• Tidak ada hasil yang ditemukan

SISTEM PENDETEKSI PLAGIARISME DOKUMEN SKRIPSI DENGAN MENGGUNAKAN PERBANDINGAN N-GRAMS

N/A
N/A
Protected

Academic year: 2019

Membagikan "SISTEM PENDETEKSI PLAGIARISME DOKUMEN SKRIPSI DENGAN MENGGUNAKAN PERBANDINGAN N-GRAMS"

Copied!
314
0
0

Teks penuh

(1)

SISTEM PENDETEKSI PLAGIARISME DOKUMEN SKRIPSI

DENGAN MENGGUNAKAN PERBANDINGAN

N-GRAMS

(STUDI KASUS PADA PROGRAM STUDI TEKNIK INFORMATIKA UNIVERSITAS SANATA DHARMA)

SKRIPSI

Ditujukan Untuk Memenuhi Salah Satu Syarat

Memperoleh Gelar Sarjana Teknik Jurusan Teknik Informatika

Disusun oleh :

Rosalia Ratna Susanti

NIM : 075314073

PROGRAM STUDI TEKNIK INFORMATIKA

FAKULTAS SAINS DAN TEKNOLOGI

UNVERSITAS SANATA DHARMA

YOGYAKARTA

(2)

ii

SYSTEM PLAGIARISM DETECTION DOCUMENT THESIS

BASED ON N-GRAMS COMPARISON

(A CASE STUDY AT DEPARTMENT OF INFORMATIC

ENGINEERING , SANATA DHARMA UNIVERSITY

)

A THESIS

Presented as Partial Fulfillment of the Requirements

To Obtain the

Sarjana Komputer

Degree

In Informatics Engineering Department

By:

Rosalia Ratna Susanti

NIM : 075314073

DEPARTMENT OF INFORMATIC ENGINEERING

FACULTY OF SCIENCE AND TECHNOLOGY

SANATA DHARMA UNIVERSITY

YOGYAKARTA

(3)
(4)
(5)

v

HALAMAN PERSEMBAHAN

!

"

!

#

$$

$$

%

"

"

"

"

" "

(6)
(7)
(8)

viii

SISTEM PENDETEKSI PLAGIARISME DOKUMEN SKRIPSI DENGAN

MENGGUNAKAN PERBANDINGAN N-GRAMS

ABSTRAK

Plagiat bukan menjadi hal baru dalam dunia pendidikan. Dengan adanya kemudahan bagi setiap orang untuk dapat bertukar informasi. Sehingga memberikan kemudahan dalam tindakan plagiarisme terutama dikalangan mahasiswa. Yang menjadi salah satu keprihatinan dalam dunia pendidikan yaitu adanya tindakan plagiat pada naskah dokumen skripsi yang banyak dilakukan oleh para mahasiswa. Oleh karena itu diperlukan suatu sistem pendeteksian plagiarisme pada dokumen teks yang dilakukan secara terkomputerisasi.

Dalam hal ini sistem pendeteksi plagiat dokumen skripsi yang akan digunakan yaitu dengan menggunakan perbandingan n-grams. Perbandingan n-grams merupakan sebuah metode sederhana dengan membandingkan potongan teks berdasarkan n-grams kata.

Pengujian dari sistem ini dilakukan dengan melakukan perhitungan recall dan precision dari hasil testing program dengan membandingkan dengan hasil deteksi secara manual. Dari hasil pengujian yang dilakukan terhadap dokumen skripsi dengan menggunakan perbandingan n-grams dengan nilai n=3, n=4, dan n=5 yang memiliki tingkat ketepatan terbaik adalah yang nilai n=5 dengan nilai precision = 90.12% dibandingakn dengan nilai n =3 dengan hasil precision 10.61% dan n=4 dengan hasil precision 78.12%.

(9)

ix

SYSTEM PLAGIARISM DETECTION DOCUMENT THESIS

BASED ON N-GRAMS COMPARISON

(A CASE STUDY AT DEPARTMENT OF INFORMATIC

ENGINEERING , SANATA DHARMA UNIVERSITY

)

ABSTRACT

Plagiarism is not a new thing in the world of education. With the convenience for everyone to be able to exchange information. So much easier and acts of plagiarism, especially among students. That was one of concern in education is the act of plagiarism in the thesis text document is mostly done by the students. Therefore we need a system for plagiarism detection in text documents is done in computerized.

In this system plagiarism detection document thesis based on n-grams comparison. N-grams comparison is a simple method by comparing the bits of text based on word n-grams.

Testing performance of the system with comparing of recall and precision of the testing program and the detection results manually. From the results of tests performed on thesis document based on n-grams comparison with a value of n = 3, n = 4 and n = 5 which has the best accuracy rate is the value of n = 5 with the precision = 90.12% compared with a value of n = 3 with the precision 10.61% and n = 4 with 78.12% precision results.

(10)

x

KATA PENGANTAR

Puji dan syukur penulis panjatkan ke hadirat Tuhan Yesus Kristus atas segala berkat, bimbingan, dan kasih-Nya sehingga penulis dapat menyelesaikan penelitian dan penyusunan tugas akhir yang berjudul “SISTEM PENDETEKSI PLAGIARISME DOKUMEN SKRIPSI DENGAN MENGGUNAKAN

PERBANDINGAN N-GRAMS (STUDI KASUS PADA PROGRAM STUDI

TEKNIK INFORMATIKA UNIVERSITAS SANATA DHARMA)” ini tepat

pada waktunya.

Tugas akhir ini disusun untuk memenuhi salah satu syarat dalam menyelesaikan program Strata satu ( S1 ) Jurusan Teknik Informatika Fakultas Sains dan Teknologi Universitas Sanata Dharma Yogyakarta. Penulis berhasil menyelesaikan penelitian dan penyusunan tugas akhir ini tak lepas dari bantuan dan dukungan baik berupa materiil, moral maupun spiritual dari banyak pihak. Pada kesempatan ini, penulis ingin mengucapkan terima kasih kepada :

1. Tuhan Yesus Kristus atas berkat, rahmat dan penyertaan selama penulis menyusun dan menyelesaikan tugas akhir ini dari awal hingga selesai. 2. Ibu P.H. Prima Rosa, S.Si.,M.Sc., selaku Dekan Fakultas Sains dan Teknologi

Universitas Sanata Dharma Yogyakarta

(11)

xi

4. Ibu Sri Hartati Wijono, S.Si.,M.Kom., selaku Dosen Pembimbing atas segala waktu, kesabaran, serta member kritik dan saran yang membangun dalam membantu penyelesaian tugas akhir ini.

5. Bapak Puspaningtyas Sanjoyo Adi S.T.,M.T.,dan Bapak J.B.Budi Darmawan, S.T.,M.Sc., selaku dosen penguji atas saran dan kritikannya. 6. Seluruh staff pengajar Prodi Teknik Informatika yang telah memberikan

ilmu pengetahuan yang sangat berguna bagi penulis.

7. Seluruh staff sekretariat yang telah membantu dalam urusan akademik. 8. Ayah dan Ibu yang selalu memberikan semangat, doa, perhatian dan kasih

sayang kepada penulis.

9. Kakakku L. Eka Ariwobowo dan adikku Theresia Nurvita S yang selalu memberikan dukungan dan semangat selama pengerjaan tugas akhir ini. 10.“Ndutz” yang selalu menanyakan perkembangan tugas akhir ini.

Membantu dan memberikan banyak masukan dan semangat selama menyelesaikan tugas akhir ini. Terimakasih atas dukungan dan semangatnya.

11.“Bebz q cayank” thank’s buat kesabaran, kesetiaan, kasih sayang, nasehat, semangat, perhatian, dan doa yang telah diberikan hingga saat ini.

12.Teman seperjuanganku Monica Pancaindrani yang selalu membantu dan memberikan semangat selama pengerjaan tugas akhir ini dari awal hingga selesai.

(12)
(13)

xiii

DAFTAR ISI

HALAMAN JUDUL BAHASA INDONESIA ... i

HALAMAN JUDUL BAHASA INGGRIS ... ii

HALAMAN PERSETUJUAN ... iii

HALAMAN PENGESAHAN ... iv

HALAMAN PERSEMBAHAN ... v

HALAMAN PERNYATAAN KEASLIAN KARYA ... vi

HALAMAN PERSETUJUAN PUBLIKASI ... vii

ABSTRAK ... viii

ABSTRACT ... ix

KATA PENGANTAR ... x

DAFTAR ISI ... xiii

DAFTAR TABEL ... xvii

DAFTAR GAMBAR ... xix

BAB I PENDAHULUAN ... 1

1.1 Judul ... 1

1.2 Latar Belakang Masalah ... 1

1.3 Rumusan Masalah ... 3

1.4 Batasan Masalah ... 3

1.5 Tujuan ... 4

1.6 Luaran Yang Diharapkan ... 4

1.7 Metodologi ... 4

1.8 Sistematika Penulisan ... 5

BAB II TINJAUAN PUSTAKA ... 7

2.1 Sistem ... 7

2.2 Deteksi Plagiarisme ... 7

2.2.1 Plagiarisme ... 7

2.3 Sistem Temu kembali ... 9

(14)

xiv

2.4 Pengukuran Unjuk Kerja Sistem Temu Kembali ... 15

2.5 Perbandingan N-grams ... 16

2.6 Konsep N-grams ... 17

2.7 Contoh perhitungan menggunakan perbandingan n-grams ... 19

BAB III ANALISA DAN PERANCANGAN SISTEM ... 70

3.1 Gambaran Umum Sistem... 70

3.1.1 Analisa kebutuhan ... 73

3.2 Analisa Sistem ... 73

3.2.1 Definisi Aktor ... 73

3.2.2 Model Use Case ... 74

3.2.3 Deskripsi Use Case ... 75

3.2.4 Diagram Use Case ... 77

3.2.5 Skenario Use Case ... 78

3.3 Model Analisis ... 92

3.3.1 Diagram Sekuensial ... 92

3.3.1.1 Diagram Sekuensial Login ... 92

3.3.1.2 Diagram Sekuensial InsertUser ... 94

3.3.1.3 Diagram Sekuensial UpdateUser ... 95

3.3.1.4 Diagram Sekuensial DeleteUser ... 97

3.3.1.5 Diagram Sekuensial Insert Kata Dasar ... 98

3.3.1.6 Diagram Sekuensial Delete Kata Dasar ... 100

3.3.1.7 Diagram Sekuensial Cari Kata Dasar ... 101

3.3.1.8 Diagram Sekuensial InsertStopword ... 102

3.3.1.9 Diagram Sekuensial UpdateStopword ... 104

3.3.1.10 Diagram Sekuensial Cari Stopword ... 105

3.3.1.11Diagram Sekuensial Insert Dokumen Skripsi Admin .... 107

3.3.1.12Diagram Sekuensial Insert Dokumen Skripsi User ... 108

3.3.1.13Diagram Sekuensial Preprocessing Dokumen Skripsi Admin ... 110

(15)

xv

3.3.1.15Diagram Sekuensial Deteksi Plagiarisme Admin ... 114

3.3.1.16Diagram Sekuensial Deteksi Plagiarisme User ... 115

3.3.2 Diagram Kelas Keseluruhan... 117

3.3.3 Model Desain ... 117

3.3.3.1 Kelas Perancangan ... 118

3.3.3.2 Diagram UML untuk kelas perancangan model ... 120

3.3.4 Algoritma Method – Method Penting dalam Setiap Kelas ... 124

3.3.5 Prototype Antar Muka ... 142

3.3.6 Desain Database ... 149

3.4 Rencana Pengujian dan Evaluasi ... 151

3.4.1 Metode Pengujian ... 151

3.4.2 Mekanisme Pengujian Sistem ... 152

3.4.3 Mekanisme Pengujian Manual ... 153

BAB IV IMPLEMENTASI DAN PENGUJIAN ... 154

4.1 Implementasi ... 154

4.1.1 Lingkungan Implementasi Perangkat Keras ... 154

4.1.2 Lingkungan Implementasi Perangkat Lunak ... 154

4.1.3 Implementasi Method – Method Penting dalam Setiap Kelas .... 154

4.1.4 Implementasi Antar Muka... 178

4.1.5 Implementasi Kelas ... 185

4.1.6 Implementasi Database ... 186

4.2 Pengujian ... 188

4.2.1 Hasil Pengujian Program ... 188

4.2.2 Hasil Pengujian Precision ... 189

4.2.3Testing Program ... 193

4.3 Kelemahan Sistem ... 196

BAB V KESIMPULAN... 198

5.1 Kesimpulan ... 198

5.2 Saran ... 199

DAFTAR PUSTAKA ... 200

(16)

xvi

(17)

xvii

DAFTAR TABEL

Tabel 2.1 Kombinasi Awalan Akhiran yang Tidak Diijinkan ... 13

Tabel 2.2 Cara Menentukan Tipe Awalan Untuk Kata Diawali dengan “ te- ... 14

Tabel 2.3 Jenis Awalan Berdasarkan Tipe Awalannya ... 14

Tabel 3.1 Tabel Penjelasan Dokumen Plagiat ... 70

Tabel 3.2 Tabel Definisi Aktor ... 73

Tabel 3.3 Deskripsi Use Case ... 75

Tabel 3.4 Skenario Use Case Login ... 79

Tabel 3.5 Skenario InsertUser ... 80

Tabel 3.6 Skenario UpdateUser ... 81

Tabel 3.7 Skenario DeleteUser ... 81

Tabel 3.8 Skenario Insert Kata Dasar ... 82

Tabel 3.9 Skenario Delete Kata Dasar ... 83

Tabel 3.10 Skenario Cari Kata Dasar ... 84

Tabel 3.11 Skenario InsertStopword ... 84

Tabel 3.12 Skenario UpdateStopword ... 85

Tabel 3.13 Skenario Cari Stopword ... 86

Tabel 3.14 Skenario Use CaseInsert Dokumen Skripsi Admin ... 87

Tabel 3.15 Skenario Use CaseInsert Dokumen Skripsi User ... 87

Tabel 3.16 Skenario Use CasePreprocessing Dokumen Skripsi Admin ... 88

Tabel 3.17 Skenario Use CasePreprocessing Dokumen Skripsi User ... 89

Tabel 3.18 Skenario Use Case Deteksi Plagiarisme Admin ... 90

Tabel 3.19 Skenario Use Case Deteksi Plagiarisme User ... 91

Tabel 3.20 Kelas Perancangan ... 118

Tabel 3.21 Diagram Relational User ... 150

Tabel 3.22 Diagram Relational Kamus ... 150

Tabel 3.23 Diagram Relational Stopwod ... 150

Tabel 3.24 Diagram Relational KumpulanSkripsi ... 150

Tabel 3.25 Diagram Relational ngramkata ... 151

(18)

xviii

Tabel 4.2 Tabel Pegujian Program ... 188

Tabel 4.3 Tabel Hasil Pengujian... 190

Tabel 4.4 Tabel Hasil Pengujian Precision dan Recall... 192

(19)

xix

DAFTAR GAMBAR

Gambar 2.1 Prose Sistem temu kembali ... 9

Gambar 2.2 Proses Pengindeksan ... 10

Gambar 3.1 Diagram Keseluruhan Sistem ... 71

Gambar 3.2 Flowcart Perhitungan Perbandingan N-grams ... 72

Gambar 3.3 Diagram Use Case ... 78

Gambar 3.4 Diagram Kelas Keseluruhan ... 117

Gambar 3.5 Antar muka Login ... 142

Gambar 3.6 Antar muka Kelola Stopword ... 143

Gambar 3.7 Antar muka Kelola Kata Dasar ... 144

Gambar 3.8 Antar muka User ... 145

Gambar 3.9 Antar muka Preprocessing Admin ... 146

Gambar 310 Antar muka Testing Program ... 147

Gambar 3.11 Antar muka Deteksi User ... 148

Gambar 3.12 ER Diagram ... 149

Gambar 3.13 Mekanisme Pengujian ... 153

Gambar 4.1 Halaman Login ... 178

Gambar 4.2 Halaman Kelola Stopword ... 179

Gambar 4.3 Halaman Kelola Kata Dasar ... 180

Gambar 4.4 Halaman User ... 181

Gambar 4.5 Halaman Preprocessing Admin ... 182

Gambar 4.6 Halaman Testing Program ... 183

Gambar 4.7 Halaman Deteksi User ... 184

Gambar 4.8 Hasil Pengujian Sample1 ... 188

Gambar 4.9 Hasil Pengujian Sample2 ... 189

Gambar 4.10 Hasil Running Skripsi-051 ... 194

Gambar 4.11 Hasil Running Skripsi-052 ... 195

(20)

1

BAB I

PENDAHULUAN

1.1 Judul

“SISTEM DETEKSI PLAGIARISME DOKUMEN SKRIPSI DENGAN MENGGUNAKAN PERBANDINGAN N-GRAMS

1.2 Latar Belakang Masalah

Plagiarisme atau sering disebut plagiat adalah penjiplakan atau pengambilan karangan, pendapat, dan sebagainya dari orang lain dan menjadikannya seolah karangan dan pendapat sendiri.Plagiat dapat dianggap sebagai tindak pidana karena mencuri hak cipta orang lain. Pelaku plagiat disebut sebagai plagiator[1]. Plagiat bukan menjadi hal baru dalam dunia pendidikan. Dengan adanya kemudahan bagi setiap orang untuk dapat bertukar informasi, mengakses segala sesuatu melalui internet. Sehingga memberikan kemudahan dalam tindakan plagiarisme terutama dikalangan mahasiswa. Yang menjadi salah satu keprihatinan dalam dunia pendidikan yaitu adanya tindakan plagiat pada naskah dokumen skripsi yang banyak dilakukan oleh para mahasiswa.

(21)

Untuk mengatasi adanya plagiarisme dalam dunia pendidikan dapat dilakukan dalam beberapa cara. Terdapat dua cara untuk mengatasi permasalahan plagiarisme, yaitu dengan mencegah dan mendeteksi. Mencegah berarti menjaga atau menghalangi agar plagiarisme tidak dilakukan. Hal tersebut harus dilakukan sedini mungkin terutama dalam dunia pendidikan. Mendeteksi berarti melakukan usaha untuk menemukan tindakan plagiat yang telah dilakukan.

Yang menjadi permasalahan adalah bagaimana cara untuk mengetahui apakah seorang mahasiswa melakukan plagiarisme atau tidak dalam membuat suatu karya tulis atau skripsi. Untuk mengetahuinya perlu dilakukan pengecekan secara teliti terhadap hasil tulisan mahasiswa tersebut, kemudian dibandingkan dengan hasil tulisan mahasiswa yang lainnya. Tetapi usaha tersebut akan memerlukan waktu yang lama dan ketelitian yang tinggi jika pembandingan tersebut dilakukan secara manual. Oleh karena itu diperlukan suatu sistem pendeteksian plagiarisme pada dokumen teks yang dilakukan secara terkomputerisasi.

Terdapat beberapa metode yang dilakukan untuk mendeteksi adanya plagiarisme dokumen skripsi atau karya ilmiah antara lain dengan Multilevel Text Comparison, Clustering, Document Similarities, Mining

(22)

dokumen skripsi plagiat dari dokumen skripsi yang lain. Perbandingan n-grams merupakan sebuah metode sederhana dengan membandingkan potongan teks berdasarkan n-grams kata. Untuk mendeteksi plagiarisme kata dari dokumen yang mencurigakan plagiat atau tidak dari dokumen referensi[2].

1.3 Rumusan Masalah

Dengan melihat latar belakang yang ada, maka rumusan masalah yang didapatkan adalah :

1. Bagaimana ketepatan dari sistem deteksi plagiarisme dokumen skripsi dengan menggunakan perbandingan n-grams ?

2. Bagaimana membuat sistem deteksi plagiarisme dokumen skripsi dengan menggunakan perbandingan n-grams ?

.

1.4

Batasan Masalah

Pada sistem deteksi plagiarisme pada dokumen skripsi ditetapkan beberapa batasan sebagai berikut :

1. Perbandingan menggunakan dengan nilai n=3, n=4 dan n=5.

2. Data skripsi yang digunakan 50 skripsi mahasiswa Teknik Informatika Universitas Sanata Dharma.

3. Dokumen yang digunakan Abstraksi, Bab 1, dan Bab 2 dengan topik Sistem Informasi.

(23)

5. Dokumen yang digunakan Dokumen teks yang akan dideteksi adalah file teks digital yang bersifat plain text, yaitu file yang hanya terdiri dari huruf-huruf dan angka-angka saja, tidak mencakup gambar, tabel, dan sejenisnya.

6. Sistem hanya memproses dokumen teks berbahasa Indonesia. 7. Sistem tidak menghiraukan adanya kutipan.

8. Sistem tidak memperhatikan sinonim/persamaan kata.

1.5 Tujuan

Penelitian ini bertujuan untuk membangun sebuah sistem untuk mendeteksi plagiarisme dokumen skripsi, sehingga dapat diketahui apakah sebuah skripsi merupakan plagiat dari dokumen skripsi yang lainnya secara terkomputerisasi.

1.6 Luaran yang Diharapkan

Luaran yang diharapkan dari Sistem Deteksi Plagiarisme Dokumen Skripsi Dengan Menggunakan Perbandingan N-grams berupa hasil deteksi dokumen skripsi apakah merupakan plagiat dari dokumen lain atau tidak.

1.7 Metodologi

Skripsi ini akan dikerjakan dengan metodologi sebagai berikut: 1. Studi Literatur

(24)

didapatkan melalui internet, serta mempelajari lebih dalam tentang sistem informasi retrieval, teori-teori tentang plagiarisme dan teknik pengimplementasian perbandingan .

2. Perancangan Sistem

Melakukan perancangan sistem dengan melakukan pengujian terhadap data-data yang ada dengan melakukan perhitungan secara manual untuk mengetahui apakah metode yang digunakan sudah sesuai yang diharapkan.

3. Implementasi

Pembuatan aplikasi pendeteksi plagiarisme dokumen skripsi dengan menggunakan perbandingan n-grams sesuai dengan perancangan yang telah dibuat sebelumnya ke dalam program komputer.

4. Pengujian dan Evaluasi

Melakukan uji coba terhadap program yang telah dibuat kemudian dari hasil yang didapat dilakukan evaluasi terhadap kekurangan program.

1.8 Sistematika Penulisan

Dalam penulisan skripsi ini, sistematika penulisan dibagi menjadi lima bab, yaitu:

BAB I : PENDAHULUAN

(25)

BAB II : TINJAUAN PUSTAKA

Pada bab ini akan dibahas mengenai konsep dasar sistem temu-kembali informasi (information retrieval system), Pengukuran unjuk kerja sistem temu kembali, perbandingan n-grams dan konsep n-grams .

BAB III : ANALISA DAN PERANCANGAN SISTEM

Pada bab ini akan dibahas mengenai urutan dan langkah-langkah pengerjaan untuk mengidentifikasi plagiarisme, perancangan user interface dan perancangan basisdata.

BAB IV : IMPLEMENTASI DAN PEMBAHASAN

Pada bab ini akan dibahas mengenai implementasi dari perancangan yang telah dibuat sebelumnya dan uji coba terhadap hasil sistem dengan hasil membaca secara manual.

BAB V : KESIMPULAN DAN SARAN

Pada bab ini akan dibahas mengenai kesimpulan yang didapat dalam pembuatan sistem dan saran terhadap sistem yang dapat dilakukan untuk penelitian lebih lanjut.

DAFTAR PUSTAKA

(26)

7

BAB II

TINJAUAN PUSTAKA

2.1 Sistem

Sistem merupakan sekumpulan unsur/elemen yang saling berkaitan dan saling mempengaruhi dalam melakukan kegiatan bersama untuk mencapai suatu tujuan[4].

2.2 Deteksi Plagiarisme

2.2.1 Plagiarisme

Plagiarisme atau sering disebut plagiat adalah penjiplakan atau pengambilan karangan, pendapat, dan sebagainya dari orang lain dan menjadikannya seolah karangan dan pendapat sendiri[10].Plagiat dapat dianggap sebagai tindak pidana karena mencuri hak cipta orang lain. Di dunia pendidikan, pelaku plagiarisme dapat mendapat hukuman berat seperti dikeluarkan dari sekolah/universitas. Pelaku plagiat disebut sebagai plagiator[1].

Yang digolongkan sebagai plagiarisme:

1. Menggunakan tulisan orang lain secara mentah, tanpa memberikan tanda jelas (misalnya dengan menggunakan tanda kutip atau blok alinea yang berbeda) bahwa teks tersebut diambil persis dari tulisan lain.

2. Mengambil gagasan orang lain tanpa memberikan anotasi yang

(27)

Dalam buku Bahasa Indonesia: Sebuah Pengantar Penulisan Ilmiah, Felicia Utorodewo dkk. menggolongkan hal-hal berikut sebagai tindakan plagiarisme[5]:

1. Mengakui tulisan orang lain sebagai tulisan sendiri. 2. Mengakui gagasan orang lain sebagai pemikiran sendiri. 3. Mengakui temuan orang lain sebagai kepunyaan sendiri.

4. Mengakui karya kelompok sebagai kepunyaan atau hasil sendiri. 5. Menyajikan tulisan yang sama dalam kesempatan yang berbeda

tanpa menyebutkan asal-usulnya.

6. Meringkas dan memparafrasekan (mengutip tak langsung) tanpa menyebutkan sumbernya.

7. Meringkas dan memparafrasekan dengan menyebut sumbernya, tetapi rangkaian kalimat dan pilihan katanya masih terlalu sama dengan sumbernya.

Hal-hal yang tidak tergolong plagiarisme:

1. Menggunakan informasi yang berupa fakta umum.

2. Menuliskan kembali (dengan mengubah kalimat atau parafrase) opini orang lain dengan memberikan sumber jelas.

(28)

2.3 Sistem Temu Kembali

Sistem temu kembali merupakan bagian dari pengetahuan komputer yang berhubungan dengan pengambilan informasi dari dokumen-dokumen yang didasarkan pada isi dan konteks dari dokumen-dokumen itu sendiri. Information Retrieval merupakan suatu pencarian informasi (biasanya berupa dokumen) yang didasarkan pada suatu query (inputan pengguna) yang diharapkan dapat memenuhi keinginan pengguna dari kumpulan dokumen yang ada. Sedangkan, definisi query dalam sistem temu kembali merupakan sebuah formula yang digunakan untuk mencari informasi yang dibutuhkan oleh pengguna, dalam bentuk yang paling sederhana, sebuah query merupakan suatu kata kunci dan dokumen yang mengandung kata kunci merupakan dokumen yang dicari dalam sistem temu kembali[6].

Proses dalam sistem temu kembali pada gambar 2.1 dapat digambarkan sebagai sebuah proses untuk mendapatkan dokumen yang relevandari koleksi dokumenyang ada melalui pencarian query yang diinputkan pengguna.

Gambar 2.1 Proses Sistem Temu kembali [6]

Proses yang terjadi di dalam sistem temu kembali adalah preprocessing.

query Sistem temukembali

Koleksi dokumen

(29)

2.3.1 Tahap Preprocessing

Tahap preprocessing dilakukan untuk membentuk basisdata terhadap koleksi dokumen yang dimasukkan, atau dengan kata lain, preprocessing merupakan proses persiapan yang dilakukan terhadap dokumen sehingga dokumen siap untuk diproses. Tahap-tahap yang terjadi pada tahap preprocessing ialah:

1. Word Token

2. Stopword Removal

3. Stemming

4. Term Weighting

Tahap-tahap yang terjadi pada tahap preprocessing dapat dilihat pada gambar 2.2 berikut ini:

Gambar 2.2 Proses Pengindeksan [6]

Documents

Word Token

Stemming Stopword Removal

Term Weighting

Assign document IDs

Index database documents

(30)

1. Word Token

Yaitu mengubah dokumen menjadi kumpulan term dengan cara menghapus semua karakter dalam tanda baca yang terdapat pada dokumen dan mengubah kumpulan term menjadi lowercase[6]. 2. Stopword Removal

Proses penghapusan kata-kata yang sering ditampilkan dalam dokumen seperti: dan, atau, tidakdan sebagainya[6].

3. Stemming

Stemming merupakan suatu proses untuk menemukan kata dasar dari sebuah kata. Dengan menghilangkan semua imbuhan (affixes) baik yang terdiri dari awalan (prefixes), sisipan (infixes), akhiran (suffixes) dan confixes (kombinasi dari awalan dan akhiran) pada kata turunan. Stemming digunakan untuk mengganti bentuk dari suatu kata menjadi kata dasar dari kata tersebut yang sesuai dengan struktur morfologi Bahasa Indonesia yang baik dan benar[6]. Algoritma Stemming dilakukan dengan membandingkan kata yang telah dihilangkan imbuhannya dengan kata dasar dalam kamus. Stemming yang digunakan adalah stemming Nazief and Adriani’s. Algoritma skema yang berasal Adriani dan Nazief digambarkan dalam laporan teknis yang tidak dipublikasikan dari Universitas Indonesia (1996).

Berikut adalah algortima stemming Nazief and Adriani’s :

(31)

diasumsikan bahwa kata tesebut adalah root word. Maka algoritma berhenti.

2. Inflection Suffixes (“-lah”, “-kah”, “-ku”, “-mu”, atau “-nya”) dibuang. Jika berupa particles (lah”, kah”, tah” atau “-pun”) maka langkah ini diulangi lagi untuk menghapus Possesive Pronouns (“-ku”, “-mu”, atau “-nya”), jika ada. 3. Hapus Derivation Suffixes (“-i”, “-an” atau “-kan”). Jika kata

ditemukan di kamus, maka algoritma berhenti. Jika tidak maka ke langkah 3a

a. Jika “-an” telah dihapus dan huruf terakhir dari kata tersebut adalah “-k”, maka “-k” juga ikut dihapus. Jika kata tersebut ditemukan dalam kamus maka algoritma berhenti. Jika tidak ditemukan maka lakukan langkah 3b. b. Akhiran yang dihapus (“-i”, “-an” atau “-kan”)

dikembalikan, lanjut ke langkah 4.

4. Hapus Derivation Prefix. Jika pada langkah 3 ada sufiks yang dihapus maka pergi ke langkah 4a, jika tidak pergi ke langkah 4b.

a. Periksa tabel kombinasi awalan-akhiran yang tidak diijinkan. Jika ditemukan maka algoritma berhenti, jika tidak pergi ke langkah 4b.

(32)

langkah 5, jika sudah maka algoritma berhenti. Catatan: jika awalan kedua sama dengan awalan pertama algoritma berhenti.

5. Melakukan Recoding.

6. Jika semua langkah telah selesai tetapi tidak juga berhasil maka kata awal diasumsikan sebagai root word. Proses selesai. Tipe awalan ditentukan melalui langkah-langkah berikut:

1. Jika awalannya adalah: “di-”, “ke-”, atau “se-” maka tipe awalannya secara berturut-turut adalah “di-”, “ke-”, atau “se-”. 2. Jika awalannya adalah “te-”, “me-”, “be-”, atau “pe-” maka

dibutuhkan sebuah proses tambahan untuk menentukan tipe awalannya.

3. Jika dua karakter pertama bukan “di-”, “ke-”, “se-”, “te-”, “be-”, “me-“be-”, atau “pe-” maka berhenti.

4. Jika tipe awalan adalah “none” maka berhenti. Jika tipe awalan adalah bukan “none” maka awalan dapat dilihat pada Tabel 2.2. Hapus awalan jika ditemukan.

Tabel 2.1 Kombinasi Awalan Akhiran yang Tidak Diijinkan

Awalan Akhiran yang tidak diijinkan

be- -i

di- -an

ke- -i, -kan

me- -an

(33)

Tabel 2.2. Cara Menentukan Tipe Awalan Untuk Kata yang Diawali dengan “te-”

Following Characters Tipe

Awalan

Tabel 2.3. Jenis Awalan Berdasarkan Tipe Awalannya

Tipe Awalan Awalan yang harus dihapus

(34)

4. Term Weighting

Salah satu model sistem temu kembali informasi yang paling sederhana namun paling produktif adalah model ruang vektor. Vektor model ini merepresentasikan term yang terdapat pada dokumen dan query. Elemen vektor tersebut adalah bobot term yang menjadi dasar penilaian dalam pemeringkatan dokumen. Hal yang perlu diperhatikan dalam penemuan kembali informasi model ruang vektor ini adalah pembobotan term (term weighting)[8].

2.4 Pengukuran Unjuk Kerja Sistem Temu Kembali

Nilai performansi dari aplikasi sistem temu kembali menunjukkan keberhasilan dari suatu sistem temu kembali dalam mengembalikan informasi yang dibutuhkan oleh pengguna. Untuk mengukur performansi dari sistem temu kembali, digunakan koleksi uji. Koleksi uji terdiri dari tiga bagian, yaitu koleksi dokumen, query, dan relevance judgement. Koleksi dokumen adalah kumpulan dokumen yang dijadikan bahan pencarian oleh sistem. Relevance judgement adalah daftar dokumen-dokumen yang relevan dengan semua query yang telah disediakan[6]. Parameter yang digunakan dalam performansi sistem, antara lain :

1. Precision (ketepatan)

(35)

Precision =

2. Recall (kelengkapan)

Recall ialah perbandingan jumlah dokumen relevan yang didapatkan sistem dengan jumlah seluruh dokumen relevan yang ada dalam koleksi dokumen (terambil ataupun tak terambil sistem)[9].

Recall =

3. Interpolate Average Precision (IAP)

Pengukuran performansi dengan mempertimbangkan aspek keterurutan atau rangking dapat dilakukan dengan melakukan interpolasi antara precision dan recall. IAP akan mencatat semua Semua dokumen yang relevan dan urutan dokumen tersebut pada hasil IRS dan menghitung nilai precisionnya.

Nilai precision untuk semua titik ditentukan oleh perubahan nilai recall yang terjadi. Nilai precision berubah pada saat nilai recall berubah naik. Precision disatu titik recall tertentu adalah maksimal precision untuk semua titik recall yang lebih kecil dari titik tersebut.

2.5 Perbandingan N-grams

(36)

potongan-potongan karakter huruf sejumlah n dari sebuah kata yang secara kontinuitas dibaca dari awal teks sumber hingga akhir dari dokumen[6].

2.6 Konsep N-grams

Dalam tugas akhir ini deteksi plagiarisme yang akan dibuat menggunakan perbandingan n-grams yang bersumber dari makalah Alberto Barron-Cedene dan Paolo Rosso yang berjudul On Automatic Plagiarism Detection Based on N-grams Comparison[2]. Dengan menggunakan perbandingan tersebut jika dua fragmen teks cukup dekat (dokumen asli dan dokumen mencurigakan), dapat diasumsikan bahwa dokumen tersebut berpotensi plagiat, yang harus diselidiki lebih dalam. Perbandingan merupakan sebuah metode sederhana dengan membandingkan potongan teks berdasarkan kata. Dimana s merupakan dokumen mencurigakan dan D merupakan kumpulan dokumen referensi. Untuk mengetahui kata yang merupakan bagian dari dokumen yang mencurigakan plagiat dari kumpulan dokumen referensi. Untuk itu digunakan perbandingan untuk menentukan adanya plagiarisme[2].

Pada kenyataannya kalimat plagiat dapat berasal dari kata yang diambil dari beberapa bagian dari dokumen asli, dokumen referensi tidak dibagi menjadi kalimat, tetapi hanya ke . Perbandingan yang dipergunakan didasarkan pada empat hal berikut[2]:

1. Dokumen mencurigakan s dibagi menjadi kalimat (si).

(37)

3. Dokumen yang dicurigai d tidak dibagi menjadi kalimat, tetapi hanya menjadi kata.

4. Setiap si

s dicari kalimat tunggal dari dokumen-dokumen

referensi D.

Deteksi plagiat dengan perbandingan ini dilakukan dengan memotong teks dokumen pada dokumen yang mencurigakan dan kumpulan dokumen referensi berdasarkan n kata. Pemotongan teks dokumen dilakukan berdasarkan kata yang telah ditentukan nilai n nya. Setiap pemotongan teks, untuk pemotongan kata berikutnya diikuti n-1 kata dari potongan kata sebelumnya. Sehingga setiap potongan kata memiliki saling keterkaitan.

Untuk menentukan apakah n-grams (si) merupakan plagiat dari d

D, yaitu dengan membandingkan set yang sesuai dengan rumus containment :

C

(

s

i

|

d

)

=

Dimana N (•) adalah himpunan di (•). Jika nilai containment maksimum dari setiap n-grams dalam dokumen query, dibandingkan dengan n-grams dokumen asli yang merupakan kumpulan dokumen koleksi lebih besar dari nilai ambang batas tertentu, maka n-grams(si) menjadi calon

(38)

terdapat kesamaan lebih dari 60% n-grams dokumen asli. N-grams dokumen query dikatakan new fragment jika merupakan kalimat baru yang berbeda dari n-grams dokumen asli. Dokumen dianggap plagiat jika persentase dari n-gramsverbatim dan rewritten memenuhi ketidaksetaraan :

| siVU siR| > 0.4 |si| siVmerupakan kalimat verbatim

siR merupakan kalimat rewritten pada kalimat si [2].

2.7 Contoh perhitungan menggunakan perbandingan n-gram

Dalam perhitungan ayang akan dijelaskan dibawah ini menggunakan n-Grams 4 kata. Dalam perhitungan ini menggunakan 3 dokumen yaitu dokumen A sebagai dokumen yang dicurigai, dokumen B sebagai dokumen asli d1 dan dokumen C sebagai dokumen asli d2.

A.Dokumen yang dicurigai

(39)

(Java 2 Micro Edition) dengan implementasinya dapat berupa perangkat mobile yang tidak memberatkan memori, maka aplikasi ini dibuat. Aplikasi ini merupakan pengembangan dari artificial intelligence yaitu sistem pakar dengan menggunakan metode certainty factor yang mampu menunjukkan ukuran kepastian terhadap suatu fakta atau aturan.

Hasil preprocessing dokumen :

guna alat handphone sekarang ragam media komunikasi bentuk panggil suara pesan singkat kembang media mampu isi bagai program aplikasi tambah mudah user Salah satu bentuk manfaat teknologi handphone layan sehat bentuk diagnosis sakit diagnosis sakit Hepatitis laku bantu user tangan deteksi dini sakit layan sehat cepat laku bangun guna teknologi J2ME implementasi rupa perangkat mobile berat memori aplikasi buat Aplikasi kembang artificial intelligence sistem pakar guna metode certainty factor mampu tunjuk ukur fakta atur

Daftar n-Grams 4 kata dari dokumen A sebagai dokumen yang dicurigai: a1s1 guna alat handphone sekarang

(40)
(41)

a1s32 diagnosis sakit diagnosis sakit a1s33 sakit diagnosis sakit Hepatitis a1s34 diagnosis sakit Hepatitis laku a1s35 sakit Hepatitis laku bantu a1s36 Hepatitis laku bantu user a1s37 laku bantu user tangan a1s38 bantu user tangan deteksi a1s39 user tangan deteksi dini a1s40 tangan deteksi dini sakit a1s41 deteksi dini sakit layan a1s42 dini sakit layan sehat a1s43 sakit layan sehat cepat a1s44 layan sehat cepat laku a1s45 sehat cepat laku bangun a1s46 cepat laku bangun guna a1s47 laku bangun guna teknologi a1s48 bangun guna teknologi J2ME a1s49 guna teknologi J2ME implementasi a1s50 teknologi J2ME implementasi rupa a1s51 J2ME implementasi rupa perangkat a1s52 implementasi rupa perangkat mobile a1s53 rupa perangkat mobile berat

(42)

a1s55 mobile berat memori aplikasi a1s56 berat memori aplikasi buat a1s57 memori aplikasi buat Aplikasi a1s58 aplikasi buat Aplikasi kembang a1s59 buat Aplikasi kembang artificial a1s60 Aplikasi kembang artificial intelligence a1s61 kembang artificial intelligence sistem a1s62 artificial intelligence sistem pakar a1s63 intelligence sistem pakar guna a1s64 sistem pakar guna metode a1s65 pakar guna metode certainty a1s66 guna metode certainty factor a1s67 metode certainty factor mampu a1s68 certainty factor mampu tunjuk a1s69 factor mampu tunjuk ukur a1s70 mampu tunjuk ukur fakta a1s71 tunjuk ukur fakta atur

B.Dokumen asli d1

(43)

itu sekarang cenderung semakin banyak orang menggunakan mobile devices dan semakin banyak fasilitas dari mobile devices yang memudahkan penggunanya. Untuk itu aplikasi diagnosis penyakit hepatitis ini dibuat. Kemudahan dalam hal pelayanan kesehatan sangat diharapkan oleh masyarakat. Dengan memanfaatkan teknologi mobile devices dalam aplikasi diagnosis penyakit hepatitis ini maka pasien dan dokter dapat terbantu. Dengan hanya memasukkan gejala yang dideritanya pasien dapat segera tahu jenis penyakit hepatitis yang dideritanya Sehingga kecepatan dan keefektifan dalam pelayanan dan penanganan kesehatan dapat cepat dilakukan. Aplikasi ini menggunakan teknologi J2ME karena teknologi ini bersifat platform. Disamping itu aplikasi ini hanya memerlukan kapasitas memori kecil untuk instalasi sehingga tidak memberatkan perangkat mobile devices.

Hasil preprocessing dokumen :

(44)
(45)
(46)
(47)

d1s69 sifat platform samping aplikasi d1s70 platform samping aplikasi kapasitas d1s71 samping aplikasi kapasitas memori d1s72 aplikasi kapasitas memori kecil d1s73 kapasitas memori kecil instalasi d1s74 memori kecil instalasi berat d1s75 kecil instalasi berat perangkat d1s76 instalasi berat perangkat mobile d1s77 berat perangkat mobile devices

C.Dokumen asli d2

Salah satu bentuk pemanfaatan dari teknologi handphone adalah pelayanan kesehatan dalam bentuk diagnosis penyakit. Diagnosis penyakit Hepatitis dilakukan untuk membantu user dalam penanganan dan deteksi dini akan penyakit tersebut. Sehingga pelayanan kesehatan dapat lebih cepat dilakukan. Perangkat lunak dibangun dengan menggunakan teknologi J2ME yang diimplementasikan pada perangkat handphone yang tidak memberatkan memori. Aplikasi ini merupakan pengembangan dari artificial intelligence yaitu sistem pakar dengan menggunakan metode certainty factor yang mampu menunjukkan ukuran kepastian terhadap suatu fakta atau aturan.

Hasil preprocessing dokumen :

(48)

sehat cepat laku Perangkat lunak bangun guna teknologi J2ME implementasi perangkat handphone berat memori Aplikasi rupa kembang artificial intelligence sistem pakar guna metode certainty factor mampu tunjuk ukur pasti fakta atur

(49)
(50)

d2s42 guna metode certainty factor d2s43 metode certainty factor mampu d2s44 certainty factor mamputunjuk d2s45 factor mampu tunjuk ukur d2s46 mampu tunjuk ukur pasti d2s47 tunjuk ukur pasti fakta d2s48 ukur pasti fakta atur

D.Perhitungan antara dokumen yang dicurigai dan dokumen asli d1 a1s1 guna alat handphone sekarang

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen

a1s 2 alat handphone sekarang ragam

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen

a1s 3 handphone sekarang ragam media

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen

a1s 4 sekarang ragam media komunikasi

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen

a1s 5 ragam media komunikasi bentuk

(51)

a1s 6 media komunikasi bentuk panggil

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen

a1s7 komunikasi bentuk panggil suara

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen

a1s8 bentuk panggil suara pesan

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen

a1s9 panggil suara pesan singkat

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen

a1s10 suara pesan singkat kembang

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen

a1s11 pesan singkat kembang media

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen

a1s12 singkat kembang media mampu

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen

(52)

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen

a1s14 media mampu isi bagai

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen

a1s15 mampu isi bagai program

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen

a1s16 isi bagai program aplikasi

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen

a1s17 bagai program aplikasi tambah

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen

a1s18 program aplikasi tambah mudah

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen

a1s19 aplikasi tambah mudah user

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen

a1s20 tambah mudah user Salah

(53)

a1s21 mudah user Salah satu

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen

a1s22 user Salah satu bentuk

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen

a1s23 Salah satu bentuk manfaat

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen

a1s24 satu bentuk manfaat teknologi

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen

a1s25 bentuk manfaat teknologi handphone

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen

a1s26 manfaat teknologi handphone layan

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen

a1s27 teknologi handphone layan sehat

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen

(54)

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen

a1s29 layan sehat bentuk diagnosis

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen

a1s30 sehat bentuk diagnosis sakit

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen

a1s31 bentuk diagnosis sakit diagnosis

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil:

rewritten [diagnosis,sakit,diagnosis] dengan d1s39 , d1s40 dan d1s41 a1s32 diagnosis sakit diagnosis sakit

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil:

verbatim [diagnosis,sakit,diagnosis,sakit] dengan d1s39 , d1s40 dan d1s41 a1s33 sakit diagnosis sakit Hepatitis

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil:

rewritten [sakit,diagnosis,sakit] dengan d1s39

(55)

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil:

rewritten [sakit,diagnosis,hepatitis] dengan d1s40 dan d1s41 a1s35 sakit Hepatitis laku bantu

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen

a1s36 Hepatitis laku bantu user

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen

a1s37 laku bantu user tangan

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen

a1s38 bantu user tangan deteksi

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen

a1s39 user tangan deteksi dini

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen

a1s40 tangan deteksi dini sakit

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen

(56)

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen

a1s42 dini sakit layan sehat

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen

a1s43 sakit layan sehat cepat

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil:

rewritten [layan, sehat, cepat] dengan d1s59 a1s44 layan sehat cepat laku

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil:

rewritten [layan, sehat, cepat] dengan d1s59

rewritten [sehat, cepat, laku] dengan d1s60 dan d1s61 a1s45 sehat cepat laku bangun

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil:

rewritten [sehat, cepat, laku] dengan d1s60 dan d1s61 a1s46 cepat laku bangun guna

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil:

(57)

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil:

rewritten [laku, guna, teknologi] dengan d1s63 a1s48 bangun guna teknologi J2ME

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil:

rewritten [guna, teknologi, J2ME ] dengan d1s64 dan d1s65 a1s49 guna teknologi J2ME implementasi

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil:

rewritten [guna, teknologi, J2ME ] dengan d1s64 dan d1s65 a1s50 teknologi J2ME implementasi rupa

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen

a1s51 J2ME implementasi rupa perangkat

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen

a1s52 implementasi rupa perangkat mobile

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen

a1s53 rupa perangkat mobile berat

(58)

a1s54 perangkat mobile berat memori

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil:

rewritten [perangkat, mobile, berat] dengan d1s76 dan d1s77 a1s55 mobile berat memori aplikasi

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen

a1s56 berat memori aplikasi buat

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen

a1s57 memori aplikasi buat Aplikasi

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil:

rewritten [memori, aplikasi, Aplikasi] dengan d1s71 dan d1s72 a1s58 aplikasi buat Aplikasi kembang

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen

a1s59 buat Aplikasi kembang artificial

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen

a1s60 Aplikasi kembang artificial intelligence

(59)

a1s61 kembang artificial intelligence sistem

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen

a1s62 artificial intelligence sistem pakar

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen

a1s63 intelligence sistem pakar guna

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen

a1s64 sistem pakar guna metode

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen

a1s65 pakar guna metode certainty

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen

a1s66 guna metode certainty factor

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen

a1s67 metode certainty factor mampu

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen

(60)

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen

a1s69 factor mampu tunjuk ukur

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen

a1s70 mampu tunjuk ukur fakta

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen

a1s71 tunjuk ukur fakta atur

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen

Hasil n-grams yang verbatim dan rewritten : a1s31 bentuk diagnosis sakit diagnosis

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil:

rewritten [diagnosis,sakit,diagnosis] dengan d1s39 , d1s40 dan d1s41 a1s32 diagnosis sakit diagnosis sakit

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil:

verbatim [diagnosis,sakit,diagnosis,sakit] dengan d1s39 , d1s40 dan d1s41 a1s33 sakit diagnosis sakit Hepatitis

(61)

rewritten [sakit,diagnosis,sakit] dengan d1s39

rewritten [sakit, sakit, Hepatitis] dengan d1s42, d1s52, d1s53, dan d1s54 verbatim [sakit,diagnosis,sakit,hepatitis] dengan d1s40 dan d1s41 a1s34 diagnosis sakit Hepatitis laku

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil:

rewritten [sakit,diagnosis,hepatitis] dengan d1s40 dan d1s41 a1s43 sakit layan sehat cepat

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil:

rewritten [layan, sehat, cepat] dengan d1s59 a1s44 layan sehat cepat laku

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil:

rewritten [layan, sehat, cepat] dengan d1s59

rewritten [sehat, cepat, laku] dengan d1s60 dan d1s61 a1s45 sehat cepat laku bangun

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil:

rewritten [sehat, cepat, laku] dengan d1s60 dan d1s61 a1s46 cepat laku bangun guna

(62)

rewritten [cepat, laku, guna] dengan d1s62 a1s47 laku bangun guna teknologi

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil:

rewritten [laku, guna, teknologi] dengan d1s63 a1s48 bangun guna teknologi J2ME

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil:

rewritten [guna, teknologi, J2ME ] dengan d1s64 dan d1s65 a1s49 guna teknologi J2ME implementasi

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil:

rewritten [guna, teknologi, J2ME ] dengan d1s64 dan d1s65 a1s54 perangkat mobile berat memori

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil:

rewritten [perangkat, mobile, berat] dengan d1s76 dan d1s77 a1s57 memori aplikasi buat Aplikasi

dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil:

rewritten [memori, aplikasi, Aplikasi] dengan d1s71 dan d1s72 Hasil perhitungan dokumen dicurigai dan dokumen asli d1:

(63)

Hasil containment

C

(

s

i

|

d

1

)

:

| siVU siR| = 0.183 bukan plagiat

Dokumen dianggap bukan plagiat karena persentase dari kata verbatim atau rewritten, tidak memenuhi ketidaksetaraan

| siVU siR| > 0.4 |si|

E.Perhitungan dokumen yang dicurigai dan dokumen asli d2 a1s1 guna alat handphone sekarang

dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil: new fragmen

a1s 2 alat handphone sekarang ragam

dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil: new fragmen

a1s 3 handphone sekarang ragam media

dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil: new fragmen

a1s 4 sekarang ragam media komunikasi

dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil: new fragmen

a1s 5 ragam media komunikasi bentuk

dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil: new fragmen

(64)

dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil: new fragmen

a1s7 komunikasi bentuk panggil suara

dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil: new fragmen

a1s8 bentuk panggil suara pesan

dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil: new fragmen

a1s9 panggil suara pesan singkat

dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil: new fragmen

a1s10 suara pesan singkat kembang

dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil: new fragmen

a1s11 pesan singkat kembang media

dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil: new fragmen

a1s12 singkat kembang media mampu

dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil: new fragmen

a1s13 kembang media mampu isi

(65)

a1s14 media mampu isi bagai

dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil: new fragmen

a1s15 mampu isi bagai program

dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil: new fragmen

a1s16 isi bagai program aplikasi

dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil: new fragmen

a1s17 bagai program aplikasi tambah

dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil: new fragmen

a1s18 program aplikasi tambah mudah

dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil: new fragmen

a1s19 aplikasi tambah mudah user

dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil: new fragmen

a1s20 tambah mudah user Salah

dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil: new fragmen

(66)

dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil: new fragmen

a1s22 user Salah satu bentuk

dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil: new fragmen

a1s23 Salah satu bentuk manfaat

dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil: new fragmen

a1s24 satu bentuk manfaat teknologi

dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:

rewritten [bentuk, manfaat, teknologi] dengan d2s1 a1s25 bentuk manfaat teknologi handphone

dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:

verbatim [bentuk, manfaat, teknologi, handphone] dengan d2s1 rewritten [manfaat, teknologi, handphone] dengan d2s2

a1s26 manfaat teknologi handphone layan

dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:

verbatim [manfaat, teknologi, handphone, layan] dengan d2s2 rewritten [teknologi, handphone, layan] dengan d2s3

(67)

dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:

verbatim [teknologi, handphone, layan, sehat ] dengan d2s3 rewritten [teknologi, handphone, layan] dengan d2s2 rewritten [handphone, layan, sehat] dengan d2s4 a1s28 handphone layan sehat bentuk

dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:

verbatim [handphone, layan sehat, bentuk] dengan d2s4 rewritten [handphone, layan, sehat] dengan d2s3 rewritten [layan, sehat, bentuk] dengan d2s5 a1s29 layan sehat bentuk diagnosis

dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:

verbatim [layan, sehat, bentuk, diagnosis] dengan d2s5 rewritten [layan, sehat, bentuk] dengan d2s4

rewritten [sehat, bentuk, diagnosis] dengan d2s6 a1s30 sehat bentuk diagnosis sakit

dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:

(68)

a1s31 bentuk diagnosis sakit diagnosis

dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:

verbatim [bentuk, diagnosis, sakit, diagnosis] dengan d2s7 rewritten [bentuk, diagnosis, sakit] dengan d2s6

rewritten [diagnosis, sakit, diagnosis] dengan d2s8, d2s9 dan d2s10 a1s32 diagnosis sakit diagnosis sakit

dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:

verbatim [diagnosis, sakit, diagnosis, sakit] dengan d2s6, d2s7, d2s8, d2s9 dan d2s10

a1s33 sakit diagnosis sakit Hepatitis

dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:

verbatim [sakit, diagnosis, sakit, Hepatitis] dengan d2s9

rewritten [sakit, diagnosis, sakit] dengan d2s6, d2s7, d2s8 dan d2s10 rewritten [diagnosis, sakit ,Hepatitis] dengan d2s10

a1s34 diagnosis sakit Hepatitis laku

dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:

(69)

a1s35 sakit Hepatitis laku bantu

dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:

verbatim [sakit, Hepatitis, laku, bantu] dengan d2s11 rewritten [sakit, Hepatitis, laku] dengan d2s10 rewritten [Hepatitis, laku, bantu] dengan d2s12 a1s36 Hepatitis laku bantu user

dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:

verbatim [Hepatitis, laku, bantu, user] dengan d2s12 rewritten [Hepatitis, laku, bantu] dengan d2s11 rewritten [laku, bantu, user] dengan d2s13 a1s37 laku bantu user tangan

dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:

verbatim [laku, bantu, user, tangan] dengan d2s13 rewritten [laku, bantu, user] dengan d2s12

rewritten [bantu, user, tangan] dengan d2s14 a1s38 bantu user tangan deteksi

dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:

(70)

rewritten [user, tangan, deteksi] dengan d2s15 a1s39 user tangan deteksi dini

dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:

verbatim [user, tangan, deteksi, dini] dengan d2s15 rewritten [user, tangan, deteksi] dengan d2s14 rewritten [tangan, deteksi, dini] dengan d2s16 a1s40 tangan deteksi dini sakit

dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:

verbatim [tangan, deteksi, dini, sakit] dengan d2s16 rewritten [tangan, deteksi, dini] dengan d2s15 rewritten [deteksi, dini, sakit] dengan d2s17 a1s41 deteksi dini sakit layan

dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:

verbatim [deteks,i dini, sakit, layan] dengan d2s17 rewritten [deteksi, dini, sakit] dengan d2s16 rewritten [dini, sakit, layan] dengan d2s18 a1s42 dini sakit layan sehat

dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:

(71)

rewritten [dini, sakit, layan] dengan d2s17 rewritten [sakit, layan, sehat] dengan d2s19 a1s43 sakit layan sehat cepat

dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:

verbatim [sakit, layan, sehat, cepat] dengan d2s19 rewritten [sakit, layan, sehat] dengan d2s18 rewritten [layan, sehat, cepat] dengan d2s20 a1s44 layan sehat cepat laku

dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:

verbatim [layan, sehat, cepat, laku] dengan d2s20 rewritten [layan, sehat, cepat] dengan d2s19 rewritten [sehat, cepat, laku] dengan d2s21 a1s45 sehat cepat laku bangun

dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:

rewritten [sehat, cepat, laku] dengan d2s21 a1s46 cepat laku bangun guna

dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil: new fragmen

(72)

dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:

rewritten [bangun, guna, teknologi] dengan d2s25 dan d2s26 a1s48 bangun guna teknologi J2ME

dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:

verbatim [bangun, guna, teknologi, J2ME] dengan d2s26 rewritten [bangun, guna, teknologi] dengan d2s25 rewritten [guna, teknologi, J2ME] dengan d2s27 a1s49 guna teknologi J2ME implementasi

dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:

verbatim [guna, teknologi, J2ME, implementasi] dengan d2s27 rewritten [guna, teknologi, J2ME] dengan d2s26

rewritten [teknologi, J2ME, implementasi] dengan d2s28 a1s50 teknologi J2ME implementasi rupa

dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:

rewritten [teknologi, J2ME, implementasi] dengan d2s27 dan d2s28 a1s51 J2ME implementasi rupa perangkat

dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:

(73)

a1s52 implementasi rupa perangkat mobile

dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil: new fragmen

a1s53 rupa perangkat mobile berat

dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil: new fragmen

a1s54 perangkat mobile berat memori

dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:

rewritten [perangkat, berat, memori] dengan d2s31 a1s55 mobile berat memori aplikasi

dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:

rewritten [berat, memori, aplikasi] dengan d2s32 dan d2s33 a1s56 berat memori aplikasi buat

dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:

rewritten [berat, memori, aplikasi] dengan d2s32 dan d2s33 a1s57 memori aplikasi buat Aplikasi

dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:

(74)

dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:

rewritten [aplikasi, Aplikasi, kembang] dengan d2s34 dan d2s35 a1s59 buat Aplikasi kembang artificial

dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:

rewritten [Aplikasi, kembang, artificial] dengan d2s35 a1s60 Aplikasi kembang artificial intelligence

dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:

rewritten [Aplikasi, kembang, artificial] dengan d2s35

rewritten [kembang, artificial, intelligence] dengan d2s36 dan d2s37 a1s61 kembang artificial intelligence sistem

dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:

rewritten [kembang, artificial, intelligence] dengan d2s36 dan d2s37 a1s62 artificial intelligence sistem pakar

dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:

(75)

dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:

verbatim [intelligence, system, pakar, guna] dengan d2s39 rewritten [intelligence, system, pakar] dengan d2s38 rewritten [system, pakar, guna] dengan d2s40 a1s64 sistem pakar guna metode

dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:

verbatim [system, pakar, guna, metode] dengan d2s40 rewritten [system, pakar, guna] dengan d2s39

rewritten [pakar, guna, metode] dengan d2s41 a1s65 pakar guna metode certainty

dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:

verbatim [pakar, guna, metode, certainty] dengan d2s41 rewritten [pakar, guna, metode] dengan d2s40

rewritten [guna, metode, certainty] dengan d2s42 a1s66 guna metode certainty factor

dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:

Gambar

Tabel 4.5 Data Skripsi Baru ............................................................................
Gambar 2.1 Proses Sistem Temu kembali [6]
Gambar 2.2  Proses Pengindeksan [6]
Tabel 2.1  Kombinasi Awalan Akhiran yang Tidak Diijinkan
+7

Referensi

Dokumen terkait

Maka dari itu skripsi ini bertujuan membuat suatu sistem untuk mendeteksi tindakan plagiarisme dokumen skripsi yang dilakukan oleh mahasiswa Universitas Sanata

Berdasarkan hal-hal diatas, akan di lakukan sebuah penelitian pendeteksi kendaraan untuk menentukan volume traffic kendaraan, kecepatan kendaraan dan ukuran panjang

Sistem pendeteksi penghalang diam yang diimplementasikan dalam skripsi ini menggunakan metode Pyramidal Lucas Kanade Optical Flow dengan masukan berupa citra greyscale

Pada penelitian ini digunakan mikrokontroler ATMega 328 sebagai pengendali sistem, Pulse Sensor sebagai sensor pendeteksi denyut jantung,modul Bluetooth HC-05

IMPLEMENTASI VECTOR SPACE MODEL DENGAN METODE COSINE SIMILARITY DAN CONDITIONAL PROBABILITY UNTUK SISTEM DETEKSI PLAGIARISME.. DOKUMEN

Syukur Alhamdulillah, akhirnya penulis berhasil menyelesaikan skripsi yang berberjudul “Perancangan Sistem Pendeteksi Suhu Pada Kandang Ayam Broiler Berbasis

dengan menggunakan algoritma Smith- Waterman untuk mendeteksi kesamaan dokumen dan data noise untuk menghitung bobot hasil perbandingan, Pembuatan Sistem

Berdasarkan hal-hal diatas, akan di lakukan sebuah penelitian pendeteksi kendaraan untuk menentukan volume traffic kendaraan, kecepatan kendaraan dan ukuran panjang