SISTEM PENDETEKSI PLAGIARISME DOKUMEN SKRIPSI
DENGAN MENGGUNAKAN PERBANDINGAN
N-GRAMS
(STUDI KASUS PADA PROGRAM STUDI TEKNIK INFORMATIKA UNIVERSITAS SANATA DHARMA)
SKRIPSI
Ditujukan Untuk Memenuhi Salah Satu Syarat
Memperoleh Gelar Sarjana Teknik Jurusan Teknik Informatika
Disusun oleh :
Rosalia Ratna Susanti
NIM : 075314073
PROGRAM STUDI TEKNIK INFORMATIKA
FAKULTAS SAINS DAN TEKNOLOGI
UNVERSITAS SANATA DHARMA
YOGYAKARTA
ii
SYSTEM PLAGIARISM DETECTION DOCUMENT THESIS
BASED ON N-GRAMS COMPARISON
(A CASE STUDY AT DEPARTMENT OF INFORMATIC
ENGINEERING , SANATA DHARMA UNIVERSITY
)
A THESIS
Presented as Partial Fulfillment of the Requirements
To Obtain the
Sarjana Komputer
Degree
In Informatics Engineering Department
By:
Rosalia Ratna Susanti
NIM : 075314073
DEPARTMENT OF INFORMATIC ENGINEERING
FACULTY OF SCIENCE AND TECHNOLOGY
SANATA DHARMA UNIVERSITY
YOGYAKARTA
v
HALAMAN PERSEMBAHAN
!
"
!
#
$$
$$
%
"
"
"
"
" "
viii
SISTEM PENDETEKSI PLAGIARISME DOKUMEN SKRIPSI DENGAN
MENGGUNAKAN PERBANDINGAN N-GRAMS
ABSTRAK
Plagiat bukan menjadi hal baru dalam dunia pendidikan. Dengan adanya kemudahan bagi setiap orang untuk dapat bertukar informasi. Sehingga memberikan kemudahan dalam tindakan plagiarisme terutama dikalangan mahasiswa. Yang menjadi salah satu keprihatinan dalam dunia pendidikan yaitu adanya tindakan plagiat pada naskah dokumen skripsi yang banyak dilakukan oleh para mahasiswa. Oleh karena itu diperlukan suatu sistem pendeteksian plagiarisme pada dokumen teks yang dilakukan secara terkomputerisasi.
Dalam hal ini sistem pendeteksi plagiat dokumen skripsi yang akan digunakan yaitu dengan menggunakan perbandingan n-grams. Perbandingan n-grams merupakan sebuah metode sederhana dengan membandingkan potongan teks berdasarkan n-grams kata.
Pengujian dari sistem ini dilakukan dengan melakukan perhitungan recall dan precision dari hasil testing program dengan membandingkan dengan hasil deteksi secara manual. Dari hasil pengujian yang dilakukan terhadap dokumen skripsi dengan menggunakan perbandingan n-grams dengan nilai n=3, n=4, dan n=5 yang memiliki tingkat ketepatan terbaik adalah yang nilai n=5 dengan nilai precision = 90.12% dibandingakn dengan nilai n =3 dengan hasil precision 10.61% dan n=4 dengan hasil precision 78.12%.
ix
SYSTEM PLAGIARISM DETECTION DOCUMENT THESIS
BASED ON N-GRAMS COMPARISON
(A CASE STUDY AT DEPARTMENT OF INFORMATIC
ENGINEERING , SANATA DHARMA UNIVERSITY
)
ABSTRACT
Plagiarism is not a new thing in the world of education. With the convenience for everyone to be able to exchange information. So much easier and acts of plagiarism, especially among students. That was one of concern in education is the act of plagiarism in the thesis text document is mostly done by the students. Therefore we need a system for plagiarism detection in text documents is done in computerized.
In this system plagiarism detection document thesis based on n-grams comparison. N-grams comparison is a simple method by comparing the bits of text based on word n-grams.
Testing performance of the system with comparing of recall and precision of the testing program and the detection results manually. From the results of tests performed on thesis document based on n-grams comparison with a value of n = 3, n = 4 and n = 5 which has the best accuracy rate is the value of n = 5 with the precision = 90.12% compared with a value of n = 3 with the precision 10.61% and n = 4 with 78.12% precision results.
x
KATA PENGANTAR
Puji dan syukur penulis panjatkan ke hadirat Tuhan Yesus Kristus atas segala berkat, bimbingan, dan kasih-Nya sehingga penulis dapat menyelesaikan penelitian dan penyusunan tugas akhir yang berjudul “SISTEM PENDETEKSI PLAGIARISME DOKUMEN SKRIPSI DENGAN MENGGUNAKAN
PERBANDINGAN N-GRAMS (STUDI KASUS PADA PROGRAM STUDI
TEKNIK INFORMATIKA UNIVERSITAS SANATA DHARMA)” ini tepat
pada waktunya.
Tugas akhir ini disusun untuk memenuhi salah satu syarat dalam menyelesaikan program Strata satu ( S1 ) Jurusan Teknik Informatika Fakultas Sains dan Teknologi Universitas Sanata Dharma Yogyakarta. Penulis berhasil menyelesaikan penelitian dan penyusunan tugas akhir ini tak lepas dari bantuan dan dukungan baik berupa materiil, moral maupun spiritual dari banyak pihak. Pada kesempatan ini, penulis ingin mengucapkan terima kasih kepada :
1. Tuhan Yesus Kristus atas berkat, rahmat dan penyertaan selama penulis menyusun dan menyelesaikan tugas akhir ini dari awal hingga selesai. 2. Ibu P.H. Prima Rosa, S.Si.,M.Sc., selaku Dekan Fakultas Sains dan Teknologi
Universitas Sanata Dharma Yogyakarta
xi
4. Ibu Sri Hartati Wijono, S.Si.,M.Kom., selaku Dosen Pembimbing atas segala waktu, kesabaran, serta member kritik dan saran yang membangun dalam membantu penyelesaian tugas akhir ini.
5. Bapak Puspaningtyas Sanjoyo Adi S.T.,M.T.,dan Bapak J.B.Budi Darmawan, S.T.,M.Sc., selaku dosen penguji atas saran dan kritikannya. 6. Seluruh staff pengajar Prodi Teknik Informatika yang telah memberikan
ilmu pengetahuan yang sangat berguna bagi penulis.
7. Seluruh staff sekretariat yang telah membantu dalam urusan akademik. 8. Ayah dan Ibu yang selalu memberikan semangat, doa, perhatian dan kasih
sayang kepada penulis.
9. Kakakku L. Eka Ariwobowo dan adikku Theresia Nurvita S yang selalu memberikan dukungan dan semangat selama pengerjaan tugas akhir ini. 10.“Ndutz” yang selalu menanyakan perkembangan tugas akhir ini.
Membantu dan memberikan banyak masukan dan semangat selama menyelesaikan tugas akhir ini. Terimakasih atas dukungan dan semangatnya.
11.“Bebz q cayank” thank’s buat kesabaran, kesetiaan, kasih sayang, nasehat, semangat, perhatian, dan doa yang telah diberikan hingga saat ini.
12.Teman seperjuanganku Monica Pancaindrani yang selalu membantu dan memberikan semangat selama pengerjaan tugas akhir ini dari awal hingga selesai.
xiii
DAFTAR ISI
HALAMAN JUDUL BAHASA INDONESIA ... i
HALAMAN JUDUL BAHASA INGGRIS ... ii
HALAMAN PERSETUJUAN ... iii
HALAMAN PENGESAHAN ... iv
HALAMAN PERSEMBAHAN ... v
HALAMAN PERNYATAAN KEASLIAN KARYA ... vi
HALAMAN PERSETUJUAN PUBLIKASI ... vii
ABSTRAK ... viii
ABSTRACT ... ix
KATA PENGANTAR ... x
DAFTAR ISI ... xiii
DAFTAR TABEL ... xvii
DAFTAR GAMBAR ... xix
BAB I PENDAHULUAN ... 1
1.1 Judul ... 1
1.2 Latar Belakang Masalah ... 1
1.3 Rumusan Masalah ... 3
1.4 Batasan Masalah ... 3
1.5 Tujuan ... 4
1.6 Luaran Yang Diharapkan ... 4
1.7 Metodologi ... 4
1.8 Sistematika Penulisan ... 5
BAB II TINJAUAN PUSTAKA ... 7
2.1 Sistem ... 7
2.2 Deteksi Plagiarisme ... 7
2.2.1 Plagiarisme ... 7
2.3 Sistem Temu kembali ... 9
xiv
2.4 Pengukuran Unjuk Kerja Sistem Temu Kembali ... 15
2.5 Perbandingan N-grams ... 16
2.6 Konsep N-grams ... 17
2.7 Contoh perhitungan menggunakan perbandingan n-grams ... 19
BAB III ANALISA DAN PERANCANGAN SISTEM ... 70
3.1 Gambaran Umum Sistem... 70
3.1.1 Analisa kebutuhan ... 73
3.2 Analisa Sistem ... 73
3.2.1 Definisi Aktor ... 73
3.2.2 Model Use Case ... 74
3.2.3 Deskripsi Use Case ... 75
3.2.4 Diagram Use Case ... 77
3.2.5 Skenario Use Case ... 78
3.3 Model Analisis ... 92
3.3.1 Diagram Sekuensial ... 92
3.3.1.1 Diagram Sekuensial Login ... 92
3.3.1.2 Diagram Sekuensial InsertUser ... 94
3.3.1.3 Diagram Sekuensial UpdateUser ... 95
3.3.1.4 Diagram Sekuensial DeleteUser ... 97
3.3.1.5 Diagram Sekuensial Insert Kata Dasar ... 98
3.3.1.6 Diagram Sekuensial Delete Kata Dasar ... 100
3.3.1.7 Diagram Sekuensial Cari Kata Dasar ... 101
3.3.1.8 Diagram Sekuensial InsertStopword ... 102
3.3.1.9 Diagram Sekuensial UpdateStopword ... 104
3.3.1.10 Diagram Sekuensial Cari Stopword ... 105
3.3.1.11Diagram Sekuensial Insert Dokumen Skripsi Admin .... 107
3.3.1.12Diagram Sekuensial Insert Dokumen Skripsi User ... 108
3.3.1.13Diagram Sekuensial Preprocessing Dokumen Skripsi Admin ... 110
xv
3.3.1.15Diagram Sekuensial Deteksi Plagiarisme Admin ... 114
3.3.1.16Diagram Sekuensial Deteksi Plagiarisme User ... 115
3.3.2 Diagram Kelas Keseluruhan... 117
3.3.3 Model Desain ... 117
3.3.3.1 Kelas Perancangan ... 118
3.3.3.2 Diagram UML untuk kelas perancangan model ... 120
3.3.4 Algoritma Method – Method Penting dalam Setiap Kelas ... 124
3.3.5 Prototype Antar Muka ... 142
3.3.6 Desain Database ... 149
3.4 Rencana Pengujian dan Evaluasi ... 151
3.4.1 Metode Pengujian ... 151
3.4.2 Mekanisme Pengujian Sistem ... 152
3.4.3 Mekanisme Pengujian Manual ... 153
BAB IV IMPLEMENTASI DAN PENGUJIAN ... 154
4.1 Implementasi ... 154
4.1.1 Lingkungan Implementasi Perangkat Keras ... 154
4.1.2 Lingkungan Implementasi Perangkat Lunak ... 154
4.1.3 Implementasi Method – Method Penting dalam Setiap Kelas .... 154
4.1.4 Implementasi Antar Muka... 178
4.1.5 Implementasi Kelas ... 185
4.1.6 Implementasi Database ... 186
4.2 Pengujian ... 188
4.2.1 Hasil Pengujian Program ... 188
4.2.2 Hasil Pengujian Precision ... 189
4.2.3Testing Program ... 193
4.3 Kelemahan Sistem ... 196
BAB V KESIMPULAN... 198
5.1 Kesimpulan ... 198
5.2 Saran ... 199
DAFTAR PUSTAKA ... 200
xvi
xvii
DAFTAR TABEL
Tabel 2.1 Kombinasi Awalan Akhiran yang Tidak Diijinkan ... 13
Tabel 2.2 Cara Menentukan Tipe Awalan Untuk Kata Diawali dengan “ te- ... 14
Tabel 2.3 Jenis Awalan Berdasarkan Tipe Awalannya ... 14
Tabel 3.1 Tabel Penjelasan Dokumen Plagiat ... 70
Tabel 3.2 Tabel Definisi Aktor ... 73
Tabel 3.3 Deskripsi Use Case ... 75
Tabel 3.4 Skenario Use Case Login ... 79
Tabel 3.5 Skenario InsertUser ... 80
Tabel 3.6 Skenario UpdateUser ... 81
Tabel 3.7 Skenario DeleteUser ... 81
Tabel 3.8 Skenario Insert Kata Dasar ... 82
Tabel 3.9 Skenario Delete Kata Dasar ... 83
Tabel 3.10 Skenario Cari Kata Dasar ... 84
Tabel 3.11 Skenario InsertStopword ... 84
Tabel 3.12 Skenario UpdateStopword ... 85
Tabel 3.13 Skenario Cari Stopword ... 86
Tabel 3.14 Skenario Use CaseInsert Dokumen Skripsi Admin ... 87
Tabel 3.15 Skenario Use CaseInsert Dokumen Skripsi User ... 87
Tabel 3.16 Skenario Use CasePreprocessing Dokumen Skripsi Admin ... 88
Tabel 3.17 Skenario Use CasePreprocessing Dokumen Skripsi User ... 89
Tabel 3.18 Skenario Use Case Deteksi Plagiarisme Admin ... 90
Tabel 3.19 Skenario Use Case Deteksi Plagiarisme User ... 91
Tabel 3.20 Kelas Perancangan ... 118
Tabel 3.21 Diagram Relational User ... 150
Tabel 3.22 Diagram Relational Kamus ... 150
Tabel 3.23 Diagram Relational Stopwod ... 150
Tabel 3.24 Diagram Relational KumpulanSkripsi ... 150
Tabel 3.25 Diagram Relational ngramkata ... 151
xviii
Tabel 4.2 Tabel Pegujian Program ... 188
Tabel 4.3 Tabel Hasil Pengujian... 190
Tabel 4.4 Tabel Hasil Pengujian Precision dan Recall... 192
xix
DAFTAR GAMBAR
Gambar 2.1 Prose Sistem temu kembali ... 9
Gambar 2.2 Proses Pengindeksan ... 10
Gambar 3.1 Diagram Keseluruhan Sistem ... 71
Gambar 3.2 Flowcart Perhitungan Perbandingan N-grams ... 72
Gambar 3.3 Diagram Use Case ... 78
Gambar 3.4 Diagram Kelas Keseluruhan ... 117
Gambar 3.5 Antar muka Login ... 142
Gambar 3.6 Antar muka Kelola Stopword ... 143
Gambar 3.7 Antar muka Kelola Kata Dasar ... 144
Gambar 3.8 Antar muka User ... 145
Gambar 3.9 Antar muka Preprocessing Admin ... 146
Gambar 310 Antar muka Testing Program ... 147
Gambar 3.11 Antar muka Deteksi User ... 148
Gambar 3.12 ER Diagram ... 149
Gambar 3.13 Mekanisme Pengujian ... 153
Gambar 4.1 Halaman Login ... 178
Gambar 4.2 Halaman Kelola Stopword ... 179
Gambar 4.3 Halaman Kelola Kata Dasar ... 180
Gambar 4.4 Halaman User ... 181
Gambar 4.5 Halaman Preprocessing Admin ... 182
Gambar 4.6 Halaman Testing Program ... 183
Gambar 4.7 Halaman Deteksi User ... 184
Gambar 4.8 Hasil Pengujian Sample1 ... 188
Gambar 4.9 Hasil Pengujian Sample2 ... 189
Gambar 4.10 Hasil Running Skripsi-051 ... 194
Gambar 4.11 Hasil Running Skripsi-052 ... 195
1
BAB I
PENDAHULUAN
1.1 Judul
“SISTEM DETEKSI PLAGIARISME DOKUMEN SKRIPSI DENGAN MENGGUNAKAN PERBANDINGAN N-GRAMS”
1.2 Latar Belakang Masalah
Plagiarisme atau sering disebut plagiat adalah penjiplakan atau pengambilan karangan, pendapat, dan sebagainya dari orang lain dan menjadikannya seolah karangan dan pendapat sendiri.Plagiat dapat dianggap sebagai tindak pidana karena mencuri hak cipta orang lain. Pelaku plagiat disebut sebagai plagiator[1]. Plagiat bukan menjadi hal baru dalam dunia pendidikan. Dengan adanya kemudahan bagi setiap orang untuk dapat bertukar informasi, mengakses segala sesuatu melalui internet. Sehingga memberikan kemudahan dalam tindakan plagiarisme terutama dikalangan mahasiswa. Yang menjadi salah satu keprihatinan dalam dunia pendidikan yaitu adanya tindakan plagiat pada naskah dokumen skripsi yang banyak dilakukan oleh para mahasiswa.
Untuk mengatasi adanya plagiarisme dalam dunia pendidikan dapat dilakukan dalam beberapa cara. Terdapat dua cara untuk mengatasi permasalahan plagiarisme, yaitu dengan mencegah dan mendeteksi. Mencegah berarti menjaga atau menghalangi agar plagiarisme tidak dilakukan. Hal tersebut harus dilakukan sedini mungkin terutama dalam dunia pendidikan. Mendeteksi berarti melakukan usaha untuk menemukan tindakan plagiat yang telah dilakukan.
Yang menjadi permasalahan adalah bagaimana cara untuk mengetahui apakah seorang mahasiswa melakukan plagiarisme atau tidak dalam membuat suatu karya tulis atau skripsi. Untuk mengetahuinya perlu dilakukan pengecekan secara teliti terhadap hasil tulisan mahasiswa tersebut, kemudian dibandingkan dengan hasil tulisan mahasiswa yang lainnya. Tetapi usaha tersebut akan memerlukan waktu yang lama dan ketelitian yang tinggi jika pembandingan tersebut dilakukan secara manual. Oleh karena itu diperlukan suatu sistem pendeteksian plagiarisme pada dokumen teks yang dilakukan secara terkomputerisasi.
Terdapat beberapa metode yang dilakukan untuk mendeteksi adanya plagiarisme dokumen skripsi atau karya ilmiah antara lain dengan Multilevel Text Comparison, Clustering, Document Similarities, Mining
dokumen skripsi plagiat dari dokumen skripsi yang lain. Perbandingan n-grams merupakan sebuah metode sederhana dengan membandingkan potongan teks berdasarkan n-grams kata. Untuk mendeteksi plagiarisme kata dari dokumen yang mencurigakan plagiat atau tidak dari dokumen referensi[2].
1.3 Rumusan Masalah
Dengan melihat latar belakang yang ada, maka rumusan masalah yang didapatkan adalah :
1. Bagaimana ketepatan dari sistem deteksi plagiarisme dokumen skripsi dengan menggunakan perbandingan n-grams ?
2. Bagaimana membuat sistem deteksi plagiarisme dokumen skripsi dengan menggunakan perbandingan n-grams ?
.
1.4
Batasan Masalah
Pada sistem deteksi plagiarisme pada dokumen skripsi ditetapkan beberapa batasan sebagai berikut :
1. Perbandingan menggunakan dengan nilai n=3, n=4 dan n=5.
2. Data skripsi yang digunakan 50 skripsi mahasiswa Teknik Informatika Universitas Sanata Dharma.
3. Dokumen yang digunakan Abstraksi, Bab 1, dan Bab 2 dengan topik Sistem Informasi.
5. Dokumen yang digunakan Dokumen teks yang akan dideteksi adalah file teks digital yang bersifat plain text, yaitu file yang hanya terdiri dari huruf-huruf dan angka-angka saja, tidak mencakup gambar, tabel, dan sejenisnya.
6. Sistem hanya memproses dokumen teks berbahasa Indonesia. 7. Sistem tidak menghiraukan adanya kutipan.
8. Sistem tidak memperhatikan sinonim/persamaan kata.
1.5 Tujuan
Penelitian ini bertujuan untuk membangun sebuah sistem untuk mendeteksi plagiarisme dokumen skripsi, sehingga dapat diketahui apakah sebuah skripsi merupakan plagiat dari dokumen skripsi yang lainnya secara terkomputerisasi.
1.6 Luaran yang Diharapkan
Luaran yang diharapkan dari Sistem Deteksi Plagiarisme Dokumen Skripsi Dengan Menggunakan Perbandingan N-grams berupa hasil deteksi dokumen skripsi apakah merupakan plagiat dari dokumen lain atau tidak.
1.7 Metodologi
Skripsi ini akan dikerjakan dengan metodologi sebagai berikut: 1. Studi Literatur
didapatkan melalui internet, serta mempelajari lebih dalam tentang sistem informasi retrieval, teori-teori tentang plagiarisme dan teknik pengimplementasian perbandingan .
2. Perancangan Sistem
Melakukan perancangan sistem dengan melakukan pengujian terhadap data-data yang ada dengan melakukan perhitungan secara manual untuk mengetahui apakah metode yang digunakan sudah sesuai yang diharapkan.
3. Implementasi
Pembuatan aplikasi pendeteksi plagiarisme dokumen skripsi dengan menggunakan perbandingan n-grams sesuai dengan perancangan yang telah dibuat sebelumnya ke dalam program komputer.
4. Pengujian dan Evaluasi
Melakukan uji coba terhadap program yang telah dibuat kemudian dari hasil yang didapat dilakukan evaluasi terhadap kekurangan program.
1.8 Sistematika Penulisan
Dalam penulisan skripsi ini, sistematika penulisan dibagi menjadi lima bab, yaitu:
BAB I : PENDAHULUAN
BAB II : TINJAUAN PUSTAKA
Pada bab ini akan dibahas mengenai konsep dasar sistem temu-kembali informasi (information retrieval system), Pengukuran unjuk kerja sistem temu kembali, perbandingan n-grams dan konsep n-grams .
BAB III : ANALISA DAN PERANCANGAN SISTEM
Pada bab ini akan dibahas mengenai urutan dan langkah-langkah pengerjaan untuk mengidentifikasi plagiarisme, perancangan user interface dan perancangan basisdata.
BAB IV : IMPLEMENTASI DAN PEMBAHASAN
Pada bab ini akan dibahas mengenai implementasi dari perancangan yang telah dibuat sebelumnya dan uji coba terhadap hasil sistem dengan hasil membaca secara manual.
BAB V : KESIMPULAN DAN SARAN
Pada bab ini akan dibahas mengenai kesimpulan yang didapat dalam pembuatan sistem dan saran terhadap sistem yang dapat dilakukan untuk penelitian lebih lanjut.
DAFTAR PUSTAKA
7
BAB II
TINJAUAN PUSTAKA
2.1 Sistem
Sistem merupakan sekumpulan unsur/elemen yang saling berkaitan dan saling mempengaruhi dalam melakukan kegiatan bersama untuk mencapai suatu tujuan[4].
2.2 Deteksi Plagiarisme
2.2.1 Plagiarisme
Plagiarisme atau sering disebut plagiat adalah penjiplakan atau pengambilan karangan, pendapat, dan sebagainya dari orang lain dan menjadikannya seolah karangan dan pendapat sendiri[10].Plagiat dapat dianggap sebagai tindak pidana karena mencuri hak cipta orang lain. Di dunia pendidikan, pelaku plagiarisme dapat mendapat hukuman berat seperti dikeluarkan dari sekolah/universitas. Pelaku plagiat disebut sebagai plagiator[1].
Yang digolongkan sebagai plagiarisme:
1. Menggunakan tulisan orang lain secara mentah, tanpa memberikan tanda jelas (misalnya dengan menggunakan tanda kutip atau blok alinea yang berbeda) bahwa teks tersebut diambil persis dari tulisan lain.
2. Mengambil gagasan orang lain tanpa memberikan anotasi yang
Dalam buku Bahasa Indonesia: Sebuah Pengantar Penulisan Ilmiah, Felicia Utorodewo dkk. menggolongkan hal-hal berikut sebagai tindakan plagiarisme[5]:
1. Mengakui tulisan orang lain sebagai tulisan sendiri. 2. Mengakui gagasan orang lain sebagai pemikiran sendiri. 3. Mengakui temuan orang lain sebagai kepunyaan sendiri.
4. Mengakui karya kelompok sebagai kepunyaan atau hasil sendiri. 5. Menyajikan tulisan yang sama dalam kesempatan yang berbeda
tanpa menyebutkan asal-usulnya.
6. Meringkas dan memparafrasekan (mengutip tak langsung) tanpa menyebutkan sumbernya.
7. Meringkas dan memparafrasekan dengan menyebut sumbernya, tetapi rangkaian kalimat dan pilihan katanya masih terlalu sama dengan sumbernya.
Hal-hal yang tidak tergolong plagiarisme:
1. Menggunakan informasi yang berupa fakta umum.
2. Menuliskan kembali (dengan mengubah kalimat atau parafrase) opini orang lain dengan memberikan sumber jelas.
2.3 Sistem Temu Kembali
Sistem temu kembali merupakan bagian dari pengetahuan komputer yang berhubungan dengan pengambilan informasi dari dokumen-dokumen yang didasarkan pada isi dan konteks dari dokumen-dokumen itu sendiri. Information Retrieval merupakan suatu pencarian informasi (biasanya berupa dokumen) yang didasarkan pada suatu query (inputan pengguna) yang diharapkan dapat memenuhi keinginan pengguna dari kumpulan dokumen yang ada. Sedangkan, definisi query dalam sistem temu kembali merupakan sebuah formula yang digunakan untuk mencari informasi yang dibutuhkan oleh pengguna, dalam bentuk yang paling sederhana, sebuah query merupakan suatu kata kunci dan dokumen yang mengandung kata kunci merupakan dokumen yang dicari dalam sistem temu kembali[6].
Proses dalam sistem temu kembali pada gambar 2.1 dapat digambarkan sebagai sebuah proses untuk mendapatkan dokumen yang relevandari koleksi dokumenyang ada melalui pencarian query yang diinputkan pengguna.
Gambar 2.1 Proses Sistem Temu kembali [6]
Proses yang terjadi di dalam sistem temu kembali adalah preprocessing.
query Sistem temukembali
Koleksi dokumen
2.3.1 Tahap Preprocessing
Tahap preprocessing dilakukan untuk membentuk basisdata terhadap koleksi dokumen yang dimasukkan, atau dengan kata lain, preprocessing merupakan proses persiapan yang dilakukan terhadap dokumen sehingga dokumen siap untuk diproses. Tahap-tahap yang terjadi pada tahap preprocessing ialah:
1. Word Token
2. Stopword Removal
3. Stemming
4. Term Weighting
Tahap-tahap yang terjadi pada tahap preprocessing dapat dilihat pada gambar 2.2 berikut ini:
Gambar 2.2 Proses Pengindeksan [6]
Documents
Word Token
Stemming Stopword Removal
Term Weighting
Assign document IDs
Index database documents
1. Word Token
Yaitu mengubah dokumen menjadi kumpulan term dengan cara menghapus semua karakter dalam tanda baca yang terdapat pada dokumen dan mengubah kumpulan term menjadi lowercase[6]. 2. Stopword Removal
Proses penghapusan kata-kata yang sering ditampilkan dalam dokumen seperti: dan, atau, tidakdan sebagainya[6].
3. Stemming
Stemming merupakan suatu proses untuk menemukan kata dasar dari sebuah kata. Dengan menghilangkan semua imbuhan (affixes) baik yang terdiri dari awalan (prefixes), sisipan (infixes), akhiran (suffixes) dan confixes (kombinasi dari awalan dan akhiran) pada kata turunan. Stemming digunakan untuk mengganti bentuk dari suatu kata menjadi kata dasar dari kata tersebut yang sesuai dengan struktur morfologi Bahasa Indonesia yang baik dan benar[6]. Algoritma Stemming dilakukan dengan membandingkan kata yang telah dihilangkan imbuhannya dengan kata dasar dalam kamus. Stemming yang digunakan adalah stemming Nazief and Adriani’s. Algoritma skema yang berasal Adriani dan Nazief digambarkan dalam laporan teknis yang tidak dipublikasikan dari Universitas Indonesia (1996).
Berikut adalah algortima stemming Nazief and Adriani’s :
diasumsikan bahwa kata tesebut adalah root word. Maka algoritma berhenti.
2. Inflection Suffixes (“-lah”, “-kah”, “-ku”, “-mu”, atau “-nya”) dibuang. Jika berupa particles (lah”, kah”, tah” atau “-pun”) maka langkah ini diulangi lagi untuk menghapus Possesive Pronouns (“-ku”, “-mu”, atau “-nya”), jika ada. 3. Hapus Derivation Suffixes (“-i”, “-an” atau “-kan”). Jika kata
ditemukan di kamus, maka algoritma berhenti. Jika tidak maka ke langkah 3a
a. Jika “-an” telah dihapus dan huruf terakhir dari kata tersebut adalah “-k”, maka “-k” juga ikut dihapus. Jika kata tersebut ditemukan dalam kamus maka algoritma berhenti. Jika tidak ditemukan maka lakukan langkah 3b. b. Akhiran yang dihapus (“-i”, “-an” atau “-kan”)
dikembalikan, lanjut ke langkah 4.
4. Hapus Derivation Prefix. Jika pada langkah 3 ada sufiks yang dihapus maka pergi ke langkah 4a, jika tidak pergi ke langkah 4b.
a. Periksa tabel kombinasi awalan-akhiran yang tidak diijinkan. Jika ditemukan maka algoritma berhenti, jika tidak pergi ke langkah 4b.
langkah 5, jika sudah maka algoritma berhenti. Catatan: jika awalan kedua sama dengan awalan pertama algoritma berhenti.
5. Melakukan Recoding.
6. Jika semua langkah telah selesai tetapi tidak juga berhasil maka kata awal diasumsikan sebagai root word. Proses selesai. Tipe awalan ditentukan melalui langkah-langkah berikut:
1. Jika awalannya adalah: “di-”, “ke-”, atau “se-” maka tipe awalannya secara berturut-turut adalah “di-”, “ke-”, atau “se-”. 2. Jika awalannya adalah “te-”, “me-”, “be-”, atau “pe-” maka
dibutuhkan sebuah proses tambahan untuk menentukan tipe awalannya.
3. Jika dua karakter pertama bukan “di-”, “ke-”, “se-”, “te-”, “be-”, “me-“be-”, atau “pe-” maka berhenti.
4. Jika tipe awalan adalah “none” maka berhenti. Jika tipe awalan adalah bukan “none” maka awalan dapat dilihat pada Tabel 2.2. Hapus awalan jika ditemukan.
Tabel 2.1 Kombinasi Awalan Akhiran yang Tidak Diijinkan
Awalan Akhiran yang tidak diijinkan
be- -i
di- -an
ke- -i, -kan
me- -an
Tabel 2.2. Cara Menentukan Tipe Awalan Untuk Kata yang Diawali dengan “te-”
Following Characters Tipe
Awalan
Tabel 2.3. Jenis Awalan Berdasarkan Tipe Awalannya
Tipe Awalan Awalan yang harus dihapus
4. Term Weighting
Salah satu model sistem temu kembali informasi yang paling sederhana namun paling produktif adalah model ruang vektor. Vektor model ini merepresentasikan term yang terdapat pada dokumen dan query. Elemen vektor tersebut adalah bobot term yang menjadi dasar penilaian dalam pemeringkatan dokumen. Hal yang perlu diperhatikan dalam penemuan kembali informasi model ruang vektor ini adalah pembobotan term (term weighting)[8].
2.4 Pengukuran Unjuk Kerja Sistem Temu Kembali
Nilai performansi dari aplikasi sistem temu kembali menunjukkan keberhasilan dari suatu sistem temu kembali dalam mengembalikan informasi yang dibutuhkan oleh pengguna. Untuk mengukur performansi dari sistem temu kembali, digunakan koleksi uji. Koleksi uji terdiri dari tiga bagian, yaitu koleksi dokumen, query, dan relevance judgement. Koleksi dokumen adalah kumpulan dokumen yang dijadikan bahan pencarian oleh sistem. Relevance judgement adalah daftar dokumen-dokumen yang relevan dengan semua query yang telah disediakan[6]. Parameter yang digunakan dalam performansi sistem, antara lain :
1. Precision (ketepatan)
Precision =
2. Recall (kelengkapan)
Recall ialah perbandingan jumlah dokumen relevan yang didapatkan sistem dengan jumlah seluruh dokumen relevan yang ada dalam koleksi dokumen (terambil ataupun tak terambil sistem)[9].
Recall =
3. Interpolate Average Precision (IAP)
Pengukuran performansi dengan mempertimbangkan aspek keterurutan atau rangking dapat dilakukan dengan melakukan interpolasi antara precision dan recall. IAP akan mencatat semua Semua dokumen yang relevan dan urutan dokumen tersebut pada hasil IRS dan menghitung nilai precisionnya.
Nilai precision untuk semua titik ditentukan oleh perubahan nilai recall yang terjadi. Nilai precision berubah pada saat nilai recall berubah naik. Precision disatu titik recall tertentu adalah maksimal precision untuk semua titik recall yang lebih kecil dari titik tersebut.
2.5 Perbandingan N-grams
potongan-potongan karakter huruf sejumlah n dari sebuah kata yang secara kontinuitas dibaca dari awal teks sumber hingga akhir dari dokumen[6].
2.6 Konsep N-grams
Dalam tugas akhir ini deteksi plagiarisme yang akan dibuat menggunakan perbandingan n-grams yang bersumber dari makalah Alberto Barron-Cedene dan Paolo Rosso yang berjudul On Automatic Plagiarism Detection Based on N-grams Comparison[2]. Dengan menggunakan perbandingan tersebut jika dua fragmen teks cukup dekat (dokumen asli dan dokumen mencurigakan), dapat diasumsikan bahwa dokumen tersebut berpotensi plagiat, yang harus diselidiki lebih dalam. Perbandingan merupakan sebuah metode sederhana dengan membandingkan potongan teks berdasarkan kata. Dimana s merupakan dokumen mencurigakan dan D merupakan kumpulan dokumen referensi. Untuk mengetahui kata yang merupakan bagian dari dokumen yang mencurigakan plagiat dari kumpulan dokumen referensi. Untuk itu digunakan perbandingan untuk menentukan adanya plagiarisme[2].
Pada kenyataannya kalimat plagiat dapat berasal dari kata yang diambil dari beberapa bagian dari dokumen asli, dokumen referensi tidak dibagi menjadi kalimat, tetapi hanya ke . Perbandingan yang dipergunakan didasarkan pada empat hal berikut[2]:
1. Dokumen mencurigakan s dibagi menjadi kalimat (si).
3. Dokumen yang dicurigai d tidak dibagi menjadi kalimat, tetapi hanya menjadi kata.
4. Setiap si
∈
s dicari kalimat tunggal dari dokumen-dokumenreferensi D.
Deteksi plagiat dengan perbandingan ini dilakukan dengan memotong teks dokumen pada dokumen yang mencurigakan dan kumpulan dokumen referensi berdasarkan n kata. Pemotongan teks dokumen dilakukan berdasarkan kata yang telah ditentukan nilai n nya. Setiap pemotongan teks, untuk pemotongan kata berikutnya diikuti n-1 kata dari potongan kata sebelumnya. Sehingga setiap potongan kata memiliki saling keterkaitan.
Untuk menentukan apakah n-grams (si) merupakan plagiat dari d
∈
D, yaitu dengan membandingkan set yang sesuai dengan rumus containment :
C
(
s
i|
d
)
=Dimana N (•) adalah himpunan di (•). Jika nilai containment maksimum dari setiap n-grams dalam dokumen query, dibandingkan dengan n-grams dokumen asli yang merupakan kumpulan dokumen koleksi lebih besar dari nilai ambang batas tertentu, maka n-grams(si) menjadi calon
terdapat kesamaan lebih dari 60% n-grams dokumen asli. N-grams dokumen query dikatakan new fragment jika merupakan kalimat baru yang berbeda dari n-grams dokumen asli. Dokumen dianggap plagiat jika persentase dari n-gramsverbatim dan rewritten memenuhi ketidaksetaraan :
| siVU siR| > 0.4 |si| siVmerupakan kalimat verbatim
siR merupakan kalimat rewritten pada kalimat si [2].
2.7 Contoh perhitungan menggunakan perbandingan n-gram
Dalam perhitungan ayang akan dijelaskan dibawah ini menggunakan n-Grams 4 kata. Dalam perhitungan ini menggunakan 3 dokumen yaitu dokumen A sebagai dokumen yang dicurigai, dokumen B sebagai dokumen asli d1 dan dokumen C sebagai dokumen asli d2.
A.Dokumen yang dicurigai
(Java 2 Micro Edition) dengan implementasinya dapat berupa perangkat mobile yang tidak memberatkan memori, maka aplikasi ini dibuat. Aplikasi ini merupakan pengembangan dari artificial intelligence yaitu sistem pakar dengan menggunakan metode certainty factor yang mampu menunjukkan ukuran kepastian terhadap suatu fakta atau aturan.
Hasil preprocessing dokumen :
guna alat handphone sekarang ragam media komunikasi bentuk panggil suara pesan singkat kembang media mampu isi bagai program aplikasi tambah mudah user Salah satu bentuk manfaat teknologi handphone layan sehat bentuk diagnosis sakit diagnosis sakit Hepatitis laku bantu user tangan deteksi dini sakit layan sehat cepat laku bangun guna teknologi J2ME implementasi rupa perangkat mobile berat memori aplikasi buat Aplikasi kembang artificial intelligence sistem pakar guna metode certainty factor mampu tunjuk ukur fakta atur
Daftar n-Grams 4 kata dari dokumen A sebagai dokumen yang dicurigai: a1s1 guna alat handphone sekarang
a1s32 diagnosis sakit diagnosis sakit a1s33 sakit diagnosis sakit Hepatitis a1s34 diagnosis sakit Hepatitis laku a1s35 sakit Hepatitis laku bantu a1s36 Hepatitis laku bantu user a1s37 laku bantu user tangan a1s38 bantu user tangan deteksi a1s39 user tangan deteksi dini a1s40 tangan deteksi dini sakit a1s41 deteksi dini sakit layan a1s42 dini sakit layan sehat a1s43 sakit layan sehat cepat a1s44 layan sehat cepat laku a1s45 sehat cepat laku bangun a1s46 cepat laku bangun guna a1s47 laku bangun guna teknologi a1s48 bangun guna teknologi J2ME a1s49 guna teknologi J2ME implementasi a1s50 teknologi J2ME implementasi rupa a1s51 J2ME implementasi rupa perangkat a1s52 implementasi rupa perangkat mobile a1s53 rupa perangkat mobile berat
a1s55 mobile berat memori aplikasi a1s56 berat memori aplikasi buat a1s57 memori aplikasi buat Aplikasi a1s58 aplikasi buat Aplikasi kembang a1s59 buat Aplikasi kembang artificial a1s60 Aplikasi kembang artificial intelligence a1s61 kembang artificial intelligence sistem a1s62 artificial intelligence sistem pakar a1s63 intelligence sistem pakar guna a1s64 sistem pakar guna metode a1s65 pakar guna metode certainty a1s66 guna metode certainty factor a1s67 metode certainty factor mampu a1s68 certainty factor mampu tunjuk a1s69 factor mampu tunjuk ukur a1s70 mampu tunjuk ukur fakta a1s71 tunjuk ukur fakta atur
B.Dokumen asli d1
itu sekarang cenderung semakin banyak orang menggunakan mobile devices dan semakin banyak fasilitas dari mobile devices yang memudahkan penggunanya. Untuk itu aplikasi diagnosis penyakit hepatitis ini dibuat. Kemudahan dalam hal pelayanan kesehatan sangat diharapkan oleh masyarakat. Dengan memanfaatkan teknologi mobile devices dalam aplikasi diagnosis penyakit hepatitis ini maka pasien dan dokter dapat terbantu. Dengan hanya memasukkan gejala yang dideritanya pasien dapat segera tahu jenis penyakit hepatitis yang dideritanya Sehingga kecepatan dan keefektifan dalam pelayanan dan penanganan kesehatan dapat cepat dilakukan. Aplikasi ini menggunakan teknologi J2ME karena teknologi ini bersifat platform. Disamping itu aplikasi ini hanya memerlukan kapasitas memori kecil untuk instalasi sehingga tidak memberatkan perangkat mobile devices.
Hasil preprocessing dokumen :
d1s69 sifat platform samping aplikasi d1s70 platform samping aplikasi kapasitas d1s71 samping aplikasi kapasitas memori d1s72 aplikasi kapasitas memori kecil d1s73 kapasitas memori kecil instalasi d1s74 memori kecil instalasi berat d1s75 kecil instalasi berat perangkat d1s76 instalasi berat perangkat mobile d1s77 berat perangkat mobile devices
C.Dokumen asli d2
Salah satu bentuk pemanfaatan dari teknologi handphone adalah pelayanan kesehatan dalam bentuk diagnosis penyakit. Diagnosis penyakit Hepatitis dilakukan untuk membantu user dalam penanganan dan deteksi dini akan penyakit tersebut. Sehingga pelayanan kesehatan dapat lebih cepat dilakukan. Perangkat lunak dibangun dengan menggunakan teknologi J2ME yang diimplementasikan pada perangkat handphone yang tidak memberatkan memori. Aplikasi ini merupakan pengembangan dari artificial intelligence yaitu sistem pakar dengan menggunakan metode certainty factor yang mampu menunjukkan ukuran kepastian terhadap suatu fakta atau aturan.
Hasil preprocessing dokumen :
sehat cepat laku Perangkat lunak bangun guna teknologi J2ME implementasi perangkat handphone berat memori Aplikasi rupa kembang artificial intelligence sistem pakar guna metode certainty factor mampu tunjuk ukur pasti fakta atur
d2s42 guna metode certainty factor d2s43 metode certainty factor mampu d2s44 certainty factor mamputunjuk d2s45 factor mampu tunjuk ukur d2s46 mampu tunjuk ukur pasti d2s47 tunjuk ukur pasti fakta d2s48 ukur pasti fakta atur
D.Perhitungan antara dokumen yang dicurigai dan dokumen asli d1 a1s1 guna alat handphone sekarang
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen
a1s 2 alat handphone sekarang ragam
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen
a1s 3 handphone sekarang ragam media
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen
a1s 4 sekarang ragam media komunikasi
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen
a1s 5 ragam media komunikasi bentuk
a1s 6 media komunikasi bentuk panggil
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen
a1s7 komunikasi bentuk panggil suara
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen
a1s8 bentuk panggil suara pesan
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen
a1s9 panggil suara pesan singkat
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen
a1s10 suara pesan singkat kembang
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen
a1s11 pesan singkat kembang media
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen
a1s12 singkat kembang media mampu
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen
a1s14 media mampu isi bagai
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen
a1s15 mampu isi bagai program
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen
a1s16 isi bagai program aplikasi
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen
a1s17 bagai program aplikasi tambah
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen
a1s18 program aplikasi tambah mudah
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen
a1s19 aplikasi tambah mudah user
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen
a1s20 tambah mudah user Salah
a1s21 mudah user Salah satu
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen
a1s22 user Salah satu bentuk
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen
a1s23 Salah satu bentuk manfaat
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen
a1s24 satu bentuk manfaat teknologi
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen
a1s25 bentuk manfaat teknologi handphone
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen
a1s26 manfaat teknologi handphone layan
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen
a1s27 teknologi handphone layan sehat
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen
a1s29 layan sehat bentuk diagnosis
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen
a1s30 sehat bentuk diagnosis sakit
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen
a1s31 bentuk diagnosis sakit diagnosis
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil:
rewritten [diagnosis,sakit,diagnosis] dengan d1s39 , d1s40 dan d1s41 a1s32 diagnosis sakit diagnosis sakit
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil:
verbatim [diagnosis,sakit,diagnosis,sakit] dengan d1s39 , d1s40 dan d1s41 a1s33 sakit diagnosis sakit Hepatitis
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil:
rewritten [sakit,diagnosis,sakit] dengan d1s39
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil:
rewritten [sakit,diagnosis,hepatitis] dengan d1s40 dan d1s41 a1s35 sakit Hepatitis laku bantu
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen
a1s36 Hepatitis laku bantu user
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen
a1s37 laku bantu user tangan
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen
a1s38 bantu user tangan deteksi
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen
a1s39 user tangan deteksi dini
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen
a1s40 tangan deteksi dini sakit
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen
a1s42 dini sakit layan sehat
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen
a1s43 sakit layan sehat cepat
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil:
rewritten [layan, sehat, cepat] dengan d1s59 a1s44 layan sehat cepat laku
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil:
rewritten [layan, sehat, cepat] dengan d1s59
rewritten [sehat, cepat, laku] dengan d1s60 dan d1s61 a1s45 sehat cepat laku bangun
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil:
rewritten [sehat, cepat, laku] dengan d1s60 dan d1s61 a1s46 cepat laku bangun guna
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil:
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil:
rewritten [laku, guna, teknologi] dengan d1s63 a1s48 bangun guna teknologi J2ME
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil:
rewritten [guna, teknologi, J2ME ] dengan d1s64 dan d1s65 a1s49 guna teknologi J2ME implementasi
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil:
rewritten [guna, teknologi, J2ME ] dengan d1s64 dan d1s65 a1s50 teknologi J2ME implementasi rupa
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen
a1s51 J2ME implementasi rupa perangkat
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen
a1s52 implementasi rupa perangkat mobile
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen
a1s53 rupa perangkat mobile berat
a1s54 perangkat mobile berat memori
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil:
rewritten [perangkat, mobile, berat] dengan d1s76 dan d1s77 a1s55 mobile berat memori aplikasi
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen
a1s56 berat memori aplikasi buat
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen
a1s57 memori aplikasi buat Aplikasi
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil:
rewritten [memori, aplikasi, Aplikasi] dengan d1s71 dan d1s72 a1s58 aplikasi buat Aplikasi kembang
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen
a1s59 buat Aplikasi kembang artificial
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen
a1s60 Aplikasi kembang artificial intelligence
a1s61 kembang artificial intelligence sistem
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen
a1s62 artificial intelligence sistem pakar
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen
a1s63 intelligence sistem pakar guna
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen
a1s64 sistem pakar guna metode
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen
a1s65 pakar guna metode certainty
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen
a1s66 guna metode certainty factor
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen
a1s67 metode certainty factor mampu
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen
a1s69 factor mampu tunjuk ukur
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen
a1s70 mampu tunjuk ukur fakta
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen
a1s71 tunjuk ukur fakta atur
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil: new fragmen
Hasil n-grams yang verbatim dan rewritten : a1s31 bentuk diagnosis sakit diagnosis
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil:
rewritten [diagnosis,sakit,diagnosis] dengan d1s39 , d1s40 dan d1s41 a1s32 diagnosis sakit diagnosis sakit
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil:
verbatim [diagnosis,sakit,diagnosis,sakit] dengan d1s39 , d1s40 dan d1s41 a1s33 sakit diagnosis sakit Hepatitis
rewritten [sakit,diagnosis,sakit] dengan d1s39
rewritten [sakit, sakit, Hepatitis] dengan d1s42, d1s52, d1s53, dan d1s54 verbatim [sakit,diagnosis,sakit,hepatitis] dengan d1s40 dan d1s41 a1s34 diagnosis sakit Hepatitis laku
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil:
rewritten [sakit,diagnosis,hepatitis] dengan d1s40 dan d1s41 a1s43 sakit layan sehat cepat
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil:
rewritten [layan, sehat, cepat] dengan d1s59 a1s44 layan sehat cepat laku
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil:
rewritten [layan, sehat, cepat] dengan d1s59
rewritten [sehat, cepat, laku] dengan d1s60 dan d1s61 a1s45 sehat cepat laku bangun
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil:
rewritten [sehat, cepat, laku] dengan d1s60 dan d1s61 a1s46 cepat laku bangun guna
rewritten [cepat, laku, guna] dengan d1s62 a1s47 laku bangun guna teknologi
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil:
rewritten [laku, guna, teknologi] dengan d1s63 a1s48 bangun guna teknologi J2ME
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil:
rewritten [guna, teknologi, J2ME ] dengan d1s64 dan d1s65 a1s49 guna teknologi J2ME implementasi
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil:
rewritten [guna, teknologi, J2ME ] dengan d1s64 dan d1s65 a1s54 perangkat mobile berat memori
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil:
rewritten [perangkat, mobile, berat] dengan d1s76 dan d1s77 a1s57 memori aplikasi buat Aplikasi
dibandingkan dengan n-Grams kata dalam dokumen asli d1 didapat hasil:
rewritten [memori, aplikasi, Aplikasi] dengan d1s71 dan d1s72 Hasil perhitungan dokumen dicurigai dan dokumen asli d1:
Hasil containment
C
(
s
i|
d
1)
:| siVU siR| = 0.183 bukan plagiat
Dokumen dianggap bukan plagiat karena persentase dari kata verbatim atau rewritten, tidak memenuhi ketidaksetaraan
| siVU siR| > 0.4 |si|
E.Perhitungan dokumen yang dicurigai dan dokumen asli d2 a1s1 guna alat handphone sekarang
dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil: new fragmen
a1s 2 alat handphone sekarang ragam
dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil: new fragmen
a1s 3 handphone sekarang ragam media
dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil: new fragmen
a1s 4 sekarang ragam media komunikasi
dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil: new fragmen
a1s 5 ragam media komunikasi bentuk
dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil: new fragmen
dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil: new fragmen
a1s7 komunikasi bentuk panggil suara
dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil: new fragmen
a1s8 bentuk panggil suara pesan
dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil: new fragmen
a1s9 panggil suara pesan singkat
dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil: new fragmen
a1s10 suara pesan singkat kembang
dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil: new fragmen
a1s11 pesan singkat kembang media
dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil: new fragmen
a1s12 singkat kembang media mampu
dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil: new fragmen
a1s13 kembang media mampu isi
a1s14 media mampu isi bagai
dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil: new fragmen
a1s15 mampu isi bagai program
dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil: new fragmen
a1s16 isi bagai program aplikasi
dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil: new fragmen
a1s17 bagai program aplikasi tambah
dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil: new fragmen
a1s18 program aplikasi tambah mudah
dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil: new fragmen
a1s19 aplikasi tambah mudah user
dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil: new fragmen
a1s20 tambah mudah user Salah
dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil: new fragmen
dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil: new fragmen
a1s22 user Salah satu bentuk
dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil: new fragmen
a1s23 Salah satu bentuk manfaat
dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil: new fragmen
a1s24 satu bentuk manfaat teknologi
dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:
rewritten [bentuk, manfaat, teknologi] dengan d2s1 a1s25 bentuk manfaat teknologi handphone
dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:
verbatim [bentuk, manfaat, teknologi, handphone] dengan d2s1 rewritten [manfaat, teknologi, handphone] dengan d2s2
a1s26 manfaat teknologi handphone layan
dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:
verbatim [manfaat, teknologi, handphone, layan] dengan d2s2 rewritten [teknologi, handphone, layan] dengan d2s3
dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:
verbatim [teknologi, handphone, layan, sehat ] dengan d2s3 rewritten [teknologi, handphone, layan] dengan d2s2 rewritten [handphone, layan, sehat] dengan d2s4 a1s28 handphone layan sehat bentuk
dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:
verbatim [handphone, layan sehat, bentuk] dengan d2s4 rewritten [handphone, layan, sehat] dengan d2s3 rewritten [layan, sehat, bentuk] dengan d2s5 a1s29 layan sehat bentuk diagnosis
dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:
verbatim [layan, sehat, bentuk, diagnosis] dengan d2s5 rewritten [layan, sehat, bentuk] dengan d2s4
rewritten [sehat, bentuk, diagnosis] dengan d2s6 a1s30 sehat bentuk diagnosis sakit
dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:
a1s31 bentuk diagnosis sakit diagnosis
dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:
verbatim [bentuk, diagnosis, sakit, diagnosis] dengan d2s7 rewritten [bentuk, diagnosis, sakit] dengan d2s6
rewritten [diagnosis, sakit, diagnosis] dengan d2s8, d2s9 dan d2s10 a1s32 diagnosis sakit diagnosis sakit
dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:
verbatim [diagnosis, sakit, diagnosis, sakit] dengan d2s6, d2s7, d2s8, d2s9 dan d2s10
a1s33 sakit diagnosis sakit Hepatitis
dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:
verbatim [sakit, diagnosis, sakit, Hepatitis] dengan d2s9
rewritten [sakit, diagnosis, sakit] dengan d2s6, d2s7, d2s8 dan d2s10 rewritten [diagnosis, sakit ,Hepatitis] dengan d2s10
a1s34 diagnosis sakit Hepatitis laku
dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:
a1s35 sakit Hepatitis laku bantu
dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:
verbatim [sakit, Hepatitis, laku, bantu] dengan d2s11 rewritten [sakit, Hepatitis, laku] dengan d2s10 rewritten [Hepatitis, laku, bantu] dengan d2s12 a1s36 Hepatitis laku bantu user
dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:
verbatim [Hepatitis, laku, bantu, user] dengan d2s12 rewritten [Hepatitis, laku, bantu] dengan d2s11 rewritten [laku, bantu, user] dengan d2s13 a1s37 laku bantu user tangan
dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:
verbatim [laku, bantu, user, tangan] dengan d2s13 rewritten [laku, bantu, user] dengan d2s12
rewritten [bantu, user, tangan] dengan d2s14 a1s38 bantu user tangan deteksi
dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:
rewritten [user, tangan, deteksi] dengan d2s15 a1s39 user tangan deteksi dini
dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:
verbatim [user, tangan, deteksi, dini] dengan d2s15 rewritten [user, tangan, deteksi] dengan d2s14 rewritten [tangan, deteksi, dini] dengan d2s16 a1s40 tangan deteksi dini sakit
dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:
verbatim [tangan, deteksi, dini, sakit] dengan d2s16 rewritten [tangan, deteksi, dini] dengan d2s15 rewritten [deteksi, dini, sakit] dengan d2s17 a1s41 deteksi dini sakit layan
dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:
verbatim [deteks,i dini, sakit, layan] dengan d2s17 rewritten [deteksi, dini, sakit] dengan d2s16 rewritten [dini, sakit, layan] dengan d2s18 a1s42 dini sakit layan sehat
dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:
rewritten [dini, sakit, layan] dengan d2s17 rewritten [sakit, layan, sehat] dengan d2s19 a1s43 sakit layan sehat cepat
dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:
verbatim [sakit, layan, sehat, cepat] dengan d2s19 rewritten [sakit, layan, sehat] dengan d2s18 rewritten [layan, sehat, cepat] dengan d2s20 a1s44 layan sehat cepat laku
dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:
verbatim [layan, sehat, cepat, laku] dengan d2s20 rewritten [layan, sehat, cepat] dengan d2s19 rewritten [sehat, cepat, laku] dengan d2s21 a1s45 sehat cepat laku bangun
dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:
rewritten [sehat, cepat, laku] dengan d2s21 a1s46 cepat laku bangun guna
dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil: new fragmen
dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:
rewritten [bangun, guna, teknologi] dengan d2s25 dan d2s26 a1s48 bangun guna teknologi J2ME
dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:
verbatim [bangun, guna, teknologi, J2ME] dengan d2s26 rewritten [bangun, guna, teknologi] dengan d2s25 rewritten [guna, teknologi, J2ME] dengan d2s27 a1s49 guna teknologi J2ME implementasi
dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:
verbatim [guna, teknologi, J2ME, implementasi] dengan d2s27 rewritten [guna, teknologi, J2ME] dengan d2s26
rewritten [teknologi, J2ME, implementasi] dengan d2s28 a1s50 teknologi J2ME implementasi rupa
dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:
rewritten [teknologi, J2ME, implementasi] dengan d2s27 dan d2s28 a1s51 J2ME implementasi rupa perangkat
dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:
a1s52 implementasi rupa perangkat mobile
dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil: new fragmen
a1s53 rupa perangkat mobile berat
dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil: new fragmen
a1s54 perangkat mobile berat memori
dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:
rewritten [perangkat, berat, memori] dengan d2s31 a1s55 mobile berat memori aplikasi
dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:
rewritten [berat, memori, aplikasi] dengan d2s32 dan d2s33 a1s56 berat memori aplikasi buat
dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:
rewritten [berat, memori, aplikasi] dengan d2s32 dan d2s33 a1s57 memori aplikasi buat Aplikasi
dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:
dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:
rewritten [aplikasi, Aplikasi, kembang] dengan d2s34 dan d2s35 a1s59 buat Aplikasi kembang artificial
dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:
rewritten [Aplikasi, kembang, artificial] dengan d2s35 a1s60 Aplikasi kembang artificial intelligence
dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:
rewritten [Aplikasi, kembang, artificial] dengan d2s35
rewritten [kembang, artificial, intelligence] dengan d2s36 dan d2s37 a1s61 kembang artificial intelligence sistem
dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:
rewritten [kembang, artificial, intelligence] dengan d2s36 dan d2s37 a1s62 artificial intelligence sistem pakar
dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:
dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:
verbatim [intelligence, system, pakar, guna] dengan d2s39 rewritten [intelligence, system, pakar] dengan d2s38 rewritten [system, pakar, guna] dengan d2s40 a1s64 sistem pakar guna metode
dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:
verbatim [system, pakar, guna, metode] dengan d2s40 rewritten [system, pakar, guna] dengan d2s39
rewritten [pakar, guna, metode] dengan d2s41 a1s65 pakar guna metode certainty
dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil:
verbatim [pakar, guna, metode, certainty] dengan d2s41 rewritten [pakar, guna, metode] dengan d2s40
rewritten [guna, metode, certainty] dengan d2s42 a1s66 guna metode certainty factor
dibandingkan dengan n-Grams kata dalam dokumen asli d2 didapat hasil: