3.3 Perancangan Antar Muka
4.2.2 Data Pengujian 50
Data yang digunakan sebagai bahan pengujian masing-masing hanya menggunakan satu kalimat yang dibuat secara manual dan diketikkan pada sistem.
Kalimat 1 : Saya Membaca Buku. Kalimat 2 : Saya Membantu Ibu.
4.2.3 Skenario Pengujian
Dalam mengukur tingkat akurasi dan performa sistem, maka dilakukan pengujian. Skenario pengujian yaitu membandingkan dua kalimat. Dua kalimat yang menjadi data pengujian akan dihitung secara :
1. Perhitungan manual 2. Perhitungan dalam sistem
4.2.4 Output Hasil Pengujian
Output hasil pengujian merupakan hasil persentase dari perhitungan kemiripan menggunakan stemming Nazief dan Adriani, algoritma Rabin-Karp dan rumus Dice Coefficient Similarity.
4.2.4.1Perhitungan Manual
A. Kalimat Pertama : Saya Membaca Buku
- Stemming kalimat menggunakan Stemming Nazief dan Adriani
Ubah menjadi huruf kecil semua :
sayamembacabuku
Hapus Stopword dan buat menjadi array: Array ( [0] => saya [1] => membaca [2] => buku )
Hapus awalan, akhiran dan sisipan : Array ( [0] => saya [1] => baca [2] => buku )
Hapus spasi dan kembalikan menjadi satu kalimat: sayabacabuku
- Bentuk Hash menggunakan Algoritma Rabin-Karp
Pembentukan Gram
Bentuk 5 karakter untuk menghitung nilai hash masing-masing pattern dan buat menjadi array kembali
1 gram = 5 karakter Array ( [0] => sayab [1] => ayaba [2] => yabac [3] => abaca [4] => bacab [5] => acabu [6] => cabuk [7] => abuku )
Hitung nilai hash
n=5 Basis=10 Bilangan prima=10007
Nilai Hash : [(Kode ascii huruf 1*10�−1
)+( Kode ascii huruf 2*10�−2
) + Kode ascii huruf 3*10�−3
) + Kode ascii huruf 4*10�−4
)] + Kode ascii huruf 5*10�−5
)] mod 10007 (1) ( [sayab] = [(115*104)+(97*103)+(121*102) [(97*101)+(98*100)] mod 10007 = [(1150000+97000+12100+970+98)] mod 10007 = 1260168 mod 10007 = 9293 [ayaba] = [(97*104)+(121*103)+(97*102) [(98*101)+(97*100)] mod 10007 = [(970000+121000+9700+980+97)] mod 10007 = 1101777 mod 10007 = 1007 [yabac] = [(121*104)+(97*103)+(98*102) [(97*101)+(99*100)] mod 10007 = [(1210000+97000+9800+970+99)] mod 10007 = 1317869 mod 10007 = 6952 [abaca] = [(97*104)+(98*103)+(97*102) [(99*101)+(97*100)] mod 10007 = [(970000+98000+9700+990+97)] mod 10007 = 1078787 mod 10007 = 8038 [bacab] =[(98*104)+(97*103)+(99*102) [(97*101)+(98*100)] mod 10007 = [(980000+97000+9900+970+98)] mod 10007 = 1087968 mod 10007 = 7212 [acabu] = [(97*104)+(99*103)+(97*102) [(98*101)+(117*100)] mod 10007 = [(970000+99000+9700+980+117)] mod 10007 = 1079797 mod 10007 = 9048 [cabuk] = [(99*104)+(97*103)+(98*102) [(117*101)+(107*100)] mod 10007 = [(990000+97000+9800+1170+107)] mod 10007 = 1098077 mod 10007 = 7314
[abuku] = [(97*104)+(98*103)+(117*102) [(107*101)+(117*100)] mod 10007 = [(970000+98000+11700+1070+117)] mod 10007
= 1080887 mod 10007 = 131 )
Sehingga didapat nilai hash :
Array ( [0] => 9293 [1] => 1007 [2] => 6952 [3] => 8038 [4] => 7212 [5] => 9048 [6] => 7314 [7] => 131 ) B. Kalimat Kedua : Saya Membantu Ibu
- Stemming kalimat menggunakan Stemming Nazief dan Adriani
1. Ubah menjadi huruf kecil semua :
sayamembantuibu
2. Hapus Stopword dan buat menjadi array: Array
( [0] => saya [1] => membantu
[2] => ibu ) 3. Hapus awalan, akhiran dan sisipan :
Array ( [0] => saya [1] => bantu [2] => ibu )
4. Hapus spasi dan kembalikan menjadi satu kalimat: sayabantuibu
- Bentuk Hash menggunakan Algoritma Rabin-Karp
5. Pembentukan Gram
Bentuk 5 karakter untuk menghitung nilai hash masing-masing pattern dan buat menjadi array kembali
1 gram = 5 karakter Array ( [0] => sayab [1] => ayaba [2] => yaban [3] => abant [4] => bantu [5] => antui [6] => ntuib [7] => tuibu ) 6. Hitung nilai hash
n=5 Basis=10 Bilangan prima=10007
Nilai Hash : [(Kode ascii huruf 1*10�−1
)+( Kode ascii huruf 2*10�−2
) + Kode ascii huruf 3*10�−3
) + Kode ascii huruf 4*10�−4
)] + Kode ascii huruf 5*10�−5
)] mod 10007 (1) ( [sayab] = [(115*104)+(97*103)+(121*102) [(97*101)+(98*100)] mod 10007 = [(1150000+97000+12100+970+98)] mod 10007 = 1260168 mod 10007 = 9293 [ayaba] = [(97*104)+(121*103)+(97*102) [(98*101)+(97*100)] mod 10007 = [(970000+121000+9700+980+97)] mod 10007 = 1101777 mod 10007 = 1007 [yaban] = [(121*104)+(97*103)+(98*102) [(97*101)+(110*100)] mod 10007 = [(1210000+97000+9800+970+110)] mod 10007 = 1317880 mod 10007 = 6963 [abant] = [(97*104)+(98*103)+(97*102) [(110*101)+(116*100)] mod 10007 = [(970000+98000+9700+1100+116)] mod 10007 = 1078916 mod 10007 = 8167 [bantu] = [(98*104)+(97*103)+(110*102) [(116*101)+(117*100)] mod 10007 = [(980000+97000+11000+1160+117)] mod 10007 = 1089277 mod 10007 = 8521 [antui] = [(97*104)+(110*103)+(116*102) [(117*101)+(105*100)] mod 10007 = [(970000+110000+11600+1170+105)] mod 10007 = 1092875 mod 10007 = 2112 [ntuib] = [(110*104)+(116*103)+(117*102) [(105*101)+(98*100)] mod 10007 = [(1100000+116000+11700+1050+98)] mod 10007 = 1228848 mod 10007 = 7994 [tuibu] = [(116*104)+(117*103)+(105*102) [(98*101)+(117*100)] mod 10007
= [(1160000+117000+10500+980+117)] mod 10007 = 1288597 mod 10007 = 7701
)
Sehingga didapat nilai hash :
Array ( [0] => 9293 [1] => 1007 [2] => 6963 [3] => 8167 [4] => 8521 [5] => 2112 [6] => 7994 [7] => 7701 )
Selanjutnya dihitung menggunakan Dice Coefficient Similarity, dengan rumus:
2 | X ∩ Y |
D ( X , Y ) = ————— (3)
| X | + | Y |
Dimana:
D ( X , Y) : Nilai Kemiripan X : Nilai hash dokumen 1 Y : Nilai hash dokumen 2
Dokumen 1: || 9293 1007 6952 8038 7212 9048 7314 131 || Dokumen 2: || 9293 1007 6963 8167 8521 2112 7994 7701 ||
Nilai hash yang sama : || 9293 1007 || = 2
Jumlah nilai hash : 8 + 8 = 16
2 * 2 D ( X , Y ) = ——— = 0,25
16
Persentase = 0,25 * 100 % = 25 %
Sehingga persentase kemiripan antar kalimat Saya Membaca Buku dan Saya Membantu Ibu = 25 %.
4.2.4.2 Perhitungan Dalam Sistem
Perhitungan dalam sistem ditampilkan dalam bentuk print screen. Pada sistem, masuk ke Form Masukkan Skripsi. Ketikkan “1” pada Nim dan “Dokumen 1” pada Judul kemudian klik tombol “Masukkan”. Pada baris Dokumen 1 klik kolom link “Masukkan Cover” kemudian ketik kalimat “Saya Membaca Buku” kemudia klik tombol “proses” maka sistem akan memproses. Hasil proses dapat dilihat pada gambar 4.9.
Pada step 1, yaitu mengubah huruf menjadi huruf kecil semua , sistem dapat melakukannya dengan baik dan hasilnya sesuai dengan proses yang dilakukan manual. Kemudian tahap selanjutnya dapat dilihat pada gambar 4.10
Gambar 4.10 Proses Sistem Step 2, Step 3 dan step 4
Seperti tampak pada gambar 4.10 Sistem dapat melakukan stemming Nazief dan Adriani dengan baik, dan hasil stemmingnya sesuai dengan yang dilakukan manual. Kemudian untuk proses algoritma Rabin-Karp dapat dilihat paada gambar 4.11.
Seperti terlihat pada gambar 4.9, 4.10 dan 4.11 terlihat bahwa sistem dapat melakukan tahapan-tahapan proses sesuai dengan perhitungan manual. Dan nilai hash yang didapat dari perhitungan di sistem dan perhitungan manual adalah sama.
Selanjutnya masukkan hasil nilai hash ke database. Kembali ke form Masukkan Skripsi dan ketikkan “2” pada kotak NIM dan “Dokumen 2” pada kotak Judul, kemudian klik link “Masukkan Cover” pada baris Dokumen 2 dan ketikkan kalimat “Saya Membantu Ibu”kemudian klik tombol “proses”. Maka akan didapat hasil seperti gambar 4.12.
Gambar 4.12 Proses Sistem Dokumen 2
Seperti tampak pada gambar 4.12 perhitungan sistem juga sesuai dengan perhitungan manual yang sudah dipaparkan. Kemudian untuk melihat persentase nya maka masuk ke
Gambar 4.13 Persentase Kemiripan Dokumen 1 dan Dokumen 2
Seperti terlihat pada gambar 4.13, hasil perhitungan rumus Dice Coefficient Similarity
pada sistem juga sesuai dengan perhitungan yang dilakukan secara manual. Hasil kemiripan pada perhitungan manual dan pada perhitungan sistem yaitu 25 %. Dapat disimpulkan bahwa hasil output pada sistem, sistem dapat melakukan proses stemming
menggunakan algoritma Nazief dan adriani. Sistem juga dapat menghitung nilai hash menggunakan algoritma Rabin-Karp. Sistem juga dapat menghitung persentase kemiripan menggunakan rumus Dice Coefficient Similarity. Hal ini membuktikan bahwa akurasi dan performa sistem sangat baik.
62
BAB 5
KESIMPULAN DAN SARAN
5.1 Kesimpulan
Berdasarkan pembahasan dan evaluasi dari bab terdahulu, maka dapat ditarik kesimpulan sebagai berikut:
1. Algortima stemming Nazief dan Adriani dan algoritma Rabin-Karp dapat digunakan untuk menghitung tingkat kemiripan satu file skripsi dengan file skripsi lain. Perhitungan persentase kemiripan dihitung dengan rumus Dice Coefficient similarity.
2. Dalam menentukan kata dasar digunakan stemming Nazief dan Adriani, kemudian dibentuk gram dan dihitung nilai hash dengan algoritma Rabin-Karp. Antar nilai hash tersebut dihitung kemiripannya menggunakan Dice Coefficient similarity
sehingga didapat persentase kemiripan antar file.
3. Aplikasi ini hanya menghitung persentase kemiripan antar file skripsi, tidak sampai menentukan apakah file tersebut plagiat atau tidak.
4. Aplikasi ini dapat digunakan dalam aktivitas yang terjadi pada lingkungan akademik.
5.2 Saran
Berikut adalah beberapa saran untuk pengembangan lebih lanjut terhadap penelitian skripsi ini:
1. Sistem ini dapat dikembangkan lebih lanjut dengan menfokuskan pada mengembangkan fitur-fitur yang ada seperti fitur update dan delete dikarenakan sistem yang dibuat lebih menfokuskan pada penghitungan kemiripan satu file
63
dengan yang lain menggunakan algoritma stemming Nazief dan Adriani dan algoritma Rabin-Karp.
2. Sistem ini dapat diakses lebih mudah apabila dikembangkan dengan berbasis online. 3. Disarankan dapat mencoba algoritma stemming kata yang lain guna perbandingan.
64
DAFTAR PUSTAKA
Atmopawiro, Alsasian. 2006. Pengkajian dan Analisis Tiga Algoritma Efisien Rabin-Karp, Knuth-Morris-Pratt dan Boyer-Moore dalam Pencarian Pola dalam Suatu Teks. Skripsi. Institut Teknologi Bandung.
Agusta, Ledy. 2009. Perbandingan Algoritma Stemming Porter dengan Algoritma Nazief & Adriani untuk Stemming Dokumen Teks Bahasa Indonesia. Prosiding Konferensi Nasional Sistem dan Informatika ( KNS&I 2009 ), pp. 196-201. Alwi, Hasan, dkk. 2003. Tata Bahasa Baku Bahasa Indonesia. Balai Pustaka : Jakarta. Fernando, Hary. 2009. Perbandingan dan Pengujian Beberapa Algoritma Pencocokan
String. Skripsi. Institut Teknologi Bandung.
Firdaus, Hari B. 2003. Deteksi Plagiat Dokumen Menggunakan Algoritma Rabin-Karp. Jurnal Ilmu Komputer dan Teknologi Informasi, vol. III, no. 2.
Hermawati, F.A. 2013. Data Mining. Andi : Yogyakarta. Kamus Besar Bahasa Indonesia 1997, 775.
Mendikbud, Kep. 2009. Ejaan Yang Disempurnakan. Bumi Aksara : Jakarta. Muslich, Masnur. 2009. Tata Bentuk Bahasa Indonesia. Bumi Aksara : Jakarta.
Nugroho, E. 2011. Perancangan Sistem Deteksi Plagiarisme Dokumen Teks dengan Menggunakan Algoritma Rabin-Karp. Skripsi. Universitas Brawijaya.
Salmuasih.2013. Perancangan Sistem Deteksi Plagiat pada Dokumen Teks dengan
Konsep Similarity Menggunakan Algoritma Rabin-Karp. Skripsi. STMIK
Amikom Yogyakarta.
Salmuasih & Sunyoto, A. 2013. Implementasi Algoritma Rabin-Karp untuk Pendeteksian Plagiat Dokumen Teks Menggunakan Konsep Similarity. Prosiding Seminar Nasional Aplikasi Teknologi Informasi (SNATI 2013), pp. F-23 – F-28.
Utomo, D., Harjo, E.W., Handoko. 2008. Perbandingan Algoritma String Searching Brute Force, Knuth Morris Pratt, Boyer Moore, dan Karp Rabin pada Teks Alkitab Bahasa Indonesia. Techne Jurnal Ilmiah Elektoteknika, vol. 7, no.1: 1-13.
Wirawan, T. P. 2003. Penggunaan Algoritma Rabin-Karp dalam Pencocokan String. Jurnal Ilmu computer dan teknologi informasi, vol. III, no. 2.
Manning, C.D. and Schütze, H.1999. Foundations Of Statistical Natural Language Processing. Massachusetts Institut Of Technology. (Online)
65
CURRICULUM VITAE
Nama : WINDI ARINDA
Alamat Sekarang : Dusun IV Desa Dalu Sepuluh A, Tanjung Morawa Alamat Orang Tua : Dusun IV Desa Dalu Sepuluh A, Tanjung Morawa Telp/Hp : 083198989396
E-mail : [email protected]
Riwayat Pendidikan
SD Negeri 104236 Tanjung Morawa dari Tahun 1997 s/d Tahun 2003 SMP Negeri 3 Tanjung Morawa dari Tahun 2003 s/d Tahun 2006 SMA Negeri 1 Lubuk Pakam dari Tahun 2006 s/d Tahun 2009 Universitas Sumatera Utara dari Tahun 2009 s/d Tahun 2015
Keterampilan
• Programming PHP