2 perdaagangan hassil pertanian perdagangan 1 insertion hasil 1 insertion 3 perdaagangan hasil perrtanian perdagangan 1 insertion pertanian 1 insertion 5 1 penerapan tekhnologi
pertanian teknologi 1 insertion 2 penerapan tecnologi
pertanian teknologi 1 substitution
3 penerrapan tehnologi pertanian
penerapan 1 insertion
teknologi 1 substitution
6
1 pupuk organik organnik 1 pembelajaran 2 pupuk organiik organik, organnik 1 insertion
3 pupuk ortganik organik 1 insertion
7
1 penyakti hewan ternak penyakit 1 insertion
2 penyakit hewan ternakj ternak 1 insertion
3 Pemyakit hewan tyernak penyakit 1 substitution
ternak 1 insertion
8
1 penerapan biotekhnologi di
Indonesia bioteknologi 1 insertion 2 penerapan biotehnologi di
Indonesia bioteknologi 1 substitution 3 penerpan bioteknologi di
indonesia
penerapan,
16 Lampiran 3 lanjutan
No Ulangan Query Usulan Koreksi Jarak
edit
Klasifikasi Kesalahan
8 3 penerpan bioteknologi di
indonesia Indonesia 1 substitution
9
1 laboaratorium pertanian laboratorium 1 insertion
2 labroatoruim pertanian laboratorium 2 transposition
3 laboratorium pertanihan pertanian,
pertanahan 1 insertion
10
1 riser pertanian riset 1 substitution
2 risert pertanian riset 1 insertion
3 riset petranian pertanian 1 transposition
11
1 hagra komoditas pertanian jagra, harga, hara 1 transposition
2 hahrga komodias pertanian komoditas 1 deletion
3 harga komodiatas pertanian komoditas 1 insertion
12
1 tanaman pagnan pangan, pagan 1 transposition
2 tnaman pangan tanaman, taman 1 deletion
3 tanaman pangna pangsa, pangan 1 transposition
13
1 kelompk masyarakt tani kelompok 1 deletion
masyarakat 1 deletion
2 kelompok masiarakat tani masyarakat,
masarakat 1 substitution 3 kellompok masyarakat tani kelompok 1 insertion
14
1 musim panmen pasmen, panen 1 deletion
2 nmusim panen musim 1 insertion
3 musim psanen panen 1 insertion
15
1 tannaman obat tanaman 1 insertion
2 tanaman obatr obat, obar 1 insertion
3 taanman obat tanaman 1 transposition
16
1 gabah kering gilign giling, gilian 1 transposition
2 gabh kering giing gah, gabah 1 insertion
giling 1 deletion
3 gabah kerign giling kering 1 insertion
17
1 impor breas indonesia beras 1 transposition
Indonesia 1 substitution
2 inmpor beras Indonesia impor 1 insertion
3 import beras Indonesia impor 1 insertion
17 Lampiran 3 lanjutan
No Ulangan Query Usulan Koreksi Jarak
edit
Klasifikasi Kesalahan
18
1 sisitem pertanain organik pertanian 1 transposition
2 sistem pertranian organic pertanian 1 insertion
organik 1 substitution
3 sisten pertanian organik sistem, asisten 1 substitution
19
1 swasemnbada pangan swasembada 1 insertion
2 suasembada pangan swasembada 1 substitution
3 swasembada pangnan pangonan, pangan,
panenan 1 insertion
20
1 penyuluahan pertanian penyuluhan 1 insertion
2 penyuluhan oertanian pertanian 1 substitution
3 pemyuluhan pertanian penyuluhan 1 substitution
21
1 tadajh hujan tadah 1 insertion
2 tdaah hujan tadah 1 transposition
3 tadah jhujan hujan 1 insertion
22 1 benacana kekeringan bencana 1 insertion kepeningan, kemiringan, keserongan, kekuningan, kekurangan, kekejangan, kebeningan, keserangan, keterangan, keheningan, keberingas 2 pembelajaran
2 bancana kekeringan kancana, bencana,
bancang 1 substitution 3 bencana kekeriangan kekeringan 1 insertion
23
1 peterank unggas peternak, peterana 1 transposition
2 peternak ugngas unggas 1 transposition
3 perternak unggas peternak 1 insertion
24
1 lfu burung lu, flu 1 transposition
2 flu burumg burung 1 substitution
3 flu bvrung burung 1 substitution
25
1 inatitut pertanian bogro institut 1 substitution
bogor 1 transposition
2 institut pertaniuan bogor pertanian 1 insertion
18 Lampiran 3 lanjutan
No Ulangan Query Usulan Koreksi Jarak
edit Klasifikasi Kesalahan 26 1 pemabanngunan untuk sektor perrtanian pembangungan 2 insertion pertanian 1 insertion
2 pemebangunan untuk sektor
pertanian pembangunan 1 insertion 3 Pembangunan untuk sector
pertanian setor, sektor 1 substitution
27
1 upaya peningkatan
pendapatan petnai petani, petsai, petai 1 transposition 2 upaya peningaktan
pendapatan petani peningkatan 1 transposition
3 upaya penignkatan pendaptan petani
peningkatan 1 transposition
pendapatan 1 deletion
28
1 prodak usaha petrnakan rakyat
produk, podak 1 substitution
peternakan 1 deletion
2 prtoduk usahas peternakan rakyat
produk, 1 insertion
usaha 1 insertion
3 produk usaha perternakan ralkyat
peternakan 1 insertion
rakyat 1 insertion
29
1 kelangakaan pupuk kelangkaan 1 insertion
2 kelangkaan pupupk pupuk 1 insertion
3 kelangakan pupuk kelangkaan,
kelangkan 1 transposition
30
1 dukungan pemerinrah pada
pertanian pemerintah 1 substitution
2 dukungna pemerintahj pada pertanian
dukungan 1 transposition
pemerintah 1 insertion
3 dukungn pemerintah pada pretanian
dukungan, dukung 1 deletion
pertanian 1 transposition
19 Lampiran 4. Perbandingan maksimum nilai precision tahap sebelum dikoreksi dan tahap setelah pengoreksian dengan kata yang bukan diharapkan
recall Sebelum dikoreksi
Dikoreksi dengan bukan kata yang diharapkan Perubahan (%) 0 1 1 0 0,1 1 1 0 0,2 1 1 0 0,3 1 0,89 -11 0,4 0,83 0,71 -14,46 0,5 0,86 0,75 -12,79 0,6 0,88 0,76 -13,64 0,7 0,89 0,76 -14,61 0,8 0,89 0,77 -13,48 0,9 0,86 0,74 -13,95 1 0,84 0,64 -23,81 Rataan 0,91 0,82 -10,7
Lampiran 5. Perbandingan maksimum nilai precision tahap sebelum dikoreksi dan setelah pengoreksian dengan kata yang diharapkan
recall Sebelum dikoreksi
Dikoreksi dengan kata yang diharapkan Perubahan (%) 0 1 1 0 0,1 1 1 0 0,2 1 1 0 0,3 1 1 0 0,4 0,83 0,91 9,64 0,5 0,86 0,92 6,98 0,6 0,88 0,88 0 0,7 0,89 0,84 -5,62 0,8 0,89 0,81 -8,99 0,9 0,86 0,77 -10,47 1 0,84 0,70 -16,67 Rataan 0,91 0,89 -2,3
20 Lampiran 6. Perbandingan minimum nilai precision tahap sebelum dikoreksi dan tahap setelah pengoreksian dengan kata yang bukan diharapkan
recall Sebelum dikoreksi
Dikoreksi dengan bukan kata yang diharapkan Perubahan (%) 0 0,02 0,03 50 0,1 0,02 0,04 100 0,2 0,01 0,04 300 0,3 0,02 0,04 100 0,4 0,02 0,03 50 0,5 0,02 0,03 50 0,6 0,02 0,03 50 0,7 0,02 0,03 50 0,8 0,02 0,03 50 0,9 0,02 0,04 100 1 0,02 0,02 0 Rataan 0,02 0,03 81,82
Lampiran 7. Perbandingan minimum nilai precision tahap sebelum dikoreksi dan setelah pengoreksian dengan kata yang diharapkan
recall Sebelum dikoreksi
Dikoreksi dengan kata yang diharapkan Perubahan (%) 0 0,02 0,19 850 0,1 0,02 0,09 350 0,2 0,01 0,11 1000 0,3 0,02 0,10 400 0,4 0,02 0,10 400 0,5 0,02 0,08 300 0,6 0,02 0,07 250 0,7 0,02 0,06 200 0,8 0,02 0,06 200 0,9 0,02 0,04 100 1 0,02 0,03 50 Rataan 0,02 0,09 372,73
21 Lampiran 8. Perbandingan rata-rata nilai precision tahap sebelum dikoreksi dan tahap setelah pengoreksian dengan kata yang bukan diharapkan
recall Sebelum dikoreksi
Dikoreksi dengan bukan kata yang diharapkan Perubahan (%) 0 0,48 0,60 25 0,1 0,38 0,48 26 0,2 0,35 0,41 17 0,3 0,32 0,38 19 0,4 0,28 0,34 21 0,5 0,27 0,29 7 0,6 0,26 0,27 4 0,7 0,25 0,23 -8 0,8 0,22 0,19 -14 0,9 0,20 0,17 -15 1 0,14 0,13 -7 Rataan 0,28 0,32 6,82
Lampiran 9. Perbandingan rata-rata nilai precision tahap sebelum dikoreksi dan setelah pengoreksian dengan kata yang diharapkan
recall Sebelum dikoreksi
Dikoreksi dengan kata yang diharapkan Perubahan (%) 0 0,48 0,78 63 0,1 0,38 0,68 79 0,2 0,35 0,54 54 0,3 0,32 0,50 56 0,4 0,28 0,43 54 0,5 0,27 0,41 52 0,6 0,26 0,37 42 0,7 0,25 0,33 32 0,8 0,22 0,28 27 0,9 0,20 0,24 20 1 0,14 0,16 14 Rataan 0,28 0,43 44,82
22 Lampiran 10 Daftar hasil usulan kata dengan metode Levenshtein(Arumsari, 1998)
No Ulangan Query Usulan Koreksi Jarak
edit
1
1 gaga;l panep/puso gagal 1
panen, panel 1
2 gagal pnen/puso pen, panen 1
3 ggaal panen/puso
gubal, gagal, gemal, igal, gial, gayal, gawal, gail, gual, gaul, gatal, gasal, faal, gazal, Baal, gamal, laal, giral, agal, ganal,
2
2
1 petani tebtu tentu, tebu 1 2 ptani tebu petani, tani 1 3 eptani tebu etana, aptasi, botani, tani, petani,
bertani, litani, heptana, 2
3
1 industri ugla
aga, vla, gila, ugut, ular, ulas, ua, tala, ulat, sela, unda, iga, rela, iglo, ulam, aula, ulak, mola, ungka, ulan, jela, bola, ela, hela, cela, ulna, jala, kala, sila, mala, ulu, uda, uma, lala, duga, dula, nala, oga, pala, ugem, uger, pola, usia, uba, uli, gela, kuala, pula, ulah, gala, vila, la, tela, uvula, nila, imla, urna, cula, dila, sala, mula, gua, bila, jila, Tula, uzlah, lila, sula, urea, lela, kila, gula, bala, bela, sugra, tuala, hala, ala, kola, uja, unta, upa, juga
2
2 indstri gula industri 1 3 indusri gula industri 1
4 1 perdagagnang haisl pertanian - - hail 1 2 perdaagangan hassil pertanian perdagangan 1 hasil 1 3 perdaagangan hasil perrtanian perdagangan 1 pertanian 1 5 1 penerapan tekhnologi pertanian teknologi 1 2 penerapan tecnologi pertanian teknologi 1 3 penerrapan tehnologi pertanian penerapan 1 teknologi 1 6
1 pupuk organik organnik 1 2 pupuk organiik organik, organnik 1 3 pupuk ortganik organik 1 7 1 penyakti hewan ternak penyakit 1
23 Lampiran 10 lanjutan
No Ulangan Query Usulan Koreksi Jarak
edit
7
2 penyakit hewan ternakj ternak 1
3 pemyakit hewan tyernak penyakit 1
ternak 1 8 1 penerapan biotekhnologi di indonesia bioteknologi 1 2 penerapan biotehnologi di indonesia bioteknologi 1 3 penerpan bioteknologi di indonesia penerapan, peneraan 1 Indonesia 1 9
1 laboaratorium pertanian laboratorium 1 2 labroatoruim pertanian - - 3 laboratorium pertanihan pertanian, pertanahan 1
10
1 riser pertanian riset 1 2 risert pertanian riset 1
3 riset petranian pertanian, petagian, petarangan,
peranan, perapian, peragian, 2
11
1 hagra komoditas pertanian jagra, hara 1 2 hahrga komodias pertanian harga, komoditas 1 3 harga komodiatas pertanian komoditas 1
12
1 tanaman pagnan pagan 1 2 tnaman pangan tanaman, taman 1 3 tanaman pangna pangsa 1
13
1 kelompk masyarakt tani kelompok 1
masyarakat 1
2 kelompok masiarakat tani masyarakat, masarakat 1 3 kellompok masyarakat tani kelompok 1
14
1 musim panmen pasmen, panen 1
2 nmusim panen musim 1
3 musim psanen panen 1
15
1 tannaman obat tanaman 1 2 tanaman obatr obat, obar 1
3 taanman obat
tuangan, tawanan, tandan, tanaman, tatanan, tayangan, tahanan, tangan, taman,
2
16 1 gabah kering gilign gilian 1 2 gabh kering giing gah, gabah 1
24 Lampiran 10 lanjutan
No Ulangan Query Usulan Koreksi Jarak
edit
16 2 gabh kering giing giling 1 3 gabah kerign giling kering 1
17
1 impor breas indonesia
bahas, beruas, ares, reras, areal, area, aras, ruas, bidas, arcas, breksi, urea, uras, batas, ras, barkas, abras, kreasi, brem, bren, iras, tres, trias, rebas, retas, biras, bebas, real, baras, betas, babas, buras, redas, obras, bayas, bakas, boyas, remas, bas, pres, bea, bias, reak, bekas, tras, belas, regas, relas, bros, bagas, bergas, berkas, berias, bargas, beras, rias, bilas, balas, beremas, repas, buas, gres, bernas, beres,
2
Indonesia 1
2 inmpor beras Indonesia impor 1 3 import beras Indonesia impor 1
18
1 sisitem pertanain organik
sistem 1
pertanahan, pertanian, pertanaman, pertandaan, peranan, perangin, pertuanan, pertapaan, pertanyaan, pertunaian, pertalan,
2
2 sistem pertranian organic pertanian 1
organik 1
3 sisten pertanian organik sistem, asisten 1
19
1 swasemnbada pangan swasembada 1 2 suasembada pangan swasembada 1 3 swasembada pangnan pangonan, pangan, panenan 1
20
1 penyuluahan pertanian penyuluhan 1 2 penyuluhan oertanian pertanian 1 3 pemyuluhan pertanian penyuluhan 1
21
1 tadajh hujan tadah 1
2 tdaah hujan
tarah, tapah, tanah, dadah, tatah, tebah, dah, tulah, tirah, takah, diah, tamah, adalah, taat, tabah, tah, tadah, tujah, dakah, darah, idah, idarah, topah, dayah, timah, titah, tiwah, toyah, temaah, tekah, tegah, tufah, tuah, damah, telah, telaah, radaah, talah,
2
3 tadah jhujan hujan 1
25 Lampiran 10 lanjutan
No Ulangan Query Usulan Koreksi Jarak
edit
22 2 bancana kekeringan kancana,
bencana, bancang 1
3 benacana kekeringan bencana 1
23
1 peterank unggas peterana 1
2 peternak ugngas
lengas, ungam, tengas, rengas, tangas, engas, rangas, bangas, gagas, dungas, ungar, bingas, mangas, gegas, unggas
2
3 perternak unggas peternak 1
24
1 lfu burung lu 1
2 flu burumg burung 1
3 flu bvrung burung 1
25
1 inatitut pertanian bogro
institut 1
boto, bogor, bogot, bongko, bongo, bogol, bogel, bogem, bogi, bowo, gogrok, boko, negro, logo, coro, gogo, comro, biro, sogo, bogam, joglo, bora, bor, boga, boron, borok, bego, bolero, toro, boros, pogrom, bonto, bobrok
2
2 institut pertaniuan bogor pertanian 1 3 inestitut pertanian bogor institut 1
26
1 pemabanngunan untuk sektor perrtanian
pembangungan 2
pertanian 1
2 pemebangunan untuk sektor
pertanian pembangunan 1
3 Pembangunan untuk sector
pertanian setor, sektor 1
27
1 upaya peningkatan
pendapatan petnai petsai, petai 1
2 upaya peningaktan
pendapatan petani peningkatan, peringatan, penindakan
3 upaya penignkatan pendaptan petani
peningkatan 2
pendapatan 1
28
1 prodak usaha petrnakan rakyat
produk, podak 1
peternakan 1
2 prtoduk usahas peternakan rakyat
produk 1
usaha 1
3 produk usaha perternakan ralkyat
peternakan 1
26 Lampiran 10 lanjutan
No Ulangan Query Usulan Koreksi Jarak
edit
29
1 kelangakaan pupuk kelangkaan 1 2 kelangkaan pupupk pupuk 1 3 kelangakan pupuk kelangkan 1
30
1 dukungan pemerinrah pada
pertanian pemerintah 1
2 dukungna pemerintahj pada pertanian
dukungan, dukung 2
pemerintah 1
3 dukungn pemerintah pada pretanian
dukungan, dukung 1
pertanian, petagian, prewangan 2
*) cetak tebal merupakan kata yang dipilih
Lampiran 11. Contoh kamus
Kata Sub Kata Kata Sub Kata Kata Sub Kata
A M Z
ab ma za
aba maab zabad
aba-aba maaf zabah
abad bermaaf-maafan Zabaniah berabad-abad memaafi zabarjad abadi memaafkan zabib
mengabadi maaf-memaafkan Zabur mengabadikan permaafan zadah pengabadian pemaaf zahid keabadian pemaafan zahir
abadiah mabir zai
abadiat mabriuk zaim
abah mabrur zair
mengabahkan mabuh zaitun abah-abah mabuk zakar abai bermabuk-mabukan sakat
mengabaikan memabukkan zakelek terabai mabuk-mabukan zakiah terabaikan dimabuk zakum abaian pemabuk zal pengabai mabul zalim
pengabaian mabul-mabul menzalimi abaimana macakal Menzalimkan
27 Lampiran 12. Antarmuka program Temu Kembali Informasi
6
Percobaan
Tujuan percobaan ini adalah untuk mengetahui kinerja algoritme pengoreksian ejaan Damerau Levenshtein. Akan dilihat apakah algoritme tersebut dapat memberikan usulan kata yang cukup baik untuk berbagai variasi kesalahan yang terjadi.
Percobaan dilakukan dengan mengetikkan
query yang mengandung salah eja. Hal ini juga dilakukan seolah-olah tidak mengetahui ejaan
query yang benar (diasumsikan ejaan query
benar walaupun mengandung salah eja).
Evaluasi Kinerja Program
Evaluasi untuk mengukur kinerja sistem temu kembali informasi adalah dengan recall
dan precision. Dari hasil penemukembalian dokumen-dokumen, dilakukan perhitungan nilai
precision pada tingkat recall tertentu. Hasilnya kemudian dirata-ratakan untuk mendapatkan
Average Precision (AVP).
Asumsi
Asumsi-asumsi yang digunakan dalam penelitian ini antara lain:
Query yang dimasukkan ke sistem merupakan kata kunci yang telah ditentukan sebelumnya.
Jumlah dokumen relevan untuk setiap query
telah diketahui sebelumnya.
Teks pada dokumen benar sesuai dengan Kamus Besar Bahasa Indonesia.
Pengoreksian hanya dilakukan pada query.
HASIL DAN PEMBAHASAN
Dokumen korpus yang digunakan untuk pengujian sebanyak 1000 dokumen dalam bentuk file teks yang berformat XML. Contoh dokumen pengujian dapat dilihat pada Lampiran 1. Deskripsi dokumen pengujian ditunjukan oleh Tabel 1.
Tabel 1. Deskripsi dokumen pengujian
Uraian Nilai
(bytes)
Ukuran rata-rata dokumen 4.111 Ukuran dokumen keseluruhan 4.110.509 Ukuran dokumen terbesar 53.306 Ukuran dokumen terkecil 456 Percobaan dilakukan dengan query sebanyak 30 query yang telah ditentukan. Lampiran 2 merupakan contoh query yang digunakan sebagai percobaan. Masing-masing query
dilakukan 3 kali percobaan. Lampiran 3 merupakan hasil percobaan untuk masing-
masing percobaan jenis kesalahan. Banyaknya kata usulan yang dimunculkan tergantung banyaknya kata di kamus serta nilai jarak edit
yang ditentukan sebelumnya.
Pada percobaan pengoreksian ejaan terdapat kata yang dikoreksi diberikan kata usulan oleh sistem tetapi tidak sesuai dengan kata yang diharapkan, seperti kata “organik” dan
“kekeringan”. Karena keterbatasan kata dalam
kamus, sistem hanya mengusulkan mungkin
kata tersebut adalah “organnik”. Namun, kata
“kekeringan”, sistem memunculkan kata usulan “kepeningan”, “kemiringan”, “keserongan”,
“kekuningan”, “kekurangan”, “kekejangan”,
“kebeningan”, “keserangan”, “keterangan”,
“keheningan” dan “keberingas”. Padahal kata
“organik” dan “kekeringan” benar sesuai ejaan
bahasa Indonesia. Dengan demikian, kata
“organik” dan “kekeringan” dilakukan proses penyimpan pada kamus khusus.
Pembobotan Model VSM
Proses tokenizer pada korpus menghasilkan
token atau kata setiap dokumen. Sesuai Tabel 3 jumlah kata setiap dokumen sangat beragam. Penjelasan hasil proses tokenizer ditunjukan oleh Tabel 2.
Tabel 2. Hasil proses tokenizer
Uraian Nilai
Rata-rata token tiap dokumen 563 Jumlah token keseluruhan 563.019 Jumlah token terbesar 7.166 Jumlah token terkecil 44 Hasil proses penentuan kata unik pada sebuah teks dokumen pada korpus juga sangat beragam. Kata unik yang diperoleh ditunjukkan pada Tabel 3.
Tabel 3. Hasil penentuan kata unik
Uraian Nilai
Rata-rata token unik tiap
dokumen 26
Jumlah token unik keseluruhan 25875 Jumlah token unik terbesar 1.831 Jumlah token unik terkecil 37 Hasil penentuan kata unik disajikan pada Tabel 3, dimana didapatkan jumlah kata atau
token unik secara keseluruhan 25875 kata. Kata unik ini digunakan sebagai attribut vektor- vektor dokumen. Setiap dokumen menjadi sebuah vektor. Begitu juga query menjadi sebuah vektor.
Pembobotan ini dilakukan dengan membuat sebuah matriks yang menyimpan baris sebagai
7 kata unik dari korpus dan kolom sebagai nama
dokumen. Nilai cell pada matriks diisikan dengan nilai 1 dan 0. Nilai 1 menunjukkan kata ada pada dokumen. Sehingga matriks yang digunakan untuk pemodelan VSM memiliki ukuran 268.213 x 1001 cell.
Evaluasi Kinerja Temu Kembali
Untuk mengukur performansi dari temu kembali informasi, digunakan koleksi uji, koleksi uji terdiri atas tiga bagian, yaitu koleksi dokumen, query, dan relevance judgement. Koleksi dokumen adalah kumpulan dokumen yang dijadikan bahan pencarian oleh sistem.
Relevance judgement adalah daftar dokumen- dokumen yang relevan dengan semua query
yang telah disediakan.
Berdasarkan percobaan, akan dipaparkan nilai precision untuk beberapa tahap, yaitu nilai
precision sebelum dilakukan pengoreksian, nilai
precision setelah pengoreksian dengan memilih kata usulan yang bukan diharapkan, dan nilai
precision setelah pengoreksian dengan kata usulan yang diharapkan. Nilai precision untuk semua percobaan akan dilihat berdasarkan maksimum nilai precision, minimum nilai
precision dan rata-rata precision dari semua percobaan.
Berdasarkan Lampiran 4 dan Lampiran 5, nilai precision untuk tahap sebelum dilakukan pengoreksian, tahap setelah pengoreksian dengan memilih kata usulan yang bukan
diharapkan, dan tahap setelah pengoreksian dengan kata usulan yang diharapkan diperoleh dengan nilai precison maksimum dari semua percobaan. Penurunan nilai precision rata-rata setelah dilakukan tahap setelah pengoreksian dengan kata usulan yang diharapkan sedikit lebih kecil dibanding dengan tahap setelah pengoreksian dengan memilih kata usulan yang bukan diharapkan. Hal ini disebabkan secara maksimum nilai precision dari semua percobaan tahap setelah pengoreksian dengan kata usulan yang diharapkan lebih optimal. Sementara itu, grafik perbandingan precision tahap sebelum dilakukan pengoreksian, tahap setelah pengoreksian dengan memilih kata usulan yang bukan diharapkan, dan tahap setelah pengoreksian dengan kata usulan yang diharapkan dapat dilihat pada Gambar 3.
Berdasarkan Gambar 3, pada titik recall 0 sampai 0,2 menunjukkan nilai precision yang relatif sama. Untuk tahap setelah pengoreksian dengan kata usulan yang diharapkan pada titik
recall 0 sampai 0,6 kurva recall-precision
berada pada atau di atas dua kurva lainnya. Ini menunjukkan peningkatan nilai rata-rata
precision dokumen relevan. Tetapi pada titik
recall 0,7 sampai 1 mengalami penurunan nilai rata-rata precision. Walaupun demikian, tahap setelah pengoreksian dengan kata usulan yang diharapkan mengalami peningkatan dokumen relevan dalam sistem temu kembali .
Gambar 3. Kurva maksimum recall-precision tahap sebelum pengoreksian, tahap setelah pengoreksian dengan bukan kata diharapkan, dan tahap setelah pengoreksian dengan kata
yang diharapkan. 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1 Sebelum dikoreksi
Dikoreksi dengan bukan kata yang diharapkan Dikoreksi dengan kata yang diharapkan
8 Gambar 4. Kurva minimum recall-precision tahap sebelum pengoreksian, tahap setelah pengoreksian
dengan bukan kata diharapkan, dan tahap setelah pengoreksian dengan kata yang diharapkan.
Berdasarkan Lampiran 6 dan Lampiran 7, nilai precision diperoleh dengan nilai precison
minimum dari semua percobaan. Nilai rata-rata
precision tahap setelah pengoreksian dengan bukan kata diharapkan sedikit lebih tinggi dibanding tahap sebelum dilakukan pengoreksian. Hal ini disebabkan dengan melihat nilai precision secara minimum percobaan setelah pengoreksian dengan kata usulan yang diharapkan query menjadi lebih optimal. Sementara itu, grafik perbandingan
precision tahap sebelum dilakukan pengoreksian, tahap setelah pengoreksian dengan memilih kata usulan yang bukan diharapkan, dan tahap setelah pengoreksian dengan kata usulan yang diharapkan dengan melihat minimum precision dapat dilihat pada Gambar 4.
Berdasarkan Gambar 4, kurva recall- precision tahap setelah pengoreksian dengan memilih kata usulan yang bukan diharapkan, dan tahap setelah pengoreksian dengan kata usulan yang diharapkan selalu berada di atas kurva recall-precision tahap sebelum dilakukan pengoreksian. Hal ini menunjukkan peningkatan nilai rata-rata precision yang menyebabkan peningkatan dokumen relevan yang ditemukembalikan. Berdasarkan minimum
precision, perbandingan hasil temu kembali setelah tahap setelah pengoreksian dengan kata usulan yang diharapkan, menunjukkan nilai
recall dan precision memiliki nilai yang lebih baik dibanding dua tahap lainnya yang menyebabkan peningkatan dokumen-dokumen yang ditemukembalikan dan query menjadi lebih optimal.
Berdasarkan Lampiran 8 dan Lampiran 9, nilai precision untuk tahap sebelum dilakukan pengoreksian, tahap setelah pengoreksian dengan memilih kata usulan yang bukan diharapkan, dan tahap setelah pengoreksian dengan kata usulan yang diharapkan diperoleh dengan rata-rata nilai precison dari semua percobaan. Nilai rata-rata precision setelah tahap setelah pengoreksian dengan kata usulan yang diharapkan jauh lebih tinggi dibanding dengan tahap sebelum dilakukan pengoreksian maupun tahap setelah pengoreksian dengan kata usulan yang diharapkan. Hal ini disebabkan,
query setelah tahap setelah pengoreksian dengan kata usulan yang diharapkan menjadi
query yang lebih optimal. Sementara itu, grafik perbandingan precision tahap sebelum dilakukan pengoreksian, tahap setelah pengoreksian dengan memilih kata usulan yang bukan diharapkan, dan tahap setelah pengoreksian dengan kata usulan yang diharapkan dengan melihat minimum precision
dapat dilihat pada Gambar 5. 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1 Sebelum dikoreksi
Dikoreksi dengan bukan kata yang diharapkan Dikoreksi dengan kata yang diharapkan
9 Gambar 5. Kurva rata-rata recall-precision tahap sebelum pengoreksian, tahap setelah pengoreksian
dengan bukan kata diharapkan, dan tahap setelah pengoreksian dengan kata yang diharapkan.
Kurva perbandingan recall-precision pada Gambar 5 menunjukkan bahwa kurva recall- precision setelah tahap setelah pengoreksian dengan kata yang diharapkan selalu berada di atas dua kurva tahap sebelum pengoreksian dan tahap setelah pengoreksian dengan bukan kata diharapkan. Hal ini terjadi peningkatan nilai rata-rata precision yang baik setiap titik recall. Ini menunjukkan query setelah dilakukan pengoreksian dengan kata yang diharapkan jauh lebih optimal. Query yang lebih optimal menyebabkan peningkatan dokumen-dokumen relevan yang ditemukembalikan.
Pengoreksian ejaan query dengan menggunakan algoritme Damerau Levenshtein dalam percobaan, menunjukkan hasil yang sangat baik. Ini terlihat secara rata-rata perbandingan kurva sebelum query dikoreksi dan setelah dikoreksi dengan kata yang diharapkan terlihat nilai precision temu kembali meningkat untuk setiap titik recall. Ini juga menunjukkan dokumen-dokumen relevan yang ditemukembalikan berada pada halaman pertama dari sistem temu kembali.
Perbandingan Kinerja Temu Kembali dengan Levenshtein (Arumsari, 1998)
Dari hasil percobaan evaluasi temu kembali yang dilakukan dengan menggunakan algoritme Damerau Levenshtein, akan dilakukan perbandingan evaluasi kinerja temu kembali dengan menggunakan metode jarak edit yang
digunakan dalam penelitian Arumsari (1998). Tabel 11 menunjukkan nilai precision
perbandingan pengoreksian dengan menggunakan algoritme Damerau Levenshtein dan jarak edit (Arumsari, 1998) dan Gambar 5. menunjukkan kurva perbandingan menggunakan algoritme Damerau Levenshtein dengan metode jarak edit (Arumsari, 1998). Tabel 11. Perbandingan nilai precision dengan algoritme Damerau Levenshtein dengan metode Levenshtein (Arumsari,1998).
recall Levenshtein Damerau Levenshtein Perubahan (%) 0 0,65 0,78 20 0,1 0,56 0,68 21 0,2 0,45 0,54 20 0,3 0,4 0,5 25 0,4 0,36 0,43 19 0,5 0,34 0,41 21 0,6 0,31 0,37 19 0,7 0,28 0,33 18 0,8 0,22 0,28 27 0,9 0,18 0,24 33 1 0,13 0,16 23 Rataan 0,35 0,43 22,36
0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1 Sebelum dikoreksi
Dikoreksi dengan bukan kata yang diharapkan Dikoreksi dengan kata yang diharapkan
10 Gambar 6. Kurva recall-precision perbandingan algoritme Damerau Levenshtein dengan Levenshtein
Berdasarkan Gambar 6, kurva recall- precision dengan algoritme Damerau Levenshtein berada di atas kurva dengan metode Levenshtein (Arumsari, 1998) untuk setiap titik recall-nya. Ini menunjukkan pengoreksian ejaan dengan algoritme Damerau Levenshtein lebih optimal dan meningkatkan dokumen yang ditemukembalikan pada sistem. Ini terlihat ketika pengoreksian ejaan seperti
pada kata “perdagagnang”, “labroatoruim”,
“haisl” dengan menggunakan Levenhtein (Arumsari,1998), sistem tidak menemukan kata usulan atau tidak memberikan kata usulan yang diharapkan. Lebih lengkapnya kata usulan yang diberikan dengan metode Levenshtein (Arumsari,1998) dapat dilihat pada Lampiran 10. Lampiran 11 merupakan contoh referensi kamus dan Lampiran 12 merupakan antar muka sistem yang telah dibuat.
KESIMPULAN DAN SARAN Kesimpulan
Melalui penelitian ini dapat disimpulkan: