• Tidak ada hasil yang ditemukan

Query Expansion on Information Retrieval System in Indonesian Language using Thesaurus

N/A
N/A
Protected

Academic year: 2017

Membagikan "Query Expansion on Information Retrieval System in Indonesian Language using Thesaurus"

Copied!
35
0
0

Teks penuh

(1)

1

EKSPANSI KUERI PADA SISTEM TEMU KEMBALI INFORMASI

BERBAHASA INDONESIA MENGGUNAKAN

THESAURUS

NUTRI RAHAYUNI

G64070071

DEPARTEMEN ILMU KOMPUTER

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

INSTITUT PERTANIAN BOGOR

(2)

1

EKSPANSI KUERI PADA SISTEM TEMU KEMBALI INFORMASI

BERBAHASA INDONESIA MENGGUNAKAN

THESAURUS

NUTRI RAHAYUNI

Skripsi

Sebagai salah satu syarat untuk memperoleh gelar

Sarjana Komputer pada Departemen Ilmu Komputer

DEPARTEMEN ILMU KOMPUTER

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

INSTITUT PERTANIAN BOGOR

(3)

1

ABSTRACT

NUTRI RAHAYUNI Query Expansion on Information Retrieval System in Indonesian Language using Thesaurus. Supervised by JULIO ADISANTOSO.

Query expansion is a common technique for fixed query in order to yield a better information retrieval result. Using a thesaurus is a way for fixed query. Thesaurus is a dictionary of words and terms which are collected and filtered by correlation of meaning of the word, like synonim, antonim, hyponim, and hypernim. This research is intended to analyze the effectivity of query expansion using thesaurus Global Analysis Method. There are a thousand agricultural documents and 93 medical plants documents. The research used Tf-Idf as a weighting method.

(4)

1 Judul : Ekspansi Kueri pada Sistem Temu Kembali Informasi Berbahasa Indonesia Menggunakan

Thesaurus Nama : Nutri Rahayuni NRP : G64070071

Menyetujui:

Pembimbing

Ir. Julio Adisantoso, M.Kom NIP. 19620714 198601 1 002

Mengetahui:

Ketua Departemen Ilmu Komputer,

Dr. Ir. Sri Nurdiati, M.Sc. NIP. 19601126 198601 2 001

(5)

1

RIWAYAT HIDUP

Penulis dilahirkan di Jakarta pada tanggal 25 Februari 1990 yang merupakan anak ketiga dari empat bersaudara dengan ayah bernama Ngatimin dan ibu bernama Limpen Badriah.Pada tahun 2007 lulus dari Sekolah Menengah Atas (SMA) Negeri 37 Jakarta dan diterima di Departemen Ilmu Komputer Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor (IPB) melalui jalur SPMB.

(6)

1

PRAKATA

Puji dan syukur penulis panjatkan ke hadirat Tuhan Yang Maha Esa karena berkat rahmat dan karunia-Nya penulis dapat menyelesaikan skripsi ini. Skripsi ini merupakan hasil penelitian yang dilakukan dari bulan Februari sampai bulan Agustus dengan bidang kajian Eskpansi Kueri pada Sistem Temu Kembali Berbahasa Indonesia Menggunakan Thesaurus.

Pembuatan skripsi ini tak lepas dari dukungan dan bantuan dari berbagai pihak. Oleh karena itu, penulis menyampaikan rasa terima kasih kepada:

 Tuhan Yang Maha Esa atas rahmat dan karunia-Nya.

 Ayah, Ibu, Adik dan Kakak yang selalu memberikan dukungan, motivasi, kasih sayang, serta doanya.

 Bapak Ir. Julio Adisantoso, M.Kom selaku dosen pembimbing tugas akhir. Terima kasih atas kesabaran, bimbingan serta dukungan dalam penyelesaian tugas akhir ini.

 Ibu Dr. Yeni Herdiyeni, S.Si, M.Kom dan Bapak Sony Hartono Wijaya, S. Kom, M.Kom selaku dosen penguji.

 Teman-teman satu bimbingan Woro Indriyani, Isna Mariam, Nova Maulizar, Aprilia Ramadhina, Agus Umriadi, Devi Dian Pramana dan Fandi Rahmawan. Terima kasih atas semangat dan kebersamaannya selama penyelesaian tugas akhir ini

 Teman-teman seperjuangan Departemen Ilmu Komputer angkatan 44.

 Eryandi Angga Pratama yang senantiasa memberikan dukungan, semangat serta doanya kepada penulis.

 Seluruh pihak yang turut membantu baik secara langsung maupun tidak langsung dalam pelaksanaan tugas akhir

Semoga hasil penelitian ini dapat bermanfaat dan dapat terus dikembangkan di masa mendatang.

Bogor, Agustus 2011

(7)

1

DAFTAR ISI

Halaman

DAFTAR GAMBAR ... v

DAFTAR TABEL ... v

DAFTAR LAMPIRAN ... v

PENDAHULUAN Latar Belakang ... 1

Tujuan Penelitian ... 1

Ruang lingkup ... 1

TINJAUAN PUSTAKA Sistem Temu Kembali Informasi. ... 1

Thesaurus ... 1

Ekspansi Kueri ... 2

Pengindeksan... 2

Pembobotan tf-idf ... 2

Ukuran Kemiripan ... 2

Evaluasi… ... 2

METODE PENELITIAN Koleksi Dokumen ... 3

Tahapan Penelitian ... 3

Evaluasi Sistem ... 4

Lingkungan Pengembangan Sistem ... 4

HASIL DAN PEMBAHASAN Dokumen Pengujian ... 5

Pemrosesan Dokumen ... 5

Ekspansi Kueri ... 6

Ukuran Kesamaan ... 6

Evaluasi Dokumen Pertanian ... 6

Evaluasi Berdasarkan Panjang Kueri ... 6

Evaluasi Berdasarkan Jumlah Penambahan Thesaurus ... 7

Kinerja Thesaurus ... 8

Kelemahan Sistem ... 8

Evaluasi Dokumen Tanaman Obat ... 9

KESIMPULAN DAN SARAN Kesimpulan ... 9

Saran... 9

DAFTAR PUSTAKA ... 9

LAMPIRAN ... 11

(8)

1

DAFTAR GAMBAR

Halaman

1 Diagram Alur Metode Penelitian ... 3

2 Contoh hasil similarity dokumen dengan kueri ... 6

3 Grafik recall precision menggunakan ekspansi thesaurus ... 6

4 Grafik recall precision ekspansi kueri berdasarkan panjang kueri... 7

5 Grafik perbandingan recall precision thsr1, thsr2 dan thsr3 ... 7

6 Grafik perbandingan recall precision metode ekspansi thesaurus, kamus, dan pseudo relevance feedback ... 8

7 Grafik recall precision tanaman obat menggunakan ekspansi ... 9

DAFTAR TABEL

Halaman 1 Ilustrasi Recall dan Precision ... 3

2 Deskripsi Dokumen Uji Pertanian (.txt) ... 5

3 Deskripsi Dokumen Uji Tanaman Obat (.txt) ... 5

4 Perbandingan nilai average precision panjang kueri ... 7

5 Perbandingan nilai average precision thsr1, thsr2, dan thsr3 ... 8

6 Perbandingan nilai average precision Kinerja thesaurus ... 8

DAFTAR LAMPIRAN

Halaman 1 Contoh dokumen koleksi pengujian ... 12

2 Daftar Kueri dan Dokumen yang Relevan ... 13

3 Daftar Kata Thesaurus ... 21

4 Nilai Average precision masing-masing kueri ... 22

(9)

1

PENDAHULUAN Latar Belakang

Temu kembali informasi bertujuan untuk memberikan informasi yang relevan bagi pengguna. Jumlah dokumen yang relevan dipengaruhi oleh kueri yang diberikan pengguna. Sebagian pengguna tidak mengetahui dokumen yang tersedia untuk melakukan pencarian sehingga sulit untuk merepresentasikan informasi ke dalam kueri yang sesuai agar mendapatkan dokumen yang relevan dengan keinginan pengguna. Salah satu cara untuk memperbaiki kueri pengguna adalah ekspansi kueri. Idenya adalah mengubah kueri sehingga lebih dekat ke dokumen yang relevan dengan cara menambah, membuang, atau mengubah bobot tiap kata pada kueri.

Penelitian ekspansi kueri yang telah dilakukan umumnya menggunakan metode analisis lokal, seperti Paiki (2006) menggunakan similarity thesaurus untuk melakukan ekspansi. Metode ini memanfaatkan kata-kata yang memiliki nilai kesamaan terbesar dengan kueri sebagai kata-kata yang akan digunakan pada ekspansi kueri. Rusidi (2008) menggunakan peluang bersyarat untuk melakukan ekspansi kueri. Peluang bersyarat merepresentasikan bobot istilah di dalam dokumen dan di dalam kueri. Anbiana (2009) menggunakan segmentasi dokumen untuk melakukan ekspansi kueri dengan teknik pseudo-relevance feedback. Kueri perluasan baru ini diambil dari segmen yang terkait dengan dokumen peringkat teratas. Kinerja ekspansi ini masih belum cukup bagus karena terambilnya dokumen dan segmen yang tidak relevan sehingga kueri perluasan yang terambil bukan merupakan kata penciri yang diinginkan.

Sitohang (2009) dan Samana (2010) mengimplementasikan metode ekspansi kueri menggunakan analisis global dengan kamus dwibahasa. Sitohang (2009) menggunakan nilai kemiripan IDF (inverse document frequency) dan Samana (2010) menggunakan nilai peluang bersyarat untuk memilih kueri ekspansi yang dihasilkan dari kamus. Namun demikian hasil dari ekspansi ini belum mampu untuk meningkatkan hasil temu kembali informasi karena istilah yang merupakan hasil terjemahan kueri cukup banyak dan beberapa diantaranya tidak sesuai dengan konteks pencarian.

Penelitian ini akan menggunakan thesaurus yang merupakan kamus kata-kata dan ungkapan yang dikumpulkan berdasarkan kata yang saling bertalian makna seperti sinonim, antonim, hiponim, hipernim dan akronim. Thesaurus dapat menunjukkan hubungan suatu istilah dengan istilah yang lainnya. Istilah di dalam thesaurus yang memunyai kedekatan dengan kueri dapat digunakan untuk membangun kueri yang baru. Hasil dari kueri baru ini diharapkan menghasilkan temu kembali yang lebih baik.

Tujuan Penelitian

Penelitian ini bertujuan

mengimplementasikan perluasan kueri menggunakan metode analisis global Thesaurus.

Ruang lingkup

Penelitian ini terbatas pada analisis global menggunakan thesaurus bahasa Indonesia.

TINJAUAN PUSTAKA Sistem Temu Kembali Informasi.

Menurut Rijsbergen (1979), Information Retrieval System (IRS) tidak memberitahu pengguna masalah yang ditanyakannya. Sistem tersebut hanya memberitahukan keberadaan dan keterangan dokumen yang berhubungan dengan permintaan pengguna.

IRS memberikan kemudahan kepada pengguna dalam merepresentasikan kebutuhan informasinya dalam bentuk kueri. Kueri berfungsi sebagai variabel untuk menemukan dokumen di dalam koleksi. IRS menerima kueri dari pengguna, kemudian melakukan perangkingan terhadap dokumen pada koleksi berdasarkan kesesuaiannya dengan kueri. Hasil perangkingan yang diberikan kepada pengguna merupakan dokumen yang menurut sistem relevan dengan kueri. Namun relevansi dokumen terhadap suatu kueri merupakan penilaian pengguna yang subjektif dan dipengaruhi banyak faktor seperti topik, waktu proses, sumber informasi maupun tujuan pengguna.

Thesaurus

(10)

2 untuk mengalihkan gagasan ke dalam sebuah

kata atau sebaliknya.

Thesaurus berbeda dengan kamus. Di dalam kamus dapat dicari informasi tentang makna kata, sedangkan di dalam tesaurus dapat dicari kata yang akan digunakan untuk mengungkapkan gagasan pengguna. Dengan demikian, thesaurus dapat membantu penggunanya dalam mengungkapkan atau mengekspresikan gagasan sesuai dengan apa yang dimaksud (Imran &Sharan 2009).

Ekspansi Kueri

Dalam relevance feedback pengguna memberikan input tambahan pada koleksi dokumen yang diberikan dengan memberi tanda pada dokumen yang dianggap relevan. Selanjutnya input ini digunakan untuk memperbaiki kueri yang telah diberikan pengguna. Dalam ekspansi kueri pengguna memberikan input tambahan pada kueri awal berupa kata ataupun frase (Manning et al. 2009).

Menurut Aly (2008) terdapat tiga jenis ekspansi kueri

1. Manual Query Expansion (MQE)

Dalam metode ini pengguna memodifikasi kueri secara manual tanpa bantuan sistem.

2. Automatic Query Expansion (AQE), Metode ini akan memodifikasi kueri tanpa bantuan pengguna. Ekspansi kueri dilakukan secara otomatis melalui sistem.

Menurut Baeza dan Yates (1999) terdapat beberapa teknik yang digunakan dalam Automatic Query Expansion, yaitu: Global Analysis yang prinsip dasarnya adalah memanfaatkan konteks suatu kata untuk menentukan kesamaannya dengan kata yang lain, Local Analysis yang menggunakan dokumen yang di-retrieve pengguna untuk mendapatkan kueri baru, dan Local Context Analysis yang merupakan gabungan antara teknik analisis lokal dan analisis global. 3. Interactive Query Expansion (IQE).

Metode ini membutuhkan interaksi antara pengguna dengan sistem untuk melakukan proses ekspansi kueri.

Pengindeksan

Indexing merupakan sebuah proses untuk melakukan pengindeksan terhadap kumpulan dokumen yang akan disediakan sebagai informasi kepada pemakai. Proses pengindeksan dapat dilakukan secara manual ataupun secara otomatis. Dewasa ini, sistem

pengindeksan secara manual mulai digantikan oleh sistem pengindeksan otomatis. Adapun tahapan dari pengindeksan yang dikemukakan oleh Maning (2009) sebagai berikut :

 Tokenisasi yaitu mengubah dokumen menjadi kumpulan term dengan cara menghapus semua karakter dalam tanda baca yang terdapat pada dokumen dan mengubah kumpulan term menjadi lowercase.

Stoplist yaitu proses pembuangan kata buang seperti: tetapi, yaitu, sedangkan, dan sebagainya.

Stemming yaitu proses penghilangan atau pemotongan dari suatu kata menjadi bentuk dasar. Kata “diadaptasikan” atau “beradaptasi” menjadi kata “adaptasi” sebagai istilah.

Term weighting yaitu proses pembobotan setiap term di dalam dokumen.

Pembobotan Tf-Idf

Menurut Maning et al (2009) metode tf-idf merupakan integrasi antar term frequency (tf) dan inverse document frequency (idf), yaitu:

,

dengan

adalah inverse document frequency untuk istilah t, N adalah jumlah dokumen di koleksi, dan adalah jumlah dokumen yang mengandung term t.

Bobot dari term t di dalam sistem temu kembali informasi ( ) dihitung menggunakan ukuran tf-idf, dengan

adalah inverse document frequency untuk istilah t dan adalah jumlah term t pada dokumen ke i, yaitu:

.

Ukuran Kemiripan

Ukuran kemiripan dokumen yang umum digunakan adalah cosine similarity. Ukuran ini menghitung nilai sudut cosinus antara dua vektor yang merepresentasikan dokumen dan kueri. Nilai cosinus antara dan kueri didefinisikan sebagai berikut:

( ⃗⃗⃗ ) ⃗⃗⃗ | ⃗⃗⃗ | | |

(11)

3

Evaluasi

Menurut Manning (2009) temu kembali informasi sistem dinyatakan sempurna ketika setiap dokumen yang berhasil dikeluarkan sistem, relevan terhadap query pengguna. Precision didefinisikan sebagai perbandingan antara dokumen teretrieve dengan query tertentu yang relevan terhadap total dokumen yang berhasil di-retrieve. Recall didefinisikan sebagai perbandingan antara dokumen yang diterima dengan query tertentu yang relevan terhadap total koleksi dokumen yang relevan terhadap query. Perhitungan recall precision diilustrasikan pada Tabel 1.

Tabel 1 Ilustrasi Recall dan Precision Data Relevan Non relevan

Retrieved tp fp

Non

retrieved fn tn

Average precision adalah suatu ukuran evaluasi kinerja temu-kembali yang diperoleh dengan menghitung rata-rata precision pada berbagai tingkat recall. Standar yang biasa digunakan adalah 11 standar tingkat recall, yaitu 0.0, 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 0.10. Average precision diformulasikan sebagai:

Gambar 1 Diagram Alur Metode Penelitian Sistem

Koleksi Dokumen

Dokumen pengujian yang digunakan berasal dari Laboratorium Temu Kembali Informasi dan Laboratorium Computational Intelligence Departemen Ilmu Komputer IPB. Koleksi dokumen terdiri atas 1000 dokumen pertanian dan 93 dokumen tanaman obat. Sebagian besar dokumen pertanian bersifat artikel media umum dan dokumen tanaman obat berisi tanaman obat beserta keterangannya.

Tahapan Penelitian

Penelitian ini merupakan teknik pengembangan ekspansi kueri menggunakan analisis global thesaurus. Tahap-tahap yang dilakukan dalam penelitian ini yaitu:

1. Pemrosesan dokumen

Pada tahap pemrosesan dokumen dilakukan proses indexing menggunakan pembobotan tf-idf. Proses indexing diawali dengan proses tokenisasi yang bertujuan untuk untuk mengidentifikasi kata di dalam teks

(12)

4 dengan cara membedakan karakter-karakter

yang bersifat separator. Pembuangan stopword dilakukan untuk membuang kata-kata yang tidak diperlukan atau tidak memiliki arti,dan terakhir adalah pembobotan yang bertujuan untuk menentukan tingkat kepentingan suatu istilah didalam dokumen

2. Ekspansi kueri

Ekspansi kueri dilakukan dengan menerjemahkan setiap kueri menggunakan thesaurus. Penerjemahan thesaurus dilakukan untuk mendapatkan gugus kata yang berkaitan dengan kueri. Setiap gugus kata yang didapat dari thesaurus dihitung kemiripannya dengan kueri. Misalkan kueri (q) memiliki gugus kata dalam thesaurus ( , , ……. ) maka kemiripan kueri dengan kata adalah:

( ) ⃗⃗ | | | ⃗⃗ |

dengan q adalah vektor kata kueri dan adalah vektor kata ke-j.

Gugus kata yang memunyai kemiripan dengan kueri akan digunakan sebagai kandidat ekspansi kueri. Jika kueri tidak ada di dalam koleksi dokumen namun memunyai arti dari thesaurus, maka penilaian yang digunakan sebagai pengukur kemiripan antara kueri dengan gugus kata thesaurus adalah inverse document frequency (IDF).

3. Ukuran kesamaan

Pengukuran kemiripan dilakukan untuk menentukan nilai kesamaan antara dokumen yang dihasilkan pada pemrosesan dokumen dan kueri. Pengukuran kemiripan dilakukan dengan menggunakan kueri awal dan juga kueri perluasan.

Evaluasi Sistem

Metode evaluasi yang digunakan dalam penelitian ini adalah recall precision. Hasil perhitungan recall precision untuk masing-masing pembobotan akan digambarkan dalam bentuk grafik. Kemudian dilakukan perhitungan interpolasi maksimum untuk mendapatkan nilai average precision yang akan digambarkan melalui tabel. Terdapat tiga hal utama yang akan dibandingkan dari evaluasi ini yaitu panjang kueri yang diberikan pengguna, kinerja ekspansi kueri thesaurus dibanding metode ekspansi kueri lain dan jumlah istilah yang diambil dari thesaurus.

1. Evaluasi berdasarkan panjang kueri Evaluasi berdasarkan panjang kueri hanya digunakan pada dokumen pertanian, karena dokumen pertanian memiliki gugus kueri yang lebih banyak dan lebih beragam dibanding dokumen tanaman obat. Untuk mengetahui pengaruh panjang kueri terhadap dokumen yang di-retrieve dilakukan evaluasi menggunakan tiga jenis asumsi ekspansi temu kembali, yaitu: evaluasi menggunakan kueri dengan panjang dua, tiga, dan empat kata. Dari ketiga asumsi ini akan dibandingkan berapa panjang kueri yang dapat meningkatkan hasil temu kembali informasi secara optimal.

2. Perbandingan metode ekspansi

Metode ekspansi kueri yang digunakan sebagai perbandingan adalah ekspansi kueri berbasis analisis global menggunakan kamus dwi bahasa dan ekspansi kueri berbasis analisis lokal menggunakan pseudo relevance feedback segmentasi dokumen, penelitian ini telah dilakukan oleh Awet (2010) dan Anbiana (2009).

3. Evaluasi berdasarkan jumlah pengambilan istilah thesaurus

Dari sistem ini akan diuji berapa banyak istilah thesaurus yang digunakan untuk menaikkan hasil temu kembali. Untuk itu dilakukan pembandingan evaluasi menggunakan tiga jenis asumsi ekspansi temu kembali, yaitu: pemrosesan temu kembali informasi menggunakan ekspansi kueri dengan mengambil satu, dua, dan tiga kemiripan gugus kata dari thesaurus.

Lingkungan Pengembangan Sistem

Spesifikasi komputer yang digunakan dalam mengimplementasikan sistem ini adalah sebagai berikut:

 Processor Intel Core 2 duo  Kapasitas RAM sebesar 2 GB  Ruang hardisk sebesar 250 GB  Resolusi Monitor 1280x800

Dalam pengimplementasiannya, aplikasi ini membutuhkan beberapa perangkat lunak lain yang sudah ada, di antaranya:

 Sistem Operasi Microsoft Windows 7 sebagai sistem operasi.

 xampp-win32-1.7.0-installer sebagai web server

 Adobe dreamweaver  Notepad++ 4.0.2

(13)

5

HASIL DAN PEMBAHASAN Dokumen Pengujian

Penelitian ini menggunakan 1000 dokumen pertanian dan 93 dokumen tanaman obat yang berasal dari Laboratorium Temu Kembali Informasi dan Laboratorium Computational Intelligence Departemen Ilmu Komputer IPB. Deskripsi dokumen uji yang digunakan dapat dilihat pada Tabel 2 dan Tabel3.

Tabel 2 Deskripsi Dokumen Uji Pertanian (.txt)

Dokumen Ukuran (bytes) Ukuran rata-rata Dokumen 4.138 Ukuran seluruh dokumen 4.138.733 Ukuran dokumen terbesar 54.082

Ukuran dokumen terkecil 451

Tabel 3 Deskripsi Dokumen Uji Tanaman Obat (.txt)

Dokumen Ukuran (bytes) Ukuran rata-rata Dokumen 3.202 Ukuran seluruh dokumen 297.796 Ukuran dokumen terbesar 13.628

Ukuran dokumen terkecil 813

Koleksi ini dibuat sesuai struktur tag XML pada masing-masing dokumen. Contoh dokumen pengujian yang digunakan dapat dilihat pada Lampiran 1.

Tag XML yang digunakan dalam koleksi dokumen pertanian, yaitu:

<doc></doc>, mewakili keseluruhan dokumen. Di dalamnya terdapat tag lain yang mendeskripsikan isi dokumen secara lebih jelas.

<docno></docno>, mewakili ID dokumen. ID yang dipakai merupakan kombinasi nama sumber berita, tanggal berita, dan urutan berita pada tanggal yang sama.  <title></title>, mewakili judul dokumen. <author></author>, mewakili penulis

dokumen.

<date></date>, mewakili tanggal penulisan.

<text></text>, mewakili isi dokumen.

Tag XML yang digunakan dalam koleksi dokumen Tanaman obat, yaitu:

<docno></docno>, mewakili ID dokumen. ID yang dipakai berupa angka pengurutan nomor dokumen.

<nama></nama>, mewakili nama tanaman obat.

<namal></namal>, mewakili nama latin tanaman obat.

<content></content>, mewakili keterangan dari tanaman obat

<fam></fam>, mewakili nama famili dari tanaman obat.

<penyakit></penyakit>, mewakili nama penyakit yang dapat disembuhkan melalui tanaman obat.

Jumlah kueri uji yang akan digunakan dalam penelitian ini adalah 30 kueri uji dokumen pertanian yang berasal dari Laboratorium Temu Kembali Informasi dan 7 kueri uji dokumen tanaman obat. Daftar kueri uji yang digunakan dalam penelitian ini dapat dilihat pada Lampiran 2.

Pemrosesan dokumen

Pemrosesan dokumen dilakukan melalui beberapa tahapan yaitu: tokenisasi, pembuangan stopword, dan pembobotan. Sebelum dilakukan tokenisasi, seluruh huruf pada koleksi dokumen diubah menjadi huruf kecil dengan menggunakan fungsi strtolower.

Tahap tokenisasi dilakukan dengan pembacaan karakter per karakter. Tujuannya untuk membedakan karakter-karakter yang bersifat separator. Separator yang dihilangkan yaitu: karakter pemisah indeks istilah (whitespace), karakter angka, titik, koma, dan karakter lainnya yang dianggap kurang representasif dalam mencirikan suatu dokumen.

Tahap pembuangan stopword dilakukan setelah hasil tokenisasi dokumen didapatkan. Hasil tokenisasi dibandingkan dengan stopword. Jika token berada di dalam stopword maka token tersebut harus dihilangkan. Pembuangan juga dilakukan untuk token yang terdiri atas dua kata karena token tersebut kurang representatif dalam mencirikan suatu dokumen.

(14)

6

“tf-idf.txt” untuk mempermudah proses

perhitungan selanjutnya.

Ekspansi Kueri

Ekspansi kueri dilakukan dengan menerjemahkan kueri menggunakan thesaurus. Penerjemahan thesaurus dilakukan untuk mendapatkan gugus kata yang berkaitan dengan kueri. Setiap gugus kata yang didapat dari thesaurus dihitung kemiripannya dengan kueri menggunakan inverted index kueri atau inverse document frequency (IDF)

.

Gugus kata yang memunyai kemiripan dengan kueri akan digunkan sebagai kandidat ekspansi kueri.

Sistem ini dibuat menggunakan fungsi hash untuk mempercepat proses temu kembali ekspansi kueri. Tahapannya yaitu:

1. Seluruh kata unik di dalam dokumen diterjemahkan menggunakan thesaurus untuk mendapatkan gugus kata dari thesaurus. Hasil terjemahan dari seluruh kata unik beserta gugus katanya disimpan ke dalam file “P-kata.txt”.

2. Pembentukan inverted index kueri dan inverse document frequency (IDF). Dari hasil pengindeksan dilakukan pembentukan inverted index. Hasil inverted index yang didapat digunakan untuk mengukur kemiripan antara masing masing kata unik sehingga membentuk inverted index kueri dan disimpan ke dalam file “sim_term.txt”.

3. Gugus kata thesaurus yang memunyai kemiripan dengan kata unik akan digunakan sebagai kandidat ekspansi kueri. Hasil kemiripannya akan disimpan ke dalam file “ths_term.txt” sehingga saat pengguna memasukkan kueri maka kueri baru hasil ekspansi langsung dapat diambil dari file ini.

Lampiran 3 menunjukkan hasil terjemahan beberapa kata menggunakan thesaurus.

Ukuran Kesamaan

Hasil pemrosesan dokumen dan ekspansi kueri digunakan untuk menghitung kemiripan kueri dengan dokumen. Kemiripan yang digunakan untuk Menghitung bobot antara dokumen dengan kueri adalah similarity cosine. Hasil dari similarity akan diurutkan berdasarkan dokumen yang memunyai kemiripan terbesar sampai terkecil. Contoh hasil dari similarity ditunjukkan pada Gambar 2.

Gambar 2 Contoh hasil similarity dokumen dengan kueri

Evaluasi Dokumen Pertanian

Proses evaluasi dokumen pertanian menggunakan 30 pasangan kueri dengan dokumen relevan. Evaluasi ini menggunakan nilai recall precision. Hasil dari evaluasi recall precision masing-masing kueri diinterpolasi maksimum untuk mencari nilai average precision dan digambarkan dalam bentuk grafik serta tabel.

Gambar 3 Grafik recall precision menggunakan ekspansi thesaurus Gambar 3 menggambarkan Hasil temu kembali menggunakan ekspansi kueri thesaurus menghasilkan nilai average precision (AVP) sebesar 0.534 dengan nilai recall sebesar 0.826.

Evaluasi Berdasarkan Panjang Kueri

Kueri yang digunakan untuk evaluasi menggunakan kueri dengan panjang dua sampai empat kata, untuk itu akan dilihat kembali berapa panjang kueri yang benar-benar dapat menaikkan temu kembali dengan memisahkan tiap kueri menjadi dua, tiga, dan empat panjang kata. Jumlah kueri yang memunyai panjang kueri dua kata sebanyak 17 kueri, untuk panjang kueri tiga kata sebanyak 9 kueri, dan untuk panjang kueri empat kata sebanyak 4 kueri. Hasil temu kembali menggunakan asumsi panjang kueri diilustrasikan pada Gambar 4 dan Tabel 4.

Array (

(15)

7 Gambar 4 Grafik recall precision ekspansi

kueri berdasarkan panjang kueri Tabel 4 perbandingan nilai average precision panjang kueri

Panjang Kueri ekspansi thesaurus

2 kata 0.620

3 kata 0.486

4 kata 0.273

Gambar 4 menunjukkan bahwa hasil ekspansi thesaurus dengan panjang kueri dua kata memunyai hasil yang lebih baik dibandingkan panjang kueri tiga dan empat kata. Tabel 4 menunjukkan perbandingan nilai average precision antara metode ekspansi kueri dengan panjang kueri yang berbeda, untuk kueri dengan panjang dua kata memunyai nilai sebesar 62.01%. Panjang kueri tiga kata memunyai nilai sebesar 48.64% dan panjang kueri empat kata memunyai nilai sebesar 27.30%.

Hasil ini terlihat bahwa panjang kueri dua kata memunyai hasil yang paling optimal untuk menaikkan temu kembali, hal ini dikarenakan kueri dengan panjang dua kata belum dapat merepresentasikan secara jelas dokumen yang akan dicari, sehingga dibutuhkan ekspansi kueri untuk memperjelas kueri agar dapat menemukan dokumen yang relevan dengan pengguna. Kueri dengan panjang tiga dan empat kata, umumnya sudah mewakili secara jelas dokumen yang akan dicari sehingga jika dilakukan ekspansi kueri maka kueri yang ada menjadi semakin tidak sesuai dengan dokumen yang akan dicari. Hal ini menyebabkan peluang dokumen yang tidak relevan ikut ter-retrieve menjadi semakin besar sehingga menyebabkan hasil temu kembali menjadi lebih kecil.

Evaluasi Berdasarkan Jumlah Penambahan Thesaurus

Perbandingan ekspansi juga dilakukan dengan cara mengambil satu, dua dan tiga gugus kata dari thesaurus yang memunyai kemiripan terbesar dengan kueri. Kueri yang digunakan adalah 30 pasangan kueri dengan panjang dua sampai empat kata. Gambar 5 mengilustrasikan perbandingan ekspansi kueri dengan mengambil satu, dua, dan tiga gugus kata thesaurus yang memunyai kemiripan terbesar dengan kueri.

Gambar 5 Grafik perbandingan recall precision thsr1, thsr2 dan thsr3

Gambar 5 menunjukkan perbandingan nilai recall precision menggunakan ekspansi thesaurus dengan mengambil satu kata teratas (thsr1), dua kata teratas (thsr2), dan tiga kata teratas (thsr3). Dari grafik dapat dilihat bahwa thsr1 memunyai nilai yang lebih besar dibandingkan thsr2 dan thsr3. Nilai Average precision thsr1, thsr2, dan thsr3 dapat dilihat pada Tabel 5.

Tabel 5 Perbandingan nilai average precision thsr1, thsr2, dan thsr3.

Dari Tabel 5 dapat diketahui bahwa semakin banyak jumlah kata yang ditambahkan ke dalam kueri hasil ekspansi, maka semakin kecil tingkat relevansi temu kembalinya. Thsr1 dapat menemukembalikan dokumen yang relevan sebesar 82,6%, thsr2 sebesar 83,2% dan thsr3 sebesar 83,3%. Dengan nilai average precision untuk thsr1 sebesar 0.534, untuk thsr2 sebesar 0.513 dan untuk thsr3 sebesar 0.506.

Metode Nilai Recall Nilai AVP

thsr1 0.826 0.534

thsr2 0.832 0.513

(16)

8 Meskipun semakin banyak kata yang

ditambahkan ke dalam ekspansi membuat hasil penemukembalian dokumen relevan menjadi lebih besar, namun penurunan nilai precision dari hasil pencarian tetap terjadi. Hal ini dikarenakan penambahan kata yang dilakukan mengakibatkan dokumen-dokumen yang tak relevan juga ikut ditemukembalikan oleh sistem. Dokumen-dokumen tak relevan ini sebagian menempati peringkat yang lebih tinggi daripada dokumen relevan yang ditemukembalikan sehingga nilai precision menjadi lebih rendah dibandingkan dengan pencarian yang menggunakan ekspansi kueri dengan satu kemiripan term teratas.

Kinerja Thesaurus

Kinerja ekspansi kueri thesaurus akan dibandingkan dengan metode ekspansi kueri kamus dwi bahasa dan pseudo relevance feedback segmentasi dokumen. Kueri yang digunakan dalam pengujian ini berjumlah 17 kueri dengan panjang kueri dua kata. Kueri ini digunakan karena kueri dengan panjang dua kata memunyai hasil yang optimal untuk meningkatkan hasil temu kembali informasi. Tabel 6 Perbandingan nilai average precision

Tabel 6 mengilustrasikan perbandingan kinerja ekspansi thesaurus dengan metode ekspansi kamus dwibahasa dan pseudo relevance feedback segmentasi dokumen (PRF segmentasi dokumen). Nilai average precision pada metode ekspansi kamus dwibahasa sebesar 0.567, pada metode pseudo relevance feedback sebesar 0.576, dan pada metode ekspansi thesaurus sebesar 0.596.

Gambar 6 mengilustrasikan perbandingan kinerja thesaurus. Hasil perbandingan menunjukkan bahwa temu kembali ekspansi kueri menggunakan thesaurus memunyai hasil yang lebih baik dibandingkan temu kembali menggunakan ekspansi kueri kamus dwibahasa dan pseudo relevance feedback segmentasi dokumen. Hal tersebut disebabkan pada ekspansi kueri kamus dwi bahasa istilah yang merupakan hasil terjemahan kueri cukup banyak dan beberapa di antaranya tidak sesuai dengan konteks pencarian. Begitu pula dengan ekspansi kueri pseudo relevance feedback segmentasi dokumen, segmen yang digunakan pada ekspansi ini lebih luas karena pemilihan segmen pada dokumen menggunakan satu paragraf untuk setiap segmennya, sedangkan pada ekspansi kueri thesaurus hasil istilah terjemahan yang merupakan kandidat ekspansi kueri lebih sedikit dan lebih sesuai dengan konteks pencarian karena thesaurus merupakan kamus kata-kata yang saling bertalian makna.

Metode Nilai AVP

Ekspansi kamus dwibahasa 0.567 PRF segmentasi dokumen 0.576

Ekspansi thesaurus 0.596

Gambar 6 Grafik perbandingan recall precision metode ekspansi thesaurus, kamus, dan pseudo relevance feedback

Thsr kamus prf seg

(17)

9

Kelemahan Sistem

Sistem ini memunyai beberapa kelemahan. Salah satunya pada algoritme penerjemahan kata pada thesaurus. Algoritme penerjemahan yang dilakukan adalah word by word atau penerjemahan kata-per-kata. Setiap kueri yang dimasukkan dalam bentuk frasa akan dikenali menjadi bentuk per-kata yang tidak berhubungan satu sama lain, misalnya kueri

“gagal panen”. Thesaurus yang diharapkan

untuk kata ini ialah “puso”. Lain halnya dengan hasil yang didapatkan dengan algoritme penerjemahan ini. Kata dari thesaurus yang dihasilkan ialah “rusak” dan “penuaian”. Jadi penerjemahan kata thesaurus dilakukan secara terpisah untuk masing-masing kata “gagal” dan “panen”.

Selain itu kelemahan yang ada di sistem ini yaitu pengambilan gugus kata pada thesaurus. Tidak semua kueri yang dimasukkan dapat diekspansi oleh thesaurus, hal itu dikarenakan tidak semua kueri memunyai arti dari thesaurus. Misalnya untuk

kata “Organik”, seharusnya kata yang

didapatkan melalui thesaurus adalah “alami”. Tetapi karena kata organik tidak memunyai arti di dalam thesaurus maka tidak ada penambahan kueri untuk ekspansi sehingga hasil temu kembali metode ekspansi sama dengan hasil temu kembali menggunakan metode tanpa ekspansi.

Evaluasi Dokumen Tanaman Obat

Proses evaluasi dokumen tanaman obat menggunakan 7 pasangan kueri dengan dokumen relevan. Evaluasi ini menggunakan nilai recall precision. Menggunakan ekspansi kueri menghasilkan penemukembalian dokumen relevan sebesar 100% dengan nilai average precision sebesar 0.767. grafik recall precision temu kembali tanaman obat menggunakan ekspansi thesaurus dapat dilihat pada Gambar 7.

Dari tujuh gugus kueri yang digunakan untuk evaluasi, hanya dua kueri yang mampu menaikkan nilai ekspansi yaitu kueri pencernaan dan saluran kemih. Dalam hal ini, thesaurus tidak sesuai digunakan untuk dokumen tanaman obat, karena thesaurus mengandung kata-kata yang bersifat umum. Penciri dokumen tanaman obat lebih banyak mengandung nama latin dan nama penyakit. Nilai average precision secara keseluruhan untuk dokumen tanaman obat dan pertanian dapat dilihat pada Lampiran 4.

Gambar 7 Grafik recall precision tanaman obat menggunakan ekspansi

KESIMPULAN DAN SARAN Kesimpulan

Penelitian ini menganalisis ekspansi kueri dengan metode analisis global menggunakan thesaurus berbahasa Indonesia. Dari hasil yang didapat dapat disimpulkan bahwa: 1. Ekspansi kueri dengan Thesaurus dapat

meningkatkan hasil temu kembali informasi dibandingkan ekspansi kueri dengan kamus dwibahasa dan pseudo relevance feedback segmentasi dokumen. 2. Panjang ekspansi kueri mempengaruhi

hasil temu kembali informasi. Semakin panjang ekspansi kueri yang diberikan maka dokumen yang di-retrieve semakin tidak relevan.

3. Jumlah penambahan gugus kata thesaurus pada ekspansi kueri mempengaruhi hasil temu kembali.

Saran

Beberapa hal yang perlu dikembangkan dalam penelitian ini:

1. Perlu diujicoba dengan menggunakan dokumen yang lebih beragam dan jumlahnya lebih banyak.

2. Perlu disusun Wordnet Bahasa Indonesia untuk keperluan ekspansi kueri berbasis analisis global yang lebih baik.

DAFTAR PUSTAKA

(18)

10 Anbiana E.D. 2009. Pseudo-Relevance

Feedback pada Sistem Temu Kembali Menggunakan Segementasi Dokumen. [Skripsi]. Bogor: Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor.

Baaeza-Yates R, Ribeiro B. 1999. Modern Information Retrieval. Addison-Wesley, New York.

Imran H, Sharan A. 2009. Thesaurus and Query Ekspansion. Departement of Computer Scienece, Jamia Hamdrad, New Delhi, India.

Manning C.D, Raghavan P, and Schutze H. 2009. Introduction to Information Retrieval. America, New York.

Paiki F.F. 2006. Evaluasi Penggunaan Similarity Thesaurus terhadap Ekspansi Kueri dalam Sistem Temu Kembali Informasi Berbahasa Indonesia. [Skripsi]. Bogor: Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor.

Rusidi. 2008. Ekspansi Kueri dalam Sistem Temu Kembali Informasi Berbahasa Indonesia Menggunakan Peluang Bersyarat. [Skripsi]. Bogor: Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor.

Samana A.M. 2010. Ekspansi Kueri Berdasarkan Kamus Dwibahasa Menggunakan Peluang Bersyarat. [Skripsi]. Bogor: Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor.

(19)

11

(20)

12 Lampiran 1 Contoh dokumen koleksi pengujian

Dokumen Pertanian <DOC>

<DOCNO>jurnal000000-016 </DOCNO>

<TITLE>Peramalan Produksi Jambu Mente Berdasarkan Luas Areal Tanam di Daerah Istimewa Yogyakarta </TITLE>

<AUTHOR>Saras Winarbawa </AUTHOR> <TEXT>

<P>Permasalahan produksi jambu mente di Daerah Istimewa Yogyakarta di masa mendatang sangat penting, antara lain sehubungan dengan perencanaan pembiayaan, pendapatan, dan pemasaran. Pada pengkajian ini memformulasi suatu metode peramalan dengan beberapa asumsi tertentu. Penerapan metode ini secara matematik telah dicobakan untuk meramalkan produksi jambu mente di Daerah Istimewa Yogyakarta. Hasil perhitungan menunjukkan bahwa produksi jambu mente di provinsi tersebut akan mengalami kenaikan 0,62 persen per tahun dalam periode 1996-2001. Produksi jambu mente tahun 2001 diperkirakan mencapai 315,62 ton. Hubungan antara produksi ramalan (Y) dengan tahun ke-t (X) mulai dari tahun 1996-2001 memunyai persamaan: Ln Y = 5,7055 + 0,0196 Ln X (r = 0,7446).</P>

</TEXT> </DOC>

Dokumen Tanaman Obat <DOCNO>007</DOCNO> <nama>Kemangi</nama>

<namal>Ocimum sanctum L.</namal>

<content>Famili : Lamiaceae. Nama Lokal : Kemangi. Deskripsi : Tanaman semak dengan tinggi 30cm-150cm. Berakar tunggang dan berwarna putih kotor. Batangnya berkayu, segiempat, beralur, bercabang, memunyai bulu hijau. Daunnya tunggal, hijau, bulat telur, ujungnya runcing, pangkal tumpul, tepi bergerigi, pertulangan menyirip. Habitus : terna. Bagian yang digunakan : daun. Manfaat : mengatasi perut kembung atau masuk angin, bau badan, bau mulut, ASI macet, menyembuhkan diare, nyeri payudara, batu ginjal, gangguan pada vagina dan juga dapat mengatasi albuminaria, yaitu adanya konsentrasi albumin di dalam urin. Kandungan senyawa kimia : Daunnya mengandung saponin, kardenolin dan polifenol. Lokasi ditemukan : Komplek Masjid Al-Hurriyyah, Depan Poliklinik IPB dan Fakultas Kehutanan.</content>

<fam>Lamiaceae</fam>

(21)

13 Lampiran 2 Daftar Kueri dan Dokumen yang Relevan

Tabel Dokumen Pertanian

No Kueri Gugus Jawaban

1 bencana kekeringan

gatra070203.txt, gatra161002.txt, gatra210704.txt, gatra301002.txt, indosiar010903.txt, indosiar170603.txt, indosiar220503.txt, indosiar260803-003.txt, indosiar310504.txt, kompas210504.txt, kompas250803.txt, mediaindonesia050604-001.txt, mediaindonesia110703.txt, mediaindonesia160603.txt, mediaindonesia240503.txt, mediaindonesia260803.txt, mediaindonesia270803.txt, mediaindonesia310503.txt, pikiranrakyat020704.txt, republika030903-001.txt, republika030903-002.txt, republika070604-001.txt, republika090804-01.txt, republika120804-01.txt, republika120804-04.txt, republika130804-02.txt, republika200603.txt, republika210704-004.txt, republika250604.txt, republika270503.txt, republika270704-002.txt, situshijau181103-001.txt, 002-01.txt, suarakarya000000-021.txt, suaramerdeka130602.txt, suaramerdeka190903.txt, suarapembaruan150903.txt, suarapembaruan180303.txt, suarapembaruan260703-002.txt.

2 dukungan pemerintah pada pertanian

indosiar070504.txt, jurnal000000-026.txt, kompas030401.txt, kompas050303.txt, kompas060503.txt, kompas071100.txt, kompas150201.txt, kompas200802.txt, kompas300402.txt, mediaindonesia130204.txt, mediaindonesia220303.txt, pembaruan110903.txt, poskota040804.txt, republika100903.txt, republika180303.txt, republika210902.txt, republika230903.txt, republika251102-001.txt, republika251102-002.txt, republika300604-001.txt, situshijau150504-002.txt, situshijau190303-002.txt, situshijau200103-002.txt, situshijau201003-001.txt, situshijau281003-002.txt, suarakarya000000-028.txt, suaramerdeka130902.txt, wartapenelitian000000-002.txt, wartapenelitian000000-007.txt.

3 flu burung gatra220604.txt, gatra270104-001.txt, gatra270104-002.txt, gatra300104.txt, indosiar020304.txt, indosiar240204.txt, mediaindonesia090204.txt, mediaindonesia140704.txt, mediaindonesia200204.txt, republika090604.txt, republika120704-005.txt, republika190504-001.txt, republika190604-005.txt, republika210504-001.txt, republika290704-002.txt, situshijau280404-004.txt, 001.txt, 008.txt, suarakarya000000-014.txt, suaramerdeka160204.txt, suaramerdeka200104.txt.

4 gabah kering giling

indosiar180603.txt, indosiar240703.txt, indosiar300304.txt, kompas 170402.txt, kompas030502-001.txt, kompas160704.txt, kompas170903.txt, mediaindonesia250304.txt, pikiranrakyat300604.txt, republika040303.txt, republika060804-003.txt, republika100704-003.txt, republika100804.txt, republika120804-01.txt, republika180504-002.txt, republika210704-001.txt, republika230704-001.txt, republika231202-001.txt, republika231202-002.txt, republika290604-003.txt, republika290604-007.txt, situshijau281003-004.txt, suarakarya000000-007.txt, suaramerdeka090104.txt.

5 gagal panen

(22)

14 Lampiran 2 Lanjutan

Tabel Dokumen Pertanian

No Kueri Gugus Jawaban

republika030903-002.txt, republika060804-001.txt, republika080703.txt, republika090804-01.txt, republika120804-04.txt, republika130704-001.txt, republika130804-02.txt, republika200603.txt, republika230704-005.txt, republika260604-003.txt, situshijau091203-002.txt, situshijau100603-003.txt, situshijau110303-002.txt, situshijau280404-002.txt, suarakarya000000-002-02.txt, suarakarya000000-011.txt, suaramerdeka120104.txt, suaramerdeka130602.txt, suarapembaruan120104.txt, suarapembaruan260703-001.txt, suarapembaruan260703-002.txt.

6 harga komoditas pertanian

indosiar071103.txt, indosiar180603.txt, indosiar221003.txt, indosiar240604.txt, indosiar300304.txt, jurnal000000-027.txt, kompas030502-001.txt, kompas030502-002.txt, kompas080702.txt, kompas100399.txt, kompas101004.txt, kompas111099.txt, kompas140802.txt, kompas160304.txt, kompas170104.txt, kompas171002.txt, kompas180502.txt, kompas180504.txt, kompas230603.txt, kompas250901.txt, kompas270203-001.txt, kompas270401.txt, kompas270502-001.txt, kompas280602.txt, kompas311203.txt, mediaindonesia060803.txt, mediaindonesia310503.txt, pikiranrakyat240404.txt, pikiranrakyat300604.txt, poskota000000-002.txt, poskota000000-003.txt, republika030804-002.txt, republika060503.txt, republika060804-001.txt, republika060804-003.txt, republika061102.txt, republika090902.txt, republika140704-004.txt, situshijau050703-002.txt, situshijau070503.txt, situshijau130203-002.txt, situshijau240203-002.txt, situshijau280203.txt, situshijau280404-001.txt, situshijau280404-002.txt, situshijau280404-003.txt, 002-02.txt, suarakarya000000-021.txt, suaramerdeka170602-001.txt, suaramerdeka290802.txt, suaramerdeka311003.txt, suarapembaruan100903.txt, suarapembaruan220403.txt, trubus000004.txt, wartapenelitian000000-002.txt.

7 impor beras indonesia

gatra180103.txt, gatra220802.txt, indosiar180603.txt, indosiar180703.txt, indosiar200304.txt, indosiar300703-002.txt, kompas 170402.txt, kompas 170402.txt, kompas050602.txt, kompas101002.txt, kompas101004.txt, kompas160704.txt, kompas180504.txt, kompas270401.txt, kompas270502-002.txt, kompas310702.txt, mediaindonesia050104.txt, mediaindonesia060803.txt, mediaindonesia100203.txt, mediaindonesia131003.txt, mediaindonesia160603.txt, mediaindonesia250304.txt, republika020604-001.txt, republika060804-001.txt, republika090902.txt, republika100703.txt, republika100704-003.txt, republika180504-002.txt, republika210704-001.txt, republika230704-001.txt, republika231202-001.txt, republika231202-002.txt, republika240604-001.txt, republika300704-002.txt, situshijau281003-004.txt, suarakarya000000-007.txt, suarakarya000000-023.txt, suaramerdeka120104.txt, suaramerdeka130104.txt, suaramerdeka170602-001.txt, suaramerdeka270601.txt, suarapembaruan100903.txt, suarapembaruan110903.txt.

8 industri gula

(23)

15 Lampiran 2 Lanjutan

Tabel Dokumen Pertanian

No Kueri Gugus Jawaban

9 institut pertanian bogor

gatra020804.txt, gatra180304.txt, gatra180702.txt, gatra220704.txt, gatra290903.txt, gatra300404.txt, kompas100399.txt, kompas111099.txt, kompas121099.txt, kompas150304-001.txt, kompas200704.txt, kompas200799.txt, kompas230704.txt, mediaindonesia080704.txt, mediaindonesia090704.txt, mediaindonesia101003.txt, mediaindonesia290903-002.txt, republika010704-001.txt, republika061003.txt, republika070604-002.txt, republika100604-002.txt, republika100704-002.txt, republika110604-002.txt, republika140704-002.txt, republika160604-002.txt, republika170604-001.txt, republika180303.txt, republika180604.txt, republika190604-001.txt, republika190604-002.txt, republika211002.txt, republika220604-001.txt, republika230704-08.txt, situshijau070503.txt, situshijau101103-004.txt, situshijau281003-003.txt, suarakarya000000-005.txt, suarakarya000000-010.txt, suarapembaruan150903.txt, suarapembaruan260703-001.txt.

10 kelangkaan pupuk

indosiar010704.txt, indosiar060204.txt, indosiar190504-001.txt, indosiar200104.txt, indosiar260504.txt, indosiar290604.txt, kompas210504.txt, kompas300502-001.txt, pikiranrakyat010504-003.txt, republika050604.txt, republika160604-001.txt, suarakarya000000-001-02.txt, 002.txt, 006.txt, suarakarya000000-026.txt, suarakarya000000-029.txt, suarakarya000000-030.txt, suarakarya000000-032.txt, suarakarya000000-038.txt, suaramerdeka161101.txt.

11 kelompok masyarakat tani

bitraindonesia000000-001.txt, indosiar021203-002.txt, jurnal000000-017.txt, kompas180502.txt, kompas211103.txt, kompas250901.txt, kompas260304.txt, kompas260902.txt, kompas270203-002.txt, kompas270502-002.txt, kompas300502-001.txt, replubika110804.txt, republika030304.txt, republika110604-004.txt, republika131203-001.txt, republika140703.txt, republika151202.txt, republika180303.txt, republika270704-001.txt, republika280703.txt, republika300704-001.txt, situshijau070503.txt, situshijau120303-003.txt, situshijau130303-001.txt, situshijau190303-002.txt, situshijau200103-002.txt, situshijau281003-004.txt, suarakarya000000-001-02.txt, suarakarya000000-037.txt, suaramerdeka260902.txt, suarapembaruan090202.txt, suarapembaruan130103.txt.

12 laboratoriu m pertanian

balaipenelitian000000-010.txt, gatra100203.txt, indobic130504-002.txt, indosiar010704.txt, jurnal000000-027.txt, kompas220801.txt, kompas241203.txt, kompas300502-002.txt, mediaindonesia290903-002.txt, republika050804-007.txt, republika120704-005.txt, republika230704-004.txt, republika300604-002.txt, situshijau040603.txt, situshijau051103-02.txt, situshijau100603-001.txt, situshijau140503-001-01.txt, situshijau150403-002.txt, situshijau180603-003.txt, suarakarya000000-003.txt, suaramerdeka031101.txt.

13 musim panen

(24)

16 Lampiran 2 Lanjutan

Tabel Dokumen Pertanian

No Kueri Gugus Jawaban

situshijau270503-002.txt, situshijau280404-002.txt, suarakarya000000-007.txt, suarakarya000000-023.txt, suarakarya000000-028.txt,

suaramerdeka120104.txt, suaramerdeka290901.txt,

suarapembaruan031002.txt. 14 pembangun

an untuk sektor pertanian

gatra180304.txt, jurnal000000-002.txt, kompas020803.txt, kompas031003.txt, kompas060203.txt, kompas060503.txt, kompas100399.txt, kompas101004.txt, kompas110201.txt, kompas111099.txt, kompas121099.txt, kompas150304-002.txt, kompas190802.txt, kompas191099.txt, kompas200799.txt, kompas210502.txt, kompas220901-002.txt, kompas230603.txt, kompas240803.txt, kompas260203.txt, kompas270204.txt, kompas280602.txt, kompas290404.txt, mediaindonesia050604-002.txt, mediaindonesia060903.txt, mediaindonesia090903.txt, mediaindonesia160903.txt, pembaruan110903.txt, poskota110703.txt, republika060903.txt, republika070104.txt, republika080703.txt, republika100804.txt, republika100903.txt, republika101203.txt, republika110604-002.txt, republika131203-001.txt, republika150604-003.txt, republika150903.txt, republika190803.txt, republika251002-003.txt, republika290704-003.txt, republika300604-001.txt, situshijau091203-002.txt, situshijau280203.txt, suarapembaruan140303.txt.

15 penerapan bioteknolo

gi di

indonesia

jurnal000000-018.txt, kompas121099.txt, puslitbang000000-001.txt, republika220604-003.txt, republika290704-002.txt, situshijau000000-002.txt, situshijau030603-001.txt, situshijau040603.txt, situshijau050703-001.txt, situshijau070103-001.txt, situshijau070103-002.txt, situshijau070103-003.txt, situshijau100603-002.txt, situshijau100603-003.txt, situshijau110303-002.txt, situshijau130103-001.txt, situshijau130503-001.txt, situshijau130503-002.txt, situshijau140103-002.txt, situshijau140103-003.txt, situshijau140503-001-01.txt, situshijau140903-001.txt, situshijau150403-001.txt, situshijau150403-002.txt, situshijau160103.txt, situshijau180603-003.txt, situshijau180803-003.txt, situshijau200103-001.txt, situshijau210103-003.txt, situshijau210503-001.txt, situshijau270303-004.txt, situshijau270503-002.txt, situshijau270703-005.txt, situshijau300403.txt, situshijau310303.txt, situshijau310303-No.txt, 001-02.txt, suarakarya000000-014.txt, suarapembaruan020603.txt, suarapembaruan020603-No.txt, suarapembaruan151102.txt, wartapenelitian000000-009.txt.

16 penerapan teknologi pertanian

(25)

17 Lampiran 2 Lanjutan

Tabel Dokumen Pertanian

No Kueri Gugus Jawaban

17 peningkata n

pendapatan petani

indosiar150104-001.txt, jurnal000000-017.txt, kompas030502-001.txt, kompas031003.txt, kompas100399.txt, kompas170903.txt, kompas200802.txt, kompas210502.txt, kompas260702.txt, kompas270203-001.txt, kompas300402.txt, kompas300502-002.txt, pembaruan110903.txt, poskota110703.txt, republika030804-002.txt, republika030903-001.txt, republika060804-001.txt, republika060804-003.txt, republika230404.txt, republika231202-001.txt, republika231202-002.txt, republika240604-005.txt, republika241203.txt, republika281202.txt, republika300704-002.txt, situshijau140503-001.txt, situshijau180803-002.txt, situshijau181103-002.txt, situshijau200103-001.txt, situshijau280203.txt, suaramerdeka120104.txt, suaramerdeka170602-001.txt, suarapembaruan060602.txt, suarapembaruan290802-001.txt, wartapenelitian000000-005.txt.

18 penyakit hewan ternak

gatra270104-002.txt, gatra270104-003.txt, gatra300104.txt, mediaindonesia090204.txt, republika150103.txt, republika160704-003.txt, republika260704-004.txt, republika300604-002.txt, suarakarya000000-004.txt, suarakarya000000-008.txt, suarakarya000000-014.txt, suarakarya000000-017.txt, suaramerdeka260302-01.txt.

19 penyuluhan pertanian

bitraindonesia000000-001.txt, gatra190902-02.txt, indosiar310504.txt, jurnal000000-005.txt, jurnal000000-014.txt, kompas050802.txt, kompas130699.txt, kompas170104.txt, kompas200503-002.txt, mediaindonesia160603.txt, poskota110703.txt, republika030903-002.txt, republika050804-001.txt, republika061003.txt, republika171003.txt, republika180303.txt, republika200203.txt, republika210504-001.txt, republika220604-003.txt, republika260604-003.txt, republika300604-003.txt, situshijau201003-002.txt, situshijau230103-001.txt, situshijau270703-001.txt, suaramerdeka271102.txt, wartapenelitian000000-002.txt, wartapenelitian000000-007.txt.

20 perdaganga n hasil pertanian

gatra011102.txt, indosiar070204.txt, indosiar201103.txt, jurnal000000-002.txt, jurnal000000-027.txt, kompas031003.txt, kompas041102.txt, kompas101002.txt, kompas140802.txt, kompas160304.txt, kompas270401.txt, kompas270502-001.txt, kompas271103.txt, kompas311203.txt, mediaindonesia030104.txt, mediaindonesia101003.txt, mediaindonesia150903.txt, mediaindonesia170303.txt, republika020604-001.txt, republika041102.txt, republika281202.txt, situshijau130303-republika020604-001.txt, situshijau191103.txt, situshijau240203-002.txt, suarakarya000000-013.txt, suaramerdeka120104.txt, suaramerdeka270601.txt, suarapembaruan080903-001.txt, suarapembaruan080903-002.txt, wartapenelitian000000-006.txt. 21 pertanian

organik

indosiar250204-002.txt, jurnal000000-017.txt, kompas010499.txt, kompas030502-002.txt, kompas050802.txt, kompas081203.txt, kompas181099.txt, kompas221001.txt, kompas241203.txt, kompas260304.txt, kompas270502-002.txt, kompas300502-001.txt, republika131203-001.txt, republika150303.txt, republika180303.txt, situshijau070503.txt, situshijau091203-001.txt, situshijau091203-004.txt, situshijau290503-003.txt, suarakarya000000-001-02.txt, suarapembaruan000000-002.txt, suarapembaruan090202.txt, suarapembaruan110702-01.txt, suarapembaruan160702.txt.

(26)

18 Lampiran 2 Lanjutan

Tabel Dokumen Pertanian

No Kueri Gugus Jawaban

suaramerdeka130902.txt, suarapembaruan100903.txt, suarapembaruan220403.txt.

23 peternak unggas

gatra270104-001.txt, gatra270104-002.txt, gatra300104.txt, indosiar020304.txt, indosiar161203.txt, indosiar240204.txt, jurnal000000-009.txt, kompas051103.txt, kompas120101.txt, mediaindonesia090204.txt, republika061003.txt, republika100604-002.txt, republika190504-001.txt, republika210504-001.txt, situshijau280404-004.txt, suarakarya000000-001.txt, suarakarya000000-008.txt, suarakarya000000-014.txt, suarakarya000000-017.txt, suarapembaruan220802.txt.

24 produk usaha peternakan rakyat

jurnal000000-003.txt, kompas120101.txt, kompas150201.txt, mediaindonesia010304.txt, mediaindonesia090204.txt, republika100604-002.txt, republika150303.txt, republika170704-007.txt, republika210504-001.txt, republika220704-003.txt, republika260604-001.txt, republika290704-002.txt, republika300604-002.txt, situshijau190303-001.txt, 001.txt, 008.txt, suarakarya000000-013.txt, suarakarya000000-014.txt, suarapembaruan151102.txt.

25 pupuk organik

balaipenelitian000000-001.txt, kompas270502-002.txt, kompas280502.txt, kompas300502-001.txt, republika050804-007.txt, republika190104.txt, republika201102.txt, republika270604.txt, situshijau091203-004.txt, situshijau140103-001.txt, 001-02.txt, suarakarya000000-037.txt, suaramerdeka031101.txt, suaramerdeka170602-002.txt, suarapembaruan090202.txt, suarapembaruan130103.txt, suarapembaruan160702.txt, suarapembaruan220802.txt, wartapenelitian000000-002.txt, wartapenelitian000000-008.txt.

26 riset pertanian

(27)

19 Lampiran 2 Lanjutan

Tabel Dokumen Pertanian

No Kueri Gugus Jawaban

27 swasembad a pangan

indosiar021203-002.txt, kompas060503.txt, kompas100901.txt, kompas110201.txt, kompas150304-002.txt, kompas170104.txt, kompas230603.txt, kompas230899.txt, kompas270203-001.txt, kompas270401.txt, kompas270502-002.txt, mediaindonesia160603.txt, republika030304.txt, republika060503.txt, republika061003.txt, republika080703.txt, republika100704-005.txt, republika220604-003.txt, republika220604-003.txt, republika230902-001.txt, republika230902-002.txt, republika231202-001.txt, republika231202-002.txt, suarakarya000000-001-02.txt, suarakarya000000-002-02.txt, suarakarya000000-016.txt, suarakarya000000-021.txt, suaramerdeka170602-001.txt, suarapembaruan110903.txt, suarapembaruan221102.txt.

28 tadah hujan gatra210704.txt, gatra301002.txt, indosiar260803-001.txt, indosiar310504.txt, jurnal000000-001.txt, kompas270502-002.txt, mediaindonesia160603.txt, mediaindonesia310503.txt, republika090804-01.txt, republika210704-004.txt, republika230704-005.txt, republika240604-005.txt, republika290604-007.txt, suarakarya000000-001-02.txt, suarakarya000000-030.txt, suaramerdeka130602.txt, suarapembaruan260703-002.txt, wartapenelitian000000-004.txt.

29 tanaman obat

balaipenelitian000000-008.txt, balaipenelitian000000-009.txt, indobic120504.txt, indosiar010704.txt, indosiar260803-002.txt, republika020604-003.txt, republika030804-002.txt, republika270604.txt, republika290604-001.txt, situshijau030203-001.txt, situshijau041203.txt, situshijau060503.txt, situshijau070103-004.txt, situshijau070103-005.txt, situshijau100603-002.txt, situshijau101103-003.txt, situshijau120303-004.txt, situshijau130103-002.txt, situshijau130503-001.txt, situshijau140103-003.txt, situshijau140903-004.txt, situshijau180203-001.txt, situshijau180203-002.txt, situshijau201003-002.txt, situshijau270303-001.txt, situshijau270303-003.txt, situshijau270503-002.txt, situshijau270703-situshijau270503-002.txt, situshijau290503-001.txt.

30 tanaman pangan

bitraindonesia000000-001.txt, indosiar021203-001.txt, indosiar030304.txt, indosiar050704-002.txt, indosiar130104.txt, indosiar130504.txt, indosiar160304.txt, indosiar180304.txt, indosiar310504.txt, kompas020603.txt, kompas120102.txt, kompas120702.txt, kompas171002.txt, kompas180701.txt, kompas240302.txt, kompas260203.txt, kompas311203.txt, mediaindonesia030104.txt, mediaindonesia160603.txt, mediaindonesia170303.txt, mediaindonesia220303.txt, republika030304.txt, republika050903.txt, republika080604-004.txt, republika150903.txt, republika200603.txt, republika220604-003.txt, republika230704-006.txt, republika241203.txt, republika260604-001.txt, republika271003.txt, situshijau070103-003.txt, situshijau140903-001.txt, situshijau181103-001.txt, situshijau290403-002.txt, suarakarya000000-001-02.txt, suarakarya000000-011.txt, suarakarya000000-013.txt, suarakarya000000-031.txt,

suaramerdeka160703.txt, suaramerdeka250302.txt,

(28)

20 Lampiran 2 Lanjutan

Tabel Dokumen Tanaman Obat

No Kueri Gugus Jawaban

1 pencernaan 001.txt, 002.txt, 004.txt, 018.txt, 022.txt, 032.txt, 036.txt, 048.txt, 049.txt, 050.txt, 051.txt, 053.txt, 054.txt, 073.txt, 074.txt, 076.txt, 078.txt, 088.txt, 089.txt.

2 nyeri radang demam

003.txt, 008.txt, 016.txt, 021.txt, 029.txt, 031.txt, 033.txt, 038.txt, 039.txt, 043.txt, 046.txt, 056.txt, 062.txt, 063.txt, 066.txt, 077.txt, 081.txt, 084.txt, 085.txt, 086.txt.

3 kulit 005.txt, 017.txt, 026.txt, 035.txt, 041.txt, 058.txt, 067.txt, 070.txt, 072.txt, 091.txt.

4 perawatan 006.txt, 007.txt, 011.txt, 012.txt, 013.txt, 019.txt, 023.txt, 028.txt, 030.txt, 034.txt, 037.txt, 044.txt, 047.txt, 055.txt, 059.txt, 061.txt, 064.txt, 068.txt, 069.txt, 071.txt, 075.txt, 079.txt, 087.txt, 093.txt.

5 saluran kemih

009.txt, 025.txt, 042.txt, 057.txt, 080.txt, 090.txt. 6 pernapasan 010.txt, 024.txt, 040.txt, 045.txt, 060.txt.

(29)

21 Lampiran 3 Daftar Kata Thesaurus

Tabel Kata Thesaurus

Kata

Thesaurus

aneh abnormal,absurd,ajaib,asing,eksentrik,eksotis,gaib,ganjil,garib,heran,jarang,la ngka,luar biasa,biasa,normal

bencana bahala,bahaya,bala,dahiat,kecelakaan,kegagalan,kemalangan,kematian,kemud aratan,kenahasan,kerugian,kesedihan,kesengsaraan,kesialan,kesusahan,ketewa san,mala,malapetaka,mara,marabahaya,musibah,petaka,tragedi,gangguan,god aan

gabah antah,butir padi

giling menggelek,mengulek,memeras,mengupas,melinting,memusar,menggulung harga kadar,kualitas,mutu,nilai,payu,taksiran,derajat,harkat,kehormatan,martabat,pa

ngkat,arti,faedah,guna,makna,manfaat,maslahat,kepentingan,keperluan hewan binatang,dabat,fauna,sato,satwa

komoditas barang,dagangan,produk

makanan incaran,konsumsi,mangsa,pangan,rezeki,santapan,sasaran musim hari,perian,tahun

panen pengetaman,penuaian

peningkatan kenaikan,promosi,eskalasi,pengembangan,penambahan,penurunan penyakit kelainan,kesulitan,komplikasi,masalah,problem,aib,kebobrokan,keburukan riset penelitian,penyelidikan

(30)

22

Lampiran 4 Nilai Average precision masing-masing kueri Tabel analisis kinerja dokumen Pertanian Tanpa Thesaurus

Kueri Recall

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

bencana kekeringan 1.00 1.00 1.00 0.93 0.90 0.00 0.00 0.00 0.00 0.00 1.00

dukungan pemerintah pada pertanian 1.00 1.00 0.30 0.30 0.30 0.29 0.29 0.00 0.00 0.00 1.00

flu burung 1.00 1.00 1.00 0.92 0.92 0.92 0.91 0.91 0.91 0.91 1.00

gabah kering giling 1.00 1.00 1.00 0.57 0.48 0.47 0.47 0.47 0.47 0.47 1.00

gagal panen 1.00 1.00 1.00 1.00 0.86 0.85 0.85 0.83 0.00 0.00 1.00

harga komoditas pertanian 1.00 0.91 0.80 0.64 0.41 0.41 0.00 0.00 0.00 0.00 1.00

impor beras indonesia 1.00 1.00 1.00 0.87 0.75 0.69 0.63 0.54 0.00 0.00 1.00

industri gula 1.00 1.00 1.00 0.92 0.92 0.92 0.76 0.70 0.00 0.00 1.00

institut pertanian bogor 1.00 1.00 0.75 0.71 0.71 0.64 0.64 0.64 0.58 0.55 1.00

kelangkaan pupuk 1.00 1.00 1.00 1.00 0.92 0.92 0.90 0.90 0.90 0.90 1.00

kelompok masyarakat tani 0.70 0.70 0.70 0.48 0.47 0.47 0.43 0.43 0.43 0.43 0.70

laboratorium pertanian 1.00 0.83 0.83 0.70 0.65 0.65 0.52 0.48 0.44 0.44 1.00

musim panen 0.67 0.67 0.61 0.57 0.42 0.33 0.32 0.32 0.32 0.00 0.67

pembangunan untuk sektor pertanian 0.64 0.64 0.57 0.56 0.47 0.47 0.45 0.42 0.39 0.39 0.64

penerapan bioteknologi 1.00 0.89 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 1.00

penerapan teknologi pertanian 1.00 1.00 1.00 0.82 0.71 0.64 0.00 0.00 0.00 0.00 1.00

peningkatan pendapatan petani 0.67 0.23 0.22 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.67

penyakit hewan ternak 1.00 0.83 0.83 0.83 0.75 0.70 0.69 0.69 0.69 0.68 1.00

penyuluhan pertanian 1.00 1.00 1.00 0.77 0.71 0.63 0.58 0.58 0.00 0.00 1.00

perdagangan hasil pertanian 1.00 0.67 0.53 0.48 0.41 0.33 0.27 0.27 0.00 0.00 1.00

pertanian organik 0.83 0.83 0.83 0.71 0.71 0.67 0.67 0.67 0.67 0.52 0.83

petani tebu 0.71 0.71 0.71 0.67 0.67 0.62 0.62 0.62 0.62 0.46 0.71

peternak unggas 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 0.00 0.00 1.00

produk usaha peternakan rakyat 1.00 1.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 1.00

pupuk organik 1.00 1.00 0.67 0.62 0.62 0.62 0.62 0.62 0.62 0.53 1.00

riset pertanian 1.00 0.75 0.75 0.60 0.00 0.00 0.00 0.00 0.00 0.00 1.00

swasembada pangan 1.00 1.00 0.80 0.80 0.80 0.80 0.80 0.00 0.00 0.00 1.00

tadah hujan 1.00 1.00 1.00 1.00 1.00 0.91 0.86 0.81 0.73 0.59 1.00

tanaman obat 1.00 1.00 1.00 0.67 0.63 0.63 0.63 0.58 0.44 0.40 1.00

tanaman pangan 0.42 0.42 0.39 0.39 0.33 0.29 0.26 0.26 0.26 0.24 0.42

(31)

23

Lampiran 4 Lanjutan

Tabel analisis kinerja dokumen Pertanian ekspansi Thesaurus

Kueri Recall

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

bencana kekeringan 1.00 1.00 0.90 0.89 0.89 0.78 0.00 0.00 0.00 0.00 0.00

dukungan pemerintah pada pertanian 0.50 0.33 0.24 0.24 0.19 0.19 0.19 0.10 0.00 0.00 0.00

flu burung 1.00 1.00 1.00 0.92 0.92 0.92 0.91 0.91 0.91 0.91 0.91

gabah kering giling 1.00 1.00 0.75 0.53 0.46 0.46 0.46 0.46 0.46 0.46 0.00

gagal panen 1.00 0.93 0.93 0.89 0.88 0.70 0.69 0.58 0.00 0.00 0.00

harga komoditas pertanian 1.00 0.50 0.38 0.38 0.34 0.34 0.00 0.00 0.00 0.00 0.00

impor beras indonesia 1.00 1.00 1.00 1.00 0.68 0.65 0.59 0.53 0.00 0.00 0.00

industri gula 1.00 1.00 1.00 1.00 0.83 0.83 0.81 0.79 0.73 0.42 0.37

institut pertanian bogor 1.00 1.00 0.90 0.73 0.72 0.64 0.64 0.64 0.58 0.55 0.00

kelangkaan pupuk 1.00 1.00 1.00 1.00 1.00 1.00 0.94 0.94 0.90 0.90 0.77

kelompok masyarakat tani 1.00 0.55 0.55 0.55 0.45 0.45 0.45 0.39 0.39 0.39 0.00

laboratorium pertanian 1.00 0.83 0.83 0.70 0.65 0.65 0.52 0.48 0.44 0.44 0.42

musim panen 0.67 0.56 0.48 0.48 0.46 0.36 0.31 0.31 0.31 0.00 0.00

pembangunan untuk sektor pertanian 0.83 0.83 0.63 0.48 0.44 0.42 0.40 0.39 0.36 0.35 0.25

penerapan bioteknologi 1.00 0.82 0.82 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00

penerapan teknologi pertanian 1.00 1.00 0.62 0.62 0.62 0.60 0.44 0.36 0.00 0.00 0.00

peningkatan pendapatan petani 0.75 0.50 0.32 0.29 0.25 0.00 0.00 0.00 0.00 0.00 0.00

penyakit hewan ternak 1.00 1.00 1.00 1.00 1.00 0.67 0.67 0.67 0.67 0.67 0.67

penyuluhan pertanian 1.00 1.00 1.00 0.77 0.71 0.63 0.58 0.58 0.00 0.00 0.00

perdagangan hasil pertanian 1.00 0.50 0.36 0.36 0.36 0.36 0.24 0.20 0.20 0.20 0.00

pertanian organik 0.83 0.83 0.83 0.71 0.71 0.67 0.67 0.67 0.67 0.52 0.00

petani tebu 0.71 0.71 0.71 0.67 0.67 0.62 0.62 0.62 0.62 0.46 0.45

peternak unggas 1.00 1.00 1.00 1.00 0.68 0.68 0.68 0.68 0.00 0.00 0.00

produk usaha peternakan rakyat 1.00 1.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00

pupuk organik 1.00 1.00 0.62 0.62 0.62 0.62 0.62 0.62 0.62 0.53 0.44

riset pertanian 1.00 0.88 0.74 0.64 0.59 0.49 0.40 0.34 0.25 0.00 0.00

swasembada pangan 1.00 0.54 0.54 0.54 0.54 0.53 0.53 0.51 0.50 0.36 0.00

tadah hujan 1.00 1.00 1.00 1.00 1.00 0.91 0.86 0.81 0.73 0.59 0.56

tanaman obat 1.00 0.88 0.88 0.50 0.50 0.50 0.50 0.50 0.48 0.39 0.00

tanaman pangan 0.50 0.28 0.22 0.22 0.22 0.22 0.22 0.22 0.22 0.21 0.21

(32)

24

Lampiran 4 Lanjutan

Tabel analisis kinerja dokumen Pertanian pengambilan dua gugus kata teratas thesaurus

Kueri Recall

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

bencana kekeringan 1.00 1.00 0.92 0.87 0.84 0.72 0.00 0.00 0.00 0.00 0.00

dukungan pemerintah pada pertanian 0.50 0.30 0.21 0.21 0.18 0.18 0.17 0.10 0.00 0.00 0.00

flu burung 1.00 1.00 1.00 0.92 0.92 0.92 0.91 0.91 0.91 0.91 0.91

gabah kering giling 1.00 1.00 0.75 0.53 0.46 0.46 0.46 0.46 0.46 0.46 0.00

gagal panen 0.88 0.88 0.88 0.86 0.85 0.68 0.67 0.55 0.00 0.00 0.00

harga komoditas pertanian 0.67 0.47 0.43 0.36 0.30 0.26 0.00 0.00 0.00 0.00 0.00

impor beras indonesia 1.00 0.85 0.85 0.83 0.69 0.51 0.51 0.41 0.00 0.00 0.00

industri gula 1.00 1.00 1.00 1.00 0.83 0.83 0.81 0.79 0.73 0.42 0.37

institut pertanian bogor 1.00 1.00 0.90 0.73 0.72 0.64 0.64 0.64 0.58 0.55 0.00

kelangkaan pupuk 1.00 1.00 1.00 1.00 0.93 0.93 0.93 0.90 0.90 0.90 0.61

kelompok masyarakat tani 1.00 0.45 0.44 0.44 0.44 0.40 0.39 0.35 0.35 0.35 0.00

laboratorium pertanian 1.00 0.83 0.83 0.70 0.65 0.65 0.52 0.48 0.44 0.44 0.42

musim panen 0.67 0.56 0.48 0.48 0.46 0.36 0.31 0.31 0.31 0.00 0.00

pembangunan untuk sektor pertanian 0.67 0.67 0.61 0.47 0.38 0.37 0.37 0.33 0.32 0.30 0.24

penerapan bioteknologi 1.00 0.69 0.69 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00

penerapan teknologi pertanian 1.00 1.00 0.48 0.48 0.48 0.48 0.37 0.32 0.00 0.00 0.00

peningkatan pendapatan petani 1.00 0.67 0.29 0.26 0.25 0.21 0.00 0.00 0.00 0.00 0.00

penyakit hewan ternak 1.00 1.00 1.00 0.86 0.86 0.64 0.64 0.64 0.64 0.64 0.64

penyuluhan pertanian 1.00 1.00 1.00 0.77 0.71 0.63 0.58 0.58 0.00 0.00 0.00

perdagangan hasil pertanian 1.00 0.50 0.29 0.29 0.29 0.29 0.20 0.18 0.18 0.18 0.00

pertanian organik 0.83 0.83 0.83 0.71 0.71 0.67 0.67 0.67 0.67 0.52 0.00

petani tebu 0.71 0.71 0.71 0.67 0.67 0.62 0.62 0.62 0.62 0.46 0.45

peternak unggas 1.00 1.00 1.00 1.00 0.63 0.63 0.63 0.63 0.00 0.00 0.00

produk usaha peternakan rakyat 1.00 1.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00

pupuk organik 1.00 1.00 0.62 0.62 0.62 0.62 0.62 0.62 0.62 0.53 0.44

riset pertanian 1.00 0.88 0.74 0.64 0.59 0.49 0.40 0.34 0.25 0.00 0.00

swasembada pangan 0.50 0.46 0.46 0.46 0.46 0.46 0.46 0.46 0.46 0.29 0.00

tadah hujan 1.00 1.00 1.00 1.00 1.00 0.91 0.86 0.81 0.73 0.59 0.56

tanaman obat 0.67 0.64 0.64 0.56 0.49 0.49 0.49 0.49 0.46 0.39 0.00

tanaman pangan 0.50 0.28 0.21 0.21 0.21 0.21 0.21 0.21 0.21 0.20 0.20

Gambar

Gambar 1 Diagram Alur Metode Penelitian
Gambar 3 Grafik recall precision
Gambar 4 Grafik recall precision ekspansi
Tabel 6 Perbandingan nilai average precision
+7

Referensi

Dokumen terkait

Berdasarkan hasil skrining fitokimia yang telah dilakukan, diperoleh hasil bahwa ekstrak etanol daun ketapang mengandung senyawa alkaloid dan flavonoid, di Fraksi Heksana

a) Kecuali untuk yang disebutkan di bawah ini, penyediaan semua pekerja, bahan dan peralatan yang dibutuhkan untuk melaksanakan survei lapangan dengan baik, untuk

Tarekat Naqsyabandiyah Khalidiyah adalah salah satu nama tarekat yang berkembang di Indonesia.Ajaran-ajaran yang diterapkan di dalam Tarekat Naqsyabandiyah Khalidiyah

Kompetensi linguistik tersebut memungkinkan peneliti dalam membuat penelitian intuitif apakah suatu kalimat di dalam bahasa Bali berterima (gramatikal) atau tidak. Sementara

masalah lebih cocok digunakan untuk satuan jalur pendidikan informal. Karakteristik perkembangan untuk masing-masing jenjang adalah berbeda, hal tersebut

• Warna kulit telur: coklat, putih; 250-260 butir/ekor/tahun Telur ayam ras.. • Berat rata-rata 15

• Pantai tipe II secara umum dicirikan oleh relief sedang, berupa perbukitn bergelombang, dengan kemiringan paras pantai yang relatif rendah hingga sedang (tidak lebih dari 10° -

(Suatu hal yang dapat diterapkan secara umum untuk semua persaingan tidak jujur atau curang dalam perdagangan dan bisnis, tetapi terutama diterapkan pada praktik berusaha