• Tidak ada hasil yang ditemukan

Implementasi dan Analisis Relevance Feedback dengan Model Croft

N/A
N/A
Protected

Academic year: 2021

Membagikan "Implementasi dan Analisis Relevance Feedback dengan Model Croft"

Copied!
7
0
0

Teks penuh

(1)

CROFT

Ahmad Ulil Albaab¹, Warih Maharani², Imelda Ataina³

¹Teknik Informatika, Fakultas Teknik Informatika, Universitas Telkom

Abstrak

Relevance Feedback merupakan salah satu teknik dalam information retrieval untuk

meningkatkan performansi ketepatan hasil pencarian. Dengan teknik ini pengguna sistem akan memilih dokumen yang relevan dengan query. Kemudian dokumen yang dipilih oleh user ini dijadikan sebagai salah satu faktor untuk menentukan hasil pencarian. Salah satu model perhitungan untuk sistem relevance feedback adalah model yang dikembangkan oleh Croft. Model ini menggunakan pembobotan TF dan IDF untuk pencarian pertama dan untuk pencarian berikutnya memasukkan dokumen pilihan user sebagai bagian dari perhitungan. Model Croft memiliki variabel yang besarnya dapat diadaptasikan sesuai dengan koleksi dokumen yang digunakan untuk mendapatkan hasil yang lebih baik.

Kata Kunci : Information Retrieval, relevance feedback, Croft

Abstract

Relevance feedback is a technique in information retrieval for improving the search result by using feedback from user. With this technique user will choose which document that is relevance with the given query. This feedback will be used by the sistem to recalculate the search result. Croft made a calculation model that can be implemented in a relevance feedback sistem. His model uses TF dan IDF weighting for the initial search, dan uses feedback documents as a factor for the next search. His model has variables that gives flexibility as it can be adjusted to the document collection that is being used to get a better result.

(2)

1

1.

PENDAHULUAN

1.1

Latar Belakang Masalah

Informasi sudah menjadi suatu aspek penting dalam kehidupan kita. Kebutuhan manusia akan informasi terus bertambah mengikuti perkembangan teknologi yang mampu menghadirkan informasi dengan cepat. Sumber informasi sekarang tidak hanya berbentuk buku atau tulisan pada media saja tetapi sudah dapat berupa data-data digital pada komputer.

Mencari informasi sebenarnya merupakan hal yang merepotkan jika dilakukan secara manual dengan jumlah data yang sangat banyak. Untuk mempercepat proses pencarian maka dikembangkan teknik pencarian dokumen salah satunya adalah information retrieval. Secara garis besar proses kerja suatu sistem information retrieval adalah user memasukkan kata kunci atau disebut juga query mengenai informasi yang akan dicari, kemudian sistem akan mencari dokumen yang sesuai di document collection yang dimiliki sistem tersebut. Sistem akan mengembalikan dokumen-dokumen hasil temuan yang menurut sistem sesuai dengan query.[5] Tetapi dokumen-dokumen hasil temuan ini tidak selalu tepat sesuai dengan informasi yang sebenarnya dicari oleh user.

Pengguna suatu sistem pencarian akan menilai sistem tersebut baik jika hasil pencarian sesuai dengan keinginan user. Performansi sebuah sistem information retrieval dapat kita ukur berdasarkan hal tersebut dengan precision dan recall dimana precision membandingkan dokumen relevan yang diterima dengan hasil pencarian sistem sedangkan recall membandingkan dokumen relevan yang diterima dengan seluruh dokumen relevan yang seharusnya diterima.[7]

Relevance feedback merupakan salah satu teknik dalam information retrieval untuk membantu meningkatkan performansi dari suatu sistem information retrieval. Dengan Relevance feedback, sistem akan menerima masukan atau feedback dari user tentang sesuai atau tidaknya sebuah dokumen dengan query.[1] Hasil feedback tersebut akan digunakan oleh sistem untuk menilai kembali kesesuaian dokumen dengan query sehingga diharapkan dokumen-dokumen hasil temuan sistem information retrieval akan lebih sesuai dengan informasi yang diinginkan user.

Teknik dasar yang digunakan pada relevance feedback antara lain adalah query expansion dan term reweighting (memodifikasi bobot sebuah term berdasarkan user relevance judgement).[1] Model yang dikembangkan Croft merupakan salah satu model yang menggunakan teknik term reweighting tanpa query expansion. Model Croft ini merupakan pengembangan dari model Robertson dan Spark Jones. Kelebihan model Croft dibandingkan dengan model Robertson dan Spark Jones adalah model ini memperhitungkan frekuensi term di dalam dokumen dan lebih fleksibel dengan adanya variabel C dan K yang bobotnya diadaptasikan menurut tipe

(3)

koleksi dokumen yang digunakan.[1] Dengan adanya variabel yang dapat diubah-ubah, model Croft ini dapat memberikan hasil yang berbeda untuk tiap nilai variabel.

Dalam Tugas Akhir ini, akan dilakukan penelitian untuk melihat pengaruh relevance feedback dengan model Croft terhadap performansi suatu sistem information retrieval dan bagaimana pengaruh variabel yang ada pada model Croft ini.

1.2

Perumusan Masalah

Berikut ini adalah rumusan masalah yang akan dijadikan objek penelitian pada tugas akhir ini:

1. Bagaimana mengimplementasikan model Croft untuk relevance feedback pada suatu sistem information retrieval.

2. Bagaimana pengaruh relevance feedback dengan model Croft pada suatu sistem information retrieval.

3. Bagaimana pengaruh pemilihan dokumen feedback oleh user terhadap performansi sistem.

1.3

Batasan Masalah

Batasan masalah dalam pengerjaan tugas akhir ini adalah:

1. Koleksi dokumen merupakan file teks yang isinya diambil dari situs ftp://ftp.cs.cornell.edu/pub/smart dimana koleksi yang digunakan adalah koleksi med, cran dan npl.

2. Query yang digunakan untuk pengujian merupakan query yang ada didalam masing-masing koleksi dokumen.

3. Data relevance jugdement untuk masing-masing query adalah relevance judgement yang ada pada koleksi dokumen.

4. Feedback yang diberikan merupakan dokumen teratas yang relevan dengan query berdasarkan data pada relevant judgement.

5. Performansi sistem information retrieval diukur dengan nilai precision,recall dan Interpolated Average Precision (IAP) 50 dokumen teratas hasil pencarian.

1.4

Tujuan

Tujuan yang ingin dicapai dalam penelitian ini adalah

1. Menganalisis performansi dari sistem information retrieval yang

mengimplementasikan relevance feedback dengan model Croft dimana performansinya dihitung berdasarkan nilai precison, recall, dan IAP.

(4)

3

2. Menganalisis pengaruh variabel yang ada di dalam model Croft terhadap performansi sistem

3. Menganalisis pengaruh pemilihan dokumen feedback terhadap performansi sistem

1.5

Metodologi Penyelesaian Masalah

Metodologi penyelesaian masalah yang digunakan untuk menyelesaikan Tugas Akhir ini adalah:

1. Studi literatur

Pada tahap ini akan dilakukan pembelajaran konsep teori-teori tentang information retrieval, relevance feedback dan model Croft serta informasi lainnya yang menunjang pembuatan tugas akhir ini dari berbagai macam sumber.

2. Perancangan sistem

Tahap ini meliputi analisis kebutuhan sistem, perancangan perangkat lunak berdasarkan kebutuhan yang telah diidentifikasi. Berikut merupakan gambaran sistem yang akan dibangun:

Gambar 1-1. Gambaran Umum Sistem

(5)

3. Implementasi sistem

Pada tahap ini akan dilakukan pembangunan sistem information retrieval dengan relevance feedback menggunakan model Croft berdasarkan rancangan sistem yang telah dibuat.

4. Pengujian sistem dan analisis hasil

Pengujian dilakukan dengan memasukkan data uji query pada sistem yang telah dibangun dan memasukkan feedback untuk memperoleh hasil keluaran dari sistem. Data-data hasil pengujian kemudian akan digunakan untuk analisa performa sistem.

5. Penyusunan laporan

Pada tahap ini akan dilakukan penyususun laporan penelitian tugas akhir ini sesuai dengan kaidah-kaidah yang ditentukan.

(6)

37

5.

KESIMPULAN DAN SARAN

5.1

Kesimpulan

Berdasarkan analisis pada sistem information retrieval yang menggunakan relevance feedback dengan model Croft, dapat disimpulkan bahwa :

a) Teknik relevance feedback dengan model Croft pada suatu sistem information retrieval dapat meningkatkan nilai precision, recall, dan IAP dari 50 dokumen pertama hasil pencarian initial search.

b) Adanya variabel C dan K pada model Croft membuat sistem information retrieval dapat diadaptasikan sesuai dengan karakteristik koleksi dokumen baik dengan koleksi yang memiliki dokumen yang panjang ataupun yang pendek, untuk mendapatkan hasil pencarian yang lebih baik.

c) Pemilihan jumlah dokumen feedback lebih dari satu umumnya memberikan hasil yang lebih baik.

5.2

Saran

Beberapa saran yang dapat diperhatikan untuk pengembangan tugas akhir ini yaitu :

a) Menambahkan teknik query expansion pada relevance feedback.

b) Menggunakan pembobotan dengan memperhatikan jarak antar term dalam dokumen.

Powered by TCPDF (www.tcpdf.org)

(7)

DAFTAR PUSTAKA

[1] Baeza-Yates, Ricardo. 1999. Modern Information Retrieval. Addison Wesley. [2] Baeza-Yates, Ricardo dan William B. Frakes. 1992. Information Retrieval:

Data Structures & Algorithms. Prentice-Hall.

[3] Croft, W. B. 2002. Advance in Information Retrieval. Kluwer Academic Publishers.

[4] Fang, Haw-ren dan Yousef Saad. Multilevel Linear Dimensionality Reduction using Hypergraphs for Data Analysis.

http://www-users.cs.umn.edu/~saad/PDF/umsi-mlevel2-08.pdf Didownload pada tanggal 27 April 2011.

[5] Greengrass, Ed. 2000. Information Retrieval: A Survey

http://www.cs.umbc.edu/csee/research/cadip/readings/IR.report.120600.book. pdf

Didownload pada tanggal 27 April 2011.

[6] Kowalski, Gerald. 1999. Information Retrieval Systems Theory and Implementation. Massachusetts: Kluwer Academic Publishers.

[7] Manning, Christopher D. dan Hinrich Schütze. 2008. Introduction to Information retrieval.Cambridge University Press.

[8] Siallagan, Evandi Gunata. 2009. Relevance Feedback dengan Algoritma Robertson dan Sparck Jones pada Information Retrieval. Jurnal TA. Bandung: Jurusan Teknik Informatika ITTelkom.

[9] van Rijsbergen, C. J. 1979. Information Retrieval: 2nd Edition. London: Butterworths.

[10] van Rijsbergen, Keith. 2004. The Geometryof Information Retrieval. New York: Cambridge University Press.

Gambar

Gambar 1-1. Gambaran Umum Sistem

Referensi

Dokumen terkait

Dewan Komisaris menghargai langkah yang diambil oleh Dewan Direksi dalam mengantisipasi pertumbuhan yang lamban pada sektor industri alat berat dan pertambangan batu bara.. Di

Jalan kabupaten sebagaimana dimaksud pada ayat (1) merupakan jalan local dalam sistem jaringan jalan primer yang tidak termasuk pada ayat (2) dan ayat (3), yang

Dengan menggunakan teknologi multimedia, masyarakat diharapkan akan tertarik untuk belajar sejarah para pahlawan karena dibuat dengan mempermudah masyarakat untuk

Ketika pemain telah menjalankan aplikasi, pemain dapat memilih bermain dengan single player, two players, melihat cara bermain, meminta bantuan untuk two players,

3 Untuk mengetahui konsep dari sistem bilangan dan Agar mahasiswa dapat mengetahui dan lebih Pengenalan.. Konsep Dasar Sistem

Puji dan syukur penulis ucapkan ke hadirat Tuhan Yang Maha Kuasa atas berkat dan rahmatNya tugas akhir dengan judul “ Pra Rancangan Pabrik Pembuatan Asam Fenil

Berdasarkan perhitungan dan hasil hipotesis diketahui bahwa NPL, IRR, LDR, IPR, BOPO, FBIR, ROA, ROE dan CAR secara simultan memiliki pengaruh yang signifikan

Tujuan dari penelitian ini adalah mengetahui formulasi terbaik dan tingkat kesukaan konsumen terhadap takoyaki substitusi tepung tapioka dengan berbagai formulasi