SEMANTIC SEARCH PADA DIGITAL LIBRARY ONLINE PUBLIC
ACCESS CATALOG
Adhie Tri Wahyudi
Teknik Industri, Universitas Setia Budi Surakarta e-mail:adhie.wahyudi@gmail.com
Abstract
Searching facility on the Digital library Online Public Access Catalog (Digilib-OPAC) is a basic requirement for each user accessesing it; therefore it plays an important role. The observations on behaviour of the users when using Digilib-OPAC obtained a fact: the user want search result that are relevant to the user whises. This means, the user requires the search engine should be able to understand the meaning of the word/phrase/sentences entered as relevant and effective.
Therefor, searching facility with ontology and semantic search technology is applied in order to solve problems of relevance of search results and the words meaning between system and users. The ontology model formed is expressed by using OWL language which contains semantic entities such as three main class i.e: Student class, Lecturer class and Publication class and three helper class i.e: Kalimat class, Stopword class and Keyword class. The rules of semantic search builts are Language processing rules using Natural Language Processing so that the system is able to understand the meaning of keyword or search sentence which are input by the users and the query SWRL rule to search the information stored in the knowledge base.
The results of system testing on a number of searching phrase, for every each keyword, show providing both the precision ratio and recall ratio of 100% or 1 : 1. Thus the facility search system developed on Digilib-OPAC is considered to be effective.
Keywords: semantic search, NLP, precision ratio, recall ratio, OPAC
PENDAHULUAN
Digital library Online Public Access Catalog (Digilib-OPAC) merupakan fasilitas yang
selalu tersedia pada sistemdigital library. Tujuan dari pemanfaatan fasilitas ini adalah untuk
mempermudah proses penemukembalian dokumen digital yang tersimpan berdasarkan kata kunci yang diinputkan. Namun demikian, peningkatan volume informasi yang disimpan menyebabkan terjadinya kesulitan untuk menemukan, mengelola, mengakses dan memelihara informasi yang diperlukan. Hal ini mengakibatkan banyaknya kata kunci yang tersimpan dan menjadi penyebab utama timbulnya kesulitan tersebut. Terutama karena makna informasi yang disimpan hanya mampu dipahami oleh manusia, sedangkan mesin tidak [1]. Akibatnya mesin tidak mampu menginterpretasikan secara tepat informasi apa yang dibutuhkan atau dicari oleh manusia. Hal ini yang mengakibatkan hasil-hasil pencarian yang tidak relevan justru terindeks dan ditampilkan sebagai hasil pencarian.
Dari hasil pengamatan terhadap perilaku user ketika sedang menggunakan
Digilib-OPAC sewaktu mencari dokumen pada sebuah digital library, diperoleh suatu fakta bahwa user menginginkan hasil pencarian yang sesuai dan relevan dengan keinginan user. Sebagai
contoh, ketika user menginputkan keyword sistem informasi, user menginginkan informasi
penelitian yang terkait tentang sistem informasi, begitupun ketika user menginputkan keyword sistem informasi keuangan, maka user menghendaki output mengenai sistem
informasi keuangan bukan penelitian sistem informasi secara umum. User menganggap
keyword yang terpecah-pecah dan diartikan sendiri-sendiri. Berikutnya ketika user
menginputkan keyword Analisa Keputusan dan Analisis Keputusan pada kolom pencarian, user menginginkan hasil pencarian yang identik, karena menganggap kedua keyword yang
diinputkan tersebut memiliki makna yang sama. Namun ternyata sistem pencarian pada
digital librarymemberikan output yang berbeda dengan interpretasi user. Mesin menganggap
kedua keyword tersebut mempunyai makna yang tidak identik. Permasalahan berikutnya,
ketika user mengetikkan singkatan kata/singkatan istilah sebagai input pencarian, sistem
justru menampilkan hasil pencarian yang sama sekali tidak relevan. Artinya, sistem tidak dapat memahami persamaan makna keyword yang tersimpan dengan singkatan
kata/singkatan istilah yang diinputkan.
Untuk mengatasi permasalahan pemaknaan, Davies dkk. mengatakan bahwa pemanfaatan teknologi semantic web mampu memberikan kemampuan pada mesin
memahami makna kata sama seperti yang dipahami oleh manusia [2]. Sedangkan, Berners-Lee mengatakan content atau informasi menjadi basis pengetahuan dapat direpresentasikan
dalam bentuk ontologi dalam bentuk-bentuk yang dapat dipahami dan diproses oleh mesin [3]. Berdasarkan kedua penjelasan semantic web yang dikemukakan tersebut, maka pada
dasarnyaSemantic Webbertujuan agar isi Web yang diekpresikan di dalam bahasa alami yang
dimengerti manusia, dapat juga dimengerti, diinterpretasi dan digunakan oleh perangkat lunak (software agents). Terkait dengan tema kustomasi mesin pencari, ada beberapa
penelitian sejenis, seperti yang dilakukan oleh Wibisono membuat suatu aplikasi pemrosesan dengan menggunakan bahasa alami (natural language processing) [4]. Pemrosesan
dilakukan pada basis data akademik dengan menggunakan format data XML. Aplikasi yang dihasilkan mampu memberikan informasi akademik dari sebuah permintaan berupa masukkan dalam bahasa Indonesia. Hasil dari penelitian ini adalah menguji tujuh aturan produksi bahasa alami yang dapat diimplementasikan dalam query bahasa Indonesia untuk
menghasilkan informasi yang diinginkan. Dengan demikian, basis data digital library yang
tersimpan dapat dimodifikasi menjadi sebuah metadata berbasis ontologi, dengan harapan agarcontentatau informasi yang tersimpan dapat dipahami serupa, baik oleh mesin maupun
olehuser(manusia).
Penelitian yang terkait dengan digital library, antara lain menyebutkan bahwa salah
satu karakteristik perpustakaan digital yang paling penting adalah fasilitas information retrieval
untuk memudahkan para pembaca dalam mencari data atau pun dokumen digital seperti judul buku, pengarang, keyword dan lain-lain [5]. Namun demikian, penelitian lain
mengatakan bahwa banyak tantangan bagi pengelola digital library untuk mengelola, sharing
dan querying informasi yang tersimpan karena faktor penyimpanan yang terdistribusi dan
bersifat heterogeneous [6]. Namun, penerapan teknologi semantic web dapat memberikan
peningkatanusabilitydaridigital librarykarena keunggulan-keunggulannya.
Kemudian, dalam penelitian yang dilakukan Sloni, disajikan desain penggunaan semantik web dalam mesin pencari untuk memecahkan masalah dalam menemukan kembali informasi secara cerdas [7]. Dan penggabungan teknik crawler, preprocessor, searcher
dan modul peringkat diyakini akan meningkatkan hasil pencarian informasi pada halaman web. Sedangkan penerapan semantic search memiliki tujuan untuk memunculkan penemuan
kembali informasi secara lebih relevan dengan keinginanuser, dengan mencocokkan konsep
atau arti [8]. Dalam hal ini, semantic search tidak bertujuan untuk menggantikan web
METODE PENELITIAN
Adapun alur penelitian yang dilakukan, mengikuti kerangka seperti yang ditampilkan pada Gambar 1.
Gambar 1. Kerangka Penelitian
Setelah dilakukan analisis dan desain requirement untuk mendefinisikan kelemahan
atau kekurangan dari sistem yang sudah ada,dan data yang diperlukan juga telah diperoleh,
maka tahapan pengembangan perangkat lunak yang dilalui adalah: METODE PENELITIAN
Adapun alur penelitian yang dilakukan, mengikuti kerangka seperti yang ditampilkan pada Gambar 1.
Gambar 1. Kerangka Penelitian
Setelah dilakukan analisis dan desain requirement untuk mendefinisikan kelemahan
atau kekurangan dari sistem yang sudah ada,dan data yang diperlukan juga telah diperoleh,
maka tahapan pengembangan perangkat lunak yang dilalui adalah: METODE PENELITIAN
Adapun alur penelitian yang dilakukan, mengikuti kerangka seperti yang ditampilkan pada Gambar 1.
Gambar 1. Kerangka Penelitian
Setelah dilakukan analisis dan desain requirement untuk mendefinisikan kelemahan
atau kekurangan dari sistem yang sudah ada,dan data yang diperlukan juga telah diperoleh,
1. Pembuatan prototipe
a. Perancangan user interface prototype
Dilakukan rancang bangun tampilan(interface)aplikasi, seperti menu, dialog,
input dan output. b. Desain arsitektur
Dilakukan rancang bangun tampilan(interface)aplikasi, seperti menu, dialog,
input dan output.
c. Desain ontologi, desain aturan pengolahan bahasa dan desain aturan SWRL
Pada tahapan dilakukan designing proses-proses yang terjadi pada sistem,
seperti desain ontologi, desain aturan pengolahan bahasa dan desain aturan SWRL. 2. Implementasi
Pada tahap ini dibangun aplikasi semantic searchdengan berbasiskan ontologi dan
aturan. Untuk pembangunan basis pengetahuan ontologi menggunakan bahasa OWL dengan bantuan tools Protégé, untuk pembuatan antarmuka ETD menggunakan bahasa
PHP, sedangkan untuk pengembangan proses pencarian menggunakan bahasa
programming JAVA dengan bantuan JENA Library untuk koneksi ke basis pengetahuan
dan bantuan JESS API untuk mengeksekusirulepencarian.
3. Pengujian sistem
Testing atau pengujian sistem dilakukan dengan dua metode, yaitu pengujian sistem pencarian karena unsur semantic dan pengujian sistem karena unsur informasi yang dikembalikan kepada user.
HASIL DAN PEMBAHASAN
Analisis Permasalahan
Seperti yang telah dipaparkan, inti permasalahan yang mendasari untuk dilakukan penelitian ini adalah kurang relevannya hasil pencarian yang dikembalikan oleh sistem pencarian. Hasil pengamatan menunjukkan bahwa nilai precision ratio penemukembalian
informasi dengan kata kunci analisa keputusan adalah sebesar 1/90 atau 0,0001%. Rendahnya nilai precision ratio dikarenakan, sistem melakukan proses pencarian dengan keyword analisa dan keyword keputusan. Karenanya dari 90 dokumen yang
ditemukembalikan, hanya 1 dokumen saya yang relevan dengan keinginan user, yaitu
dokumen dengan subyek analisa keputusan. Sedangkan, untuk kata kunci analisis keputusan nilaiprecision ratio atas hasil pencarian adalah sebesar 0/121 atau 0%. Yang menarik adalah
satu dokumen yang relevan dengan kata analisa keputusan tidak tertampil pada hasil pencarian kali ini. Melihat kedua hasil pengamatan tersebut, terlihat bahwa mesin tidak mampu memahami persamaan makna antara kata kunci analisa keputusan dengan analisis keputusan, sementarausermenginginkan hasil pencarian yang sama antara kedua kata kunci
tersebut, karena secara makna kedua kata kunci tersebut adalah identik.
Sementara itu ketika sistem diberi inputan singkatan, yaitu sim, dengan tujuan ingin mencari penelitian tentang sistem informasi manajemen, maka sistem akan memberikan hasil denganprecision ratio 10/1659 atau sekitar 0.6% atau dengan keywordlan dengan tujuan
ingin mencari penelitian yang serupa dengan tema jaringan komputer, maka sistem akan memberikan hasil dengan precision ratio 10/10133 atau sekitar 0.009%. Tabel 1
memperlihatkan sebagian hasil analisis pencarian. Kesimpulan yang diperoleh adalah hasil pencarian yang terlalu melebar yang menyebabkan nilaiprecision ratio rendah, tidak mampu
mengenali keyword yang berbeda namun memiliki persamaan makna dan tidak mampu
Tabel 1 Analisis hasil pencarian padadigital library
4 Analisa keputusan 90 1 Sistem melakukanretrievedpada
kata kunci analisa dan keputusan 5 Analisis keputusan 121 0 Sistem melakukanretrievedpada
kata kunci analisis dan keputusan
Perancangan Sistem
Pengembangan sistem pencarian usulan dilakukan dengan memanfaatkan ontologi dan teknologi semantic search. Ontologi (owl) digunakan sebagai basis pengetahuan yang
digunakan untuk menyimpan semua koleksi digital yang dimiliki system digilital library. Sedangkan teknologi semantic search diterapkan dengan tujuan untuk memunculkan
penemuan kembali informasi secara lebih relevan dengan keinginan user, dengan
mencocokkan konsep atau arti.
Metode pencarian pada pengembangan sistem pencarian yang diusulkan dibagi menjadi dua bagian, yaitu simple search dan semantic search. Ketika metode pencarian simple search dipilih, sistem menerima parameter pencarian yang diinputkan oleh user, lalu
mengecek kategori pencarian (apakah meminta pencarian pada kategori buku, artikel penelitian, Tugas Akhir atau ketiganya) kemudian menyusun representasi query berdasarkan parameter yang diterima untuk kemudian dieksekusi secararule based dengan menggunakan
konsep SWRL. Sedangkan pada metode pencarian semantic search, sistem dapat menerima
parameter pencarian yang lebihhuman friendly, yaitu berupa kalimat pencarian. Kalimat yang
diinputkan kemudian mengalami serangkaian proses pengolahan bahasa untuk penemukembalian informasi (information retrieval; IR). Strzalkowski pada publikasinya
mengatakan bahwa, pengolahan bahasa sebagai bagian proses IR terdiri dari beberapa tahap, yaitu tokenizing, filtering, stemming dan validation [9]. Output dari proses tersebut
kemudian dieksekusi secararule baseddengan menggunakan konsep SWRL.
Proses pembangunan basis pengetahuan atau building ontologi merupakan bagian
proses yang sangat penting karena pada bagian inilah terletak penyimpanan seluruh data yang nantinya akan digunakan memberikan solusi. Dalam hal perancangan ontologi, penelitian ini menerapkan prinsip re-usage atau memanfaatkan ontologi yang dibuat oleh
Nurkhamid yang bersesuaian [10]. Sedangkan untuk penggunaan istilah dan terminology,
digunakan standar Dublin Core, sehingga semua istilah dan terminology yang digunakan
sesuai dengan standar internasional yang mendukung prinsip interoperabilitas. Dengan demikian, sharing data dan informasi tidak lagi terkendala oleh rigidnya istilah yang
digunakan antara satu database dengan database lainnya. Pada publikasinya, Noy dkk. menjelaskan bahwa langkah-langkah dalam merancang suatu ontologi adalah : menentukan konsep, istilah dan domain, mendefinisikan kelas dan hirarkinya, mendefinisikan property, constraint, danslot, serta mendefinisikaninstance[11].
Ada dua kelas utama dan tiga kelas pembantu yang didefinisikan pada pembangunan ontologi untuk meyimpan semua dokumen yang ada padadigital library. Dua
lecturerPublication memiliki sub-kelas lagi, yaitu undergraduateThesis, masterThesis dan phdDissertation merupakan sub-kelas dari finalProject dan Article serta Journal yang merupakan sub-kelas dari lecturerPublication. Gambar 2 memperlihatkan rancangan struktur dan hirarki kelas ontologi yang akan dibangun. Rancangan ontology tersebut kemudian diimplementasikan dengan menggunakan bahasa OWL (Web Ontologi Language).
OWL merupakan suatu bahasa yang digunakan untuk mendeskripsikan kelas, properti dan relasi antar objek dalam suatu cara yang dapat diinterpretasikan oleh mesin [12]. OWL merupakan sebuah vocabulary namun dengan tingkatan semantik yang lebih tinggi
dibandingkan dengan RDF dan RDF Schema. Gambar 3 memperlihatkan implementasi
rancangan ontologi dalam bahasa OWL.
Kemudian untuk dapat menemukembalikan dokumen (IR) yang tersimpan pada ontologi, terdapat dua aturan yang akan dibangun, yaitu aturan pengolahan kalimat perintah secara linguistik/bahasa dan aturan query SWRL.
Aturan pengolahan kalimat perintah secara bahasa mengatur bagaimana produksi kalimat perintah yang dibuat dan menentukan keteraturan kalimat untuk mengakses informasi pada basis pengetahuan [13] dan [14]. Kemudian [9] pada publikasinya, menyebutkan bahwa pengolahan bahasa sebagai bagian proses IR terdiri dari beberapa tahap, yaitu (1) validation, (2) tokenizing atau parsing kalimat pencarian menjadi kata-kata
(token), (3) filtering atau menghilangkan kata-kata yang menjadi kategori stopword ataupun
kata-kata yang dianggap tidak penting seperti kata sambung dan (4) stemming atau proses
mencarirootdari token-token [9].Outputdari proses stemming kemudian divalidasi menjadi
representasi kalimat dengan aturan-aturan Natural Language Processing (NLP) dan kemudian
disusun sebuah representasi query untuk kemudian dieksekusi secara rule based dengan
Gambar 2 Struktur dan Hirarki Kelas Sistem ETD
Gambar 3 Implementasi Ontologi dalam bahasa OWL Gambar 2 Struktur dan Hirarki Kelas Sistem ETD
Gambar 3 Implementasi Ontologi dalam bahasa OWL Gambar 2 Struktur dan Hirarki Kelas Sistem ETD
Mandala pada publikasinya juga menyatakan bahwa linguistik untuk sistem temu kembali informasi dapat diidentifikasi dengan lima unsur, yaitu : (1). Kata perintah pencarian (kp), (2). Kata kunci yang mewakili categoryobjek pencarian (ctg), (3). Kata kunci
yang mewakilidatatype property (dtp), (4). Kata kunci yang mewakili object property (obp) dan
(5). Nilai dari sebuahdatatype property (value) [14]. Berdasarkan kelima unsur tersebut, dapat
diidentifikasi pola kalimat (K) sebagai berikut [14]:
Kkp + ctg + [dtp | obp] + value
Pada publikasinya, Mandala juga mengatakan bahwa unsur minimal kalimat yang bernilai valid untuk sistem temu kembali informasi terdiri dari: (1). Kalimat minimal harus terdiri dari kata perintah (cari, carikan, atau tampilkan), kategori pencarian (atau ctg : tesis, disertasi atau penelitian) dan nilai yang akan dicari; (2). Kalimat yang memiliki datatype properties (dtp) atau object properties (obp) lebih dari satu akan dinyatakan valid jika dtp atau
obp tidak mempunyai makna yang sama [14]. Selain pengukuran validitas, Mandala juga melakukan identifikasi pola kalimat pencarian untuk sistem temu kembali informasi. Pola kalimat pencarian tersebut, terdiri dari [14] :
1. Tipe 1 : Kkp + ctg + value.
Kalimat tipe 1 terdiri dari kata pencari + kata yang mengandung unsur category
pencarian + value pencarian.
2. Tipe 2 : Kkp + ctg + dtp + value.
Kalimat tipe 2 terdiri dari kata pencari + kata yang mengandung unsur category
pencarian + kata yang mengandung unsurdatatypepencarian + value pencarian;
3. Tipe 3 : Kkp + ctg +obp +value.
Kalimat tipe 3 terdiri dari kata pencari + kata yang mengandung unsur category
pencarian + kata yang mengandung unsurobject propertypencarian + value pencarian.
4. Tipe 4 : Kkp + ctg + dtp + value + obp + value
Kalimat tipe 4 terdiri dari kata pencari + kata yang mengandung unsur category
pencarian + kata yang mengandung unsur data property pencarian + value pencarian +
kata yang mengandung unsurobject propertypencarian + value pencarian.
5. Tipe 5 : Kkp + ctg + dtp + value + dtp + value
Kalimat tipe 5 terdiri dari kata pencari + kata yang mengandung unsur category
pencarian + kata yang mengandung unsur data property pencarian + value pencarian +
kata yang mengandung unsurdata propertypencarian + value pencarian.
6. Tipe 6 : Kkp + ctg + obp + value + obp + value.
Kalimat tipe 3 terdiri dari kata pencari + kata yang mengandung unsur category
pencarian + kata yang mengandung unsur object property pencarian + value pencarian +
kata yang mengandung unsurobject propertypencarian + value pencarian.
Proses pengolahan bahasa yang dilakukan terhadap kalimat yang diinputkan adalah: (1) proses tokenizing, yaitu memecah setiap kata yang menyusun suatu kalimat pencarian
yang diterima oleh sistem. Proses ini dilakukan dengan menggunakan algoritma yang dipublikasikan [15] yang mengandalkan karakter spasi pada kalimat untuk melakukan pemisahan kata. (2) Berbarengan dengan proses tokenizing, juga dilakukan proses filtering,
diabaikan oleh sistem dan tidak akan diproses lebih lanjut. Sebaliknya jika terdapat kata yang tidak termasuk didalam daftar stopword maka kata tersebut akan masuk pada proses berikutnya. (3) Selanjutnya adalah Prosesstemming yang pada dasarnya adalah proses untuk
mencari root dari sebuah kata. Pencarian root sebuah kata atau biasa disebut dengan kata dasar dapat memperkecil hasil indeks tanpa harus menghilangkan makna. Beberapa term hasil stemming bisa jadi berupa kata standar pencarian. Kata standar pencarian (keyword)
merupakan kata-kata yang digunakan sebagai standar acuan dalam pembentukan sebuah kalimat dan disimpan dalam sebuah kelas pada ontologi. Karenanya pada proses ini dilakukan pengecekan term terhadap sebuah daftar keyword yang tersimpan pada ontologi.
(4) Setelah kalimat terpotong-potong dan dirubah menjadi kata dasarnya, maka kalimat tersebut dapat dicek validitas dan tipe kalimatnya berdasarkan skema yang dipublikasikan oleh [14]. Kalimat yang invalid akan ditolak oleh sistem dan ditampilkan sebagai kalimat yang tidak valid.
Hasil dari keempat proses pengolahan kalimat perintah secara linguistik/bahasa di atas, dilanjutkan dengan proses pembentukan representasi query dengan menggunakan
SWRL. Aturan SWRL yang dibentuk adalah aturan dasar dalam format query SWRL untuk
retrieveinformasi sesuai dengan parameter yang diberikan.
ctg OntologyETD:title(?f, ?t) ∧ OntologyETD:author(?f, ?a) ∧
OntologyETD:department(?a, ?d) ∧ OntologyETD:programmeName(?d, ?dp) ∧ OntologyETD:sinopsis(?f, ?s) ∧ OntologyETD:fullName(?a, ?af) ∧
OntologyETD:hasKeyword(?f, ?kw) ∧ OntologyETD:keyword(?kw, ?k) ∧ OntologyETD:adviser(?f, ?adv) ∧ OntologyETD:fullName(?adv, ?advf) filter → sqwrl:select(?f, ?t, ?af, ?dp, ?s, ?k, ?advf)
Gambar 4. Aturan dasar query SWRL
Aturan dasar query SWRL yang ditunjukkan pada Gambar 4, pada prinsipnya adalah template untuk inisiasi semua properti ontologi yang kemudian di-generate
berdasarkan parameter yang diinputkan oleh user. Query SWRL yang telah di-generate,
kemudian dieksekusi oleh mesin SWRL untuk selanjutnya melakukan pencarian pada file ontologi ETD.
Perancangan Sistem
Pengujian dilakukan dengan tujuan untuk mengetahui tingkat keberhasilan sistem yang dibangun. Menurut Mandala [14] pengujian dilakukan dengan cara memberikan penilaian terhadap komponen berikut: a) Apakah sistem mampu mengenali validitas kalimat dengan tepat dan mampu merubah kalimat pencarian menjadi representasi kalimat sebelum query? (b) Apakah sistem mampu mengenali value kunci dengan tepat? (c) Apakah sistem mampu menentukan statement query dengan tepat? (d) Apakah sistem mampu menghasilkan informasi yang tepat untuk setiap kalimat pencarian yang dimasukkan?
pencarian pada metode semantic search. Sedangkan Tabel 2 memperlihatkan hasil pengujian
kalimat pencarian pada metodesemantic search.
Gambar 5. Pengujian semantic search dengan pola kalimat a.1
Tabel 2. Pengujian kalimat pencarian pada metodesemantic search
No Kalimat pencarian
Komponen pengujian : Apakah sistem mampu Mengenali
validitas kalimat
Mengenali value kunci
Menentukan statement query
Menghasilkan informasi yang tepat a1 Cari buku sistem √ √ √ √ a2 Tampilkan tugas akhir
analisa keputusan √ √ √ √ a3 Carikan tugas akhir
analisis keputusan √ √ √ √ b1 Cari buku dengan tema
semantic web √ √ √ √ b2 Cari publikasi dosen
dengan topik semantik web
√ √ √ √
b3 Cari tugas akhir dengan
bahasan web semantik √ √ √ √ b4 Cari tugas akhir dengan
judul web semantic √ √ √ √ b5 Cari buku yang
membahas semantic web √ √ √ √ b6 Cari tugas akhir yang
berhubungan dengan semantic web
√ √ √ √
b7 Cari tugas akhir yang
No Kalimat pencarian
No Kalimat pencarian
Komponen pengujian : Apakah sistem mampu Mengenali
Hasil pengujian menunjukkan bahwa sistem mampu: (1) mengenali validitas kalimat dengan tepat, (2) mampu merubah kalimat pencarian menjadi representasi kalimat sebelum query, (3) mampu mengenali value kunci dengan tepat, (4) mampu menentukan statement query dengan tepat dan (5) mampu menghasilkan informasi yang tepat untuk setiap kalimat pencarian yang dimasukkan.
Pengujian sistem temu kembali informasi
[16] mengatakan bahwa untuk mengukur efektifitas sistem temu kembali informasi terdapat dua rasio umum yang biasa dipergunakan, yaitu precision (ukuran kemampuan
sebuah sistem untuk menampilkan hanya dokumen yang relevan) dan recall (ukuran
kemampuan sistem untuk menampilkan seluruh dokumen yang relevan). Untuk mengukur rasio precision dan recall, maka perlu mengetahui jumlah dokumen relevan terhadap suatu
kata kunci (keyword) yang tersimpan pada ontologi. Kemudian dilakukan pengujian
berdasarkan kata kunci tersebut dan dihitung jumlah dokumen yang dikembalikan dan jumlah dokumen yang dikembalikan yang relevan terhadap kata kunci yang dicari. Tabel 3 memperlihatkan hasil pengujian tersebut.
Tabel 3. Inisiasi kata kunci (keyword) pada dokumen yang tersimpan
No Kata kunci ∑ dokumen
1 Analisa keputusan 1 1 1
2 Analisis keputusan 1 1 1
Dari Tabel 3 tersebut, maka dapat dihitung rasio precision dan rasio recall untuk setiap kata kunci, seperti:
Selanjutnya hasil perhitungan rasio precision dan recall ditampilkan pada Tabel 4. Tabel 4 Tabel perhitungan rasioprecisiondanrecall
No Kata kunci pencarian rasioprecision Rasiorecall
1 Analisa keputusan 100% 100%
2 Analisis keputusan 100% 100%
3 Semantic 100% 100%
4 Semantik 100% 100%
5 Semantic web 100% 100%
6 Semantik web 100% 100%
7 Web semantik 100% 100%
8 Web 100% 100%
Pada tabel 4 terlihat bahwa hasil perhitungan rasio precision untuk setiap kata kunci
adalah 100%. Begitupun untuk hasil perhitungan rasio recall. Dengan demikian, merujuk
pada pernyataan Harrod dan Prytherch dalam [17] yang mengatakan “bahwa suatu sistem temu balik informasi dapat dikatakan efektif apabila rasio recalldan precision sama besarnya
(1:1)”, maka sistem semantic search yang dikembangkan pada penelitian ini dapat dikatakan
efektif.
KESIMPULAN
Berdasarkan hasil penelitian yang telah dilakukan dapat disimpulkan:
1. Model ontologi dapat digunakan untuk menyimpan data dan metadata dokumendigital librarydan membantu meningkatkan efektivitas hasil pencarian.
2. Dari hasil pengujian dengan menginputkan sejumlah kalimat perintah pencarian, sistem mengenali kalimat perintah yang diinputkan dan memberikan informasi yang relevan maknanya terhadap yang diinginkanuser.
3. Aturan pengolahan bahasa dan aturan query yang diimplementasikan memberikan hasil perhitungan rasio precision dan rasio recall pada setiap pengujian kata kunci yang sama besar yaitu 100%, yang berarti sistem dapat dikatakan efektif.
SARAN
ditambahkan suatu metode/mekanisme berupa koreksi otomatis sebagai alternatif perbaikan kesalahan, jika kalimat yang dimasukkan tidak valid.
DAFTAR PUSTAKA
[1] Al-Kalani, F., Awad, M.G., dan Hani, N.B., 2010, Semantic Web: Improving Search Using RDF Instead of XML, Global Journal of Computer Science and Technology, Vol. 10
Issue 15, Hal 23-26.
[2] Davies, J., Fensel, D., dan van Harmelen, F., 2002, Towards the Semantic web -Ontology-Driven Knowledge Management, John Wiles and Sons, Ltd, Chichester.
[3] Berners-Lee, T., 2001., TheSemantic web., The Scientific American.
[4] Wibisono, S., 2010, Aplikasi Pengolah Bahasa Alami untuk query Basisdata Akademik dengan format data XML,Tesis,Universitas Gadjah Mada.
[5] Hui-fang, Q., 2009, Construction of University Digital library Resources under the
Network Environment, IEEE Computer Society Proceedings of International Conference on Networking and Digital Society, hlm. 12-15.
[6] Kruk, S.R., Zimmerman, K., dan Sapkota, B., No Date, Semantically Enhanced Search Services in Digital Libraries, Digital Enterprise Research Institute, Deri Galway, Ireland. [7] Sloni, D.K., dan Mahawar, N.K., 2010, Design a Customize Search Engine: Semantic
Web, International Journal of Soft Computing and Engineering (IJSCE), Vol. I.
[8] Unni, M., dan Baskaran, K., 2011, Overview of Approaches to Semantic Web Search,
International Journal of Computer Science and Communication (IJCSC), No. 2, Vol. 2, Hal
345-349.
[9] Strzalkowski, T., Carballo, J.P., Karlgren, J., Hulth, A., Tapanainen, P., dan Lahtinen, T.,
1999, Natural Language Information Retrieval,
http://trec.nist.gov/pubs/trec8/papers/ge8adhoc2.pdf, diakses tanggal 26 Maret 2012.
[10] Nurkhamid, 2009, Aplikasi bibliografi perpustakaan berbasis teknologi semantic web,
Tesis, Universitas Gadjah Mada.
[11] Noy, N.F., dan McGuinness, D.L., 2001, Ontologi Development 101 : A Guide to Creating Your First Ontologi, http://protege.stanford.edu/publications/ontologi_development/ ,
diakses pada tanggal 7 Februari 2012.
[13] Liddy, E.D., 2001, Natural Language Processing, In Enclopedia of Library and Information Science-2nd Edition, Marcel Decker Inc., NY., USA.
[14] Mandala, R., 1999, Temu Kembali Informasi dengan Bantuan Analisis Linguistik,
Proceeding of Information Processing and Management.
[15] Tala, Z., 2003, A Study of Stemming Effect on Information Retrieval in Bahasa Indonesia, Theses, Institute for Logic, Language and Computation, Universiteit van Amsterdam, The Nedherlands.
[16] Grossman, D. A. dan Frieder, O., 2004, Information Retrieval : Algorithms and Heuristics,
Springer.
[17] Mustangimah, 1998, Efektifitas system temu kembali informasi dan analisis bibliometrik: aplikasi pada dokumen bidang nuklir berbahasa Indonesia, Tesis,