SEMANTIC SEARCH PADA DIGITAL LIBRARY ONLINE PUBLIC ACCESS CATALOG

(1)

SEMANTIC SEARCH PADA DIGITAL LIBRARY ONLINE PUBLIC

ACCESS CATALOG

Adhie Tri Wahyudi

Teknik Industri, Universitas Setia Budi Surakarta e-mail:[email protected]

Abstract

Searching facility on the Digital library Online Public Access Catalog (Digilib-OPAC) is a basic requirement for each user accessesing it; therefore it plays an important role. The observations on behaviour of the users when using Digilib-OPAC obtained a fact: the user want search result that are relevant to the user whises. This means, the user requires the search engine should be able to understand the meaning of the word/phrase/sentences entered as relevant and effective.

Therefor, searching facility with ontology and semantic search technology is applied in order to solve problems of relevance of search results and the words meaning between system and users. The ontology model formed is expressed by using OWL language which contains semantic entities such as three main class i.e: Student class, Lecturer class and Publication class and three helper class i.e: Kalimat class, Stopword class and Keyword class. The rules of semantic search builts are Language processing rules using Natural Language Processing so that the system is able to understand the meaning of keyword or search sentence which are input by the users and the query SWRL rule to search the information stored in the knowledge base.

The results of system testing on a number of searching phrase, for every each keyword, show providing both the precision ratio and recall ratio of 100% or 1 : 1. Thus the facility search system developed on Digilib-OPAC is considered to be effective.

Keywords: semantic search, NLP, precision ratio, recall ratio, OPAC

PENDAHULUAN

Digital library Online Public Access Catalog (Digilib-OPAC) merupakan fasilitas yang

selalu tersedia pada sistemdigital library. Tujuan dari pemanfaatan fasilitas ini adalah untuk

mempermudah proses penemukembalian dokumen digital yang tersimpan berdasarkan kata kunci yang diinputkan. Namun demikian, peningkatan volume informasi yang disimpan menyebabkan terjadinya kesulitan untuk menemukan, mengelola, mengakses dan memelihara informasi yang diperlukan. Hal ini mengakibatkan banyaknya kata kunci yang tersimpan dan menjadi penyebab utama timbulnya kesulitan tersebut. Terutama karena makna informasi yang disimpan hanya mampu dipahami oleh manusia, sedangkan mesin tidak [1]. Akibatnya mesin tidak mampu menginterpretasikan secara tepat informasi apa yang dibutuhkan atau dicari oleh manusia. Hal ini yang mengakibatkan hasil-hasil pencarian yang tidak relevan justru terindeks dan ditampilkan sebagai hasil pencarian.

Dari hasil pengamatan terhadap perilaku user ketika sedang menggunakan

Digilib-OPAC sewaktu mencari dokumen pada sebuah digital library, diperoleh suatu fakta bahwa user menginginkan hasil pencarian yang sesuai dan relevan dengan keinginan user. Sebagai

contoh, ketika user menginputkan keyword sistem informasi, user menginginkan informasi

penelitian yang terkait tentang sistem informasi, begitupun ketika user menginputkan keyword sistem informasi keuangan, maka user menghendaki output mengenai sistem

informasi keuangan bukan penelitian sistem informasi secara umum. User menganggap

(2)

keyword yang terpecah-pecah dan diartikan sendiri-sendiri. Berikutnya ketika user

menginputkan keyword Analisa Keputusan dan Analisis Keputusan pada kolom pencarian, user menginginkan hasil pencarian yang identik, karena menganggap kedua keyword yang

diinputkan tersebut memiliki makna yang sama. Namun ternyata sistem pencarian pada

digital librarymemberikan output yang berbeda dengan interpretasi user. Mesin menganggap

kedua keyword tersebut mempunyai makna yang tidak identik. Permasalahan berikutnya,

ketika user mengetikkan singkatan kata/singkatan istilah sebagai input pencarian, sistem

justru menampilkan hasil pencarian yang sama sekali tidak relevan. Artinya, sistem tidak dapat memahami persamaan makna keyword yang tersimpan dengan singkatan

kata/singkatan istilah yang diinputkan.

Untuk mengatasi permasalahan pemaknaan, Davies dkk. mengatakan bahwa pemanfaatan teknologi semantic web mampu memberikan kemampuan pada mesin

memahami makna kata sama seperti yang dipahami oleh manusia [2]. Sedangkan, Berners-Lee mengatakan content atau informasi menjadi basis pengetahuan dapat direpresentasikan

dalam bentuk ontologi dalam bentuk-bentuk yang dapat dipahami dan diproses oleh mesin [3]. Berdasarkan kedua penjelasan semantic web yang dikemukakan tersebut, maka pada

dasarnyaSemantic Webbertujuan agar isi Web yang diekpresikan di dalam bahasa alami yang

dimengerti manusia, dapat juga dimengerti, diinterpretasi dan digunakan oleh perangkat lunak (software agents). Terkait dengan tema kustomasi mesin pencari, ada beberapa

penelitian sejenis, seperti yang dilakukan oleh Wibisono membuat suatu aplikasi pemrosesan dengan menggunakan bahasa alami (natural language processing) [4]. Pemrosesan

dilakukan pada basis data akademik dengan menggunakan format data XML. Aplikasi yang dihasilkan mampu memberikan informasi akademik dari sebuah permintaan berupa masukkan dalam bahasa Indonesia. Hasil dari penelitian ini adalah menguji tujuh aturan produksi bahasa alami yang dapat diimplementasikan dalam query bahasa Indonesia untuk

menghasilkan informasi yang diinginkan. Dengan demikian, basis data digital library yang

tersimpan dapat dimodifikasi menjadi sebuah metadata berbasis ontologi, dengan harapan agarcontentatau informasi yang tersimpan dapat dipahami serupa, baik oleh mesin maupun

olehuser(manusia).

Penelitian yang terkait dengan digital library, antara lain menyebutkan bahwa salah

satu karakteristik perpustakaan digital yang paling penting adalah fasilitas information retrieval

untuk memudahkan para pembaca dalam mencari data atau pun dokumen digital seperti judul buku, pengarang, keyword dan lain-lain [5]. Namun demikian, penelitian lain

mengatakan bahwa banyak tantangan bagi pengelola digital library untuk mengelola, sharing

dan querying informasi yang tersimpan karena faktor penyimpanan yang terdistribusi dan

bersifat heterogeneous [6]. Namun, penerapan teknologi semantic web dapat memberikan

peningkatanusabilitydaridigital librarykarena keunggulan-keunggulannya.

Kemudian, dalam penelitian yang dilakukan Sloni, disajikan desain penggunaan semantik web dalam mesin pencari untuk memecahkan masalah dalam menemukan kembali informasi secara cerdas [7]. Dan penggabungan teknik crawler, preprocessor, searcher

dan modul peringkat diyakini akan meningkatkan hasil pencarian informasi pada halaman web. Sedangkan penerapan semantic search memiliki tujuan untuk memunculkan penemuan

kembali informasi secara lebih relevan dengan keinginanuser, dengan mencocokkan konsep

atau arti [8]. Dalam hal ini, semantic search tidak bertujuan untuk menggantikan web

(3)

METODE PENELITIAN

Adapun alur penelitian yang dilakukan, mengikuti kerangka seperti yang ditampilkan pada Gambar 1.

Gambar 1. Kerangka Penelitian

Setelah dilakukan analisis dan desain requirement untuk mendefinisikan kelemahan

atau kekurangan dari sistem yang sudah ada,dan data yang diperlukan juga telah diperoleh,

maka tahapan pengembangan perangkat lunak yang dilalui adalah: METODE PENELITIAN

(4)

1. Pembuatan prototipe

a. Perancangan user interface prototype

Dilakukan rancang bangun tampilan(interface)aplikasi, seperti menu, dialog,

input dan output. b. Desain arsitektur

Dilakukan rancang bangun tampilan(interface)aplikasi, seperti menu, dialog,

input dan output.

c. Desain ontologi, desain aturan pengolahan bahasa dan desain aturan SWRL

Pada tahapan dilakukan designing proses-proses yang terjadi pada sistem,

seperti desain ontologi, desain aturan pengolahan bahasa dan desain aturan SWRL. 2. Implementasi

Pada tahap ini dibangun aplikasi semantic searchdengan berbasiskan ontologi dan

aturan. Untuk pembangunan basis pengetahuan ontologi menggunakan bahasa OWL dengan bantuan tools Protégé, untuk pembuatan antarmuka ETD menggunakan bahasa

PHP, sedangkan untuk pengembangan proses pencarian menggunakan bahasa

programming JAVA dengan bantuan JENA Library untuk koneksi ke basis pengetahuan

dan bantuan JESS API untuk mengeksekusirulepencarian.

3. Pengujian sistem

Testing atau pengujian sistem dilakukan dengan dua metode, yaitu pengujian sistem pencarian karena unsur semantic dan pengujian sistem karena unsur informasi yang dikembalikan kepada user.

HASIL DAN PEMBAHASAN

Analisis Permasalahan

Seperti yang telah dipaparkan, inti permasalahan yang mendasari untuk dilakukan penelitian ini adalah kurang relevannya hasil pencarian yang dikembalikan oleh sistem pencarian. Hasil pengamatan menunjukkan bahwa nilai precision ratio penemukembalian

informasi dengan kata kunci analisa keputusan adalah sebesar 1/90 atau 0,0001%. Rendahnya nilai precision ratio dikarenakan, sistem melakukan proses pencarian dengan keyword analisa dan keyword keputusan. Karenanya dari 90 dokumen yang

ditemukembalikan, hanya 1 dokumen saya yang relevan dengan keinginan user, yaitu

dokumen dengan subyek analisa keputusan. Sedangkan, untuk kata kunci analisis keputusan nilaiprecision ratio atas hasil pencarian adalah sebesar 0/121 atau 0%. Yang menarik adalah

satu dokumen yang relevan dengan kata analisa keputusan tidak tertampil pada hasil pencarian kali ini. Melihat kedua hasil pengamatan tersebut, terlihat bahwa mesin tidak mampu memahami persamaan makna antara kata kunci analisa keputusan dengan analisis keputusan, sementarausermenginginkan hasil pencarian yang sama antara kedua kata kunci

tersebut, karena secara makna kedua kata kunci tersebut adalah identik.

Sementara itu ketika sistem diberi inputan singkatan, yaitu sim, dengan tujuan ingin mencari penelitian tentang sistem informasi manajemen, maka sistem akan memberikan hasil denganprecision ratio 10/1659 atau sekitar 0.6% atau dengan keywordlan dengan tujuan

ingin mencari penelitian yang serupa dengan tema jaringan komputer, maka sistem akan memberikan hasil dengan precision ratio 10/10133 atau sekitar 0.009%. Tabel 1

memperlihatkan sebagian hasil analisis pencarian. Kesimpulan yang diperoleh adalah hasil pencarian yang terlalu melebar yang menyebabkan nilaiprecision ratio rendah, tidak mampu

mengenali keyword yang berbeda namun memiliki persamaan makna dan tidak mampu

(5)

Tabel 1 Analisis hasil pencarian padadigital library

4 Analisa keputusan 90 1 Sistem melakukanretrievedpada

kata kunci analisa dan keputusan 5 Analisis keputusan 121 0 Sistem melakukanretrievedpada

kata kunci analisis dan keputusan

Perancangan Sistem

Pengembangan sistem pencarian usulan dilakukan dengan memanfaatkan ontologi dan teknologi semantic search. Ontologi (owl) digunakan sebagai basis pengetahuan yang

digunakan untuk menyimpan semua koleksi digital yang dimiliki system digilital library. Sedangkan teknologi semantic search diterapkan dengan tujuan untuk memunculkan

penemuan kembali informasi secara lebih relevan dengan keinginan user, dengan

mencocokkan konsep atau arti.

Metode pencarian pada pengembangan sistem pencarian yang diusulkan dibagi menjadi dua bagian, yaitu simple search dan semantic search. Ketika metode pencarian simple search dipilih, sistem menerima parameter pencarian yang diinputkan oleh user, lalu

mengecek kategori pencarian (apakah meminta pencarian pada kategori buku, artikel penelitian, Tugas Akhir atau ketiganya) kemudian menyusun representasi query berdasarkan parameter yang diterima untuk kemudian dieksekusi secararule based dengan menggunakan

konsep SWRL. Sedangkan pada metode pencarian semantic search, sistem dapat menerima

parameter pencarian yang lebihhuman friendly, yaitu berupa kalimat pencarian. Kalimat yang

diinputkan kemudian mengalami serangkaian proses pengolahan bahasa untuk penemukembalian informasi (information retrieval; IR). Strzalkowski pada publikasinya

mengatakan bahwa, pengolahan bahasa sebagai bagian proses IR terdiri dari beberapa tahap, yaitu tokenizing, filtering, stemming dan validation [9]. Output dari proses tersebut

kemudian dieksekusi secararule baseddengan menggunakan konsep SWRL.

Proses pembangunan basis pengetahuan atau building ontologi merupakan bagian

proses yang sangat penting karena pada bagian inilah terletak penyimpanan seluruh data yang nantinya akan digunakan memberikan solusi. Dalam hal perancangan ontologi, penelitian ini menerapkan prinsip re-usage atau memanfaatkan ontologi yang dibuat oleh

Nurkhamid yang bersesuaian [10]. Sedangkan untuk penggunaan istilah dan terminology,

digunakan standar Dublin Core, sehingga semua istilah dan terminology yang digunakan

sesuai dengan standar internasional yang mendukung prinsip interoperabilitas. Dengan demikian, sharing data dan informasi tidak lagi terkendala oleh rigidnya istilah yang

digunakan antara satu database dengan database lainnya. Pada publikasinya, Noy dkk. menjelaskan bahwa langkah-langkah dalam merancang suatu ontologi adalah : menentukan konsep, istilah dan domain, mendefinisikan kelas dan hirarkinya, mendefinisikan property, constraint, danslot, serta mendefinisikaninstance[11].

Ada dua kelas utama dan tiga kelas pembantu yang didefinisikan pada pembangunan ontologi untuk meyimpan semua dokumen yang ada padadigital library. Dua

(6)

lecturerPublication memiliki sub-kelas lagi, yaitu undergraduateThesis, masterThesis dan phdDissertation merupakan sub-kelas dari finalProject dan Article serta Journal yang merupakan sub-kelas dari lecturerPublication. Gambar 2 memperlihatkan rancangan struktur dan hirarki kelas ontologi yang akan dibangun. Rancangan ontology tersebut kemudian diimplementasikan dengan menggunakan bahasa OWL (Web Ontologi Language).

OWL merupakan suatu bahasa yang digunakan untuk mendeskripsikan kelas, properti dan relasi antar objek dalam suatu cara yang dapat diinterpretasikan oleh mesin [12]. OWL merupakan sebuah vocabulary namun dengan tingkatan semantik yang lebih tinggi

dibandingkan dengan RDF dan RDF Schema. Gambar 3 memperlihatkan implementasi

rancangan ontologi dalam bahasa OWL.

Kemudian untuk dapat menemukembalikan dokumen (IR) yang tersimpan pada ontologi, terdapat dua aturan yang akan dibangun, yaitu aturan pengolahan kalimat perintah secara linguistik/bahasa dan aturan query SWRL.

Aturan pengolahan kalimat perintah secara bahasa mengatur bagaimana produksi kalimat perintah yang dibuat dan menentukan keteraturan kalimat untuk mengakses informasi pada basis pengetahuan [13] dan [14]. Kemudian [9] pada publikasinya, menyebutkan bahwa pengolahan bahasa sebagai bagian proses IR terdiri dari beberapa tahap, yaitu (1) validation, (2) tokenizing atau parsing kalimat pencarian menjadi kata-kata

(token), (3) filtering atau menghilangkan kata-kata yang menjadi kategori stopword ataupun

kata-kata yang dianggap tidak penting seperti kata sambung dan (4) stemming atau proses

mencarirootdari token-token [9].Outputdari proses stemming kemudian divalidasi menjadi

representasi kalimat dengan aturan-aturan Natural Language Processing (NLP) dan kemudian

disusun sebuah representasi query untuk kemudian dieksekusi secara rule based dengan

(7)

Gambar 2 Struktur dan Hirarki Kelas Sistem ETD

Gambar 3 Implementasi Ontologi dalam bahasa OWL Gambar 2 Struktur dan Hirarki Kelas Sistem ETD

(8)

Mandala pada publikasinya juga menyatakan bahwa linguistik untuk sistem temu kembali informasi dapat diidentifikasi dengan lima unsur, yaitu : (1). Kata perintah pencarian (kp), (2). Kata kunci yang mewakili categoryobjek pencarian (ctg), (3). Kata kunci

yang mewakilidatatype property (dtp), (4). Kata kunci yang mewakili object property (obp) dan

(5). Nilai dari sebuahdatatype property (value) [14]. Berdasarkan kelima unsur tersebut, dapat

diidentifikasi pola kalimat (K) sebagai berikut [14]:

Kkp + ctg + [dtp | obp] + value

Pada publikasinya, Mandala juga mengatakan bahwa unsur minimal kalimat yang bernilai valid untuk sistem temu kembali informasi terdiri dari: (1). Kalimat minimal harus terdiri dari kata perintah (cari, carikan, atau tampilkan), kategori pencarian (atau ctg : tesis, disertasi atau penelitian) dan nilai yang akan dicari; (2). Kalimat yang memiliki datatype properties (dtp) atau object properties (obp) lebih dari satu akan dinyatakan valid jika dtp atau

obp tidak mempunyai makna yang sama [14]. Selain pengukuran validitas, Mandala juga melakukan identifikasi pola kalimat pencarian untuk sistem temu kembali informasi. Pola kalimat pencarian tersebut, terdiri dari [14] :

1. Tipe 1 : Kkp + ctg + value.

Kalimat tipe 1 terdiri dari kata pencari + kata yang mengandung unsur category

pencarian + value pencarian.

2. Tipe 2 : Kkp + ctg + dtp + value.

pencarian + kata yang mengandung unsurdatatypepencarian + value pencarian;

3. Tipe 3 : Kkp + ctg +obp +value.

pencarian + kata yang mengandung unsurobject propertypencarian + value pencarian.

4. Tipe 4 : Kkp + ctg + dtp + value + obp + value

pencarian + kata yang mengandung unsur data property pencarian + value pencarian +

kata yang mengandung unsurobject propertypencarian + value pencarian.

5. Tipe 5 : Kkp + ctg + dtp + value + dtp + value

pencarian + kata yang mengandung unsur data property pencarian + value pencarian +

kata yang mengandung unsurdata propertypencarian + value pencarian.

6. Tipe 6 : Kkp + ctg + obp + value + obp + value.

pencarian + kata yang mengandung unsur object property pencarian + value pencarian +

kata yang mengandung unsurobject propertypencarian + value pencarian.

Proses pengolahan bahasa yang dilakukan terhadap kalimat yang diinputkan adalah: (1) proses tokenizing, yaitu memecah setiap kata yang menyusun suatu kalimat pencarian

yang diterima oleh sistem. Proses ini dilakukan dengan menggunakan algoritma yang dipublikasikan [15] yang mengandalkan karakter spasi pada kalimat untuk melakukan pemisahan kata. (2) Berbarengan dengan proses tokenizing, juga dilakukan proses filtering,

(9)

diabaikan oleh sistem dan tidak akan diproses lebih lanjut. Sebaliknya jika terdapat kata yang tidak termasuk didalam daftar stopword maka kata tersebut akan masuk pada proses berikutnya. (3) Selanjutnya adalah Prosesstemming yang pada dasarnya adalah proses untuk

mencari root dari sebuah kata. Pencarian root sebuah kata atau biasa disebut dengan kata dasar dapat memperkecil hasil indeks tanpa harus menghilangkan makna. Beberapa term hasil stemming bisa jadi berupa kata standar pencarian. Kata standar pencarian (keyword)

merupakan kata-kata yang digunakan sebagai standar acuan dalam pembentukan sebuah kalimat dan disimpan dalam sebuah kelas pada ontologi. Karenanya pada proses ini dilakukan pengecekan term terhadap sebuah daftar keyword yang tersimpan pada ontologi.

(4) Setelah kalimat terpotong-potong dan dirubah menjadi kata dasarnya, maka kalimat tersebut dapat dicek validitas dan tipe kalimatnya berdasarkan skema yang dipublikasikan oleh [14]. Kalimat yang invalid akan ditolak oleh sistem dan ditampilkan sebagai kalimat yang tidak valid.

Hasil dari keempat proses pengolahan kalimat perintah secara linguistik/bahasa di atas, dilanjutkan dengan proses pembentukan representasi query dengan menggunakan

SWRL. Aturan SWRL yang dibentuk adalah aturan dasar dalam format query SWRL untuk

retrieveinformasi sesuai dengan parameter yang diberikan.

ctg OntologyETD:title(?f, ?t) ∧ OntologyETD:author(?f, ?a) ∧

OntologyETD:department(?a, ?d) ∧ OntologyETD:programmeName(?d, ?dp) ∧ OntologyETD:sinopsis(?f, ?s) ∧ OntologyETD:fullName(?a, ?af) ∧

OntologyETD:hasKeyword(?f, ?kw) ∧ OntologyETD:keyword(?kw, ?k) ∧ OntologyETD:adviser(?f, ?adv) ∧ OntologyETD:fullName(?adv, ?advf) filter → sqwrl:select(?f, ?t, ?af, ?dp, ?s, ?k, ?advf)

Gambar 4. Aturan dasar query SWRL

Aturan dasar query SWRL yang ditunjukkan pada Gambar 4, pada prinsipnya adalah template untuk inisiasi semua properti ontologi yang kemudian di-generate

berdasarkan parameter yang diinputkan oleh user. Query SWRL yang telah di-generate,

kemudian dieksekusi oleh mesin SWRL untuk selanjutnya melakukan pencarian pada file ontologi ETD.

Perancangan Sistem

Pengujian dilakukan dengan tujuan untuk mengetahui tingkat keberhasilan sistem yang dibangun. Menurut Mandala [14] pengujian dilakukan dengan cara memberikan penilaian terhadap komponen berikut: a) Apakah sistem mampu mengenali validitas kalimat dengan tepat dan mampu merubah kalimat pencarian menjadi representasi kalimat sebelum query? (b) Apakah sistem mampu mengenali value kunci dengan tepat? (c) Apakah sistem mampu menentukan statement query dengan tepat? (d) Apakah sistem mampu menghasilkan informasi yang tepat untuk setiap kalimat pencarian yang dimasukkan?

(10)

pencarian pada metode semantic search. Sedangkan Tabel 2 memperlihatkan hasil pengujian

kalimat pencarian pada metodesemantic search.

Gambar 5. Pengujian semantic search dengan pola kalimat a.1

Tabel 2. Pengujian kalimat pencarian pada metodesemantic search

No Kalimat pencarian

Komponen pengujian : Apakah sistem mampu Mengenali

validitas kalimat

Mengenali value kunci

Menentukan statement query

Menghasilkan informasi yang tepat a1 Cari buku sistem √ √ √ √ a2 Tampilkan tugas akhir

analisa keputusan √ √ √ √ a3 Carikan tugas akhir

analisis keputusan √ √ √ √ b1 Cari buku dengan tema

semantic web √ √ √ √ b2 Cari publikasi dosen

dengan topik semantik web

√ √ √ √

b3 Cari tugas akhir dengan

bahasan web semantik √ √ √ √ b4 Cari tugas akhir dengan

judul web semantic √ √ √ √ b5 Cari buku yang

membahas semantic web √ √ √ √ b6 Cari tugas akhir yang

berhubungan dengan semantic web

√ √ √ √

b7 Cari tugas akhir yang

(11)

(12)

Komponen pengujian : Apakah sistem mampu Mengenali

Hasil pengujian menunjukkan bahwa sistem mampu: (1) mengenali validitas kalimat dengan tepat, (2) mampu merubah kalimat pencarian menjadi representasi kalimat sebelum query, (3) mampu mengenali value kunci dengan tepat, (4) mampu menentukan statement query dengan tepat dan (5) mampu menghasilkan informasi yang tepat untuk setiap kalimat pencarian yang dimasukkan.

Pengujian sistem temu kembali informasi

[16] mengatakan bahwa untuk mengukur efektifitas sistem temu kembali informasi terdapat dua rasio umum yang biasa dipergunakan, yaitu precision (ukuran kemampuan

sebuah sistem untuk menampilkan hanya dokumen yang relevan) dan recall (ukuran

kemampuan sistem untuk menampilkan seluruh dokumen yang relevan). Untuk mengukur rasio precision dan recall, maka perlu mengetahui jumlah dokumen relevan terhadap suatu

kata kunci (keyword) yang tersimpan pada ontologi. Kemudian dilakukan pengujian

berdasarkan kata kunci tersebut dan dihitung jumlah dokumen yang dikembalikan dan jumlah dokumen yang dikembalikan yang relevan terhadap kata kunci yang dicari. Tabel 3 memperlihatkan hasil pengujian tersebut.

Tabel 3. Inisiasi kata kunci (keyword) pada dokumen yang tersimpan

No Kata kunci ∑ dokumen

1 Analisa keputusan 1 1 1

2 Analisis keputusan 1 1 1

(13)

Dari Tabel 3 tersebut, maka dapat dihitung rasio precision dan rasio recall untuk setiap kata kunci, seperti:

Selanjutnya hasil perhitungan rasio precision dan recall ditampilkan pada Tabel 4. Tabel 4 Tabel perhitungan rasioprecisiondanrecall

No Kata kunci pencarian rasioprecision Rasiorecall

1 Analisa keputusan 100% 100%

2 Analisis keputusan 100% 100%

3 Semantic 100% 100%

4 Semantik 100% 100%

5 Semantic web 100% 100%

6 Semantik web 100% 100%

7 Web semantik 100% 100%

8 Web 100% 100%

Pada tabel 4 terlihat bahwa hasil perhitungan rasio precision untuk setiap kata kunci

adalah 100%. Begitupun untuk hasil perhitungan rasio recall. Dengan demikian, merujuk

pada pernyataan Harrod dan Prytherch dalam [17] yang mengatakan “bahwa suatu sistem temu balik informasi dapat dikatakan efektif apabila rasio recalldan precision sama besarnya

(1:1)”, maka sistem semantic search yang dikembangkan pada penelitian ini dapat dikatakan

efektif.

KESIMPULAN

Berdasarkan hasil penelitian yang telah dilakukan dapat disimpulkan:

1. Model ontologi dapat digunakan untuk menyimpan data dan metadata dokumendigital librarydan membantu meningkatkan efektivitas hasil pencarian.

2. Dari hasil pengujian dengan menginputkan sejumlah kalimat perintah pencarian, sistem mengenali kalimat perintah yang diinputkan dan memberikan informasi yang relevan maknanya terhadap yang diinginkanuser.

3. Aturan pengolahan bahasa dan aturan query yang diimplementasikan memberikan hasil perhitungan rasio precision dan rasio recall pada setiap pengujian kata kunci yang sama besar yaitu 100%, yang berarti sistem dapat dikatakan efektif.

SARAN

(14)

ditambahkan suatu metode/mekanisme berupa koreksi otomatis sebagai alternatif perbaikan kesalahan, jika kalimat yang dimasukkan tidak valid.

DAFTAR PUSTAKA

[1] Al-Kalani, F., Awad, M.G., dan Hani, N.B., 2010, Semantic Web: Improving Search Using RDF Instead of XML, Global Journal of Computer Science and Technology, Vol. 10

Issue 15, Hal 23-26.

[2] Davies, J., Fensel, D., dan van Harmelen, F., 2002, Towards the Semantic web -Ontology-Driven Knowledge Management, John Wiles and Sons, Ltd, Chichester.

[3] Berners-Lee, T., 2001., TheSemantic web., The Scientific American.

[4] Wibisono, S., 2010, Aplikasi Pengolah Bahasa Alami untuk query Basisdata Akademik dengan format data XML,Tesis,Universitas Gadjah Mada.

[5] Hui-fang, Q., 2009, Construction of University Digital library Resources under the

Network Environment, IEEE Computer Society Proceedings of International Conference on Networking and Digital Society, hlm. 12-15.

[6] Kruk, S.R., Zimmerman, K., dan Sapkota, B., No Date, Semantically Enhanced Search Services in Digital Libraries, Digital Enterprise Research Institute, Deri Galway, Ireland. [7] Sloni, D.K., dan Mahawar, N.K., 2010, Design a Customize Search Engine: Semantic

Web, International Journal of Soft Computing and Engineering (IJSCE), Vol. I.

[8] Unni, M., dan Baskaran, K., 2011, Overview of Approaches to Semantic Web Search,

International Journal of Computer Science and Communication (IJCSC), No. 2, Vol. 2, Hal

345-349.

[9] Strzalkowski, T., Carballo, J.P., Karlgren, J., Hulth, A., Tapanainen, P., dan Lahtinen, T.,

1999, Natural Language Information Retrieval,

http://trec.nist.gov/pubs/trec8/papers/ge8adhoc2.pdf, diakses tanggal 26 Maret 2012.

[10] Nurkhamid, 2009, Aplikasi bibliografi perpustakaan berbasis teknologi semantic web,

Tesis, Universitas Gadjah Mada.

[11] Noy, N.F., dan McGuinness, D.L., 2001, Ontologi Development 101 : A Guide to Creating Your First Ontologi, http://protege.stanford.edu/publications/ontologi_development/ ,

diakses pada tanggal 7 Februari 2012.

(15)

[13] Liddy, E.D., 2001, Natural Language Processing, In Enclopedia of Library and Information Science-2nd Edition, Marcel Decker Inc., NY., USA.

[14] Mandala, R., 1999, Temu Kembali Informasi dengan Bantuan Analisis Linguistik,

Proceeding of Information Processing and Management.

[15] Tala, Z., 2003, A Study of Stemming Effect on Information Retrieval in Bahasa Indonesia, Theses, Institute for Logic, Language and Computation, Universiteit van Amsterdam, The Nedherlands.

[16] Grossman, D. A. dan Frieder, O., 2004, Information Retrieval : Algorithms and Heuristics,

Springer.

[17] Mustangimah, 1998, Efektifitas system temu kembali informasi dan analisis bibliometrik: aplikasi pada dokumen bidang nuklir berbahasa Indonesia, Tesis,