• Tidak ada hasil yang ditemukan

BAB 2 TINJAUAN PUSTAKA - Penerapan Metode Semantic Search Dalam Mencari Relasi Kata Yang Terdapat Pada Al-Qur’an Terjemahan Bahasa Indonesia

N/A
N/A
Protected

Academic year: 2019

Membagikan "BAB 2 TINJAUAN PUSTAKA - Penerapan Metode Semantic Search Dalam Mencari Relasi Kata Yang Terdapat Pada Al-Qur’an Terjemahan Bahasa Indonesia"

Copied!
9
0
0

Teks penuh

(1)

2.1. Pencarian

Pencarian adalah proses untuk menemukan suatu informasi yang kita butuhkan. Misalnya, kita ingin mencari sebuah kata didalam dokumen digital yang kita miliki. Kita dapat mencarinya dengan beberapa cara misalnya dengan cara yang paling lambat yaitu membaca dokumen tersebut secara perlahan agar lebih teliti dalam menemukan kata yang ingin kita cari. Atau dengan cara yang lebih cepat namun akan mengurangi ketelitian dalam menemukan kata yang kita cari dengan memanfaatkan fitur pencarian yang telah disediakan di komputer.

Kedua cara tersebut memiliki kelebihan dan kekurangan. Pada cara yang pertama, kelebihan yang akan kita dapatkan adalah kita lebih teliti dalam mencari kata yang ingin kita temukan dan sebagai hasilnya kita dapat menemukan kata yang kita cari atau menemukan kata yang berkaitan maknanya dengan kata yang kita cari. Dengan demikian, kita tetap menemukan kata yang dicari walaupun dalam bentuk penulisan yang berbeda. Kekurangannya adalah kita akan membutuhkan waktu yang lama untuk menemukannya.

Cara kedua juga demikian, ada kelebihan dan kekurangannya. Kelebihannya, waktu yang digunakan jauh lebih singkat dan ketepatan hasil pencariannya pun baik. Akan tetapi, jika tidak ditemukan kata yang serupa dengan kata yang kita inputkan maka hasilnya tidak ada. Sehingga, komputer akan memberitahukan bahwa kata yang kita cari tidak ada didalam dokumen tersebut. Kurangnya ketelitian dari sistem pencarian tersebut merupakan penyebabnya dan hal tersebut akan menjadi masalah bagi para pengguna.

(2)

2.2. Semantic Search

Semantic atau dalam Bahasa Indonesia semantik, adalah ilmu tentang makna kata dan

kalimat; pengetahuan mengenai seluk-beluk dan pergeseran arti kata; bagian struktur bahasa yang berhubungan dengan makna ungkapan atau struktur makna suatu wicara. Tujuan pencarian semantik adalah mencari konten yang sesuai dengan konteks yang diinginkan pengguna (Rahutomo, 2009).

Ada dua jenis pencarian semantik menurut Pollock (2009). Jenis yang pertama adalah pencarian semantik dengan memberikan hasil berupa navigasi. Pengguna menggunakan mesin pencari sebagai alat navigasi untuk mengarahkan ke dokumen yang diinginkan. Navigasi ini dapat berupa link. Jenis yang kedua adalah dengan memasukkan frase atau kalimat yang menunjukkan keinginan pengguna untuk mendapatkan informasi. Pada jenis yang kedua ini, pengguna akan mendapatkan keseluruhan dokumen yang akan memberikan informasi secara lengkap. Intinya, pencarian semantik memberikan saran bagi pengguna berdasarkan penarikan kesimpulan yang dilakukan oleh sistem berdasarkan batasan-batasan tertentu (Sarno, et al. 2012).

Untuk mendukung proses pencarian semantik maka diperlukan pemodelan data yang bisa digunakan ulang (Pollock, 2009). Bentuk pemodelan data yang mendukung proses pencarian semantic antara lain weighted tree similarity, ontologi, dan weighted directed acyclic graph. Dan pemodelan data yang akan penulis gunakan pada penelitian ini adalah ontologi. Ontologi ini tersusun berdasarkan konsep triple yang menggunakan property sebagai penghubung (relasi) antar data yang tersusun di dalamnya. Di dalam property itulah nantinya diinputkan pengetahuan kepada sistem apakah antar kata tersebut berelasi atau tidak.

2.2.1. Perbedaan semantic search dengan semantic web

(3)

2.2.2. Tujuan semantic search

Tujuan utama dari semantic search adalah untuk menyediakan dokumen web yang paling relevan kepada para pengguna sesuai dengan query yang mereka gunakan dengan menggunakan domain ontologi yang spesifik (Mustapha et al. 2010).

2.2.3. Semantic search processing

Pada prosesnya, semantic search melakukan pencarian dengan cara mencocokkan query yang tepat dan hubungannya diantara kata kunci dalam otologi. Karena user

lebih suka hasil yang meliputi semua kata kunci (Lee et al. 2009).

Semantic search meningkatkan metode information retrieval (IR) konvensional dengan melihat pada perspektif yang berbeda seperti, arti kata yang dapat diformalkan dan diproses pada mesin yang menggunakan bahasa ontologi seperti RDF (Resource Description Framework) dan OWL (Ontology Web Language) (Wei et al. 2008). Semantic search framework dapat dilihat pada gambar 2.1.

(4)

2.3. Resource Description Framework

RDF (Resource Description Framework) adalah sebuah aplikasi dari XML yang memungkinkan penyusunan suatu resource description yang kaya, terstruktur, dan dapat dibaca oleh mesin (Trust, 2008). RDF merupakan sebuah framework untuk menjelaskan suatu halaman web. RDF memungkinkan pengembang web untuk membuat statement terhadap resources yang ada dari sebuah web (Daum, 2003). RDF statement memiliki struktur yang sederhana. Tiap statement memiliki bentuk yang

disebut triple yang terdiri dari predicate, subject, dan object (Daum, 2003). Contohnya, dalam sebuah kalimat “John has phone number 777-717-0077”, subjeknya adalah “John”, predikatnya adalah “has phone number”, dan objeknya adalah “ 415-555-6789”. Semua statement dalam RDF memiliki bentuk yaitu Subject has property. Pada contoh statement sebelumnya, property-nya adalah “phone number”. Property memiliki dua tipe, yaitu object property dan literal. Object property adalah sebuah objek dari suatu statement yang dapat mengarahkan/mereferensikan kepada resources yang lain. Literal adalah objek dari suatu stement yang bernilai string. Berikut ini adalah anatomi dari sebuh RDF statement yang dapat dilihat pada gambar 2.2.

Gambar 2.2 Anatomi dari sebuah RDF statement

2.3.1. RDF/XML

RDF/XML merupakan salah satu bahasa ontologi. RDF/XML adalah sintaks yang digunakan untuk mengekspresikan RDF graph sebagai sebuah dokumen XML. Pada gambar 2.3 dapat dilihat contoh RDF statement yang ditulis dengan sintaks RDF/XML.

(5)

Dari gambar 2.3 dapat dilihat bahwa struktur penulisan RDF statement mengikuti struktur penulisan pada dokumen XML. Tag (contoh: <p:PhoneNo>) menunjukkan nama property sedangkan nilai dari property dinyatakan sebagai konten elemen (contoh: 415-55-6789).

2.3.2. Hubungan data dalam dokumen RDF

Resource description framework merupakan sebuah bahasa untuk merepresentasikan

informasi tentang resource yang ada di dunia (Yu, 2011). RDF juga merupakan model berbentuk graf untuk merepresentasikan resource dan relasinya. Resource yang direpresentasikan adalah seluruh pengetahuan manusia yang kemudian dimodelkan kedalam bentuk subyek, predikat, dan objek. Statement RDF berupa triple, yaitu subject, predicate, object (Manola et al, 2004). Contoh: Ari Rifki is the author of the

resource http://tugas-akhir.com/semantic-search/. Kalimat tersebut memiliki beberapa

bagian seperti:

Gambar 2.4 Contoh statement RDF

Kita dapat melihat bahwa pola subyek, predikat, dan objek yang dibentuk hampir sama dengan pembentukan pola kalimat dalam bidang ilmu linguistik. Dimana sebuah kalimat terdiri dari subyek, predikat, dan objek. Namun, pada konsep triple ini tidak ada yang namanya keterangan waktu, tempat, dsb. Subyek dan objek pada konsep triple merupakan entitas fisik (nyata). Sedangkan predikat pada konsep tersebut

merupakan entitas virtual (tidak nyata) seperti sebuah relasi yang menyatakan adanya hubungan namun tidak dapat dipegang/disentuh. Sehingga dapat digambarkan sebagai berikut:

http://tugas-akhir.com/semantic-search/ Author Ari Rifki

(6)

Agar RDF dapat dipahami oleh computer maka diperlukan sebuah identifier. Nantinya identifier ini akan diberikan pada entitas yang memiliki informasi yang saling berkaitan. Bentuk identifier pada RDF adalah URI (uniform resource identifier) yang merupakan sebuah string yang mirip dengan URL (uniform resource locator). URI & URL sama-sama berfungsi untuk mengarahkan user ke suatu alamat (resource) di internet yang memiliki informasi yang dicari .

Setiap resource yaitu subyek, predikat, dan objek akan diberikan sebuah URI. Tetapi khusus untuk objek, identifier-nya dapat berupa URI atau literal. Karena terkadang informasi yang terkandung pada resource objek merupakan sebuah/beberapa kata (string) yang tidak mengarahkan ke alamat resource lain. Walaupun URI berbentuk seperti URL dan mengarahkan ke suatu alamat resource di internet, alamat URI tidak benar-benar harus ada di internet. Meskipun demikian, URI tersebut tetap valid.

URI yang diberikan kepada resource sering sering kali sangat panjang sehingga jika terus dipergunakan berulang-ulang akan sangat tidak efisien. Maka dari itu URI tersebut haruslah kita buat lebih singkat (padat). URI yang dipadatkan disebut compact URI. Cara memadatkan URI adalah dengan menggunakan XML namespace.

XML namespace ini adalah sebuah referensi yang digunakan untuk mengarahkan kesebuah prefix tertentu.

2.4. RDFS (Resource Description Framework Schema)

RDF schema adalah satu set semantik yang didefinisikan dalam sebuah namespace untuk digunakan dengan model data RDF yang spesifik (Trust, 2008). RDF schema menyediakan kosakata pemodelan data (data-modelling vocabulary) untuk data RDF (http://www.w3.org/TR/rdf-schema/).

(7)

2.5. RDF API for PHP (RAP)

RAP atau RDF API for PHP adalah sebuah semantic web toolkit untuk para pengembang PHP (Oldakowski, et al. 2004). RAP diawali sebagai proyek open source oleh Freie Universitat Berlin pada 2002 dan telah mengalami perkembangan di komunitas web semantik. Inti dari RAP meliputi dua implementasi atas penyimpanan statement, yaitu apakah menyimpan graph RDF dalam memory sistem maupun dalam

database relational (Awaludin, 2009).

2.6. SPARQL (Simple Protocol and RDF Query Language)

Model data RDF berupa suatu statement dalam bentuk triple yang terdiri dari subyek, prdikat, objek. Untuk mendapatkan informasi dari suatu graph RDF dibutuhkn suatu query. SPARQL adalah query untuk RDF/OWL, query ini digunakan untuk

mengambil data yang ditulis dengan menggunakan RDF/OWL atau XML. Query ini menggunakan URI (Universal Resource Identifier) untuk me-reatrive struktur RDF/OWL. SPARQL memungkinkan untuk melakukan beberapa hal yaitu, mengambil nilai dari data yang terstruktur maupun data yang semi terstruktur, mengembangkan data dengan melakukan query terhadap suatu relasi yang tidak diketahui, melakukan query operasi join yang kompleks pada database yang berlainan secara lebih sederhana, dan mengubah suatu data RDF menjadi vocabulary yang lain. Hasil dari query SPARQL dapat mengembalikan nilai dalam beberapa format data yang antara lain: XML, RDF, dan HTML (Awaludin, 2009). Berikut ini adalah contoh sederhana dari SPARQL:

 Data:

<http:://example.org/book/book1>

<http://purl.org/dc/elements/1.1/title> “SPARQL Tutorial”

 Query:

SELECT ?title WHERE {

<http://example.org/book/book1>

(8)

 Hasil:

title

“SPARQL Tutorial”

Variable SPARQL dimulai dengan tanda “?” dan merupakan suatu node (resource atau literal) dalam RDF triple. Sedangkan pernyataan “SELECT” mengembalikan suatu tabel dari variable dan nilai dideskripsikan dalam query (Awaludin, 2009).

2.7. Penelitian Terdahulu

Pembuatan fitur pencarian pada ayat-ayat Al-Qur’an sudah banyak dibuat. Namun, beberapa masih menggunakan metode pencarian berbasis teks (text based) artinya pencarian yang dilakukan hanya berdasarkan kata yang diinputkan. Jika terjadi kesalahan input atau kata tersebut memang tidak ada didalam dokumen, maka tidak ada hasil yang ditampilkan kepada pengguna.

Herdianto (2010) telah berhasil membuat sistem untuk pencarian ayat-ayat

Al-Qur’an dengan memanfaatkan metode korelasi sehingga pengguna dapat mengajukan

pertanyaan yang kemudian sistem akan menganalisa tiap kata yang ada pada pertanyaan tersebut dan memberikan sebuah jawaban. Dan dari jawaban tersebut ditampilkan ayat-ayat yang menjawab pertanyaan yang diinputkan oleh pengguna (user).

Ridwan (2010) telah berhasil membuat sebuah sistem pencarian ayat-ayat

Al-Qur’an dengan tiga cara yaitu mencari terjemahan ayat berdasarkan juz, surat, dan kata.

Istiadi (2012) telah menghasilkan sebuah mesin pencari (Lafzi) ayat Al-Qur’an yang mampu melakukan pencarian ayat berdasarkan lafaz yang diingat oleh pengguna (user) dengan penulisan aksara latin. Contohnya, user mengingat ada kata “jannah” di dalam Al-Qur’an, maka ia hanya perlu mengetikkan kata tersebut dalam bentuk penulisan aksara latin pada form input di Lafzi dan kemudian akan memberikan hasil berupa ayat Al-Qur’an dalam bahasa Arab dengan Lafaz yang mirip dengan lafal kata

(9)

Tabel 2.1 Penelitian terdahulu

Nama (tahun) Penelitian Teknik

Herdianto (2010) Pencarian ayat-ayat

Al-Qur’an berdasarkan

konten menggunakan text mining berbasis aplikasi

desktop.

Menggabungkan text mining dengan metode korelasi.

Ridwan (2010)

Istiadi (2012)

Learning and searching

terjemahan ayat-ayat

Al-Qur’an.

Sistem Pencarian Ayat

Al-Qur’an Berbasis

Kemiripan Fonetis

Membuat aplikasi Al-Qur’an berbasis web yang mudah dimengerti oleh pengguna (user-friendly) yang ingin belajar dan mencari terjemahan ayat Al-Qur’an.

Gambar

Gambar 2.1 A semantic search framework (Wei, et al. 2008)
Gambar 2.2 Anatomi dari sebuah RDF statement
Tabel 2.1 Penelitian terdahulu

Referensi

Dokumen terkait