• Tidak ada hasil yang ditemukan

Implementasi Sistem Temu Kembali Informasi Studi Kasus: Dokumen Teks Berbahasa Indonesia

N/A
N/A
Protected

Academic year: 2021

Membagikan "Implementasi Sistem Temu Kembali Informasi Studi Kasus: Dokumen Teks Berbahasa Indonesia"

Copied!
10
0
0

Teks penuh

(1)

JURNAL TRANSFORMATIKA, Volume 10, No.1, Juli 2012 : 1 – 10 1

I M PLEM EN TASI SI STEM TEM U KEM BALI I N FORM ASI

St u d i Ka su s: D o k u m e n Te k s Be r b a h a sa I n d o n e sia

( I MPLEMENTATI ON OF I NFORMATI ON RETRI EVAL SYSTEM

Case St udy: Text Docum ent in I ndonesian Language) Bernadus Very Christioko

Fakultas Teknologi Informasi dan Komunikasi, Universitas Semarang Abstract

Storage of digital documents is growing rapidly with increasing use of computers. These conditions raise issues to access the desired information quickly and accurately and also the difficulty in finding a document relating to a particular keyword with the precise and accurate results. The purpose of this paper is to compile a collection of documents as part of the testing device information retrieval systems for text documents in Indonesian language and compiled a collection of indexes from the collection of documents and build a search engine to help to search documents using information retrieval methods / Information Retrieval System (IRS ). The method used was to build a system with two main parts, namely subsystem Indexing and Searching Subsystem (matching system). The results show that the method the IRS can assist in conducting a search for documents in a collection by the number of one or more keywords or a combined using Boolean functions.

Keyword : Information Retrieval System, Search Engine 1. PENDAHULUAN

Penyimpanan dokumen secara digital berkembang dengan pesat seiring meningkatnya penggunaan komputer. Kondisi tersebut memunculkan masalah untuk mengakses informasi yang diinginkan secara akurat dan cepat. Oleh karena itu, walaupun sebagian besar dokumen digital tersimpan dalam bentuk teks dan berbagai algoritma yang efisien untuk pencarian teks telah dikembangkan, kesulitan menemukan suatu dokumen yang berhubungan dengan suatu kata kunci tertentu dengan hasil yang tepat dan akurat masih terjadi. Pencarian terhadap seluruh isi dokumen yang tersimpan bukanlah solusi yang tepat mengingat pertumbuhan ukuran data yang tersimpan umumnya.Temu kembali informasi bertujuan untuk membantu pengguna dalam menemukan informasi yang relevan dengan kebutuhan mereka dalam waktu singkat. Akan tetapi banyak teknik-teknik tersebut yang tergantung pada bahasa yang digunakan dalam dokumen. Untuk mengembangkan teknik-teknik temu kembali

informasi bagi dokumen teks berbahasa Indonesia, dibutuhkan perangkat pengujian untuk Bahasa Indonesia. Salah satunya adalah suatu koleksi dokumen dalam Bahasa Indonesia sebagai pendekatan seragam dalam evaluasi sistem temu kembali informasi.

Sistem temu kembali informasi atau Information Retrieval System (IRS) mempunyai tujuan memberitahukan keberadaan (atau ketidakberadaan) dan keterangan dokumen-dokumen yang berhubungan dengan permintaan dari pengguna bukan memberitahu mengenai masalah yang ditanyakan. Alasan utamanya adalah karena IRS menangani teks bahasa alami yang tidak selalu terstruktur dengan baik dan bersifat ambigu. IRS bekerja berdasarkan kueri yang diberikan pengguna yang kemudian menghasilkan daftar dokumen yang dianggap relevan dengan 2 bagian utama, yaitu Indexing subsystem, dan Searching subsystem (matching system).

Tujuan dari tulisan ini adalah untuk menyusun koleksi dokumen sebagai bagian

(2)

2 Implementasi Sistem Temu Kembali Informasi … (B. Very C) perangkat pengujian sistem temu kembali

informasi untuk dokumen teks berbahasa Indonesia dan menyusun kumpulan indeks dari koleksi dokumen dan membangun mesin pencari untuk membantu melakukan pencarian dokumen menggunakan metode Sistem Temu Kembali Informasi.

2. METODE PENELITIAN

Dalam menerapkan metode sistem temu kembali informasi untuk koleksi dokumen berbahasa indonesia dengan membangun 2 bagian utama, yaitu Indexing subsystem, dan Searching subsystem (matching system)dilakukan beberapa tahapan penelitian berikut ini.

2.1. Kata buangan / stop list

Pada tahapan ini, sebelum melakukan upload dokumen dan parsing dokumen, terlebih dahulu menentukan daftar kata-kata buangan yang akan digunakan sebagai penyaring indeks. Setelah kata-kata buangan didefinisikan, parsing dokumen dapat dilakukan dengan melakukan upload dokumen menggunakan upload engine.

2.2. Koleksi Dokumen

Untuk melakukan implementasi system temu kembali diperlukan sebuah koleksi dokumen yang terdiri dari kumpulan-kumpulan jurnal atau paper yang mempunyai topic yang sama. Oleh karena itu, dalam tahap ini, pengumpulan dokumen dilakukan sebanyak 10 (sepuluh) dokumen dengan topic E-Learning, E-Government, Teknologi Informasi dengan format dokumen berekstensi .doc (Microsoft Word ).

File-file dokumen yang telah dikumpulkan akan diindeks berdasarkan judul dan abstrak dengan cara mengupload dokumen ke server database menggunakan upload engine menggunakan bahasa pemrograman PHP dan database MySQL.

2.3. Parsing Dokumen

Dalam proses upload dokumen ke server menggunakan upload engine, judul dan abstrak akan diparsing dengan membuang kata-kata buangan (stop list) yang tidak perlu untuk dijadikan sebagai indeks, sehingga setiap kata dari judul dan abstrak yang menjadi indeks akan tersimpan dalam database di MySQL.

2.4. Data / Indeks

Hasil dari tahap parsing dokumen adalah daftar indeks dari setiap dokumen yang terdapat dalam koleksi dokumen. Daftar indeks sudah terbebas dari kata-kata buangan (stop list), daftar indeks inilah yang akan menjadi acuan dalam melakukan pencarian informasi dengan menggunakan kata kunci pencarian yang akan dicocokkan dengan daftar indeks yang ada.

2.5. Matriks Dokumen Indeks

Matriks dokumen indeks diperoleh dari hasil indeks dan dokumen dengan mengukur frekuensi kemunculan suatu indeks dalam setiap dokumen.

2.6. Query Dokumen

Query terhadap dokumen dilakukan dengan menggunakan kata kunci pencarian untuk melakukan pengujian dari koleksi indeks yang telah terbentuk pada proses parsing dokumen. Untuk melakukan query dibangun sebuah mesin pencari dengan menerima input berupa kata kunci tunggal maupun ganda ( gabungan dengan fungsi Boolean AND dan OR).

3. HASIL DAN PEMBAHASAN 3.1. Kata buangan / stop list

Kata-kata buangan yang telah ditentukan diupload ke database server MySQL untuk disimpan ke dalam table ‘Common’ menggunakan modul ‘Upload Kata Buangan’ . Table ‘common’ mempunyai struktur sebagai berikut : Tabel 1.Tabel Common

(3)

JURNAL TRANSFORMATIKA, Volume 10, No.1, Juli 2012 : 1 – 10 3 Tampilan dari modul ‘Upload Kata Buangan’ seperti gambar di bawah ini :

Gambar 3. Upload Kata Buangan

Setelah kata-kata buangan terupload, dapat dilihat melalui modul ‘List Kata Buangan’, seperti gambar berikut :

Gambar 4. List Kata Buangan 3.2. Koleksi Dokumen

Sepuluh dokumen yang telah disiapkan kemudian diupload ke server menggunakan modul ‘Upload Dokumen’, berupa form isian judul dan abstrak dari setiap dokumen yang

ada. Dokumen secara otomatis akan tersaring dari kata-kata buangan yang sudah ditentukan sebelumnya dan disimpan ke dalam table ‘content’, ‘keytable’, dan ‘link’. Struktur dari ketiga table sebagai berikut:

(4)

4 Implementasi Sistem Temu Kembali Informasi … (B. Very C) Tabel 2. Tabel Content

Tabel 3. Tabel Keytable

Tabel 4. Table Link

Tampilan dari modul ‘Upload Dokumen’ seperti gambar di bawah ini :

Gambar 5. Upload Dokumen

(5)

JURNAL TRANSFORMATIKA, Volume 10, No.1, Juli 2012 : 1 – 10 5 Gambar 6. List Dokumen

3.3. Hasil Indexing

Setelah seluruh koleksi dokumen terupload, indeks dokumen sudah terbentuk. Indeks

dapat dilihat pada modul ‘indeks-dokumen’, seperti gambar di bawah ini :

(6)

6 3.4. M Matriks dapat kemun atriks Dokum s dokumen an dilihat pada culan suatu Imp men Indeks ntara dokume modul ‘matrik u indeks da Ga plementasi S Gambar 8. in en dan indek ks’. Frekuens alam koleks ambar 9. Matr Sistem Temu ndeks Dokum s si si dokumen jumlah in seperti riks Dokumen u Kembali In men 2 n ditunjukka ndeks dalam gambar n Indeks nformasi … ( an dengan suatu dokum di bawah (B. Very C) banyaknya men tertentu, h ini :

(7)

JURNA 3.5. Ha Untuk gamba Pengu Penguj dokum pencar AL TRANSF asil Query melakukan uj ar di bawah ini ujian 1: jian pertam en dengan rian dengan FORMATIKA ji query diban i : a, dilakuka kata kunci n kata ku Gam A, Volume 10 ngun sebuah Gambar 10 n pencarian ‘sistem’. Dar unci ‘sistem mbar 11. Hasil 0, No.1, Juli mesin penca 0. Mesin Penc n ri m’ dihasilka kata kun ini Pencarian Pe 2012 : 1 – 1 ri yaitu modu cari n 6 dokume ci ‘sistem’. G engujian 1 10 ul ‘query boole n yang relev Gambar seper 7 ean’, seperti van dengan rti di bawah :

(8)

8 Pengu Penguj dokum pencar Pengu Penguj dokum Boolea pencar ujian 2: jian kedua en dengan rian dengan ujian 3: jian ketiga en dengan an ‘AND’ Æ ‘s rian dengan Imp , dilakukan kata kunci ‘i kata kunc Gam , dilakukan n menggun sistem AND i kata kunci plementasi S n pencarian informasi’.Dar ci ‘informas mbar 12. Hasil n pencarian akan fungs informasi’.Dar ‘sistem AND Sistem Temu n ri i’ dihasilka kata ku bawah in Pencarian Pe n si ri D informasi dengan k baik syst dokumen bawah in u Kembali In n 7 dokume nci ‘informas ni: engujian 2 i’ dihasilkan 6 kata kunci, d em dan inform n yang ditemu ni : nformasi … ( n yang relev si’. Gambar 6 dokumen y dimana kedua masi terkandu ukan. Gamba (B. Very C) van dengan seperti di ang relevan a kata kunci ung di setiap ar seperti di

(9)

JURNA Pengu Penguj dokum Boolea pencar AL TRANSF ujian 4: jian keempa en dengan an ‘OR’ Æ ‘ rian dengan FORMATIKA Gam at, dilakuka n menggun ‘sistem OR i kata kunci A, Volume 10 mbar 13. Hasil an pencarian akan fungs informasi’.Dar ‘sistem OR 0, No.1, Juli Pencarian Pe n si ri R informasi dengan k baik sys setiap d seperti di 2012 : 1 – 1 engujian 3 i’ dihasilkan 7 kata kunci, d stem atau in dokumen yan i bawah ini : 10 7 dokumen y dimana kedua nformasi terk ng ditemuka 9 ang relevan a kata kunci kandung di an. Gambar

(10)

10 4. KES Dari h dengan sistem memba memba dokum dimana membe satu mengg mengg dan OR 5. DAF Keraf, Nu Wibiso Ba (h SIMPULAN hasil penguj n menerapka temu k angun suatu antu dalam en dalam a pencarian erikan kata k atau lebi abungkan le unakan fungs R. FTAR PUSTA Goris. 1984 usa Indah. no, Yudi. 2 ahasa Indone ttp://yudiwbs. Imp Gam ian dapat d an konsep-k kembali info u mesin pe melakukan suatu kolek dapat dilak kunci dengan h atau ebih dari sat si Booleanyai AKA , Tata Baha 2008. Stop esia. .wordpress.co plementasi S mbar 14. Hasil dilihat bahwa konsep dalam formasi dan encari dapa n pencarian ksi dokumen ukan dengan jumlah kunc dapat juga tu kata kunc tu fungsi AND sa Indonesia words untu (Online) om/2008/07/2 Sistem Temu Pencarian Pe a m n at n n n ci a ci D a, k ). 3/sto diak Dharan, Sea (Onl diak Baeza-Ya Mod Wes Lancaste Retr Pres Liddy, E. Sea Adisanto Bah Efek Insti u Kembali In engujian 4 op-words-untu kses tanggal 9 M.Murali. 20 arch line).(http://ww kses tanggal 9 ates, R. & dern Informat sley.

er, F. & Warn rieval Today. ss, Arlington. . 2001. How rcher 9(5). Inf so, Julio.2004 hasa Indone ktivitas Tem itut Pertanian nformasi … ( uk-bahasa-ind 9 Agustus 201 003. Dynamic ww.phpbuilde 9 Agustus 201 Ribeiro-Neto tion Retrieva ner, A. 1993. . Information a Search Eng formation Tod 4. Corpus Dok esia untuk mu Kembali Bogor. (B. Very C) donesia/, 11) c Document Engine. er.com, 11) o, B. 1999. al. Addison-Information Resources gine Works. day, Inc. kumen Teks Pengujian Informasi.

Gambar

Gambar 3. Upload Kata Buangan
Tabel 3. Tabel Keytable
Gambar 7. indeks Dokumen 1

Referensi

Dokumen terkait

Penelitian ini menggunakan sensor flex sebagai pendekteksi gerak di setiap jari dan mengubah masukan sensor tersebut menjadi sebuah angka dan huruf yang ditampilkan pada

Berdasarkan hal tersebut, EF Samarinda telah menerapkan sistem CRM yang dibantu dengan penggunaan software ODIN yang bertujuan untuk mengenali profil dan kebutuhan

Penelitian terdahulu yang dilakukan oleh Leli Siregar pada Tahun 2011 dari Fakultas Ilmu Sosial dan Ilmu Politik Universitas Sumatera Utara (USU) yang berjudul pengaruh

5. Pekerjaan pembuatan rangka dinding dan pemasangan dinding pemisah; 6. Pekerjaan pemasangan listplank kayu dan list plafond. Pelaksana pembangunan gedung dan perumahan

Rodger [9]; Muin [7] mendefinisikan refleksi adalah proses mencerminkan pengetahuan atau informasi yang mengarah pada pengetahuan atau pengalaman yang dimiliki sebelumnya

a) Kecuali untuk yang disebutkan di bawah ini, penyediaan semua pekerja, bahan dan peralatan yang dibutuhkan untuk melaksanakan survei lapangan dengan baik, untuk

KPRI “Bina Tani” Kab Lombok Barat 624/BH/XXII Komp Kantor Bupati Lobar Giri Menang Gerung Koperasi Jasa Berkualitas 358.. Koperasi “Beriuk Sadar” Dsn Dopang Tengah Ds Dopang

Faktor-faktor yang mempengaruhi terjadinya bencana longsor lahan di Kecamatan Cikoneng adalah: 1) Lereng yang curam dengan kemiringan lebih dari 25%, 2) Jenis batuan