PERANCANGAN INFORMATION RETRIEVAL SYSTEM DENGAN METODE EXTENDED BOOLEAN DAN SAVOY

(1)

DENGAN METODE EXTENDED BOOLEAN DAN SAVOY

SKRIPSI

Oleh :

DELAVENIA LUIS

1145028

PROGRAM STUDI SISTEM INFORMASI

SEKOLAH TINGGI MANAJEMEN INFORMATIKA DAN KOMPUTER STMIK TIME

MEDAN 2015

(2)

i

Information Retrieval System digunakan untuk menemukan kembali informasi - informasi yang relevan terhadap kebutuhan pengguna dari suatu kumpulan informasi secara otomatis. Salah satu hal yang perlu diingat adalah bahwa informasi yang diproses terkandung dalam sebuah dokumen yang bersifat tekstual. Pengguna information retrieval system sangat bervariasi dengan kebutuhan informasi. Akan tetapi, yang menjadi masalah adalah bagaimana teknik mendapatkan informasi tersebut, teknik pengindeksan istilah, teknik pembobotan dokumen dan bagaimana memilih dokumen yang paling relevan sesuai dengan query yang diberikan. Metode penelitian yang digunakan adalah metode Waterfall. Dalam penelitian ini, yang dijelaskan adalah pengindeksan berdasarkan istilah indeks. Pemberian bobot dokumen dilakukan untuk mengetahui tingkat relevansi dokumen sesuai query yang diberikan dan akan dilakukan secara frekwensi dan rumus savoy. Kemudian, dokumen yang telah diindeks dan ditentukan bobotnya, untuk mendapatkan informasi (dokumen) yang dibutuhkan, dilakukan teknik boolean peringkat. Hasil penelitian ini adalah sebuah aplikasi information retrieval system yang dapat melakukan pencarian dokumen yang relevan dengan kata kunci yang dimasukkan.

(3)

ii

ABSTRACT

Information Retrieval System is used to retrieve information that is relevant to user needs automatically from a set of information. The information that will be processed are textual documents. The user could retrieve variants information according to the needs. Whereas, the problem is how to achieve those information, indexing technique, document weighted technique, and how to choose the relevant document according to the given query. This research aims to generate index and weight from a file that is needed in indexing process, find and determine file which is relevant to query given with savoy method. This research used Waterfall model. The result of this research is an application of information retrieval system that could be used to search relevant document with input keywords.

(4)

iii

Puji dan syukur penulis panjatkan kehadirat Tuhan Yang Maha Esa yang

telah memberikan hidayah-Nya sehingga penulis dapat menyelesaikan skripsi ini

dengan judul : “Perancangan Information Retrieval System dengan Metode

Extended Boolean dan Savoy”

Skripsi ini disusun untuk melengkapi persyaratan studi program Strata 1

(S-1) Sekolah Tinggi Manajemen Informatika Komputer (STMIK) TIME Medan.

Penulis menyadari bahwa dalam penulisan skripsi ini banyak menemukan

kesulitan-kesulitan dan kekurangan pada penulisan. Namun, berkat bantuan dan

dorongan dari berbagai pihak, akhirnya penulis dapat menyelesaikannya dengan

baik.

Oleh karena itu, dalam kesempatan ini penulis ingin mengucapkan terima

kasih yang sebesar-besarnya kepada :

1. Bapak Hendri, M.Kom, selaku Pembimbing I yang telah memberikan saran dan masukan, pendidikan serta bimbingan dalam penulisan skripsi

ini maupun pemrograman skripsi ini.

2. Bapak Huliman, M.Kom, selaku Pembimbing II yang telah memberikan saran dan masukan, pendidikan serta bimbingan dalam penulisan skripsi

ini.

3. Bapak Simon Kanggali, selaku Ketua Yayasan STMIK TIME Medan 4. Bapak Prof. Chainur Arrasyid, S. H. , selaku Ketua BPH STMIK TIME

(5)

iv

5. Bapak Prof. Harlem Marpaung, Ph. D, selaku Ketua STMIK TIME Medan 6. Bapak Jackri Hendrik, ST, M.Kom, selaku Pembantu Ketua I STMIK

TIME Medan

7. Ibu Feriani Astuti Tarigan, S. Kom, M.Kom, selaku Ketua Program Studi Sistem Informasi STMIK TIME Medan

8. Kepada staf perusahaan yang selama ini telah membantu penulis dalam menyelesaikan penulisan skripsi

9. Orangtua dan teman-teman mahasiswa serta seluruh dosen di STMIK TIME yang telah banyak memberikan dukungan dan saran untuk penulis

Penulis menyadari tanpa adanya dukungan dari teman-teman sekalian

semua ini tidak akan terwujud. Hanya dengan doa kepada Tuhan Yang Maha Esa

penulis memohon agar kebaikan dan bimbingan dari teman-teman semua dapat

dibalas dengan kebahagiaan dan kesehatan. Akhir kata, penulis mengucapkan

terimakasih sebesar-besarnya kepada semua pihak yang telah membantu terhadap

penyelesaian penulisan skripsi ini.

Medan, Mei 2015

Penulis,

(6)

v

ABSTRAK ... i

ABSTRACT... ii

KATA PENGANTAR ... iii

DAFTAR ISI ... v

DAFTAR GAMBAR ... vii

DAFTAR TABEL ... viii

DAFTAR LAMPIRAN ... ix

BAB I PENDAHULUAN ... 01 1.1. Latar Belakang Masalah ... 01 1.2. Identifikasi Masalah ... 02 1.3. Batasan Masalah ... 02 1.4. Tujuan dan Manfaat Penelitian ... 03 1.5. Sistematika Penulisan ... 04 BAB II LANDASAN TEORI ... 06 2.1. Perancangan ... 06 2.2. Sistem ... 06 2.3. Pencarian ... 7

2.4. Informasi ... 8

2.5. Metode ... 10

2.6. Information Retrieval System ... 10

2.7. Metode Extended Boolean ... 16

2.8. Metode Savoy ... 17

2.9. Bahasa Pemrograman ... 20

BAB III METODE PENELITIAN ... 22

3.1. Tempat dan Jadwal Penelitian ... 22

3.2. Kerangka Kerja ... 22

3.2.1. Metode Pengumpulan Data ... 23

3.2.2. Analisa Sistem ... 23

(7)

vi

3.2.5. Uji Coba Sistem ... 26

BAB IV ANALISIS DAN PERANCANGAN ... 27

4.1. Analisa ... 27

4.2. Perancangan ... 32

4.2.1. Perancangan Proses ... 32

4.2.2. Perancangan Tabel Pada Database ... 34

4.2.3. Perancangan Antarmuka ... 35

BAB V HASIL DAN PEMBAHASAN ... 41

5.1. Hasil ... 41

5.2. Pembahasan ... 46

BAB V1 KESIMPULAN DAN SARAN ... 50

6.1. Kesimpulan ... 50

6.2. Saran ... 51 DAFTAR PUSTAKA

(8)

vii

Gambar 2.1. Ilustrasi Sistem Temu Kembali ... 11

Gambar 2.2. Outline Information Retrieval System ... 14

Gambar 2.3. Komponen Information Retrieval System ... 15

Gambar 2.4. Interaksi anatara Pengguna dengan Sistem ... 16

Gambar 3.1. Kerangka Kerja Penelitian ... 22

Gambar 3.2. Flowchart Sistem Usulan ... 25

Gambar 4.1. Activity Diagram ... 33

Gambar 4.2. Use Case Diagram ... 34

Gambar 4.3. Rancangan Form Open ... 35

Gambar 4.4. Form Teori ... 36

Gambar 4.5. Form Input Data ... 37

Gambar 4.6. Form Proses ... 38

Gambar 4.7. Form Setting ... 39

Gambar 4.8. Form Tabel ... 40

Gambar 5.1. Tampilan Menu Utama... 41

Gambar 5.2. Tampilan Form Teori Information Retrieval System Halaman 1 dari 4 ... 42

Gambar 5.6. Tampilan Form Input Data ... 45

Gambar 5.7. Tampilan Form Kumpulan File ... 46

Gambar 5.8. Tampilan Form Proses ... 46

Gambar 5.9. Tampilan Form Open ... 47

(9)

viii

DAFTAR TABEL

Tabel 2.1. Teknik P-Norm ... 16 Tabel 3.1. Jadwal Penelitian ... 22 Tabel 4.1. Tabel Database ... 34

(10)

ix

Lampiran 1 : Daftar Riwayat Hidup Mahasiswa

Lampiran 2 : Surat Keputusan Dosen Pembimbing Skripsi

Lampiran 3 : Surat Keterangan dari Perusahaan

Lampiran 4 : Kartu Bimbingan Skripsi

(11)

1

BAB I

PENDAHULUAN

1.1. Latar Belakang Masalah

Semakin banyaknya data dan informasi saat ini menyebabkan masyarakat

mengalami kesulitan memperoleh informasi yang cepat, padat, dan relevan

dengan kebutuhannya. Untuk mengatasi hal tersebut, diperlukan suatu information

retrieval system yang dapat mengakses dan menyediakan berbagai informasi

sesuai kebutuhan pengguna. Saat ini, sumber informasi tersebut dapat diakses

secara elektronik melalui World Wide Web (WWW) ataupun internet dengan

menggunakan berbagai mesin penelusuran (search engine). Perbedaan mesin

penelusuran yang satu dengan yang lain sangat tergantung pada teknik pencarian

informasi dan teknik pengindeksan yang dipakai.

Information retrieval system merupakan suatu sistem yang berfungsi untuk

menemukan kembali informasi yang relevan dengan kebutuhan pemakai. Dalam

hal ini, temu kembali informasi berkaitan dengan representasi, penyimpanan, dan

akses terhadap representasi dokumen. Dokumen yang ditemukan tidak dapat

dipastikan apakah relevan dengan kebutuhan informasi pengguna yang dinyatakan

dalam query. Pengguna information retrieval system sangat bervariasi sesuai

dengan kebutuhan yang berbeda-beda.

Salah satu cara untuk mengurutkan dokumen pada information retrieval

system adalah dengan menggunakan metode Savoy, dimana harus ditentukan

terlebih dahulu jumlah kata dan dokumen yang ada. Setelah itu, akan dihitung

(12)

Setelah itu, untuk mendapatkan informasi dari dokumen yang dibutuhkan akan

dilakukan teknik extended boolean sesuai P-Norm. Teknik ini akan mengurutkan

dokumen yang diinginkan dan nilai P-Norm akan menentukan di urutan ke

berapakah dokumen tersebut berada.

Berdasarkan uraian di atas, penulis tertarik untuk melakukan penelitian

dengan mengambil judul “Perancangan Information Retrieval System dengan

Metode Extended Boolean dan Savoy”.

1.2. Identifikasi Masalah

Berdasarkan latar belakang di atas, maka permasalahan dalam penelitian

ini dapat dirumuskan sebagai berikut.

1. Bagaimana menentukan indeks dari suatu dokumen. 2. Bagaimana menentukan bobot dari suatu dokumen.

3. Bagaimana menentukan dokumen yang relevan sesuai dengan query yang diberikan.

4. Bagaimana merancang suatu sistem dengan menggunakan metode savoy untuk menghasilkan dokumen terurut yang sulit dikerjakan dengan

perhitungan manual akibat jumlah dokumen yang banyak.

1.3. Batasan Masalah

Ruang lingkup permasalahan dalam merancang sistem ini, yaitu :

a. Teknik pengindeksan dengan istilah indeks, dimana tahapannya adalah dengan pengambilan kata dari kumpulan dokumen, pembuangan kata yang tidak perlu

(13)

b. Teknik pembobotan dilakukan dengan Metode Savoy.

c. Penggunaan Extended Boolean disesuaikan dengan P-Norm untuk mendapatkan informasi yang dibutuhkan.

d. Pengujian menggunakan file berekstensi *.doc dan *.docx dengan kapasitas maksimum 2Mb.

e. Pengujian file menggunakan Bahasa Indonesia.

f. Peng-input-an nilai P-Norm memiliki batasan maksimal 3 digit bilangan bulat positif agar pada saat pencarian kata tidak memakan waktu yang terlalu lama.

g. Pembobotan boolean hanya menggunakan operator “OR” dan “AND” saja karena pencarian dua buah kata secara sekaligus.

h. Perangkat lunak akan menampilkan hasil perbandingan dari teknik yang digunakan sebanyak 1 dokumen per halamannya karena jika dokumennya

banyak maka tidak akan mencukupi untuk menampilkan secara keseluruhan.

i. Hasil proses perhitungan dari perangkat lunak akan disimpan ke dalam sebuah file data dengan ekstensi *.txt.

j. Hasil pencarian dapat disimpan sehingga untuk pencarian query yang sama tidak harus mengulang kembali lagi.

k. Perangkat lunak dibuat dengan menggunakan bahasa pemrograman Microsoft Visual Basic 2008.

1.4. Tujuan dan Manfaat

Adapun tujuan dari penelitian ini adalah untuk merancang sebuah

information retrieval system dengan metode savoy.

(14)

1. Bagi penulis

Penelitian ini akan meningkatkan wawasan dan pengetahuan penulis

mengenai information retrieval system dan juga meningkatkan kemampuan

penulis dalam membuat aplikasi dengan menggunakan Microsoft Visual

Basic.NET 2008.

2. Bagi STMIK TIME

Penelitian ini dapat dijadikan sebagai referensi bagi mahasiswa lainnya yang

ingin mengangkat topik mengenai information retrieval system.

3. Bagi masyarakat

Dapat mengetahui lebih jelas dan terperinci serta dapat menambah

pengetahuan mengenai teknik pengindeksan dan pembobotan pada

information retrieval system.

1.5. Sistematika Penulisan

Rincian penulisan laporan skripsi ini meliputi beberapa bab, yaitu :

BAB I PENDAHULUAN

Bab ini membahas tentang latar belakang masalah, identifikasi

masalah, batasan masalah, tujuan dan manfaat serta sistematika

penulisan.

BAB II LANDASAN TEORI

Bab ini berisi tentang penjelasan singkat mengenai perancangan,

sistem, pencarian, informasi, metode Extended Boolean, metode

(15)

BAB III METODE PENELITIAN

Bab ini berisi uraian tentang tempat dan jadwal penelitian,

kerangka kerja, metode pengumpulan data, analisa sistem,

perancangan sistem, pembangunan sistem, dan uji coba sistem.

BAB IV ANALISA DAN PERANCANGAN SISTEM

Bab ini berisi analisa sistem, perancangan activity diagram,

perancangan use case diagram, perancangan tabel pada database,

perancangan menu, dan perancangan antarmuka.

BAB V HASIL DAN PEMBAHASAN

Bab ini berisi kebutuhan sistem, tampilan output sistem yang

dibuat, cara penggunaan, dan hasil penelitian.

BAB VI KESIMPULAN DAN SARAN

Bab ini berisi kesimpulan dan saran terhadap penelitian yang telah

(16)

6

LANDASAN TEORI

2.1. Perancangan

Perancangan sistem merupakan penggambaran, perencanaan dan

pembuatan sketsa atau pengaturan dari beberapa elemen yang terpisah ke dalam

satu kesatuan yang utuh dan berfungsi. (Hartono, 2009: 196)

Tahap perancangan sistem mempunyai dua maksud atau tujuan utama

yaitu:

1. Untuk memenuhi kebutuhan pemakai sistem.

2. Untuk memberikan gambaran yang jelas dan rancang bangun yang lengkap kepada pemrograman komputer dan ahli-ahli teknik lainnya yang terlibat.

Untuk memahami tujuan ini, analisa sistem harus dapat mencapai sasaran-

sasaran sebagai berikut:

1. Perancangan sistem harus berguna, mudah dipahami dan nantinya mudah digunakan.

2. Perancangan sistem harus dapat mendukung tujuan utama perusahaan sesuai dengan yang didefiniskan pada tahap perencanaan sistem yang dilanjutkan

pada tahap analisa sistem.

2.2. Sistem

Sistem berasal dari bahasa Yunani yaitu “sistema” yang artinya kesatuan.

(17)

berhubungan, berkumpul bersama-sama untuk melakukan kegiatan atau untuk

mencapai suatu sasaran tertentu. Ada berbagai macam definisi mengenai sistem.

Sistem pada dasarnya adalah sekelompok unsur yang erat hubungannya

satu dengan yang lain, yang berfungsi bersama-sama untuk mencapai tujuan

tertentu. (Sutabri, 2010: 9)

Sistem adalah jaringan kerja dari prosedur-prosedur yang saling

berhubungan, berkumpul bersama-sama untuk melakukan kegiatan dalam rangka

mencapai tujuan tertentu. (Baridwan, 2008: 3)

Sistem mempunyai beberapa komponen, diantaranya adalah :

1. Perangkat keras, meliputi CPU, disk, terminal, printer, dan tape.

2. Perangkat lunak meliputi sistem operasi, sistem database, program pengontrol komunikasi, dan program aplikasi.

3. Personil meliputi orang yang mengoperasikan sistem, menyediakan masukan, dan melakukan aktivitas manual yang mendukung sistem.

4. Data meliputi komponen yang harus tersimpan dalam sistem selama jangka waktu tertentu.

5. Prosedur meliputi instruksi dan kebijakan untuk mengoperasikan sistem. Jadi, sistem merupakan kumpulan dari bagian-bagian atau elemen-elemen yang

saling berhubungan dan terpadu untuk mencapai suatu tujuan tertentu.

2.3. Pencarian

Pencarian (searching) merupakan pekerjaan yang sering dilakukan dalam

kehidupan sehari-hari. Dalam text editor, sering dilakukan pekerjaan untuk

(18)

mencari kata tertentu dan menghitung frekuensi kemunculan kata tersebut dalam

dokumen. Windows explorer dan internet explorer dalam sistem operasi Windows

menggunakan prinsip pencarian dalam melakukan pekerjaan dimaksud.

Dalam ilmu komputer, metode pencarian (searching) ada

bermacam-macam. Secara garis besar, metode pencarian data dapat dibagi menjadi 2 bagian,

yaitu:

1. Metode pencarian data tanpa penempatan data, terdiri dari: a. Metode pencarian Linier (Linear / Sequential Search) b. Metode pencarian Biner (Binary Search)

c. Metode pencarian Interpolasi (Interpolation Search) 2. Metode pencarian data dengan penempatan data, terdiri dari:

a. Metode pencarian Langsung (Direct Search) b. Metode pencarian Relatif (Hash Search)

Masing-masing metode memiliki kelebihan dan kekurangan. Metode

pencarian (searching) yang memiliki efisiensi penggunaan tempat yang lebih baik

adalah metode pencarian relatif (Hash Search).

(gerlan1986.files.wordpress.com/2010/03/pencarian-searching.ppt)

2.4. Informasi

Istilah informasi berasal dari bahasa Inggris ”to inform” yang artinya

dalam Bahasa Indonesia adalah ”memberitahukan”. Informasi merupakan hal

yang sangat penting bagi manajemen di dalam pengambilan keputusan.

Informasi merupakan bagian yang terpenting di dalam sebuah organisasi.

(19)

yang kurang memperoleh informasi akan ketinggalan dan akhirnya berakhir.

Robert N. Anthony dan John Dearden menyebut keadaan dari sistem dalam

hubungannya dengan keberakhirannya dengan istilah entropy yang disebut

negative entropy. (Baridwan, 2008: 4)

Informasi adalah data yang sudah diproses menjadi bentuk yang berguna

bagi pemakai dan mempunyai nilai pikir yang nyata bagi pembuatan keputusan

pada saat sedang berjalan atau untuk prospek masa depan. Definisi tersebut

menekankan kenyataan bahwa data harus diproses dengan cara-cara tertentu untuk

menjadi informasi dalam bentuk dan nilai yang berguna bagi pemakai. (Amsyah,

2009: 289)

Informasi merupakan suatu data yang telah diproses dan mempunyai arti

tertentu. (Mcleod, 2008: 12)

Sumber dari informasi adalah data. Data merupakan bentuk jamak dari

bentuk tunggal data, yaitu item ataupun datum. Data adalah kenyataan yang

mengambarkan suatu kejadian-kejadian dan kesatuan nyata. Kejadian-kejadian

nyata yang sering terjadi adalah perubahan dari suatu nilai yang disebut dengan

transaksi.

Jadi, hal yang terpenting untuk membedakan informasi dengan data,

informasi itu mempunyai kandungan “makna” dan data tidak mempunyai

“makna”. Makna artinya output (sebagai penunjang sistem). Pengertian makna

di sini merupakan hal yang sangat penting, karena berdasarkan makna inilah

penerima dapat memahami informasi tersebut dan secara lebih jauh dapat

menggunakannya untuk menarik suatu kesimpulan atau bahkan mengambil

(20)

2.5. Metode

Metode berasal dari bahasa Yunani “Methodos” yang berarti cara atau

jalan yang ditempuh. Upaya ilmiah berhubungan dengan metode yang

menyangkut masalah cara kerja untuk dapat memahami objek yang menjadi

sasaran ilmu yang bersangkutan. Fungsi metode adalah sebagai alat untuk

mencapai tujuan.

Menurut Kamus Besar Bahasa Indonesia, metode adalah cara kerja yang

bersistem untuk memudahkan pelaksanaan suatu kegiatan guna mencapai tujuan

yang ditentukan. Menurut artikata.com, metode adalah cara teratur yang

digunakan untuk melaksanakan suatu pekerjaan agar tercapai sesuai dengan yang

dikehendaki.

2.6. Information Retrieval System

Information Retrieval System merupakan sistem yang berfungsi untuk

menemukan informasi yang relevan dengan kebutuhan pemakai. Salah satu hal

yang perlu diingat adalah bahwa informasi yang diproses terkandung dalam

sebuah dokumen yang bersifat tekstual. Dalam konteks ini, temu kembali

informasi berkaitan dengan representasi, penyimpanan, dan akses terhadap

dokumen representasi dokumen. Dokumen yang ditemukan tidak dapat dipastikan

apakah relevan dengan kebutuhan informasi pengguna yang dinyatakan dalam

query. Pengguna Sistem Temu Kembali sangat bervariasi dengan kebutuhan

informasi yang berbeda-beda.

Misalkan ada sebuah kumpulan dokumen dan seorang user yang

(21)

pertanyaan tersebut adalah sekumpulan dokumen yang relevan dan membuang

dokumen yang tidak relevan.

Secara matematis hal tersebut dapat dituliskan sebagai berikut:

Q  → n 2 D ... (2.1) Dimana : Q = pertanyaan (query) D = dokumen n = jumlah dokumen

2n = jumlah kemungkinan himpunan bagian dari dokumen yang ditemukan

Sistem Temu Kembali pada dasarnya dibagi dalam dua komponen utama

yaitu sistem pengindeksan (indexing) yang menghasilkan basis data sistem dan

temu kembali yang merupakan gabungan dari user interface dan look-up-table.

Pada bagian selanjutnya akan dijelaskan mengenai sistem pengindeksan dan

teknik temu kembali informasi. Gambar 2.1 menunjukkan ilustrasi information

retrieval system.

Gambar 2.1 Ilustrasi Sistem Temu Kembali

(22)

Sistem Temu Kembali didesain untuk menemukan dokumen atau informasi

yang diperlukan oleh masyarakat pengguna. Information retrieval system

bertujuan untuk menghubungkan kebutuhan informasi pengguna dengan sumber

informasi yang tersedia dalam situasi sebagai berikut.

1. Penulis mempresentasikan sekumpulan ide dalam sebuah dokumen menggunakan sekumpulan konsep.

2. Terdapat beberapa pengguna memerlukan ide yang dikemukakan oleh penulis tersebut, tapi mereka tidak dapat mengidentifikasikan dan menemukannya

dengan baik.

3. Information retrieval system bertujuan untuk mempertemukan ide yang dikemukakan oleh penulis dalam dokumen dengan kebutuhan informasi

pengguna yang dinyatakan dalam bentuk pertanyaan (query).

Berkaitan dengan sumber informasi di satu sisi dan kebutuhan informasi

pengguna di sisi yang lain, information retrieval system berperan untuk:

1. Menganalisa isi sumber informasi dan pertanyaan pengguna.

2. Mempertemukan pertanyaan pengguna dengan sumber informasi untuk mendapatkan dokumen yang relevan.

Adapun fungsi utama information retrieval system adalah sebagai berikut.

1. Mengidentifikasi sumber informasi yang relevan dengan minat masyarakat pengguna yang ditargetkan.

2. Menganalisa isi sumber informasi (dokumen).

3. Merepresentasikan isi sumber informasi dengan cara tertentu yang memungkinkan untuk dipertemukan dengan pertanyaan (query) pengguna.

(23)

4. Merepresentasikan pertanyaan (query) pengguna dengan cara tertentu yang memungkinkan untuk dipertemukan sumber informasi yang terdapat dalam

basis data.

5. Mempertemukan pernyataan pencarian dengan data yang tersimpan dalam basis data.

6. Menemu-kembalikan informasi yang relevan.

7. Menyempurnakan unjuk kerja sistem berdasarkan umpan balik yang diberikan oleh pengguna.

Information retrieval system terdiri dari 6 (enam) subsistem, yaitu:

1. Subsistem dokumen 2. Subsistem pengindeksan 3. Subsistem kosa kata 4. Subsistem pencarian

5. Subsistem antarmuka pengguna-sistem 6. Subsistem penyesuaian

Dokumen sebagai objek data dalam Information retrieval system

merupakan sumber informasi. Dokumen biasanya dinyatakan dalam bentuk indeks

atau kata kunci. Kata kunci dapat diekstrak secara langsung dari teks dokumen

atau ditentukan secara khusus oleh spesialis subjek dalam proses pengindeksan

yang pada dasarnya terdiri dari proses analisa dan representasi dokumen.

Pengindeksan dilakukan dengan menggunakan sistem pengindeksan

tertentu, yaitu himpunan kosa kata yang dapat dijadikan sebagai bahasa indeks

sehingga diperoleh informasi yang terorganisasi. Sementara itu, pencarian diawali

(24)

retrieval system berfungsi untuk menganalisa pertanyaan (query) pengguna yang

merupakan representasi dari kebutuhan informasi untuk mendapatkan

pernyataan-pernyataan pencarian yang tepat. Selanjutnya pernyataan-pernyataan-pernyataan-pernyataan pencarian

tersebut dipertemukan dengan informasi yang telah terorganisasi dengan suatu

fungsi penyesuaian (matching function) tertentu sehingga ditemukan dokumen

atau sekumpulan dokumen (http://repository.ui.ac.id/dokumen/lihat/6396.pdf).

Proses tersebut di atas dapat diilustrasikan pada gambar 2.2

Gambar 2.2 Outline Information Retrieval System

Sumber : http://repository.ui.ac.id/dokumen/lihat/6396.pdf

Sementara itu, Information retrieval system dapat juga didefinisikan

sebagai suatu proses yang terdiri dari 6 (enam) komponen utama yaitu:

1. Kumpulan dokumen 2. Pengindeksan

3. Kebutuhan informasi pemakai 4. Strategi pencarian

(25)

6. Penilaian relevansi

Secara garis besar komponen - komponen information retrieval system

dapat diilustrasikan pada gambar 2.3

Gambar 2.3 Komponen Information Retrieval System

Proses pencarian informasi terjadi interaksi antara pengguna dengan

sistem (mesin), baik secara langsung maupun tidak langsung. Interaksi antara

pengguna dengan sistem dalam proses pencarian informasi dapat dinyatakan

(26)

Gambar 2.4 Interaksi antara Pengguna dengan Sistem

2.7. Metode Extended Boolean

Model Extended Boolean berdasarkan model P-norm merupakan

pengembangan lebih lanjut dari model Boolean. Teknik ini memakai operator

yang dikomputasi berdasarkan rumus Savoy (1993). Rumus masing-masing

operator dapat dilihat pada tabel 2.2

Tabel 2.1 Teknik P-Norm

Query Retrieval Status Value (RSV)

A or <p> B p p ib p ia W W 2 RSV_or = + A and <p> B p p ib p ia W W 2 ) 1 ( ) 1 ( 1 RSV_and = − − + − Not A RSV_not = 1−W_ia

(27)

Dimana :

a. p adalah sebuah nilai yang dimasukkan pada query b. Wia adalah bobot istilah A dalam indeks pada dokumen Di

c. Wib adalah bobot istilah B dalam indeks pada dokumen Di

Untuk menentukan peringkat dapat dilakukan dengan dua cara, yaitu:

1. Langsung mengurutkan dokumen (descending) berdasarkan bobot dokumen yang didapat dengan rumus Retrieval Status Value (RSV).

2. Memakai rumus Learning Scheme :

∑ ∫

= + = r k ik 1 k init i init i) RSV (D ) norm*RSV (D ) RSV(D α n ..., 2, 1, i untuk = ……….. (2.2) dimana :

a. RSVinit(Di) merupakan retrieval status value dari dokumen Di yang

dikomputasi berdasarkan rumus teknik retrieval P-norm model.

b. ∝ik merupakan bobot keterhubungan antara dokumen i dan k. Bobot

ketergantungan ini diperoleh dari nilai relevance link yang merupakan

hasil dari proses pembelajaran.

2.8. Metode Savoy

Nama lengkap Savoy adalah Profesor Jacques Savoy. Berikut adalah

riwayat hidup dari beliau.

a. Sejak 1992 : Profesor di University of Neuchatel, Fakultas Hukum dan Ilmu Ekonomi. Kunjungan profesor di Universitas Freiburg dan Universitas Jenewa

(28)

; * log * _ik _k k ik ik tf idf df n tf W _=      =

b. 1992 : Asisten Profesor di University of Montreal, Fakultas Graduate Studies, Departemen Ilmu Komputer dan Riset Operasional.

c. 1989-1991 : Asisten Profesor di University of Montreal, Departemen Ilmu Komputer dan Penelitian Operasional (lab incognito).

d. 1987-1989 : Fellow penelitian dari Swiss Dana Nasional untuk Penelitian Ilmiah di University of Montreal.

e. 1987 : Dr rer. pol. (Referensi : Summa cum laude), University of Freibourg. f. 1987 : Peluncuran pertama sistem hypertext francophone.

g. 1982 : Sarjana rer. pol. (Referensi :Summa cum laude), University of Freiburg.

Adapun kegiatan penelitiannya adalah sebagai penulis berbagai publikasi

mengenai informasi dan khususnya tentang informasi di dalam hypertext, dan

khususnya di Web, digunakan pendekatan yang logis serta analisa statistik dari

hasil pencarian.

Di dalam memberikan bobot pada sebuah istilah, terdapat berbagai macam

teknik pembobotan. Teknik pembobotan berdasarkan rumus Savoy (1993),

merepresentasikan bobot (Wik) dari setiap istilah k, dimana k=1, 2, …., t; dalam

sebuah dokumen i adalah:

……….. (2.3)

Keterangan :

a. Wik adalah bobot dari istilah k dalam dokumen i

(29)

) log( log nidf_k n df n k       = ij j ik ik tf Max tf ntf =

c. n adalah jumlah dokumen dalam kumpulan dokumen. d. dfk adalah jumlah dokumen yang mengandung istilah k.

Rumus di atas terdiri dari dua komponen yaitu tfik dan dfk, dimana kedua

komponen ini dinormalisasi dalam rentang [0, 1], menjadi :

W_ik =ntf_ik*nidf_k ……….. (2.4) dimana :

dan ……. (2.5)

dimana Maxjtfij adalah frekuensi istilah terbesar pada satu dokumen.

Pada teknik pembobotan ini, bobot istilah telah dinormalisasi, dengan

mempertimbangkan frekuensi kemunculan istilah di satu dokumen, tetapi juga

memperhatikan frekuensi terbesar pada suatu istilah-istilah lain di dokumen yang

sama. Selain itu, teknik ini juga memperhitungkan jumlah dokumen yang

mengandung istilah yang bersangkutan dan jumlah keseluruhan dokumen. Hal ini

berguna untuk mengetahui posisi relatif bobot istilah bersangkutan pada suatu

dokumen dibandingkan dengan dokumen-dokumen lain yang memiliki istilah

yang sama. Ini berarti, jika sebuah istilah mempunyai frekuensi kemunculan yang

sama pada dua dokumen, belum tentu mempunyai bobot yang sama.

1

15

15 ntf

_k

=

705373

,

0 )

1162

log(

8 1162

log

nidf

k

=









=

705373

,

0 705373

,

0 *

1 =

=

ik

W

(30)

2.9. Bahasa Pemrograman

Bahasa pemrograman berdasarkan tingkat ketergantungannya dengan

mesin bisa meliputi:

1. Machine-code languages

Merupakan bentuk terendah dari bahasa komputer. Setiap instruksi dalam

program direpresentasikan dengan kode numerik, yang secara fisik berupa

deretan angka 0 dan 1. Sekumpulan instruksi dalam bahasa mesin bisa

dibentuk menjadi microcode, yaitu semacam prosedur dalam bahasa mesin.

2. Assembly languages

Merupakan bentuk simbolik dari bahasa mesin. Setiap kode memiliki kode

simbolik, misalnya ADD untuk penjumlahan (addition) dan MUL untuk

perkalian (multiplication). Pada bahasa assembly tersedia alat bantu untuk

diagnostik (debug) yang tidak terdapat pada bahasa mesin. contoh software

yang ada untuk pengembangan dan debug bahasa assembly seperti Turbo

Assembler dari Borland, Macro Assembler dari Microsoft, Turbo Debugger.

3. High-level languages

Disebut tingkat tinggi karena lebih dekat dengan manusia. Memberikan

fasilitas yang lebih mudah, serta mudah dimengerti dan dipelajari oleh

pengguna. Pengguna tidak perlu mengetahui bagaimana representasi data ke

dalam bentuk internal di memori, karena pekerjaan tersebut ditangani oleh

suatu sistem yang mentranslasikan program bahasa tingkat tinggi ke dalam

(31)

4. Problem-oriented language

Memungkinkan penyelesaian untuk suatu masalah atau aplikasi yang spesifik,

contohnya Structured Query Language (SQL) untuk aplikasi database, Query

by Example (QBE).

(Junindar, 2008: 3)

Visual Basic.NET adalah generasi selanjutnya dari Visual Basic. Visual

Basic.Net memungkinkan kita untuk membangun aplikasi database client atau

server performa tinggi dan sangat cocok didampingkan dengan perangkat lunak

SQL Server 2000.

Pemilihan Visual Basic.NET sebagai program pengembang sistem ini

adalah karena merupakan salah satu program aplikasi yang berada di bawah

(32)

22

BAB III

METODE PENELITIAN

3.1. Tempat dan Jadwal Penelitian

Penelitian dimulai dari tanggal 01 Desember 2014 dan berakhir pada

tanggal 30 April 2015.

Tabel 3.1 Jadwal Penelitian

3.2. Kerangka Kerja

Adapun kerangka kerja yang dibuat penulis seperti gambar 3.1.

Gambar 3.1 Kerangka Kerja Penelitian Waktu Kegiatan Desember 2014 Januari 2015 Februari 2015 Maret 2015 April 2015 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 Identifikasi Masalah Pengumpulan Data Analisa Sistem Perancangan Sistem Pembangunan Sistem

Uji coba Sistem

Penulisan Laporan Skripsi

Analisa Sistem Pengumpulan Data

Perancangan Sistem

Pembangunan Sistem

Uji Coba Sistem Identifikasi Masalah

(33)

3.2.1. Metode Pengumpulan Data

Teknik pengumpulan data dapat didefinisikan sebagai suatu cara yang

digunakan untuk memperoleh data yang dibutuhkan sebagai bahan masukan bagi

penulis dalam penyusunan skripsi ini.

Proses dimulai dengan mengumpulkan data yang diperlukan dalam

penelitian. Adapun metode pengumpulan data dalam penelitian dilakukan melalui

Penelitian Kepustakaan (library research), yaitu penulis mengumpulkan data

melalui internet dan buku-buku yang relevan yang berhubungan dengan topik

yang dibahas, seperti buku Analisa Sistem Informasi karya Tata Sutabri dan

Modern Information Retrieval karya Ricardo Baeza-Yates, Berthier Ribeiro-Neto.

Pencarian pada internet dapat menggunakan keyword information retrieval system

dan metode Savoy.

3.2.2. Analisa Sistem

Pada sistem operasi Windows, terdapat fasilitas pencarian file dengan

menggunakan kata pencarian (keyword). Output yang dihasilkan berupa kumpulan

file yang isinya mengandung kata pencarian yang dimasukkan. Namun, output

yang dihasilkan tersebut tidak diurutkan berdasarkan derajat hubungan dari isi file

dengan kata pencarian.

Untuk itu, maka diperlukan sebuah information retrieval system. Proses

analisa terhadap sistem tersebut akan dimulai dari proses pembacaan data input.

Setelah itu, proses dilanjutkan dengan menampilkan langkah kerja proses

perhitungan dengan menggunakan metode Extended Boolean dan Savoy.

(34)

3.2.3. Perancangan Sistem

Perancangan perangkat lunak akan menggunakan metode Object Oriented

Diagram (OOD). OOD adalah metode untuk mengarahkan arsitektur software

yang didasarkan pada manipulasi objek-objek sistem atau subsistem. Objek

oriented dekomposisi dan notasi untuk menggambarkan model dari sistem yang

sedang dikembangkan. Struktur dikembangkan set objek dimana berkolaborasi

untuk menyediakan perilaku yang memenuhi persyaratan dari masalah.

Untuk melaksanakan OOD, ada beberapa langkah umum yang seharusnya

dilakukan :

a. Gambarkan setiap subsistem dan alokasinya pada processor dan task.

b. Pilih sebuah strategi desain untuk mengimplementasikan manajemen data,

interface support, dan manajemen task.

c. Desain suatu mekanisme kontrol yang tepat untuk sistem

d. Lakukan desain objek dengan membuat suatu representasi prosedural untuk

setiap operasi dan struktur data untuk setiap atribut klas.

e. Lakukan desain message menggunakan kolaborasi di antara objek-objek dan

hubungan objek (object relationships).

f. Buat messaging model.

g. Tinjau model desain dan ulangi jika dibutuhkan.

Flowchart sistem usulan yang dibuat dapat digambarkan seperti terlihat

(35)

Start

Hitung frekwensi kata dalam dokumen Input kata pencarian

Input lokasi pencarian Input nilai p

Hitung frekwensi terbesar 1 dokumen

Hitung jumlah seluruh dokumen

Jumlah dokumen yang mengandung kata yang dicari

If dicari bobot dokumen sesuai

operator then

Masukkan dokumen sebagai kandidat

Ya

Tidak

Urutkan dokumen kandidat

End

Gambar 3.2 Flowchart Sistem Usulan

3.2.4. Pembangunan Sistem

Proses dilanjutkan dengan melakukan coding terhadap perangkat lunak

(36)

merancang laporan yang diperlukan dengan menggunakan aplikasi Crystal Report

10. Jenis koneksi (data source) yang digunakan adalah koneksi Data Active

Object (DAO).

Sistem dibuat dengan menggunakan bahasa pemrograman Microsoft Visual Basic 2008 dan laporan dirancang dengan menggunakan aplikasi Crystal

Report 10 dan database dirancang dengan aplikasi Microsoft Access 2007.

3.2.5. Uji Coba Sistem

Proses dilanjutkan dengan melakukan coding terhadap perangkat lunak

untuk melakukan koneksi ke database dan melakukan proses testing and

debugging terhadap coding yang dirancang tersebut.

Proses diakhiri dengan melakukan proses passing data dari Microsoft Visual Basic 2008 ke aplikasi Crystal Report 10 untuk menampilkan laporannya.

Koneksi yang digunakan untuk melakukan passing data adalah koneksi

Data Active Object (DAO). Dalam proses perancangan perangkat lunak juga

diperlukan beberapa buah gambar yang digunakan sebagai dekorasi pada tombol

dan icon dari perangkat lunak. Gambar-gambar tersebut dicari dari berbagai

sumber seperti internet, buku teks, majalah dan sebagainya. Gambar tersebut

di-edit dan disimpan dengan menggunakan aplikasi Adobe Photoshop CS dengan

(37)

BAB IV

ANALISA DAN PERANCANGAN

4.1. Analisa

Sebelum merancang information retrieval system ini, maka terlebih dahulu

perlu dilakukan proses analisa terhadap permasalahan yang muncul, analisa

persyaratan yang harus dipenuhi oleh sistem, analisa proses dan pemodelan

sistem. Hal ini dilakukan agar sistem yang dirancang dapat sesuai dengan

kebutuhan yang diinginkan.

Secara umum sistem yang akan dibangun adalah menggunakan metode

Savoy, yaitu suatu metode yang bertujuan untuk menentukan bobot dari suatu

dokumen dan mengurutkannya berdasarkan nilai indeksnya. Sistem ini akan

dibangun menjadi sebuah alat bantu yang berkaitan dengan masalah pencarian

kata didalam dokumen. Sistem ini dapat mempermudah proses pencarian kata

yang diinginkan serta untuk mempermudah pengelompokkan dokumen

berdasarkan nilai indeksnya.

Contoh sederhana berikut dapat digunakn untuk membantu pemahaman

mengenai prosedur kerja dari metode Savoy, misalkan terdapat dua buah dokumen

yang akan dilakukan pembobotan dan pengindeksan. Isi dari kedua dokumen yang

digunakan tersebut dapat dirincikan sebagai berikut:

File 1 : File1.doc

Penelitian di Florida telah menemukan bahwa senyawa alami dalam buah

semangka, yaitu citrulline, yang membantu melebarkan dan merilekskan

(38)

darah ke seluruh tubuh. Penelitian lain dari University Kentucky juga

menunjukkan bahwa semangka baik dikonsumsi untuk menjaga berat badan dan

membantu kesehatan jantung.

File 2 : File2.doc

Melon dan semangka memiliki kandungan air yang cukup banyak sehingga baik

untuk mengatasi dehidrasi. Sayangnya, kandungan gula dalam keduanya cukup

tinggi (Indeks glikemik mencapai 65-100 persen), sehingga sangat tidak

disarankan bagi mereka yang memiliki diabetes atau memiliki riwayat keluarga

penderita diabetes untuk mengonsumsi buah ini.

Misalkan kata yang ingin dicari adalah: ‘melon’ dan ‘semangka’, maka proses

perhitungannya adalah sebagai berikut:

Jumlah File : melon = 1 (df1) semangka = 2 (df2) File 1 : melon = 0 semangka = 2 File 2 : melon = 1 semangka = 1

(39)

Jumlah keseluruhan File (n) : 2 Nilai p = 100 Proses penyelesaian : File 1 : melon : log(n/dfk) = log(2/1) = 0.3010299956639812 nidfk1 = 0.3010299956639812 / log(2) = 1 keterangan :

a. n adalah jumlah dokumen dalam kumpulan dokumen.

b. dfk adalah jumlah dokumen yang mengandung istilah k.

c. nidfk1 adalah normalisasi jumlah dokumen yang mengandung istilah k.

ntfk1 = 0/2 = 0

keterangan :

a. tfik adalah frekwensi dari istilah k dalam dokumen i.

b. ntfk1 adalah normalisasi frekwensi dari istilah k dalam dokumen i.

c. Maxjtfij adalah frekwensi istilah terbesar pada satu dokumen.

(40)

k ik ik ntf nidf W = * w1 = 0 x 1 = 0 semangka : log(n/dfk) = log (2/2) = 0 nidfk2 = 0 / log (2) = 0 ntfk1 = 2/2 = 1 k ik ik ntf nidf W = * w2 = 0.1 x 0 = 0 RSV = 1 – (((1 – w1)p + (1 – w2)p) / 2)1/np RSV = 1 – (((1 – 0)100 + (1 – 0)100 / 2)1/100 RSV = 0 Keterangan :

a. RSVinit(Di) merupakan retrieval status value dari dokumen Di yang

dikomputasi berdasarkan rumus teknik retrieval P-norm model.

b. ∝ik merupakan bobot keterhubungan antara dokumen i dan k. Bobot

ketergantungan ini didapat dari nilai relevance link yang merupakan hasil

(41)

File 2 : melon : log(n/dfk) = log(2/1) = 0.3010299956639812 nidfk1 = 0.3010299956639812 / log(2) = 1 ntfk1 = 2/2 = 1 k ik ik ntf nidf W = * w1 = 1 x 1 = 1 semangka : log(n/dfk) = log (2/2) = 0 nidfk2 = 0 / log (2) = 0 ntfk2 = 1/2 = 0.5

(42)

k ik ik ntf nidf W = * w2 = 0.5 x 0 = 0 RSV = 1 – (((1 – w1)p + (1 – w2)p) / 2)1/np RSV = 1 – (((1 – 1)100 + (1 – 0)100 / 2)1/100 RSV = 0.006907504562964073

Berdasarkan nilai RSV yang diperoleh maka dokumen dapat diurutkan sebagai

berikut:

1. File 2 : File2.txt

2. File 1 : File1.txt

4.2. Perancangan

Untuk menggambarkan dan memodelkan sistem yang dibuat, maka dapat

digunakan beberapa diagram Unified Modeling Language (UML), yang mencakup

activity diagram dan use case diagram.

4.2.1. Perancangan Proses

Untuk menggambarkan prosedur kerja dari sistem, maka akan digunakan

activity diagram. Gambar 4.1 berikut menunjukkan activity diagram dari

(43)

Meng-input lokasi pencarian

Menghitung jumlah kemunculan kata dalam dokumen

Menghitung jumlah kemunculan kata terbesar 1 dokumen

Menghitung jumlah seluruh dokumen

Menghitung jumlah dokumen yang mengandung kata yang dicari

Masukkan dokumen sebagai kandidat

Ya

Tidak

Urutkan dokumen kandidat

User Sistem

If dicari bobot dokumen sesuai operator then Meng-input kata kunci yang

dicari

Menampilkan lokasi pencarian yang dipilih

Menentukan fungsi logika pencarian

Menentukan nilai p

Gambar 4.1 Activity Diagram

Aktor yang terlibat dalam sistem ini hanya satu yaitu pemakai. Gambar 4.2

(44)

Gambar 4.2 Use Case Diagram

4.2.2. Perancangan Tabel pada Database

Tabel 4.1 merincikan database yang digunakan pada sistem. Rincian dari

database yang terdapat pada data flow diagram dari sistem ini dapat dilihat pada

table 4.1

Tabel 4.1 Tabel Database

Atribut Tipe Data Ukuran Data Keterangan

Nfile Text 25 Nama File

Nindeks Number 10 Nilai Indeks

Jkata Number 10 Jumlah Kata

NP Number 10 Nilai P

(45)

4.2.3. Perancangan Antarmuka

Antarmuka ini dirancang menggunakan bahasa pemrograman Visual Basic

2008. Dalam antarmuka sistem ini terdapat beberapa form, yaitu :

1. Form Open

2. Form Teori

3. Form Input Data

4. Form Proses

5. Form Setting

6. Form Tabel

Berikut ini adalah penjelasan mengenai form-form yang terdapat pada

perancangan antamuka, yaitu :

1. Form Open

Gambar 4.3 menunjukkan rancangan form Open.

Gambar 4.3 Rancangan Form Open

Keterangan :

(46)

2. Text, digunakan untuk memberikan informasi mengenai file yang

dimunculkan.

2. Form Teori

Gambar 4.4 menunjukkan rancangan form Teori.

Gambar 4.4 Rancangan Form Teori

Keterangan :

1. Button Back, digunakan untuk kembali kehalaman sebelumya.

2. Button Next, digunakan untuk lanjut kehalaman berikutnya.

3. Button Exit, digunakan untuk keluar dari form teori.

4. Text, digunakan untuk memberikan informasi mengenai teori dari

information retrieval dan metode savoy.

3. Form Input Data

(47)

Gambar 4.5 Rancangan Form Input Data

Keterangan :

1. Textbox, digunakan untuk menampilkan lokasi folder yang dicari.

2. Button Tambahkan ke List, digunakan untuk menambahkan folder yang

diinginkan kedalam list sistem.

3. Button Search, digunakan untuk memilih dan mengambil folder yang

diinginkan.

4. Button Hapus dari List, digunakan untuk menghapus folder yang telah

dipilih.

5. Rich Textbox, digunakan untuk menampilkan banyaknya folder yang telah

dipilih.

6. Button Keluar, digunakan untuk keluar dari proses input data.

7. Button Proses, digunakan untuk melakukan proses penyimpanan data

sementara untuk dapat dipergunakan kembali.

8. Check list, digunakan memilih apakah semua isi subfolder yang

(48)

4. Form Proses

Gambar 4.6 menunjukkan rancangan form Proses.

Gambar 4.6 Rancangan Form Proses

Keterangan :

1. Check list, digunakan untuk memilih apakah kata yang dicari ingin secara

utuh atau berdasarkan huruf besar dan huruf kecil.

2. Progress bar, digunakan untuk mengetahui waktu pemrosesan.

3. Button Tampil, digunakan untuk menampilkan dokumen apa saja yang

akan diproses oleh sistem.

4. Button Cari, digunakan untuk mencari kata yang diinginkan dan akan

diurutkan berdasarkan nilai indeksnya.

5. Button Batal, digunakan untuk membatalkan proses kerja sistem ini.

6. Label, digunakan untuk menampilkan nama file, isi file, lokasi file, nilai

indeks dan jumlah kata.

(49)

8. Button Back Page, digunakan untuk kembali kehalaman sebelumnya.

9. Button Show tabel, digunakan untuk menampilkan tabel hasil pencarian

kata.

10. Combo box, digunakan untuk menampilkan jumlah halaman dan dapat

dipilih untuk melompat kehalaman yang diinginkan.

5. Form Setting

Gambar 4.7 menunjukkan rancangan form Setting.

Gambar 4.7 Rancangan Form Setting

Keterangan :

1. Rich Textbox, digunakan untuk menampilkan dokumen yang telah dipilih

untuk diproses nantinya.

2. Button Keluar, digunakan untuk keluar dari menu form setting.

6. Form Tabel

(50)

Gambar 4.8 Rancangan Form Tabel

Keterangan :

1. Nilai P, digunakan untuk menginput banyaknya jumlah P yang ingin

dicari.

2. Hasil, digunakan untuk mengetahui informasi mengenai nama file, jumlah

kata1 dan kata2 serta nilai indeks.

3. Button Simpan, digunakan untuk menyimpan data yang telah diproses.

4. Button Buka, digunakan untuk membuka data yang telah disimpan

sebelumnya.

5. Button Proses, digunakan untuk menjalankan proses dari sistem tersebut.

(51)

BAB V

HASIL DAN PEMBAHASAN

5.1 Hasil

Saat sistem ini dijalankan, maka akan muncul tampilan menu utama

seperti .ada gambar 5.1

Gambar 5.1 Tampilan Menu Utama

Gambar 5.1, terdapat 3 menu utama, yaitu menu teori, menu penemuan

kembali dan menu keluar. Dalam menu teori terdapat 2 sub menu, yaitu

information retrieval dan metode savoy.

Untuk mengetahui teori dari information retrieval dan metode savoy,

pengguna dapat memilih menu teori. Untuk menjalankan program dapat memilih

menu penemuan kembali, dimana pada saat memilih menu tersebut, pengguna

(52)

dilakukan proses penginputan kata dan nilai P maka hasilnya akan langsung

dimunculkan. Untuk pencarian nilai P yang banyak maka pengguna harus memilih

menu tampilkan tabel yang ada didalam sistem. Untuk mengetahui mengenai

pembuat dapat memilih menu mengenai dan untuk keluar dari program dapat

memilih menu keluar. Untuk penjelasan lebih lanjut dapat dilihat pada tampilan

form seperti ditunjukkan gambar 5.2

Gambar 5.2 Tampilan Form Teori Information Retrieval System

(53)

Halaman 2 dari 4

(54)

Halaman 4 dari 4

Pada Form teori ini, pengguna dapat mengetahui informasi mengenai

information retrieval dan metode savoy dengan cara memilih menu teori dan

mengklik salah satu dari kedua submenu yang ada. Untuk meng-input data dan

(55)

Gambar 5.6 Tampilan Form Input Data

Pada form input data ini, pengguna akan mencari folder-folder mana saja

yang diperlukan dan mengklik folder tersebut untuk diproses oleh sistem. Untuk

mengecek secara keseluruhan isi dokumen maka pengguna harus menandai

checkbox yang ada disudut kiri bawah form yang bertuliskan “Cek semua

subfolder didalamnya” karena jika tidak menandainya, maka dokumen yang ada

didalam subfolder tidak akan diproses juga. Setelah itu, pengguna mengklik

(56)

Gambar 5.7 Tampilan Form Kumpulan File

Gambar 5.7 menunjukkan kumpulan-kumpulan file yang ada di dalam

folder yang telah dipilih oleh pengguna untuk diproses. Di dalam folder ini

terdapat data mengenai lokasi dokumen dan nama dokumen yang hanya

berekstensi .doc. Untuk keluar dari proses ini, pengguna dapat mengklik button

keluar.

(57)

Pada form proses seperti ditampilkan oleh gambar 5.8, pengguna akan

meng-input nilai P dan kata-kata apa saja yang akan dicari serta operator-operator

mana yang akan digunakan. Setelah itu, pengguna akan mengklik button cari dan

sistem akan menjalankan prosesnya dan akan memunculkan hasil pencariannya,

yaitu sistem akan memunculkan nama dokumen, lokasi dari file tersebut, nilai

indeksnya serta jumlah kata yang terdapat pada dokumen tersebut yang sudah

diurutkan berdasarkan nilai indeks dari yang terbesar ke yang paling kecil. Untuk

melihat halaman berikutnya, pengguna dapat mengklik button halaman berikutnya

dan jika pengguna ingin melihat secara acak halamannya maka dapat memilih

untuk melihat dari button untuk lompat ke halaman yang diinginkan.

Gambar 5.9 Tampilan Form Open

Pada form open seperti ditampilkan oleh gambar 5.9, sistem akan

(58)

kemudian hasilnya dapat dilihat oleh pengguna. Untuk keluar dari form ini,

pengguna dapat mengklik button keluar yang ada di dalam sistem.

Gambar 5.10 Tampilan Form Tabel

Form tabel seperti ditampilkan oleh gambar 5.10, berfungsi untuk

menampilkan hasil pencarian nilai P dalam jumlah banyak. Di sini, pengguna

dapat menginput nilai P sesuai dengan keinginan ataupun sebanyak yang

diinginkan oleh pengguna dan hasilnya akan langsung dimunculkan pada tabel ini.

Dimana tabel ini akan menampilkan nama file, jumlah kata1, jumlah kata 2, dan

nilai indeks berdasarkan nilai P. Setelah itu, pengguna dapat menyimpan file

tersebut dengan mengklik button simpan. Untuk membuka file yang yang telah

disimpan, pengguna dapat mengklik button buka.

5.2 Pembahasan

Berdasarkan proses pengujian yang dilakukan, maka dapat diperoleh

(59)

1. Nilai p yang berbeda dapat mempengaruhi tingkat relevansi dari suatu

dokumen.

2. Operator “OR” akan menghasilkan nilai indeks yang jauh lebih besar dari

pada nilai indeks yang dihasilkan oleh operator “AND”. Dengan

menggunakan operator “OR” maka hasil yang diperoleh merupakan dokumen

yang memiliki salah satu atau kedua kata yang dicari;

3. Operator “AND” akan menghasilkan nilai indeks yang lebih kecil daripada

nilai indeks yang dihasilkan oleh operator “OR”. Dengan menggunakan

operator “AND” maka hasil yang diperoleh merupakan dokumen yang

memiliki kedua kata yang dicari;

4. Hasil uji coba untuk operator “AND“ menunjukkan bahwa semakin tinggi

nilai p menyebabkan nilai bobot dokumen semakin menurun. Karena nilai

rentang untuk bobot [0,1] maka semakin tinggi nilai p mengakibatkan nilai

bobot mendekati “0”. Dengan kata lain untuk p mendekati ∞ (tak hingga)

mengakibatkan nilai bobot akan sama dengan 0. Tentu hal ini akan

mempengaruhi tingkat relevansi dokumen. Demikian juga, karena rentang

nilai bobot [0,1], maka nilai bobot yang lebih kecil bila dipangkatkan dengan

nilai p-norm yang semakin besar akan menghasilkan nilai bobot yang

semakin kecil, sehingga rumus RSV dari p-norm akan dipengaruhi oleh bobot

(60)

BAB VI

KESIMPULAN DAN SARAN

6.1 Kesimpulan

Setelah menyelesaikan penelitian pada skripsi ini, maka dapat ditarik

beberapa kesimpulan berikut:

1. Dengan menggunakan information retrieval system, maka dapat dilakukan

pencarian dokumen yang relevan dengan kata kunci yang dimasukkan.

2. Aplikasi dapat digunakan untuk menghitung indeks dan bobot dari suatu

dokumen.

3. Aplikasi yang dibuat dapat menerapkan metode Savoy untuk menghasilkan

dokumen terurut yang sulit dikerjakan dengan perhitungan manual akibat

jumlah dokumen yang banyak.

4. Keunggulan dari program yang dibuat mencakup:

a. Program dapat digunakan untuk menguji pengaruh nilai p terhadap hasil

pencarian.

b. Program mampu melakukan pencarian terhadap file berekstensi *.txt dan

*.doc.

5. Operator “OR” akan menghasilkan nilai indeks yang jauh lebih besar daripada

nilai indeks yang dihasilkan oleh operator “AND”. Dengan menggunakan

operator “OR” maka hasil yang diperoleh merupakan dokumen yang memiliki

salah satu atau kedua kata yang dicari.

6. Operator “AND” akan menghasilkan nilai indeks yang lebih kecil daripada

(61)

operator “AND” maka hasil yang diperoleh merupakan dokumen yang

memiliki kedua kata yang dicari;

7. Untuk operator “AND“ pada metode Savoy, semakin tinggi nilai p

menyebabkan nilai bobot dokumen semakin menurun.

6.2 Saran

Beberapa saran yang berhubungan dengan pengembangan sistem lebih

lanjut adalah:

1. Untuk menemukan informasi yang akan dicari, user sebaiknya menggunakan

rumus Savoy karena akan lebih memudahkan dan mempersingkat proses

pencarian informasinya.

2. Perlu dicari teknik-teknik lain untuk memperbaiki kinerja teknik frekuensi dan

savoy.

3. Perlu dikembangkan atau dicari alternatif lain untuk teknik Boolean peringkat

(62)

Amsyah, Zulkifli, 2009, Manajemen Sistem Informasi, PT. Gramedia Pustaka Utama.

Assauri, Sofyan, 2009, Manajemen Pemasaran (Dasar, Konsep dan Strategi), Penerbit PT. Grafindo Persada, Jakarta.

Baridwan, Z. 2008, Sistem Akuntansi Penyusunan Prosedur dan Metode, Cetakan Kelima, Edisi Kelima, Penerbit BPFE, Yogyakarta.

Hartono J, 2009, Analisis dan Desain Sistem Informasi, Penerbit Andi Offset, Yogyakarta.

Junindar, 2008, Panduan Lengkap Menjadi Programmer Membuat Aplikasi Penjualan Menggunakan VB.Net. Cetakan ke-3. Media Kita, Jakarta.

McLeod, Jr. R., 2008, Sistem Informasi Manajemen, Jilid 1, Edisi 7, Prenhallindo, Jakarta.

Sutabri, T., 2010, Analisa Sistem Informasi, Andi Offset, Yogyakarta.

gerlan1986.files.wordpress.com/2010/03/pencarian-searching.ppt

http://repository.ui.ac.id/dokumen/lihat/6396.pdf

http://www.cs.ui.ac.id/WebKuliah/textpro/PT08-MODEL.pdf