DENGAN METODE EXTENDED BOOLEAN DAN SAVOY
SKRIPSI
Oleh :
DELAVENIA LUIS
1145028
PROGRAM STUDI SISTEM INFORMASI
SEKOLAH TINGGI MANAJEMEN INFORMATIKA DAN KOMPUTER STMIK TIME
MEDAN 2015
i
Information Retrieval System digunakan untuk menemukan kembali informasi - informasi yang relevan terhadap kebutuhan pengguna dari suatu kumpulan informasi secara otomatis. Salah satu hal yang perlu diingat adalah bahwa informasi yang diproses terkandung dalam sebuah dokumen yang bersifat tekstual. Pengguna information retrieval system sangat bervariasi dengan kebutuhan informasi. Akan tetapi, yang menjadi masalah adalah bagaimana teknik mendapatkan informasi tersebut, teknik pengindeksan istilah, teknik pembobotan dokumen dan bagaimana memilih dokumen yang paling relevan sesuai dengan query yang diberikan. Metode penelitian yang digunakan adalah metode Waterfall. Dalam penelitian ini, yang dijelaskan adalah pengindeksan berdasarkan istilah indeks. Pemberian bobot dokumen dilakukan untuk mengetahui tingkat relevansi dokumen sesuai query yang diberikan dan akan dilakukan secara frekwensi dan rumus savoy. Kemudian, dokumen yang telah diindeks dan ditentukan bobotnya, untuk mendapatkan informasi (dokumen) yang dibutuhkan, dilakukan teknik boolean peringkat. Hasil penelitian ini adalah sebuah aplikasi information retrieval system yang dapat melakukan pencarian dokumen yang relevan dengan kata kunci yang dimasukkan.
ii
ABSTRACT
Information Retrieval System is used to retrieve information that is relevant to user needs automatically from a set of information. The information that will be processed are textual documents. The user could retrieve variants information according to the needs. Whereas, the problem is how to achieve those information, indexing technique, document weighted technique, and how to choose the relevant document according to the given query. This research aims to generate index and weight from a file that is needed in indexing process, find and determine file which is relevant to query given with savoy method. This research used Waterfall model. The result of this research is an application of information retrieval system that could be used to search relevant document with input keywords.
iii
Puji dan syukur penulis panjatkan kehadirat Tuhan Yang Maha Esa yang
telah memberikan hidayah-Nya sehingga penulis dapat menyelesaikan skripsi ini
dengan judul : “Perancangan Information Retrieval System dengan Metode
Extended Boolean dan Savoy”
Skripsi ini disusun untuk melengkapi persyaratan studi program Strata 1
(S-1) Sekolah Tinggi Manajemen Informatika Komputer (STMIK) TIME Medan.
Penulis menyadari bahwa dalam penulisan skripsi ini banyak menemukan
kesulitan-kesulitan dan kekurangan pada penulisan. Namun, berkat bantuan dan
dorongan dari berbagai pihak, akhirnya penulis dapat menyelesaikannya dengan
baik.
Oleh karena itu, dalam kesempatan ini penulis ingin mengucapkan terima
kasih yang sebesar-besarnya kepada :
1. Bapak Hendri, M.Kom, selaku Pembimbing I yang telah memberikan saran dan masukan, pendidikan serta bimbingan dalam penulisan skripsi
ini maupun pemrograman skripsi ini.
2. Bapak Huliman, M.Kom, selaku Pembimbing II yang telah memberikan saran dan masukan, pendidikan serta bimbingan dalam penulisan skripsi
ini.
3. Bapak Simon Kanggali, selaku Ketua Yayasan STMIK TIME Medan 4. Bapak Prof. Chainur Arrasyid, S. H. , selaku Ketua BPH STMIK TIME
iv
5. Bapak Prof. Harlem Marpaung, Ph. D, selaku Ketua STMIK TIME Medan 6. Bapak Jackri Hendrik, ST, M.Kom, selaku Pembantu Ketua I STMIK
TIME Medan
7. Ibu Feriani Astuti Tarigan, S. Kom, M.Kom, selaku Ketua Program Studi Sistem Informasi STMIK TIME Medan
8. Kepada staf perusahaan yang selama ini telah membantu penulis dalam menyelesaikan penulisan skripsi
9. Orangtua dan teman-teman mahasiswa serta seluruh dosen di STMIK TIME yang telah banyak memberikan dukungan dan saran untuk penulis
Penulis menyadari tanpa adanya dukungan dari teman-teman sekalian
semua ini tidak akan terwujud. Hanya dengan doa kepada Tuhan Yang Maha Esa
penulis memohon agar kebaikan dan bimbingan dari teman-teman semua dapat
dibalas dengan kebahagiaan dan kesehatan. Akhir kata, penulis mengucapkan
terimakasih sebesar-besarnya kepada semua pihak yang telah membantu terhadap
penyelesaian penulisan skripsi ini.
Medan, Mei 2015
Penulis,
v
ABSTRAK ... i
ABSTRACT... ii
KATA PENGANTAR ... iii
DAFTAR ISI ... v
DAFTAR GAMBAR ... vii
DAFTAR TABEL ... viii
DAFTAR LAMPIRAN ... ix
BAB I PENDAHULUAN ... 01 1.1. Latar Belakang Masalah ... 01 1.2. Identifikasi Masalah ... 02 1.3. Batasan Masalah ... 02 1.4. Tujuan dan Manfaat Penelitian ... 03 1.5. Sistematika Penulisan ... 04 BAB II LANDASAN TEORI ... 06 2.1. Perancangan ... 06 2.2. Sistem ... 06 2.3. Pencarian ... 7
2.4. Informasi ... 8
2.5. Metode ... 10
2.6. Information Retrieval System ... 10
2.7. Metode Extended Boolean ... 16
2.8. Metode Savoy ... 17
2.9. Bahasa Pemrograman ... 20
BAB III METODE PENELITIAN ... 22
3.1. Tempat dan Jadwal Penelitian ... 22
3.2. Kerangka Kerja ... 22
3.2.1. Metode Pengumpulan Data ... 23
3.2.2. Analisa Sistem ... 23
vi
3.2.5. Uji Coba Sistem ... 26
BAB IV ANALISIS DAN PERANCANGAN ... 27
4.1. Analisa ... 27
4.2. Perancangan ... 32
4.2.1. Perancangan Proses ... 32
4.2.2. Perancangan Tabel Pada Database ... 34
4.2.3. Perancangan Antarmuka ... 35
BAB V HASIL DAN PEMBAHASAN ... 41
5.1. Hasil ... 41
5.2. Pembahasan ... 46
BAB V1 KESIMPULAN DAN SARAN ... 50
6.1. Kesimpulan ... 50
6.2. Saran ... 51 DAFTAR PUSTAKA
vii
Gambar 2.1. Ilustrasi Sistem Temu Kembali ... 11
Gambar 2.2. Outline Information Retrieval System ... 14
Gambar 2.3. Komponen Information Retrieval System ... 15
Gambar 2.4. Interaksi anatara Pengguna dengan Sistem ... 16
Gambar 3.1. Kerangka Kerja Penelitian ... 22
Gambar 3.2. Flowchart Sistem Usulan ... 25
Gambar 4.1. Activity Diagram ... 33
Gambar 4.2. Use Case Diagram ... 34
Gambar 4.3. Rancangan Form Open ... 35
Gambar 4.4. Form Teori ... 36
Gambar 4.5. Form Input Data ... 37
Gambar 4.6. Form Proses ... 38
Gambar 4.7. Form Setting ... 39
Gambar 4.8. Form Tabel ... 40
Gambar 5.1. Tampilan Menu Utama... 41
Gambar 5.2. Tampilan Form Teori Information Retrieval System Halaman 1 dari 4 ... 42
Gambar 5.3. Tampilan Form Teori Information Retrieval System Halaman 2 dari 4 ... 43
Gambar 5.4. Tampilan Form Teori Information Retrieval System Halaman 3 dari 4 ... 43
Gambar 5.5. Tampilan Form Teori Information Retrieval System Halaman 4 dari 4 ... 44
Gambar 5.6. Tampilan Form Input Data ... 45
Gambar 5.7. Tampilan Form Kumpulan File ... 46
Gambar 5.8. Tampilan Form Proses ... 46
Gambar 5.9. Tampilan Form Open ... 47
viii
DAFTAR TABEL
Tabel 2.1. Teknik P-Norm ... 16 Tabel 3.1. Jadwal Penelitian ... 22 Tabel 4.1. Tabel Database ... 34
ix
Lampiran 1 : Daftar Riwayat Hidup Mahasiswa
Lampiran 2 : Surat Keputusan Dosen Pembimbing Skripsi
Lampiran 3 : Surat Keterangan dari Perusahaan
Lampiran 4 : Kartu Bimbingan Skripsi
1
BAB I
PENDAHULUAN
1.1. Latar Belakang Masalah
Semakin banyaknya data dan informasi saat ini menyebabkan masyarakat
mengalami kesulitan memperoleh informasi yang cepat, padat, dan relevan
dengan kebutuhannya. Untuk mengatasi hal tersebut, diperlukan suatu information
retrieval system yang dapat mengakses dan menyediakan berbagai informasi
sesuai kebutuhan pengguna. Saat ini, sumber informasi tersebut dapat diakses
secara elektronik melalui World Wide Web (WWW) ataupun internet dengan
menggunakan berbagai mesin penelusuran (search engine). Perbedaan mesin
penelusuran yang satu dengan yang lain sangat tergantung pada teknik pencarian
informasi dan teknik pengindeksan yang dipakai.
Information retrieval system merupakan suatu sistem yang berfungsi untuk
menemukan kembali informasi yang relevan dengan kebutuhan pemakai. Dalam
hal ini, temu kembali informasi berkaitan dengan representasi, penyimpanan, dan
akses terhadap representasi dokumen. Dokumen yang ditemukan tidak dapat
dipastikan apakah relevan dengan kebutuhan informasi pengguna yang dinyatakan
dalam query. Pengguna information retrieval system sangat bervariasi sesuai
dengan kebutuhan yang berbeda-beda.
Salah satu cara untuk mengurutkan dokumen pada information retrieval
system adalah dengan menggunakan metode Savoy, dimana harus ditentukan
terlebih dahulu jumlah kata dan dokumen yang ada. Setelah itu, akan dihitung
Setelah itu, untuk mendapatkan informasi dari dokumen yang dibutuhkan akan
dilakukan teknik extended boolean sesuai P-Norm. Teknik ini akan mengurutkan
dokumen yang diinginkan dan nilai P-Norm akan menentukan di urutan ke
berapakah dokumen tersebut berada.
Berdasarkan uraian di atas, penulis tertarik untuk melakukan penelitian
dengan mengambil judul “Perancangan Information Retrieval System dengan
Metode Extended Boolean dan Savoy”.
1.2. Identifikasi Masalah
Berdasarkan latar belakang di atas, maka permasalahan dalam penelitian
ini dapat dirumuskan sebagai berikut.
1. Bagaimana menentukan indeks dari suatu dokumen. 2. Bagaimana menentukan bobot dari suatu dokumen.
3. Bagaimana menentukan dokumen yang relevan sesuai dengan query yang diberikan.
4. Bagaimana merancang suatu sistem dengan menggunakan metode savoy untuk menghasilkan dokumen terurut yang sulit dikerjakan dengan
perhitungan manual akibat jumlah dokumen yang banyak.
1.3. Batasan Masalah
Ruang lingkup permasalahan dalam merancang sistem ini, yaitu :
a. Teknik pengindeksan dengan istilah indeks, dimana tahapannya adalah dengan pengambilan kata dari kumpulan dokumen, pembuangan kata yang tidak perlu
b. Teknik pembobotan dilakukan dengan Metode Savoy.
c. Penggunaan Extended Boolean disesuaikan dengan P-Norm untuk mendapatkan informasi yang dibutuhkan.
d. Pengujian menggunakan file berekstensi *.doc dan *.docx dengan kapasitas maksimum 2Mb.
e. Pengujian file menggunakan Bahasa Indonesia.
f. Peng-input-an nilai P-Norm memiliki batasan maksimal 3 digit bilangan bulat positif agar pada saat pencarian kata tidak memakan waktu yang terlalu lama.
g. Pembobotan boolean hanya menggunakan operator “OR” dan “AND” saja karena pencarian dua buah kata secara sekaligus.
h. Perangkat lunak akan menampilkan hasil perbandingan dari teknik yang digunakan sebanyak 1 dokumen per halamannya karena jika dokumennya
banyak maka tidak akan mencukupi untuk menampilkan secara keseluruhan.
i. Hasil proses perhitungan dari perangkat lunak akan disimpan ke dalam sebuah file data dengan ekstensi *.txt.
j. Hasil pencarian dapat disimpan sehingga untuk pencarian query yang sama tidak harus mengulang kembali lagi.
k. Perangkat lunak dibuat dengan menggunakan bahasa pemrograman Microsoft Visual Basic 2008.
1.4. Tujuan dan Manfaat
Adapun tujuan dari penelitian ini adalah untuk merancang sebuah
information retrieval system dengan metode savoy.
1. Bagi penulis
Penelitian ini akan meningkatkan wawasan dan pengetahuan penulis
mengenai information retrieval system dan juga meningkatkan kemampuan
penulis dalam membuat aplikasi dengan menggunakan Microsoft Visual
Basic.NET 2008.
2. Bagi STMIK TIME
Penelitian ini dapat dijadikan sebagai referensi bagi mahasiswa lainnya yang
ingin mengangkat topik mengenai information retrieval system.
3. Bagi masyarakat
Dapat mengetahui lebih jelas dan terperinci serta dapat menambah
pengetahuan mengenai teknik pengindeksan dan pembobotan pada
information retrieval system.
1.5. Sistematika Penulisan
Rincian penulisan laporan skripsi ini meliputi beberapa bab, yaitu :
BAB I PENDAHULUAN
Bab ini membahas tentang latar belakang masalah, identifikasi
masalah, batasan masalah, tujuan dan manfaat serta sistematika
penulisan.
BAB II LANDASAN TEORI
Bab ini berisi tentang penjelasan singkat mengenai perancangan,
sistem, pencarian, informasi, metode Extended Boolean, metode
BAB III METODE PENELITIAN
Bab ini berisi uraian tentang tempat dan jadwal penelitian,
kerangka kerja, metode pengumpulan data, analisa sistem,
perancangan sistem, pembangunan sistem, dan uji coba sistem.
BAB IV ANALISA DAN PERANCANGAN SISTEM
Bab ini berisi analisa sistem, perancangan activity diagram,
perancangan use case diagram, perancangan tabel pada database,
perancangan menu, dan perancangan antarmuka.
BAB V HASIL DAN PEMBAHASAN
Bab ini berisi kebutuhan sistem, tampilan output sistem yang
dibuat, cara penggunaan, dan hasil penelitian.
BAB VI KESIMPULAN DAN SARAN
Bab ini berisi kesimpulan dan saran terhadap penelitian yang telah
6
LANDASAN TEORI
2.1. Perancangan
Perancangan sistem merupakan penggambaran, perencanaan dan
pembuatan sketsa atau pengaturan dari beberapa elemen yang terpisah ke dalam
satu kesatuan yang utuh dan berfungsi. (Hartono, 2009: 196)
Tahap perancangan sistem mempunyai dua maksud atau tujuan utama
yaitu:
1. Untuk memenuhi kebutuhan pemakai sistem.
2. Untuk memberikan gambaran yang jelas dan rancang bangun yang lengkap kepada pemrograman komputer dan ahli-ahli teknik lainnya yang terlibat.
Untuk memahami tujuan ini, analisa sistem harus dapat mencapai sasaran-
sasaran sebagai berikut:
1. Perancangan sistem harus berguna, mudah dipahami dan nantinya mudah digunakan.
2. Perancangan sistem harus dapat mendukung tujuan utama perusahaan sesuai dengan yang didefiniskan pada tahap perencanaan sistem yang dilanjutkan
pada tahap analisa sistem.
2.2. Sistem
Sistem berasal dari bahasa Yunani yaitu “sistema” yang artinya kesatuan.
berhubungan, berkumpul bersama-sama untuk melakukan kegiatan atau untuk
mencapai suatu sasaran tertentu. Ada berbagai macam definisi mengenai sistem.
Sistem pada dasarnya adalah sekelompok unsur yang erat hubungannya
satu dengan yang lain, yang berfungsi bersama-sama untuk mencapai tujuan
tertentu. (Sutabri, 2010: 9)
Sistem adalah jaringan kerja dari prosedur-prosedur yang saling
berhubungan, berkumpul bersama-sama untuk melakukan kegiatan dalam rangka
mencapai tujuan tertentu. (Baridwan, 2008: 3)
Sistem mempunyai beberapa komponen, diantaranya adalah :
1. Perangkat keras, meliputi CPU, disk, terminal, printer, dan tape.
2. Perangkat lunak meliputi sistem operasi, sistem database, program pengontrol komunikasi, dan program aplikasi.
3. Personil meliputi orang yang mengoperasikan sistem, menyediakan masukan, dan melakukan aktivitas manual yang mendukung sistem.
4. Data meliputi komponen yang harus tersimpan dalam sistem selama jangka waktu tertentu.
5. Prosedur meliputi instruksi dan kebijakan untuk mengoperasikan sistem. Jadi, sistem merupakan kumpulan dari bagian-bagian atau elemen-elemen yang
saling berhubungan dan terpadu untuk mencapai suatu tujuan tertentu.
2.3. Pencarian
Pencarian (searching) merupakan pekerjaan yang sering dilakukan dalam
kehidupan sehari-hari. Dalam text editor, sering dilakukan pekerjaan untuk
mencari kata tertentu dan menghitung frekuensi kemunculan kata tersebut dalam
dokumen. Windows explorer dan internet explorer dalam sistem operasi Windows
menggunakan prinsip pencarian dalam melakukan pekerjaan dimaksud.
Dalam ilmu komputer, metode pencarian (searching) ada
bermacam-macam. Secara garis besar, metode pencarian data dapat dibagi menjadi 2 bagian,
yaitu:
1. Metode pencarian data tanpa penempatan data, terdiri dari: a. Metode pencarian Linier (Linear / Sequential Search) b. Metode pencarian Biner (Binary Search)
c. Metode pencarian Interpolasi (Interpolation Search) 2. Metode pencarian data dengan penempatan data, terdiri dari:
a. Metode pencarian Langsung (Direct Search) b. Metode pencarian Relatif (Hash Search)
Masing-masing metode memiliki kelebihan dan kekurangan. Metode
pencarian (searching) yang memiliki efisiensi penggunaan tempat yang lebih baik
adalah metode pencarian relatif (Hash Search).
(gerlan1986.files.wordpress.com/2010/03/pencarian-searching.ppt)
2.4. Informasi
Istilah informasi berasal dari bahasa Inggris ”to inform” yang artinya
dalam Bahasa Indonesia adalah ”memberitahukan”. Informasi merupakan hal
yang sangat penting bagi manajemen di dalam pengambilan keputusan.
Informasi merupakan bagian yang terpenting di dalam sebuah organisasi.
yang kurang memperoleh informasi akan ketinggalan dan akhirnya berakhir.
Robert N. Anthony dan John Dearden menyebut keadaan dari sistem dalam
hubungannya dengan keberakhirannya dengan istilah entropy yang disebut
negative entropy. (Baridwan, 2008: 4)
Informasi adalah data yang sudah diproses menjadi bentuk yang berguna
bagi pemakai dan mempunyai nilai pikir yang nyata bagi pembuatan keputusan
pada saat sedang berjalan atau untuk prospek masa depan. Definisi tersebut
menekankan kenyataan bahwa data harus diproses dengan cara-cara tertentu untuk
menjadi informasi dalam bentuk dan nilai yang berguna bagi pemakai. (Amsyah,
2009: 289)
Informasi merupakan suatu data yang telah diproses dan mempunyai arti
tertentu. (Mcleod, 2008: 12)
Sumber dari informasi adalah data. Data merupakan bentuk jamak dari
bentuk tunggal data, yaitu item ataupun datum. Data adalah kenyataan yang
mengambarkan suatu kejadian-kejadian dan kesatuan nyata. Kejadian-kejadian
nyata yang sering terjadi adalah perubahan dari suatu nilai yang disebut dengan
transaksi.
Jadi, hal yang terpenting untuk membedakan informasi dengan data,
informasi itu mempunyai kandungan “makna” dan data tidak mempunyai
“makna”. Makna artinya output (sebagai penunjang sistem). Pengertian makna
di sini merupakan hal yang sangat penting, karena berdasarkan makna inilah
penerima dapat memahami informasi tersebut dan secara lebih jauh dapat
menggunakannya untuk menarik suatu kesimpulan atau bahkan mengambil
2.5. Metode
Metode berasal dari bahasa Yunani “Methodos” yang berarti cara atau
jalan yang ditempuh. Upaya ilmiah berhubungan dengan metode yang
menyangkut masalah cara kerja untuk dapat memahami objek yang menjadi
sasaran ilmu yang bersangkutan. Fungsi metode adalah sebagai alat untuk
mencapai tujuan.
Menurut Kamus Besar Bahasa Indonesia, metode adalah cara kerja yang
bersistem untuk memudahkan pelaksanaan suatu kegiatan guna mencapai tujuan
yang ditentukan. Menurut artikata.com, metode adalah cara teratur yang
digunakan untuk melaksanakan suatu pekerjaan agar tercapai sesuai dengan yang
dikehendaki.
2.6. Information Retrieval System
Information Retrieval System merupakan sistem yang berfungsi untuk
menemukan informasi yang relevan dengan kebutuhan pemakai. Salah satu hal
yang perlu diingat adalah bahwa informasi yang diproses terkandung dalam
sebuah dokumen yang bersifat tekstual. Dalam konteks ini, temu kembali
informasi berkaitan dengan representasi, penyimpanan, dan akses terhadap
dokumen representasi dokumen. Dokumen yang ditemukan tidak dapat dipastikan
apakah relevan dengan kebutuhan informasi pengguna yang dinyatakan dalam
query. Pengguna Sistem Temu Kembali sangat bervariasi dengan kebutuhan
informasi yang berbeda-beda.
Misalkan ada sebuah kumpulan dokumen dan seorang user yang
pertanyaan tersebut adalah sekumpulan dokumen yang relevan dan membuang
dokumen yang tidak relevan.
Secara matematis hal tersebut dapat dituliskan sebagai berikut:
Q → n 2 D ... (2.1) Dimana : Q = pertanyaan (query) D = dokumen n = jumlah dokumen
2n = jumlah kemungkinan himpunan bagian dari dokumen yang ditemukan
Sistem Temu Kembali pada dasarnya dibagi dalam dua komponen utama
yaitu sistem pengindeksan (indexing) yang menghasilkan basis data sistem dan
temu kembali yang merupakan gabungan dari user interface dan look-up-table.
Pada bagian selanjutnya akan dijelaskan mengenai sistem pengindeksan dan
teknik temu kembali informasi. Gambar 2.1 menunjukkan ilustrasi information
retrieval system.
Gambar 2.1 Ilustrasi Sistem Temu Kembali
Sistem Temu Kembali didesain untuk menemukan dokumen atau informasi
yang diperlukan oleh masyarakat pengguna. Information retrieval system
bertujuan untuk menghubungkan kebutuhan informasi pengguna dengan sumber
informasi yang tersedia dalam situasi sebagai berikut.
1. Penulis mempresentasikan sekumpulan ide dalam sebuah dokumen menggunakan sekumpulan konsep.
2. Terdapat beberapa pengguna memerlukan ide yang dikemukakan oleh penulis tersebut, tapi mereka tidak dapat mengidentifikasikan dan menemukannya
dengan baik.
3. Information retrieval system bertujuan untuk mempertemukan ide yang dikemukakan oleh penulis dalam dokumen dengan kebutuhan informasi
pengguna yang dinyatakan dalam bentuk pertanyaan (query).
Berkaitan dengan sumber informasi di satu sisi dan kebutuhan informasi
pengguna di sisi yang lain, information retrieval system berperan untuk:
1. Menganalisa isi sumber informasi dan pertanyaan pengguna.
2. Mempertemukan pertanyaan pengguna dengan sumber informasi untuk mendapatkan dokumen yang relevan.
Adapun fungsi utama information retrieval system adalah sebagai berikut.
1. Mengidentifikasi sumber informasi yang relevan dengan minat masyarakat pengguna yang ditargetkan.
2. Menganalisa isi sumber informasi (dokumen).
3. Merepresentasikan isi sumber informasi dengan cara tertentu yang memungkinkan untuk dipertemukan dengan pertanyaan (query) pengguna.
4. Merepresentasikan pertanyaan (query) pengguna dengan cara tertentu yang memungkinkan untuk dipertemukan sumber informasi yang terdapat dalam
basis data.
5. Mempertemukan pernyataan pencarian dengan data yang tersimpan dalam basis data.
6. Menemu-kembalikan informasi yang relevan.
7. Menyempurnakan unjuk kerja sistem berdasarkan umpan balik yang diberikan oleh pengguna.
Information retrieval system terdiri dari 6 (enam) subsistem, yaitu:
1. Subsistem dokumen 2. Subsistem pengindeksan 3. Subsistem kosa kata 4. Subsistem pencarian
5. Subsistem antarmuka pengguna-sistem 6. Subsistem penyesuaian
Dokumen sebagai objek data dalam Information retrieval system
merupakan sumber informasi. Dokumen biasanya dinyatakan dalam bentuk indeks
atau kata kunci. Kata kunci dapat diekstrak secara langsung dari teks dokumen
atau ditentukan secara khusus oleh spesialis subjek dalam proses pengindeksan
yang pada dasarnya terdiri dari proses analisa dan representasi dokumen.
Pengindeksan dilakukan dengan menggunakan sistem pengindeksan
tertentu, yaitu himpunan kosa kata yang dapat dijadikan sebagai bahasa indeks
sehingga diperoleh informasi yang terorganisasi. Sementara itu, pencarian diawali
retrieval system berfungsi untuk menganalisa pertanyaan (query) pengguna yang
merupakan representasi dari kebutuhan informasi untuk mendapatkan
pernyataan-pernyataan pencarian yang tepat. Selanjutnya pernyataan-pernyataan-pernyataan-pernyataan pencarian
tersebut dipertemukan dengan informasi yang telah terorganisasi dengan suatu
fungsi penyesuaian (matching function) tertentu sehingga ditemukan dokumen
atau sekumpulan dokumen (http://repository.ui.ac.id/dokumen/lihat/6396.pdf).
Proses tersebut di atas dapat diilustrasikan pada gambar 2.2
Gambar 2.2 Outline Information Retrieval System
Sumber : http://repository.ui.ac.id/dokumen/lihat/6396.pdf
Sementara itu, Information retrieval system dapat juga didefinisikan
sebagai suatu proses yang terdiri dari 6 (enam) komponen utama yaitu:
1. Kumpulan dokumen 2. Pengindeksan
3. Kebutuhan informasi pemakai 4. Strategi pencarian
6. Penilaian relevansi
Secara garis besar komponen - komponen information retrieval system
dapat diilustrasikan pada gambar 2.3
Gambar 2.3 Komponen Information Retrieval System
Sumber : http://repository.ui.ac.id/dokumen/lihat/6396.pdf
Proses pencarian informasi terjadi interaksi antara pengguna dengan
sistem (mesin), baik secara langsung maupun tidak langsung. Interaksi antara
pengguna dengan sistem dalam proses pencarian informasi dapat dinyatakan
Gambar 2.4 Interaksi antara Pengguna dengan Sistem
Sumber : http://repository.ui.ac.id/dokumen/lihat/6396.pdf
2.7. Metode Extended Boolean
Model Extended Boolean berdasarkan model P-norm merupakan
pengembangan lebih lanjut dari model Boolean. Teknik ini memakai operator
yang dikomputasi berdasarkan rumus Savoy (1993). Rumus masing-masing
operator dapat dilihat pada tabel 2.2
Tabel 2.1 Teknik P-Norm
Query Retrieval Status Value (RSV)
A or <p> B p p ib p ia W W 2 RSVor = + A and <p> B p p ib p ia W W 2 ) 1 ( ) 1 ( 1 RSVand = − − + − Not A RSVnot = 1−Wia
Dimana :
a. p adalah sebuah nilai yang dimasukkan pada query b. Wia adalah bobot istilah A dalam indeks pada dokumen Di
c. Wib adalah bobot istilah B dalam indeks pada dokumen Di
Untuk menentukan peringkat dapat dilakukan dengan dua cara, yaitu:
1. Langsung mengurutkan dokumen (descending) berdasarkan bobot dokumen yang didapat dengan rumus Retrieval Status Value (RSV).
2. Memakai rumus Learning Scheme :
∑ ∫
= + = r k ik 1 k init i init i) RSV (D ) norm*RSV (D ) RSV(D α n ..., 2, 1, i untuk = ……….. (2.2) dimana :a. RSVinit(Di) merupakan retrieval status value dari dokumen Di yang
dikomputasi berdasarkan rumus teknik retrieval P-norm model.
b. ∝ik merupakan bobot keterhubungan antara dokumen i dan k. Bobot
ketergantungan ini diperoleh dari nilai relevance link yang merupakan
hasil dari proses pembelajaran.
2.8. Metode Savoy
Nama lengkap Savoy adalah Profesor Jacques Savoy. Berikut adalah
riwayat hidup dari beliau.
a. Sejak 1992 : Profesor di University of Neuchatel, Fakultas Hukum dan Ilmu Ekonomi. Kunjungan profesor di Universitas Freiburg dan Universitas Jenewa
; * log * ik k k ik ik tf idf df n tf W = =
b. 1992 : Asisten Profesor di University of Montreal, Fakultas Graduate Studies, Departemen Ilmu Komputer dan Riset Operasional.
c. 1989-1991 : Asisten Profesor di University of Montreal, Departemen Ilmu Komputer dan Penelitian Operasional (lab incognito).
d. 1987-1989 : Fellow penelitian dari Swiss Dana Nasional untuk Penelitian Ilmiah di University of Montreal.
e. 1987 : Dr rer. pol. (Referensi : Summa cum laude), University of Freibourg. f. 1987 : Peluncuran pertama sistem hypertext francophone.
g. 1982 : Sarjana rer. pol. (Referensi :Summa cum laude), University of Freiburg.
Adapun kegiatan penelitiannya adalah sebagai penulis berbagai publikasi
mengenai informasi dan khususnya tentang informasi di dalam hypertext, dan
khususnya di Web, digunakan pendekatan yang logis serta analisa statistik dari
hasil pencarian.
Di dalam memberikan bobot pada sebuah istilah, terdapat berbagai macam
teknik pembobotan. Teknik pembobotan berdasarkan rumus Savoy (1993),
merepresentasikan bobot (Wik) dari setiap istilah k, dimana k=1, 2, …., t; dalam
sebuah dokumen i adalah:
……….. (2.3)
Keterangan :
a. Wik adalah bobot dari istilah k dalam dokumen i
) log( log nidfk n df n k = ij j ik ik tf Max tf ntf =
c. n adalah jumlah dokumen dalam kumpulan dokumen. d. dfk adalah jumlah dokumen yang mengandung istilah k.
Rumus di atas terdiri dari dua komponen yaitu tfik dan dfk, dimana kedua
komponen ini dinormalisasi dalam rentang [0, 1], menjadi :
Wik =ntfik*nidfk ……….. (2.4) dimana :
dan ……. (2.5)
dimana Maxjtfij adalah frekuensi istilah terbesar pada satu dokumen.
Pada teknik pembobotan ini, bobot istilah telah dinormalisasi, dengan
mempertimbangkan frekuensi kemunculan istilah di satu dokumen, tetapi juga
memperhatikan frekuensi terbesar pada suatu istilah-istilah lain di dokumen yang
sama. Selain itu, teknik ini juga memperhitungkan jumlah dokumen yang
mengandung istilah yang bersangkutan dan jumlah keseluruhan dokumen. Hal ini
berguna untuk mengetahui posisi relatif bobot istilah bersangkutan pada suatu
dokumen dibandingkan dengan dokumen-dokumen lain yang memiliki istilah
yang sama. Ini berarti, jika sebuah istilah mempunyai frekuensi kemunculan yang
sama pada dua dokumen, belum tentu mempunyai bobot yang sama.
1
15
15
ntf
k=
=
705373
,
0
)
1162
log(
8
1162
log
nidf
k=
=
705373
,
0
705373
,
0
*
1
=
=
ikW
2.9. Bahasa Pemrograman
Bahasa pemrograman berdasarkan tingkat ketergantungannya dengan
mesin bisa meliputi:
1. Machine-code languages
Merupakan bentuk terendah dari bahasa komputer. Setiap instruksi dalam
program direpresentasikan dengan kode numerik, yang secara fisik berupa
deretan angka 0 dan 1. Sekumpulan instruksi dalam bahasa mesin bisa
dibentuk menjadi microcode, yaitu semacam prosedur dalam bahasa mesin.
2. Assembly languages
Merupakan bentuk simbolik dari bahasa mesin. Setiap kode memiliki kode
simbolik, misalnya ADD untuk penjumlahan (addition) dan MUL untuk
perkalian (multiplication). Pada bahasa assembly tersedia alat bantu untuk
diagnostik (debug) yang tidak terdapat pada bahasa mesin. contoh software
yang ada untuk pengembangan dan debug bahasa assembly seperti Turbo
Assembler dari Borland, Macro Assembler dari Microsoft, Turbo Debugger.
3. High-level languages
Disebut tingkat tinggi karena lebih dekat dengan manusia. Memberikan
fasilitas yang lebih mudah, serta mudah dimengerti dan dipelajari oleh
pengguna. Pengguna tidak perlu mengetahui bagaimana representasi data ke
dalam bentuk internal di memori, karena pekerjaan tersebut ditangani oleh
suatu sistem yang mentranslasikan program bahasa tingkat tinggi ke dalam
4. Problem-oriented language
Memungkinkan penyelesaian untuk suatu masalah atau aplikasi yang spesifik,
contohnya Structured Query Language (SQL) untuk aplikasi database, Query
by Example (QBE).
(Junindar, 2008: 3)
Visual Basic.NET adalah generasi selanjutnya dari Visual Basic. Visual
Basic.Net memungkinkan kita untuk membangun aplikasi database client atau
server performa tinggi dan sangat cocok didampingkan dengan perangkat lunak
SQL Server 2000.
Pemilihan Visual Basic.NET sebagai program pengembang sistem ini
adalah karena merupakan salah satu program aplikasi yang berada di bawah
22
BAB III
METODE PENELITIAN
3.1. Tempat dan Jadwal Penelitian
Penelitian dimulai dari tanggal 01 Desember 2014 dan berakhir pada
tanggal 30 April 2015.
Tabel 3.1 Jadwal Penelitian
3.2. Kerangka Kerja
Adapun kerangka kerja yang dibuat penulis seperti gambar 3.1.
Gambar 3.1 Kerangka Kerja Penelitian Waktu Kegiatan Desember 2014 Januari 2015 Februari 2015 Maret 2015 April 2015 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 Identifikasi Masalah Pengumpulan Data Analisa Sistem Perancangan Sistem Pembangunan Sistem
Uji coba Sistem
Penulisan Laporan Skripsi
Analisa Sistem Pengumpulan Data
Perancangan Sistem
Pembangunan Sistem
Uji Coba Sistem Identifikasi Masalah
3.2.1. Metode Pengumpulan Data
Teknik pengumpulan data dapat didefinisikan sebagai suatu cara yang
digunakan untuk memperoleh data yang dibutuhkan sebagai bahan masukan bagi
penulis dalam penyusunan skripsi ini.
Proses dimulai dengan mengumpulkan data yang diperlukan dalam
penelitian. Adapun metode pengumpulan data dalam penelitian dilakukan melalui
Penelitian Kepustakaan (library research), yaitu penulis mengumpulkan data
melalui internet dan buku-buku yang relevan yang berhubungan dengan topik
yang dibahas, seperti buku Analisa Sistem Informasi karya Tata Sutabri dan
Modern Information Retrieval karya Ricardo Baeza-Yates, Berthier Ribeiro-Neto.
Pencarian pada internet dapat menggunakan keyword information retrieval system
dan metode Savoy.
3.2.2. Analisa Sistem
Pada sistem operasi Windows, terdapat fasilitas pencarian file dengan
menggunakan kata pencarian (keyword). Output yang dihasilkan berupa kumpulan
file yang isinya mengandung kata pencarian yang dimasukkan. Namun, output
yang dihasilkan tersebut tidak diurutkan berdasarkan derajat hubungan dari isi file
dengan kata pencarian.
Untuk itu, maka diperlukan sebuah information retrieval system. Proses
analisa terhadap sistem tersebut akan dimulai dari proses pembacaan data input.
Setelah itu, proses dilanjutkan dengan menampilkan langkah kerja proses
perhitungan dengan menggunakan metode Extended Boolean dan Savoy.
3.2.3. Perancangan Sistem
Perancangan perangkat lunak akan menggunakan metode Object Oriented
Diagram (OOD). OOD adalah metode untuk mengarahkan arsitektur software
yang didasarkan pada manipulasi objek-objek sistem atau subsistem. Objek
oriented dekomposisi dan notasi untuk menggambarkan model dari sistem yang
sedang dikembangkan. Struktur dikembangkan set objek dimana berkolaborasi
untuk menyediakan perilaku yang memenuhi persyaratan dari masalah.
Untuk melaksanakan OOD, ada beberapa langkah umum yang seharusnya
dilakukan :
a. Gambarkan setiap subsistem dan alokasinya pada processor dan task.
b. Pilih sebuah strategi desain untuk mengimplementasikan manajemen data,
interface support, dan manajemen task.
c. Desain suatu mekanisme kontrol yang tepat untuk sistem
d. Lakukan desain objek dengan membuat suatu representasi prosedural untuk
setiap operasi dan struktur data untuk setiap atribut klas.
e. Lakukan desain message menggunakan kolaborasi di antara objek-objek dan
hubungan objek (object relationships).
f. Buat messaging model.
g. Tinjau model desain dan ulangi jika dibutuhkan.
Flowchart sistem usulan yang dibuat dapat digambarkan seperti terlihat
Start
Hitung frekwensi kata dalam dokumen Input kata pencarian
Input lokasi pencarian Input nilai p
Hitung frekwensi terbesar 1 dokumen
Hitung jumlah seluruh dokumen
Jumlah dokumen yang mengandung kata yang dicari
If dicari bobot dokumen sesuai
operator then
Masukkan dokumen sebagai kandidat
Ya
Tidak
Urutkan dokumen kandidat
End
Gambar 3.2 Flowchart Sistem Usulan
3.2.4. Pembangunan Sistem
Proses dilanjutkan dengan melakukan coding terhadap perangkat lunak
merancang laporan yang diperlukan dengan menggunakan aplikasi Crystal Report
10. Jenis koneksi (data source) yang digunakan adalah koneksi Data Active
Object (DAO).
Sistem dibuat dengan menggunakan bahasa pemrograman Microsoft Visual Basic 2008 dan laporan dirancang dengan menggunakan aplikasi Crystal
Report 10 dan database dirancang dengan aplikasi Microsoft Access 2007.
3.2.5. Uji Coba Sistem
Proses dilanjutkan dengan melakukan coding terhadap perangkat lunak
untuk melakukan koneksi ke database dan melakukan proses testing and
debugging terhadap coding yang dirancang tersebut.
Proses diakhiri dengan melakukan proses passing data dari Microsoft Visual Basic 2008 ke aplikasi Crystal Report 10 untuk menampilkan laporannya.
Koneksi yang digunakan untuk melakukan passing data adalah koneksi
Data Active Object (DAO). Dalam proses perancangan perangkat lunak juga
diperlukan beberapa buah gambar yang digunakan sebagai dekorasi pada tombol
dan icon dari perangkat lunak. Gambar-gambar tersebut dicari dari berbagai
sumber seperti internet, buku teks, majalah dan sebagainya. Gambar tersebut
di-edit dan disimpan dengan menggunakan aplikasi Adobe Photoshop CS dengan
BAB IV
ANALISA DAN PERANCANGAN
4.1. Analisa
Sebelum merancang information retrieval system ini, maka terlebih dahulu
perlu dilakukan proses analisa terhadap permasalahan yang muncul, analisa
persyaratan yang harus dipenuhi oleh sistem, analisa proses dan pemodelan
sistem. Hal ini dilakukan agar sistem yang dirancang dapat sesuai dengan
kebutuhan yang diinginkan.
Secara umum sistem yang akan dibangun adalah menggunakan metode
Savoy, yaitu suatu metode yang bertujuan untuk menentukan bobot dari suatu
dokumen dan mengurutkannya berdasarkan nilai indeksnya. Sistem ini akan
dibangun menjadi sebuah alat bantu yang berkaitan dengan masalah pencarian
kata didalam dokumen. Sistem ini dapat mempermudah proses pencarian kata
yang diinginkan serta untuk mempermudah pengelompokkan dokumen
berdasarkan nilai indeksnya.
Contoh sederhana berikut dapat digunakn untuk membantu pemahaman
mengenai prosedur kerja dari metode Savoy, misalkan terdapat dua buah dokumen
yang akan dilakukan pembobotan dan pengindeksan. Isi dari kedua dokumen yang
digunakan tersebut dapat dirincikan sebagai berikut:
File 1 : File1.doc
Penelitian di Florida telah menemukan bahwa senyawa alami dalam buah
semangka, yaitu citrulline, yang membantu melebarkan dan merilekskan
darah ke seluruh tubuh. Penelitian lain dari University Kentucky juga
menunjukkan bahwa semangka baik dikonsumsi untuk menjaga berat badan dan
membantu kesehatan jantung.
File 2 : File2.doc
Melon dan semangka memiliki kandungan air yang cukup banyak sehingga baik
untuk mengatasi dehidrasi. Sayangnya, kandungan gula dalam keduanya cukup
tinggi (Indeks glikemik mencapai 65-100 persen), sehingga sangat tidak
disarankan bagi mereka yang memiliki diabetes atau memiliki riwayat keluarga
penderita diabetes untuk mengonsumsi buah ini.
Misalkan kata yang ingin dicari adalah: ‘melon’ dan ‘semangka’, maka proses
perhitungannya adalah sebagai berikut:
Jumlah File : melon = 1 (df1) semangka = 2 (df2) File 1 : melon = 0 semangka = 2 File 2 : melon = 1 semangka = 1
Jumlah keseluruhan File (n) : 2 Nilai p = 100 Proses penyelesaian : File 1 : melon : log(n/dfk) = log(2/1) = 0.3010299956639812 nidfk1 = 0.3010299956639812 / log(2) = 1 keterangan :
a. n adalah jumlah dokumen dalam kumpulan dokumen.
b. dfk adalah jumlah dokumen yang mengandung istilah k.
c. nidfk1 adalah normalisasi jumlah dokumen yang mengandung istilah k.
ntfk1 = 0/2 = 0
keterangan :
a. tfik adalah frekwensi dari istilah k dalam dokumen i.
b. ntfk1 adalah normalisasi frekwensi dari istilah k dalam dokumen i.
c. Maxjtfij adalah frekwensi istilah terbesar pada satu dokumen.
k ik ik ntf nidf W = * w1 = 0 x 1 = 0 semangka : log(n/dfk) = log (2/2) = 0 nidfk2 = 0 / log (2) = 0 ntfk1 = 2/2 = 1 k ik ik ntf nidf W = * w2 = 0.1 x 0 = 0 RSV = 1 – (((1 – w1)p + (1 – w2)p) / 2)1/np RSV = 1 – (((1 – 0)100 + (1 – 0)100 / 2)1/100 RSV = 0 Keterangan :
a. RSVinit(Di) merupakan retrieval status value dari dokumen Di yang
dikomputasi berdasarkan rumus teknik retrieval P-norm model.
b. ∝ik merupakan bobot keterhubungan antara dokumen i dan k. Bobot
ketergantungan ini didapat dari nilai relevance link yang merupakan hasil
File 2 : melon : log(n/dfk) = log(2/1) = 0.3010299956639812 nidfk1 = 0.3010299956639812 / log(2) = 1 ntfk1 = 2/2 = 1 k ik ik ntf nidf W = * w1 = 1 x 1 = 1 semangka : log(n/dfk) = log (2/2) = 0 nidfk2 = 0 / log (2) = 0 ntfk2 = 1/2 = 0.5
k ik ik ntf nidf W = * w2 = 0.5 x 0 = 0 RSV = 1 – (((1 – w1)p + (1 – w2)p) / 2)1/np RSV = 1 – (((1 – 1)100 + (1 – 0)100 / 2)1/100 RSV = 0.006907504562964073
Berdasarkan nilai RSV yang diperoleh maka dokumen dapat diurutkan sebagai
berikut:
1. File 2 : File2.txt
2. File 1 : File1.txt
4.2. Perancangan
Untuk menggambarkan dan memodelkan sistem yang dibuat, maka dapat
digunakan beberapa diagram Unified Modeling Language (UML), yang mencakup
activity diagram dan use case diagram.
4.2.1. Perancangan Proses
Untuk menggambarkan prosedur kerja dari sistem, maka akan digunakan
activity diagram. Gambar 4.1 berikut menunjukkan activity diagram dari
Meng-input lokasi pencarian
Menghitung jumlah kemunculan kata dalam dokumen
Menghitung jumlah kemunculan kata terbesar 1 dokumen
Menghitung jumlah seluruh dokumen
Menghitung jumlah dokumen yang mengandung kata yang dicari
Masukkan dokumen sebagai kandidat
Ya
Tidak
Urutkan dokumen kandidat
User Sistem
If dicari bobot dokumen sesuai operator then Meng-input kata kunci yang
dicari
Menampilkan lokasi pencarian yang dipilih
Menentukan fungsi logika pencarian
Menentukan nilai p
Gambar 4.1 Activity Diagram
Aktor yang terlibat dalam sistem ini hanya satu yaitu pemakai. Gambar 4.2
Gambar 4.2 Use Case Diagram
4.2.2. Perancangan Tabel pada Database
Tabel 4.1 merincikan database yang digunakan pada sistem. Rincian dari
database yang terdapat pada data flow diagram dari sistem ini dapat dilihat pada
table 4.1
Tabel 4.1 Tabel Database
Atribut Tipe Data Ukuran Data Keterangan
Nfile Text 25 Nama File
Nindeks Number 10 Nilai Indeks
Jkata Number 10 Jumlah Kata
NP Number 10 Nilai P
4.2.3. Perancangan Antarmuka
Antarmuka ini dirancang menggunakan bahasa pemrograman Visual Basic
2008. Dalam antarmuka sistem ini terdapat beberapa form, yaitu :
1. Form Open
2. Form Teori
3. Form Input Data
4. Form Proses
5. Form Setting
6. Form Tabel
Berikut ini adalah penjelasan mengenai form-form yang terdapat pada
perancangan antamuka, yaitu :
1. Form Open
Gambar 4.3 menunjukkan rancangan form Open.
Gambar 4.3 Rancangan Form Open
Keterangan :
2. Text, digunakan untuk memberikan informasi mengenai file yang
dimunculkan.
2. Form Teori
Gambar 4.4 menunjukkan rancangan form Teori.
Gambar 4.4 Rancangan Form Teori
Keterangan :
1. Button Back, digunakan untuk kembali kehalaman sebelumya.
2. Button Next, digunakan untuk lanjut kehalaman berikutnya.
3. Button Exit, digunakan untuk keluar dari form teori.
4. Text, digunakan untuk memberikan informasi mengenai teori dari
information retrieval dan metode savoy.
3. Form Input Data
Gambar 4.5 Rancangan Form Input Data
Keterangan :
1. Textbox, digunakan untuk menampilkan lokasi folder yang dicari.
2. Button Tambahkan ke List, digunakan untuk menambahkan folder yang
diinginkan kedalam list sistem.
3. Button Search, digunakan untuk memilih dan mengambil folder yang
diinginkan.
4. Button Hapus dari List, digunakan untuk menghapus folder yang telah
dipilih.
5. Rich Textbox, digunakan untuk menampilkan banyaknya folder yang telah
dipilih.
6. Button Keluar, digunakan untuk keluar dari proses input data.
7. Button Proses, digunakan untuk melakukan proses penyimpanan data
sementara untuk dapat dipergunakan kembali.
8. Check list, digunakan memilih apakah semua isi subfolder yang
4. Form Proses
Gambar 4.6 menunjukkan rancangan form Proses.
Gambar 4.6 Rancangan Form Proses
Keterangan :
1. Check list, digunakan untuk memilih apakah kata yang dicari ingin secara
utuh atau berdasarkan huruf besar dan huruf kecil.
2. Progress bar, digunakan untuk mengetahui waktu pemrosesan.
3. Button Tampil, digunakan untuk menampilkan dokumen apa saja yang
akan diproses oleh sistem.
4. Button Cari, digunakan untuk mencari kata yang diinginkan dan akan
diurutkan berdasarkan nilai indeksnya.
5. Button Batal, digunakan untuk membatalkan proses kerja sistem ini.
6. Label, digunakan untuk menampilkan nama file, isi file, lokasi file, nilai
indeks dan jumlah kata.
8. Button Back Page, digunakan untuk kembali kehalaman sebelumnya.
9. Button Show tabel, digunakan untuk menampilkan tabel hasil pencarian
kata.
10. Combo box, digunakan untuk menampilkan jumlah halaman dan dapat
dipilih untuk melompat kehalaman yang diinginkan.
5. Form Setting
Gambar 4.7 menunjukkan rancangan form Setting.
Gambar 4.7 Rancangan Form Setting
Keterangan :
1. Rich Textbox, digunakan untuk menampilkan dokumen yang telah dipilih
untuk diproses nantinya.
2. Button Keluar, digunakan untuk keluar dari menu form setting.
6. Form Tabel
Gambar 4.8 Rancangan Form Tabel
Keterangan :
1. Nilai P, digunakan untuk menginput banyaknya jumlah P yang ingin
dicari.
2. Hasil, digunakan untuk mengetahui informasi mengenai nama file, jumlah
kata1 dan kata2 serta nilai indeks.
3. Button Simpan, digunakan untuk menyimpan data yang telah diproses.
4. Button Buka, digunakan untuk membuka data yang telah disimpan
sebelumnya.
5. Button Proses, digunakan untuk menjalankan proses dari sistem tersebut.
BAB V
HASIL DAN PEMBAHASAN
5.1 Hasil
Saat sistem ini dijalankan, maka akan muncul tampilan menu utama
seperti .ada gambar 5.1
Gambar 5.1 Tampilan Menu Utama
Gambar 5.1, terdapat 3 menu utama, yaitu menu teori, menu penemuan
kembali dan menu keluar. Dalam menu teori terdapat 2 sub menu, yaitu
information retrieval dan metode savoy.
Untuk mengetahui teori dari information retrieval dan metode savoy,
pengguna dapat memilih menu teori. Untuk menjalankan program dapat memilih
menu penemuan kembali, dimana pada saat memilih menu tersebut, pengguna
dilakukan proses penginputan kata dan nilai P maka hasilnya akan langsung
dimunculkan. Untuk pencarian nilai P yang banyak maka pengguna harus memilih
menu tampilkan tabel yang ada didalam sistem. Untuk mengetahui mengenai
pembuat dapat memilih menu mengenai dan untuk keluar dari program dapat
memilih menu keluar. Untuk penjelasan lebih lanjut dapat dilihat pada tampilan
form seperti ditunjukkan gambar 5.2
Gambar 5.2 Tampilan Form Teori Information Retrieval System
Gambar 5.3 Tampilan Form Teori Information Retrieval System
Halaman 2 dari 4
Gambar 5.4 Tampilan Form Teori Information Retrieval System
Gambar 5.5 Tampilan Form Teori Information Retrieval System
Halaman 4 dari 4
Pada Form teori ini, pengguna dapat mengetahui informasi mengenai
information retrieval dan metode savoy dengan cara memilih menu teori dan
mengklik salah satu dari kedua submenu yang ada. Untuk meng-input data dan
Gambar 5.6 Tampilan Form Input Data
Pada form input data ini, pengguna akan mencari folder-folder mana saja
yang diperlukan dan mengklik folder tersebut untuk diproses oleh sistem. Untuk
mengecek secara keseluruhan isi dokumen maka pengguna harus menandai
checkbox yang ada disudut kiri bawah form yang bertuliskan “Cek semua
subfolder didalamnya” karena jika tidak menandainya, maka dokumen yang ada
didalam subfolder tidak akan diproses juga. Setelah itu, pengguna mengklik
Gambar 5.7 Tampilan Form Kumpulan File
Gambar 5.7 menunjukkan kumpulan-kumpulan file yang ada di dalam
folder yang telah dipilih oleh pengguna untuk diproses. Di dalam folder ini
terdapat data mengenai lokasi dokumen dan nama dokumen yang hanya
berekstensi .doc. Untuk keluar dari proses ini, pengguna dapat mengklik button
keluar.
Pada form proses seperti ditampilkan oleh gambar 5.8, pengguna akan
meng-input nilai P dan kata-kata apa saja yang akan dicari serta operator-operator
mana yang akan digunakan. Setelah itu, pengguna akan mengklik button cari dan
sistem akan menjalankan prosesnya dan akan memunculkan hasil pencariannya,
yaitu sistem akan memunculkan nama dokumen, lokasi dari file tersebut, nilai
indeksnya serta jumlah kata yang terdapat pada dokumen tersebut yang sudah
diurutkan berdasarkan nilai indeks dari yang terbesar ke yang paling kecil. Untuk
melihat halaman berikutnya, pengguna dapat mengklik button halaman berikutnya
dan jika pengguna ingin melihat secara acak halamannya maka dapat memilih
untuk melihat dari button untuk lompat ke halaman yang diinginkan.
Gambar 5.9 Tampilan Form Open
Pada form open seperti ditampilkan oleh gambar 5.9, sistem akan
kemudian hasilnya dapat dilihat oleh pengguna. Untuk keluar dari form ini,
pengguna dapat mengklik button keluar yang ada di dalam sistem.
Gambar 5.10 Tampilan Form Tabel
Form tabel seperti ditampilkan oleh gambar 5.10, berfungsi untuk
menampilkan hasil pencarian nilai P dalam jumlah banyak. Di sini, pengguna
dapat menginput nilai P sesuai dengan keinginan ataupun sebanyak yang
diinginkan oleh pengguna dan hasilnya akan langsung dimunculkan pada tabel ini.
Dimana tabel ini akan menampilkan nama file, jumlah kata1, jumlah kata 2, dan
nilai indeks berdasarkan nilai P. Setelah itu, pengguna dapat menyimpan file
tersebut dengan mengklik button simpan. Untuk membuka file yang yang telah
disimpan, pengguna dapat mengklik button buka.
5.2 Pembahasan
Berdasarkan proses pengujian yang dilakukan, maka dapat diperoleh
1. Nilai p yang berbeda dapat mempengaruhi tingkat relevansi dari suatu
dokumen.
2. Operator “OR” akan menghasilkan nilai indeks yang jauh lebih besar dari
pada nilai indeks yang dihasilkan oleh operator “AND”. Dengan
menggunakan operator “OR” maka hasil yang diperoleh merupakan dokumen
yang memiliki salah satu atau kedua kata yang dicari;
3. Operator “AND” akan menghasilkan nilai indeks yang lebih kecil daripada
nilai indeks yang dihasilkan oleh operator “OR”. Dengan menggunakan
operator “AND” maka hasil yang diperoleh merupakan dokumen yang
memiliki kedua kata yang dicari;
4. Hasil uji coba untuk operator “AND“ menunjukkan bahwa semakin tinggi
nilai p menyebabkan nilai bobot dokumen semakin menurun. Karena nilai
rentang untuk bobot [0,1] maka semakin tinggi nilai p mengakibatkan nilai
bobot mendekati “0”. Dengan kata lain untuk p mendekati ∞ (tak hingga)
mengakibatkan nilai bobot akan sama dengan 0. Tentu hal ini akan
mempengaruhi tingkat relevansi dokumen. Demikian juga, karena rentang
nilai bobot [0,1], maka nilai bobot yang lebih kecil bila dipangkatkan dengan
nilai p-norm yang semakin besar akan menghasilkan nilai bobot yang
semakin kecil, sehingga rumus RSV dari p-norm akan dipengaruhi oleh bobot
BAB VI
KESIMPULAN DAN SARAN
6.1 Kesimpulan
Setelah menyelesaikan penelitian pada skripsi ini, maka dapat ditarik
beberapa kesimpulan berikut:
1. Dengan menggunakan information retrieval system, maka dapat dilakukan
pencarian dokumen yang relevan dengan kata kunci yang dimasukkan.
2. Aplikasi dapat digunakan untuk menghitung indeks dan bobot dari suatu
dokumen.
3. Aplikasi yang dibuat dapat menerapkan metode Savoy untuk menghasilkan
dokumen terurut yang sulit dikerjakan dengan perhitungan manual akibat
jumlah dokumen yang banyak.
4. Keunggulan dari program yang dibuat mencakup:
a. Program dapat digunakan untuk menguji pengaruh nilai p terhadap hasil
pencarian.
b. Program mampu melakukan pencarian terhadap file berekstensi *.txt dan
*.doc.
5. Operator “OR” akan menghasilkan nilai indeks yang jauh lebih besar daripada
nilai indeks yang dihasilkan oleh operator “AND”. Dengan menggunakan
operator “OR” maka hasil yang diperoleh merupakan dokumen yang memiliki
salah satu atau kedua kata yang dicari.
6. Operator “AND” akan menghasilkan nilai indeks yang lebih kecil daripada
operator “AND” maka hasil yang diperoleh merupakan dokumen yang
memiliki kedua kata yang dicari;
7. Untuk operator “AND“ pada metode Savoy, semakin tinggi nilai p
menyebabkan nilai bobot dokumen semakin menurun.
6.2 Saran
Beberapa saran yang berhubungan dengan pengembangan sistem lebih
lanjut adalah:
1. Untuk menemukan informasi yang akan dicari, user sebaiknya menggunakan
rumus Savoy karena akan lebih memudahkan dan mempersingkat proses
pencarian informasinya.
2. Perlu dicari teknik-teknik lain untuk memperbaiki kinerja teknik frekuensi dan
savoy.
3. Perlu dikembangkan atau dicari alternatif lain untuk teknik Boolean peringkat
Amsyah, Zulkifli, 2009, Manajemen Sistem Informasi, PT. Gramedia Pustaka Utama.
Assauri, Sofyan, 2009, Manajemen Pemasaran (Dasar, Konsep dan Strategi), Penerbit PT. Grafindo Persada, Jakarta.
Baridwan, Z. 2008, Sistem Akuntansi Penyusunan Prosedur dan Metode, Cetakan Kelima, Edisi Kelima, Penerbit BPFE, Yogyakarta.
Hartono J, 2009, Analisis dan Desain Sistem Informasi, Penerbit Andi Offset, Yogyakarta.
Junindar, 2008, Panduan Lengkap Menjadi Programmer Membuat Aplikasi Penjualan Menggunakan VB.Net. Cetakan ke-3. Media Kita, Jakarta.
McLeod, Jr. R., 2008, Sistem Informasi Manajemen, Jilid 1, Edisi 7, Prenhallindo, Jakarta.
Sutabri, T., 2010, Analisa Sistem Informasi, Andi Offset, Yogyakarta.
gerlan1986.files.wordpress.com/2010/03/pencarian-searching.ppt
http://repository.ui.ac.id/dokumen/lihat/6396.pdf
http://www.cs.ui.ac.id/WebKuliah/textpro/PT08-MODEL.pdf