ANALISIS DAN IMPLEMENTASI METODE LATENT SEMANTIC INDEXING PADA
SISTEM PENCARIAN DOKUMEN
SKRIPSI
ARIANI 071401022
PROGRAM STUDI S1 ILMU KOMPUTER DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SUMATERA UTARA
MEDAN
2011
ANALISIS DAN IMPLEMENTASI METODE LATENT SEMANTIC INDEXING PADA
SISTEM PENCARIAN DOKUMEN
SKRIPSI
Diajukan untuk melengkapi tugas dan memenuhi syarat mencapai gelar Sarjana Komputer
ARIANI 071401022
PROGRAM STUDI S1 ILMU KOMPUTER DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SUMATERA UTARA
MEDAN 2011
PERSETUJUAN
Judul : ANALISIS DAN IMPLEMENTASI METODE
LATENT SEMANTIC INDEXING PADA
SISTEM PENCARIAN DOKUMEN
Kategori : SKRIPSI
Nama : ARIANI
Nomor Induk Mahasiswa : 071401022
Program Studi : SARJANA (S1) ILMU KOMPUTER
Departemen : ILMU KOMPUTER
Fakultas : MATEMATIKA DAN ILMU PENGETAHUAN
ALAM (FMIPA) UNIVERSITAS SUMATERA UTARA
Diluluskan di Medan, Komisi Pembimbing :
Pembimbing 2 Pembimbing 1
Dra. Mardiningsih, M.Si Drs. James P. Marbun, M.Kom NIP 196904051988112001 NIP 195806111986031002
Diketahui/Disetujui oleh
Program Studi S1 Ilmu Komputer Ketua,
Dr. Poltak Sihombing, M.Kom NIP 196203171991021001
PERNYATAAN
ANALISIS DAN IMPLEMENTASI METODE LATENT SEMANTIC INDEXING PADA
SISTEM PENCARIAN DOKUMEN
SKRIPSI
Saya mengakui bahwa skripsi ini adalah hasil karya saya sendiri, kecuali beberapa kutipan dan ringkasan yang masing-masing disebutkan sumbernya.
Medan, 13 Desember 2011
Ariani 071401022
PENGHARGAAN
Bismillahiraahmaanirrahiim
Alhamdulillahirrabbil’alamin, penulis ucapkan rasa syukur yang tiada habisnya kehadirat Allah SWT yang telah memberikan rahmat serta hidayah-Nya dan segala kemurahan-Nya kepada penulis sehingga penulis dapat menyelesaikan tugas akhir ini.
Shalawat dan salam kepada manusia paling agung, Rasulullah Muhammad SAW, beserta keluarganya, para sahabat dan pengikutnya yang setia meski tak pernah berjumpa.
Ucapan terima kasih yang sebesar-besarnya penulis sampaikan kepada Bapak Drs. James Piter Marbun, M.Kom selaku Dosen Pembimbing I dan Ibu Dra.
Mardiningsih, M.Si selaku Dosen Pembimbing II yang telah memberikan bimbingan, waktu, saran dan masukan kepada penulis sehingga dapat menyelesaikan skripsi ini.
Selanjutnya kepada Bapak Drs. Marihat Situmorang, M.Kom selaku Dosen Penguji I dan Bapak Mohammad Andri Budiman, S.T, M.Comp.Sc, MEM selaku Dosen Penguji II, terima kasih atas saran dan kritikan yang sangat berguna bagi penulis.
Ucapan terima kasih juga penulis tujukan kepada Ketua dan Sekretaris Program Studi SI Ilmu Komputer, Bapak Dr. Poltak Sihombing, M.Kom dan Ibu Maya Silvi Lydia B.Sc, M.Sc. Dekan dan para Pembantu Dekan FMIPA USU, dosen-dosen di Program Studi SI Ilmu Komputer FMIPA USU dan Staf Tata Usaha Program Studi S1 Ilmu Komputer FMIPA USU.
Teristimewa penulis sampaikan ucapan terima kasih kepada kedua orang tua dan keluarga yang telah memberikan dukungan dan motivasi, Ayahanda Sumardi dan Ibunda Supini atas doa, kasih sayang dan yang selalu sabar dalam semua kondisi, sesungguhnya doa dari Ibunda menjadi pembuka jalan bagi penulis. Semoga Ayahanda dan Ibunda selalu berada dalam naungan cahaya iman. Penulis juga sampaikan terima kasih kepada Abangda terkasih, Armansyah atas segala dukungan yang telah diberikan.
Selanjutnya kepada sahabat penulis, Dila, Nida, Nur dan Tika terima kasih atas doanya. Kepada teman-teman di Asrama Putri serta rekan-rekan stambuk 2007 yang sama-sama sedang berjuang mengerjakan skripsi dan khususnya Kom B 2007 terima kasih atas motivasi dan hari-harinya selama ini. Semoga Allah melindungi kita semua, amin.
Penulis menyadari bahwa skripsi ini masih jauh dari kesempurnaan, karena kesempurnaan hanyalah milik Allah semata. Oleh karena itu penulis menerima kritik dan saran dari semua pihak yang bersifat membangun dan menyempurnakan skripsi ini. Penulis berharap semoga skripsi ini bermanfaat bagi penulis sendiri pada khususnya dan pembaca pada umumnya.
ABSTRAK
Keberadaan informasi yang jumlahnya tidak terhitung serta kebutuhan manusia akan penggunaan informasi-informasi tersebut mendorong berkembangnya suatu ilmu untuk melakukan pencarian. Salah satu bentuk information retrieval yang sering digunakan adalah search engine yang memfasilitasi pengguna untuk melakukan pencarian suatu informasi dari seluruh dokumen yang ada dengan query yang dimasukkan oleh pengguna yang biasanya berupa kata-kata kunci dari informasi yang diinginkan.
penulisan tugas akhir ini bertujuan untuk membangun sebuah sistem pencarian dokumen relevan berdasarkan query yang dimasukkan, serta telah teranking berdasarkan tingkat relevansinya dengan menggunakan metode Latent Semantic Indexing (LSI). LSI adalah metode pengindeksan dan pencarian yang menggunakan teknik matematika yang disebut Dekomposisi Nilai Singular (SDV) untuk mengidentifikasi pola hubungan antara istilah dan konsep-konsep yang terkandung dalam sebuah koleksi teks yang tidak terstruktur. Sistem ini dibangun menggunakan perangkat lunak Borland Delphi 10. Metodologi untuk membentuk sistem menggunakan pendekatan model air terjun. Tahapan yang penulis lakukan untuk melakukan proses pembentukan sistem tersebut meliputi tahapan analisis permasalahan, perancangan aplikasi yang melibatkan diagram alir data, algoritma dan flowchart beserta desain antarmuka aplikasi, sehingga aplikasi yang terbentuk menjadi mudah dipergunakan dan memiliki fungsi yang optimal. Metode LSI bisa digunakan pada search engine, karena dengan metode ini search engine dapat mencari dokumen yang diinginkan oleh user. Keluaran yang dihasilkan dari sistem adalah dokumen relevan yang telah teranking yang ditampilkan dalam bentuk list file.
Kata Kunci: Sistem Temu Kembali Informasi, Borland Delphi, Latent Semantic Indexing, Dekomposisi Nilai Singular, Algoritma.
ANALYSIS AND IMPLEMENTATION OF LATENT SEMANTIC INDEXING METHOD ON DOCUMENT
RETRIEVAL SYSTEM
ABSTRACT
The existence of information that there were not counted and the human need for the use of such information encourages the development of a science to perform information retrieval. One of information retrievers wich is often used are search engines that facilitate users to perform information retrieval from all documents to the entered query by a user who is usually in the form of key words of the desired information.
This writing final duty aim to build a document retrieval system the relevant based on the entered query, and the documents have ranked based on the relevancy level with using latent semantic indexing method. The system is built by using Borland Delphi 10 software. The methodologies to form the system is use the approach of waterfall model. The step which writer do to conduct the application forming process are covering the step analysis the problems, application scheme entangling data flow diagram, algorithm and flowchart therewith the user interface design, so that application formed become easy to use and own the optimal function. To ensure that the entire function which is there are in the information retrieval system work in an optimal.
Keyword: Information retrieval system, Borland Delphi, Latent Semantic Indexing, Singular Value Decomposition, Algorithm.
DAFTAR ISI
Halaman
Persetujuan ii
Pernyataan iii Penghargaan iv Abstrak v Abstract vi Daftar Isi vii Daftar Tabel x Daftar Gambar xi Bab 1 Pendahuluan 1.1 Latar Belakang 1
1.2 Rumusan Masalah 2
1.3 Batasan Masalah 3
1.4 Tujuan Penelitian 3
1.5 Manfaat Penelitian 3
1.6 Metodologi Penelitian 4
1.7 Sistematika Penulisan 4
Bab 2 Tinjauan Pustaka 2.1 Pendahuluan 6
2.2 Information Retrieval 7
2.3 Searching 10
2.4 Pengantar Umpan Balik Relevansi 10
2.5 Istilah Pencarian 11
2.6 Preferensi Pencarian 12
2.7 Antarmuka Pencarian 12
2.8 Ranking 12
2.8.1 Cara Meranking 13
2.9 Algoritma Pencarian 14
2.10 Latent Semantic Indexing 15
2.10.1 Singular Value Decomposition 17
2.10.2 Eigenvalue dan Eigenvector Matriks 18
2.11 Term-Document Matriks 18
3.4 Analisis Metode Latent Semantic Indexing 30
3.5 Blok Diagram Sistem 34
3.6 Arsitektur Sistem 34
3.7 Spesifikasi Umum Kebutuhan Sistem 35
3.7.1 Fungsi Sistem 35
3.7.2 Tujuan Sistem 36
3.7.3 Masukan dan Keluaran Sistem 36
3.7.4 Batasan Sistem 36
3.7.5 Model Fungsionalitas Sistem 37
3.7.5.1 Data Flow Diagram 37
3.7.5.1.1 Diagram Aliran Data Level 0 38
3.7.5.1.2 Diagram Aliran Data Level 1 39
3.7.5.1.3 Kamus Data DFD 40
3.7.5.2 Flowchart 41
3.8 Ranking Dokumen 44
3.9 Perancangan Aplikasi 47
3.9.1 Perancangan Antarmuka Pemakai 47
3.9.1.1 Perancangan Antarmuka Home 48
3.9.1.2 Perancangan Antarmuka Searching Dokumen 49
3.9.1.3 Perancangan Halaman Contact 51
Bab 4 Implementasi dan Pengujian Sistem 4.1 Implementasi Sistem 52
4.1.1 Lingkungan Implementasi 52
4.1.1.1 Kebutuhan Perangkat Keras 52
4.1.1.2 Kebutuhan Perangkat Lunak 53
4.1.2 Tampilan Sistem 53
4.1.2.1 Tampilan Utama Program 53
4.1.2.2 Halaman Searching Dokumen 55
4.1.2.3 Halaman Contact 58
4.2 Pengujian 59
4.2.1 Tujuan Pengujian 59
4.2.2 Data Pengujian 60
4.2.3 Pengujian Perankingan 63
4.2.3.1 Kriteria Pengujian 63
4.2.4 Hasil Pengujian 63
Bab 5 Kesimpulan dan Saran 5.1 Kesimpulan 66
5.2 Saran 67
DAFTAR PUSTAKA
LAMPIRAN A : LISTING PROGRAM HOME LAMPIRAN B : LISTING PROGRAM SEARCHING LAMPIRAN C : LISTING PROGRAM RANKING LAMPIRAN D : LISTING PROGRAM CONTACT
DAFTAR TABEL
Halaman
2.1 Contoh Matriks Kata-Dokumen 20
3.1 Kamus Data DFD 41
3.2 Simbol-Simbol Flowchart 42
3.3 Ranking Dokumen Menggunakan 3 Kata Kunci 45
3.4 Keterangan Tampilan Antarmuka Home 49
3.5 Keterangan Tampilan Antarmuka Searching Dokumen 50
3.6 Keterangan Tampilan Halaman Contact 51
4.1 Spesifikasi Kebutuhan Perangkat Keras 52
4.2 Hasil Pengujian 64
4.3 Hasil Pengujian 11 64
4.4 Analisis Hasil Pengujian 65
4.5 Analisis Hasil Pengujian 11 65
DAFTAR GAMBAR
Halaman 2.1 Bagian-Bagian Sistem Temu Kembali Informasi 8
2.2 Contoh Teks untuk LSI 19
2.3 Tampilan Layar Delphi 2010 23
2.4 Layar Code Editor 24
3.1 Proses Searching 29
3.2 Hasil Dekomposisi Matriks 33
3.3 Diagram Algoritma LSI 33
3.4 Blok Diagram Sistem 34
3.5 Arsitektur Sistem 35
3.6 Diagram Konteks 38
3.7 Diagram Aliran Data Level 1 39
3.8 Flowchat Searching 43
3.9 Flowchart Ranking 46
3.10 Rancangan Tampilan Antarmuka Home 48
3.11 Rancangan Tampilan Halaman Searching 50
3.12 Rancangan Tampilan Halaman Contact 51
4.1 Tampilan Utama Program 54
4.2 Tampilan Halaman Searching 55
4.3 Tampilan Hasil Pencarian 56
4.4 Hasil Pencarian yang tidak ditemukan 57
4.5 Tampilan Halaman Contact 58
4.6 Tampilan Confirm untuk mengakhiri Program 59
4.7 Hasil Pencarian Dokumen 60
4.8 Hasil Pencarian dengan Kata Kunci yang berbeda 61