ABSTRAK
IMPLEMENTASI PROSES PENCARIAN TEKS DENGAN METODE VECTOR SPACE MODEL PADA SEARCH ENGINE DALAM
ENSIKLOPEDIA LAMPUNG BERBASIS WEB
Oleh
INDAH DWI TIARA
Penelitian ini membahas metode pencarian kata yang digunakan search engine pada website Ensiklopedia Lampung. Dalam proses pencarian teks pada website diterapkan metode vector space model untuk mengukur kemiripan anatara suatu dokumen dengan suatu query.Kemiripan tersebut diukur berdasarkan perhitungan nilai cosinus dari dua vektor yaitu dokumen dan kata kunci .
Pada aplikasi ini, search engine yang digunakan dikembangkan dari aplikasi www.spider.eu yang memberikan sejumlah alamat website yang dapat dikunjungi dengan teknik spider atau lebih dikenal dengan teknik crawler.
ABSTRACT
THE IMPLEMENTASI OF TEXT SEARCHING PROCESS WITH VECTOR SPACE MODEL ON SEARCH ENGINE FOR LAMPUNG
ENCYCLOPEDIA WEB-BASED
BY
INDAH DWI TIARA
Theresearch discusses abaout method of text searching used for search engine on website of Lampung Encyclopedia. The process of text searching uses vector space model to count the correspondence between document and query. The
correspondance is counted. By using the counting of cosinus value in to vector,
they are document and query.
In this applications, Search engine is developed from www.spider.eu, serach engine that gives some website addresses to be visited using spider technic or well known as crawler technic.
BIODATA DIRI
Fakultas : Maatematika dan Ilmu Pengetahuan Alam
Jurusan/Prodi : Ilmu Komputer/Ilmu Komputer
IPK : 2.89
Tgl Lulus Ujian Skripsi : 4 Mei 2012
Alamat : Jl. Griya Nuza Blok Z No.5 Way Halim Permai
Bandar Lampung
Asal SMA : SMA Negeri 1 Natar
Nama Orang Tua : Syamsu
Pembimbing : 1.Didik Kurniawan, S.Si, M.T
2. Amanto, S.Si, M.Si
Penguji : Ir. Machudor Yusman, M.Kom.
Tes Toefl : 1. Nomor : 3018/UN.26/14/DT/2012
2. Tanggal : 26 April 2012
3. Nilai : 480
Judul Skripsi : IMPLEMENTASI PROSES PENCARIAN TEKS
DENGAN METODE VECTOR SPACE MODEL
PADA SEARCH ENGINE DALAM ENSIKLOPEDIA
ABSTRACT
THE IMPLEMENTASI OF TEXT SEARCHING PROCESS WITH VECTOR SPACE MODEL ON SEARCH ENGINE FOR LAMPUNG
ENCYCLOPEDIA WEB-BASED
BY
INDAH DWI TIARA
Theresearch discusses abaout method of text searching used for search engine on website of Lampung Encyclopedia. The process of text searching uses vector space model to count the correspondence between document and query. The
correspondance is counted. By using the counting of cosinus value in to vector,
they are document and query.
In this applications, Search engine is developed from www.spider.eu, serach engine that gives some website addresses to be visited using spider technic or well known as crawler technic.
ABSTRAK
IMPLEMENTASI PROSES PENCARIAN TEKS DENGAN METODE VECTOR SPACE MODEL PADA SEARCH ENGINE DALAM
ENSIKLOPEDIA LAMPUNG BERBASIS WEB
Oleh
INDAH DWI TIARA
Penelitian ini membahas metode pencarian kata yang digunakan search engine pada website Ensiklopedia Lampung. Dalam proses pencarian teks pada website diterapkan metode vector space model untuk mengukur kemiripan anatara suatu dokumen dengan suatu query.Kemiripan tersebut diukur berdasarkan perhitungan nilai cosinus dari dua vektor yaitu dokumen dan kata kunci .
Pada aplikasi ini, search engine yang digunakan dikembangkan dari aplikasi www.spider.eu yang memberikan sejumlah alamat website yang dapat dikunjungi dengan teknik spider atau lebih dikenal dengan teknik crawler.
IMPLEMENTASI PROSES PENCARIAN TEKS DENGAN METODE VECTOR SPACE MODEL PADA SEARCH ENGINE DALAM
ENSIKLOPEDIA LAMPUNG BERBASIS WEB ( SKRIPSI )
Oleh : Indah Dwi Tiara
0717032006
JURUSAN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS LAMPUNG
DAFTAR GAMBAR
3.2 Desain Arsitektur Pengembangan Sistem Pada Metode Prototype ... 49
4.1 DFD Level 0 Pada Sistem Search Engine Ensiklopedia Lampung ... 52
4.2 DFD Link Dokumen ... 53
4.3 DFD Query ... 55
4.4 Use Case Diagram Sistem Ensiklopedia Lampung ... 56
4.17 Form Statistic ... 72
4.18 Diagram Grafik Penilaian Konten / Isi Pada Sistem ... 83
DAFTAR ISI
2.2 Penilaian Pembobotan Panjang Dan Model Ruang Vektor ... 7
iii
2.2.5.2 Normalisasi Maksimum tf ... 16
2.3 Sistem Pencarian Komputasi Skor Secara Lengkap ... 17
2.3.1 Efisien Penilaian Dan Peringkat ...17
2.3.1.1 Indeks Eliminasi ... ...18
2.3.2 Komponen Dari Informasi Temu Kembali ... 19
2.3.2.1 Indeks Berjenjang ... 19
2.3.2.2 Merancang Fungsi Parsing Dan Penilaian ... 20
2.3.3 Ruang Vector Scoring dan Interaksi Permintaan Operator ... 22
iv
V. KESIMPULAN DAN SARAN 5.1. Kesimpulan ... 86
5.2. Saran ... 87
DAFTAR PUSTAKA ... 88
DAFTAR PUSTAKA
Anh, Vo Ngoc, and Alistair Moffat. 2005. Inverted index compression using Word aligned binary codes. At: http://dx.doi.org/10.1023/B:INRT
Anh, Vo Ngoc, and Alistair Moffat. 2006b. Pruned query evaluation using pre-computed impacts. At: http://doi.acm.org/
Bartell, Brian Theodore. 1994. Optimizing ranking functions: A connectionist approach to adaptive information retrieval. San Diego: University of California.
Bar-Yossef, Ziv, and Maxim Gurevich. 2006. Random sampling from a search engine’s index. At: http://doi.acm.org/10.1145/
Brain Pinkerton 2000. WebCrawler:Finding what people want. Washington: University of Washington.
Brown, Eric W. 1995. Execution Performance Issues in Full Text Information Retrieval. , Amherst: University of Massachusets.
Carmel, David, Doron Cohen, Ronald Fagin, Eitan Farchi, Michael Herscovici,
Yoelle S. Maarek, and Aya Soffer. 2001. Static index pruning for information retrieval systems. At: http://doi.acm.org/
Kristhoper David Harjono, Vector Pada Metode Search Vector Space, INTEGRAL Vol. 10 No. 2, Juli 2005
Ledford, Jerri L. 2007. Search Engine Optimization Bible. Wiley Publishing, Inc. Indiana. 411 Hlm.
DAFTAR TABEL
Tabel Halaman
2.1 Frekuensi Koleksi Dan Frekuensi Dokumen Yang Berbeda ... 8
2.2 Contoh Nilai df ... 10
2.3 Nilai Dokumen tf ... 12
2.4 Nilai tf Euclidean Ternormalisasi Untuk Dokumen ... 13
4.1 Term Dokumen ... ... 76
4.2 Hasil Perhitungan ... ... 79
4.3 Perhitungan Kemiripan ... 79
4.4 Ranking ... 79
4.5 Evaluasi Kuisioner Penilaian Konten / Isi Sistem ... 81
MOTTO
“
Hasil dari suatu perjuangan adalah hal yang bernilai , tetapi
perjuangan untuk mendapatkannya jauh lebih bernilai “
(Indah Dwi Tiara)
“Hai orang
-orang yang beriman, Jadikanlah sabar dan shalatmu
Sebagai penolongmu, sesungguhnya Allah beserta orang-orang yang
sabar” (Al
-Baqarah: 153)
Tugas kita bukanlah untuk berhasil. Tugas kita adalah untuk mencoba, karena didalam
mencoba itulah kita menemukan dan belajar membangun kesempatan untuk berhasil
PERSEMBAHAN
Kupersembahkan karyaku ini kepada:
Allah SWT atas limpahan berkat dan rahmat-Nya jualah sehingga skripsi ini
dapat terselesaikan
Kupersembahkan karya sederhana penuh perjuangan dan kesabaran ini sebagai
ungkapan rasa sayangku dan baktiku kepada :
Kedua Orangtuaku tercinta, yang telah mendidik dan membesarkanku serta
mencurahkan segala kasih sayang dan perhatiannya sejak aku dilahirkan hingga
kini ku dewasa.
Dan seseorang yang selalu menemani dan memberikanku semangat serta
motivasi dan doa yang tlah diberikan terhadap penulis agar tetap berjuang dan
RIWAYAT HIDUP
Penulis dilahirkan di Tanjung Karang, Bandar Lampung
pada tanggal 2 Agustus 1989, sebagai anak ke dua dari dua
bersaudara, dari pasangan Bapak Syamsu dan Ibu Dra.Siti
Nurjanah
Pendidikan Sekolah Dasar (SD) diselesaikan di SD
AL-AZHAR,Bandar Lampung pada tahun 2001, Sekolah
Lanjutan Tingkat Pertama (SLTP) di SLTPN 1 Bandar Lampung pada tahun
2004, dan Sekolah Menengah Atas (SMA) di SMAN 1 Natar Lampung Selatan
pada tahun 2007.
Tahun 2007, penulis terdaftar sebagai mahasiswi Jurusan Ilmu Komputer Fakultas
Matematika Ilmu Pengetahuan Alam Unila melalui jalur PKAB Selama menjadi
mahasiswi , penulis aktif berorganisasi diantaranya adalah :
1. Anggota Generasi Muda Himpunan Mahasiswa Jurusan Matematika
(GEMATIKA) FMIPA pada tahun 2007
2. Anggota Himpunanan Mahasiswa Jurusan Matematika (HIMATIKA) pada
tahun 2008-2009
Pada bulan Juli sampai dengan Agustus tahun 2010, penulis melakukan kerja
praktik di PT.Telekomunikasi Indonesia, Tbk. yang beralamat di Jl. Sultan Agung
SANWACANA
Puji syukur penulis ucapkan kehadirat ALLAH SWT, karena atas rahmat dan
hidayah-Nya skripsi ini dapat diselesaikan.
Skripsi dengan judul “Implementasi Proses Pencarian Teks Dengan Metode Vector Space Model Pada Search Engine Dalam Ensiklopedia Lampung Berbasis Web” adalah salah satu syarat untuk memperoleh gelar sarjana Ilmu Komputer di Universitas Lampung.
Dalam kesempatan ini penulis mengucapkan terimakasih kepada berbagai pihak
yang secara langsung maupun tidak langsung telah membantu penulis sehingga
skripsi ini dapat terselesaikan. Penulis mengucapkan terimakasih kepada:
1. Bapak Didik Kurniawan, S.Si, M.T.,selaku pembimbing pertama yang telah
memberikan bimbingan dan motivasi dalam pembuatan skripsi ini.
2. Bapak Amanto, S.Si, M.Si., selaku dosen pembimbing kedua yang telah
memberikan bimbingan, saran dan koreksi dalam pembuatan skripsi ini.
3. Bapak Ir.Machudor Yusman,M.Kom., selaku Ketua Jurusan Ilmu Komputer
dan pembahas yang telah memberikan koreksi dan saran dalam pembuatan
skripsi ini.
4. Bapak Dwi Sakethi, S.Si, M.Kom., selaku Sekretaris Jurusan Ilmu Komputer
5. Bapak Dr. Sutyarso, M.S., selaku Dekan Fakultas Matematika dan Ilmu
Pengetahuan Alam.
6. Ibu Fitriani, S.Si, M.Sc., selaku pembimbing akademik selama penulis
menjadi mahasiswa Ilmu Komputer Fakultas Matematika dan Ilmu
Pengetahuan Alam Universitas Lampung.
7. Seluruh dosen dan karyawan Jurusan Matematika Fakultas Matematika dan
Ilmu Pengetahuan Alam.
8. Ayahanda Syamsu Ibunda Dra.Siti Nurjanah, serta kakak penulis Prarindra
Afwan,S.P., atas saran yang telah diberikan .
9. Teman-teman Ilmu Komputer 2007, terutama, Renny, Nyimas, Winda, Like,
Eko, Anggi, Aziza, Nurhayati, Fitriawan , Cepi, Hendar, Mardonius, Gozali,
Vita, Wika, Sapta, Friska dll.
10.Sahabat-sahabat yang mendukung menyukseskan skripsi ini , terutama Guntur
Budi , Agus Riyadi , Fida Filia , M.Dyaz al-kaisya , Pritta Karianthi , Intan
Puspita , terima kasih atas dukungan dan kebersamaan kalian.
Akhir kata, Penulis menyadari bahwa skripsi ini masih jauh dari kesempurnaan,
akan tetapi sedikit harapan semoga skripsi yang sederhana ini dapat berguna dan
bermanfaat bagi kita semua. Amiin.
Bandar Lampung, 4 Mei 2012 Penulis,
83
India 1 1 9 0,954 0.954
Selatan 1 1 2 4,5 0,653 0,653 0,653
Geografis 1 1 9 0,954 0,954
Bujur 1 1 9 0,954 0,954
Timur 1 1 9 0,954 0,954
Lintang 1 1 1 0,954 0,954
Selatan 1 1 1 9 0,954 0,954
Berjarak 1 1 1 9 0,954 0,954
Pesawaran 1 1 1 9 0,954 0,954
Potensi 1 1 1 9 0,954 0,954
0,910 0,910 0,910 0,910 0,910 0,910
0,910 0,910 0,910
9,366 5,202 9,366 2,601 2,601 2,601 2,601 6,765 2,601 5,202 18,741 13,017 22,264 6,795 8,224 10,29 14,698 12,651 9,921