• Tidak ada hasil yang ditemukan

ANALISIS DAN IMPLEMENTASI LATENT SEMANTIC INDEXING UNTUK PENCARIAN MAKALAH (PAPER) PADA WEB PORTAL JURNAL ILMU KOMPUTER SKRIPSI TITO HANAFI

N/A
N/A
Protected

Academic year: 2021

Membagikan "ANALISIS DAN IMPLEMENTASI LATENT SEMANTIC INDEXING UNTUK PENCARIAN MAKALAH (PAPER) PADA WEB PORTAL JURNAL ILMU KOMPUTER SKRIPSI TITO HANAFI"

Copied!
14
0
0

Teks penuh

(1)

JURNAL ILMU KOMPUTER

SKRIPSI

TITO HANAFI

111401072

PROGRAM STUDI S-1 ILMU KOMPUTER

FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI

UNIVERSITAS SUMATERA UTARA

MEDAN

2016

(2)

ANALISIS DAN IMPLEMENTASI LATENT SEMANTIC INDEXING UNTUK PENCARIAN MAKALAH (PAPER) PADA WEBPORTAL

JURNAL ILMU KOMPUTER

SKRIPSI

Diajukan untuk melengkapi tugas dan memenuhi syarat memperoleh ijazah Sarjana Ilmu Komputer

TITO HANAFI 111401072

PROGRAM STUDI S-1 ILMU KOMPUTER

(3)

PERSETUJUAN

Judul : ANALISIS DAN IMPLEMENTASI LATENT SEMANTIC INDEXING UNTUK PENCARIAN MAKALAH (PAPER) PADA WEB PORTAL JURNAL ILMU KOMPUTER Kategori : SKRIPSI

Nama : TITO HANAFI Nomor Induk Mahasiswa : 111401072

Program Studi : SARJANA (S-1) ILMU KOMPUTER Departemen : ILMU KOMPUTER

Fakultas : FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA

Diluluskan di Medan, Juli 2016 Komisi Pembimbing :

Pembimbing 2 Pembimbing 1

Dian Rachmawati, S.Si., M.Kom. Dr. Poltak Sihombing, M.Kom. NIP. 198307232009122004 NIP. 197510082008011011

Diketahui/disetujui oleh

Program Studi S-1 Ilmu Komputer Ketua,

Dr. Poltak Sihombing, M.Kom. NIP. 196203171991031001

(4)

PERNYATAAN

ANALISIS DAN IMPLEMENTASI LATENT SEMANTIC INDEXING UNTUK PENCARIAN MAKALAH (PAPER) PADA WEBPORTAL

JURNAL ILMU KOMPUTER

SKRIPSI

Saya mengakui bahwa skripsi ini adalah hasil karya saya sendiri, kecuali beberapa kutipan dan ringkasan yang masing-masing telah disebutkan sumbernya.

Medan, Juli 2016

Tito Hanafi 111401072

(5)

UCAPAN TERIMA KASIH

Puji dan syukur penulis ucapkan kehadirat Allah SWT, karena rahmat dan izin-Nya penulis dapat menyelesaikan skripsi ini. Banyak bantuan berupa uluran tangan, budi baik, buah pikiran dan kerjasama yang telah penulis terima selama menempuh studi sampai dengan penyelesaian studi (skripsi) ini. Oleh karena itu, seyogianya penulis menyampaikan ucapan terima kasih kepada pihak-pihak yang telah membantu.

Ucapan terima kasih penulis sampaikan kepada:

1. Bapak Prof. Dr. Runtung Sitepu, S.H., M.Hum. selaku Rektor Universitas Sumatera Utara.

2. Bapak Prof. Dr. Opim Salim Sitompul, M.Si. selaku Dekan Fasilkom-TI USU. 3. Bapak Dr. Poltak Sihombing, M.Kom. selaku Ketua Program Studi S-1 Ilmu

Komputer Universitas Sumatera Utara dan Dosen Pembimbing I yang telah memberikan bimbingan dan dukungan kepada penulis.

4. Ibu Maya Silvi Lydia, B.Sc., M.Sc. selaku Sekretaris Program Studi S-1 Ilmu Komputer Universitas Sumatera Utara.

5. Ibu Dian Rachmawati, S.Si., M.Kom. selaku Dosen Pembimbing II yang telah memberikan bimbingan dan dukungan kepada penulis.

6. Bapak Drs. Marihat Situmorang, M.Kom. selaku Dosen Pembanding I yang telah memberikan kritik dan saran dalam penyempurnaan skripsi ini.

7. Bapak Ade Candra, S.T., M.Kom. selaku Dosen Pembanding II yang telah memberikan kritik dan saran dalam penyempurnaan skripsi ini.

8. Bapak M. Andri Budiman, S.T., M.Comp.Sc., M.E.M. selaku Dosen Pembimbing Akademik yang telah memberikan bimbingan dan dukungan kepada penulis.

9. Yang teristimewa, Ayahanda Alm. Chairul dan Ibunda Tuti Hariani, serta Kakanda dan Abangda drg. Chitra Chairunnisah, Tirza Hafiz, S.Kom., Chairunnisa Sari, S.Pd yang selalu memberikan kasih sayang dan dukungan kepada penulis.

(6)

10. Seluruh tenaga pengajar dan pegawai di Fakultas Ilmu Komputer dan Teknologi Informasi USU, terkhususnya di Program Studi S-1 Ilmu Komputer.

11. Teman-teman kuliah, khususnya Kom B Ilmu Komputer USU 2011 yang telah memberikan semangat, teman diskusi yang menyenangkan dan teman seperjuangan dalam menggapai gelar Sarjana Komputer.

12. Rekan-rekan di PEMA Fasilkom-TI USU, UKMI Al-Khuwarizmi Fasilkom-TI USU, Sobat Bumi Medan, Garuda Creative, dan Indonesia Positif yang juga membantu dengan memberikan semangat kepada penulis.

13. Saudara-saudara Halaqoh Buya Hamka dan Bung Tomo yang telah memberikan bantuan moral, nasihat dan pengetahuan kepada penulis.

14. Adik-adik Asisten Laboratorium IKLC, dan penghuni Startup Center yang telah memberikan motivasi dan dukungannya kepada penulis.

15. Semua pihak yang terlibat langsung atau tidak langsung yang penulis tidak dapat tuliskan satu per satu.

Semoga Allah SWT melimpahkan berkah dan kasih sayang-Nya kepada semua pihak yang telah memberikan bantuan, semangat, dukungan dan perhatian kepada penulis dalam menyelesaikan skripsi ini. Semoga skripsi ini bermanfaat bagi penulis, pendidikan, dan masyarakat.

Medan, Juli 2016

(7)

ABSTRAK

Jumlah makalah (paper) di Indonesia mengalami peningkatan yang signifikan tiap tahunnya. Banyaknya makalah atau karya tulis ilmiah ini tentu memberikan kemudahan dalam mendapatkan informasi, namun disisi lain, dapat menimbulkan masalah dalam menemukan makalah yang sesuai dengan keinginan. Dengan adanya web portal yang menyimpan makalah–makalah hasil penelitian secara online akan sangat membantu pengguna dalam menemukan makalah sesuai dengan apa yang diinginkan melalui fitur pencarian. Latent Semantic Indexing (LSI) adalah salah satu metode dalam sistem temu balik informasi (Information Retrieval System) dengan teknik matematika yang disebut

Singular Value Decomoposition. Pada proses pencarian dengan metode LSI kata-kata yang unik yang didapat setelah dilakukan proses praprocessing pada setiap dokumen akan direpresentasikan sebagai baris matriks dan dokumen-dokumen akan direpresentasikan sebagai kolom matriks. Kemudian matriks kata-dokumen yang terbentuk didekomposisi dengan algoritma SVD. Hasil SVD matriks dapat dioptimalkan dengan melakukan pengurangan dimensi matriks tersebut. Jumlah dimensi matriks yang dipertahankan adalah sebanyak k, dimana nilai 𝑘 < 𝑟𝑎𝑛𝑘 𝑚𝑎𝑡𝑟𝑖𝑘𝑠. Dalam penelitian ini terdapat 51 buah makalah dengan kasus uji nilai 𝑘 = 10, k = 20, k = 30, k = 40, k = 50, menunjukkan nilai 𝑘 = 50 memberikan hasil pencarian yang paling baik dengan rata-rata f-measure dari 2 kali percobaan pencarian dengan kata kunci yang berbeda adalah 0,7651. Hasil penelitian menunjukkan semakin banyak nilai 𝑘 yang dipertahankan memberikan hasil pencarian yang lebih optimal.

Kata Kunci: Information Retrieval, Latent Semantic Indexing (LSI), Singular Value Decomposition (SVD), Web Portal, Makalah (Paper)

(8)

ANALYSIS AND IMPLEMENTATION OF LATENT SEMANTIC INDEXING FOR PAPER SEARCHING ON WEB JOURNAL PORTAL OF

COMPUTER SCIENCE

ABSTRACT

The number of papers in Indonesia has increased significantly each year. The number of these papers certainly provides ease in obtaining information, but on the other hand, can cause problems in finding papers which relevan with users needed. With the web portal that stores papers online, research will greatly assist users in finding the papers in accordance with what is desired through the search feature. Latent Semantic Indexing (LSI) is one method of information retrieval systems (Information Retrieval System) with a mathematical technique called Singular Value Decomposition. In the search process by the method of LSI, unique words that come after praprocessing process from each document will be represented as a matrix of rows and the documents will be represented as a matrix column. Then the word-document matrix formed is decomposed with SVD algorithm. The results of SVD matrix can be optimized by reducing the dimensions of the matrix. The number of dimensional matrix is preserved as much as k, where k < rank matrix. In this study there were 51 pieces of paper with test cases k = 10, k = 20, k = 30, k = 40, k = 50, demonstrating the value of k = 50 provide the search results most good with average f-measure of 2 trials search with different keywords is 0.7651. The results showed the more value of k that retained provide the more optimal searching results.

Keywords: Information Retrieval, Latent Semantic Indexing (LSI), Singular Value Decomposition (SVD), Web Portal, Paper

(9)

DAFTAR ISI

Halaman

Persetujuan ii

Pernyataan iii

Ucapan Terima Kasih iv

Abstrak vi

Abstract vii

Daftar Isi viii

Daftar Tabel x

Daftar Gambar xi

Daftar Lampiran xiii

Bab 1 Pendahuluan 1.1. Latar Belakang 1 1.2. Rumusan Masalah 2 1.3. Batasan Masalah 2 1.4. Tujuan Penelitian 3 1.5. Manfaat Penelitian 3 1.6. Metodologi Penelitian 3 1.7. Sistematika Penulisan 4

Bab 2 Landasan Teori

2.1. Information Retrieval 6

2.2. Latent Semantic Indexing (LSI) 7 2.2.1. Pemrosesan Awal (Praprocessing) 9

2.2.1.1. Parsing 9

2.2.1.2. Pembuangan Stopword 9

2.2.1.3. Stemming 9

2.2.2. Matriks Kata-Dokumen (Terms-Documents Matrix) 12

2.2.3. Pembobotan 13

2.2.4. Nilai Eigen (Eigenvalue) dan Vektor Eigen (Eigenvector) 14 2.2.5. Singular Value Decomposition (SVD) 15 2.2.6. Query Vector Mapping 18 2.2.7. Relevansi Dokumen dan Query 19

2.3. Evaluasi Metode LSI 23

2.4. Penelitian yang Relevan 24

Bab 3 Analisis dan Perancangan

3.1. Analisis Sistem 25 3.1.1. Analisis masalah 25 3.1.2. Analisis kebutuhan 28 3.2. Pemodelan Sistem 29 3.2.1. Use-case diagram 29 3.2.2. Activity diagram 31

(10)

3.2.4. Class diagram 36 3.2.5. Flowchart pencarian 36

3.2.6. Kamus Data 38

3.2.6. Perancangan antarmuka 40

Bab 4 Implementasi dan Pengujian

4.1. Implementasi 47

4.1.1. Tampilan antarmuka halaman beranda 47 4.1.2. Tampilan antarmuka halaman pencarian 48 4.1.3. Tampilan antarmuka halaman hasil pencarian 48 4.1.4. Tampilan antarmuka halaman pencarian tidak ditemukan 49 4.1.5. Tampilan antarmuka halaman arsip 49 4.1.6. Tampilan antarmuka halaman detail makalah 49 4.1.7. Tampilan antarmuka halaman log in 50 4.1.8. Tampilan antarmuka halaman dashboard 50 4.1.9. Tampilan antarmuka halaman tambah makalah 51

4.2. Pengujian 51

4.2.1. Tujuan Pengujian 52

4.2.2. Data Pengujian 52

4.2.3. Skenario pengujian 56 4.2.4. Hasil dan analisis pengujian kata kunci I 56 4.2.5. Hasil dan analisis pengujian kata kunci II 60

Bab 5 Kesimpulan dan Saran

5.1. Kesimpulan 64

5.2. Saran 64

(11)

DAFTAR TABEL

Halaman Tabel 2.1. Daftar Prefiks yang Meluluh 12 Tabel 2.2. Daftar Kemungkinan Perubahan Prefiks 12 Tabel 2.3. Daftar Kombinasi Prefiks dan Sufiks yang Tidak

Diperbolehkan 12

Tabel 3.1. Pengkajian Diagram Ishikawa (I) 26 Tabel 3.2. Pengkajian Diagram Ishikawa (II) 27 Tabel 3.3. Kamus Data tb_dokumen 38

Tabel 3.4. Kamus Data tb_kata 38

Tabel 3.5. Kamus Data tb_mkd 39

Tabel 3.6. Kamus Data tb_stopword 39

Tabel 3.7. Kamus Data tb_user 39

Tabel 4.1. Data Pengujian (I) 52

Tabel 4.2. Data Pengujian (II) 53

Tabel 4.3. Data Pengujian (III) 54

Tabel 4.4. Data Pengujian (IV) 55

Tabel 4.5. Hasil Pengujian Perankingan untuk kata kunci I (I) 56 Tabel 4.6. Hasil Pengujian Perankingan untuk kata kunci I (II) 57 Tabel 4.7. Klasifikasi Tingkat Relevansi Dokumen untuk Kata Kunci I 58 Tabel 4.8. Hasil perhitungan Recal, Precission dan F-Measure kata

kunci I 59

Tabel 4.9. Hasil Pengujian Perankingan untuk Kata Kunci II 60 Tabel 4.10. Klasifikasi Tingkat Relevansi Dokumen untuk Kata Kuni II (I) 61 Tabel 4.11. Klasifikasi Tingkat Relevansi Dokumen untuk Kata

Kuni II (II) 62

Tabel 4.12. Hasil perhitungan Recal, Precission dan F-Measure kata

(12)

DAFTAR GAMBAR

Halaman Gambar 2.1. Proses dalam Information Retrieval System 6 Gambar 2.2. Alur proses dari metode latent semantic indexing 8 Gambar 2.3. Contoh Tahapan Praprcessing Pada Dokumen dan Query 10 Gambar 2.4. Format Kata Berimbuhan dalam Bahasa Indonesia 10 Gambar 2.5. Representasi Matriks Kata-Dokumen 13 Gambar 2.6. Ilustrasi Singular Value Decomposition (SVD) dari

Matriks A 15

Gambar 3.1. Diagram Ishikawa 25

Gambar 3.2. Use-Case Diagram 30

Gambar 3.3. Use-CaseDiagram Metode LSI 30 Gambar 3.4. Activity Diagram Pencarian Makalah 31 Gambar 3.5. Activity Diagram Log In 31 Gambar 3.6. Activity Diagram Lihat dan Download Makalah 32 Gambar 3.7. Activity Diagram Tambah Makalah 32 Gambar 3.8. Activity Diagram Edit Makalah 33 Gambar 3.9. Activity Diagram Hapus Makalah 33 Gambar 3.10. Sequence Diagram Proses Pencarian Makalah 34 Gambar 3.11. Sequence DiagramLog In 34 Gambar 3.12. Sequence Diagram lihat arsip 35 Gambar 3.13. Sequence Diagram Kelola Arsip 35

Gambar 3.14. Class Diagram 36

Gambar 3.15. Flowchart Pencarian 37 Gambar 3.16. Rancangan Tampilan Halaman Beranda 40 Gambar 3.17. Rancangan Tampilan Halaman Pencarian 41 Gambar 3.18. Rancangan Tampilan Halaman Hasil Pencarian 41 Gambar 3.19. Rancangan Tampilan Halaman Pencarian Tidak Ditemukan 42 Gambar 3.20. Rancangan Tampilan Halaman Arsip 43 Gambar 3.21. Rancangan Tampilan Halaman Detail Makalah 44 Gambar 3.22. Rancangan Tampilan Halaman Log In 44 Gambar 3.23. Rancangan Tampilan Halaman Dashboard 45

(13)

Gambar 4.11. Grafik Perbandingan nilai recall, precission, dan f-measure

(14)

DAFTAR LAMPIRAN

Halaman

Lampiran 1 Perhitungan Matriks A-1

Lampiran 2 Listing Program B-1

Referensi

Dokumen terkait

Cara bagi hasil yang dilakukan disana dengan sistem kebiasaan di masyarakat, yaitu pemilik tanah menyediakan tanah dan menyediakan biaya yang diperlukan penggarap, dan penggarap

Berdasrakan arahan program prioritas untuk RPI2JM bidang Cipta Karya, dapat diketahui bahwa program tersebar dan keterpaduan ada yang terlihat pada lingkup kecamatan dan

Peserta didik dengan kemampuan penalaran matematis kategori rendah apabila peserta didik dapat melakukan manipulasi matematika dengan benar namun kurang lengkap,

A reasonable plan of action would be to focus attention on the basic components (Land Use Change, Forest Inventory, Tim- ber Market) initially. Once these are functioning, the

BLH Kota Yogyakarta telah melakukan pengendalian terhadap pemakaian air tanah oleh hotel dengan cara pemeriksaan dokumen periodik, mewajibkan hotel membuat sumur resapan,

dapat dilihat kerutan pada kaki yang diolesi krim nanopartikel murni lebih banyak dibandingkan kaki yang diolesi dengan krim yang ditambah dengan bahan aktif

lembaga kesejahteraan sosial anak yang memberikan pelayanan terhadap balita terlantar dari usia. 2 s/d