• Tidak ada hasil yang ditemukan

Penerapan Temu Balik Informasi untuk Rekomendasi Topik Tugas Akhir (Studi Kasus: Program Studi S1 Teknik Informatika UK Maranatha).

N/A
N/A
Protected

Academic year: 2017

Membagikan "Penerapan Temu Balik Informasi untuk Rekomendasi Topik Tugas Akhir (Studi Kasus: Program Studi S1 Teknik Informatika UK Maranatha)."

Copied!
20
0
0

Teks penuh

(1)

v

ABSTRAK

Penelitian ini bertujuan untuk memudahkan pencarian dokumen-dokumen yang memiliki hubungan antar kata, bukan hanya pencarian pada judul dokumen saja akan tetapi dapat juga mencari dari isi dokumen tersebut. Dalam penerapannya penelitian ini menggunakan metode Latent Semantic Indexing (LSI) sebagai dasar metodenya. Latent Semantic Indexing (LSI) merupakan metode pengindeksan yang menggunakan teknik matematika yang disebut Singular Value Decomposition (SVD) untuk mengidentifikasi pola dalam hubungan antar istilah. Singular Value Decomposition (SVD) adalah faktorisasi matriks real atau matriks komplek. Sebagai data untuk penelitian ini menggunakan data tugas akhir dari jurusan S1 Teknik Informatika Universitas Kristen Maranatha dari tahun 2003 hingga 2013. Uji coba dilakukan dengan menggunakan beberapa query yang berbeda dan dengan total dokumen yang dibaca antara 10 dokumen dan 20 dokumen. Setelah uji coba dilakukan, dapat dihasilkan pencarian dokumen yang relevan sesuai dengan kata kunci yang dimasukan, dan pemberian rekomendasi kata berbeda antara pembacaan 10 dokumen dan 20 dokumen.

(2)

vi

ABSTRACT

This study aims to facilitate the search for documents which have realtionships between words, not just a search on the title of the document but also from the content of the document. In application of this study using Latent Semantic Indexing (LSI) as the base method. Latent Semantic Indexing (LSI) is an indexing method that uses a mathematical technique called Singular Value Decomposition (SVD) to identify patters in the relationships between terms. Singular Value Decomposition (SVD) is a matrix factorization of the real or complex matrix. As the data for this study using data from the final assignment of S1 Computer Science Maranatha Christian Universty from 2003 to 2013. Trial was performed using several different queries and total documents to read between 10 documents and 20 documents. After the trial is done, relevant documents can be generated according to the entered keywords, and recommendations differ between 10 documents and 20 documents to read.

(3)

vii

DAFTAR ISI

LEMBAR PENGESAHAN ... i

PERNYATAAN ORISINALITAS LAPORAN PENELITIAN ... ii

PERNYATAAN PUBLIKASI LAPORAN PENELITIAN... iii

PRAKATA ... iv

DAFTAR NOTASI/ LAMBANG ... xiii

DAFTAR SINGKATAN ... xvi

DAFTAR RUMUS... xvii

DAFTAR KODE PROGRAM ... xviii

BAB I PENDAHULUAN... 1

1.1 Latar Belakang ... 1

1.2 Rumusan Masalah ... 1

1.3 Tujuan ... 2

1.4 Batasan Masalah... 2

1.5 Sistematika Penyajian ... 3

BAB II KAJIAN TEORI... 4

2.1 Latent Semantic Indexing (LSI) ... 4

2.2 Singular Value Decomposition (SVD) ... 4

2.3 Stopwrods ... 10

2.4 Indri ... 11

2.5 Total Reciprocal Rank... 13

BAB III ANALISIS DAN DISAIN ... 14

3.1 Arsitektur Perangkat Lunak ... 14

3.2 Use Case... 15

(4)

viii

3.3.1 Use Case Cari Dokumen Tugas Akhir ... 16

3.3.2 Use Case Rekomendasi ... 16

3.3.3 Use Case Indexing... 17

3.3.4 Use Case Refinment Query ... 17

3.4 Activity Diagram ... 18

3.4.1 Activity Diagram Cari Dokumen Tugas Akhir ... 18

3.4.2 Activity Diagram Melihat Topik Terkait... 19

3.4.3 Activity Diagram Indexing ... 19

3.4.4 Activity Diagram Refinment Query ... 20

3.5 Entity Relationship Diagram (ERD) ... 21

3.6 Gambaran Keseluruhan ... 22

3.6.1 Persyaratan Antarmuka Eksternal ... 22

3.6.2 Antarmuka dengan Pengguna ... 22

3.6.3 Antarmuka Perangkat Keras ... 23

3.6.4 Antarmuka Perangkat Lunak... 23

3.6.5 Fitur-fitur Produk Perangkat Lunak ... 23

3.6.6 Fitur Rekomendasi ... 26

3.7 Disain Antarmuka ... 28

3.7.1 Main Form ... 28

3.7.2 Form Configuration ... 29

BAB IV PENGEMBANGAN PERANGKAT LUNAK ... 30

4.1 Implementasi Class/Modul... 30

4.2 Implementasi Penyimpanan Data ... 31

4.3 Implementasi Antarmuka ... 31

4.3.1 Menu Utama ... 31

4.3.2 Menu Konfigurasi ... 32

4.4 Pseudocode ... 33

4.5 Penjelasan Arsitektur Perangkat Lunak ... 34

4.5.1 Ubah Dokumen dari bentuk PDF menjadi file text ... 34

4.5.2 Membuang Stopwords ... 35

4.5.3 Melakukan Latent Semantic Indexing (LSI) ... 37

(5)

ix

4.5.5 Searching ... 41

BAB V TESTING DAN EVALUASI SISTEM ... 45

5.1 Rencana Pengujian ... 45

5.1.1 Pengujian 1 ... 45

5.1.2 Pengujian Waktu ... 46

5.1.3 Pengujian Query ... 47

5.1.4 Pengujian Rekomendasi ... 86

5.1.5 Total Reciprocal Rank... 93

5.2 Pelaksanaan Pengujian ... 93

5.2.1 Pengujian Menu Utama ... 93

5.2.2 Pengujian Menu Konfigurasi ... 95

BAB VI SIMPULAN DAN SARAN ... 96

6.1 Kesimpulan ... 96

6.2 Saran ... 96

(6)

x

DAFTAR GAMBAR

Gambar 2.1 Matriks A... 6

Gambar 2.2 Menemukan Singular Value dan Eigenvalue ... 6

Gambar 2.3 Menghitung Singular Value ... 7

Gambar 2.4 Eigenvactor... 7

Gambar 2.5 Normalisasi... 7

Gambar 2.6 Matriks V... 8

Gambar 2.7 Matriks U... 8

Gambar 2.8 Reduksi SVD ... 9

Gambar 2.9 Vektor Query ... 10

Gambar 2.10 Cosinus Query ... 10

Gambar 2.11 Indexing Indri ... 11

Gambar 2.12 Searching Indri ... 12

Gambar 3.1 Arsitektur Perangkat Lunak ... 15

Gambar 3.2 Use Case Diagram ... 16

Gambar 3.3 Activity Diagram Cari Dokumen Tugas Akhir ... 18

Gambar 3.4 Activity Diagram Melihat Topik Terkait ... 19

Gambar 3.5 Activity Diagram Indexing ... 20

Gambar 3.6 Refinment Query ... 21

Gambar 3.7 Entity Relationship Diagram (ERD) ... 22

Gambar 3.8 Menu Utama ... 28

Gambar 3.9 Menu Konfiguration ... 29

Gambar 4.1 Class Diagram ... 30

Gambar 4.2 Implementasi Basis Data ... 31

Gambar 4.3 Menu Utama ... 31

Gambar 4.4 Menu Konfigurasi ... 32

Gambar 4.5 Aristektur Perangkat Lunak ... 34

Gambar 4.6 Aplikasi PDFZilla 1.2 ... 35

Gambar 5.1Pengujian 1A ... 45

(7)

xi

DAFTAR TABEL

Tabel 2.1 Contoh TTR ... 13

Tabel 4.1 Contoh daftar stopwords ... 35

Tabel 5.1 Perbedaan waktu pembuatan indeks ... 46

Tabel 5.2 Perbandingan waktu pencarian ... 47

Tabel 5.3 Perbandingan Query 1 ... 47

Tabel 5.4 Perbandingan Qeury 2 ... 50

Tabel 5.5 Perbandingan Query 3 ... 52

Tabel 5.6 Perbandingan Query 4 ... 54

Tabel 5.7 Perbandingan Query 5 ... 57

Tabel 5.8 Perbandingan Query 6 ... 59

Tabel 5.9 Perbandingan Query 7 ... 61

Tabel 5.10 Perbandingan Query 8 ... 63

Tabel 5.11 Perbandingan Query 9 ... 65

Tabel 5.12 Perbandingan Query 10 ... 66

Tabel 5.13 Perbandingan Query 11 ... 68

Tabel 5.14 Perbandingan Query 12 ... 71

Tabel 5.15 Perbandingan Query 13 ... 73

Tabel 5.16 Perbandingan Query 14 ... 75

Tabel 5.17 Perbandingan Query 15 ... 77

Tabel 5.18 Perbandingan Query 16 ... 79

Tabel 5.19 Perbandingan Query 17 ... 80

Tabel 5.20 Perbandingan Query 18 ... 82

Tabel 5.21 Perbandingan Query 19 ... 84

Tabel 5.22 Perbandingan Rekomendasi 1 ... 86

Tabel 5.23 Perbandingan Rekomendasi 2 ... 87

Tabel 5.24 Perbandingan Rekomendasi 3 ... 87

Tabel 5.25 Perbandingan Rekomendasi 4 ... 87

Tabel 5.26 Perbandingan Rekomendasi 5 ... 88

Tabel 5.27 Perbandingan Rekomendasi 6 ... 88

(8)

xii

Tabel 5.29 Perbandingan Rekomendasi 8 ... 89

Tabel 5.30 Perbandingan Rekomendasi 9 ... 89

Tabel 5.31 Perbandingan Rekomendasi 10 ... 89

Tabel 5.32 Perbandingan Rekomendasi 11 ... 90

Tabel 5.33 Perbandingan Rekomendasi 12 ... 90

Tabel 5.34 Perbandingan Rekomendasi 13 ... 90

Tabel 5.35 Perbandingan Rekomendasi 14 ... 91

Tabel 5.36 Perbandingan Rekomendasi 15 ... 91

Tabel 5.37 Perbandingan Rekomendasi 16 ... 91

Tabel 5.38 Perbandingan Rekomendasi 17 ... 92

Tabel 5.39 Perbandingan Rekomendasi 18 ... 92

Tabel 5.40 Perbandingan Rekomendasi 19 ... 92

Tabel 5.41 Hasil Total Reciprocal Rank ... 93

Tabel 5.42 Pengujian menu utama ... 93

(9)

xiii

DAFTAR NOTASI/ LAMBANG

Jenis Notasi/Lambang Nama Arti

UML

UseCase1 Use Case Nama proses

yang ada pada

UML «extends» Extends

(10)

xiv

Jenis Notasi/Lambang Nama Arti

UML

Pembelian Barang

Apotek

System

(11)

xv

Jenis Notasi/Lambang Nama Arti

Activity

Diagram

ActionState1

Action State

Proses yang dilakukan oleh sistem/pengguna

Activity Diagram

Final State

Akhir dari sebuah alur

activity Activity

Diagram

Control Flow

(12)

xvi

DAFTAR SINGKATAN

(13)

xvii

DAFTAR RUMUS

(14)

xviii

DAFTAR KODE PROGRAM

Kode Program 4.1 Kode Program Stopwords ... 37

Kode Program 4.2 Kode Program Indexing ... 40

Kode Program 4.3 Save Index ... 41

(15)

1

BAB I

PENDAHULUAN

1.1 Latar Belakang

Seiring dengan majunya perkembangan teknologi sekarang, sudah banyak aplikasi untuk melakukan penelusuran dokumen guna mempermudah dan mempersingkat waktu yang dibutuhkan oleh pengguna dalam melakukan pencarian. Akan tetapi sistem pencarian yang disediakan biasanya hanya terbatas untuk melakukan pencarian nama dokumennya saja, sedangkan biasanya pengguna ingin melakukan pencarian dokumen-dokumen yang berkaitan dengan isi dokumen.

Perpustakaan sekarang ini hanya menerapkan pencarian berdasarkan judul artikel atau judul buku saja, khususnya di perpustakaan Universitas Kristen Maranatha. Untuk mempercepat dan menambah keakuratan pencarian agar sesuai dengan keinginan pencari, maka dibuatlah aplikasi pencarian untuk melakukan pencarian bukan hanya pada judul Tugas Akhir saja namun dapat juga melakukan pencarian dari isi dokumennya juga. Dalam penerapannya aplikasi ini akan menggunakan metode Latent Semantic Indexing (LSI) dalam melakukan pengambilan informasi dari dokumen-dokumen yang ada. Latent Semantic

Indexing (LSI) dapat menghasilkan hubungan antar kata atau disebut juga dengan semantic sehingga LSI tidak memerlukan pencocokan yang sama persis untuk

kalimat query agar dapat menghasilkan dokumen yang relevan. Dengan menggunakan metode LSI dimungkinkan untuk melakukan pencarian berdasarkan kata kunci atau frasa dari isi dokumen, selain itu juga LSI dapat melakukan penyaringan kata-kata yang tidak perlu, sehingga dapat mendekati permintaan pencarian.

1.2 Rumusan Masalah

(16)

2

referensi topik lain yang berhubungan dengan topik yang sedang dicari. Sehingga dapat dirumuskan masalah - masalah yang terdapat di perpustakaan Universitas Kristen Maranatha adalah :

1. Bagaimana cara untuk dapat melakukan pencarian pada judul tugas akhir atau isi dokumen abstrak tugas akhir ?

2. Bagaimana memanfaatkan hasil penelusuran isi dokumen untuk memberikan rekomendasi topik yang terkait ?

1.3 Tujuan

Berdasarkan latar belakang dan rumusan masalah, maka dapat diambil tujuan pembahasannya antara lain :

1. Menyediakan fasilitas yang menerapkan temu balik informasi untuk pencarian topik tugas akhir di perpustakaan Universitas Kristen Maranatha yang mencakup isi dokumen.

2. Membuat Aplikasi untuk melakukan pencarian dokumen dengan menerapkan metode Latent Semantic Indexing untuk memberikan rekomendasi topik yang terkait dengan topik yang dicari.

1.4 Batasan Masalah

Agar masalah tidak meluas, masalah yang akan dibahas disini adalah : 1. Bagaimana menerapkan fasilitas temu balik informasi dengan

menggunakan metode Latent Semantic Indexing di perpustakaan Universitas Kristen Maranatha untuk mempermudah pengguna dalam mencari topik tugas akhir dan dapat memberikan rekomendasi topik terkait.

2. Data yang digunakan adalah dokumen tugas akhir yang dikumpulkan pada tahun 2006-2013 di Fakultas Teknologi Informasi Jurusan S1 Teknik Informatika.

3. Ukuran indeks yang digunakan seluruh dokumen yang ada, dan hanya bagian abstract saja yang akan dijadikan indeks.

(17)

3

Teknik Informatika, yang diacu pada buku panduan mahasiswa jurusan S1 Teknik Informatika Tahun Akademik 2012/2013.

1.5 Sistematika Penyajian

Sistematika pembahasan dari penyusunan laporan ini adalah sebagai berikut:

BAB I. Pendahuluan

Bab ini berisi tentang pendahuluan yang terdiri dari latar belakang, rumusan masalah, tujuan, batasan masalah, dan sistematika penyajian laporan tugas akhir.

BAB II. Kajian Teori

Bab ini berisi tentang penjelasan teori-teori yang berkaitan dengan pembuatan dan pendukung perangkat lunak.

BAB III. Analisis dan Disain

Bab ini berisi tentang penjelasan analisis, gambaran arsitektur keseluruhan, dan disain perangkat lunak.

BAB IV. Pengembangan Perangkat Lunak

Bab ini berisi tentang penjelasan perencanaan tahap implementasi modul dan penyimpanan data, penjelasan mengenai analisis dari algoritma yang digunakan.

BAB V. Testing dan Evaluasi Sistem

Bab ini berisi tentang penjelasan rencana pengujian perangkat lunak serta testing yang akan dilakukan.

BAB VI. Kesimpulan dan Saran

(18)

98

BAB VI

SIMPULAN DAN SARAN

6.1 Kesimpulan

Berdasarkan hasil pembahasan diatas dan hasil yang telah dicapai dalam pembuatan aplikasi ini, maka dapat ditarik kesimpulan sebagai berikut :

1. Telah berhasil dibuat sebuah aplikasi yang dapat melakukan pencarian tugas akhir dengan menggunakan metode Latent Semantic Indexing (LSI).

2. Aplikasi dapat melakukan tahap pre-processing dan indexing, memberikan rekomendasi kata, serta melakukan pencarian dokumen relevan.

3. Setelah dilakukan pengujian pada aplikasi lain yaitu Indri, waktu yang dibutuhkan oleh aplikasi (LSI) untuk melakukan indexing dan searching lebih lama. Hal ini disebabkan aplikasi Indri menerapkan language modeling dan

inference network sebagai dasar modelnya. Aplikasi Indri juga menerapkan

metode clustering dari koleksi lokal ketika melakukan proses pencarian. Hasil pengujian dapat dilihat pada Tabel 5.1 dan Tabel 5.2.

4. Dari hasil pengujian query pada aplikasi Indri dan LSI, terdapat kesamaan dokumen relevan yang dihasilkan meskipun metode yang digunakan berbeda. Hasil pengujian dapat dilihat pada Tabel 5.3 - Tabel 5.8.

5. Dari hasil pengujian untuk perbandingan rekomendasi, ada ketidaksamaan kata yang dihasilkan pada masing-masing aplikasi untuk setiap layer. Hal ini disebabkan hasil yang diperoleh dari masing-masing aplikasi tersebut memberikan dokumen relevan yang tidak selalu sama, sehingga mempengaruhi pemberian rekomendasi kata. Hasil pengujian dapat dilihat pada Tabel 5.22 - Tabel 5.24.

6.2 Saran

Untuk mengembangkan aplikasi ini agar lebih baik lagi maka dapat dilakukan beberapa hal sebagai berikut :

1. Mengubah metode dalam melakukan pencarian rekomendasi agar waktu yang dibutuhkan untuk pencarian tidak terlalu lama.

(19)

99

3. Memberikan visualisasi keterkaitan kata-kata pada rekomendasi dengan kata kunci pencarian, sehingga dapat diketahui sebaran katanya.

(20)

100

DAFTAR PUSTAKA

Deerwester, S. (1988). Improving Information Retrieval with Latent Semantic Indexing. In Proceedings of the 51st Annual Meeting of the American Society

for Information Science 25 (pp. 36-40).

Konchady, M. (2006). Text Mining Applcation Programming. Boston, Massachusetts: Charles River Media.

Kontostathis, A. (n.d.). Essential Dimensions of Latent Semantic Indexing (LSI).

Essential Dimensions of Latent Semantic Indexing (LSI).

Kowalski, G. (2011). Information Retrieval Architecture and Algorithms. Springer US.

Landauer, T., & et, a. (1998). Learning Human-like Knowledge by Singular Value Decomposition. Cambridge: MIT Press.

Metzler, D., Strohman, T., Turtle, H., & Croft, W. B. (2004). Indri at TREC 2004: T erabyte Track.

Strang, G. (2006). Linear Algebra and its Applications. Cengage Learning.

Tala, F. Z. (2003). A Study of Steamming Effects on Information Retrieval in Bahasa Indonesia.

Voorhees, E. (1999). Proceedings of the 8th Text Retrieval Conference. TREC-8

Referensi

Dokumen terkait

5. Pekerjaan pembuatan rangka dinding dan pemasangan dinding pemisah; 6. Pekerjaan pemasangan listplank kayu dan list plafond. Pelaksana pembangunan gedung dan perumahan

Pengorganisasian adalah penentuan, pengelompokkan, dan penyusunan macam-macam kegiatan yang diperlukan untuk mencapai tujuan, penempatan orang-orang (pegawai), terhadap

Sasaran kesehatan hewan untuk tahun 2007-2010 yang telah ditetapkan oleh Direktorat Kesehatan Hewan dalam mendukung kecukupan daging sapi 2010, adalah: menekan angka kematian

Kondisi ini berbanding terbalik dengan kondisi sampel untuk dosis asam sulfat 0,75 %, data yang dihasilkan memiliki kecendrungan bahwa semakin tinggi temperatur pemanasan

a) Decomposition, yaitu memecahkan persoalan utuh menjadi unsur- unsurnya, setelah persoalan tersebut dirumuskan secara baik. Unsur- unsur persoalan yang telah terpecahkan,

[r]

Identifikasi End-user dan Network Device Jaringan Nirkabel Teknologi jaringan nirkabel sebenarnya terbentang luas mulai dari komunikasi suara sampai dengan jaringan data,

Tujuan pengobatan adalah untuk mengurangi pembatasan dalam mobilitas jaringan lunak dari struktur periartikular, untuk meningkatkan arthrokinematic dan gerak