• Tidak ada hasil yang ditemukan

Perbandingan unjuk kerja struktur data linkedlist dan array list dalam inverted index untuk mendukung sistem pemerolehan informasi judul buku koleksi perpustakaan (studi kasus: Perpustakaan Universitas Sanata Dharma)

N/A
N/A
Protected

Academic year: 2021

Membagikan "Perbandingan unjuk kerja struktur data linkedlist dan array list dalam inverted index untuk mendukung sistem pemerolehan informasi judul buku koleksi perpustakaan (studi kasus: Perpustakaan Universitas Sanata Dharma)"

Copied!
106
0
0

Teks penuh

(1)PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI. PERBANDINGAN UNJUK KERJA STRUKTUR DATA LINKEDLIST DAN ARRAY LIST DALAM INVERTED INDEX UNTUK MENDUKUNG SISTEM PEMEROLEHAN INFORMASI JUDUL BUKU KOLEKSI PERPUSTAKAAN Studi Kasus Perpustakaan Universitas Sanata Dharma. SKRIPSI Diajukan untuk Memenuhi Salah Satu Syarat Memperoleh Gelar Sarjana Komputer Program Studi Teknik Informatika. Diajukan Oleh: Gabriel Indra Widi Tamtama. 135314075. PROGRAM STUDI TEKNIK INFORMATIKA JURUSAN TEKNIK INFORMATIKA FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS SANATA DHARMA YOGYAKARTA 2017.

(2) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI. PERBANDINGAN UNJUK KERJA STRUKTUR DATA LINKEDLIST DAN ARRAY LIST DALAM INVERTED INDEX UNTUK MENDUKUNG SISTEM PEMEROLEHAN INFORMASI JUDUL BUKU KOLEKSI PERPUSTAKAAN Studi Kasus Perpustakaan Universitas Sanata Dharma. SKRIPSI Diajukan untuk Memenuhi Salah Satu Syarat Memperoleh Gelar Sarjana Komputer Program Studi Teknik Informatika. Diajukan Oleh: Gabriel Indra Widi Tamtama. 135314075. PROGRAM STUDI TEKNIK INFORMATIKA JURUSAN TEKNIK INFORMATIKA FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS SANATA DHARMA YOGYAKARTA 2017. i.

(3) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI. COMPARISON OF THE PERFORMANCE OF LINKEDLIST AND ARRAYLIST DATA STRUCTURE USING INVERTED INDEX TO SUPPORT INFORMATION RETRIEVAL OF TITLE LIBRARY COLLECTION Case Study: Sanata Dharma University Library. THESIS. Presented as Partial Fullfilment of the Requirements To Obtain the Sarjana Komputer Degree In Informatics Engineering. By: Gabriel Indra Widi Tamtama. 135314075. INFORMATICS ENGINEERING STUDY PROGRAM DEPARTMENT OF INFORMATICS ENGINEERING FACULTY OF SCIENCE AND TECHNOLOGY SANATA DHARMA UNIVERSITY YOGYAKARTA 2017. ii.

(4) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI. iii.

(5) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI. iv.

(6) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI. v.

(7) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI. ABSTRAKSI Perpustakaan merupakan tempat koleksi berbagai macam buku dan memungkinkan setiap pengunjung untuk membaca dan meminjam buku di perpustakaan. Tidak dipungkiri bahwa koleksi perpustakaan setiap tahun mengalamai penambahan koleksi baik jenis buku maupun kategori. Begitu juga dengan Perpustakaan Universitas Sanata Dharma. Sebelum adanya sistem pencarian judul buku koleksi perpustakaan, pengunjung sering mengalami kesulitan ketika akan mencari buku yang diinginkan. Maka untuk memudahkan pencarian buku dibuatlah sistem pencarian yang mampu mencari judul buku sesuai dengan kebutuhan pengunjung. Sistem pemerolehan informasi yang dibangun menggunakan struktur data inverted index dengan arraylist dan linkedlist menawarkan kelebihan dalam membantu pengunjung untuk mencari judul buku yang diinginkan. Struktur data inverted index yang dibangun dengan arraylist dan linkedlist diuji performanya dalam melakukan pencarian judul buku perpustakaan kemudian dibandingkan hasilnya dengan sistem pencarian yang dimiliki oleh Perpustakaan Universitas Sanata Dharma. Perbandingan dilakukan dengan membandingkan nilai relevansi antara sistem pemerolehan informasi dan sistem pencarian yang dimiliki perpustakaan. Hasil yang didapat yaitu kedua sistem pencarian mampu mencari judul buku yang diinginkan sesuai dengan kebutuhan pengunjung. Selain itu, ditemukan perbedaan antara sistem pemerolehan informasi dengan sistem pencarian yang dimiliki perpustakaan Sanata Dharma.. Kata kunci: inverted index, arraylist, linkedlist, sistem pencarian, perpustakaan.. vi.

(8) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI. ABSTRACT Library is a book collection place where people can read and borrow book. There is no doubt of the fact that books collection is increasing, whether it is from the kinds of the book or the categories. It also happens with Sanata Dharma University Library. Prior to the existence of the search system to find the collection of the book from the library, many visitors have difficulties to find the desired book. From that fact, the researcher designed a system which will help the visitor to find the collection of the book that suit the needs of the visitor. Information retrieval system which is made from inverted index data structure with arraylist and linkendlist offers some advantages to help the visitor to find the desired collection of the book. Inverted Index data structure which is built from the arraylist and the linkedlist is tested by the performance and the result is compared with search system of Sanata Dharma University Library. The comparison is done by comparing the value of relevance between information acquisition system and search system which the library has. The result is both of the systems can find the title of the desired book according to the needs of visitors. Furthermore, the researcher found differences between the information acquisition system and search system which Sanata Dharma University Library has.. Keyword: inverted index, arraylist, linkedlist, search engine, library.. vii.

(9) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI. viii.

(10) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI. KATA PENGANTAR Puji dan syukur saya panjatkan kepada Tuhan Yang Maha Kuasa, karena berkat kuasa dan rahmat-Nya saya dapat menyelesaikan Tugas Akhir ini dengan lancar. Tugas akhir merupakan syarat dalam memperoleh gelar sarjana bagi mahasiswa dan untuk Teknik Informatika untuk memperoleh gelar Sarjana Komputer (S. Kom). Tugas akhir ini selesai tak lepas dari bantuan dosen pembimbing, orang tua, teman seperguruan, dan pihak-pihak lain yang turut membantu. Oleh karena itu, perkenankan saya selaku penulis mengucapkan terima kasih kepada:. 1. Bapak JB. Budi Darmawan, S.T., M.Sc., selaku dosen pembimbing yang dengan sabar senantiasa memberi masukan dan bimbingan dalam penyusunan tugas akhir ini. 2. Segenap dosen jurusan Teknik Informatika Universitas Sanata Dharma. 3. Keluarga, Agustinus Sukaryadi (Bapak), Maria Wahyuni (Ibu), dan Monica Warih Widi Kristanti (Adik) yang selalu memberi dukungan dalam penyusunan tugas akhir ini. 4. Responden yang membantu dalam pengujian sistem. 5. Teman-teman seperjuangan Teknik Informatika khususnya Arka, Kris, Kasih, Medi, Windi, Valen, Baptista, Awan, Kris Hendra, Andre, Advent, Joseph, Adit, Adhi, Ekky, Bagus, Lukas, Rusydi dan teman-teman yang tidak dapat saya sebutkan satu persatu. 6. Seluruh pihak yang sudah membantu dalam pengerjaan tugas akhir saya secara langsung maupun tidak langsung.. Saya selaku penulis menyadari bahwa tugas akhir ini masih banyak kekurangan. Oleh karena itu, besar harapan saya untuk memberikan kritik dan saran sehingga bisa saya gunakan di masa yang mendatang. Akhir kata semoga karya saya ix.

(11) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI. ini dapat digunakan dan bermanfaat bagi civitas akademika Universitas Sanata Dharma maupun bagi pembaca yang lain.. Yogyakarta, 2017. x.

(12) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI. DAFTAR ISI HALAMAN PERSETUJUAN ..................................................................................... iii PERNYATAAN KEASLIAN KARYA ...................................................................... iv ABSTRAKSI ............................................................................................................... vi ABSTRACT ................................................................................................................ vii KATA PENGANTAR ............................................................................................... viii DAFTAR ISI ................................................................................................................ xi Daftar Tabel ............................................................................................................... xiv Daftar Gambar ............................................................................................................. xv BAB I PENDAHULUAN ........................................................................................................ 1 1.1. Latar Belakang ............................................................................................... 1. 1.2. Rumusan Masalah .......................................................................................... 4. 1.3. Tujuan ............................................................................................................. 4. 1.4. Batasan Masalah ............................................................................................. 5. 1.5. Sistematika Penulisan ..................................................................................... 5. BAB II TINJAUAN PUSTAKA ............................................................................................... 7 2.1. Pemerolehan Informasi ................................................................................... 7. 2.2. Logical View Pada Document ........................................................................ 8. 2.2.1. Stopwords ................................................................................................ 9. 2.2.2. Stemming ................................................................................................. 9. 2.3. Inverted Index ............................................................................................... 11. 2.4. Pembobotan TF-IDF..................................................................................... 15. 2.5. Struktur Data ................................................................................................ 16. 2.5. Precision dan Recall ..................................................................................... 17. BAB III METODOLOGI PENELITIAN.................................................................... 18. xi.

(13) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI. 3.1. Gambaran Umum Penelitian ........................................................................ 18. 3.2. Sumber Data ................................................................................................. 18. 3.3. Spesifikasi Alat............................................................................................. 18. 3.4. Perbandingan Struktur Data ......................................................................... 19. 3.5 Tahap-Tahap Penelitian .................................................................................... 20 BAB IV ANALISA DAN PERANCANGAN SISTEM ........................................................... 23 4.1. Analisa Sistem .............................................................................................. 23. 4.2. Analisis Kebutuhan Pengguna...................................................................... 25. 4.3. Perancangan Sistem ...................................................................................... 27. 4.4. Rancangan Struktur Data Inverted Index ..................................................... 33. 4.5. Algoritma pencarian dengan operator AND................................................. 34. 4.6. Rancangan Basis Data .................................................................................. 34. 4.7. Rancangan Desain Antarmuka ..................................................................... 37. BAB V IMPLEMENTASI DAN ANALISIS HASIL ............................................................. 39 5.1. Spesifikasi Software dan Hardware ............................................................. 39. 5.2. Implementasi Antar Muka (Interface) .......................................................... 40. 5.3. Implementasi Stemming ............................................................................... 41. 5.4. Implementasi inverted index ........................................................................ 41. 5.5. Pengujian dan Analisa Hasil ....................................................................... 42. 5.6. Perbandingan Relevansi Hasil Pencarian Judul Buku ................................. 42. 5.7 Perbandingan Rata-Rata Precision Sistem Pemerolehan Informasi dengan Sistem Pencarian Perpustakaan Sanata Dharma ..................................................... 48 5.8 Perbandingan Kecepatan Struktur Data Linked List dan Array List ................. 50 BAB VI KESIMPULAN DAN SARAN ................................................................................... 52 DAFTAR PUSTAKA ................................................................................................. 54 Lampiran ..................................................................................................................... 56 xii.

(14) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI. Lampiran I ............................................................................................................... 56 Lampiran II.............................................................................................................. 59 Lampiran III ............................................................................................................ 71. xiii.

(15) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI. Daftar Tabel Tabel 4. 1 Tabel buku_perpus ..................................................................................... 34 Tabel 4. 2 Table Terms ............................................................................................... 35 Tabel 4. 3 Tabel Sourceterm ....................................................................................... 35 Tabel 4. 4 Tabel Posting.............................................................................................. 36 Tabel 4. 5 Tabel posting_stopword ............................................................................. 36 Tabel 4. 6 Tabel stopwords ......................................................................................... 37 Tabel 5. 7 recall and precision ................................................................................... 46 Tabel 5. 8 precision dalam 11 titik recall ................................................................... 47 Tabel 5. 10 Perbedaan waktu pencarian ArrayList dan Linkedlist ............................. 50. xiv.

(16) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI. Daftar Gambar Gambar 2. 1 Proses Pemerolehan Informasi (Baeza-Yates, 1999) ............................... 7 Gambar 2. 2 Logical view ............................................................................................. 8 Gambar 2. 3 Inverted index (Manning, 2008) ............................................................. 12 Gambar 2. 4 Membangun inverted index (Manning, 2008) ........................................ 13 Gambar 2. 5 Intersection posting list (Manning, 2008) .............................................. 14 Gambar 2. 7 Linked list (Robert, 2003) ...................................................................... 17 Gambar 3. 1 Linked List .............................................................................................. 19 Gambar 3. 2 Array List ............................................................................................... 19 Gambar 3. 3 Metode waterfall (Pressman & Roger(2001)) ........................................ 21 Gambar 4. 1 LinkedList ............................................................................................... 23 Gambar 4. 2 Struktur Pemerolehan Informasi (Nazief & Andriani, 1996) ................. 24 Gambar 4. 3 Use Case Diagram ................................................................................. 25 Gambar 4. 4 Desain Kelas Analisis ............................................................................ 28 Gambar 4. 5 Entity Relationship Diagram .................................................................. 30 Gambar 4. 6 Logical design ........................................................................................ 32 Gambar 4. 7 Representasi Inverted Index ................................................................... 33 Gambar 4. 8 Halaman awal ......................................................................................... 37 Gambar 4. 9 Halaman hasil ......................................................................................... 38 Gambar 5. 1 Tampilan Awal ....................................................................................... 40 Gambar 5. 2 Halaman Hasil Pencarian ....................................................................... 40 Gambar 5. 4 Inverted index ......................................................................................... 41 Gambar 5. 5 Grafik precision dalam 11 titik recall .................................................... 73 Gambar 5. 6 Grafik precision dalam 11 titik recall ................................................... 44 Gambar 5. 7 Grafik precision dalam 11 titik recall .................................................... 46 Gambar 5. 8 Grafik precision dalam 11 titik recall .................................................... 48 Gambar 5. 9 Grafik relevansi sistem pencarian dan pemerolehan informasi ............. 49. xv.

(17) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI. BAB I PENDAHULUAN 1.1 Latar Belakang Perpustakaan. merupakan. tempat. koleksi. buku-buku. dan. memungkinkan orang untuk bisa membaca maupun meminjam buku di perpustakaan. Buku-buku yang dikoleksi pun beraneka ragam jenis dan kategori seperti pendidikan, kuliner, artikel, teknologi, agama dan jurnal. Buku-buku yang dikoleksi ditempatkan sesuai dengan pengkategorian dan jenis buku tersebut sehingga tidak jarang orang mengalami kesulitan ketika mencari buku tersebut. Secara konkrit, perpustakaan didefinisikan sebagai unit kesatuan dari sebuah lembaga pendidikan yang berupa tempat penyimpanan koleksi bukubuku pustaka. Ada beberapa jenis perpustakaan berdasarkan fungsi dan tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan umum, perpustakaan perguruan tinggi, perpustakaan sekolah, perpustakaan khusus, perpustakaan keagamaan, perpustakaan internasional, perpustakaan pribadi dan perpustakaan digital. Seiring dengan kemajuan dan perkembangan teknologi informasi dan komunikasi, maka keinginan orang untuk mendapat pengetahuan harus semakin cepat dan ringkas. Namun, seringkali pengunjung perpustakaan sering kehabisan waktu untuk mencari buku yang akan dibaca sehingga di. 1.

(18) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 2. perpustakaan dibutuhkan suatu layanan yang dapat memberikan kemudahan dalam menelusuri informasi tentang suatu buku dengan cepat, ringkas, mudah dan efisien. Perpustakaan dituntut untuk bisa menyesuaikan diri. dengan. perkembangan. dan. kemajuan. teknologi. dan. mampu. menerapkannya untuk mendukung proses pencarian judul buku. Perpustakaan perlu mengorganisasikan kembali koleksi dan informasi yang ada dengan cara menciptakan katalog dan indeks dalam format web sehingga bisa ditelusuri informasi yang ada dengan mudah. Pemerolehan informasi (information retrieval) menjadi alternatif dan memberikan kemudahan dalam mencari judul buku dalam web perpustakaan karena mampu mencari dan mencocokkan kata kunci yang dimasukkan oleh pengguna. Pemerolehan informasi merupakan salah satu bidang ilmu komputer yang berhubungan dengan pengambilan informasi dari dokumendokumen yang disimpan dalam basis data. Informasi atau data yang dicari dapat berupa berupa teks, gambar, audio, video dan lain-lain. Koleksi data teks yang dapat dijadikan sumber pencarian juga dapat berupa pesan teks, seperti e-mail, fax, dan dokumen berita, bahkan dokumen yang beredar di internet. Dengan jumlah dokumen koleksi yang besar sebagai sumber pencarian, maka dibutuhkan suatu sistem yang dapat membantu user menemukan buku yang sesuai dalam waktu yang efisien..

(19) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 3. Inverted index terbukti efisien dalam menjawab query dan diterapkan pada kebanyakan sistem pemerolehan informasi berbasis web (Baeza-Yates, 2009). Penelitian yang berkaitan dengan pemerolehan informasi sudah pernah dilakukan oleh Puspitaningrum (2011) tentang pemerolehan informasi pada undang-undang dengan menerapkan struktur data inverted index yang bertujuan untuk mencari pasal-pasal dalam perundang-undangan. Struktur data yang menjadi perhatian penulis adalah struktur data array list dan linkedlist. Kedua struktur data tersebut sama-sama dapat digunakan untuk membuat inverted index berdasarkan indexing dokumen. Tujuan dari membandingkan kedua struktur data tersebut adalah mencari keefisien pencarian yang diukur dengan kecepatan pencarian dalam mencari judul buku koleksi perpustakaan Universitas Sanata Dharma. Alasan lain penulis membandingkan dengan website perpustakaan Universitas Sanata Dharma karena penulis ingin mengetahui bila pencarian judul buku perpustakaan menggunakan model pemerolehan informasi jauh lebih baik atau tidak dari sistem yang ada sekarang..

(20) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 4. 1.2 Rumusan Masalah - Bagaimana hasil unjuk kerja kecepatan sistem pemerolehan informasi yang dibangun menggunakan struktur data arraylist dan linkedlist dalam inverted index untuk pencarian judul buku perpustakaan Universitas Sanata Dharma menggunakan operator AND? 1.3 Tujuan Tujuan dari tugas akhir ini adalah: -. Mengetahui hasil unjuk kerja kecepatan sistem pemerolehan informasi yang dibangun menggunakan struktur data arraylist dan linkedlist dalam inverted index untuk pencarian judul buku perpustakaan Universitas Sanata Dharma menggunakan operator AND..

(21) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 5. 1.4 Batasan Masalah Batasan-batasan masalah yang dijadikan dalam penulisan tugas akhir adalah sebagai berikut : -. Pencarian berdasarkan judul buku dan kata kunci (query).. -. Judul buku disimpan dalam basis data yang sama.. -. Jumlah data yang disimpan sama.. -. Perbedaan terletak pada penerapan struktur data array list dan linkedlist.. 1.5 Sistematika Penulisan Untuk memudahkan penulisan tugas akhir, maka sistematika penulisan dibagi menjadi lima bagian yaitu: Bab I. Pendahuluan Bab ini berisi latar belakang, rumusan masalah, tujuan, batasan. masalah dan sistematika penulisan. Bab II. Tinjauan Pustaka Bab ini berisi mengenai landasan teori berupa konsep dasar. pemerolehan informasi, struktur data, algoritma dan pengertian TFIDF. Bab III. Metodologi Penelitian Bab ini berisi tentang metode penelitian yang akan digunakan..

(22) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 6. Bab IV. Perancangan dan Analisis Kebutuhan Sistem Bab ini berisi penelitian yang dilakukan disertai dengan. pembahasan yang didapat setelah melakukan penelitian. Bab V. Implementasi dan Analisa Hasil Bab ini berisi implementasi sistem yang telah dibuat beserta. analisis hasil yang diperoleh dari pengujian sistem. Bab VI. Kesimpulan dan Saran Bab ini berisi mengenai kesimpulan dan saran yang didapat. setelah menyelesaikan tugas akhir. DAFTAR PUSTAKA LAMPIRAN.

(23) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI. BAB II TINJAUAN PUSTAKA 2.1 Pemerolehan Informasi Pemerolehan informasi merupakan sistem untuk menemukan kembali informasi-informasi yang berguna dan relevan terhadap kebutuhan pengguna dari suatu kumpulan informasi secara otomatis. Mesin pencari atau search engine merupakan salah satu contoh penerapan pemerolehan informasi (Hasibuan & Andri, 2001). Ingwersen. (1992). mengartikan. bahwa. pemerolehan. informasi. merupakan proses yang terlibat dalam representation, storage, pencarian, dan mendapatkan informasi yang relevan untuk kebutuhan yang diperlukan pengguna. Tipe dari informasi tersebut bisa berupa dokumen, halaman web, katalog online, dan objek multimedia. Seiring dengan perkembangan teknologi, pemerolehan informasi sudah melibatkan pemodelan, pencarian web, visualisasi data, penyaringan dan bahasa dalam memperoleh informasi yang relevan (Baeza-Yates, 1999). Tahap-tahap pemerolehan informasi menurut Baeza-Yates (1999) disajikan dalam Gambar 2.1 berikut ini:. Gambar 2. 1 Proses Pemerolehan Informasi (Baeza-Yates, 1999). 7.

(24) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 8. Terdapat lima (5) langkah dalam proses pemerolehan informasi yang dijelaskan melalui Gambar 2.1. Tahap pertama yaitu text operation yakni menghilangkan kata umum (stop words removal), pencarian kata dasar (stemming), dan sebagainya. Sebagai contoh kata umum dalam bahasa Indonesia adalah dan, di, ini, itu, yang, dan lain-lain. Tahap kedua adalah query operations seperti penggunaan operator AND, OR, dan NOT pada query. Tahap ketiga yaitu pengindeksan yang bertujuan untuk mempercepat proses pencarian. Tahap keempat yaitu pencarian yang dilakukan pada inverted file yang sudah dibangun. Tahap kelima adalah pembobotan (ranking) terhadap dokumen yang diperoleh dari proses pencarian. 2.2 Logical View Pada Document Dokumen-dokumen pada koleksi tertentu sering digambarkan secara langsung melalui keyword (kata kunci). Kata kunci tersebut diekstraksi langsung dari teks pada dokumen atau dibuat secara manual oleh manusia. Kata kunci atau index term ini menyediakan logical view dari dokumen. Logical. view. dokumen. merupakan. gambaran. proses. dalam. membangun suatu rangkaian teks dalam dokumen. Untuk lebih jelas dalam memahami logical view pada dokumen dari bentuk full text menjadi indexing dapat dilihat pada Gambar 2.2 berikut ini:. Gambar 2. 2 Logical view.

(25) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 9. 2.2.1. Stopwords Merupakan kata umum yang biasanya muncul dalam jumlah. besar dan dianggap tidak memiliki makna. Stopwords perlu dieliminasi dengan tujuan mengurangi waktu eksekusi query. Cara mengeliminasi stopwords yaitu menghindari proses list yang panjang (BüttcherClarke-Cormark, 2010), sehingga pengolahan teks (text processing) akan. berhenti. ketika. mengeliminasinya.. menemukan. Tujuan. dari. stopwords. eliminasi. dan. stopwords. langsung adalah. mengurangi ukuran indeks, meningkatkan efisiensi dan keefektifan dari pemerolehan informasi (Croft-Metzler-Strohman, 2010). Beberapa kata yang termasuk dalam stopwords yaitu “the”, “a”, “an”, “that”, “those”. Sedangkan dalam bahasa Indonesia, contoh kata yang termasuk stopwords yaitu kata ganti orang (“dia”, “mereka”, “beliau”, “kami”), kata penghubung (“lalu”, “namun”, “padahal”) (Oktaviani, 2011).. 2.2.2. Stemming Stemming merupakan proses untuk menghilangkan prefik dan. sufik suatu kata bentukan menjadi kata dasar (Nazief & Adriani, 1996). Dalam pemerolehan informasi, stemming sangat diperlukan untuk meningkatkan performa pemerolehan informasi dengan cara mentranformasi kata-kata dalam sebuah dokumen teks menjadi kata dasar. Nazief & Adriani (1996) menggambarkan kata dasar Bahasa Indonesia terdiri dari kombinasi berikut: Prefiks 1+Prefiks 2+ kata dasar + Sufiks 3+Sufiks 2+Sufiks 1 ….(2.1).

(26) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 10. Algoritma stemming yang dibuat oleh Bobby Nazief dan Mirna Adriani adalah sebagai berikut: 1. Cari kata yang akan di-stem dalam kamus kata dasar. Bila ditemukan maka kata tersebut adalah kata dasar, maka algoritma berhenti. 2. Inflection Suffixes (“-lah”, “-kah”, “-ku”, “-mu”, atau “-nya”) dibuang. Jika berupa particles (“-lah”, “-kah”, “-tah” atau “-pun”) maka langkah ini diulangi lagi untuk menghapus possesive pronouns (“-ku”, “-mu”, atau “-nya”). 3. Hapus Derivation Suffix (“-i”, “-an”, atau “-kan”). Jika kata ditemukan dalam kamus maka algoritma berhenti, jika tidak maka diteruskan ke langkah 3a. a. Jika “-an” telah dihapus dan huruf terakhir adalah “-k” maka “k” juga dihapus. Jika ditemukan dalam kamus maka algoritma berhenti. Jika tidak ditemukan maka menuju langkah 3b. b. Akhiran yang dihapus (“-i”, “-an”, atau “-kan”) akan dikembalikan dan selanjutnya masuk langkah 4. 4. Hilangkan Derivation Prefix (“di-“, “ke-“, “se-”,“me-”, “be-”,“pe”, “te-”). Jika pada langkah 3 ada sufiks yang dihapus maka masuk langkah 4a, jika tidak, lanjut ke langkah 4b. a. Periksa tabel kombinasi awalan-akhiran yang tidak diijinkan. Jika ditemukan maka algoritma berhenti, jika tidak lanjut ke langkah 4b. b. For i = 1 to 3, tentukan tipe awalan kemudian hapus awalan. Jika kata dasar belum juga ditemukan lakukan langkah 5, jika sudah maka algoritma berhenti. Catatan: jika awalan kedua sama dengan awalan pertama maka algoritma berhenti. 5. Melakukan recording. Recording dilakukan dengan menambahkan karakter recording di awal kata yang dipenggal..

(27) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 11. 6. Jika langkah 1-5 sudah dilalui namun tidak membuahkan hasil, maka kata awal diasumsikan sebagai kata dasar. Terdapat juga beberapa aturan sebagai berikut: 1. Aturan reduplikasi a. Jika kedua kata yang dihubungkan oleh kata penghubung adalah kata yang sama maka kata dasarnya adalah bentuk tunggalnya. Contoh “mata-mata” maka kata dasarnya adalah “mata”. b. Misalkan ada kata “bolak-balik”, “berbalas-balasan” maka untuk mendapatkan kata dasarnya harus mengartikan kedua kata secara terpisah. Jika kedua kata memiliki kata dasar yang sama maka diubah menjadi bentuk tunggal. Contoh kata “berbalas-balasan” terdiri dari kata “berbalas” dan “balasan” yang memiliki kata dasar sama yaitu “balas”. Sedangkan pada kata “bolak-balik” memiliki kata dasar yang berbeda maka “bolak-balik” adalah kata dasar. 2. Tambahan bentuk awalan dan akhiran serta aturannya: a.. Setiap tipe awalan “mem-“, kata yang diawali dengan. awalan “memp-” memiliki tipe awalan “mem-”. b.. Tipe awalan “meng-“, kata yang diawali dengan awalan. “mengk-” memiliki tipe awalan “meng-”.. 2.3 Inverted Index Inverted index atau inverted file merupakan struktur data pokok yang terdapat dalam sistem pemerolehan informasi (Büttcher-Clarke-Cormark, 2010). Tujuan adanya inverted index adalah untuk mempercepat proses pencarian terms pada koleksi dokumen (Grossman-Frieder, 2004)..

(28) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 12. Inverted index memiliki dua komponen pokok yaitu dictionary dan posting lists. Dictionary menyimpan daftar kata, sedangkan posting list menyimpan identitas dokumen yang mengandung kata bersangkutan. Contoh melakukan pengindeksan terhadap dokumen-dokumen yang mengandung istilah tertentu dengan membuat inverted index yang terdiri dari dictionary dan postings digambarkan pada gambar 2.3 berikut:. Gambar 2. 3 Inverted index (Manning, 2008) Pada gambar 2.4 berikut merupakan gambaran secara keseluruhan dari proses membangun inverted index (Manning, 2008):.

(29) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 13. Gambar 2. 4 Membangun inverted index (Manning, 2008) Di sebelah kiri pada gambar 2.4, terdapat beberapa istilah yang disimpan dalam kolom term dan diurutkan sesuai abjad. Di sebelah kolom term terdapat kolom docID yang menunjukkan dokumen yang mengandung term tersebut. Sebelah kanan pada gambar 2.4 menjelaskan bahwa istilah yang terdapat pada kolom term dan docID dipisah ke dalam kolom term beserta doc. freq (document frequency) dan disimpan dalam dictionary. Dictionary berfungsi untuk menyimpan istilah-istilah dan mempunyai pointer untuk menuju ke posting list pada setiap istilah. Sedangkan posting list berfungsi untuk menyimpan list dari dokumen yang mengandung istilah tertentu (Manning, 2008). Misalkan mencari query AND dengan contoh “Brutus AND Calpurnia”, maka langkah-langkahnya adalah sebagai berikut: 1. Temukan lokasi Brutus dalam Dictionary..

(30) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 14. 2. Dapatkan posting list milik Brutus. 3. Temukan lokasi Calpurnia dalam Dictionary. 4. Dapatkan posting list milik Calpurnia. 5. Lakukan. interseksi. kedua. dokumen. yang. hanya. mengandung kedua posting list tersebut. Interseksi atau operasi pemotongan sangat penting untuk bisa mendapatkan. dokumen yang mengandung istilah dari kedua posting list. (Brutus dan Calpurnia) dengan cepat. Interseksi ini digambarkan dalam gambar 2.5 berikut:. Gambar 2. 5 Intersection posting list (Manning, 2008) Berikut ini merupakan algoritma untuk melakukan pemotongan kedua posting list pada gambar 2.5 (Manning, 2008): INTERSECT (p1,p2) 1. answer ← ( ) 2. while p1 ≠ NIL and p2 ≠ NIL 3. do if docID(p1) = docID(p2) 4. then ADD(answer, docID(p1)) 5. p1 ← next(p1) 6. p2 ← next(p2) 7. else if docID(p1) < docID(p2) 8. then p1 ← next(p1) 9. else p2 ← next(p2) 10. return answer.

(31) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 15. 2.4 Pembobotan TF-IDF Term Frequency (TF) dan Inverse Document Frequency (IDF) merupakan skema pembobotan yang populer pada pemerolehan informasi (Baeza-Yates, 1999). Metode TF-IDF merupakan metode untuk menghitung bobot setiap kata yang paling umum digunakan. Savoy (1993) merumuskan pembobotan TF-IDF sebagai berikut: Wij = ntfij * nidfj. …………(2.2). dimana dan. …………(2.3). Keterangan: - Wij adalah bobot istilah pada Tj pada dokumen Di. - tfij adalah frekuensi dari Tj dalam dokumen Di. - m adalah jumlah dokumen Di. - dfj adalah jumlah dokumen yang mengandung istilah Tj. - Max tfi merupakan frekuensi terbesar pada satu dokumen. Pada teknik ini, bobot istilah sudah dalam keadaan dinormalisasi. Penentuan bobot ditentukan dari jumlah frekuensi kemunculan istilah di satu dokumen dan frekuensi terbesar pada suatu istilah yang dimiliki dokumen bersangkutan. Jumlah dokumen pun diperhitungkan dalam teknik pembobotan TF-IDF untuk mengetahui posisi relatif bobot istilah yang bersangkutan pada suatu dokumen dibandingkan dengan dokumen-dokumen lain yang memiliki istilah yang sama. Oleh karena itu, jika sebuah istilah memiliki jumlah frekuensi kemunculan yang sama pada dua dokumen maka nilai bobotnya belum tentu sama (Hasibuan, 2001)..

(32) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 16. 2.5 Struktur Data Sebelum lebih lanjut berbicara tentang arraylist terlebih dahulu membahas mengenai array. Array merupakan sekelompok variable (disebut elemen atau komponen) yang memiliki nilai dan bertipe sama. Namun, array tidak mendukung untuk mengubah ukuran kapasitas secara otomatis (Deitel, 2012). Maka, untuk memberi solusi permasalahan pada array tersebut dikembangkan struktur data yaitu ArrayList. ArrayList merupakan implementasi dari sebuah array dalam suatu list. ArrayList memiliki sifat fleksibel dan dapat ditingkatkan kapasitas penyimpanannya secara otomatis. ArrayList memungkinkan untuk mengakses elemen-elemennya secara acak dalam waktu yang bersamaan.. Gambar 2. 6 Array Linked list adalah suatu bentuk struktur data, berisi kumpulan data (node) yang terhubung secara sekuensial, saling sambung menyambung, dinamis, dan terbatas. Ukuran linked list menjadi dinamis karena menyesuaikan jumlah node yang dimasukkan kedalam rantai node (Robert, 2003). Linked list pertama kali dikembangkan oleh Allen Newell, Cliff Shaw dan Herbert Simon di RAND Corporation pada tahun 1955-1956 sebagai struktur data utama untuk bahasa Information Processing Language (IPL). Dalam linked list, setiap data terhubung dalam sebuah link. Setiap link objek mengandung referensi (biasa disebut next) pada setiap link selanjutnya. Gambar 2.7 menggambarkan pengertian dari linked list (Robert, 2003):.

(33) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 17. Gambar 2. 7 Linked list (Robert, 2003) Data yang satu terhubung pada link yang lain sehingga membentuk seperti suatu rantai. 2.5 Precision dan Recall Dalam pemerolehan informasi, keakurasian perlu diukur dan dianalisis. Untuk menganalisis keakurasian diperlukan precision dan recall. Recall adalah istilah yang digunakan untuk dokumen terpanggil yang relevan dengan query yang dimasukkan pengguna dalam pemerolehan informasi. Precision adalah jumlah dokumen relevan dari total jumlah dokumen yang ditemukan oleh sistem. Precision dan recall dirumuskan sebagai berikut (Manning, 2008): Precision=. Recall =. Interpolasi =. ……....(2.4). .……(2.5). …………..(2.6).

(34) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI. BAB III METODOLOGI PENELITIAN 3.1 Gambaran Umum Penelitian Penelitian ini dilakukan untuk membandingkan kecepatan struktur data arraylist dan linked list. Objek yang menjadi penelitian adalah judul buku koleksi perpustakaan Universitas Sanata Dharma. Diharapkan penelitian ini bermanfaat bagi pihak perpustakaan maupun pihak mahasiswa yang akan mencari buku-buku yang dikoleksi oleh perpustakaan Universitas Sanata Dharma.. 3.2 Sumber Data Sumber data berasal perpustakaan Universitas Sanata Dharma. Data yang diambil berupa judul buku yang merupakan koleksi dari perpustakaan Universitas Sanata Dharma. Teknik pengumpulan data dilakukan dengan survey di perpustakaan Universitas Sanata Dharma dan melakukan wawancara dengan berbagai pihak pengelola perpustakaan.. 3.3 Spesifikasi Alat Sistem dibuat dengan minimal spesifikasi software dan hardware sebagai berikut: a. Spesifikasi hardware: -. Processor Intel Core i-5 4200U CPU @ 1.60 GHz 2.30 GHz. -. RAM 4 GB. -. Hard Disk Drive 500 GB. 18.

(35) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 19. b. Spesifikasi software: -. Windows 10 Pro 64 bit Operating System. -. Compiler IDE NetBeans 8.0. -. Oracle Database. 3.4 Perbandingan Struktur Data Struktur data yang akan dibandingkan oleh peneliti adalah struktur data inverted index dengan menggunakan arraylist dan linked list. Struktur data inverted index akan dijelaskan lebih lanjut pada bab 4. Adapun gambar mengenai arraylist dan linkedlist ditampilkan pada gambar 2.8 dan 2.9 berikut ini:. Gambar 3. 1 Linked List Dibandingkan dengan:. Gambar 3. 2 Array List.

(36) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 20. 3.5 Tahap-Tahap Penelitian 3.5.1 Studi Kasus Kasus yang akan dipelajari adalah kebiasaan pengunjung perpustakaan dalam memasukkan kata kunci pada saat melakukan pencarian buku di perpustakaan Universitas Sanata Dharma.. 3.5.2. Studi Pustaka Studi pustaka yang dilakukan adalah mencari dan memahami. informasi-informasi beserta teori yang berkaitan dengan materi pemerolehan informasi maupun struktur data. Dalam penelitian ini, penulis mempelajari literatur yang berkaitan dengan struktur data arraylist dan linked list yang keduanya sama-sama dapat digunakan untuk membuat inverted index. Literature yang dipelajari akan membantu peneliti untuk membangun sistem pencarian judul buku perpustakaan Universitas Sanata Dharma.. 3.5.3. Pengembangan Perangkat Lunak 3.5.3.1 Metode Pengembangan Perangkat Lunak Metode. yang. digunakan. peneliti. dalam. mengembangkan perangkat lunak adalah waterfall. Pressman & Roger (2001) menuturkan bahwa metode waterfall merupakan metode pengembangan perangkat lunak yang dilakukan secara berurutan, dan kemajuan dipantau secara terus menerus mengalir ke bawah. Fase-fase yang dilalui dalam pengembangan perangkat lunak metode waterfall yaitu perencanaan, pemodelan, implementasi, dan pengujian. Gambar 3.5.3 menggambarkan alur proses dari metode waterfall dan disajikan seperti berikut ini:.

(37) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 21. Gambar 3. 3 Metode waterfall (Pressman & Roger(2001)) Ada lima tahap yang digunakan dalam metode waterfall yaitu: a. Analisa Langkah ini merupakan analisa terhadap kebutuhan sistem. Pengumpulan data dalam tahap ini bisa melalui wawancara, studi literatur, dan studi kasus. Wawancara yang dilakukan adalah. mewawancarai. pengunjung. perpustakaan.. Wawancara digunakan untuk mencari informasi sebanyak mungkin dari pengguna sehingga sistem pencarian yang dibuat sesuai dengan kebutuhan pengguna.. b. Design Proses design adalah proses mengubah hasil analisa menjadi representasi kebutuhan perangkat lunak yang dapat diprediksi bentuk dan fungsinya sebelum diubah ke dalam bahasa pemrograman. Titik fokus pada proses ini terletak pada struktur data, arsitektur perangkat lunak, tampilan user interface, dan algoritma..

(38) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 22. c. Implementasi (Coding) Coding merupakan proses penerjemahan dari desain ke dalam bahasa pemrograman. Dalam tahap ini, programmer akan membangun sistem yang dibutuhkan oleh pengguna.. d. Testing (Pengujian) Testing merupakan tahap yang dilalui setelah pengkodean selesai. Tujuan dari pengujian adalah menguji kemampuan dan performa dari sistem yang telah dibangun. Selain itu, pengujian juga bermanfaat untuk menemukan kesalahan maupun error yang kemungkinan masih dapat ditemukan dan selanjutnya dilakukan perbaikan.. e. Pemeliharaan Merupakan tahap akhir dari metode waterfall. Sistem yang sudah selesai dibangun dan melewati beberapa tahap kemudian. dijalankan. Pemeliharaan. yang. dan. dilakukan. dimaksud. adalah. pemeliharaan. meningkatkan. performa dan perbaikan fitur-fitur yang mungkin masih bisa terjadi error.. f. Analisis Hasil Hasil pencarian judul buku yang ditemukan dari sistem pemerolehan. informasi. dengan. sistem. pencarian. perpustakaan minimal sama. Selanjutnya adalah menguji unjuk kerja struktur data inverted index yang dibangun menggunakan arraylist dan linkedlist..

(39) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI. BAB IV ANALISA DAN PERANCANGAN SISTEM 4.1 Analisa Sistem 4.1.1. Analisis Kerja ArrayList dan Linkedlist. Cara Kerja Linked List Linked list merupakan struktur data yang memungkinkan untuk menyimpan. obyek.. Obyek. yang. dimaksud. adalah. obyek. yang. mengimplementasikan antarmuka dari list tersebut. Obyek tersebut disimpan dalam bentuk elemen-elemen. Elemen-elemen tersebut saling terhubung dalam suatu reference yang disebut dengan link. Gambar 4.1 berikut memudahkan dalam pemahaman mengenai linked list.. Gambar 4. 1 LinkedList Linked list mendukung berbagai metode berbasis indeks seperti get dan indexOf. Indeks selalu dimulai dari angka nol (0) sehingga bila terdapat tiga elemen, maka elemen pertama terletak pada indeks nol (0), elemen kedua pada indeks pertama (1) dan begitu seterusnya (Collins, 2001).. Cara Kerja ArrayList ArrayList dapat dikatakan sebagai perbaikan dari satu dimensi array. Seperti array, kelas ArrayList mendukung akses semua elemennya secara acak. Artinya, semua elemen dapat diakses dalam waktu yang sangat singkat dan setiap elemen mempunyai indeks. Tidak seperti array, ukuran obyek dalam ArrayList secara otomatis dipertahankan selama eksekusi program. Ukuran default arraylist adalah 10 (sepuluh) dan ketika penuh maka akan mengalamai penggembungan ukuran dengan cara kapasitas yang lama. 23.

(40) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI. ditambah nilai kapasitas lama + 1. Jika data penuh, maka elemen lama dikopikan ke kapasitas baru ditambah dengan data baru.. Gambar 6. 1 ArrayList 4.1.2. Gambaran Sistem. Sistem Pemerolehan Informasi Judul Buku Perpustakaan Universitas Sanata Dharma dikembangkan untuk membantu mahasiswa dalam mencari judul buku yang dibutuhkan. Namun, sistem pemerolehan informasi yang akan dikembangkan adalah sistem yang membandingkan kecepatan dalam pencarian judul buku perpustakaan. Tujuannya adalah mencari metode pencarian yang efekif, cepat dan mampu mengembangkan pencarian dalam website perpustakaan Universitas Sanata Dharma. Arsitektur perancangan sistem pemerolehan informasi ditunjukkan dalam gambar berikut ini:. 24.

(41) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 24. Gambar 4. 2 Struktur Pemerolehan Informasi (Nazief & Andriani, 1996) Berdasarkan struktur tersebut, sistem melakukan text operation pada koleksi judul buku, berupa pembuangan kata dan stemming. Langkah selanjutnya sistem melalukan indexing kata dan dokumen pada RDBMS. Sistem mengambil index dari RDBMS ke random access memory secara periodik di dalam inverted index serta melakukan pembobotan. Proses pencarian melibatkan user yang memasukkan pencarian menggunakan query yang selanjutnya masuk pada tahap text processing. Sistem melakukan pencarian pada inverted index dengan operasi AND kemudian melakukan ranking berdasarkan bobot dokumen. Hasil dokumen yang sudah memiliki peringkat ditampilkan melalui user interface..

(42) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 25. 4.2 Analisis Kebutuhan Pengguna 4.2.1 Use Case Diagram Sistem ini diperuntukkan kepada pengguna (user) sehingga use case diagram digambarkan sebagai berikut:. Gambar 4. 3 Use Case Diagram Sistem pemerolehan informasi judul buku perpustakaan diakses oleh satu aktor yaitu pengguna. Gambar use case diagram diatas dijelaskan dengan tabel berikut ini: Tabel 4. 1 Keterangan Use Case Diagram Aktor Keterangan Pengguna. 1. Dapat melakukan searching judul buku perpustakaan.. 4.2.2. Skenario Use Case a. Mencari Judul Buku Perpustakaan Tabel 4. 2 Mencari Judul Buku Perpustakaan. Nama Use Case. Mencari judul buku perpustakaan. ID Use Case. 1. Prioritas. Tinggi. Aktor. Pengguna. Deskripsi. Use case ini merupakan proses untuk pencarian judul buku perpustakaan. Pra kondisi. Aktor berada di halaman utama.

(43) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 26. Pemicu. Aktor akan melakukan pencarian judul buku perpustakaan.. Langkah utama. Aksi Aktor. Reaksi Sistem. Langkah 1: Aktor memasukkan kata kunci dan menekan tombol cari.. Langkah 2: Sistem akan mengecek kata kunci yang dimasukkan Langkah 3: Sistem akan menampilkan hasil pencarian. Langkah. Jika kata kunci yang dimasukkan tidak ada,. alternatif. maka sistem akan memberi tahu aktor bahwa kata kunci yang dicari tidak ditemukan.. Kesimpulan. Use case ini digunakan untuk pencarian judul buku perpustakaan dan akan berhenti bila aktor menemukan judul buku yang dicari. Pasca kondisi. Aktor menemukan judul buku yang dicari. Aktor tidak berhasil menemukan judul buku yang dicari karena kata kunci yang dimasukkan tidak ditemukan..

(44) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 27. 4.3 Perancangan Sistem 4.3.1 Desain Logikal 4.3.1.1 Diagram Aktifitas 4.3.1.1.1. Mencari Judul Buku.

(45) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 28. 4.3.1. Desain Model Kelas Analisis Berikut ini merupakan desain model kelas analisis untuk sistem pemerolehan informasi judul buku:. Gambar 4. 4 Desain Kelas Analisis 4.3.2. Diagram Sequence. 4.3.2.1 Mencari Judul Buku Berikut ini merupakan diagram sequence alur pencarian judul buku yang dilakukan oleh pengguna:.

(46) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 29. Gambar 4. 5 Diagram Sequence. 4.3.3. Perancangan Database. 4.3.3.1 Desain Konseptual Desain konseptual database disajikan dalam bentuk ERD yang ditunjukkan pada gambar 4.6 berikut ini:.

(47) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 30. Gambar 4. 6 Entity Relationship Diagram 4.3.3.2 Desain Logical Hubungan relasi antar tabel pada database perpustakaan ditunjukkan pada gambar 4.6 berikut ini:.

(48) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI. Gambar 4. 7 Logical design. 32.

(49) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 33. 4.4 Rancangan Struktur Data Inverted Index Inverted index merupakan indeks yang terbentuk dari proses pengindeksan. Pengindeksan (indexing) merupakan cara untuk memudahkan proses pencarian dengan tujuan meningkatkan efisiensi pencarian. Dengan melakukan pengindeksan pada dokumen yang akan dicari, maka pencarian dokumen dengan query tertentu tidak perlu dilakukan secara sekuensial atau diperiksa satu persatu. Inverted index memotong tiap kata (term) yang berbeda dari suatu daftar dokumen. Struktur data inverted index merupakan pasangan term dan posting list di dalam sebuah dokumen (t{d1,d2,3}). Istilah t merujuk pada term sedangkan d1-d3 merujuk pada dokumen. Sebagai contoh, misalkan jika t1 terdapat pada dokumen d1, d2, d5 sedangkan t2 terdapat pada dokumen d2, d5 maka inverted index yang dihasilkan adalah sebagai berikut: t1 d1, d2, d5 t2  d2, d5 Rancangan struktur data untuk inverted index akan dijelaskan pada diagram berikut ini:. Gambar 4. 8 Representasi Inverted Index.

(50) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 34. 4.5 Algoritma pencarian dengan operator AND Sistem pemerolehan informasi yang dibangun menggunakan operator AND. Operator AND merupakan fungsi yang digunakan untuk menguji beberapa nilai atau kondisis sekaligus untuk menghasilkan nilai true or false. Operator AND memiliki ketentuan yaitu bernilai true jika semua kondisi argument terpenuhi dan bernilai false jika salah satu argument tidak terpenuhi. Algoritma AND dijelaskan berikut ini: 1. answer ← ( ) 2. while p1 ≠ NIL and p2 ≠ NIL 3. do if docID(p1) = docID(p2) 4. then ADD(answer, docID(p1)) 5. p1 ← next(p1) 6. p2 ← next(p2) 7. else if docID(p1) < docID(p2) 8. then p1 ← next(p1) 9. else p2 ← next(p2) 10. return answer 4.6 Rancangan Basis Data Basis data yang digunakan yaitu Oracle 11g dengan tools yaitu aplikasi SQL Developer. Database ini digunakan untuk menyimpan teks judul-judul buku yang merupakan koleksi Perpustakaan Universitas Sanata Dharma. Berikut ini merupakan rancangan tabel-tabel untuk membangun sistem pemerolehan informasi judul buku perpustakaan: 1. Tabel buku_perpus Nama Field. Tabel 4. 1 Tabel buku_perpus Tipe Data Ukuran Keterangan. ID_Buku. bigint. Merupakan id buku perpustakaan.

(51) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 35. ISBN. varchar. 300. Nomor ISBN Buku. Judul_Buku. Varchar. 500. Judul dari buku. Klasifikasi. Varchar. 300. Klasifikasi dari buku. Tahun. Integer. 11. Tahun dari sebuah buku. Id_status_ready Integer. Status untuk buku. Id_status2. Status untuk pencarian. Integer. 2. Tabel terms Nama Field. Tabel 4. 2 Table Terms Tipe Data Ukuran Keterangan. Id_term. Integer. terms. varchar. ID untuk term 50. Term dari sebuah judul buku. Stemmed_word varchar. 50. Term yang sudah di stemming. Is_root_word. char. 1. Untuk mengecek sebuah kata termasuk kata dasar atau bukan. 3. Tabel sourceterm Nama Field. Tabel 4. 3 Tabel Sourceterm Tipe Data Ukuran Keterangan. Id_sourceterm. Integer. Merupakan primary key untuk tabel sourceterm. Id_term. Integer. Merupakan foreign key untuk tabel terms. Word. varchar. 50. Kata tanpa proses stemming.

(52) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 36. Is_root_word. char. 1. Keterangan yang menunjukkan bila kata terdapat dalam kamus. 1 untuk benar, dan 0 untuk salah. 4. Tabel posting Nama Field. Tabel 4. 4 Tabel Posting Tipe data Ukuran Keterangan. ID_Buku. Bigint. 10. Merupakan foreign key dari tabel buku_perpus. Id_term. Integer. -. Merupakan foreign key dari tabel terms. frequency. Integer. -. Merupakan frequency dari sebuah kata. Ntfik. Integer. -. Merupakan hasil perhitungan frequency. w. integer. -. Bobot dari sebuah term. 5. Tabel posting_stopword Nama Field. Tabel 4. 5 Tabel posting_stopword Tipe Data Ukuran Keterangan. ID_Buku. Integer. -. Merupakan foreign key dari tabel buku_perpus. Id_stopword. Integer. -. Merupakan foreign key dari tabel stopword. Frequency. integer. -. Merupakan frequency stopword pada buku..

(53) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 37. 6. Tabel stopwords Nama Field. Tabel 4. 6 Tabel stopwords Tipe data Ukuran Keterangan. Id_stopword. integer. -. Merupakan primary key pada tabel stopwords. stopword. varchar. 50. Merupakan daftar kata yang merupakan stopword. 4.7 Rancangan Desain Antarmuka Antar muka sistem pemerolehan informasi terdiri dari satu tampilan yakni halaman pencarian. Pada halaman pencarian, pengguna diminta untuk memasukkan keyword yang akan dicari, kemudian bisa menekan Enter atau mengklik tombol Search. Tampilan dari halaman pencarian digambarkan dalam ilustrasi berikut ini:. Gambar 4. 9 Halaman awal. Sedangkan hasil pencarian masih merujuk pada halaman utama, namun hasil dari pencarian akan ditampilkan di bawah tombol Search sebagaimana ditampilkan berikut ini:.

(54) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 38. Gambar 4. 10 Halaman hasil.

(55) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI. BAB V IMPLEMENTASI DAN ANALISIS HASIL 5.1 Spesifikasi Software dan Hardware 5.1.1. Spesifikasi Software (Perangkat Lunak) Sistem yang dibangun menggunakan perangkat lunak yang. mendukung untuk implementasi pemrosesan teks dan pencarian judul buku yaitu: a. Sistem Operasi : Windows 10 Pro b. SQL Developer c. NetBeans IDE 8.0 d. Browser: Mozilla Firefox 5.1.2. Spesifikasi Hardware (Perangkat Keras) Perangkat keras yang diperlukan untuk membuat sistem pencarian. judul buku koleksi perpustakaan Universitas Sanata Dharma yaitu: a. Memory RAM: 4GB DDR3 b. Processor Intel i5 4200U c. Harddisk: 500GB. 39.

(56) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 40. 5.2. Implementasi Antar Muka (Interface) 5.2.1 Implementasi Halaman Awal. Gambar 5. 1 Tampilan Awal. 5.2.2. Implementasi Halaman Hasil Pencarian. Gambar 5. 2 Halaman Hasil Pencarian.

(57) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 41. 5.3 Implementasi Stemming Stemming digunakan untuk menghilangkan prefix dan suffix suatu kata bentukan. menjadi. kata. dasar.. Stemming. sangat. diperlukan. untuk. meningkatkan performa pemerolehan informasi dengan cara mentransformasi kata-kata dalam sebuah dokumen teks menjadi kata dasar. Proses stemming didukung dengan daftar kata-kata dasar yang diperoleh dari Kamus Besar Bahasa Indonesia. Implementasi stemming diambil dari kelas Stemming yang dibuat oleh Reza Darojad (2008) menggunakan algoritma Nazief dan Andriani. 5.4 Implementasi inverted index Inverted index digunakan untuk menambahkan data posting yang baru dari indeks posisi 0 dan menemukan posisi indeks yang tepat berdasarkan nomor id_document data posting baru dibandingkan dengan id dokumen yang sudah ada. Berikut ini merupakan listing program untuk inverted index yang berfungsi untuk menambahkan kata dalam posting:. Gambar 5. 3 Inverted index.

(58) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 42. 5.5 Pengujian dan Analisa Hasil 5.5.1. Hasil Pengujian Data judul buku perpustakaan yang digunakan sebanyak 135425 buah. judul. Data tersebut diambil sampel sebanyak 538 judul buku dengan memastikan jumlah judul buku yang diambil sama dengan hasil pencarian pada website perpustakaan. Data-data tersebut diperoleh dari pihak Perpustakaan Universitas Sanata Dharma. Kamus kata yang digunakan diambil dari Kamus Besar Bahasa Indonesia sebanyak 28526 kata dasar yang digunakan untuk proses stemming. Jumlah stopword yang dipakai sebanyak 399 kata dan menghasilkan term sebanyak 60531. Salah satu tujuan dari pengujian ini adalah membandingkan unjuk kerja struktur data inverted index yang dibuat menggunakan arraylist dan linkedlist. Cara pengujian adalah memasukkan keyword pada sistem pemerolehan informasi yang dibangun. Cara melakukan pengujian yaitu dengan mencari responden sebanyak 10 orang. Masing-masing orang memasukkan kata kunci judul buku perpustakaan yang akan dicari. 5.6 Perbandingan Relevansi Hasil Pencarian Judul Buku Perbandingan relevansi yang dimaksud adalah membandingkan antara sistem pemerolehan informasi yang dibuat dengan website dari Perpustakaan Universitas Sanata Dharma. Adapun cara membandingkan adalah dengan memasukkan kata kunci yang sama kemudian dihitung recall and precision untuk menentukan relevansi judul buku yang dicari. Berikut ini adalah hasil perbandingan. antara. sistem. pemerolehan. perpustakaan Universitas Sanata Dharma.. informasi. dengan. website.

(59) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 43. 5.6.1 Kata Kunci “struktur data” 5.6.1.1 Pencarian pada Sistem Pencarian Perpustakaan Responden mencoba untuk mencari judul buku yang berkaitan dengan kata kunci “struktur data”. Hasilnya, sistem menemukan 17 judul buku yang relevan dalam bahasa Indonesia. Maka perhitungan recall (persamaan (2.4)) dan precision (persamaan (2.5)) adalah sebagai berikut Recall = = Precision. =1 = =. =1. Tabel 5. 1 recall and precision Relevan Recall Precision R 0.0588 1 R 0.1176 1 R 0.1765 1 R 0.2353 1 R 0.2941 1 R 0.3529 1 R 0.4118 1 R 0.4706 1 R 0.5294 1 R 0.5882 1 R 0.6471 1 R 0.7059 1 R 0.7647 1 R 0.8235 1 R 0.8824 1 R 0.9412 1 R 1.0000 1.

(60) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 44. Percision menjadi bernilai 1 semua dikarenakan tidak menyertakan judul buku dalam bahasa Inggris dari kata kunci “struktur data”. Maka perhitungan precision dalam 11 titik recall menjadi seperti berikut: Tabel 5. 2 precision dalam 11 titik recall Recall precision 0% 1 10% 1 20% 1 30% 1 40% 1 50% 1 60% 1 70% 1 80% 1 90% 1 100% 1 Rata-rata 1. Dan bila digambarkan dalam bentuk grafik adalah seperti berikut:. Interpolation 1 0.9 0.8 0.7 0.6 0.5. Interpolation. 0.4 0.3 0.2 0.1 0 0% 10% 20% 30% 40% 50% 60% 70% 80% 90%100%. Gambar 5. 3 Grafik precision dalam 11 titik recall.

(61) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 45. 5.6.1.2 Pencarian pada Sistem Pemerolehan Informasi dengan Arraylist Responden mencoba untuk mencari buku dengan kata kunci pencarian “struktur data”. Hasilnya sistem menemukan 17 buku yang relevan dengan kata kunci pencarian. Maka perhitungan recall and precision adalah sebagai berikut: Tabel 5. 3 recall and precision Relevan Recall Precision R 0.0588 1 R 0.1176 1 R 0.1765 1 R 0.2353 1 R 0.2941 1 R 0.3529 1 R 0.4118 1 R 0.4706 1 R 0.5294 1 R 0.5882 1 R 0.6471 1 R 0.7059 1 R 0.7647 1 R 0.8235 1 R 0.8824 1 R 0.9412 1 R 1.0000 1. Maka perhitungan precision dalam 11 titik recall menjadi seperti berikut: Tabel 5. 4 precision dalam 11 titik recall Recall Precision 0% 1 10% 1 20% 1 30% 1 40% 1 50% 1 60% 1 70% 1.

(62) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 46. 80% 90% 100% Rata-rata. 1 1 1 1. Berdasarkan tabel nilai precision dalam 11 titik recall tersebut, jika digambarkan dalam grafik menjadi seperti berikut:. Interpolation 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0. Interpolation. 0% 10%20%30%40%50%60%70%80%90%100%. Gambar 5. 4 Grafik precision dalam 11 titik recall. 5.6.1.3 Pencarian pada Sistem Pemerolehan Informasi dengan Linkedlist Dengan menggunakan kata kunci yang sama yakni “struktur data” hasilnya adalah website perpustakaan Universitas Sanata Dharma menemukan 16 buku yang relevan dengan kata kunci pencarian. Maka perhitungan recall and precision adalah sebagai berikut: Tabel 5. 5 recall and precision Relevan Recall Precision R 0.0625 1 R 0.1250 1 R 0.1875 1 R 0.2500 1 R 0.3125 1 R 0.3750 1 R 0.4375 1.

(63) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 47. R R R R R R R R R. 0.5000 0.5625 0.6250 0.6875 0.7500 0.8125 0.8750 0.9375 1.0000. 1 1 1 1 1 1 1 1 1. Maka perhitungan precision dalam 11 titik recall adalah seperti berikut: Tabel 5. 6 precision dalam 11 titik recall. recall 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% Rata-rata. precision 1 1 1 1 1 1 1 1 1 1 1 1.

(64) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 48. Maka bila digambarkan dengan bentuk grafik adalah seperti berikut ini:. Interpolation 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0. Interpolation. 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%. Gambar 5. 5 Grafik precision dalam 11 titik recall. 5.7 Perbandingan Rata-Rata Precision Sistem Pemerolehan Informasi dengan Sistem Pencarian Perpustakaan Sanata Dharma Berdasarkan perhitungan recall and precision untuk perbandingan hasil pencarian antara sistem pencarian yang dimiliki dengan sistem pemerolehan informasi yang dibangun, maka dapat disimpulkan perbandingan rata-rata precision sebagai berikut: Tabel 5. 7 Perbandingan rata-rata precision. Recall 0% 10% 20% 30% 40% 50% 60% 70%. Rata-rata precision sistem pencarian perpustakaan. rata-rata precision sistem pemerolehan informasi menggunakan arraylist. rata-rata precision sistem pemerolehan informasi menggunakan linkedlis. 1 1 1 1 1 1 1 1. 1 1 1 1 1 1 1 1. 1 1 1 1 1 1 1 1.

(65) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 49. 80% 90% 100%. 1 1 1. 1 1 1. 1 1 1. Berdasarkan tabel tersebut maka dapat disajikan dalam bentuk grafik sebagai berikut: 1.2. 1 Rata-rata precision sistem pencarian perpustakaan. 0.8. rata-rata precision sistem pemerolehan informasi menggunakan arraylist. 0.6. rata-rata precision sistem pemerolehan informasi menggunakan linkedlist. 0.4. 0.2. 0 0%. 20%. 40%. 60%. 80%. 100%. 120%. Gambar 5. 6 Grafik relevansi sistem pencarian dan pemerolehan informasi. Berdasarkan grafik tersebut, sistem pemerolehan informasi judul buku perpustakaan berhasil dikembangkan dibuktikan dengan hasil yang sama dengan sistem pencarian yang dimiliki oleh perpustakaan Sanata Dharma. Dalam proses evaluasi dan pengujian lebih lanjut, penulis menemukan bahwa sistem pemerolehan informasi lebih baik dibandingkan sistem pencarian yang dimiliki oleh perpustakaan Sanata Dharma. Evaluasi dilakukan dengan melakukan pengujian terhadap sistem pencarian dengan kondisi kata kunci yang berbeda yaitu terbalik dan tidak urut (hasil perhitungan akurasi dapat dilihat pada Lampiran III)..

(66) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 50. 5.8 Perbandingan Kecepatan Struktur Data Linked List dan Array List Perbandingan kecepatan yang diteliti adalah kecepatan pencarian antara struktur data linked list dengan array list. Cara menguji kecepatan tersebut dengan cara memasukkan kata kunci pencarian, kemudian melihat hasil waktu pencarian yang ditempuh oleh sistem. Pengujian dilakukan sebanyak 400 kali untuk memperoleh hasil yang stabil. Tabel pengujian ditampilkan pada tabel 5.8 dibawah ini: Tabel 5. 8 Perbedaan waktu pencarian ArrayList dan Linkedlist. Jumlah kata (dalam 100 kali ujicoba dengan keyword yang berbeda). Total waktu pencarian. Rata-rata waktu pencarian. Arraylist Linkedlist. Arraylist. Linkedlist. (dalam detik). (dalam detik). (dalam detik). (dalam detik). Satu kata. 0.674. 1.254. 0.007. 0.013. 0.006. Dua kata. 3.842. 5.956. 0.038. 0.060. 0.022. Tiga kata. 9.507. 14.213. 0.095. 0.142. 0.047. Empat kata. 174.708. 234.42. 1.747. 2.344. 0.597. Selisih waktu rata-rata.

(67) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 51. Sistem pemerolehan informasi yang dibuat dengan arraylist lebih cepat dalam melakukan pencarian dibandingkan dengan linkedlist dibuktikan dengan selisih ratarata waktu pencarian. Pengujian satu kata kunci membutuhkan waktu kecepatan ratarata 0.006 miliseconds (ms), dua kata kunci dalam waktu 0.022 ms, tiga kata kuncidalam waktu 0.047 ms, dan empat kata kunci dalam waktu 0.597 ms lebih cepat arraylist daripada linkedlist. Perhitungan tersebut berdasarkan ketelitian sistem yang mencapai tiga angka nol dibelakang koma. Ketelitian sistem mencapai tiga angka nol dibelakang koma dikarenakan method timer yang digunakan pada java menggunakan parameter period dalam satuan miliseconds untuk menjaga agar frekuensi tetap akurat dalam jangka pendek ketika program masih berjalan. Berdasarkan tabel 5.8 tersebut, dapat dilihat bahwa struktur data arraylist lebih cepat dibandingkan dengan linkedlist. Hal ini dikarenakan arraylist berkaitan dengan alamat memory. Alamat memori atau memory address register merupakan register yang mencatat alamat memory yang akan diakses (baik yang akan ditulis maupun yang akan dibaca) (Hariyanto, 2009). Dengan kata lain, data yang akan diambil dimasukkan ke dalam memory address kemudian mengirimkan alamat tersebut ke dalam RAM. Sedangkan linkedlist harus mencari satu persatu data yang dicari karena bentuk dari linkedlist yang seperti rantai. Pada saat build index dengan lima kali percobaab, struktur data inverted index yang dibangun menggunakan arraylist memerlukan waktu rata-rata 0.013 miliseconds (ms) sedangkan struktur data inverted index yang dibangun menggunakan linkedlist memerlukan waktu rata-rata 0.02 ms..

(68) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI. BAB VI KESIMPULAN DAN SARAN 6.1 Kesimpulan Kesimpulan yang didapat dari perbandingan antara sistem pencarian judul buku yang dimiliki oleh Perpustakaan Universitas Sanata Dharma dengan sistem pemerolehan informasi yang dibangun menggunakan struktur data LinkedList dan ArrayList dalam inverted index adalah sebagai berikut: 1. Sistem pemerolehan informasi perpustakaan yang dibangun menggunakan struktur data arraylist dan linkedlist dalam inverted index telah berhasil dikembangkan dibuktikan mampu mencari judul buku dengan hasil yang minimal sama dengan sistem pencarian perpustakaan. 2. Sistem pemerolehan informasi yang dibuat dengan arraylist lebih cepat dalam melakukan pencarian dibandingkan dengan linkedlist dibuktikan dengan selisih rata-rata waktu pencarian. Pengujian satu kata kunci mempunyai selisih waktu kecepatan rata-rata 0.006 miliseconds (ms), dua kata kunci dalam waktu 0.022 ms, tiga kata kunci dalam waktu 0.047 ms, dan empat kata kunci dalam waktu 0.597 ms lebih cepat arraylist daripada linkedlist. 3. Pembentukan struktur data inverted index yang menggunakan arraylist membutuhkan waktu rata-rata 0.013 miliseconds (ms) lebih cepat dibandingkan linkedlist yang membutuhkan waktu ratarata 0.015 ms.. 52.

(69) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 53. 6.2 Saran Saran yang mendukung pengembangan dari sistem pemerolehan informasi judul buku perpustakaan yaitu:.  Hasil evaluasi dan pengujian sistem pemerolehan informasi dibandingkan sistem pencarian perpustakaan Universitas Sanata Dharma memiliki beberapa kelebihan sebagai berikut:. a. Sistem pemerolehan informasi ini mampu mencari judul dengan kata kunci pencarian yang dibalik, sedangkan sistem pencarian milik Perpustakaan Universitas Sanata Dharma tidak dapat melakukan pencarian judul buku. b. Sistem pemerolehan informasi ini mampu mencari judul buku dengan kata kunci pencarian yang tidak urut, sedangkan. sistem. pencarian. milik. Perpustakaan. Universitas Sanata Dharma tidak dapat melakukan pencarian judul buku. Untuk lebih detail dapat dilihat pada Lampiran III.

(70) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 54. DAFTAR PUSTAKA Adriani, M., Asian, J., Nazief, B., Tahaghoghi, S.M.M. & Williams, H.E. 2007. Stemming Indonesian : A Confix-Stripping Approach. Transaction on Asian Langeage Information Processing. Vol. 6, No. 4, Articel 13. Association for Computing Machinery : New York . Agusta, Ledy. (2009). Perbandingan Algoritma Stemming Porter dengan Algoritma Nazief & Adriani untuk Stemming Dokumen Teks Bahasa Indonesia. Jurnal Konferensi Nasional Sistem dan Informatika 2009, Bali.. Baeza-Yates, R., Riberio-Neto, B. (1999). Modern Information Retrieval the Concepts and Technology Behind Search. England: A division of the association for Computing Machinary Büttcher, Stefan., Clarke, L.A Charles., Cormack, V. Gordon. (2010). Information Retrieval Implementing and Evaluating Search Engines. USA: Massachusetts Institute of Technology. Darojad, Reza Mohammad. (2013). Sistem Temu Balik Informasi Dokumen Makalah. Ilmiah Berbahasa Indonesia Menggunakan Struktur Data. Inverted Index Berbasis Hash Table dan Linked List. Universitas Sanata Dharma: Yogyakarta. Hariyanto, Bambang. (2009). Sistem Operasi revisi keempat. Informatika: Bandung. Hasibuan, Zainal A., & Andri, Yofi. (2001). Penerapan Berbagai Teknik Sistem Temu-Kembali Informasi Berbasis Hiperteks. Jurnal Ilmu Komputer dan Teknologi Informasi, Vol. 1, No. 2 Ingwersen, Peter. (2002). Information Retrieval Interaction. Denmark: Royal School of Library and Information Science. Manning, Christopher, D., Raghavan, Prakbhakar., Schütze, Hinrich. (2008). Introduction to Information Retrieval. England: Cambridge University Press..

(71) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 55. P.J, Deitel., Deitel H.M. (2012). Java How to Program, 9th Edition. Pearson Education Inc:USA. Pressman, Roger S. (2001). Software Enginerring: A Practitioner’s Approach, 7th Edition. The McGraw-Hill Companies: USA. Puspitaningrum, Fredes Winda Oktaviani. (2011). Sistem Pemerolehan Informasi Undang-Undang dan Kasus Menggunakan Struktur Data Inverted Index dengan Pembobotan TF-IDF. Universitas Sanata Dharma: Yogyakarta. Wulandari, Justina Septiani. (2013). Sistem Pemerolehan Informasi Makalah Ilmiah Berbahasa Indonesia Menggunakan Struktur Data Inverted Index Dengan Metode Pembobotan TF-IDF Berbasis ORDBMS. Universitas Sanata Dharma: Yogyakarta..

(72) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 56. Lampiran Lampiran I Source code Stemming.java.

(73) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 57.

(74) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 58.

(75) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 59. Lampiran II A. Uji coba satu kata no 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34. kata akademik agama sistem informasi pemerolehan java data struktur katolik hindu budha islam kristen sanata dharma retrieval information mining structures framework collections basis algoritma modeling classification methods business industry accounting akuntansi analisa analisis disain implementasi. arraylist linkedlist 0.001 0.001 0.036 0.092 0.018 0.217 0.128 0.226 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.157 0.252 0.001 0.001 0.001 0.001 0.145 0.151 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001.

(76) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 60. 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72. auditing bunga evaluasi studi dampak kredit keamanan program manajemen teknologi technology perpustakaan geografis bisnis autocad fotografi statistical professionals concepts techniques multimedia computing bioinformatics machine learning implementations introduction preparation mastering aplikasi apriori analysis practical clustering konsep discovering knowledge hypertext. 0.001 0.001 0.001 0.096 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001. 0.001 0.001 0.001 0.222 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001.

(77) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 61. 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100. modern warehousing visualization core support decision systems programmer recognition pattern algorithms perancangan relational scientific perspective teori delphi turbo pascal simulasi kamus time databases penelusuran filsafat ilmu ontologi aksiologi TOTAL Rata-Rata. 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.674 0.00674. 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 1.254 0.01254.

(78) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 62. B. Uji coba dua kata no 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36. kata accounting systems accounting information sistem akuntansi teori bisnis analisis desain Informasi sistem praktek bisnis desain sistem smart card Informasi parkir audit sistem audit Informasi aplikasi informasi aplikasi smart card smart disain analisis bunga rampai evaluasi Informasi unit informasi penggajian pengupahan sistem pengendalian resiko keamanan kasus studi studi kasus indeks pencarian implementasi oracle information systems web tourism berbasis web internal auditing tinjauan sistem informasi manajemen kamus sistem sistem pendukung pendukung keputusan sistem keputusan. arraylist linkedlist 0.001 0.001 0.099 0.166 0.208 0.41 0.001 0.001 0.001 0.001 0.114 0.256 0.001 0.001 0.224 0.152 0.001 0.001 0.001 0.001 0.222 0.282 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.16 0.222 0.001 0.001 0.029 0.225 0.029 0.225 0.001 0.001 0.001 0.001 0.018 0.181 0.001 0.001 0.021 0.221 0.001 0.001 0.115 0.077 0.001 0.001 0.198 0.302 0.269 0.335 0.001 0.001 0.075 0.085.

(79) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 63. 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74. keamanan Informasi sistem keamanan kerangka dasar sistem manajemen manajemen informasi organisasi perusahaan manajemen pendidikan informasi data konsep tuntunan sistem penjualan sistem informasi toko buku model kesuksesan sistem teknologi teknologi informasi informasi teknologi model teknologi sistem geografis Informasi geografis Informasi akademik perangkat bergerak pemetaan pengawasan Informasi perpustakaan metodologi Informasi metodologi sistem pengantar sistem pengantar manajemen perspektif bisnis bisnis manajerial aplikasi akademik perangkat lunak sistem pariwisata open source pengembangan sistem template pengembangan pengenalan informasi book shop sistem bisnis. 0.001 0.211 0.001 0.097 0.001 0.001 0.001 0.084 0.001 0.062 0.134 0.001 0.001 0.081 0.028 0.001 0.001 0.133 0.001 0.001 0.001 0.001 0.001 0.001 0.308 0.041 0.001 0.001 0.001 0.001 0.001 0.032 0.001 0.176 0.001 0.001 0.001 0.107. 0.001 0.243 0.001 0.158 0.001 0.001 0.001 0.099 0.001 0.086 0.275 0.001 0.001 0.156 0.218 0.001 0.001 0.12 0.001 0.001 0.001 0.001 0.001 0.001 0.172 0.081 0.001 0.001 0.001 0.001 0.001 0.209 0.001 0.214 0.001 0.001 0.001 0.247.

(80) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 64. 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100. sistem dokumentasi algoritma mining data mining mining concepts bisnis perusahaan structures abstractions structures java mining multimedia machine tools data preparation java programming relasional kabur data relasional analysis modeling learning tools programmer java web discovering pattern recognition pattern algorithms kamus besar technology information introduction computers computers communications buku ajar farmasi kedokteran mikrobiologi imunologi TOTAL Rata-rata. 0.242 0.001 0.028 0.001 0.001 0.001 0.001 0.001 0.001 0.227 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001. 0.186 0.001 0.119 0.001 0.001 0.001 0.004 0.001 0.001 0.161 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001 0.001. 0.001 0.001 0.001 0.001 3.842 0.03842. 0.001 0.001 0.001 0.001 5.956 0.05956.

(81) PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 65. C. Uji coba tiga kata no 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36. kata data mining algoritma accounting information systems analisa sistem Informasi analisis desain sistem audit sistem Informasi analisis disain implementasi implementasi sistem Informasi praktek aplikasi bisnis dampak teknologi Informasi bunga rampai sistem pengelolaan sistem manajemen akuntansi sistem Informasi pengontrolan sistem Informasi kerangka dasar sistem keamanan sistem Informasi sistem manajemen pendidikan geografis Informasi sistem pengantar sistem Informasi pengembangan sistem Informasi perspektif bisnis Informasi perangkat lunak sistem sistem pemetaan pengawasan perpustakaan sistem Informasi pengantar Informasi manajemen pengembangan perangkat lunak pengelolaan sistem informasi sistem Informasi administrasi pengenalan sistem Informasi perancangan sistem Informasi prototipe sistem Informasi desain pemrograman komputer Informasi berbasis web sistem berbasis web prestasi akademik mahasiswa sistem Informasi bisnis studi konsultasi kanker. arraylist linkedlist 0.001 0.001 0.248 0.268 0.075 0.241 0.095 0.3 0.203 0.105 0.001 0.001 0.192 0.225 0.001 0.001 0.222 0.262 0.059 0.122 0.091 0.121 0.121 0.222 0.106 0.231 0.123 0.136 0.026 0.122 0.101 0.055 0.27 0.322 0.005 0.109 0.038 0.232 0.001 0.001 0.168 0.269 0.132 0.31 0.89 1.113 0.001 0.001 0.001 0.001 0.085 0.174 0.156 0.274 0.112 0.282 0.145 0.228 0.141 0.156 0.001 0.001 0.087 0.168 0.222 0.391 0.001 0.001 0.145 0.223 0.001 0.001.

Gambar

Gambar 2. 1 Proses Pemerolehan Informasi (Baeza-Yates, 1999)
Gambar 2. 3 Inverted index (Manning, 2008)
Gambar 2. 4 Membangun inverted index (Manning, 2008)  Di  sebelah  kiri  pada  gambar  2.4,  terdapat  beberapa  istilah  yang  disimpan
Gambar 2. 5 Intersection posting list (Manning, 2008)
+7

Referensi

Dokumen terkait