• Tidak ada hasil yang ditemukan

TUGAS AKHIR MODEL PENCARIAN HADITS YANG RELEVAN MENGGUNAKAN

N/A
N/A
Protected

Academic year: 2021

Membagikan "TUGAS AKHIR MODEL PENCARIAN HADITS YANG RELEVAN MENGGUNAKAN"

Copied!
16
0
0

Teks penuh

(1)

TUGAS AKHIR

MODEL PENCARIAN HADITS YANG RELEVAN MENGGUNAKAN METODE COSINE SIMILARITY

Oleh:

AHMAD FAHRUDIN ANSHORI NIM.1010651125

JURUSAN TEKNIK INFORMATIKA FAKULTAS TEKNIK

UNIVERSITAS MUHAMMADIYAH JEMBER 2017

TUGAS AKHIR

MODEL PENCARIAN HADITS YANG RELEVAN MENGGUNAKAN METODE COSINE SIMILARITY

Oleh:

AHMAD FAHRUDIN ANSHORI NIM.1010651125

JURUSAN TEKNIK INFORMATIKA FAKULTAS TEKNIK

UNIVERSITAS MUHAMMADIYAH JEMBER 2017

TUGAS AKHIR

MODEL PENCARIAN HADITS YANG RELEVAN MENGGUNAKAN METODE COSINE SIMILARITY

Oleh:

AHMAD FAHRUDIN ANSHORI NIM.1010651125

JURUSAN TEKNIK INFORMATIKA FAKULTAS TEKNIK

UNIVERSITAS MUHAMMADIYAH JEMBER 2017

(2)

TUGAS AKHIR

MODEL PENCARIAN HADITS YANG RELEVAN MENGGUNAKAN METODE COSINE SIMILARITY

Disusun Untuk Melengkapi dan Memenuhi Syarat Kelulusan Program Strata 1 Jurusan Teknik Informatika Fakultas Teknik

Universitas Muhammadiyah Jember

Oleh:

AHMAD FAHRUDIN ANSHORI NIM.1010651125

TUGAS AKHIR

MODEL PENCARIAN HADITS YANG RELEVAN MENGGUNAKAN METODE COSINE SIMILARITY

Disusun Untuk Melengkapi dan Memenuhi Syarat Kelulusan Program Strata 1 Jurusan Teknik Informatika Fakultas Teknik

Universitas Muhammadiyah Jember

Oleh:

AHMAD FAHRUDIN ANSHORI NIM.1010651125

TUGAS AKHIR

MODEL PENCARIAN HADITS YANG RELEVAN MENGGUNAKAN METODE COSINE SIMILARITY

Disusun Untuk Melengkapi dan Memenuhi Syarat Kelulusan Program Strata 1 Jurusan Teknik Informatika Fakultas Teknik

Universitas Muhammadiyah Jember

Oleh:

AHMAD FAHRUDIN ANSHORI NIM.1010651125

(3)

HALAMAN PENGESAHAN

MODEL PENCARIAN HADITS YANG RELEVAN MENGGUNAKAN METODE COSINE SIMILARITY

Oleh:

AHMAD FAHRUDIN ANSHORI NIM.1010651125

Tugas Akhir Ini Diajukan Sebagai Salah Satu Syarat Untuk Memperoleh Gelar Sarjana Komputer (S.Kom)

di

Universitas Muhammadiyah Jember Disetujui oleh:

Tim Penguji Dosen Pembimbing

Triawan Adi Cahyanto, M.Kom Deni Arifianto, S.Kom., M. Kom

NPK. 12 03 719 NPK. 11 03 588

Ulya Anisatur R., M.Kom Yeni Dwi Rahayu, M.Kom

NPK. 12 03 705 NPK. 11 03 590

Jember, 31 Maret 2017 Mengetahui,

Dekan Fakultas Teknik Kaprodi Teknik Informatika

Ir. Suhartinah, MT Yeni Dwi Rahayu, S.ST., M.Kom

(4)

PERNYATAAN

Yang bertanda tangan di bawah ini: Nama : Ahmad Fahrudin Anshori NIM : 1010651125

Prodi : Teknik Informatika/S1

Menyatakan dengan sesungguhnya bahwa tugas akhir yang berjudul: “MODEL PENCARIAN HADITS YANG RELEVAN MENGGUNAKAN METODE COSINE SIMILARITY” adalah benar-benar hasil karya sendiri, kecuali jika dalam pengutipan substansi disebutkan sumbernya, dan belum pernah diajukan pada instansi manapun, serta bukan karya jiplakan. Saya bertanggung jawab atas keabsahan dan kebenaran isinya sesuai dengan sikap ilmiah yang harus dijunjung tinggi.

Demikian pernyataan ini saya buat dengan sebenarnya, tanpa adanya tekanan dan paksaan dari pihak manapun serta bersedia mendapat sanksi akademik jika ternyata di kemudian hari pernyataan ini tidak benar.

Jember, 31 Maret 2017 Yang menyatakan,

Ahmad Fahrudin Anshori NIM.1010651125

(5)

UNGKAPAN TERIMA KASIH

Puji syukur kepada Allah Subhanahu Wa Ta’ala, karena atas limpahan rahmat dan karunia-Nya, saya dapat menyelesaikan tugas akhir yang berjudul: “MODEL PENCARIAN HADITS YANG RELEVAN MENGGUNAKAN METODE COSINE SIMILARITY”. Banyak pihak yang membantu hingga tugas akhir ini dapat saya selesaikan. Untuk itu, saya ingin menyampaikan ucapan terima kasih kepada:

1. Allah Swt, karena Nikmat, Perlindungan, Pertolongan, dan Ridho-Nya saya mampu menyelesaikan Tugas Akhir ini.

2. Muhammad shalallahu alaihi wa sallam, karena suri tauladannya mencerahkan seluruh umat manusia.

3. Bapak, Ibu, Kakak, Adik dan Keluarga yang telah memberikan Doa, cinta dan kasih sayang baik itu berupa dorongan moril maupun spiritual.

4. Ibu Ir. Suhartinah, MT, selaku Dekan Fakultas Teknik Universitas Muhammadiyah Jember.

5. Ibu Yeni Dwi Rahayu, S.T., M.Kom., selaku Ketua Jurusan Teknik Informatika Universitas Muhammadiyah Jember yang telah banyak membantu.

6. Bapak Deni Arifianto, S.Kom, selaku Dosen Pembimbing yang telah menyediakan waktu, tenaga, dan pikiran untuk mengarahkan saya dalam penyusunan tugas akhir ini.

7. Bapak Triawan Adi Cahyanto, M.Kom dan Ibu Ulya Anisatur R., M.Kom selaku Dosen Penguji yang telah memberikan kritik dan saran untuk perbaikan tugas akhir ini.

8. Dan teman-teman satu angkatan yang paling banyak membantu dalam proses pengkodingan program.

9. Teman-teman satu asrama masjid Nur Rohman yang telah memberikan banyak bantuan informasi dan dukungan.

10. Teman-teman kerja di Pondok Ibnu Katsir yang telah memberi banyak dukungan.

(6)

11. Seluruh teman-teman jurusan Teknik Informatika dan khususnya angkatan 2010 yang selalu memberikan semangat meskipun mereka telah lebih dahulu lulus, khususnya Eka, Rama, Dani, Rizal, Meris, Rossi dan lain-lain.

12. Seluruh Mahasiswa Universitas Muhammadiyah Jember daris egala jurusan yang pernah saya kenal dan mengenal saya. Serta semua pihak yang telah membantu dalam proses penyelesaian tugas akhir ini.

Dan juga kepada semua pihak yang tidak bisa disebutkan satu per satu. Jazakumullah khairan, semogaAllah membalas kalian dengan kebaikkan.

Jember, 31 Maret 2017 Penulis

(7)

KATA PENGANTAR Bismillahirrahmanirrahim

Alhamdulillah kami panjatkan rasa syukur kepada Allah set. Karena hanya dengan rahmat, hidayah dan Inayah-Nya kami dapat menyelesaikan tugas akhir ini dengan judul : “MODEL PENCARIAN HADITS YANG RELEVAN MENGGUNAKAN METODE COSINE SIMILARITY”.

Dalam menyelesaikan Tugas Akhir ini, kami berpegang teguh pada teori yang kami dapatkan dan bimbingan dari dosen pembimbing Tugas Akhir. Dan pihak-pihak lain yang sangat membantu hingga sampai terselesaikannya Tugas Akhir ini. Tugas akhir ini merupakan salah satu syarat akademis untuk memperoleh gelar Sarjana Komputer (S.Kom) di Fakultas Teknik, Universitas Muhammadiyah Jember.

Kami menyadari bahwa masih banyak kekurangan pada analisis dan pembuatan Tugas Akhir ini. Oleh karena itu, besar harapan kami untukmenerima saran dan kritik dari para pembaca. Semoga buku ini dapat memberikan manfaat bagi Mahasiswa Universitas Muhaadiyah Jember pada umumnya dan dapat memberikan nilai lebih untuk para pembaca pada khususnya.

Jember, 31 Maret 2017 Penulis

(8)

PERSEMBAHAN

Tugas akhir ini saya persembahkan untuk:

1. Bapak dan Ibu saya Muhammad Qomari dan Misriati 2. Calon Istri saya Didin Ayu Samitra

(9)

MOTTO

“Demi Masa. Sesungguhnya Manusia itu dalam Kerugian. Kecuali orang-orang yang beriman, dan beramal sholeh, dan saling menasihati dalam kebaikan, dan saling menasihati dalam Kesabaran” (QS Al Ashr 1-3)

(10)

MODEL PENCARIAN HADITS YANG RELEVAN MENGGUNAKAN METODE COSINE SIMILARITY

1Ahmad Fahrudin Anshori (1010651125),2Deni Arifianto, S.ST., M.Kom,

3Triawan Adi Cahyanto, M.Kom,4Ulya Anisatur R., M.Kom

Jurusan Teknik Informatika Fakultas Teknik Universitas Muhammadiyah Jember Email : ahfancool@gmail.com

ABSTRAK

Hadits merupakan pedoman seorang muslim dalam menjalankan agamanya setelah Alqur’an. Adapun Jumlah hadist yang diriwayatkan oleh para perawi hadist berjumlah puluhan ribu hadist dengan tema-tema yang sangat banyak. Dengan banyaknya hadist yang diriwayatkan oleh banyak perawi hadits maka orang yang baru mempelajari hadist akan sulit untuk menghafal atau menemukan hadist yang ingin dicari sebagai referensi untuk permasalahan-permasalahan yang ia perlukan. Diperlukan inovasi untuk memudahkan pencarian hadist berjumlah ribuan tersebut dalam suatu sistem temu kembali informasi. Sistem Temu Kembali Informasi dapat dimanfaatkan sebagai solusi karena memberikan alternatif berupa metode similarity yang dapat digunakan untuk mencocokkan esai jawaban ujian dan kunci jawaban soal. Metode similarity yang paling populer untuk diterapkan pada dokumen teks adalah cosine similarity. Kelebihan metode cosine similarity adalah tidak terpengaruh pada panjang pendeknya suatu dokumen, karena yang diperhitungkan hanya nilai term dari masing-masing dokumen. Pada penelitian ini dibangun sebuah model pencarian hadits yang relevan menggunakan metode cosine similarity. Uji coba yang dilakukan adalah pengukuran kemiripan dan penentuan threshold. Hasil yang didapat model berhasil menghitung kemiripan dengan jangkauan nilai cosine antara 0,05 – 0,25, semakin besar maka semakin mirip esai jawaban tersebut dengan kunci jawaban soal. Threshold terbaik yang diperoleh adalah 0,1 dengan recall 83% dan precision 46%.

Kata kunci: pencarian hadits, relevan, bahasa Indonesia, sistem temu kembali informasi, cosine similarity.

(11)

HADITH RELEVANT MODEL SEARCH USING COSINE SIMILARITY

1Ahmad Fahrudin Anshori (1010651125),2Deni Arifianto, S.ST., M.Kom,

3Triawan Adi Cahyanto, M.Kom,4Ulya Anisatur R., M.Kom

Department of Informatics Faculty of Engineering University of Muhammadiyah Jember Email: zuhri.nurhuda@gmail.com

ABSTRACT

Hadith is a guideline of a Muslim in Observant after the Koran. The amount of the hadith narrated by the narrators of hadith amounted to tens of thousands of hadiths with themes that very much. With many hadith narrated by many narrators then a new person to learn hadith would be difficult to memorize or find a hadith you want to find a reference to the problems that he needs. Needed innovation to facilitate the search for the thousands hadith mentioned in an information retrieval system. Information Retrieval System can be used as a solution because it provides an alternative method of similarity that can be used to match essays and exam answers answer key questions. The most popular similarity method to be applied to text document is cosine similarity. Excess cosine similarity method is not affected in the short length of a document, because it is taken into account only the terms of the values of each document. In this study constructed a hadith relevant search model using the cosine similarity. Experiments performed is the measurement of similarity and threshold determination. The results obtained with the model successfully calculates similarity cosine values range between 0.05 to 0.25, the greater the more it resembles the essay answers with the answer key questions. The best threshold obtained was 0.1 with 83% recall and 46% precision.

Keywords: searh hadith, relevant, Indonesian language, information retrieval system, cosine similarity.

(12)

DAFTAR ISI

HALAMAN JUDUL ... i

HALAMAN PENGESAHAN ... ii

HALAMAN PERNYATAAN ... iii

UNGKAPAN TERIMA KASIH ... iv

KATA PENGANTAR ... vi

HALAMAN PERSEMBAHAN ... vii

MOTTO ... viii

ABSTRAK ... ix

ABSTRACT ... x

DAFTAR ISI ... xi

DAFTAR TABEL ... xiii

DAFTAR GAMBAR ... xv BAB 1 PENDAHULUAN ... 1 1.1 Latar Belakang ... 1 1.2 Rumusan Masalah ... 2 1.3 Batasan Masalah ... 2 1.4 Tujuan Penelitian ... 3 1.5 Manfaat Penelitian ... 3

BAB II TINJAUAN PUSTAKA ... 4

2.1 Hadits ... 4

2.2 Sistem Temu Kembali Informasi ... 5

2.2.1 Arsitektur Sistem Temu Kembali Informasi ... 6

(13)

BAB III METODOLOGI PENELITIAN ... 19 3.1 Tahapan Penelitian... 19 3.2 Perancangan ... 20 3.3 Tahapan Pencarian ... 22 3.3.1 Input Data ... 22 3.3.2 Tulis Status ... 22 3.3.3 Preprocessing ... 23 3.3.4 Similarity Measure ... 28 3.3.5 Lampirkan Hadits... 32 3.3.6 Threshhold... 33

3.3.7 Recall dan Precision... 33

BAB IV HASIL DAN PEMBAHASAN ... 34

4.1 Perangkat Uji Coba ... 34

4.2 Alur Aplikasi ... 34

4.3 Skenario Uji Coba ... 36

4.4 Evaluasi Hasil Uji Coba... 37

4.4.1 Hasil Pengukuran Kemiripan Menggunakan Metode Cosine Similarity ... 37

4.4.2 Uji Coba Penentuan Threshold ... 44

BAB V KESIMPULAN DAN SARAN ... 51

5.1 Kesimpulan ... 51

5.2 Saran ... 52 DAFTAR PUSTAKA

(14)

DAFTAR TABEL

Tabel 2.1 Contoh Skema Pembobotan ... 9

Tabel 2.2 Perhitungan Penentuan Recall Dan Precision ... 12

Tabel 2.3 Contoh Perhitungan Recall Dan Precision ... 13

Tabel 2.4 Imbuhan Gabung Yang Tidak Dibolehkan ... 15

Tabel 2.5 Tipe Awalan Untuk Kata Berawalan te- ... 17

Tabel 2.6 Menentukan Awalan Dari Jenis Awalan ... 18

Tabel 3.1 Contoh Query Dan Dokumen Yang Akan Di Preprocess ... 23

Tabel 3.2 Hasil Proses Tokenizing ... 25

Tabel 3.3 Hasil Proses Stopword... 26

Tabel 3.4 Hasil Proses Stemming ... 27

Tabel 3.5 Hasil Proses Synonim ... 28

Tabel 3.6 Contoh Pembobotan Term Dengan TF-IDF ... 29

Tabel 3.7 Contoh Tahapan Cosine Similarity ... 31

Tabel 3.8 Contoh Hasil Penilaian Dengan Threshold 0,050 ... 33

Tabel 3.9 Contoh Perhitungan Recall dan Precision ... 33

Tabel 4.1 Spesifikasi Perangkat Keras... 34

Tabel 4.2 Spesifikasi Perangkat Lunak ... 34

Tabel 4.3 Dataset Status ... 37

Tabel 4.4 Hasil Pengukuran Kemiripan Menggunakan Metode Cosine Similarity... 39

Tabel 4.5 Hasil Penilaian Kerelevanan Dengan Threshold 0,2... 44

Tabel 4.6 Perhitungan Recall dan Precision Dengan Threshold 0,2... 45

(15)

Tabel 4.13 Hasil Penilaian Kerelevanan Dengan Threshold 0,05... 48 Tabel 4.14 Perhitungan Recall dan Precision Dengan Threshold 0,05... 49 Tabel 4.15 Hasil Uji Coba Penentuan Threshold... 49

(16)

DAFTAR PUSTAKA

Agusta, Ledy (2009). Perbandingan Algoritma Stemming Porter dengan Algoritma Nazief & Adriani untuk Stemming Dokumen Teks Bahasa Indonesia. Bali: Konferensi Nasional Sistem dan Informatika 2009

Asian, Jelita. (2007, Maret). - Effective Techniques For Indonesian Text Retrieval. Melbourne, Victoria, Australia: Science, Engineering, and Technology Portfolio RMIT University.

Cios, Krzysztof J, Witold Predrycz, dkk, (2007). Data Mining A Knowledge Discovery Approach. Springer. New York.

Hasugian, Jonner. (2006). Penggunaan Bahasa Alamiah dan Kosa Kata Terkontrol dalam Sistem Temu Kembali Informasi Berbasis Teks. Dalam Jurnal Pustaha: Jurnal Studi Perpustakaan dan Informasi, Vol.2, No.2, Desember 2006. USU Press.

Kaplan, Ronald M. (2005). A Method for Tokenizing Text. In Festschrift in Honor of Kimmo Koskenniemi’s 60th anniversary. CSLI Publications.

Konchady, M. (2006). Text Mining Application Programming, Charles River Media.

Murad, M.A.A, dkk.(2009). Malay Document Clustering Algorithm Based on Singular Value Decomposition. Malaysia. Fakultas Ilmu Komputer dan Teknologi Informasi, Universitas Putra Malaysia.

Salton, Gerard., Christopher Buckley (1988) Term-Weighting Approaches in Automatic Text Retrieval. Department of Computer Science, Cornell University, Ithaca, New York, USA

Wahyudin, Ahmad, M. Ilyas. Pendidikan Agama Islam untuk Perguruan Tinggi. Jakarta: Grasindo.

Referensi

Dokumen terkait

1) Penerapan Sistem Manajemen Keselamatan dan Kesehatan Kerja (SMK3) sudah berjalan dengan baik dan sesuai dengan peraturan menteri nomor PER 05/MEN/1996.

Puji dan syukur penulis panjatkan kepada Allah SWT., karena berkat rahmat dan hidayah-Nya penulis dapat menyelesaikan Laporan Akhir yang berjudul “ Aplikasi Transaksi

Menyatakan dengan sesungguhnya bahwa tesis yang berjudul “ Validitas pemeriksaan Barium Enema pre-operasi terhadap enterokolitis pada penderita hirschsprung’s

18 Tahun 2012 adalah segala sesuatu yang berasal dari sumber hayati produk pertanian, perkebunan, kehutanan, perikanan, peternakan, perairan, dan air, baik yang

Stuart Hall, Dorothy hobson,Andrew Lowe.2011. Budaya,Media dan Bahasa.. Analisis Teks Media :Suatu Pengantar Untuk Analisis Wacana ,Analisis Semiotic dan Analisis

Edge-triggered flip-flop , yaitu untai flip-flop yang mempunyai input sinyal clock , dan output akan bereaksi terhadap perubahan input saat sinyal clock berubah dari 0 ke 1

Semua jumlah lantai dari bangunan yang terdapat pada sisi ini sesuai dengan Peraturan Daerah Kota Malang Nomor 1 Tahun 2012 tentang Bangunan Gedung bagian kedua Persyaratan