• Tidak ada hasil yang ditemukan

KLASIFIKASI TERJEMAHAN AL-QUR AN JUZ 30 DALAM BAHASA INDONESIA MENGGUNAKAN METODE C5.0 LAPORAN TUGAS AKHIR. Diajukan Untuk Memenuhi

N/A
N/A
Protected

Academic year: 2022

Membagikan "KLASIFIKASI TERJEMAHAN AL-QUR AN JUZ 30 DALAM BAHASA INDONESIA MENGGUNAKAN METODE C5.0 LAPORAN TUGAS AKHIR. Diajukan Untuk Memenuhi"

Copied!
19
0
0

Teks penuh

(1)

KLASIFIKASI TERJEMAHAN AL-QUR’AN JUZ 30 DALAM BAHASA INDONESIA MENGGUNAKAN METODE C5.0

LAPORAN TUGAS AKHIR

Diajukan Untuk Memenuhi

Persyaratan Guna Meraih Gelar Sarjana Strata 1 Informatika Universitas Muhammadiyah Malang

JUNIARTI WAHYU UTAMI 201610370311259

PROGRAM STUDI INFORMATIKA FAKULTAS TEKNIK

UNIVERSITAS MUHAMMADIYAH MALANG 2021

(2)

i

(3)

ii

(4)

iii

(5)

iv ABSTRAK

Al-Qur’an merupakan wahyu dari Allah SWT yang diturunkan kepada Nabi Besar Muhammad SAW pada usia 40 tahun. Al-Qur’an diturunkan untuk disampaikan kepada seluruh umat manusia. Al-Qur’an diturunkan untuk dijadikan sebagai pedoman bagi umat islam dalam menjalani kehidupan agar mencapai kebahagiaan di dunia dan akhirat. Klasifikasi pada ayat Al-Qur’an perlu dilakukan untuk dapat memudahkan seseorang dalam mencari suatu topik dalam Al-Qur’an. Pada penelitian ini dilakukan kalsifikasi terjemahan ayat pada Juz 30 menggunakan Algoritma C5.0. Topik pada penelitian ini terdiri dari 5 kelas yaitu Kiamat, Hisab, Surga, Neraka, dan Lainnya. Data yang sudah dikumpulkan akan dilakukan Preprocessing untuk mendapatkan data yang bersih, selanjutnya melakukan klasifikasi dengan Algoritma C5.0 dan melakukan evaluasi Confusion Matrix.

Hasil dari klasifikasi diperoleh nilai akurasi 50%.

Kata Kunci : Klasifikasi, Ayat Al-Qur’an, Algoritma C5.0.

(6)

v ABSTRACT

Al-Qur'an is a revelation from Allah SWT that was sent down to the Great Prophet Muhammad SAW at the age of 40 years. Al-Qur'an was revealed to be delivered to all mankind. Al-Quran was revealed to be used as a guide for Muslims in living life in order to achieve happiness in this world and the hereafter. Classification in the verses of the Al-Qur'an needs to be done to make it easier for someone to find a topic in the Al-Qur'an. In this study, the translation of the verse in Juz 30 was classified using the C5.0 Algorithm. The topics in this study consisted of 5 classes, namely Doomsday, Hisab, Heaven, Hell, and others.

The data that has been collected will be preprocessed to get clean data, then classify with the C5.0 Algorithm and evaluate the Confusion Matrix. The results of the classification obtained an accuracy value of 50%.

Keywords : Classification, Verse of Al-Qur’an, Algorithm C5.0.

(7)

vi

KATA PENGANTAR

Puji syukur Alhamdulillah kehadirat Allah SWT atas segala limpahan rahmat serta hidayah-Nya sehingga penulis dapat menyelasaikan Tugas Akhir yang berjudul “ KLASIFIKASI TERJEMAHAN AL-QUR’AN JUZ 30 DALAM BAHASA INDONESIA MENGGUNAKAN METODE C5.0 “ ini dengan baik.

Tugas Akhir disusun guna memenuhi persyaratan dalam meraih gelar Strata-1 di Universitas Muhammadiyah Malang.

Penulis menyadari sepenuhnya bahwa penulisan Tugas Akhir ini masih terdapat banyak kekurangan, oleh sebab itu penulis ingin mengharapkan saran agar tulisan ini dapat tersusun dengan baik serta dapat memberi manfaat bagi siapapun yang membacanya.

Malang, 9 Januari 2021

Juniarti Wahyu Utami

(8)

vii

LEMBAR PERSEMBAHAN

Puji syukur Alhamdulillah penulis panjatkan kehadirat Allah SWT atas segala limpahan rahmat dan hidayah-Nya penulis dapat menyelesaikan Tugas Akhir ini.

Dalam penyelesaian Tugas Akhir ini tentunya banyak pihak yang terlibat, oleh karena itu dengan rendah hati penulis mengucapkan terimakasih yang sebesar- besarnya kepada :

1. Kedua orang tua saya, Bapak A. Suro Utomo dan Ibu Juma’ina yang selalu mendo’akan dan memberi semangat penuh kepada penulis untuk kelancaran dalam menyelesaikan studi.

2. Kakak satu-satunya, Febri Wahyu Tanoto yang selalu menjaga selama penulis menjalankan studi di Malang.

3. Ibu Gita Indah Marthasari, S.T., M.Kom selaku Ketua Jurusan Informatika sekaligus selaku dosen pembimbing 1 yang telah meluangkan waktu untuk membimbing serta memberi arahan kepada penulis sehingga Tugas Akhir ini dapat terselesaikan.

4. Bapak Christian Sri Kusuma Aditya, S.Kom., M.Kom selaku dosen pembimbing 2 yang juga telah membimbing dan memberi arahan kepada penulis.

5. Bapak Didih Rizki Chandranegara, S.Kom., M.Kom selaku dosen penguji 1 dan Bapak Wildan Suharso, S.Kom., M.Kom selaku dosen penguji 2 yang telah mengoreksi dan memberikan saran dengan baik.

6. Bapak Achmad Tito Rusady selaku pakar yang telah membantu penulis dalam proses pelabelan data.

7. Seluruh dosen jurusan Informatika UMM atas ilmu serta didikannya selama penulis berada di bangku perkuliahan.

8. Mbak Ummi Masruroh, Laili Hidayati dan adek Inayatus Sholihah yang selalu mendoakan dan memberi semangat kepada penulis.

9. Sahabat saya, Kamelia Kusdiarti Qomary, Erva Rosita, Wiwin Supriatin, Maryama, yang selalu mendengarkan keluh-kesah dunia perkuliahan dan

(9)

viii

memberikan semangat kepada penulis dalam menyelesaikan Tugas Akhir ini.

10. Teman yang paling baik, Rizal Maulana Anwar yang telah banyak membantu penulis dalam penyelesaian Tugas Akhir ini.

11. Partner kuliah terbaik, Ferdyansah Pratama Z, Arlia Wijaya yang sangat membantu penulis selama kuliah dan selalu memberi semangat kepada penulis.

12. Teman Se-Perjuangan mengerjakan Tugas Akhir dan bimbingan, Firdia Siti Aminah yang selalu saling support.

13. Rahayu Nurul Khasanah dan Neneng Aprianti yang selalu memberi semangat kepada penulis dalam penyelesaian Tugas Akhir ini.

14. Teman-teman KKN, Anggi, Danti, Nita, Yosita, Herlinda yang selalu memberikan support kepada penulis untuk segera menyelesaikan Tugas Akhir ini.

15. Teman-teman seperjuangan Kelas E Informatika 2016 yang telah mengisi segala cerita perkuliahan dan saling support.

16. KSR-PMI UMM yang sudah jadi keluarga kedua selama penulis berada di kampus dan telah melalui susah dan senang bersama. Terimakasih banyak!

(10)

ix DAFTAR ISI

LEMBAR PERSETUJUAN ... i

LEMBAR PENGESAHAN ... ii

LEMBAR PERNYATAAN ... iii

ABSTRAK ... iv

ABSTRACT ... v

KATA PENGANTAR ... vi

LEMBAR PERSEMBAHAN ... vii

DAFTAR ISI ... ix

DAFTAR GAMBAR ... xii

DAFTAR TABEL ... xiv

BAB I ... 1

PENDAHULUAN ... 1

1.1. Latar Belakang ... 1

1.2. Rumusan Masalah ... 3

1.3. Tujuan Penelitian ... 3

1.4. Batasan Masalah ... 3

BAB II ... 5

LANDASAN TEORI ... 5

2.1. Klasifkasi Teks ... 5

2.2. Al-Qur’an ... 5

2.3. Data Mining ... 6

2.4. Text Preprocessing ... 8

2.4.1. Case Folding ... 8

2.4.2. Tokenizing ... 8

2.4.3. Filtering ... 8

2.4.4. Stemming ... 8

2.4.5. Feature Weighting ... 9

2.5. Decision Tree ... 9

2.6. Algoritma C5.0 ... 10

2.7. Evaluasi ... 13

BAB III ... 15

(11)

x

METODOLOGI PENELITIAN ... 15

3.1 Pengumpulan Data ... 16

3.2 Pelabelan Secara Manual ... 16

3.3 Preprocessing Data ... 17

3.4 Term Weighting (TF-IDF) ... 18

3.5 Klasifikasi Algoritma C5.0 ... 20

3.6 Evaluasi Confusion Matrix ... 22

3.7 Skenario Pengujian ... 23

BAB IV ... 24

HASIL DAN PEMBAHASAN ... 24

4.1. Implementasi ... 24

4.2. Preprocessing ... 24

4.2.1. Case Folding ... 24

4.2.2. Filtering ... 25

4.2.3. Tokenisasi ... 25

4.2.4. StopWords Removal ... 25

4.2.5. Stemming ... 26

4.3. TF-IDF (Term Frequency-Inverse Document Frequency)... 27

4.4. Klasifikasi Algoritma C5.0 ... 29

4.4.1. Mencari Nilai Entropy ... 29

4.4.2. Mencari Nilai Information Gain... 31

4.4.3. Menghitung Split Info ... 32

4.4.4. Menghitung Gain ratio ... 33

4.4.5. Klasifikasi ... 34

4.5. Pengujian... 37

4.5.1. Klasifikasi C5.0 ... 37

4.5.2. Klasifikasi C4.5 ... 39

4.6. Analisa Hasil Pengujian ... 40

4.6.1. Analisa Hasil Accuracy, Precision, Recal, dan F-Measure ... 40

4.6.2. Analisa Perbandingan Waktu Proses Pengujian ... 40

4.6.3. Analisa Perbandingan Algoritma C4.5 dan C5.0 ... 41

4.6.4. Analisa Perbandingan Waktu Proses C4.5 dan C5.0 ... 42

4.7. Analisa Hasil Akurasi ... 43

BAB V ... 44

(12)

xi

KESIMPULAN DAN SARAN ... 44

5.1. Kesimpulan ... 44

5.2. Saran ... 44

DAFTAR PUSTAKA ... 45

(13)

xii

DAFTAR GAMBAR

Gambar 1. Tahapan Knowledge Discovery In Database (KDD) ... 7

Gambar 2. Pohon Keputusan... 10

Gambar 3. Alur penelitian ... 15

Gambar 4. Source Code Case Folding ... 24

Gambar 5. Source Code Filtering... 25

Gambar 6. Source Code Tokenisasi ... 25

Gambar 7. Source Code Stop Words ... 25

Gambar 8. Source Code Stemming ... 26

Gambar 9. Hasil Preprocessing ... 26

Gambar 10. Source Code TF ... 27

Gambar 11. Hasil TF ... 27

Gambar 12. Source Code DF ... 28

Gambar 13. Hasil DF ... 28

Gambar 14. Source Code IDF ... 28

Gambar 15. Source Code TF-IDF ... 29

Gambar 16. Hasil TF-IDF ... 29

Gambar 17. Source Code Jumlah label ... 30

Gambar 18. Source Code Entropy Total ... 30

Gambar 19. Source Code Entropy Atribut ... 30

Gambar 20. Hasil Entropy Atribut ... 31

Gambar 21. Source Code Information Gain ... 31

Gambar 22. Hasil Information Gain... 32

Gambar 23. Source Code Split Info ... 32

Gambar 24. Hasil Split Info ... 33

Gambar 25. Source Code Gain Ratio ... 33

Gambar 26. Hasil Gain Ratio ... 33

Gambar 27. Source Code Import Library ... 34

Gambar 28. Source Code Penentuan Node ... 34

Gambar 29. Source Code Pembagian Data ... 34

Gambar 30. Source Code Model Klasifikasi... 35

(14)

xiii

Gambar 31. Hasil Model Klasifikasi ... 36

Gambar 32. Source Code Cross Validation ... 36

Gambar 33. Source Code Evaluasi Confusion Matrix ... 36

Gambar 34.Grafik Perbandingan Hasil Klasifikasi ... 40

Gambar 35. Grafik Runtime ... 41

Gambar 36. Grafik Perbandingan Akurasi ... 42

Gambar 37. Grafik Perbandingan Runtime ... 42

(15)

xiv

DAFTAR TABEL

Table 1. Confusion Matrix ... 13

Table 2. Gambaran Data Penelitian ... 16

Table 3. Data Perhitungan Manual... 18

Table 4. Perhitungan nilai TF... 19

Table 5. Hasil Perhitungan DF dan IDF... 19

Table 6. Hasil Perhitungan TF-IDF ... 20

Table 7. Confusion Matrix Skenario 1 ... 37

Table 8. Confusion Matrix Skenario 2 ... 38

Table 9. Confusion Matrix Skenario 3 ... 38

Table 10. Hasil evaluasi skenario 1 sampai 3 ... 39

Table 11. Confusion Matrix C4.5 ... 39

(16)

xv

DAFTAR PUSTAKA

[1] O. Nurdiana, J. Jumadi, and D. Nursantika, “Perbandingan Metode Cosine Similarity Dengan Metode Jaccard Similarity Pada Aplikasi Pencarian Terjemah Al-Qur’an Dalam Bahasa Indonesia,” J. Online Inform., vol. 1, no. 1, p. 59, 2016.

[2] D. Setiawati, I. Taufik, J. Jumadi, and W. B. Zulfikar, “Klasifikasi Terjemahan Ayat Al-Quran Tentang Ilmu Sains Menggunakan Algoritma Decision Tree Berbasis Mobile,” J. Online Inform., vol. 1, no. 1, p. 24, 2016.

[3] N. Knn, D. A. N. Information, T. H. Putrisanni, and S. Al Faraby, “K- nearest neighbor (knn) dan information gain,” vol. 3, pp. 362–369, 2019.

[4] J. T. Informasi et al., “ALGORITMA C4 . 5 DENGAN PARTICLE

SWARM OPTIMIZATION UNTUK KLASIFIKASI LAMA

MENGHAFAL AL-QURAN PADA SANTRI,” vol. 14, pp. 92–103, 2018.

[5] P. Algoritme, P. Keputusan, C. Untuk, and K. Lahan, “Jurnal Teknologi Terpadu Meliana O . Meo Program Studi Teknik Informatika , STIKOM Uyelindo Kupang Jurnal Teknologi Terpadu,” pp. 17–23, 2017.

[6] E. Supriyati and M. Iqbal, “Pengukuran Similarity Tema Pada Juz 30 Al Qur’an Menggunakan Teks Klasifikasi,” Simetris J. Tek. Mesin, Elektro dan Ilmu Komput., vol. 9, no. 1, pp. 361–370, 2018.

[7] M. I. Rahman, N. A. Samsudin, A. Mustapha, and A. Abdullahi,

“Comparative analysis for topic classification in Juz Al-Baqarah,” Indones.

J. Electr. Eng. Comput. Sci., vol. 12, no. 1, pp. 406–411, 2018.

[8] G. G. Kronik, “Universitas Muhammadiyah Purworejo IMPLEMENTASI ALGORITMA C5 . 0 UNTUK KLASIFIKASI PENYAKIT The 9 th University Research Colloqium 2019 Universitas Muhammadiyah Purworejo,” pp. 5–10, 2019.

(17)

xvi

[9] M. Rizki and A. Saleh, “Kontrol Ekspresi Wajah Berdasarkan Klasifikasi Teks Menggunakan Metode Naive Bayes,” pp. 1–5, 2013.

[10] F. Pengaruh, K. Tepat, and D. U. Memenuhi, “Andriani Eka P,” 2019.

[11] A. Salama, Adiwijaya, and S. Al Faraby, “Klasifikasi Topik Ayat Al- Qur’an Terjemahan Berbahasa Inggris Menggunakan Metode Support Vector Machine Berbasis Vector Space Model dan Word2Vec,” E- proceeding Eng., vol. 6, no. 2, pp. 9133–9142, 2019.

[12] J. Umar, “KEGUNAAN TERJEMAH QUR’AN BAGI UMMAT MUSLIM Juairiah Umar Fakultas Tarbiyah dan Keguruan UIN Arraniry Kopelma Darussalam Kota Banda Aceh,” Al-Mu‘ashirah, vol. 14, no. 1, pp. 31–38, 2017.

[13] Muhammad Sholeh, “Prosiding Seminar Nasional Aplikasi Sains &

Teknologi (SNAST) 2014 Yogyakarta, 15 November 2014 ISSN: 1979- 911X,” Snast, no. November, pp. 211–216, 2014.

[14] Risnawati, “Analisis Kelulusan Mahasiswa Menggunakan Algoritma C.45,” J. Mantik Penusa, vol. 2, no. 1, pp. 71–76, 2018.

[15] A. Ridok and R. Latifah, “Klasifikasi Teks Bahasa Indonesia Pada Corpus Tak Seimbang Menggunakan NWKNN,” Konf. Nas. Sist. dan Inform.

2015, no. Oktober, pp. 222–227, 2015.

[16] L. A. Syaifuddin, “Bab II_8,” Klasifikasi Ber. Olahraga Menggunakan Algoritm. C5.0 Berbas. Ontol., pp. 6–14, 2019.

[17] E. Learning et al., “Jurnal Antartika,” vol. 08, 2018.

[18] A. C. Wijaya, N. A. Hasibuan, and P. Ramadhani, “Implementasi Algoritma C5 . 0 Dalam Klasifikasi Pendapatan Masyarakat ( Studi Kasus : Kelurahan Mesjid Kecamatan Medan Kota ),” Inf. dan Teknol. Ilm., vol. 13, pp. 192–198, 2018.

[19] M. I. Fitrianda, Digital Digital Repository Repository Universitas

(18)

xvii

Universitas Jember Jember Digital Digital Repository Repository Universitas Universitas Jember. 2013.

[20] N. R. Karim, “PENERAPAN ALGORITMA C5.,” PENERAPAN Algoritm.

C5.0 PADA Sist. PENDUKUNG KEPUTUSAN UNTUK MENGANALISIS TINGKAT STRES PADA Mhs. TINGKAT AKHIR, pp. 14–42, 2018.

[21] C. Hutabarat, “Penerapan Data Mining Untuk Memprediksi Permintaan Produk Kartu Perdana Internet Menggunakan Algoritma C5.0 (Studi Kasus: Vidha Ponsel),” J. Pelita Inform., vol. 17, no. 2, pp. 168–173, 2018.

[22] M. Yusa and W. Sindu, “Evaluasimodel Decision Tree C4.5 Guna Prediksi Posibilitas Resiko Obesitas,” Semin. Nas., pp. 147–152, 2015.

[23] Betrisandi, “Klasifikasi Nasabah Asuransi Jiwa Menggunakan,” vol. 9, no.

April, pp. 96–101, 2017.

[24] Sukmawan Pradika Janusange Santoso, “Pengelompokan pada Hadits Menggunakan Naive Bayes Classifier Program Studi Sarjana S1 Ilmu Komputasi Fakultas Informatika Universitas Telkom Bandung,” vol. 6, no.

2, pp. 9894–9904, 2019.

[25] S. H. Waluyo and Prihandoko, “Klasifikasi Pemanfaat Program Beras Sejahtera ( RASTRA ) Berdasarkan Tingkat Kemiskinan Dengan Menggunakan Algoritma Decision Tree C4 . 5 Berbasis Particle Swarm Optimization,” vol. 7, no. 2, pp. 19–24, 2017.

[26] D. P. Utomo, P. Sirait, and R. Yunis, “JURNAL MEDIA INFORMATIKA BUDIDARMA Reduksi Atribut Pada Dataset Penyakit Jantung dan Klasifikasi Menggunakan Algoritma C5.0,” vol. 4, pp. 994–1006, 2020.

(19)

1

Referensi

Dokumen terkait

Gaya bahasa antiklimaks, adalah majas nonperbandingan yang dibentuk dengan meletakkan satuan bahasa yang maknanya paling penting, kemudian disusul satuan bahasa

Pada penelitian ini data penginderaan jauh yang digunakan yaitu Citra Quickbird tahun 2009 karena mampu menyajikan kenampakan obyek perkotaan dengan baik,

Ketua Program Studi Farmasi, Sekolah Tinggi Ilmu Kesehatan, Harapan Ibu,

Dalam menentukan lokasi penelitian, Singarimbun (1989:86) menyatakan bahwa cara yang terbaik ditempuh dengan jalan mempertimbangkan teori dalam melihat di lapangan untuk

Flowchart Start Input data dan nilai Santri Input kriteria Penjumlahan nilai perkriteria Pembobotan kriteria dengan AHP Perangkingan alternatif dengan VIKOR Santri yang layak

Pembayaran p iutang akan lebih cepat sehingga periode rata-rata pengumpu lan p iutang akan leb ih pendek , dengan dem ikian risiko kerugian p iutang tak tertagih

Kepemimpinan kepala sekolah merupakan kemampuan kepala sekolah dalam mempengaruhi perilaku guru dan siswa untuk mencapai tujuan sekolah (Idris, 2005). Kepala sekolah yang berhasil

Jika komunikasi yang kita bangun didasarkan pada hal – hal tersebut diatas maka kita dapat menjadi seorang komunikator yang handal dan pada gilirannya dapat membangun jaringan