• Tidak ada hasil yang ditemukan

Data mining

N/A
N/A
Protected

Academic year: 2023

Membagikan "Data mining"

Copied!
7
0
0

Teks penuh

(1)

1 BAB I

PENDAHULUAN 1.1 Latar Belakang

Mayoritas ulama sepakat bahwa dalam mempelajari ilmu agama khususnya hadits, membutuhkan suatu skala prioritas tentang mana urutan ilmu yang perlu dipelajari terlebih dahulu. Prioritas dalam memulai mempelajari ilmu agama adalah turunan dari yang pokok-pokok dan intinya terlebih dahulu yang terangkum dalam rukun islam (Bernheimer and Rippin, 2019), (Waryono Abdul Ghafur, 2018). Seperti yang dijelaskan dalam hadits qudsi berikut.

َشِب يِدْبَع ﱠيَلِإ َبﱠرَقَت اَم َو ﱠيَلِإ ُبﱠرَقَتَي يِدْبَع ُلازَي اَم َو ، ِهيَلَع ُتْضَرَتْفا اﱠمِم ﱠيَلِإ ﱠبَحَأ ٍءي

،ُهﱠب ِحُأ ىﱠتَح ِلِفا َوﱠنلاِب

Artinya : Dan tidaklah seorang hamba beribadah kepada-Ku; yang lebih aku cintai daripada apa-apa yang telah Aku wajibkan kepadanya. Hamba-Ku terus-menerus mendekat kepada-Ku dengan ibadah-ibadah sunnah hingga Aku pun mencintainya… [HR. Al-Bukhari 6502 Fathul Bari (11/348)]

Oleh karenanya dalam mempelajari hadits penting untuk mengetahui kategori hadits yang dipelajari. Sedangkan untuk mengetahui kategori ini, perlu untuk memahami isi hadits dari awal hingga akhir hadits, yang mana hal ini membutuhkan waktu yang lebih banyak dan setiap orang bisa memiliki tafsiran yang berbeda (Azmi, Al-Qabbany and Hussain, 2019), (Najiyah et al., 2017).

Memegang teguh dan mempelajari serta mengamalkan hadits dengan kategori tertentu yang telah dipastikan kebenaran dan keasliannya adalah sesuatu yang harus dilakukan oleh setiap muslim, kumpulan hadits yang telah dipastikan kebenaran dan keasliannya ini tergabung dalam kitab hadits Shahih Bukhari dan Shahih Muslim (Yahya, 2016).

Data mining merupakan proses menemukan pola yang terletak di dalam kumpulan data yang besar dengan menerapkan statistika maupun logika (Tan and Shi, 2016). Dengan kata lain dari kumpulan set data besar bisa dilatih sehingga dapat mengenali pola tertentu yang menghasilkan informasi yang berguna untuk untuk keputusan (Khairati and Putra, 2022). Salah satu teknik yang paling penting dari data mining adalah klasifikasi. Metode ini dapat dimanfaatkan untuk

(2)

2 mengkategorikan atau mengklasifikasikan data serta membuat model prediksi terhadap data (Abdelaal, Elemary and Youness, 2019). Data mining hanya dapat memproses data yang telah terstruktur, sedangkan teks merupakan salah satu contoh data yang tidak terstruktur (Faisal et al., 2022). Oleh karena itu dalam melakukan pengolahan pada data teks, perlu menambahkan proses-proses tambahan sebelum masuk ke dalam proses penambangan. Penambahan proses inilah yang membedakan text mining dengan data mining. Pada text mining dilakukan proses ekstraksi fitur untuk menjadikan teks menjadi data terstruktur hingga kemudian bisa diproses. Tujuan text mining sama dengan data mining yaitu menemukan pola pada data agar dapat dimanfaatkan manusia untuk membantu pekerjaannya, hanya saja text mining lebih berfokus kepada data yang berbentuk teks (Brahimi, Touahria and Tari, 2016).

Pemanfaatan text mining dalam melakukan penambangan pada teks telah banyak diterapkan di berbagai bidang seperti kesehatan, bisnis, ekonomi, sosial, tidak terkecuali pada bidang pendidikan, khususnya pendidikan hadits. Salah satu pemanfaatan text mining pada bidang ini adalah dengan klasifikasi hadits. Hadits merupakan sumber hukum agama Islam kedua setelah Al-Qur'an, di dalam hadits terdapat banyak bab yang membahas topik dan kategori tertentu sehingga akan menarik untuk dipadukan dengan teknik data mining khususnya text mining guna mengelompokkan hadits menjadi beberapa kelompok berdasarkan kondisi tertentu (Abu Bakar, Adiwijaya and Faraby, 2018).

Terkait makin banyaknya orang yang mengkaji kembali ilmu tentang Islam, sehingga penelitian mengenai autentifikasi dan klasifikasi hadits menjadi banyak fokus penelitian. Autentifikasi hadits mengacu pada penggolongan hadits menjadi shahih atau tidak shahih. Sedangkan Klasifikasi hadits lebih mengacu kepada pengelompokkan hadits kedalam kitab atau sub-bab berdasarkan kandungan matan (isi) hadits. Seperti yang dilakukan (Abdelaal and Youness, 2019), mengklasifikasikan hadits (dalam bahasa arab) dari kitab Shahih Bukhari ke dalam kategori yang berbeda, untuk memprediksi keasliannya menggunakan Decision Tree, dan Naïve Bayes untuk melihat hasil yang paling efektif. Hasilnya diperoleh Naïve Bayes mendapatkan nilai akurasi tertinggi, selain itu penggunaan

(3)

3 Cross Validation lebih baik dari pada metode presentasi split. Masih dari peneliti yang sama (Abdelaal, Elemary and Youness, 2019) mengklasifikasikan hadits dari kitab Shahih Bukhari ke dalam kategori tauhid, haji, zakat, shalat dan puasa.

Menggunakan tiga algoritma klasifikasi yaitu Decision Tree, Random Forest dan Naïve Bayes untuk melihat hasil yang paling efektif. Dengan menggunakan Information Gain dan Chi-Kuadrat sebagai feature selection serta biner dan TF- IDF sebagai term weighting. Hasilnya diperoleh Decision Tree mendapatkan nilai akurasi tertinggi, karena adanya feature selection yang menangani nilai-nilai hilang dalam proses. Hal yang sama juga dilakukan oleh (Hassaine, Safi and Jaoua, 2016) yang melakukan klasifikasi pada 1600 data hadits berdasarkan matannya untuk melihat keaslian hadits tersebut dengan memanfaatkan metode Logistic regression, Super Vector Machine dan Random Forest. Hasil penelitian menunjukkan bahwa akurasi klasifikasi meningkat dengan jumlah annotator yang menyetujui keaslian hadits dan metode yang dilakukan berhasl mengekstrak kata kunci yang relevan dalam mengelompokkan hadits. (Abu Bakar, Adiwijaya and Faraby, 2018) mengevaluasi kategori teks hadits menggunakan pengklasifikasi Random Forets pada 1650 hadits Shahih Bukhari yang dibagi berdasarkan kategori yang berbeda, dimana setiap kategori terdiri dari 550 hadits, kemudian dilakukan ekstraksi dengan TF-IDF. Hasilnya didapat bahwa Random Forest dapat mengatasi kelemahan Decision Tree dengan rasio 90% : 60% dengan bantuan Cross Validation.

Banyak penelitian yang telah dilakukan untuk menyelesaikan permasalahan klasifikasi hadits dalam bahasa arab, dan beberapa penelitian lain dilakukan pada hadits terjemahan dalam bahasa inggris. Namun sangat sedikit studi yang melakukan pengklasifikasian hadits dalam bahasa indonesia berdasarkan matan hadits (Azalia, Bijaksana and Huda, 2019). Maka dari itu saat ini dibutuhkan bantuan dalam proses pembelajaran hadits, yaitu untuk mengetahui dan mengelompokkan hadits berdasarkan matan seperti yang dilakukan oleh para ulama hadits dalam kitabnya, namun secara lebih simple dan otomatis dengan memanfaatkan sebuah “machine” yang dapat mengklasifikasikan sebuah hadits apakah termasuk ke dalam kategori iman, shalat, puasa, zakat atau haji.

(4)

4 Mengacu kepada penjelasan diatas, maka pada tugas akhir ini dilakukan penelitian dengan judul “Pembangunan Model Klasifikasi Hadits Berdasarkan Kandungan Matan dengan Menggunakan Text mining Metode Naïve Bayes pada Pembelajaran Hadits”. Metode Naïve Bayes dipilih karena Naïve Bayes Classifier memiliki akurasi yang lebih tinggi dibandingkan dengan klasifikasi lain dalam proses klasifikasi teks, (Xhemali, J. Hinde and G. Stone, 2015) (Abdelaal et al., 2019). Sebagai pembanding untuk memastikan apakah algoritma Naïve Bayes dapat menjadi yang terbaik dalam proses klasifikasi, dilakukan pemrosesan lain dengan menggunakan algoritma Decision Tree. Decision Tree dipilih karena dalam penelitian yang telah ada sebelumnya menunjukkan hasil yang hampir sama dengan Naïve Bayes dalam proses klasifikasi hadits(Abdelaal and Youness, 2019). Selain itu kelebihan penelitian ini dibandingkan dengan penelitian yang telah dilakukan sebelumnya adalah pertama, data hadits yang digunakan dalam penelitian ini menggunakan data hadits terjemahan bahasa Indonesia, dimana penelitian sebelumnya hanya menggunakan hadits dalam bahasa Arab dan terjemahan bahasa inggris. Kedua, data hadits yang digunakan sebagai sampel diambil dari 2 kitab hadits yang berbeda yaitu Shahih Bukhari dan Shahih Muslim.

Ketiga, belum ada penelitian yang memberikan solusi terhadap bias data pada data hadits sehingga dalam penelitian ini diberikan tambahan proses yaitu teknik sampling SMOTE unsampling untuk mengatasi permasalahan ini.

Proses pembangunan model awal dilakukan dengan bantuan tools Rapidminer, baru kemudian model yang telah didapatkan akan diimplementasikan pada sistem dengan menggunakan Google Colab dan Anvil App. Rapidminer dipilih dalam pembangunan model awal karena menyediakan berbagai teknik deskriptif dan prediksi dengan menggunakan algoritma yang telah disediakan pada tools dan extension (Putra, Putra and Kurniawan, 2018).

1.2 Rumusan Masalah

Berdasarkan latar belakang masalah yang telah diuraikan, maka rumusan masalah yang dapat dipaparkan dalam tulisan ini ialah Bagaimana membangun sebuah model klasifikasi Hadits berdasarkan Kandungan Matan dengan

(5)

5 menggunakan Text mining Metode Naïve Bayes untuk membantu dalam Pembelajaran Hadits.

1.3 Batasan Masalah

Berdasarkan rumusan masalah tersebut, maka batasan masalah pada penelitian ini ialah sebagai berikut:

1. Klasifikasi terbatas hanya berdasarkan kandungan matan hadits.

2. Hadits yang diklasifikasikan menjadi 5 kategori hadits yaitu hadits dengan kategori iman, shalat, puasa, zakat dan haji sesuai dengan rukun Islam.

3. Pada penelitian ini digunakan data hadits terjemahan dalam bahasa Indonesia.

Dataset yang digunakan adalah data teks hadits yang dikumpulkan dari dua kitab shahih yang paling paling dipercaya yaitu kitab Shahih Bukhari dan Shahih Muslim.

4. Dalam proses pembangunan model digunakan bantuan tools RapidMiner 9.10.011 untuk menyiapkan data yang akan diolah dengan menggunakan algoritma Naïve Bayes dan algoritma Decision Tree yang digunakan sebagai pembanding.

5. Implementasi sistem dibangun berbasis web dengan menggunakan bahasa pemrograman python dan anvil app

1.4 Tujuan Penelitian

Tujuan penelitian ini adalah membangun sebuah model classifier yang dapat mengklasifikasikan dan membedakan topik hadits terjemahan bahasa Indonesia ke dalam kategori yang berbeda berdasarkan kandungan matan, serta juga untuk memprediksi topiknya, ke dalam iman, shalat, puasa, zakat dan haji dengan menggunakan text mining dan teknik machine learning. Objektif kajian ini adalah sebagai berikut:

1. Menerapkan text mining untuk mengklasifikasikan hadits terjemahan bahasa Indonesia ke dalam kategori yang berbeda berdasarkan kandungan matan hadits tersebut.

2. Mengaplikasikan dan menguji akurasi dan hasil performasi dari pengaplikasian algoritma Naïve Bayes dimana digunakan algoritma Decision Tree sebagai pembanding hasil akurasi dalam mengindentifikasi topik hadits.

(6)

6 3. Membuat rancangan sistem yang dapat membantu membedakan hadits terjemahan bahasa Indonesia berdasarkan matan (kandungan isi hadits), agar dapat memudahkan dalam mencari ilmu dan pengetahuan bagi pelajar secara khusus dan umat islam secara umumnya.

1.5 Manfaat Penelitian

Dengan selesainya penelitian ini, diperoleh sebuah model dan rancangan aplikasi berbasis web yang dapat mengklasifikasikan hadits ke dalam kategori- kategori yang sesuai dengan rukun Islam. Secara umum Manfaat penelitian ini adalah sebagai berikut :

1. Memberikan tambahan ilmu dan wawasan bagi penulis mengenai aplikasi dari metode Naïve Bayes untuk melakukan klasifikasi terhadap suatu kasus atau objek dan klasikasi hadits terjemahan bahasa Indonesia berdasarkan matan .

2. Dapat digunakan oleh umat secara umum dan terkhusus para pelajar yang belum paham dan masih awam mengenai klasifikasi hadits yang benar, dan membantu dalam proses pembelajaran prioritas ilmu yang harusnya dipelajari oleh seorang muslim menurut pendapat para Ulama pada umumnya

1.6 Sistematika Penulisan

Berikut Sistematika penulisan proposal Tugas Akhir ini:

1. BAB I PENDAHULUAN

Bab ini membahas tentang latar belakang yang memunculkan suatu permasalahan yang akan dirangkum pada rumusan masalah, batasan masalah, tujuan dan sistemastika penulisan laporan tugas akhir.

2. BAB II LANDASAN TEORI

Bab ini berisikan teori-teori pendukung dan informasi yang digunakan dan berhubungan dalam proses penelitian.

3. BAB III METODOLOGI PENELITIAN

Bab ini akan memaparkan metode-metode terkait penelitian yang penulis gunakan selama proses pembuatan tugas akhir.

4. BAB IV ANALISIS DAN IMPLEMENTASI

(7)

7 Bab ini membahas tentang analisis hasil dan implementasi yang terdiri dari sumber data, proses implementasi, dan pengujian.

5. BAB V PENUTUP

Bab ini memuat kesimpulan penelitian dan saran yang bisa digunakan oleh peneliti lain yang akan menjadikan penelitian ini sebagai referensi.

Referensi

Dokumen terkait

RSOH Regenerator Section overhead SO口内に規定されている再生中継器が処理する領域。 RST Regenerator Section

Dalam membuat suatu sistem pendukung keputusan untuk menentukan kelayakan calon penerima bantuan rumah sederhana layak huni dengan menggunakan metode Simple

Kompetensi pedagogik guru model di SMA 11 Banda Aceh pada penelitian dengan indikator: (1) menguasai karakter peserta didik secara mendalam, (2) menguasai teori

Dengan dibuatnya sebuah Sistem Informasi berbasis Web untuk mengenalkan produk-produk unggulan yang telah dihasilkan oleh UMKM di Kota semarang, diharapkan masyarakat

Perbandingan antar kelompok perlakuan sendiri yang menghasilkan perbedaan bermakna hanya antara kelompok K-P1, K-P2, K-P3, K-P4, P1-P2, P1- P3, P1-P4, P2-P3, P2-P4

konflik-konflik dalam tim kerja dengan baik, jelasnya peranan masing-masing karyawan dalam tim, akan berdampak positif pada peningkatan nilai komitmen karyawan

Peristiwa kedua adalah opini rakyat Prancis terhadap konstitusi Eropa yang membagi mereka ke dalam 2 (dua) kelompok, seperti terlihat dari hasil referendum tahun

Pem- buatan Sampel paving block terdiri dari 2 tahap yaitu tahap pertama pembuatan sampel untuk menentukan kuat tekan optimum dengan variasi campuran A (10% semen 5% abu sekam