Jln. Khatib Sulaiman Dalam, No. 1, Padang, Indonesia, Telp. (0751) 7056199, 7058325 Website: ijcs.stmikindonesia.ac.id | E-mail: [email protected]
Sistem Prediksi Kelulusan Santri Tahfidz Qur’an Menggunakan Algoritma C4.5 Sriani1, Juraidah2
[email protected], [email protected]
Fakultas Sains dan Teknologi Universitas Islam Negeri Sumatera Utara Informasi Artikel Abstrak
Diterima : 1 Ags 2023 Direview : 8 Ags 2023 Disetujui : 29 Ags 2023
Yayasan Tahfidz Qur’an merupakan lembaga pendidikan penghafal Al- Qur’an yang setiap tahun kuota santri semakin bertambah. Namun, tidaklsemua santri dapat lulus tepat waktu sesuai masaabelajar yang ditempuhhsehingga mengakibatkannpenumpukkan santri yang tidakllulus sesuai masapperiodelkelulusanya. Penentuan kelulusan santri berdasarkan beberapa kriteria yang harus dilalui oleh santri selama menempuh pembelajaran dilYayasan Tahfidz Qur’an. Oleh karena itu, perlu dilakukan penelitian menggunakannteknik klasifikasi yanggdapat mengolahhdata dalam jumlahhbesar untuk menemukanppola yang terjadilpada dataasantri. Pengolahanndata tersebut digunakan untuk memprediksikkelas yang belumddiketahui yaitu prediksikkelulusan santri.
Teknikkklasifikasi yanggdigunakan adalah decisionttreeedengan penerapanaalgoritmaaC4.5. Inputannyang digunakannberupa data santri yanggmeliputi dari prestasi, kedisiplinan, hapalan dan lafadz. Data santri yang digunakan adalah data sampelttraining yang sudah lulus pada tahun 2019 dengan jumlah data 170. Dimana berdasarkan hasil pengolahan, didapati 114 data santri lulus dan 56 tidak lulus.
Kata Kunci
Prediksi, Santri, Decision Tree, C4.5
Keywords Abstrak
Prediction, Santri,
DecisionTree, C4.5 The Tahfidz Qur'an Foundation is an educational institution for memorizing the Al-Qur'an where every year the quota of students is increasing. However, notaall students canggraduate onntime accordingtto the study perioddtaken, resultinglin a buildupoof studentsswho doinot graduate according to their graduation period. Students' age learning is based on several criteria that must be passed by students while studying at theeTahfidz Qur'anlFoundation.
Therefore, it is necessary tolconducttresearch usingcclassification techniquessthat canlprocess largeaamounts of data to finddpatterns thattoccur in thesstudents' data. Processing the data is used to predict classessthat are nottyetkknown, namelyppredictions offstudent graduation. The classificationntechnique used is a decisionttree with the application of the C4.5aalgorithm. The input used is in the form of student data which includes achievement, discipline, memorization and pronunciation. The student dataaused isstrainingssample data that has passed in 2019 withha total of 170 data. Basedlon the processingrresults, 114 students passed and 56 did not pass.
A. Pendahuluan
Yayasan Tahfidz Qur’an adalah lembaga pendidikan penghafal al-Qur’an.
Penentuan kelulusan santrildidasarkan kepadasseberapa baik hafalan yang dimilikilsantri selama menempuhhpembelajaran didYayasan Tahfidz Qur’an.
Tingginyattingkat persaingan di dunianpendidikan membuat setiappindividu maupun yayasantterus mengembangkankkompetensi bakattdan kemampuanya.
Menurutn[1] Pendidikannyang terencana, terarahhdan berkesinambungan mampuumembantu santri-santriuuntuk mengembangkan kemampuannya secaraaoptimal, baikaaspek kognitif, aspekjafektif, maupun aspek psikomotik. Oleh sebab itu, pentingnya kemampuan santri menjadittolak ukur keberhasilanssantrinituusendiri. Namun, tingkat keberhasilannsantrinmenjadi menurun, ketikaasantriltidak mampuululus tepat padaawaktunya.
Hal ini mendasari untuk membuat suatu penelitian berupa “Sistem Prediksi Kelulusan Santri Tahfidz Qur’an menggunakan Algoritma C4.5” yang diharapkan nantinya dapat memudahkan dalam mencari informasi yang digunakan untuk memprediksi kelulusan siswa tepat waktu. Penelitian ini menggunakan beberapa kriteria yang telah ditentukan seperti Hafalan, Tajwid, Akhlak, Makharijul Huruf, Kemampuan Bahasa Arab sebagai faktor penilaian maka dengan sistem ini dapat membantu pihak yayasan agar lebih mudah dan menghasilkan nilai yang tepat dan akurat karena selama ini sering terjadi kesalahan dalam prediksi kelulusan santri.
Penerapan AlgoritmaaC4.5 merupakan cabang dalam dataamining [2]. Data mininggmerupakan prosesgpenggalianddata dari tumpukanndatabase yang berukurannbesar digunakannuntuk menemukannknowledge berupaainformasi pentinggdan bermanfaatt[3]. Datanmining dapat diartikan sebagaikekstraksi informasikatau polalyang pentingatauumenarik dari dataayang ada padaadatabase yanggbesar [4]. MelaluiaalgoritmaaC4.5 dengan metodeeDecision Tree (Pohon Keputusan) dapattmemberikan informasiiatau pengetahuannberupa rule yang mudahhdipahami masyarakattkarena digambarkanndengan pohonnkeputusanl[5].
Decisionttree adalah salahssatu metode yangndigunakan untuk pengklasifikasianndan prediksiikarena memilikiikemudahan dalamninterpretasi hasil [6]. Decisionjtree juga disebuttsebagai diagram alirryang berbentuksseperti strukturrpohon yang manassetiap internal nodeemenyatakan pengujiansterhadap suatuaatribut, setiap cabanggmenyatakan outputtdari pengujian tersebuttnode daun (leaffnode) menyatakan distribusi kelas. Node yang paling atas disebut sebagai node akar (rootnnode) [7]. DecissionnTree digunakan untuk mengklasifikasikannsuatu sampelldata yang belum diketahuikkelasnya kedalam kelas-kelasyyang sudahaada. Jalur pengujian data adalah pertama semua data harus melalui roottnodeedan terakhir adalah melaluiuleaffnodeeyang akan menyimpulkannprediksi kelassbagi dataatersebut. Atributddata harus berupadata kategori, bila kontinuumaka atributtharus didiskretisasiiterlebihhdahulu [8].
AlgoritmaaC4.55merupakan pengembangan darieID3 [5]. Beberapa pengembangannyang dilakukankC4.5 adalahhbisa mengatasismissinggvalue, continueedata danppruning. Algoritma C4.5nmempunyai inputbberupaatraining samplessdannsamples, traininggsamples berupaldataacontoh yang akanndigunakan untuk membanguncsebuah treeeyang telah diujikkebenarannya, sedangkan samplessmerupakan field-fieldddata yang nantinya akannkita gunakannsebagai parameterndalam melakukanjklasifikasiddata [9]. Untukkmelakukan analisis
algoritmalC4.5 untukkmemprediksi kelulusannsantri tahfidzzqur’an menggunakan metodeedecision treeedengan penerapanaalgoritmalC4.5. Hasil analisissdan implementasinnantinya akanndiperoleh keputusannyang tepat dan akurattdalam memprediksikkelulusan padaatahfidz qur’an berdasarkannanalisis algoritmalC4.5 yaitu tahfidz qur’an yang lulus “tepatnwaktu” dan “tidakktepatlwaktu”. Secara umum untuk membangun pohon keputusan AlgoritmalC4.5 dapat dilakukan seperti memilih atribut yang ingin dijadikan akar, kemudian membuat cabang untuk setiap nilai, setelah itu bagi kasus dalam setiap cabang, lalu ulangi proses untuk setiap cabang sampai semua kasus pada cabang memiliki kelas yang sama [10]. Untuk memilihhatribut sebagaiiakar, didasarkanppada nilai informationggain tertinggildari atribut-atributtyang ada. Untuk menghitungginformation gainnharus mencarinnilai entropyyterlebih dahulu. Adapun rumus entropy dan information gain seperti berikut [11]:
𝑬𝒏𝒕𝒓𝒐𝒑𝒚(𝑺) = , − 𝒑𝒊
𝒏
𝒊#𝟏
∗ 𝐥𝐨𝐠𝟐 𝒑𝒊
𝑮𝒂𝒊𝒏(𝑺, 𝑨) = 𝑬𝒏𝒕𝒓𝒐𝒑𝒊(𝑺) − ,& −
'#(
|𝑺𝒊 |
|𝑺|∗ 𝑬𝒏𝒕𝒓𝒐𝒑𝒊 (𝑺𝒊 ) Keterangan:
S : Himpunannkasus n : Jumlahhpartisi S
Pi : Proporsi dari Siiterhadap S A : Atribut
n : Jumlahlpartisi atriuttA
|Si| : Jumlahjkasus pada partisi ke-i
|S| : Jumlahlkasus dalamlS B. Metode Penelitian
Dataset yang digunakan berupa data santri Yayasan Tahfidz Qur’an tahun 2019 sebanyak 170 data yang terdiri dari data santri lulus sebanyak 114 data dan data santri tidakklulus sebanyak 56 data. Dimana atribut yang digunakan yaitu atribut makhhorijul huruf, kedisiplinan, hapalan, dan lafadz. Kelas prediksi yang digunakan yaitu kelas Lulus dan Tidak Lulus. Adapun tahapanlyang dilakukan dalamnpenelitiannini sepertibgambar 1 berikut:
Gambar 1. Tahapan prediksi algoritma C4.5
Pada persiapan awal ditentukan atribut yang digunakan kemudian melakukan uji atribut dengan mencari nilai Gain tertinggi berdasarkan perhitungan entropy dari masing-masing atribut. Apabila ditemukan gain tertinggi maka gain tersebut akan menjadi root awal. Selanjutnya dilakukan penentuan cabang dengan cara yang sama dengan melihat gain tertinggi dari tiap hasil partisi.
C. Hasil dan Pembahasan
Prosessyang dilalui padaapenelitian inilyaitu mencari nilai entropy total atau keseluruhan terlebih dahulu, kemudian mencari nilaieentropy setiappatribut.
Setelahhnilaiientropyytelah didapatkan maka tahap berikutnya yaitu mencari nilai gain setiap atribut, tahap ini terus dilakukan berulang kali sampai semua atribut dilakukan atau dengan membentuk beberapa node pohonnkeputusan. Dimana hasil perhitungan dapattdilihat padaatabel 1ldan tabel 2aberikut:
Tabel 1. Perhitungan node 1
Node Jumlah
Kasus (S)
Lulus Tidak
Lulus Entropy Gain
1 Total 170 104 66 0,964
Makhorijul
huruf 0,710
Tinggi 83 83 0 0
Sedang 23 23 0 0
Rendah 64 8 56 0,543
Kedisiplinan 0,068
Node Jumlah
Kasus (S)
Lulus Tidak
Lulus Entropy Gain Disiplin 163 114 49 0,882
Kurang Disiplin
7 0 7 0
Hafalan 0,523
Banyak 74 74 0 0
Cukup 68 40 28 0,977
Sedikit 28 0 28 0
Lafadz 0,234
Mampu 123 103 20 0,785
Kurang
Mampu 47 11 36 0,234
Berdasarkan perhitungannpada tabel 1ldapat diketahui bahwalatribut dengan Gainntertinggi adalah Makhorijul huruf denganlnilai 0.710, sehingga atribut Makhorijul huruffdapat menjadinNodelAkar. Padaaatribut yanggdijadikan akarrterdapat 3nnilaiiyaitu “Tinggi”, “Sedang”, dan “Rendah”. Dariinilaiaatribut tersebut, nilai “Tinggi” mempunyaihHasil = “Lulus” sehingga tidakkperluldilakukan perhitunganlkembali. Untukknilai “Sedang” mempunyailHasil = “Lulus”. Sedangkan nilai “Rendah” mempunyailHasil = “Lulus” dan “TidaklLulus” sehinggaluntukknilai
“Rendah” perlu dilakukannperhitungankkembali.
Tabel 2. Perhitungan node 1.1
Node Jumlah
Kasus (S) Lulus Tidak
Lulus Entropy Gain
1 Total 64 8 56 0,543
Kedisiplinan 0,022
Disiplin 57 8 49 0.585
Kurang
Disiplin 7 0 7 0
Hafalan 0,113
Cukup 36 8 28 0,764
Sedikit 28 0 28 0
Lafadz 0,006
Mampu 24 4 20 0,650
Kurang
Mampu 40 4 36 0,469
Pada perhitungannpada tabel 2ldapatldiketahui bahwa atribut denganlGain tertinggiladalah Hafalan denganlnilai 0.113, sehinggaaatribut Hafalan dapat menjadilNodeaAkar berikutnya. Padalatribut yang dijadikanaakar terdapat 2anilai yaitu “Cukup” dan “Sedikit”. Darilnilai artibutttersebut, nilai “Sedikit” mempunyai Hasil = “TidaklLulus” sehinggaltidak perlu dilakukannperhitungankkembali.
Sedangkannnilai "Cukup" mempunyailHasil = "Lulus" dan " TidakkLulus" sehingga untuk nilai "Cukup" perlu dilakukan perhitungan kembali. Akan tetapi tersisa 2 atribut dimana pada atribut Kedisiplinan memiliki hasil nilai Disiplin keseluruhan
“Lulus” dan Kurang Disiplin keseeuruhan “TidakkLulus”, maka Nodeaakar selanjutnya adalah atribut Kedisiplinan yang dilanjutkan dengan Nodeaakar terakhir Lafadz. Adapun gambar pohonkkeputusan keseluruhanhhasilldapat dilihat padaggambar 2aberikut:
Gambar 2. Pohon keputusan hasil node 1.1
Berdasarkanndari pohonkkeputusan padaggambar 2amaka didapatkan rule kelayakan santri lulus dan tidak lulusssebagaiiberikut:
1. JikaaMakhorijul huruf = “Tinggi” makalHasil = “Lulus”.
2. JikaaMakhorijul huruf = “Sedang” maka Hasil = “Lulus”.
3. JikaaMakhorijul huruf = “Rendah” dan Hapalan = “Sedikit” maka Hasil=
“Tidak.Lulus”.
4. JikaaMakhorijul huruf = “Rendah” dan Hapalan = “Cukup” dan Kedisiplinan =
“KuranglDisiplin” maka Hasil= “TidakkLulus”.
5. Jika Makhorijul huruf = “Rendah” dan Hapalan = “Cukup” dan Kedisiplinan =
“Disiplin” dan Lafadz = “Mampu” maka Hasil=” Lulus”.
6. Jika Makhorijul huruf = “Rendah” dan Hapalan = “Cukup” dan Kedisiplinan =
“Disiplin” dan Lafadz = “Kurang.Mampu” maka Hasil= “Tidak.Lulus”.
D. Simpulan
Berdasarkan hasil dari pembahasan tentang prediksi kelulusan santri tahfidz Qur’an menggunakan algoritma C4.5 dapat disimpulkan bahwa dari 170 data santri terdapat 114 data santri yang lulus dengan tepat waktu dengan kriteria memiliki makhorijul huruf tinggi, hafalan cukup, disiplinan dan lafadz mampu. Dari jumlah keseluruhan data santri terdapat 56 santri yang tidak lulus dikarenakan tidak memiliki kriteria lulus seperti santri-santri lainnya.
E. Ucapan Terima Kasih
Terima kasihhkepada seluruhssivitas akademik FakultaslSains dan Teknologi UniversitaslIslam Negeri Sumatera UtaralMedan atas dukungan dan partisipasinya.
F. Referensi
[1] Winarto and N. Nurbaiti, “Hubungan Kemampuan Kognitif Dan Kemampuan Psikomotorik Ditinjau Dari-Keterampilan Proses IPA Siswa Kelas IV Sekolah Dasar Di Kecamatan Bumiayu,” J. Dialekta, vol. 10, no. 2, pp. 496–505, 2020.
[2] R. Haqmanullah Pambudi, B. Darma Setiawan, and Indriati, “Penerapan Algoritma C4.5 Untuk Memprediksi Nilai Kelulusan Siswa Sekolah Menengah Berdasarkan Faktor Eksternal,” J. Pengemb. Teknol. Inf. dan Ilmu Komput., vol. 2, no. 7, pp.
2637–2643, 2018, [Online]. Available: http://j-ptiik.ub.ac.id
[3] D. Fitrianah, S. Dwiasnati, H. H. H, and K. A. Baihaqi, “PenerapannMetode Machine-Learning untuk Prediksi Nasabah Potensial menggunakan Algoritma Klasifikasi Naïve Bayes,” Fakt. Exacta, vol. 14, no. 2, p. 92, 2021, doi:
10.30998/faktorexacta.v14i2.9297.
[4] K. S. S. M. I. Sri Wahyuni, “Implementasi Rapidminer Dalam Menganalisa Data Mahasiswa Drop Out,” vol. 10, no. 2, pp. 2013–2016, 2017.
[5] P. B. N. Setio, D. R. S. Saputro, and BowoWinarno, “Klasifikasi Dengan-Pohon Keputusan-Berbasis Algoritme C4.5,” Prism. Pros. Semin. Nas. Mat., vol. 3, pp.
64–71, 2020.
[6] Rismayanti, “Decision Treee Penentuan-Masa Studi Mahasiswa-Prodi-Teknik Informatika (Studi Kasus : Fakultas Teknik dan Komputer Universitas Harapan
Medan ),” J. Sist. Inf., vol. 02, no. 01, pp. 16–24, 2018.
[7] E. Aditya, R. Siregar, S. Rahmad, and U. P. Utama, “Penentuan/Kriteria-Calon PenerimaaBeasiswa Dengan Algoritma C4.5 ( Studi Kasus : Universitas Potensi Utama ),” vol. 5, no. 2, pp. 152–160, 2021.
[8] P. Kasih, “Innovation innResearch of Informatics ( INNOVATICS ) Pemodelan Data MininggDecision Tree Dengan Classification ErrorrUntuk Seleksi Calon Anggota Tim Paduan Suara,” vol. 2, pp. 63–69, 2019.
[9] R. Rismayanti, “Implementasi Algoritma C4.5 Untuk Menentukan Penerima Beasiswa Di Stt Harapan Medan,” J. Media Infotama, vol. 12, no. 2, pp. 116–120, 2017, doi: 10.37676/jmi.v12i2.413.
[10] A. Khumaidi, “Klasifikasi Data Prospektus Lokasi Waralaba dengan Algoritma C4.5,” Paradigma, vol. 13, no. 2, pp. 135–146, 2011.
[11] M. A. Tanjung, P. P, and H. Qurniawan, “AnalisaaKelayakan PenerimaaProgram Keluarga Harapan (PKH) Menggunakan AlgoritmaaC4.5,” Jurasik (Jurnal Ris.
Sist. Inf. dan Tek. Inform., vol. 6, no. 1, p. 217, 2021, doi:
10.30645/jurasik.v6i1.286.