• Tidak ada hasil yang ditemukan

Penerapan Data Mining Untuk Memprediksi Prestasi Siswa Menggunakan Algoritma J48

N/A
N/A
Protected

Academic year: 2021

Membagikan "Penerapan Data Mining Untuk Memprediksi Prestasi Siswa Menggunakan Algoritma J48"

Copied!
8
0
0

Teks penuh

(1)

Available online at: http://bit.ly/sisfotekjar

Jurnal Sistem Informasi dan Teknologi Jaringan

(SISFOTEKJAR)

20

Penerapan Data Mining Untuk Memprediksi Prestasi Siswa Menggunakan Algoritma J48

Agnes Permatasari Barus 1, Nurwindi Sapitri 2

1,2Program Studi Teknik Informatika, STMIK Pelita Nusanatara, Jl. Iskandar Muda, Medan, 20154, Indonesia 1[email protected], 2[email protected]

ARTICLE INFORMATION ABSTRAK

Received: January 15, 2020 Revised: February 10, 2020 Available online: March 02, 2020

Riset ini bertujuan buat membuat prediksi prestasi belajar siswa bersumber pada status sosial ekonomi orang tua, motivasi, ketertiban siswa serta prestasi masa lampau memakai tata cara informasi mining dengan algoritma J48. Selaku perbandingan, informasi riset dianalisis pula dengan CHAID (Chi Squared Automatic Interaction Detection) serta regresi ganda. Pendekatan riset yang digunakan merupakan kuantitatif. Subyek riset ini merupakan siswa tingkatan X Sekolah Menengah Kejuruan (SMK) Negeri 1 Perbaungan berjumlah 812 siswa. Metode pengumpulan data yang digunakan yaitu dokumentasi serta angket. Hasil riset menampilkan jika analisis prediksi memakai decision tree algoritma J48 mempunyai akurasi sebesar 95, 8%, sebaliknya analisis prediksi memakai CHAID mempunyai tingat akurasi 82, 3% serta analisis regresi ganda menciptakan tingkatan signifikansi sebesar 90, 8%. Bersumber pada hasil tersebut dapat disimpulkan kalau tata cara J48 lebih baik dibanding dengan tata cara CHAID serta regresi ganda.

KEYWORDS

Data Mining, j48, Prediksi

CORRESPONDENCE

Phone: 081262444734

E-mail: [email protected]

1. PENDAHULUAN

Pendidikan ialah salah satu aspek kemajuan serta kemandirian bangsa. Bertambah maju pembelajaran sesuatu bangsa, hingga hendak terus menjadi maju serta mandiri bangsa tersebut. Lewat pembelajaran para generasi penerus bangsa dibangun kualitasnya.

Pendidikan nasional berperan meningkatkan

keahlian serta membentuk sifat dan peradaban

bangsa yang bermartabat dalam rangka

mencerdaskan kehidupan bangsa, bertujuan buat mengembangkan kemampuan partisipan didik supaya jadi manusia yang beriman serta bertakwa kepada Tuhan Yang Maha Esa, berakhlaq mulia, sehat, berilmu, cakap, kreatif, mandiri serta jadi masyarakat negeri yang demokratis dan bertanggung jawab (Depdiknas, 2003, p. 4). Menurut tujuan pendidikan tersebut hingga mutu serta manajemen

pendidikan di sekolah ataupun lembaga pembelajaran butuh ditingkatkan. Salah satu penanda mutu serta manajemen sekolah ataupun lembaga pembelajaran bisa dilihat dari prestasi belajar siswa. Sekolah Menengah Kejuruan( Sekolah Menengah Kejuruan (SMK)) ialah salah satu lembaga pembelajaran yang berupaya menghasilkan sumber energi manusia yang

mempunyai keahlian, keterampilan, serta

kemampuan sehingga lulusannya bisa meningkatkan keterampilannya supaya bisa terjun dalam dunia kerja ataupun buat melanjutkan ke jenjang pembelajaran yang lebih besar. Bagi Peraturan Pemerintah Nomor. 29 Tahun 1990 pasal 2 ayat( 1) mengatakan bahwa sekolah kejuruan bertujuan buat

meningkatkan pengetahuan siswa dalam

pengembangan diri serta buat tingkatkan keahlian siswa selaku anggota penduduk. Berdasarkan Peraturan Pemerintah Nomor. 29 Tahun 1990 pasal 3 ayat( 2) disebutkan jika sekolah kejuruan bertujuan

(2)

buat mempersiapkan siswa dalam penuhi lapangan kerja, mempersiapkan siswa supaya sanggup mempunyai karir, serta mempersiapkan tamatan supaya jadi masyarakat negeri yang produktif, adaptif, serta normatif.

Secara garis besar tujuan diselenggarakan sekolah kejuruan merupakan buat membekali lu- lusan dengan kompetensi yang bermanfaat untuk diri sendiri dalam karir serta kehidupan berma- syarakat. Tujuan sekolah menengah kejuruan hendak lebih terencana bila kurikulum yang digu- nakan pas serta dilaksanakan dengan baik.

Usaha buat menaikkan mutu lulusan Sekolah Menengah Kejuruan(SMK), diperlukan kerjasama serta sink- ronisasi yang baik antara pemerintah, manaje- men sekolah, kemitraan dengan dunia industri, kompetensi guru, orang tua serta siswa

sendiri. Sebagian elemen tersebut sangat

mempengaruhi baik secara langsung ataupun tidak langsung terhadap kenaikan kualitas siswa, yang pada kesimpulannya hendak berefek pada kenaikan mutu pembelajaran. Prestasi belajar siswa di hasut oleh banyak aspek. Salah satu aspek berarti dalam

pembelajaran supaya prestasi belajar siswa

bertambah merupakan manajemen pembe- lajaran di sekolah. Terus menjadi baik manajemen pendidikan yang ditawarkan sekolah kepa- da siswa terus menjadi besar pula kemungkinanan prestasi belajar siswa hendak baik. Satu kasus yang sering timbul di golongan partisipan didik Sekolah Menengah Kejuruan(SMK) merupakan masih banyak yang mementingkan kompetensi mata pelajaran produktif daripada mata pelajaran adaptif serta normatif. Banyak partisipan didik Sekolah Menengah Kejuruan(SMK) yang piawai menciptakan karya cocok dengan kompetensi kejuruannya namun mereka lemah dalam mata pelajaran adaptif serta nor- matif. Contohnya merupakan banyak partisipan didik jurusan Tata Busana sanggup membuat serta mendesain busana yang bagus tetapi ia lemah pada mata pelajaran Matematika yang jadi salah satu ketentuan kelulusannya. Oleh sebab itu, sangat dibutuhkan atensi oleh satuan pembelajaran buat sanggup menyelenggarakan pendidikan yang dapat menanggulangi permasalahan tersebut.

Menyadari berartinya mutu pembela- jaran dalam rangka mencerdaskan kehidupan bangsa, hingga pemerintah bersama golongan swasta bersama sudah serta terus berupaya mewujudkan amanat tersebut lewat bermacam usaha pembangunan pembelajaran

yang lebih berkualitas antara lain melalui

pengembangan dan perbaikan kurikulum serta sistem

evaluasi, perbaikan sarana pembelajaran,

pengembangan lalu pengadaan materi ajar, serta pelatihan bagi guru dan tenaga kependidikan lainnya. Namun pada realitasnya upaya pemerintah tersebut

pembelajaran. (Umaedi, 2001, p.3). Proses belajar

mengajar ialah salah satu faktor penentu

keberhasilan pembelajaran di sekolah. Rendahnya kualitas pembelajaran ialah akibat dari rendahnya mutu proses pendidikan yang dicoba di sekolah.

Satu perihal yang belum banyak dicoba oleh lembaga-lembaga pembelajaran ataupun sekolah kejuruan merupakan melaksanakan prediksi terhadap partisipan didik yang berpotensi hadapi hambatan ataupun kurang berprestasi dalam belajarnya. Perihal ini dikira berarti sebab sekian dini lembaga-lembaga pembelajaran ataupun sekolah kejuruan mengenali terdapatnya kemampuan siswa yang mungkin hendak hadapi hambatan dalam belajarnya, hingga lembaga-lembaga pembelajaran ataupun sekolah dapat melakukan langkah- langkah antisipatif.

Akibat dari minimnya prediksi ataupun penangkalan semenjak dini terhadap siswa ataupun calon siswa yang berpotensi hadapi kendala dalam belajarnya ataupun kurang berprestasi merupakan kenyataan masih banyak siswa yang tidak naik kelas sebab terhambat prestasinya justru terdapat yang dikeluarkan dari sekolah. Kedua perihal tersebut kerap kita dengar serta tentu dirasai oleh seluruh sekolah. Bersumber pada penjelasan di atas, hingga riset ini bertujuan buat membuat prediksi mulai dini terhadap siswa yang berpotensi tidak berprestasi ataupun hadapi hambatan dalam belajarnya, sehingga bisa dicoba langkah-langkah antisipatif dari sekolah buat menjauhkan diri dari mungkin tidak naik kelas apalagi dikeluarkannya siswa dari sekolah. Langkah yang dapat diambil sekolah

sehabis mengenali terdapatnya siswa yang

berpotensi tidak berprestasi merupakan dengan melaksanakan pendampingan spesial terhadap siswa tersebut.

Harapan kesimpulannya merupakan seluruh siswa dari bermacam latar balik aspek tiap-tiap bisa optimal dalam prestasi belajar siswanya.

Sebagian aspek yang pengaruhi prestasi belajar siswa Sekolah Menengah Kejuruan antara lain sosial ekonomi orang tua, sarana belajar sekolah, motivasi, ketertiban siswa serta prestasi masa kemudian siswa. Perihal tersebut dibuktikan dengan banyaknya riset yang sudah dicoba tadinya.

Aspek status sosial ekonomi orang tua yang mewujudkan pada keahlian finansial nya. Keahlian finansial yang berbeda-beda sedikit banyak hendak mempengaruhi terhadap prestasi belajar siswa. Dengan keahlian finansial orang tua, pastinya hendak mengetahui sarana belajar yang disediakan oleh orang tua terhadap fasilitas serta prasarana yang diperlukan oleh seseorang siswa buat menambah prestasi belajarnya.

(3)

22

Bersumber pada Undang-Undang Sistem Pendidikan Nasional Nomor. 20 Tahun 2003 Bab III

Pasal 45 tentang fasilitas serta prasarana

pembeljaran, dinyatakan kalau(1) tiap satuan pembeljaran resmi ataupun non resmi meyediakan fasilitas serta prasarana yang penuhi keperluan pembelajaran cocok dengan perkembangan serta pertumbuhan secara raga, kecerdasan intelektual sosial, emosional, serta kejiwaan partisipan didik;(2) syarat menimpa penyediaan fasilitas serta prasarana pembelajaran pada seluruh satuan pembelajaran sebagaimana diartikan pada ayat(1) diatur lebih lanjut dengan peraturan pemerintah. Dari kedua ayat di atas dimaksudkan supaya masing-masing sekolah sediakan fasilitas serta prasarana pendidikan yang mencukupi seluruh

keperluan pembelajaran supaya siswa bisa

memanfaatkannya selaku penunjang belajar siswa. Tulus( 2004, pp. 81- 83) mengatakan kalau fasilitas belajar umumnya jadi penunjang prestasi belajar, tetapi demikian apabila kelengkapan sarana belajar selaku fasilitas penunjang belajar di sekolah mencukupi, sebaliknya bisa jadi aspek penghambat apabila kelengkapan sarana belajar di sekolah kurang mencukupi.

Sekolah Menengah Kejuruan sebaiknya sediakan fasilitas serta prasarana cocok dengan kebutuhan serta pertumbuhan siswa supaya bisa meningkatkan, meningkatkan dirinya cocok dengan bakat serta keahlian selaku manusia seutuhnya. Dengan terdapatnya sarana belajar yang lengkap, hendak meningkatkan rasa bangga serta rasa mempunyai. Pemeliharaan fasilitas belajar di sekolah

ialah tanggung jawab seluruh pihak yang

bersangkutan. Perihal ini bertujuan supaya sarana belajar bisa dimanfaatkan cocok gunanya serta bisa bertahan dengan jangka waktu yang lama. Pengadaan sarana belajar sangat berarti untuk siswa serta kurikulum pada dikala itu.

Belajar telah jadi kewajiban yang wajib di jalani oleh seseorang siswa. Kadangkala, siswa jenuh serta kesimpulannya memilah buat tidak belajar. Buat seperti itu mereka butuh diberi dorongan baik dari seluruh pihak. Pengaruh motivasi terhadap prestasi belajar siswa sangat besar sebab itu orang-orang di dekat hendaknya berikan motivasi yang sesuai.

Aspek ketertiban dalam pengelolaan pengajaran ialah sesuatu perihal yang sangat berarti. Tanpa

terdapatnya pemahaman hendak keharusan

melakukan ketentuan yang telah ditentukan tadinya pengajaran tidak bisa jadi menggapai sasaran yang optimal. Seseorang siswa butuh mempunyai perilaku disiplin dengan melakukan latihan yang menguatkan dirinya sendiri buat senantiasa terbiasa patuh serta mempertinggi energi kendali diri. Perilaku disiplin yang mencuat dari kesadarannya sendiri hendak bisa

lebih memacu serta tahan lama dibanding dengan perilaku disiplin yang mencuat sebab terdapatnya pengawasan dari orang lain.

Disiplin bisa berkembang serta dibina lewat latihan, pembelajaran ataupun penanaman kerutinan yang wajib diawali semenjak dalam area ke- luarga, mulai pada masa anak- anak serta terus berkembang tumbuh sehingga jadi disiplin yang terus menjadi kokoh. Semacam halnya disebutkan oleh Tulus( 2004, p. 37) kalau dengan disiplin yang timbul sebab pemahaman diri, siswa ber- hasil dalam belajarnya, tanpa disiplin yang baik atmosfer sekolah serta pula kelas jadi kurang kondusif untuk aktivitas pendidikan secara positif disiplin berikan sokongan area yang tenang serta tertib untuk proses pendidikan, disiplin ialah jalur untuk siswa buat sukses dalam belajar serta nanti kala bekerja sebab pemahaman berartinya norma, ketentuan, kepatuhan serta ketaatan ialah kesuksesan seorang.

Bersumber pada penjelasan menimpa faktor-faktor yang pengaruhi prestasi belajar siswa di atas, hingga riset ini dicoba dengan tujuan buat mengenali seberapa besar kontribusi dari bermacam aspek tersebut terhadap prestasi belajar siswa serta faktor-faktor mana yang sangat dominan kontribusinya terha-dap prestasi belajar siswa. Harapan dari hasil riset ini merupakan terdapatnya hasil rumusan faktor-faktor yang pengaruhi prestasi belajar siswa. Bersumber pada faktor- faktor tersebut, siswa yang diprediksi mempunyai faktor- faktor kokoh hadapi hambatan dalam prestasi belajarnya dapat dicoba langkah-langkah antisipasi semenjak dini terhadap 41 tersebut.

Penelitian-penelitian tentang faktor-faktor

yang pengaruhi prestasi belajar siswa tadinya, banyak yang memakai pengolahan informasi statisika. Pada riset ini, periset memakai informasi mining. Informasi mining ialah cabang ilmu baru di bidang pc, lumayan banyak pelaksanaan yang bisa dikerjakannya. Perihal itu ditunjang kekayaan serta keanekaragaman bermacam bidang ilmu( artificial

intelligence, database, statistik, pemodelan

matematika serta pengolahan citra) mewujudkan pelaksanaan informasi mining jadi kian luas.

Alibi utama kenapa informasi mining sangat menarik atensi industri data dalam sebagian tahun belum lama ini merupakan sebab tersedianya informasi dalam jumlah yang besar serta terus menjadi besarnya kebutuhan buat mengganti informasi tersebut jadi data serta wawasan yang bermanfaat. Informasi mining merupakan kegiatan mengekstraksi ataupun menambang wawasan dari informasi yang berdimensi/ berjumlah besar, data inilah yang nantinya sangat bermanfaat buat pengembangan.

(4)

Definisi simpel dari informasi mining merupakan ekstraksi data ataupun pola yang berarti ataupun menarik dari informasi yang terdapat di database yang besar. Dalam harian ilmiah, informasi mining pula diketahui dengan nama Knowledge

Discovery in Databases( KDD).

Banyak industri, lembaga ataupun lembaga yang memakai hasil riset memakai informasi mining buat menunjang tujuannya. Sebagian riset yang sudah memakai data mining dalam bermacam bidang antara Hal ini menunjukkan bahwa keduanya memiliki performa yang handal dalam melakukan klasifikasi. Algoritma C5.0 tetap dianggap sebagai algoritma yang sangat membantu dalam melakukan klasifikasi data karena karakteristik data yang diklasifikasi dapat diperoleh dengan jelas baik dalam bentuk struktur pohon keputusan maupun aturan if- then, sehingga

memudahkan pengguna dalam melakukan

penggalian informasi terhadap data yang

bersangkutan. Berdasarkan ketiga contoh penelitian memakai data mining di atas, dapat disimpulkan bahwa penggunaan metode data mining sangat layak dan terpercaya untuk digunakan dalam penelitian khususnya dalam membuat suatu prediksi.lain:( 1) riset tentang peramalan cuaca memakai informasi mining yang dapat dipakai oleh BMG( Tubuh Meteorologi serta Geofisika).

Framework buat mengaplikasikan informasi mining pada riset tanah nasional diusulkan meliputi pengembangan database tanah, pilih dataset, aplikasi algoritma, serta penyajian serta interpretasi hasil; (3) Judul riset “Prediksi Status Keaktifan Riset Mahasiswa dengan algoritma C5. 0 serta K-Nearest Neighbor”, Iin Ernawati (2008), berdasarkan riset ini disimpulkan kalau Ra ta- rata keberhasilan algoritma C5.0 serta KNN dalam melaksanakan klasifikasi informasi menggapai akurasi di atas 90%. Perihal ini menampilkan bahwa keduanya mempunyai performa yang profesional dalam melaksanakan klasifikasi.

Algoritma C5. 0 senantiasa dikira selaku

algoritma yang sangat menolong dalam

melaksanakan klasifikasi informasi sebab ciri informasi yang diklasifikasi bisa diperoleh dengan jelas baik dalam ben- tuk struktur tumbuhan keputusan ataupun ketentuan if- then, sehingga mempermudah pengguna dalam melaksanakan

penggalian data terhadap informasi yang

bersangkutan. Bersumber pada ketiga contoh riset memakai informasi mining di atas, bisa disimpulkan kalau pemakaian tata cara informasi mining sangat layak serta terpercaya buat digunakan dalam riset spesialnya dalam membuat sesuatu prediksi.

Kedatangan informasi mining dilatar belakangi

dengan problema informasi explosion yang dirasakan akhir-akhir ini dimana banyak organisasi sudah mengumpulkan informasi sekian tahun lamanya. Kaitannya dengan riset ini merupakan terdapatnya penimbunan informasi semacam informasi sosial

ekonomi orang tua, kedatangan siswa (disiplin), informasi nilai siswa, prestasi masa kemudian siswa serta lain- lain. Data- data tersebut biasa didapat oleh sekolah pada dikala PPDB (Penerimaan Partisipan Didik Baru).

Betapa besarnya dimensi informasi tersebut bila nanti sudah berjalan sebagian tahun. Pertanyaannya saat ini, apakah informasi tersebut hendak dibiarkan menggunung, tidak bermanfaat kemudian dibuang, ataukah kita bisa ‘menambangnya’ buat mencari emas’,‘berlian’ ialah informasi yang bermanfaat buat tingkatkan prestasi anak didik kita. Banyak di antara kita yang kebanjiran informasi tetapi miskin data.

Lembaga pendidikan pada umumnya serta Sekolah Menengah Kejuruan spesialnya merupakan institusi yang mempunyai informasi explosion yang belum dimanfaatkan dengan baik buat suatu yang bermanfaat. Informasi yang biasa dimil- iki sekolah dalam jumlah besar serta hendak senantiasa meningkat tiap tahunnya antara lain catatan muncul siswa, informasi nilai calon siswa pada dikala penerimaan siswa baru serta informasi status sosial ekonomi orang tua yang biasa diinput pada dikala penerimaan siswa baru pula ataupun dapat pula dari informasi yang dipunyai BP/ BK di sekolah.

Data-data tersebut belum termanfaatkan dengan baik selaku bahan pertimbangan, kajian serta riset buat membuat sesuatu informasi yang bermanfaat untuk sekolah. Oleh sebab itu, dengan terdapatnya informasi mining dapat jadi salah satu pemecahan buat menambang tumpu kan data-data tersebut buat membuat nilai ataupun data yang lebih bermanfaat. Berdasarkan penjelasan di atas, riset ini memakai tata cara informasi mining buat membuat sesuatu prediksi tentang prestasi belajar siswa dengan memanfaatkan tumpukan informasi yang sudah dipunyai sekolah tersebut.

2. METODE PENELITIAN

Riset ini memakai pendekatan kuantitatif. Tempat Riset ini merupakan Sekolah Menengah Kejuruan(SMK) Negeri 1 Perbaungan yang beralamat di Jl.Medan T.Tinggi KM 42, Kec. Perbaungan, Kabupaten Serdang Bedagai, Sumatera Utara 20986 Waktu penelitian serta pengambilan informasi pada bulan Juni 2020 hingga Desember 2020 Sasaran/ subjek riset merupakan siswa tingkatan X Sekolah Menengah Kejuruan(SMK) Negeri 1 Perbaungan Tahun Pelajaran 2020/ 2021 beberapa 812 siswa. Prosedur riset memakai tahapan- tahapan KDD( Knowledge Informasi

Discovery).Tahapan-tahapannya ialah :

(1) Informasi Selection, yaitu tahapan ini dicoba buat memilah informasi yang cocok dengan variabel yang diperlukan dalam riset;

(2) Preprocessing/ Cleaning, saat sebelum proses data mining

(5)

24

Gambar.1 Kerangka pikir penelitian

dapat dilaksanakan, perlu dilakukan proses cleaning pada data yang menjadi fokus KDD.

Proses cleaning mencakup antara lain

membuang duplikasi data, memeriksa data yang inkonsisten, dan memperbaiki kesalahan pada data, seperti kesalahan cetak (tipografi); (3) Transformation, coding adalah proses trans-

formasi pada data yang telah dipilih, sehingga data tersebut sesuai untuk proses data mining; (4) Analisis data;

(5) Pattern Evaluation,

Merupakan tahapan evaluasi untuk

mengidentifikasi pola yang benar-benar

menarik yang mewakili pengetahuan

berdasarkan sumber data yang ada. Kerangka pikir yang digunakan dalam penelitian ini dapat dilihat pada gambar 1.

2.1 Teknik Analisis Data

Penelitian ini mengunakan teknik Decision

Tree, CHAID dan regresi ganda untuk melakukan

prediksi prestasi belajar siswa SMK Negeri 1 Perbaungan berdasarkan status ekonomi orang tua, motivasi, kedisiplinan dan prestasi masa lampau

Decision Tree akan memperlihatkan

faktor-faktor kemungkinan (probabilitas) yang akan mempengaruhi alternatif-alternatif prestasi belajar siswa, disertai dengan prediksi hasil akhir yang akan didapat bila faktor-faktor dalam Decision Tree terpenuhi. Decision Tree akan mengubah data kedalam bentuk visual berupa diagram pohon dan aturan-aturan keputusan.

Data dalam Decision Tree dinyatakan dalam bentuk tabel dengan atribut dan record. Atribut menyatakan suatu parameter yang dibuat sebagai kriteria dalam pembentukan tree. Salah satu atribut yang merupakan atribut yang menyatakan data solusi per item data yang disebut dengan target

atribut. Atribut memiliki nilai-nilai yang dinamakan

dengan instance.

Alur proses analisis dalam decision tree adalah mengubah bentuk data (table) menjadi model tree,

mengubah model tree menjadi rule dan

menyederhanakan rule (pruning). Data yang diambil dalam penelitian ini adalah populasi sejumlah 812 siswa akan digunakan untuk membuat model prediksi Decision Tree. Model yang telah dibuat kemudian akan dihitung tingkat akurasi prediksinya. Ada banyak metodologi Data Mining, salah satu yang populer adalah Pohon Keputusan (Decision Tree).

Pohon keputusan merupakan salah satu metode klasifikasi yang sangat menarik yang melibatkan konstruksi pohon keputusan yang terdiri dari node keputusan yang di hubungkan dengan cabang-cabang dari simpul akar sampai ke node daun (akhir). Pada node keputusan attribut akan diuji, dan setiap hasil akan menghasilkan cabang. Setiap cabang akan diarahkan ke node lain atau ke node akhir untuk menghasilkan suatu keputu- san (Larose, 2005, p.107).

Menurut Maimon (2005, p.8), pohon keputusan adalah salah satu metode klasifikasi yang dinyatakan sebagai partisi rekursif. Pohon keputusan terdiri dari node yang membentuk pohon yang berakar, semua node memiliki satu masukan. Node yang keluar disebut node tes. Node yang lain disebut node keputusan atau sering disebut node daun..

Klasifikasi data mining adalah penempatan objek-objek ke salah satu ari beberapa kategori yang telah ditetapkan sebelumnya. Klasifiksi banyak digunakan untuk memprediksi kelas pada suatu label

tertentu, yaitu dengan mengklasifikasi data

(membangun model) berdasarkan training set dan nilai-nilai (label kelas) dalam mengklasifikasikan

atribut tertentu dan memakainya dalam

mengklasifika- sikan data yang baru.

Pohon keputusan biasanya digunakan untuk mendapatkan informasi untuk tujuan pengambilan sebuah keputusan. Pohon keputusan dimulai dengan sebuah root node (titik awal) yang digunakan oleh user untuk mengambil tindakan. Berdasarkan node

root ini, user memecahkan leaf node sesuai dengan

algoritma decision tree.

Hasil akhir dari penyusunan node root dan leaf

node tersebut adalah sebuah pohon keputusan

dengan setiap cabangnya menunjukkan

kemungkinan skenario dari keputusan yang di- ambil serta hasilnya. Konsep pohon keputusan adalah mengubah data menjadi sebuah pohon keputusan (decision tree) dan aturan-aturan keputusan (rule).

(6)

Gambar.2 Alur decision tree

2.2 CHAID

Tujuan dari metode ini adalah untuk memisahkan data secara berurutan dengan pembagian biner menjadi beberapa subgrup. Pada tiap tahap, pembagian sebuah grup menjadi dua bagian didefinisikan oleh salah satu varia- bel prediktor, sebuah himpunan bagian dari kategori-kategorinya mendefinisikan salah satu bagian, dan sisa kategori lainnya mendefinisikan bagian yang lain. Pada AID, prediktornya memiliki dua tipe utama, yaitu monotonik dan bebas. (Kass, 1980, p.241). Alur proses analisis data dengan

CHAID adalah memeriksa tiap variabel

independen memakai uji chisquare, menentukan variabel independen mana yang paling signifikan, membagi data memakai kategori variabel independen tersebut dengan peringkat yang paling signifikan, mengulangi langkah ke-4 untuk semua subgrup sampai teridentifikasi semua pembagian yang secara statistik telah signifikan.

2.3 Regresi

Regresi linier adalah metode statistika yang digunakan untuk membentuk model hubungan antara variabel terikat(dependen) dengan satu atau lebih variabel bebas (independen) . apabila banyaknya variabel bebas hanya ada satu , disebut sebagai regresi linier sederhana, sedangkan apabila terdaoat lebih dari 1 variabel bebas , disebut sebagai regresi linier berganda . hal ini sesuai dengan definisi tentang regresi linier menurut Xin Yan dan Xiao Gang Su (2009:2) Sebagai berikut :

Tabel 1. Detailed accuracy by class Total Number of Instances Deailed Accuracy By Class

F-MEASURE ROC AREA

0.961 0.984 Q 0.974 0.991 P 0.957 0.984 R 0.905 0.981 O 0.842 0.997 S 0.956 0.986

Regresi mampu mendeskripsikan fenomena data melalui terbentuknya suatu model hubungan yang bersifatnya numerik. Regresi juga dapat digunakan untuk melakukan pengendalian (kontrol) terhadap suatu kasus atau hal-hal yang sedang diamati melalui penggunaan model regresi yang diperoleh.

Alur proses dalam regresi ganda adalah menghitung mean, menghitung standard deviasi, menghitung kuadrat varian, menghitung korelasi product Moment, menghitung nilai beta, menghitung nilai b1, b2, dan a, membuat persamaan garis regresi, menghitung sumbangan relatif dari kedua prediktor (R2), menghitung nilai signifikansi (T) dan menghitung signifikansi tiap-tiap prediktor (t).

3. HASIL PENELITIAN DAN PEMBAHASAN

Hasil penelitian berdasarkan tahapan- tahapan proses dalam KDD (Knowledge Data Discovery) sebagai berikut: (1) Data Selection, tahapan ini dilakukan untuk memilih data yang sesuai dengan variabel yang dibutuhkan dalam penelitian. Caranya adalah dengan memilih atau menentukan atribut-atribut data mana yang akan digunakan dalam penelitian dari sekelompok data operasional yang ada. Salah satunya adalah menentukan atribut-atribut untuk variabel Sosial Ekonomi Orang Tua yang diambil dari data operasional yaitu Data Pribadi Siswa yang ada di BP/BK sekolah; (2)

Preprocessing/Cleaning, proses cleaning tersebut

dilakukan terhadap keseluruhan data yang diteliti yang berjumlah 812 siswa. Setelah dilakukan proses cleaning data sejumlah 812, dihasilkan data bersih sebanyak 463 record data yang digunakan untuk proses analisis berikutnya; (3) Transformation, tahap ini menghasilkan satu recordset data yang siap untuk analisis data; (4) Analisis data.

Analisis data yang pertama adalah dengan memakai teknik decision tree algoritma J48. Software yang digunakan adalah WEKA 3.6.9. Hasil yang diperoleh adalah tingkat akurasi prediksi sebesar 95,7%, seperti tampak pada tabel 1.

TP Rate Class FP Rate Precision Recall

0.933 0.004 0.99 0.933 0.979 0.012 0.969 0.979 1 0.043 0.917 1 0.864 0.003 0.95 0.864 0.727 0 1 0.727 W.Avg.0.957 0.018 0.959 0.957

(7)

26

Analisis yang kedua memakai CHAID (Chi

Squared Automatic Interaction Detection). Analisis

ini memakai software SPSS 16.0. Hasil yang diperoleh adalah tingkat akurasi prediksi sebesar 82,1%, seperti tampak pada tabel 2.

Tabel 2. CHAID Classification

Observed Predicted O P A 0 22 B 0 83 C 0 0 D 0 0 E 0 0 Overall Percentage 0% 30.3% Q R S T 0 0 0 0% 14 0 0 85.6% 90 15 0 85.7% 0 111 0 100% 0 11 0 0% 30.1% 39.6% 0% 82.1%

Analisis yang ketiga memakai regresi ganda. Analisis ini memakai software SPSS 16.0. Hasil yang diperoleh adalah tingkat signifikansi seluruh variabel independen terhadap variabel dependen sebesar 90,6%.

3.1 Perbandingan Hasil Akurasi Prediksi antara Metode J48, CHAID dan Regresi Ganda

Perbandingan akurasi klasifikasi antara metode J48, CHAID dan regresi ganda untuk class nilai UTS sebagai target adalah sebagai berikut:

Tingkat akurasi atau signifikansi variabel prediktor terhadap prestasi belajar siswa den- gan memakai metode J48 sebesar 95,7%. Tingkat akurasi atau signifikansi variabel prediktor terhadap prestasi belajar siswa dengan memakai metode CHAID sebesar 82,1%. Tingkat akurasi atau signifikansi variabel prediktor terhadap prestasi belajar siswa dengan memakai regresi ganda sebesar 90,1%. Berdasarkan hasil tersebut terlihat bahwa penggunaan metode J48 lebih baik dari metode CHAID dan regresi ganda. Hal terlihat seperti pada tabel di bawah ini.

Tabel 3. Perbandingan Hasil Prediksi J48, CHAID dan Regresi Ganda

Observed J48 CHAID Regresi

Rata-rata 95.7% 82.1% 90,1

4. KESIMPULAN DAN SARAN

4.1 Kesimpulan

Berdasarkan analisis data memakai decision

tree data mining untuk memprediksiprestasi belajar

siswa berdasarkan status sosial ekonomi orang tua, motivasi, kedisiplinan siswa dan prestasi masa lampau memakai metode data mining diperoleh hasil sebagai berikut : (1) variabel motivasi adalah variabel yang menentukan potensi seorang siswa berhasil atau tidak prestasi belajarnya di waktu yang akan datang. Hal ini dibuktikan dengan adanya variabel motivasi yang menjadi root node dalam decision tree yang terbentuk. Variabel prestasi masa lampau merupakan variabel kedua yang penting dalam keberhasilan siswa menempuh studinya. Hal ini menunjukkan bahwa aspek knowledge atau kecerdasan siswa sangat

berpengaruh terhadap keberhasilan belajarnya.

Sebaliknya, walaupun siswa terprediksi secara

knowledge kurang tetapi dengan motivasi tinggi tetap

bisa berprestasi minimal pada kategori P atau Q. Rata-rata keberhasilan algoritma J48 dalam melakukan klasifikasi data mencapai akurasi di 95,7%. Hal ini menunjukkan bahwa algoritma ini memiliki performa yang handal dalam melakukan klasifikasi; (2) Hasil akurasi klasifikasi memakai metode CHAID dengan data yang sama memperoleh hasil rata-rata prediksi 82,1. Hal ini menunjukkan bahwa berdasarkan hasil kla- sifikasi memakai metode CHAID tersebut memiliki tingkat akurasi yang tergolong baik, yaitu lebih dari 80%; (3) Berdasarkan tabel di atas angka R Square adalah 0,906 untuk pre- dictor Motivasi dan Prestasi_ml. Hasil tersebut adalah hasil kuadrat korelasi. Standar Error of the Estimate adalah 0,30477, perhatikan pada analisis deskriptif statistik bahwa standar deviasi nilai uts adalah 0,99246 yang jauh lebih besar dari dari standar error, oleh karena lebih besar daripada standar deviasi nilai uts maka model regresi ini bagus dalam bertindak sebagai predictor nilai uts.

Berdasarkan ketiga hasil analisis di atas dapat diketahui bahwa akurasi prediksi prestasi belajar memakai metode J48 adalah sebesar 95,7%, sedangkan metode CHAID mempunyai akurasi prediksi sebesar 82,1% dan analisis regresi ganda mempunyai tingkat signifikansi 90,6%.

Berdasarkan data tersebut dapat disimpulkan bahwa penggunaan metode data mining dengan algoritma decision tree (J48) memiliki tingkat akurasi yang lebih baik dari 2 (dua) metode lain yaitu CHAID dan regresi ganda.

(8)

4.2 Saran

Berdasarkan simpulan di atas, penulis menyarankan beberapa hal, yaitu:

(1) Keterbatasan data yang cukup beserta informasi pendukungnya yang dimiliki oleh sekolah.

Ketersediaan data yang dimiliki sangat

mempengaruhi tingkat akurasi data dalam melakukan prediksi. Salah satu diantaranya adalah data tentang kedisiplinan yang tidak hanya memakai rekap absensi siswa;

(2) Perlunya untuk menyimpan data yang disimpan untuk jangka waktu yang lama, sehingga menjamin ketersediaan data tersebut jika dibutuhkan sewaktu-waktu.

(3) Diperlukan kebijakan yang jelas dan tepat sasaran untuk mengatasi siswa yang berpotensi kesulitan dalam hal prestasi belajarnya. Misalnya dengan melakukan pendampingan siswa tersebut.

DAFTAR PUSTAKA

[1] Kurniawan, Deny. (2008). Regresi linier (lin- ear regression). Vienna, Austria: R Foundation for Statistical Computing

[2] Depdiknas. (2003). Undang-Undang Republik Indonesia Nomor 20 Tahun 2003, ten- tang Sistem Pendidikan Nasional

[3] Depdiknas. (1990). Peraturan Pemerintah RI No. 29, Tahun 1990, tentang Pendidikan Menengah [4] Kass G.V. (1980). An exploratory technique for

investigating large quantities of cat- egorical data. Appl. Statist. 29 No.2. pp 119-127

[5] Larose, & Daniel T. (2005). Discovering knowledge in data: an introduction to data mining. USA: John Wiley and Sons

[6] Lior Rokach, & Oded Maimon. (2005). Data mining with decision tree. World Sci- entific Publishing Co. Pte. Ltd. Series in Machine Perception Artificial Intel- ligence Volume 69 [7] Umaedi. (2001). Manajemen peningkatan mutu

berbasis sekolah. Jakarta: Departemen Pendidikan Nasional Direktorat Jendral Pendidikan Dasar dan Menengah Direk- torat Sekolah Lanjutan Tingkat Pertama

[8] Tulus. (2004). Peran disiplin pada perilaku dan prestasi siswa. Jakarta: Grasindo

[9] Xin Yan, & Xiao Gang Su. (2009). Linear re- gression analysis. London: World Sci- entific Publishing Co. Pte. Ltd., Covent Garden

Gambar

Tabel 2. CHAID Classification  Observed  Predicted  O  P  A  0  22  B  0  83  C  0  0  D  0  0  E  0  0  Overall Percentage  0%  30.3%  Q  R  S  T  0  0  0  0%  14  0  0  85.6%  90  15  0  85.7%  0  111  0  100%  0  11  0  0%  30.1%  39.6%  0%  82.1%

Referensi

Dokumen terkait

Hal ini berarti menurut tabel klasifikasi koefisien korelasi termasuk dalam kategori “hubungan yang sangat erat”, dan sifat hubungannya adalah searah, artinya semakin cepat

Antara teori-teori psikologi yang berpotensi dalam mengekang masalah ini adalah seperti teori ‘behaviorisme’, ,teori pembelajaran sosial oleh Bandura, teori psikososial

Jadi yang dimaksud problematika pembelajaran bidang studi pendidikan agama Islam oleh penulis adalah masalah-masalah yang terjadi dalam proses pembelajaran bidang

Subjek penelitian ini adalah : (1) Pihak Chef yang mengetahui jalannya proses produksi dan masalah yang terjadi di outlet dalam proses produksi, kaitannya dengan

This study aims to investigate the effect of Entrepreneurial Intellectual Capital [Human Capital, Social Capital, Customer Capital, Technology Capital] on SME's performance in

Pada tahapan sistem dilakukan pengujian (testing) dan pemeliharaan, yang dapat digunakan untuk menentukan apakah system / perangkat lunak yang kita buat sudah sesuai dengan

Penerapan OVOP dalam rangka memajukan industri kerajinan memerlukan strategi yang sesuai dengan prinsip mendasar OVOP dan dapat menyelesaikan permasalahan yang

Dalam sejarah Bima tercatat bahwa sebelum penyebaran Islam dengan peperangan, kerajaan Goa pernah mengutus beberapa orang untuk menyampaikan berita bahwa sultan Goa, Luwu,