• Tidak ada hasil yang ditemukan

PENGUJIAN DATA ESTIMASI PELUNASAN BIAYA PENDAFTARAN PESERTA DIDIK BARU SDIT QURROTA A YUN DENGAN MENGGUNAKAN ALGORITMA C4.

N/A
N/A
Protected

Academic year: 2022

Membagikan "PENGUJIAN DATA ESTIMASI PELUNASAN BIAYA PENDAFTARAN PESERTA DIDIK BARU SDIT QURROTA A YUN DENGAN MENGGUNAKAN ALGORITMA C4."

Copied!
91
0
0

Teks penuh

(1)

PENGUJIAN DATA ESTIMASI PELUNASAN BIAYA PENDAFTARAN PESERTA DIDIK BARU SDIT QURROTA

A’YUN DENGAN MENGGUNAKAN ALGORITMA C4.5

SKRIPSI

Oleh:

DEDE ASTRI LARASHATI 311410067

PROGRAM STUDI TEKNIK INFORMATIKA SEKOLAH TINGGI TEKNOLOGI PELITA BANGSA

BEKASI

2018

(2)

PENGUJIAN DATA ESTIMASI PELUNASAN BIAYA PENDAFTARAN PESERTA DIDIK BARU SDIT QURROTA

A’YUN DENGAN MENGGUNAKAN ALGORITMA C4.5

SKRIPSI

Diajukan Sebagai Salah Satu Syarat Untuk Menyelesaikan Program Strata Satu (S1) pada Program Studi Teknik Informatika

Oleh:

DEDE ASTRI LARASHATI 311410067

PROGRAM STUDI TEKNIK INFORMATIKA SEKOLAH TINGGI TEKNOLOGI PELITA BANGSA

BEKASI

2018

(3)

i

PERSETUJUAN

SKRIPSI

PENGUJIAN DATA ESTIMASI PELUNASAN BIAYA PENDAFTARAN PESERTA DIDIK BARU SDIT QURROTA A’YUN DENGAN

MENGGUNAKAN ALGORITMA C4.5

Yang disusun oleh DEDE ASTRI LARASHATI

311410067

telah disetujui oleh Dosen Pembimbing Skripsi pada tanggal 11 November 2018

Dosen Pembimbing 1 Dosen Pembimbing 2

Muhammad Makmun Effendi, M.Kom Ahmad Turmudizy, S.Kom, M.Kom NIDN : 0430087804 NIDN : 0408087907

Mengetahui

Kaprodi Teknik Informatika

Aswan S. Sunge, S.E, M.Kom NIDN : 0426018003

(4)

ii

LEMBAR PENGESAHAN

Nama Mahasiswa : Dede Astri Larashati Nomor Induk Mahasiswa : 311410067

Program Studi : Teknik Informatika

Judul Skripsi :

Skripsi ini diujikan pada tanggal 17 November 2018 dan dinyatakan : LULUS / TIDAK LULUS

Dosen Penguji I

Agung Nugroho, S.Kom, M.kom NIDN : 0415058205

Dosen Penguji II

Purnama Sakhrial Pradini, S.T, M.T NIDN: 0403078303

Ketua STT Pelita Bangsa

Dr. Ir. Supriyanto, M.P NIDN : 0401066605

Ketua Program Studi Teknik Informatika

Aswan Sunge, S.E., M.Kom NIDN : 0426018003 PENGUJIAN DATA ESTIMASI PELUNASAN BIAYA PENDAFTARAN PESERTA DIDIK BARU SDIT QURROTA A’YUN DENGAN

MENGGUNAKAN ALGORITMA C4.5

(5)

iv

PERNYATAAN KEASLIAN PENELITIAN

Saya yang bertandatangan dibawah ini menyatakan bahwa, skripsi ini merupakan karya saya sendiri (ASLI), dan isi dalam skripsi ini tidak terdapat karya yang pernah diajukan oleh orang lain untuk memperoleh gelar akademis di suatu institusi pendidikan tinggi manapun, dan sepanjang pengetahuan saya juga tidak terdapat karya atau pendapat yang pernah ditulis dan/atau diterbitkan oleh orang lain, kecuali yang secara tertulis diacu dalam naskah ini dan disebutkan dalam daftar pustaka.

Segala sesuatu yang terkait dengan naskah dan karya yang telah dibuat adalah menjadi tanggungjawab saya pribadi.

Bekasi, 17 November 2018

Materai 6.000

Dede Astri Larashati NIM: 311410067

(6)

v

KATA PENGANTAR

Puji syukur penulis panjatkan ke hadiran Allah SWT. yang telah melimpahkan segala rahmat dan hidayah-Nya, sehingga tersusunlah Skripsi yang berjudul “PENGUJIAN DATA ESTIMASI PELUNASAN BIAYA PENDAFTARAN PESERTA DIDIK BARU SDIT QURROTA A’YUN DENGAN MENGGUNAKAN ALGORITMA C4.5”.

Skripsi tersusun dalam rangka melengkapi salah satu persyaratan dalam rangka menempuh ujian akhir untuk memperoleh gelar Sarjana Komputer (S.Kom.) pada Program Studi Teknik Informatika di Sekolah Tinggi Teknologi Pelita Bangsa.

Penulis sungguh sangat menyadari, bahwa penulisan Skripsi ini tidak akan terwujud tanpa adanya dukungan dan bantuan dari berbagai pihak. Sudah selayaknya, dalam kesempatan ini penulis menghaturkan penghargaan dan ucapan terima kasih yang sebesar-besarnya kepada:

a. Bapak Dr. Ir. Suprianto, M.P selaku Ketua STT Pelita Bangsa.

b. Bapak Aswan, S.Kom, M.Kom selaku Ketua Program Studi Teknik Informatika STT Pelita Bangsa.

c. Bapak Muhammad Makmun Effendi, M.Kom selaku Pembimbing Utama yang telah banyak memberikan arahan dan bimbingan kepada penulis dalam penyusunan Skripsi ini.

d. Bapak Ahmad Turmudizy,S.Kom.,M.Kom Selaku pembimbing kedua yang telah banyak memberikan arahan dan bimbingan kepada penulis dalam penyusunan Skripsi ini.

e. Seluruh Dosen STT Pelita Bangsa yang telah membekali penulis dengan wawasan dan ilmu di bidang teknik informatika.

f. Seluruh staf STT Pelita Bangsa yang telah memberikan pelayanan terbaiknya kepada penulis selama perjalanan studi jenjang Strata 1.

g. Seluruh Staff Tata Usaha SDIT Qurrota A’yun yang telah membantu dalam pengumpulan dan analisa data sekolah.

(7)

vi

h. Rekan-rekan mahasiswa STT Pelita Bangsa, khususnya angkatan 2014, yang telah banyak memberikan inspirasi dan semangat kepada penulis untuk dapat menyelesaikan studi jenjang Strata 1.

i. Ibu dan Ayah tercinta yang senantiasa mendo’akan dan memberikan semangat dalam perjalanan studi Strata 1 maupun dalam kehidupan penulis.

Akhir kata, penulis mohon maaf atas kekeliruan dan kesalahan yang terdapat dalam Skripsi ini dan berharap semoga Skripsi ini dapat memberikan manfaat bagi khasanah pengetahuan Teknologi Informasi di lingkungan STT Pelita Bangsa khususnya dan Indonesia pada umumnya.

Bekasi, November 2019

Dede Astri Larashati

(8)

vii

DAFTAR ISI

PERSETUJUAN ... i

PERSETUJUAN ... ii

LEMBAR PENGESAHAN ... iii

LEMBAR PENGESAHAN ... iv

PERNYATAAN KEASLIAN PENELITIAN ... v

KATA PENGANTAR ... vi

DAFTAR ISI ... viii

DAFTAR TABEL ... xii

DAFTAR GAMBAR ... xiii

ABSTRACT ... xiv

ABSTRAK ... xv

BAB I PENDAHULUAN ... 1

1.1 Latar Belakang ... 1

1.2 Identifikasi Masalah ... 3

1.3 Rumusan Masalah ... 3

1.4 Batasan Masalah ... 4

1.5 Tujuan dan Manfaat ... 4

1.5.1 Tujuan ... 4

1.5.2 Manfaat ... 4

(9)

viii

1.6 Sistematika Penulisan ... 5

BAB II TINJAUAN PUSTAKA ... 7

2.1 Kajian Pustaka ... 7

2.2 Literatur yang medukung penelitian ... 11

2.4 Kerangka Berfikir ... 27

BAB III METODE PENELITIAN... 28

3.1 Objek penelitian ... 28

3.1.1 Sekilas tentang SDIT Qurrota A’yun... 28

3.1.2 Visi dan Misi SDIT Qurrota A’yun ... 28

3.1.3 Program Unggulan SDIT Qurrota A’yun ... 29

3.1.4 Struktur Organisasi ... 30

3.1.5 Data Jumlah Siswa Tahun Pelajaran 2018/2019... 30

3.2 Metode Pengumpulan Data ... 31

3.3 Teknik Analisa Data ... 32

3.4 Instrumen Penelitian ... 34

3.5 Pengolahan Awal Data ... 35

3.5. 5 Pemodelan ... 38

3.6 Menghitung Nilai Entrophy Dan Gain ... 39

BAB IV HASIL DAN PEMBAHASAN ... 45

4.1 Pengolahan Data ... 45

4.2 Penghitungan algoritma C4.5 ... 48

(10)

ix

4.3 Hasil ... 51

4.4 Proses RapidMiner ... 59

BAB V KESIMPULAN ... 69

5.1 Kesimpulan ... 69

5.2 Saran ... 70

DAFTAR PUSTAKA ... 71

LAMPIRAN ... 73

(11)

x

DAFTAR TABEL

Tabel 3.3 Data Siswa Per Jenjang ... 31

Tabel 3.2 Atribut yang Digunakan ... 36

Tabel 4.1 Sumber Data Administrasi siswa ... 45

Tabel 4.2 Tabel Keseluruhan Siswa ... 46

Tabel 4.3 Keterangan Atribut ... 46

Tabel 4.4 Tabel Probabilitas Keseluruhan ... 47

Tabel 4.5 Atribut Pekerjaan Ayah ... 47

Tabel 4.6 Atribut Pendidikan Ayah ... 48

Tabel 4.7 Atribut Penghasilan Ayah ... 48

Tabel 4.8 Atribut Pekerjaan Ibu ... 48

Tabel 4.9 Atribut Pendidikan Ibu ... 48

Tabel 4.10 Atribut Penghasilan Ibu ... 49

Tabel 4.11 Atribut Jumlah Saudara ... 49

Tabel 4.12 Atribut Asal Sekolah ... 49

Tabel 4.12 Data Yang di input ke RapidMiner ... 50

(12)

xi

DAFTAR GAMBAR

Gambar 2.1 Tahapan data mining ... 16

Gambar 2.2 Decision Tree ... 19

Gambar 2.3 Kerangka Fikir ... 27

Gambar 3.1 Struktur Organisasi ... 30

Gambar 3.2 Teknik Pengumpulan Data ... 32

GAMBAR 3.3 Prosedur Penelitian ... 33

GAMBAR 4.1 Instalizing Data Repository ... 59

GAMBAR 4.2 Tapilan Awal rapidminer studio ... 60

GAMBAR 4.3 Tampilan Proses RapidMiner Algoritma C4.5 ... 60

GAMBAR 4.4 Add Entry Parameter List ... 62

GAMBAR 4.5 Decision Tree ... 63

GAMBAR 4.6 Description Decision Tree Result ... 64

GAMBAR 4.7 Accuracy Result ... 64

GAMBAR 4.8 Description Of Performance Vector Result ... 65

GAMBAR 4.8 Diagram Hasil Pengukuran Data Accuracy ... 66

GAMBAR 4.9 AUC (Optimistic)(Positif Class Belum Lunas) ... 66

GAMBAR 4.10 AUC (Positif Class Belum Lunas) ... 67

GAMBAR 4.11 Performance Vector Precision result ... 67

GAMBAR 4.12 Performance Vector Recall result ... 68

(13)

xii

ABSTRACT

Qurrota A’yun Bilingual And Holistic Islamic School (QHABIS) is a private integrated Islamic education foundation, established since the 2013/2014 school year. One of the roles and functions of a foundation is to help the surrounding community to advance education and community welfare. By getting enough education, now with this capital we can improve children's intelligence as a means to advance this nation. Many ways have been done by foundations to improve the quality of education, but the determination of financing that is quite expensive is a problem that is always a problem from private foundations.

Keyworad: Data Mining, Decision Tree, Algoritma C4.5, Estimated Repayment of Registration Fees, Private Education Foundation.

(14)

xiii

ABSTRAK

Sekolah Islam Terpadu Qurrota A’yun (SDIT QA) adalah yayasan pendidikan islam terpadu swasta yang berdiri sejak tahun ajaran 2013/2014. Salah satu peran dan fungsi sebuah yayasan adalah membantu masyarakat di sekitar untuk memajukan pendidikan dan kesejahteraan masyarakat Dengan mendapatkan pendidikan yang cukup, kini dengan modal tersebut kita dapat meningkatkan kecerdasan anak sebagai sarana untuk memajukan bangsa ini. Banyak cara dilakukan yayasan untuk meningkatkan kualitas pendidikan akan tetapi penetapan pembiayaan yang cukup mahal menjadi persoalan yang selalu jadi permasalahan dari yayasan swasta.

Kata kunci : Data Mining, Decision Tree, Algoritma C4.5, Estimasi Pelunasan Biaya Pendaftaran, Yayasan Pendidikan Swasta.

(15)

1

BAB I

PENDAHULUAN

1.1 Latar Belakang

Pendidikan merupakan salah satu aspek terpenting dalam kehidupan kita selain aspek kesehatan dan ekonomi. Dengan pendidikan kita bisa memperkaya khasanah ilmu pengetahuan yang kita miliki. Pendidikan juga merupakan salah satu aspek dan jenis dari yayasan.

Yayasan pendidikan memiliki fungsi yang sanagt penting. Mengapa? Hal ini dikarenakan pendidikan adalah sarana untuk memajukan generasi emas dan mencetak generasi penerus bangsa yang nantinya akan menjadi calon pemimpin bangsa yang hebat. Dengan sebuah pendidikan dapat mengasah anak – anak untuk terus mengudate beragam informasi melalui berbagai terobosan yang semakin pesat perkembangannya. Selain itu, dengan pendidikan pula kita dapat mengasah keterampilan mereka untuk mengasah daya kreativitas yang akan menjadi bekal bagi mereka untuk mengembangkan budaya dan kesenian di negeri ini.

Di yayasan pendidikan Qurrota A’yun Setiap tahunnya menerima sekitar 20 siswa per unit pendidikan dimulai dari PE(Penitipan Edukatif), TK(Taman Kanak-kanak), SDIT(Sekolah Dasar Islam Terpadu), SDTQ(Sekolah Dasar Tahfidz Qur’an) & TAUD(Tahfidz Anak Usia Dini). Pada setiap tahun pelajaran baru setiap unit pendidikan disibukan dengan kegiatan PPDB(Penerimaan Peserta didik baru), salah satunya terkait dengan biaya pendaftaran. Setiap unit memiliki kebijakan masing-masing terkait biaya pendaftaran sekolah, Dalam laporan ini

(16)

2 akan membahas terkait data pendaftaran untuk Unit pendidikan SDIT yang memiliki beberapa kebijakan khusus salah satunya adalah potongan biaya pendaftaran dari 10% hingga 25% total biaya pendaftaran dan pemberian jangka waktu pelunasan biaya pendaftaran dengan kata lain biaya pendaftaran yang dapat diangsur.

Meskipun banyak keuntungan yang di dapatkan dari siswa yang berasal dari Unit Pendidikan dari yayasan yang sama tidak menutup kemungkinan untuk siswa yang berasal dari TK lain untuk mendaftar ke SDIT Qurrota A’yun.

Karena yayasan Pendidikan ini milik swasta untuk biaya pendaftaranpun cukup Fantastis karena untuk pengelolaan sekolah memang hanya berasal dari dana kas yayasan yakni sekitar 10 Juta Rupiah per siswa biaya tersbut mencakup biaya gedung, seragam, pendidikan, buku dan kegiatan untuk satu tahun. Dengan adanya keringanan untuk sistem angsuran setiap tahun ada saja siswa yang masih menunggak atau melebihi jangka waktu yang ditentukan. Permasalahan inilah yang menjadi dasar saya untuk melakukan penelitian lebih jauh dan penggalian data Pendaftaran peserta didik baru beberapa tahun sebelumnya untuk dijadikan acuan untuk kebijakan pembiayaan pendaftaran tahun ajaran yang akan datang.

Selain perbedaan latar belakang sekolah latar belakang pendidikan dan pekerjaan orangtuapun cukup berpengaruh dalam proses pelunasan biaya pendaftaran siswa.

Data mining adalah proses pengekstrakan informasi dari kumpulan data yang besar. Pengekstrakan informasi dilakukan berdasarkan metode data mining yang akan digunakan. Algoritma C4.5 adalah algoritma yang digunakan untuk membuat pohon keputusan. Pohon keputusan merupakan metode klasifikasi dan

(17)

3 prediksi, metode pohon keputusan mengubah fakta menjadi pohon keputusan yang merepresentasikan aturan yang mudah dipahami dengan bahasa alami.

Untuk mengetahui apakah peserta didik baru mampu melunasi biaya pendaftaran sesuai jangka waktu yang telah ditentukan maka penulis melakukan penelitian dengan mengambil judul “PENGUJIAN DATA ESTIMASI PELUNASAN BIAYA PENDAFTARAN PESERTA DIDIK BARU SDIT QURROTA A’YUN DENGAN MENGGUNAKAN ALGORITMA C4.5”, data pendaftaran siswa baru tahun sebelumnya akan di olah menggunakan metode data mining untuk melakukan prediksi dan keputusan apakah siswa tersebut akan melunasi biaya pendaftaran sesuai dengan jangka waktu yang ditentukan atau melebihi jangka waktu yang ditentukan.

1.2 Identifikasi Masalah

Berdasarkan latar belakang diatas masalah yang ada dapat diidentifikasi masalah sebagai berikut :

1. Belum diketahuinya apakah siswa dapat melunasi biaya pendaftaran sesuai waktu yang ditentukan.

2. Perlu adanya pengelolaan dana pendaftaran yang baik untuk meningkatkan kualitas pendidikan siswa baru dan sekolah.

3. Implementasi data mining menggunakan Algoritma C4.5.

1.3 Rumusan Masalah

1. Bagaimana menganalisis estimasi pelunasan biaya pendaftaran peserta didik baru dengan menggunakan metode algoritma C4.5

(18)

4 2. Bagaimana Akurasi algoritma C4.5 untuk memprediksi estimasi pelunasan

biaya pendaftaran.

1.4 Batasan Masalah

1. Penelitian hanya dilakukan di Unit pendidikan SDIT Qurrota A’yun.

2. Data yang digunakan adalah data pendaftaran siswa baru tiap tahun pelajaran baru dan data pembiayaan pendaftaran.

1.5 Tujuan dan Manfaat 1.5.1 Tujuan

Berdasarkan rumusan masalah diatas maka tujuan dari penelitian ini adalah sebagai berikut :

1. Untuk menganalisis estimasi pelunasan biaya pendaftaran peserta didik baru SDITQA Dengan menggunakan algoritma C4.5.

2. Untuk memprediksi estimasi pelunasan biaya pendaftaran dengan akurasi algoritma C4.5.

1.5.2 Manfaat

Berdasarkan rumusan masalah diatas maka manfaat dari penelitian ini adalah sebagai berikut :

1. Bagi Penulis

Penulis dapat mengaplikasikan ilmu dan keterampilan yang diperoleh di perkuliahan Teknologi Informatika, dan untuk memenuhi salah satu syarat kelulusan Strata Satu (S1) Teknik Informatika STT Pelita Bangsa, serta menambah wawasan pengetahuan dan pengalaman mengenai dunia bisnis

(19)

5 khususnya dalam potensi kepuasan pelanggan atas pelayanan yang didapatkan.

2. Bagi Yayasan

Memberikan masukan untuk pengembangan pengelolaan pembiayaan pendaftaran peserta didik baru dan kualitas yayasan.

3. Bagi STT Pelita Bangsa

Penelitian ini dapat memberikan informasi bagi peneliti atau calon peneliti lain untuk menerapkannya kedalam sistem yang lebih luas dan lebih kompleks atau sebagai bahan acuan yang dapat dikembangkan bagi kemungkinan pengembang konsep dan materi lebih lanjut serta dapat melengkapi referensi pustaka akademik.

1.6 Sistematika Penulisan

Secara garis besar materi prosposal ini terbagi dalam beberapa bab yang tersusun sebagai berikut :

Bab I : Pendahuluan

Bab ini merupakan bagian pendahuluan yang berisi latar belakang masalah Estimsasi pelunasan biaya pendaftaran menarik untuk diteliti, identifikasi masalah, rumusan masalah, batasan masalah, tujuan penelitian, manfaat penelitian serta sistematika penulisan.

Bab II : Landasan Teori

Bab ini berisikan landasan teori yang menjadi dasar penelitian. Teori yang digunakan merupakan teori yang berpijak pada bidang data mining dengan

(20)

6 menggunakan metode algoritma C4.5 dan beberapa penelitian terdahulu yang dijadikan acuan dalam melakukan penelitian. Selain itu disusun juga kerangka pemikiran penulis tentang penelitian yang akan dilakukan.

Bab III : Metode Penelitian

Pada bab ini berisi deskripsi tentang bagaimana penelitian akan dilaksanakan dengan menggunakan metode algoritma C4.5, jenis dan sumber data, metode klasifikasi data, serta metode analisis.

Bab IV : Hasil Dan Analisis

Bab ini menjelaskan secara singkat keadaan Yayasan Pendidikan Qurrota A'yun sebagai objek penelitian, kemudian menuju ke analisis dan klasifikasi data serta pembahasan hasil analisis dari penelitian ini.

Bab V : Penutup

1.7 Bab ini merupakan bab terakhir yang berisikan kesimpulan dan saran atas penelitian yang dilakukan berkaitan tentang Prediksi Estimasi Pelunasan Biaya pendaftaran siswa baru di Yayasan Pendidikan Qurrota A'yun.

(21)

7

BAB II

TINJAUAN PUSTAKA

2.1 Kajian Pustaka

Administrasi pendidikan mempunyai karakteristik tersendiri yang berbeda dengan ilmu administrasi lain. Dalam penelitian Arif Burhanudin Menyebutkan bahwa, perbedaan administrasi pendidikan terletak pada prinsip-prinsip operasionalnya dan bukan pada prinsip-prinsip umumnya. Dikarenakan tujuan umum pendidikan itu sendiri adalah untuk membantu peserta didik mencapai kedewasaannya masing- masing sehingga peserta didik dapat berdiri sendiri di dala masyarakat sesuai dengan nilai-nilai yang berlaku di lingkungan masyarakat sekitarnya. Jadi untuk mencapai tujuan pendidikan, maka harus diselenggarakan rangkaian kegiatan pendidikan secara terencana, terarah, dan sistematis melalui lembaga pendidikan formal yang diatur dan diawasi oleh pemeintah dengan tidak mengurangi arti usaha- usaha kependidikan yang lainnya.

Melalui kegiatan pengelolaan/ administrasi/ manajemen keuangan maka kebutuhan pendanaan kegiatan sekolah dapat direncanakan, diupayakan pengadaannya, dibukukan secara transparan, dan digunakan untuk membiayai pelaksanaan program sekolah secara efektif dan efisien.

Pembiayaan pendidikan tidak hanya menyakut analisis sumber- sumber pendapat pendidikan saja, namun lebih pada penggunaan dana secara efektif dan efisien. Semakin efisien dana yang digunakan dalam proses pendidikan, maka berkurang pula dana yang diperlukan untuk mencapai tujuan- tujuannya. Dengan

(22)

8 pencapain efisiensi dana pendidikan, maka tercapai pula efektifitas kegiatan dalam pencapaian tujuan pendidikan.

Berdasarkan pada dasar pengelolaan administrasi sekolah maka dilakukan penelitian ini karena biaya pendaftaran merupakan salah satu pemasukan dana terbesar sekolah untuk digunakan satu tahun kedepan maka penulis melakukan studi dari penelitian – penelitian sebelumnya dan sumber lain. Dari penelitian – penelitian sebelumnya penulis menemukan beberapa penelitian yang membahas tentang topic yang terkait dengan penelitian penulis, antara lain adalah alggoritma yang akan digunakan oleh penulis pada peneliti ini.

Penelitian pertama dilakukan oleh Swastina (2013) yang meneliti penerapan algoritma C4.5 untuk penentuan jurusan mahasiswa. Dari hasil pengujian algoritma C4.5 dalam menentukan jurusan yang akan diambil oleh mahasiswa sesuai dengan latar belakang, minat, dan kemampuannya sendiri.

Parameter pemilihan jurusan adalah indeks prestasi kumulatif semester 1 dan 2.

Metode yang dilakukan adalah penelitian eksperimen yang terdiri dari pengumpulan data sekunder yang diperoleh secara tidak langsung bersumber dari dokumentasi literatur, buku, dan jurnal. Dan pengumpulan data primer adalah data hasil dari penelitian. Pengolahan data awal yang didapatkan adalah data mahasiswa dengan atribut nim, nama, tanggal lahir, asal sekolah, nilai un, jurusan yang dipilih, data lain yang akan diolah adalah IPK semester 1 dan 2. Sebanyak 90% data akan digunakan untuk membangun struktur pohon keputusan melalui metode C4.5, sedangkan 10% lainnya digunakan sebagai data uji. Evaluasi dilakukan dengan menganalisa hasil kasifikasi, pengukuran data dilakukan dengan

(23)

9 confusion matrix dan ROC Curve (AUC). Validasi hasil penelitian dilakukan dengan mengabil sampel sebanyak 100 data mahasiswa. Hasil evaluasi dan validasi dengan confusion matrix menunjukan tingkat akurasi pada algoritma C4.5 sebesar 93,31%.

Penelitian kedua dilakukan oleh Siska Haryati (2015) Yang meneliti tentang prediksi masa studi mahasiswa menggunakan algoritma C4.5 Berdasarkan hasil pengujian sistem yang telah dilakukan di Universitas Dehasen Bengkulu yang dilakukan penulis dapat diketahui bahwa dengan menggunakan teknik data mining tingkat kesalahan dalam memprediksi masa studi mahasiswa tersebut lulus tepat waktu atau tidak dapat dikurangi dengan tingkat kesalahan 5 % . dalam analisis, dengan kriteria dan kelas yang jumlahnya sangat banyak, seorang penguji biasanya perlu untuk mengestimasikan baik itu distribusi dimensi tinggi ataupun parameter tertentu dari distribusi kelas tersebut. Metode pohon keputusan dapat menghindari munculnya permasalahan ini dengan menggunakan criteria yang jumlahnya lebih sedikit pada setiap node internal tanpa banyak mengurangi kualitas keputusan yang dihasilkan.

Dari hasil penelitian terbukti bahwa algoritma C4.5 sesuai dengan metode penelitian yang akan penulis teliti. Hal ini dibuktikan dengan hasil evaluasi penelitian bahwa algoritma C4.5 mampu menganalisa tingkat ketepatan waktu mahasiswa menyelesaikan masa studinya.

Dalam pengantar buku data mining (2010) menjelaskan tentang Gambaran kasus data volume air di dalam 12 botol yang diisi secara otomatis hasil

(24)

10 pengukuran volume air di dalam 12 botol yang diambil secara acak sebagai sample ditampilkan pada TABEL 2.1

Tabel 2.1Data Volume Air di dalam botol

Nomor

Botol Volume Air

1 2016

2 2025

3 1968

4 2007

5 2031

6 2055

7 2039

8 1981

9 1975

10 1964

11 2036

12 1987

Volume yang sebenarnya diharapkan untuk setiap botol asalah 2 Liter (2.000 ml). data di atas menunjukan bahwa mesin pengisi otomatis tersebut tidak mengisi tiap botol dengan volume air yang tepat sama seperti yang diharapkan.

Jadi jika anda diberi pertanyaan pada umumnya, berapakah volume air yang ada di dalam botol?, bagaimanakah anda harus menjawabnya?.

Mengingat ukuran populasi yang terus bertambah mustahil bagi kita untuk menghitung rata-rata dan varians (atau standar deviasi) populasi. Akan tetapi berbekal sample yang ada kita dapat melakukan estimasi (perkiraan) pada kedua parameter populasi tersebut . cara untuk memperkirakan kedua parameter populasi tersebut cukup sederhana seperti berikut :

(25)

11 1. Rata-rata populasi µ dapat diestimasi dengan rata-rata sample ( ).

2. Varians populasi σ dapat diestimasi dengan varians sampel (s2 ).

Pada contoh sample 12 air minum botol, diperoleh rata-rata sample sebesar 2.007 ml, artinya = 2007. Selanjutnya selang kepercayaan 95 %

berdasarkan sample tersebut adalah (1989, 42 ; 2024, 58) ml.

2.2 Literatur yang medukung penelitian 2.2.1 Pengelolaan pembiayaan sekolah

Setiap kegiatan perlu diatur agar kegiatan berjalan dengan tertib, lancar, efektif dan efisien (Depdiknas 2007: 6). Keuangan sekolah merupakan bagian yang sangat penting karena setiap kegiatan sekolah membutuhkan uang. Untuk itu, kegiatan pengelolaan keuangan sekolah perlu dilakukan dengan baik.

Mulyono (2010 : ) mengemukakan bahwa keberhasilan sekolah dalam menyelenggarakan pendidikan yang berkualitas juga tidak terlepas dari perencanaan anggaran pendidikan yang mantap serta pengalokasian dana pendidikan yang tepat sasaran dan efektif.

Pembiayaan pendidikan tidak hanya menyakut analisis sumber- sumber pendapat pendidikan saja, namun lebih pada penggunaan dana secara efektif dan efisien. Semakin efisien dana yang digunakan dalam proses pendidikan, maka berkurang pula dana yang diperlukan untuk mencapai tujuan- tujuannya. Dengan pencapain efisiensi dana pendidikan, maka tercapai pula efektifitas kegiatan dalam pencapaian tujuan pendidikan.

(26)

12 2.2.2 Prinsip Dasar Pengelolaan Keuangan Sekolah

Dalam pengelolaan dana pendidikan, ada beberapa prinsip yang harus diperhatiakan (PP. No 48 Tahun 2008 pasal 59 dan Undang- undang No 20 Tahun 2003 pasal 48) antara lain :

a) Prinsip keadilan, prinsip ini dilakukan dengan memberikan akses pelayanan pendidikan yang seluas- luasnya dan merata kepada peserta didik, tanpa membedakan latar belakang suku, ras, agama, jenis kelamin, dan kemampuan atau status sosial ekonomi.

b) Prinsip efisiensi, prinsip ekonomi dilakukan dengan mengoptimalkan akses, mutu, relevansi, dan daya saing pelayanan pendidikan.

c) Prinsip transparasi, prinsip ini dilakukan dengan memenuhi asas kepatutan dan tata kelola yang baik oleh pemerintah, pemerintah daerah, penyelenggaraan pendidikan yang didirikan masyarakat, dan satuan pendidikan sehingga sebagai berikut :

a. Dapat diaudit atas dasar standar audit yang berlaku, dan menghasilakan opini audit yang wajar tanpa perkecualian.

b. Dapat dipertanggungjawabkan secara transparan kepada pemangku kepentingan pendidikan.

d) Prinsip akuntabilitas publik, prinsip ini dilakukan dengan pertanggungjawaban atas kegiatan yang dijalankan oleh penyelenggara atau satuan pendidikan kepada pemangku kepentingan pendidikan, orang tua, dan pemerintah. Ada tiga pilar utama yang menjadi syarat terbangunnya akuntabilitas yaitu :

(27)

13 a. Adanya transparasi para penyelenggara sekolah dengan menerima masukan dan mengikutsertakan berbagai komponen dalam mengelola sekolah.

b. Adanya standar kinerja di setiap institusi yang dapat diukur dalam melaksanakan tugas, fugsi, dan wewenagnya.

c. Adanya partisipasi untuk saling menciptakan suasana kondusif dalam menciptakan pelayanan masyarakat dengan prosedur yang mudah, biaya yang murah dan pelayanan yang cepat.

e) Prinsip efektivitas, prinsip ini seringkali diartikan sebagai pencapaian tujuan yang telah ditetapkan. Garner (2004) mendefinisikan lebih dalam lagi, karena sebenarnya efektivitas tidak berhenti sampai tujuan tercapai tetapi sampai pada kulitataif hasil yang dikaitkan dengan pencapaian visi lembaga.

Effectiveness “ characterized by qualitative outcomes”. Efektivitas lebih menekankan pada kualitatif outcomes. Manajemen keuangan dikatakan memenuhi prinsip efektivitas kalau kegiatan yang dilakukan dapat mengatur keuangan untuk membiayai aktivitas dalam rangka mencapai tujuan lembaga yang bersangkutan dan kualitatif outcomes-nya sesuai dengan rencana yang telah ditetapkan.

2.3 Data Mining

Data mining adalah proses mencari pola atau informasi menarik dalam data terpilih dengan menggunakan teknik atau metode tertentu. Data mining merupakan proses analisa data untuk menemukan suatu pola dari kumpulan data tersebut (Shella, 2015).

(28)

14 2.3.1 Pengelompokan Data Mining

Menurut Larose dalam bukunya yang berjudul “Discovering Knowledge in Data:An Introduction to Data Mining”, data mining dibagi menjadi beberapa kelompok berdasarkan tugas/pekerjaan yang dapat dilakukan, yaitu (Kasus, Pt, Gunadi, & Sensuse, 2013) :

1. Deskripsi

Terkadang peneliti dan analisis secara sederhana ingin mencoba mencari cara untuk mengGambarkan pola dan kecenderungan sering memberikan kemungkinan penjelasan untuk suatu pola atau kecendurungan.

2. Estimasi

Estimasi hampir sama dengan klasifikasi, kecuali variabel target estimasi lebih ke arah numerik dari pada kearah ketegori. Model dibangun menggunakan baris data (record) lengkap yang menyediakan nilai dari variabel target sebagai nilai prediksi. Selanjutnya, pada peninjauan berikutnya estimasi nilai dari variabel target dibuat berdasarkan nilai variabel prediksi.

3. Prediksi

Prediksi hampir sama dengan klasifikasi dan estimasi, kecuali bahwa dalam prediksi nilai dari hasil akan ada dimasa mendatang. Beberapa metode dan teknik yang digunakan dalam klasifikasi dan estimasi dapat pula digunakan (untuk keadaan yang tepat) untuk prediksi.

Contoh prediksi dalam bisnis dan penelitian adalah:

a. Prediksi harga beras dalam tiga bulan yang akan datang.

(29)

15 b. Prediksi presentase kenaikan kecelakaan lalu lintas tahun depan jika

batas bawah kecepatan dinaikan.

4. Klasifikasi

Dalam klasifikasi, terdapat target variabel kategori. Sebagai contoh, penggolongan pendapatan dapat dipisahkan dalam tiga kategori, yaitu pendapatan tinggi, pendapatan sedang, dan pendapatan rendah.

5. Pengklasteran (Clusterring)

Pengklasteran merupakan pengelompokan record, pengamatan, atau memperhatikan dan membentuk kelas obyek-obyek yang memiliki kemiripan.

Klaster adalah kumpulan record yang memiliki kemiripan satu dengan yang lainnya dan memiliki ketidak miripan record dalam klaster yang lain. Berbeda dengan klasifikasi, pada pengklasteran tidak ada variabel target. Pengklasteran tidak melakukan klasifikasi, mengestimasi, atau memprediksi nilai dari variabel target, akan tetapi, algoritma pengkleasteran mencoba untuk melakukan pembagian terhadap keseluruhan data menjadi kelompok-kelompok yang memiliki kemiripan (homogen), yang mana kemiripan record dalam satu kelompok akan bernilai maksimal, sedangkan kemiripan dengan record dalam kelompok lain akan bernilai minimal.

6. Asosiasi

Tugas asosiasi dalam data mining adalah untuk menemukan atribut yang muncul dalam satu waktu. Dalam dunia bisnis lebih umum disebut analisis keranjang belanja.

(30)

16 Contoh asosiasi dalam penilitian adalah:

a. Meneliti jumlah pelanggan dari perusahaan telekomunikasi seluler yang diharapkan untuk memberikan respon positif terhadap penawaran upgrade layanan yang diberikan.

b. Menentukan barang dalam supermarket yang dibeli secara bersamaan dan barang yang tidak pernah dibeli bersamaan.

2.3.2 Tahapan Data Mining

Sebagai suatu rangkaian proses, data mining dapat dibagi menjadi beberapa tahap proses yang diilustrasikan pada Gambar Gambar 2.1 tahap-tahap tersebut bersifat interaktif, pemakai terlibat langsung atau dengan perantaraan knowledge base (Ridwan, Suyono, & Sarosa, 2013).

Gambar 2.1 Tahapan data mining 1. Data selection

Pemilihan (seleksi) data dari sekumpulan data operasional perlu dilakukan sebelum tahap penggalian informasi dalam KDD dimulai. Data hasil seleksi yang

(31)

17 digunakan untuk proses data mining, disimpan dalam suatu berkas, terpisah dalam basis data operasional.

2. Pre-processing/cleaning

Sebelum proses data mining dapat dilakukan, perlu dilakukan proses cleaning pada data yang menjadi fokus KDD. Proses cleaning mencakup antara lain membuang duplikasi data, memeriksa data yang inkosisten, dan memperbaiki kesalahan pada data.

3. Transformation

Coding adalah proses transformasi pada data yang telah dipilih, sehingga data tersebut sesuai untuk proses data mining. Proses coding dalam KDD merupakan proses kreatif dan sangat tergantung pada jenis atau pola informasi yang akan dicari dalam basis data.

4. Data mining

Data mining adalah proses mencari pola atau informasi menarik dalam data terpilih dengan menggunakan teknik atau metode tertentu. Teknik, metode, atau algoritma dalam data mining sangat bervariasi. Pemilihan metode atau algoritma yang tepat sangat bergantung pada tujuan dan proses KDD secara keseluruhan.

5. Interpretation/evalution

Pola informasi yang dihasilkan dari proses data mining perlu ditampilkan dalam bentuk yang mudah dimengerti oleh pihak yang berkepentingan. Tahap ini merupakan tahap dari proses KDD yang disebut interpretation. Tahap ini

(32)

18 mencakup pemeriksaan apakah pola atau informasi yang ditemukan bertentangan dengan fakta atau hipotesis yang ada sebelumnya.

2.3.3 Decision tree

Decision Tree atau Pohon keputusan adalah model prediksi menggunakan struktur pohon atau struktur berhirarki. Selain karena pembangunannya relatif cepat, hasil dari model yang dibangun juga mudah untuk dipahami, sehingga Decision Tree ini merupakan metode klasifikasi yang paling popular digunakan.

Metode pohon keputusan mengubah fakta yang sangat besar menjadi pohon keputusan yang mempresentasikan aturan. Aturan dapat di ekspresikan dalam bentuk bahasa basis data seperti Structured Query Languae untuk mencari record pada kategori tertentu. Pohon keputusan juga berguna untuk mengekplorasi data, menemukan hubungan tersembunyi antara sejumlah calon variabel input dengan sebuah variable target. Karena pohon keputusan memadukan antara eksplorasi data dan pemodelan, dia sangat bagus sebagai langkah awal dalam proses pemodelan bahkan ketika dijadikan sebagai model akhir dari beberapa teknik lain.

Sebuah pohon keputusan adalah sebuah struktur yang dapat digunakan untuk membagi kumpulan data yang besar menjadi himpunan-himpunan record yang lebih kecil dengan menerapkan serangkaian aturan keputusan. Dengan masing-masing rangkaian pembagian, Anggota himpunan hasil menjadi mirip satu dengan yang lain (Berry & Linoff, 2004)

(33)

19 Decision Tree adalah flow chart seperti struktur Tree dimana tiap internal node menunjukan sebuah test pada sebuah atribut, tiap cabang menunjukkan dari test dan leaf node menunjukkan class-class atau class distribution (“Prosiding Seminar Aplikasi Sains & Teknologi (SNAST) 2014 Yogyakarta, 15 November 2014 ISSN: 1979-911X,”2014).

Dalam decision tree tidak menggunakan vektor jarak untuk mengklasifikasikan obyek. Seringkali data observasi mempunyai atribut-atribut yang bernilai nominal. Seperti yang diilustrasikan pada Gambar 2.2, misalnya obyeknya adalah sekumpulan buah-buahan yang bisa dibedakan dalam atribut bentuk, warna, ukuran dan rasa. Bentuk, warna, ukuran dan rasa adalah besaran nominal, yaitu bersifat kategoris dan tiap nilai tidak bisa dijumlahkan atau dikurangkan. Dalam atribut warna ada beberapa nilai yang mungkin yaitu hijau, kuning, merah. Dalam atribut ukuran ada nilai besar, sedang dan kecil. Dengan nilai-nilai atribut ini, kemudian dibuat decision tree untuk menentukan suatu obyek termasuk jenis buah apa jika nilai tiap-tiap atribut diberikan(Asriningtias et al., 2014).

Gambar 2.2 Decision Tree

(34)

20 Pohon yang dibentuk tidak selalu berupa pohon biner. Jika semua fitur dalam data set menggunakan 2 macam nilai kategorikal maka bentuk pohon yang didapatkan berupa pohon biner. Jika dalam fitur berisi lebih dari 2 macam nilai kategoriikal atau menggunakan tipe numerik maka bentuk pohon yang didapatkan biasanya tidak berupa pohon biner.

Pada Decision Tree terdapat tiga jenis node, yaitu:

a. Root Node, merupakan Node paling atas , pada node ini tidak ada input dan bisa tidak mempunyai output lebih dari satu.

b. Internal Node, merupakan node percabangan, pada node ini hanya terdapat satu input dan mempunyai output minimal 2.

c. Leaf Node atau terminal node, merupakan node terakhir, pada node ini hanya terdapat satu input dan tidak mempunyai output.

Kelebihan yang dimiliki Decision Tree antara lain:

a. hasil analisa berupa pohon yang mudah dimengerti.

b. Mudah untuk dibangun serta, membutuhkan data percobaan yang lebih sedikit dibandingkan algoritma klasifikasi lainnya.

c. Mampu mengolah data nominal dan continyu.

d. Menggunakan teknik statistik sehingga dapat divalidasikan.

e. Akurasi yang dihasilkan mampu menandingi teknik klasifikasi lainnya.

2.3.4 Algoritma C4.5

Algoritma C4.5 merupakan kelompok algoritma decision tree. Algoritma ini mempunyai input berupa training samples dan samples. Training samples

(35)

21 berupa berupa data contoh yang akan digunakan untuk membangun sebuah tree yang telah diuji kebenarannya. Sedangkan samples merupakan field-field data yang nantinya akan digunakan sebagai parameter dalam melakukan klasifikasi data (“Prosiding Seminar Nasional Aplikasi Sains & Teknologi (SNAST) 2014 Yogyakarta, 15 November 2014 ISSN:1979-911X,”2014).

Secara umum, algoritma C4.5 untuk membangun sebuah pohon keputusan adalah sebagai berikut:

1. hitung jumlah data, jumlah data berdasarkan anggota atribut hasil dengan syarat tertentu. Untuk proses pertama syaratnya masih kosong.

2. Pilih atribut sebagai Node.

3. Buat cabang untuk tiap-tiap anggota dari Node.

4. Periksa apakah nilai entropy dari anggota Node ada yang bernilai nol. Jika ada, tentukan daun yang terbentuk. Jika seluruh nilai entropy anggota Node adalah nol, maka proses pun berhenti.

5. Jika ada anggota Node yang memiliki nilai entropy lebih besar dari nol, ulangi lagi proses dari awal dengan Node sebagai syarat sampai semua anggota dari Node bernilai nol.Node adalah atribut yang mempunyai nilai gain tertinggi dari atribut-atribut yang ada. Untuk menghitung nilai gain suatu atribut digunakan rumus seperti yang tertera dalam persamaan berikut:

Entropy (S) = ∑

* log2 pi

(36)

22 Tabel 2.2 Algoritma Membuat Keputusan

Algorithm : Generete_decision_tree.

Narrative : Generate a decision tree from the given training data.

Input : The training samples, samples, represented by discrete-valued attribute, the set of candidate attributes, attribute-list.

Output : A dicision tree.

Method

1) Craete a node N;

2) If samples are all of the same class, C then 3) Return N as a leaf node labeled with class C 4) If attribute-list is empty then

5) Return N as leaf node labeled with the most common class in samples;//majority voting

6) Select test-attribute, the attribute among attribute-list with the highest gain ratio;

7) Label node N with last attribute;

8) For each known value a, of test-attribute

9) Grow a branch from node N for the condition test-attribute =

10) Let be the set of samples in samples for wich test-attribure = // a partition 11) If is empty then

12) attach a leaf labeled with the most common class in sample;

13) Else attach the node returned by Generate_decision_tree ( , attribute-list-list- attribute);

(37)

23 Pada tahap pembelajaran algoritma C4.5 memiliki 2 prinsip kerja yaitu:

1. Pembuatan pohon keputusan. Tujuan dari algoritma penginduksi pohon keputusan adalah mengkontruksi struktur data pohon yang dapat digunakan untuk memprediksi kelas dari sebuah kasus atau record baru yang belum memiliki kelas.

C4.5 melakukan kontruksi pohon keputusan.

2. dengan metode divide and conquer. Pada awalnya hanya dibuat node akar dengan menerapkan algoritma divide and conquer. Algoritma ini memilih pemecahan kasus-kasus yang terbaik dengan menghitung dan membandingkan gain ratio, kemudian node-node yang terbentuk di level berikutnya, algoritma divide and conquer akan diterapkan lagi sampai terbentuk daun-daun.

Pembuatan aturan-aturan (rule set). Aturan-aturan yang terbentuk dari pohon keputusan akan membantuk suatu kondisi dalam bentuk if-then. Aturan- atturan ini didapat dengan cara menelusuri pohon keputusan dari akar sampai daun. Setiap node dan syarat percabangan akan membentuk suatu kondisi atau suatu if, sedangkan untuk nilai-nilai yang terdapat pada daun akar membentuk suatu hasil atau suatu then.

Algoritma C4.5 merupakan pengmbanagn dari algoritma ID3. Algoritma C4.5 dan ID3 diciptakan oleh seorang peneliti dibidang kecerdasan buatan bernama j. Rose quinlan pada akhir tahun 1970-an. Aloritma C4.5 membuat pohon keputusan dari atas ke bawah, dimana atribut paling atas merupakan akar, dan yang paling bawah dinamakan daun (informasi, 2013).

(38)

24 2.3.5 Information Gain

Information gain adalah salah satu attribute selection measure yang digunakan untuk memilih test attribute tiap node pada tree. Atribut dengan informasi gain tertinggi dipilih sebagai test atribut dari suatu node. Dalam prosesnya perhitungan gain bisa terjadi atau tidak suatu missing value.

Setelah mendapat nilai entropy untuk suatu kumpulan data, maka kita dapat mengukur efektifitas suatu atribut dalam mengklasifikasikan data. Ukuran efektifitas ini disebut informasi gain. Secara matematis, information gain dari suatu atribut A, dituliskan sebagai berikut (Julianto, Yunitarini, & Sophan, 2014);

Gain(S,A) = Entropy (S) - ∑

* Entropy (S)

Dimana : A : atribut

V : suatu nilai yang mungkin untuk atribut A Values (A) : himpunan yang mungkin untuk atribut A

|Sv| : jumlah sampel untuk nilai v

|S| : jumlah seluruh sampel data

Entropy(Sv): entropy untuk sampel-sampel yang memiliki nilai v.

2.3.6 RapidMiner

RapidMiner merupakan perangkat lunak yang bersifat terbuka (open source). RapidMiner adalah sebuah solusi untuk melakukan analisis terhadap data

(39)

25 mining, text mining dan analisis prediksi. RapidMiner menggunakan berbagai teknik deskriptif dan prediksi dalam memberikan wawasan kepada pengguna sehingga dapat membuat keputusan yang paling baik. RapidMiner memiliki kurang lebih 500 operator data mining, termasuk operator untuk input, output, data preprocessing dan visualisasi. RapidMiner merupakan software yang berdiri sendiri untuk analisis data dan sebagai mesin data mining yang dapat diintegrasikan pada produknya sendiri. RapidMiner ditulis dengan menggunakan bahasa java sehingga dapat bekerja di semua sistem operasi(Aprilla Dennis, 2013).

RapidMiner sebelumnya bernama YALE (Yet Another Learning Environment), dimana versi awalnya mulai dikembangkan mulai 2001 oleh RalfKlinkenberg, Ingo Mierswa, dan simon Fischer di artificial Intellegent Unit dari University of Dortmund. RapidMiner didistribusikan di bawah lisensi AGPL (GNU Affero General Public License) versi 3. Hingga saat ini telah ribuan aplikasi yang dikembangkan menggunakan RapidMiner di lebih dari 40 negara.

RapidMiner sebagai software open source untuk data mining tidak perlu diragukan lagi karena software ini sudah terkemuka di dunia. RapidMiner menempati perangkat pertama sebagai software data mining pada polling oleh KDnuggets, sebuah portal data-mining pada 2010-2011.

RapidMiner menyediakan GUI (Graphic User Interface) untuk merancang sebuah pipeline analitis. GUI ini akan menghasilkan file XML (Extensible Markup Language) yang mendefinisikan proses analitis keinginan pengguna

(40)

26 untuk diterapkan ke data. File ini kemudian dibaca oleh RapidMiner untuk menjalankan analis secara otomatis.

2.3.6.1 Keunggulan RapidMiner

Sudah tidak diragukan lagi RapidMiner memilik keunggulan tersendiri RapidMiner adalah aplikasi data mining yang tidak perlu dipertanyakan lagi dan berbasis sistem open source dunia yang termuka dan ternama. Tersedia sebagai aplikasi yang berdiri sendiri untuk analisis data dan sebagai mesin data mining untuk integrasi ke dalam produk sendiri. Ribuan Aplikasi RapidMiner di lebih dari 40 negara memberikan pengguna mereka keunggulan yang kompetitif. Solusi yang diusung antara lain :

- Integrasi data - Analitis ETL - Data Analisis, dan

Pelaporan dalam data suite tunggal. Powerfull tapi memiliki antarmuka pengguna grafis yang intiutif untuk desain analisis proses. Repositori untuk proses, data dan penanganan meta data Hanya solusi dengan transformasi meta data : lupakan trial and error dan memeriksa hasil yang telah di inspeksi selama desain. Hanya solusi yang mendukung on-the-fly kesalahan dan dapat melakukan perbaikan dengan cepat Lengkap dan fleksibel : Ratusan loading data, transformasi data, pemodelan data, dan metode visualisasi data.

(41)

27 2.4 Kerangka Berfikir

Dalam penelitian ini metode yang digunakan yaitu Algoritma C4.5 untuk memecahkan masalah dilakukan pengujian terhadap kinerja metode tersebut

Untuk pengembangan dan pengujian metode yang dipakai dengan menggunakan aplikasi RapidMiner Penulis perlu membuat Gambaran singkat sebagai alur penyusunan laporan ini dengan kerangka pemikiran sebagai berikut:

Gambar 2.3 Kerangka Fikir

(42)

28

BAB III

METODE PENELITIAN

3.1 Objek penelitian

3.1.1 Sekilas tentang SDIT Qurrota A’yun

SDIT Qurrota A'yun berdiri pada tanggal 5 Agustus 2012 Menjadi awal sebuah pemikiran untuk ikut berkontribusi dalam dunia dakwah pendidikan Mempersiapkan dan mewujudkan generasi Qur'ani berdampingan dengan berdirinya Yayasan Rumah Bahagia.

Konsep pendidikan sebagai nilai (Value) yang ditanamkan yaitu mewujudkan Akhlaq Dan budi pekerti yang sesuai dengan tuntunan Rosulullah, Menjadikan anak memiliki logika untuk berpikir dan memiliki kecerdasan Keilmuan, emosi dan spiritual dalam segala aspek (Multiple Inteligence) Serta Berprestasi dalam segala bidang sesuai dengan kecerdasan majemuk peserta didik 3.1.2 Visi dan Misi SDIT Qurrota A’yun

a. Visi

Menjadi Sekolah Islam Terpadu Unggul dan berkarakter untuk membentuk generasi Qur’ani

b. Misi

c. Menyelenggarakan pendidikan Islam terpadu bermutu berdasarkan Al Qur’an dan As Sunnah.

d. Melaksanakan pembelajaran aktif, innovatif, kreatif, efektif dan menyenangkan (PAIKEM)

(43)

29 e. Menyiapkan dan mengembangkan tenaga pendidik dan kependidikan yang

soleh/solehah, kompeten, profesional secara berkesinambungan.

f. Menyediakan sarana prasarana yang memadai sebagai bentuk pelayanan berbasiskan Informasi dan Teknologi (IT) serta pemanfaan potensi lingkungan alam sekitar sebagai penunjang CTL (Contectual Teaching Learning).

g. Mengembangkan potensi peserta didik berdasarkan kecerdasan majemuk (multiple inteligence) yang dimilikinya.

3.1.3 Program Unggulan SDIT Qurrota A’yun a. Belajar Tuntas Harian

b. Kunjungan Edukasi / outing (kelas 1 - 6) tiap bulan c. Pemantapan baca tulis kelas 1

d. Kelas khusus multiple inteligence (bahasa, matematika, Art, Sport, olympiade) e. Program Club Bahasa Arab : Koshul Hikayah (cerita/story telling), cerdas

cermat dan pidato) (kelas 4 - 6)

f. Pembiasaan Bahasa Arab dan Bahasa Inggris sebagai bahasa keseharian g. Special Day for english & Arabic language (Review english+Arabic

language)

h. Special Event (dilaksanakan setiap 2 bulan sekali ),Tema yang dipilih :

 Intrapersonal / Ibadah(sholat, wudhu, dzikir, tahfidz)

 Art/seni spasial(melukis&mewarnai, puisi, pidato, kolase bernyanyi)

 Kinestetik/Sport (futsal, loncat tinggi, lari, lempar) Bahasa (b.indonesia, b.inggris, b.arab, b. sunda)

(44)

30 Matematika (Baca , Tulis dan berhitung)

3.1.4 Struktur Organisasi

Gambar 3.1 Struktur Organisasi 3.1.5 Data Jumlah Siswa Tahun Pelajaran 2018/2019

Dalam penelitian tugas akhir ini, dilakukan dengan mengambil objek penelitian 261 data administrasi siswa potensi ketepatan waktu pelunasan biaya pendaftaran Penelitian dilakukan pada bulan Juli - September 2018.

(45)

31 Tabel 3.3 Data Siswa Per Jenjang

Kelas Siswa keseluruhan Siswa SDTQ Siswa Reguler SDIT

L P Jumlah L P Jumlah L P Jumlah

1 11 17 28 6 4 10 5 13 18

2 24 24 48 1 2 3 23 22 45

3 26 18 44 5 3 8 21 15 36

4 27 16 43 3 0 3 24 16 40

5 33 33 66 4 9 13 29 24 53

6 17 15 32 0 0 0 17 15 32

Jumlah 138 123 261 19 18 37 119 105 224

3.2 Metode Pengumpulan Data

Dalam mengumpulkan data penyusun menggunakan 2 metode yaitu : 1. Metode Lapangan

Metode ini dilakukan penulis secara langsung untuk mengumpulkan data yang berhubungan dengan sistem informasi. Data-data tersebut penulis kumpulkan secara :

a. Observasi (pengamatan langsung)

Penulis melakukan pengamatan langsung ke tempat objek pembahasan yang ingin diperoleh yaitu melalui bagian-bagian terpenting dalam pengambilan data yang diperlukan. Pengambilan data penulis lakukan pada bagian administrasi dan Staff Tata Usaha SDIT Qurrota A’yun.

b. Metode wawancara

Penulis melakukan wawancara untuk mendapatkan penjelasan dari masalah-masalah yang sebelumnya kurang jelas untuk meyakinkan bahwa data yang diperoleh dikumpulkan benar-benar akurat. Wawancara dilakukan kepada bagian pembiayaan untuk menanyakan masalah pada saat analisa data transaksi pembayaran siswa.

2. Studi Pustaka

(46)

32 Penulis mengumpulkan data-data atau sumber tertulis berdasarkan dari buku-buku atau modul-modul yang berhubungan dengan masalah yang dikemukakan penulis. Mencari sumber informasi yang tepat dengan mencocokan kebutuhan informasi dengan sistem indeksasi perpustakaan. Peneliti dapat megutip informasi tertentu dan menyusun dala bentuk uang tepat.

Berikut prosedur dari teknik pengumpulan data :

Gambar 3.2 Teknik Pengumpulan Data 3.3 Teknik Analisa Data

Data yang digunakan dalam penelitian ini adalah data berdasarkan pada survei yang dilakukan dilapangan dengan meneliti dan mengolah data yang diberikan secara langsung dari pihak sekolah. Metode yang diusulkan untuk

(47)

33 proses seperti yang sudah dijelaskan diatas yaitu menggunakan metode Algoritma C4.5.

Prosedur penghitungan estimasi pelunasan pembayaran biaya pendaftara siswa baru adalah sebagai berikut :

GAMBAR 3.3 Prosedur Penelitian

(48)

34 3.4 Instrumen Penelitian

Instrument penelitian ini diperlukan agar penelitian dapat berjalan dengan lancar dan baik. Instrument tersebut terdiri dari perangkat keras dan perangkat lunak.

3.4.1 Bahan

Bahan Yang dibutuhkan yaitu berupa data siswa induk SDIT Qurrota A’yun dan data transaksi pembiayaan SDIT Qurrota A’yun. Data transaksi digunakan untuk menghitung jumlah angsuran dan mengukur jarak pelunasan yang akan digunakan untuk memprediksi estimasi pelunasan biaya pendaftaran siswa baru.

3.4.2 Peralatan

Tujuan dari deskripsi peralatan adalah untuk mengetahui kebutuhan sistem agar mempermudah dalam memprediksi, peralatan ini meliputi :

A. Data Induk siswa

Data induk siswa adalah data yang digunakan sebagai acuan setiap administrasi sekolah Bisa dikatakan bahwa data Induk merupakan data dasar sebagai data sumber yang mampu memberikan informasi tambahan mengenai proses pengelolaan data berikutnya yang akan dilakukan.

B. Data Transaksi Administrasi sekolah

Data transaksi administrasi sekolah yang akan di gunakan oleh penulis meliputi data :

(49)

35 1.Biaya Registrasi

2.Rician dana kegiatan siswa 3.buku paket SPP Bulanan 4.Uang pangkal (Bangunan) 5.Seragam

3.4.3 Kebutuhan Perangkat Lunak

Perangkat lunak yang digunakan dalam penelitian ini antara lain : 1. Microsoft Excel 2010 sebagai media penulisan dataset.

2. Rapidminer yang akan digunakan untuk melihat hasil akurasi dari algoritma yang digunakan terhadap dataset yang sedang diteliti.

3.4.4 Kebutuhan Perangkat Keras

Selain kebutuhan perangkat lunak, dibutuhkan juga perangkat keras yang digunakan dalam penelitian ini, notebook dengan spesifikasi :

1. Prosesor intel® Celeron ® 1.10GHz 2. 64-bit Operating System

3. RAM 4 GB 4. 150GB HDD

3.5 Pengolahan Awal Data

Pada data administrasi siswa yang telah dikumpulkan dilakukan cleaning data, yaitu dengan menghilangkan record-record yang noice atau tidak lengkap dan record yang berulang. Atribut yang juga tidak diperlukan juga bisa dihilangkan seperti atribut Karakter, Pendidikan, Pekerjaan, Tanggungan, Rumah,

(50)

36 Pendapatan, dan Status. Hal ini dilakukan karena atribut tersebut tidak berpengaruh terhadap pengolahan data pada proses selanjutnya. Berikut adalah tabel atribut dan kategorinya.

Tabel 3.2 Atribut yang Digunakan

No ATRIBUT

1. Pekerjaan Ayah 2. Pendidikan Ayah 3. Penghasilan Ayah 4. Pekerjaan Ibu 5. Pendidikan Ibu 6. Penghasilan Ibu

7 Jumlah Saudara

8. Asal TK

3.5.1 Split Validation

Split Validation merupakan data yang sudah disiapkan untuk klasifikasi dibagi menjadi dua untuk data tranning dan data testing. Pembagian data menjadi data tranning (80%) dan data testing (20%) menggunakan teknik sampling random sistematik (systematic random sampling). Cara menggunakan teknik sampling random sistematik ini pengundian dilakukan satu kali, yaitu ketika melakuan unsur pertama disampling yang akan diambil. Penentuan unsur sampling selanjutnya ditempuh dengan cara memanfaatkan interval sanple.

(51)

37 Interval sample adalah angka yang mennunjukan jarak antara nomor-nomor urut yang terdapat dalam rangka sampling yang akan dijadikan patokan dalam menentukan atau memilih unsur-unsur sampling kedua dan seterusnya hingga unsur ke-n. Interval sample biasanya dilambangkan dengan huruf k.

3.5.2 Apply Model

Merupakan sebuah model pertama kali dilatih pada ExampleSet oleh Operator lain, yang sering merupakan algoritma pembelajaran. Setelah itu, model ini dapat diterapkan pada ExampleSet lain. Biasanya, tujuannya adalah untuk mendapatkan prediksi pada data yang tidak terlihat atau untuk mengubah data dengan menerapkan model preprocessing.

The ExampleSet di mana model diterapkan, harus kompatibel dengan Atribur model. Ini berarti, bahwa ExampleSet memiliki nomor, urutan, jenis, dan peran Atribut yang sama seperti ExampleSet yang digunakan untuk menghasilkan model.

3.5.3 Performance

Performance dapat diartikan sebagai tingkat pencapaian hasil atau “The degree of accomplishment “ (Rue and Byars, 1981:375). Sering pula disebut tingkat pencapaian tujuan organisasi. Penilaian terhadap performance atau disebut juga kinerja merupakan suatu kegiatan yang sangat penting Penilaian dimaksud bisa dibuat sebagai masukan guna mengadakan perbaikan untuk peningkatan kinerja organisasi pada waktu berikutnya. (Mac Donald and Lawton, 1977).

Apabila sebuah organisasi tidak menghasilkan keluaran berupa materi, performance juga sebagai sebutan bagi pengukuran output atau hasil dari

(52)

38 organisasi. Penjelasan tersebut dibicarakan oleh Stodgil dalam hubungannya dengan permasalahan output organisasi.

3.5.5 Pemodelan

Pada penelitian ini metode yang digunakan adalah Algoritma C4.5 dan dengan menggunakan tools RapidMiner 9.0.

Ada beberapa tahap dalam membuat pohon keputusan dengan algoritma C4.5, yaitu sebagai berikut:

1. Menyiapkan data training atau data testing. Data training dan data testing biasanya diambil dari histori yang pernah terjadi dan sudah dikelompokan ke dalam kelas-kelas tertentu.

2. Menentukan akar dari pohon. Akar akan diambil dari atribut yang terpilih, dengan cara menghitung nilai gain dari masing-masing atribut, nilai gain yang paling tinggi yang akan menjadi akar pertama. Sebelum menghitung nilai gain dari atribut, hitung dulu nilai entropy, dengan rumus sebagai berikut :

Entropy (S) = ∑ * log2 pi

3. Kemudian hitung nilai gain, dengan rumus sebagai berikut : Gain(S,A) = Entropy (S) - ∑

* Entropy (S) 4. Ulangi langkah ke-2 hingga semua record terpartisi.

5. Proses partisi pohon keputusan akan terhenti saat :

a. Semua record dalam simpul N mendapat kelas yang sama.

b. Tidak ada atribut di dalam record yang dipartisi lagi.

c. Tidak ada record di dalam cabang yang kosong.

(53)

39 3.6 Menghitung Nilai Entrophy Dan Gain

Berikut ini merupakan langkah-langkah perhitungan Nilai Entrophy dan Gain pada setiap Attribute yang memiliki label Lunas dan Belum Lunas :

3.6.1 Perhitungan Nilai Entrophy Total

Langkah Awal Algoritma C4.5 adalah mencari nilai Entrophy. Pertama tentukan dulu nilai Entrophy total dari kasus. Rumusnya sebagai sebagai berikut :

Entropy (S) = ∑ * log2 pi Diketahui :

Jumlah Kasus = 261 Jumlah Nilai Lunas : 200 Jumlah Nilai Belum Lunas : 61

Maka Nilai Entrophy Total adalah :

Entropy (S) = (-(

*

)) + (-(

* ))

= (-(

*

)) + (-(

*

))

= 0.7031365

Selanjutnya lakukan perhitungan entropy pada tiap attribute berdasarkan pada jumlah kasus per subset attribute, yaitu :

A. Attribute Pekerjaan Ayah

a. Perhitungan Nilai Subset pada attribute Pekerjaan ayah Tidak Bekerja(TB) Diketahui :

Jumlah kasus = 3

(54)

40 Jumlah Nilai Lunas = 2

Jumlah Nilai belum lunas = 1 Maka Nilai Entrophy adalah :

Entropy (S) = (-(

*

)) + (-(

* ))

= (-( * )) + (-( * ))

= 0.1383458

3.7 Perhitungan nilai subset Pada Attribute pekerjaan Ayah dengan Profesi guru

Diketahui :

Jumlah kasus = 27 Jumlah Nilai Lunas = 21 Jumlah Nilai belum lunas = 6

Maka Nilai Entrophy adalah :

Entropy (S) =(-(

*

)) + (-(

* ))

= (-(

*

)) + (-(

*

))

= 0.7642044

3.8 Perhitungan nilai subset Pada Attribute pekerjaan Ayah dengan Profesi PNS

Diketahui : Jumlah kasus = 6

(55)

41 Jumlah Nilai Lunas = 4

Jumlah Nilai belum lunas = 2

Maka Nilai Entrophy adalah :

Entropy (S) =(-(

*

)) + (-(

* ))

= (-( * )) + (-( * ))

= 0.9182957

3.9 Perhitungan nilai subset Pada Attribute pekerjaan Ayah dengan Profesi Pedagang Kecil

Diketahui :

Jumlah kasus = 13 Jumlah Nilai Lunas = 8 Jumlah Nilai belum lunas = 5

Maka Nilai Entrophy adalah :

Entropy (S) =(-(

*

)) + (-(

* ))

= (-(

*

)) + (-(

*

))

= 0.9612366

3.10 Perhitungan nilai subset Pada Attribute pekerjaan Ayah dengan Profesi Pedagang Besar

(56)

42 Diketahui :

Jumlah kasus = 3 Jumlah Nilai Lunas = 2 Jumlah Nilai belum lunas = 1

Maka Nilai Entrophy Total adalah :

Entropy (S) =(-(

*

)) + (-(

* ))

= (-( * )) + (-( * ))

= 0.9182958

3.11 Perhitungan nilai subset Pada Attribute pekerjaan Ayah dengan Profesi Wiraswasta

Diketahui : Jumlah kasus = 7 Jumlah Nilai Lunas = 6 Jumlah Nilai belum lunas = 1

Maka Nilai Entrophy adalah :

Entropy (S) =(-(

*

)) + (-(

* ))

= (-( * )) + (-( * ))

= 0.5916727

(57)

43 3.12 Perhitungan nilai subset Pada Attribute pekerjaan Ayah dengan Profesi

Karyawan Swasta Diketahui :

Jumlah kasus = 189 Jumlah Nilai Lunas = 148 Jumlah Nilai belum lunas = 41

Maka Nilai Entrophy adalah :

Entropy (S) =(-(

*

)) + (-(

* ))

= (-(

*

)) + (-(

*

))

= 0.7545242

3.13 Perhitungan nilai subset Pada Attribute pekerjaan Ayah dengan Profesi Lain -Lain

Diketahui :

Jumlah kasus = 13 Jumlah Nilai Lunas = 9 Jumlah Nilai belum lunas = 4

Maka Nilai Entrophy adalah :

Entropy (S) =(-(

*

)) + (-(

* ))

= (-(

*

)) + (-(

*

))

Gambar

Tabel 2.1Data Volume Air di dalam botol
Gambar 2.1 Tahapan data mining  1.  Data selection
Gambar 2.2 Decision Tree
Gambar 2.3 Kerangka Fikir
+7

Referensi

Dokumen terkait

III Unit Layanan Pengadaan Barang/Jasa Daerah Kabupaten Lamandau mengundang Direktur Utama/Direktur/Wakil Direktur/Kuasa Direktur Perusahaan sebagai berikut :. NO NAMA PERUSAHAAN

Penelitian ini bertujuan untuk mendeskripsikan 1) gambaran sikap dan perilaku kelompok Wahabi di Dusun Masaran Desa Pakong Kecamatan Modung Kabupaten Bangkalan 2)

Jika tidak lulus UN, biaya kuliah yang telah dibayarkan akan dikembalikan 100% (kecuali Biaya Formulir). Semester Pendek diikuti mahasiswa bersifat OPTIONAL dengan biaya

Dari kegiatan evaluasi hasil belajar yang telah dilakukan untuk berbagai jenis mata pelajaran misalnya, akan dapat tergambar bahwa dalam mata pelajaran tertentu (misalnya

Tujuan utama dari penelitian ini adalah untuk menganalisis pengaruh implementasi kebijakan yang dikeluarkan oleh Bank Indonesia terkait pembatasan loan to value dalam kredit

Adapun hal-hal yang mempengaruhi kepuasan kerja dari pegawai di kantor Dinas Sosial Provinsi Sumatera Utara yaitu pekerjaan yang diterima sesuai dengan

monitoring dan data dari izin serta tidak memiliki data fasilitas lainnya (penggunaan air, jumlah karyawan, kapasitas produksi dan output produk) dapat menggunakan nilai

Kemudian, kurikulum dalam bahasan ini, bukan pembahasan kurikulum dalam arti sempit berupa daftar mata pelajaran yang harus diajarkan pada peserta didik, tetapi kurikulum