• Tidak ada hasil yang ditemukan

Klasifikasi Pendaftar Beasiswa Bidikmisi Universitas Sebelas Maret Menggunakan Algoritma C4.5.

N/A
N/A
Protected

Academic year: 2017

Membagikan "Klasifikasi Pendaftar Beasiswa Bidikmisi Universitas Sebelas Maret Menggunakan Algoritma C4.5."

Copied!
13
0
0

Teks penuh

(1)

KLASIFIKASI PENDAFTAR BEASISWA BIDIKMISI

UNIVERSITAS SEBELAS MARET MENGGUNAKAN ALGORITMA C4.5

SKRIPSI

Diajukan untuk Memenuhi Salah Satu Syarat Mencapai Gelar Strata Satu Program Studi Informatika

Disusun oleh: MUH. SAFRI JULIARDI

(2)
(3)
(4)

HALAMAN PERSEMBAHAN

Tugas akhir ini ku persembahkan untuk Ayah, Ibu, dan kedua kakakku tercinta, keluarga Informatika UNS angkatan 2012,

(5)

MOTTO

“Inna ma’al ‘usri yusroo.”

“Sesungguhnya bersama kesulitan itu ada kemudahan.” (QS. Al Insyirah: 6)

“Man jadda wajada.”

“Barangsiapa bersungguh-sungguh maka berhasillah dia.” (Mahfudhot)

(6)

KATA PENGANTAR

Segala puji dan syukur penulis ucapkan kepada Allah SWT, yang hanya karena berkat rahmat dan karunia-Nya penulis dapat menyelesaikan skripsi berjudul “Klasifikasi Pendaftar Beasiswa Bidikmisi Universitas Sebelas Maret dengan Algoritma C4.5” ini untuk memenuhi salah satu syarat memperoleh gelar Sarjana Komputer pada Program Studi Informatika Universitas Sebelas Maret.

Keberhasilan penelitian dan penyusunan skripsi ini tidak lepas dari bantuan dan dukungan berbagai pihak. Untuk itu penulis mengucapkan terima kasih sebesar-besarnya kepada :

1. Ayah dan Ibu serta kedua kakak penulis yang selalu mendidik, mendukung, dan mendoakan penulis.

2. Bapak Ristu Saptono, S.Si., M.T. dan Ibu Denis Eka Cahyani, S.Kom, M.Kom selaku dosen pembimbing yang dengan penuh kesabaran telah memberikan ilmu dan bimbingan terbaik kepada penulis.

3. Biro Administrasi Kemahasiswaan Pusat Universitas Sebelas Maret yang telah memberikan izin dan data yang diperlukan guna menyelesaikan penelitian ini. 4. Para Dosen Program Studi Informatika Universitas Sebelas Maret yang telah

memberikan ilmu yang bermanfaat kepada penulis.

5. Para Staff dan karyawan serta keluarga SAT UPT TIK Universitas Sebelas Maret yang telah mendukung dan memberikan pengalaman yang berharga kepada penulis.

6. Keluarga besar S1 Informatika FMIPA UNS, khususnya angkatan 2012. Semoga tulisan ini dapat memberikan manfaat kepada para pembaca.

Surakarta, Februari 2017

(7)

KLASIFIKASI PENDAFTAR BEASISWA BIDIKMISI

UNIVERSITAS SEBELAS MARET MENGGUNAKAN ALGORITMA C4.5

MUH. SAFRI JULIARDI

Program Studi Informatika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Sebelas Maret

ABSTRAK

(8)

UNIVERSITAS SEBELAS MARET BIDIKMISI APPLICANT’S CLASSIFICATION USING C4.5 ALGORITHM

MUH. SAFRI JULIARDI

Department of Informatics, Faculty of Mathematics and Natural Science, Sebelas Maret University

ABSTRACT

Bidikmisi scholarship is a scholarship for poor but outstanding students. Because of the amount applicants, there is a need to use an accurate method in the selection process of Bidikmisi scholarship, especially in Universitas Sebelas Maret’s (UNS) environment. In this paper, C4.5 algorithm is proposed as a method to help on Bidikmisi recipients selection process. The dataset which is used is Bidikmisi applicants data from 2013 to 2015. The applicant’s data from 2013 and 2014 is used as training data and the applicant’s data from 2015 is used as testing data. Furthermore, oversampling and undersampling technique is used to address the class imbalance problem in training data. Finally the accuracy for each decision trees are compared to see which sampling method is better. The result of this study shows that the accuracy of the C4.5 algorithm decision tree with the applicant’s data from 2015 as testing data is 79,80% and Area Under Curve (AUC) value 0.5539. Meanwhile, to compare the sampling method, the best decision tree based on testing result is chosen. Oversampling technique produce 82,69 % for precision, 91,22 % for recall, and 77,16 % for accuracy. While undersampling technique produce 82,78 % for precision, 91,22 % for recall, and 77,27 % for accuracy. Therefore it is concluded that undersampling technique gives a better accuracy than oversampling technique.

Keywords : Bidikmisi, C4.5 algorithm, decision tree, Oversampling,

(9)

DAFTAR ISI

HALAMAN PERSETUJUAN...ii

HALAMAN PENGESAHAN...Error! Bookmark not defined. HALAMAN PERSEMBAHAN...iv

MOTTO...v

KATA PENGANTAR... vi

ABSTRAK...vii

ABSTRACT...viii

DAFTAR ISI... ix

DAFTAR TABEL...xi

DAFTAR GAMBAR...xii

DAFTAR LAMPIRAN... xiii

BAB I PENDAHULUAN...1

1.1. Latar Belakang...1

1.2. Rumusan Masalah...3

1.3. Batasan Masalah... 3

1.4. Tujuan Penelitian...3

1.5. Manfaat Penelitian...4

1.6. Sistematika Penulisan...4

(10)

2.3. Kerangka Pemikiran...12

BAB III METODOLOGI PENELITIAN...14

3.1. Pengumpulan Data...14

3.2.Data Preprocessing...15

3.3. Pelatihan Algoritma C4.5...17

3.4. Pengujian dan Analisa Hasil...17

BAB IV HASIL DAN PEMBAHASAN...21

4.1. Deskripsi Data...21

4.2.Data Preprocessing...24

4.2.1.Data Cleaning... 24

4.2.2.Data Transformation... 24

4.2.3.Sampling... 27

4.3. Pelatihan Algoritma C4.5...28

4.4. Pengujian dan Analisa Hasil...30

BAB V PENUTUP...38

5.1. Kesimpulan... 38

5.2. Saran... 38

DAFTAR PUSTAKA... 40

(11)

DAFTAR TABEL

Tabel 3.1. Tabel Konversi Nilai Atribut Penghasilan... 16

Tabel 3.1 Confusion Matrix...17

Tabel 4.1. Jumlah Data Pendaftar Bidikmisi Tahun 2013, 2014, dan 2015...21

Tabel 4.2. Data Nilai Unik Tiap Atribut...21

Tabel 4.3. Contoh Data Pendaftar Bidikmisi... 23

Tabel 4.4. Tabel Konversi Nilai Atribut Penghasilan... 25

Tabel 4.5. Contoh Data Setelah Melewati TahapData CleaningdanData Transformation... 26

Tabel 4.6. Tabel Rasio Kelas...28

Tabel 4.7. Contoh Hasil Klasifikasi...31

Tabel 4.8.Confusion Matrixuntuk Tiap Pohon Keputusan... 32

Tabel 4.9. NilaiPrecision, Recall, Accuracy, danFalse Positive Ratepohon keputusan PKA...34

Tabel 4.10. NilaiPrecision,Recall,Accuracy, danFalse Positive Ratepohon keputusan PKO...34

(12)

DAFTAR GAMBAR

Gambar 3.1. Diagram Alir Metodologi Penelitian... 14

Gambar 3.2. ContohROC Curve... 19

Gambar 4.1. Contoh Pohon Keputusan C4.5... 29

Gambar 4.2. Contoh Visualisasi Pohon Keputusan C4.5...29

(13)

DAFTAR LAMPIRAN

Referensi

Dokumen terkait

P SURABAYA 03-05-1977 III/b DOKTER SPESIALIS JANTUNG DAN PEMBULUH DARAH RSUD Dr.. DEDI SUSILA, Sp.An.KMN L SURABAYA 20-03-1977 III/b ANESTESIOLOGI DAN

Sampel atau contoh ialah sebagian dari populasi yang dianggap mewakili populasi (Simamora 2002). Populasi dalam penelitian ini adalah nelayan pemilik dan nelayan buruh unit

Perhatian.. materi proklamasi kemerdekaan secara individu. Siswa diminta kembali ke kelompok diskusi yang telah ditentukan sebelumnya. Siswa dan guru bertanya jawab

Yang berada di lingkaran I sampai dengan V adalah kerjasama yang sudah dirintis dan program sudah tersusun, sedang yang berada diluar lingkaran I – V, tapi berada dalam lingkaran

Kebijakan yang terkait dengan sasaran untuk meretas ketertinggalan menyangkut peningkatan daya saing daerah melalui pengembangan teknologi yang berorientasi pada

Enkripsi  maklumat  dilakukan  jika  diperlukan  atau  menggunakan  kawalan  lain  seperti  kawalan  akses,  pengurusan  kata  laluan  dan  bentuk‐bentuk 

Merupakan kebanggaan tersendiri karena telah melalui perjuangan sangat berat, dan akhirnya penulis dapat menyelesaikan tugas akhir dengan judul “Penggunaan Metode Sosiodrama Melalui

Teknik pengambilan data dalam penelitian ini adalah dokumentasi dengan analisis data yang bersifat deskriptif (descriptive analisys). Hasil penelitian ini menunjukan: 1)