MODEL ATURAN KETERHUBUNGAN DATA MAHASISWA
MENGGUNAKAN ALGORITMA C 4.5 UNTUK
MENINGKATKAN INDEKS PRESTASI
TESIS
Oleh
DEDY HARTAMA
097038009/TIF
PROGRAM STUDI MAGISTER (S2) TEKNIK INFORMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS SUMATERA UTARA
MEDAN
MODEL ATURAN KETERHUBUNGAN DATA MAHASISWA
MENGGUNAKAN ALGORITMA C 4.5 UNTUK
MENINGKATKAN INDEKS PRESTASI
TESIS
Diajukan sebagai salah satu syarat untuk memperoleh gelar
Magister Komputer dalam Program Studi Magister
Teknik Informatika pada Program Pascasarjana
Fakultas MIPA Universitas Sumatera Utara
Oleh
DEDY HARTAMA
097038009/TIF
PROGRAM STUDI MAGISTER (S2) TEKNIK INFORMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS SUMATERA UTARA
MEDAN
PENGESAHAN TESIS
Judul Tesis : MODEL ATURAN KETERHUBUNGAN DATA MAHASISWA MENGGUNAKAN ALGORITMA C 4.5 UNTUK
MENINGKATKAN INDEKS PRESTASI Nama Mahasiswa : DEDY HARTAMA
Nomor Induk Mahasiswa : 097038009
Program Studi : Magister Teknik Informatika
Fakultas : Matematika dan Ilmu Pengetahuan Alam Universitas Sumatera Utara
Menyetujui Komisi Pembimbing
Dr. Zakarias Situmorang Prof. Dr. Herman Mawengkang
Anggota Ketua
Ketua Program Studi,
Prof. Dr. Muhammad Zarlis NIP : 195707011986011003
PERNYATAAN ORISINALITAS
MODEL ATURAN KETERHUBUNGAN DATA MAHASISWA
MENGGUNAKAN ALGORITMA C 4.5 UNTUK
MENINGKATKAN INDEKS PRESTASI
TESIS
Dengan ini saya nyatakan bahwa saya mengakui semua karya tesis ini adalah hasil kerja saya sendiri kecuali kutipan dan ringkasan yang tiap bagiannya telah di jelaskan sumbernya dengan benar.
Medan, 19 April 2011
DEDY HARTAMA. NIM : 097038009
PERNYATAAN PERSETUJUAN PUBLIKASI
KARYA ILMIAH UNTUK KEPENTINGAN
AKADEMIS
Sebagai sivitas akademika Universitas Sumatera Utara, saya yang bertanda tangan di bawah ini:
Nama : DEDY HARTAMA
Nim : 097038009
Program Studi : Magister ( S2) Teknik Informatika Jenis Karya Ilmiah : TESIS
Demi pengembangan ilmu pengetahuan, menyetujui untuk memberikan kepada Universitas Sumatera Utara Hak Bebas Royalti Non-Eksklusif (Non-Exclusive Royalty free Right) atas Tesis saya yang berjudul:
MODEL ATURAN KETERHUBUNGAN DATA MAHASISWA
MENGGUNAKAN ALGORITMA C 4.5 UNTUK
MENINGKATKAN INDEKS PRESTASI
Beserta perangkat yang ada (jika diperlukan). Dengan Hak Bebas Royalti Non-Eksklusif ini, Universitas Sumatera Utara berhak menyimpan, mengalih media, memformat, mengelola dalam bentuk database, merawat dan mempublikasikan Tesis saya tanpa meminta izin dari saya selama tetap mencantumkan nama saya sebagai penulis dan sebagai pemegang dan atau sebagai pemilik hak cipta.
Demikian pernyataan ini dibuat dengan sebenarnya.
Medan, 19 April 2011
DEDY HARTAMA. NIM : 097038009
Telah diuji pada
Tanggal : 19 April 2011
PANITIA PENGUJI TESIS
Ketua : Prof. Dr. Herman Mawengkang Anggota : 1. Prof. Dr. Muhammad Zarlis 2. Dr. Zakarias Situmorang
3. M. Andre Budiman, ST, M. Comp. Sc, M.EM 4. Amer Sharif, S.Si, M.Kom
RIWAYAT HIDUP
DATA PRIBADI
Nama lengkap berikut gelar : Dedy Hartama, ST
Tempat dan Tanggal Lahir : Marihat, 11 Oktober 1973 Alamat Rumah : Jl. Jawa Gg Sate Atas No. 1
Pematangsiantar
Telepon / HP : (0622)25671 / +628126438793
Email : dedyhartama@yahoo.com
Instansi Tempat Bekerja : AMIK Tunas Bangsa
Alamat Kantor : Jl. Jendral Sudirman Blok A No. 1,2,3 Pematangsiantar
Telepon : (0622) 22431
DATA PENDIDIKAN
SD : SD NEGERI No. 095210 Tamat : 1986
SMP : SMP NEGERI 8 Tamat : 1989
SMU : SMU NEGERI 3 Tamat : 1992
D3 : FMIPA Ilmu Komuter USU Tamat : 1996 Strata-1 : STT Harapan Medan Tamat : 2003 Strata-2 : PSMTIF PPs FMIPA USU Tamat : 2011
KATA PENGANTAR
Pertama-tama kami panjatkan puji syukur kehadirat Allah SWT Tuhan Yang Maha Esa atas segala limpahan rakhmad dan karunia-Nya sehingga Tesis ini dapat diselesaikan melalui bimbingan, arahan dan bantuan yang diberikan berbagai pihak khususnya pembimbing, pembanding, para dosen, teman teman mahasiswa, khususnya mahasiswa Program Studi Magister (S2) Teknik Informatika di FMIPA Universitas Sumatera Utara.
Tesis dengan judul: ” Model Aturan Keterhubungan Data Mahasiswa Menggunakan Algoritma C 4.5 untuk Meningkatkan Indeks Prestasi” adalah merupakan Tesis dan syarat untuk memperoleh gelar Magister Komputer dalam Program Studi Magister (S2) Teknik Informatika pada Program Pascasarjana FMIPA Universitas Sumatera Utara
Dengan selesainya tesis ini, perkenankanlah penulis mengucapkan terima kasih yang sebesar-besarnya kepada:
Ketua Yayasan Muhammad Nasir AMIK Tunas Bangsa Pematangsiantar H. Maulia Ahmad Ridwan Syah yang telah memberikan izin, bantuan moril dan materil dan kesempatan kepada penulis untuk mengikuti pendidikan lanjutan pada Program Pascasarjana FMIPA USU.
Rektor Universitas Sumatera Utara, Prof. Dr. dr. Syahril Pasaribu, DTM&H, M,Sc (CTM), Sp. A(K) atas kesempatan yang diberikan kepada penulis untuk mengikuti dan menyelesaikan pendidikan Program Magister (S2).
Dekan Fakultas MIPA Universitas Sumatera Utara, Dr. Sutarman, M.Sc atas kesempatan yang diberikan kepada penulis menjadi mahasiswa Program Magister (S2) pada Program Pascasarjana FMIPA Universitas Sumatera Utara.
Ketua Program Studi Magister (S2) Teknik Informatika, Prof. Dr. Muhammad Zarlis, Sekretaris Program Studi Magister (S2) Teknik Informatika M. Andri Budiman, ST, M. Comp. Sc, M.EM beserta seluruh Staff dan Staff Pengajar pada Program Studi Magister (S2) Teknik Informatika Program Pascasarjana Fakultas MIPA Universitas Sumatera Utara, yang telah bersedia membimbing penulis, sehingga dapat menyelesaikan pendidikan tepat pada waktunya.
Terimakasih yang tak terhingga dan penghargaan setinggi-tingginya kami ucapkan kepada Prof. Dr. Herman Mawengkang selaku Pembimbing Utama dan Dr. Zakarias Situmorang selaku Pembimbing Anggota yang dengan penuh kesabaran membimbing, memotivasi, memberikan dukungan moril, kritik dan saran serta memberikan bahan-bahan yang berkaitan dengan penyusunan tesis ini sehingga penulis dapat menyelesaikan tesis ini dengan baik.
Terimakasih yang tak terhingga dan penghargaan setinggi-tingginya kami ucapkan kepada Prof. Dr. Muhammad Zarlis, M. Andre Budiman, ST, M. Comp. Sc, M.EM, dan Amer Sharif, S.Si, M.Kom sebagai pembanding, yang telah memberikan saran, masukan dan arahan yang baik demi penyelesaian tesis ini.
Seluruh Staf Pengajar dan Administrasi, Program Studi Magister (S2) Teknik Informatika Program Pascasarjana Fakultas MIPA Universitas Sumatera Utara yang telah memberikan bantuan dan pelayanan yang baik kepada penulis selama mengikuti perkuliahan.
Orangtua tercinta Ayahanda dan Ibunda, serta Ibu Mertua serta semua keluarga yang senantiasa mendoakan, dan memberikan dorongan kepada penulis.
Istri tercinta, Nina Fadilah, S.S yang selalu mendoakan, memberikan semangat, dengan kasih, sabar dan bantuan selama penulis mengikuti pendidikan, budi baik ini tidak dapat dibalas hanya diserahkan kepada Allah SWT, Tuhan Yang maha Esa. Sekali lagi terima kasih.
Rekan Mahasiswa Angkatan Pertama Program Studi Magister (S2) Teknik Informatika Komputer FMIPA Universitas Sumatera Utara dan Rekan Sejawat di AMIK Tunas Bangsa Pematangsiantar yang telah banyak membantu penulis selama mengikuti perkuliahan.
Kepada semua pihak yang tidak dapat penulis sebutkan satu persatu dalam tesis ini, terima kasih atas segala bantuan yang diberikan. Sekecil apapun yang Anda berikan untuk penulis turut menghantarkan penulis untuk menyelesaikan pendidikan yang ditempuh selama ini. Dengan segala kekurangan dan kerendahan hati, semoga kiranya Allah SWT Tuhan Yang Maha Kuasa membalas segala bantuan, kebaikan yang telah diberikan.
Medan, April 2011 Penulis,
MODEL ATURAN KETERHUBUNGAN DATA MAHASISWA
MENGGUNAKAN ALGORITMA C 4.5 UNTUK
MENINGKATKAN INDEKS PRESTASI
ABSTRAK
Tesis ini mengusulkan sebuah model aturan keterhubungan data mahasiswa dengan indeks prestasi di perguruan tinggi swasta. Faktor-faktor mana yang lebih dominan yang mempengaruhi indeks prestasi belum dapat diketahui dengan pasti. Data diperoleh dari database Akademik AMIK Tunas Bangsa dan hasil survei terhadap mahasiswa semester III tahun ajaran 2008 dan 2009. Dalam tesis ini algoritma C 4.5 decision tree diaplikasikan agar mendapatkan suatu model aturan yang dapat memperlihatkan keterhubungan antara nilai rata rata matakuliah kurikulum berbasis kompetensi dengan data ekonomi, dukungan orang tua dan fasilitas belajar terhadap indeks prestasi mahasiswa. Model aturan yang diperoleh menunjukkan bahwa variabel terbaik dari prediktor yang digunakan adalah faktor ekonomi yang memberikan kontribusi sebesar 79,8% terhadap indeks prestasi mahasiswa.
THE CONNECTEDNESS RULE MODEL OF STUDENT
DATA USING C 4.5 ALGORITHM TO IMPROVE
STUDENT ACHIEVEMENT
ABSTRACT
This thesis proposes the connectedness rule model of Students’ data with the student achievement in a private college. The more dominant factors that influence the student achievement is not exactly known yet. The data are taken from the database of the Academy of Management and Information Tunas Bangsa in Pematangsiantar and from the result of the survey on the university students of the third semester for the year of 2008 and 2009. In this thesis The C 4.5 algorithm decision tree is applied so that we can get a rule model that shows the connectedness between the average marks of the curriculum based on the competency with the economic data, parental support and the learning facilities with the university students’ achievement. The rule model that is taken shows that the best variable from the prediction which is used is the economic factor that gives contribution nearly 79,81 % to the university students’ achievement.
DAFTAR ISI Halaman KATA PENGANTAR i ABSTRAK iv ABSTRACT v DAFTAR ISI vi
DAFTAR TABEL viii
DAFTAR GAMBAR x DAFTAR LAMPIRAN xi BAB I PENDAHULUAN 1 1.1 Latar Belakang 1 1.2 Perumusan Masalah 4 1.3. Batasan Masalah 4 1.4 Tujuan Penelitian 4 1.5 Manfaat Penelitian 4
BAB II TINJAUAN PUSTAKA 6
2.1 Pengertian Data Mining 6
2.2 Pengelompokan Data Mining 14
2.3 Decision Tree 17
2.4 Algoritma C 4.5 17
2.5 Ekstraksi Rule dari Decision Tree 26
2.6 Riset- riset Terkait 27
2.7 Persamaan dengan Riset – riset lain 28 2.8 Perbedaan dengan Riset-riset lain 29
2.9 Kontribusi Riset 29
BAB III METODE PENELITIAN 31
3.1. Pendahuluan 31
3.2 Lokasi dan Waktu Penelitian 31
3.3 Rancangan Penelitian 32
3.5 Validitas dan Reabilitas (Keakuratan Data) 36
3.6 Preprocessing Data 36
3.6.1 Preprocessing Database Akademik 36 3.6.2 Preprocessing Data Kuesioner 38
3.7 Alat Analisis Data 39
3.7.1 Paket Statitik Untuk Ilmu Sosial 39 3.7.2 Komunitas Rapid Miner 39
3.8 Instrument Penelitian 40
3.9 Diagram Aktifitas Kerja Penelitian 41
3.10 Model Decision Tree 42
BAB IV HASIL DAN PEMBAHASAN 44
4.1. Pendahuluan 44
4.2 Hasil Percobaan 44
4.2.1 Hasil Percobaan Sampel Data 45 4.2.2 Hasil Percobaan Descriptive Data 47 4.2.3 Hasil Percobaan Frekuensi Data 48 4.2.3.1 Statistik Frekuensi Faktor Ekonomi 48 4.2.3.2 Statistik Frekuensi Faktor Dukungan
Orang Tua 48
4.2.3.3 Statistik Frekuensi Faktor Fasilitas
Belajar Mahasiswa 49 4.2.4 Signifikan dan Multicollinearity 50
4.2.4.1 Signifikan 50
4.2.4.2 Multicollinearity 52
4.2.5 Hasil Percobaan Decision Tree 53
4.2.6.Validasi Decision Tree 60
BAB V KESIMPULAN DAN SARAN 62
5.1. Kesimpulan 62
5.2 Saran 63
DAFTAR PUSTAKA 64
DAFTAR TABEL
Nomor J u d u l Halaman
2.1 Keputusan Bermain Tenis 20
2.2 Perhitungan Node 1 22
2.3 Perhitungan Node 1.1 24
2.4 Perhitungan Node 1.1.2 25
3.1 Meta Data View Data Set Pertama 34 3.2 Meta Data View Data Set Kedua 35 3.3 Meta Data View Data Set Pertama dan Kedua 35
3.4 Statistik Reliabilitas Data 36
3.5 Preprocessing Data Gabungan 4 Tabel 37
3.6 Tabel Data Penelitian 38
3.7 Data Kuesioner 38
4.1 Signifikan dan Reliabilitas Statistik Faktor Ekonomi 45 4.2 Signifikan dan Reliabilitas Statistik Dukungan
Orang Tua 45
4.3 Signifikan dan Reliabilitas Statistik Faktor Fasilitas
Belajar 46
4.4 Signifikan dan Reliabilitas Statistik Data 46 4.5 Descriptive Statistics Testing Data 47 4.6 Statistics Frequency Faktor Ekonomi 48 4.7 Statistics Frequency Faktor Dukungan Orang Tua 48 4.8 Statistics Frequency Faktor Fasilitas Belajar Mahasiswa 49 4.9 Statistics Frequency Tiga Faktor Pendukung 50 4.10 Korelasi Signifikan dari Empat Prediktor Variabel Predikat 51 4.11 Signifikan dari Empat Variabel Prediktor Predikat 52
4.12 Multicollinearity Diagnostik 52
4.13 Keterangan Rule Grafik 54
4.14 Keterangan Rule Text dengan Gain Rasio 56 4.15 Model Aturan Penyederhanaan Induction Rule 57
DAFTAR GAMBAR
Nomor J u d u l Halaman
2.1 Bidang Ilmu Data Mining 09
2.2 Proses dari Data Mining 11
2.3 Proses Data Mining Menurut CRISP-DM 12 2.4 Pohon Keputusan Hasil Perhitungan Node 1 23 2.5 Pohon Keputusan Hasil Perhitungan Node 1.1 24 2.6 Pohon Keputusan Hasil Perhitungan Node 1.1.2 26 3.1 Record dari Database Pendidikan 32 3.2 Rancangan Penelitian Aturan Indeks Prestasi 33
3.3 Pra Pengolahan Data 37
3.4 Proses Percobaan 40
3.5 Diagram Aktivitas Kerja Penelitian 41 3.6 Model Decision Tree Grafik 42
4.1 Grafik Decision Tree 53
4.2 Model Aturan Text Decision Tree 55 4.3 Model Aturan Induction Rule 57
4.4 Profil Predikat Kelulusan 58
4.5 Hubungan Predikat dengan Rata MKK 58 4.6 Hubungan Predikat dengan Rata MBB 59 4.7 Hubungan Predikat dengan Rata MPK 59 4.8 Hubungan Predikat dengan Rata MKB 60 4.9 Desain Model Validasi Rapidminer 61 4.10 Nilai Accuracy Performance 61
DAFTAR LAMPIRAN
Nomor J u d u l Halaman
A Bentuk Kuesioner Mahasiswa L-1 B Sampel Data Mahasiswa dari Database L-3
C Sampel Training 60 Data L-4
D Korelasi Penelitian 734 Data L-5
E Daftar Mata Kuliah Semester 3 L-6
F Data Percobaan Pembuatan Aturan Decision Tree L-7
G Output Descriptive dan Frequency L-8