MODEL RULE PENYEBAB MAHASISWA PERGURUAN TINGGI
PINDAH DENGAN METODE DECISION TREE
TESIS
AFEN PRANA UTAMA SEMBIRING
097038029/TIF
PROGRAM STUDI S2 TEKNIK INFORMATIKA
FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI
UNIVERSITAS SUMATERA UTARA
MEDAN
2013
MODEL RULE PENYEBAB MAHASISWA PERGURUAN TINGGI
PINDAH DENGAN METODE DECISION TREE
TESIS
Diajukan untuk melengkapi tugas dan memenuhi syarat memperoleh ijazah
Magister Teknik Informatika
AFEN PRANA UTAMA SEMBIRING
097038029/TIF
PROGRAM STUDI S2 TEKNIK INFORMATIKA
FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA
MEDAN 2013
PERSETUJUAN
Judul : MODEL RULE PENYEBAB MAHASISWA
PERGURUAN TINGGI PINDAH DENGAN METODE DECISION TREE
Kategori : Tesis
Nama : Afen Prana Utama Sembiring
Nomor Induk Mahasiswa : 097038029
Program Studi : S2 Teknik Informatika
Fakultas : ILMUKOMPUTER DAN TEKNOLOGI INFORMASI
UNIVERSITAS SUMATERA UTARA Komisi Pembimbing :
Pembimbing 2 Pembimbing 1
Dr. ZakariasSitumorang Prof. Dr. Muhammad Zarlis
Diketahui/disetujui oleh
Program Studi S2 Teknik Informatika Ketua
Prof. Dr. Muhammad Zarlis NIP : 195707011986011003
PERNYATAAN
MODEL RULE PENYEBAB MAHASISWA PERGURUAN TINGGI PINDAH DENGAN METODE DECISION TREE
TESIS
Saya mengakui bahwa tesis ini adalah hasil kerja saya sendiri, kecuali beberapa kutipan dan ringkasan yang masing-masing telah disebutkan sumbernya.
Medan, 10 Juli 2013
Afen Prana Utama Sembiring 097038029
PERNYATAAN PERSETUJUAN PUBLIKASI
KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS
Sebagai sivitas akademika Universitas Sumatera Utara, saya yang bertanda tangan di bawah ini:
Nama : AFEN PRANA UTAMA SEMBIRING Nim : 097038029
Program Studi : Magister (S2) TeknikInformatika JenisKaryaIlmiah : TESIS
Demi pengembangan ilmu pengetahuan, menyetujui untuk memberikan kepada Universitas Sumatera Utara Hak Bebas Royalti Non-Eksklusif (Non-Exclusive Royalty free Right) atas tesis saya yang berjudul:
MODEL RULE PENYEBAB MAHASISWA PERGURUAN TINGGI
PINDAH DENGAN METODE DECISION TREE
Beserta perangkat yang ada (jika diperlukan).Dengan Hak Bebas Royalti Non-Eksklusif ini, Universitas Sumatera Utara berhak menyimpan, mengalih media, memformat, mengelola dalam bentuk database, merawat dan mempublikasikan Tesis saya tanpa meminta izin dari saya selama tetap mencantumkan nama saya sebagai penulis dan sebagai pemegang dan atau sebagai pemilik hak cipta.
Demikian pernyataan ini dibuat dengan sebenarnya.
Medan, 10 Juli 2013
Afen Prana Utama Sembiring. 097038029
Telah diuji pada Tanggal :10 Juli 2013
PANITIA PENGUJI TESIS
Ketua : Prof. Dr. Muhammad Zarlis. Anggota : 1. Dr. ZakariasSitumorang, M.T.
2. Prof. Dr. Opim Salim Sitompul. 3. Prof. Dr.Herman Mawengkang. 4. Prof. Dr. Tulus, VorDipl.Math., M.Si.
RIWAYAT HIDUP
DATA PRIBADI
Nama lengkap : AfenPranaUtama Sembiring, S.T., M.Kom. TempatdanTanggalLahir : Medan, 27 April 1974
AlamatRumah : Jl. Sei Batanghari No. 58 A Medan - 20121
Telepon / HP : (061)4155410 / +628126088893
Email : afen366@yahoo.com
InstansiTempatBekerja : STMIK-STIE MIKROSKIL Alamat Kantor : Jl. Thamrin No 122, 124, 140
Medan - 20212 Telepon : (061) 4573767
DATA PENDIDIKAN
SD : SD NEGERI No. 060831 TAMAT : 1987 SMP : SMP TUNAS KARTIKA-1 TAMAT : 1990 SMU : SMA TUNAS KARTIKA-2 TAMAT : 1993 S1 : STT Mandala Bandung TAMAT : 2001 S2 : Teknik Informatika USU TAMAT : 2013
KATA PENGANTAR
Pertama-tama kami panjatkan puji syukur kehadirat Tuhan Yang Maha Esa atas segala limpahan rakhmad dan karunia-Nya sehingga Tesis ini dapat diselesaikan melalui bimbingan, arahan dan bantuan yang diberikan berbagai pihak khususnya pembimbing, pembanding, para dosen, khususnya mahasiswa Program Studi S2 Teknik Informatika di Fakultas Ilmu Komputer dan Teknologi Informasi Universitas Sumatera Utara.
Tesis dengan judul: ”Model Rule Penyebab Mahasiswa Perguruan Tinggi Pindah Dengan Metode Decision Tree” adalah merupakan Tesis dan syarat untuk memperoleh ijazah magister pada Program Studi S2 Teknik Informatika Fakultas Ilmu Komputer dan Teknologi Informasi Universitas Sumatera Utara.
Dengan selesainya tesis ini, perkenankanlah penulis mengucapkan terima kasih yang sebesar-besarnya kepada:
Ketua STMIK Mikroskil Dr. Mimpin Ginting, M.S, beserta jajarannya yang telah memberikan izin, dukungan dan kesempatan kepada penulis untuk mengikuti pendidikan lanjutan pada Program Studi S2 Teknik Informatika Universitas Sumatera Utara.
Rektor Universitas Sumatera Utara, Prof. Dr. dr. Syahril Pasaribu, DTM&H, M,Sc (CTM), Sp. A(K) atas kesempatan yang diberikan kepada penulis untuk mengikuti dan menyelesaikan pendidikan Program Studi S2 Teknik Informatika Universitas Sumatera Utara.
Dekan Fakultas Ilmu Komputer dan Teknologi Informasi Universitas Sumatera Utara, Prof. Dr. Muhammad Zarlis yang juga sebagai Ketua Program Studi S2 Teknik Informatika atas kesempatan yang diberikan kepada penulis menjadi mahasiswa Program Studi S2 Teknik Informatika Fakultas Ilmu Komputer dan Teknologi Informasi Universitas Sumatera Utara.
Sekretaris Program Studi S2 Teknik Informatika M. Andri Budiman, ST, M. Comp. Sc, M.EM. beserta seluruh Staff Pengajar dan Staff Administrasi yang telah memberikan bantuan dan pelayanan yang baik selama mengikuti perkuliahan.
Terimakasih yang tak terhingga dan penghargaan setinggi-tingginya kami ucapkan kepada Prof. Dr. Muhammad Zarlis selaku Pembimbing Utama dan Dr.
ii
Zakarias Situmorang, M.T selaku Pembimbing Anggota yang dengan penuh kesabaran membimbing dan memotivasi, serta memberi saran yang berkaitan dengan penyusunan tesis ini sehingga penulis dapat menyelesaikan tesis ini dengan baik.
Terimakasih yang tak terhingga dan penghargaan setinggi-tingginya kepada Prof. Dr. Herman Mawengkang, Prof. Dr. Opim Salim Sitompul, Prof. Dr. Tulus sebagai pembanding, yang telah memberikan saran, masukan dan arahan yang baik demi penyelesaian tesis ini.
Orangtua tercinta Ibunda M Br Ginting, serta Ibu Mertua K Br Sitepu (+) serta semua keluarga yang senantiasa mendoakan, dan memberikan dorongan kepada penulis.
Istri tercinta, Helen Morina Ginting, A.Md, beserta anak anakku terkasih Deryl Aditya, Jessica Nadine Regina dan Shelly Christine yang selalu mendoakan, memberikan semangat, dengan kasih dan sabar selama penulis mengikuti pendidikan, budi baik ini tidak dapat dibalas hanya diserahkan kepada Tuhan Yang Maha Esa. Sekali lagi terima kasih.
Kepada semua pihak yang tidak dapat penulis sebutkan satu persatu dalam tesis ini, terima kasih atas segala bantuan yang diberikan. Sekecil apapun yang Anda berikan untuk penulis turut menghantarkan penulis untuk menyelesaikan pendidikan yang ditempuh selama ini. Dengan segala kekurangan dan kerendahan hati, semoga kiranya Tuhan Yang Maha Kuasa membalas segala bantuan, kebaikan yang telah diberikan.
Medan, 10 Juli 2013 Penulis,
iii
ABSTRAK
Faktor-faktor yang mempengaruhi potensi mahasiswa mengundurkan diri/pindah masih belum dapat diketahui dengan pasti. Data mahasiswa diperoleh dari database mahasiswa STMIK Mikroskil dan hasil survei terhadap mahasiswa tahun ajaran 2011 dan 2012 yang dilakukan melalui website. Algoritma teknik data mining yang digunakan adalah algoritma C 4.5 untuk mendapatkan decision tree sehingga mendapatkan suatu model aturan/rule yang dapat memperlihatkan keterhubungan IPK antara data ekonomi orang tua, dukungan keluarga, fasilitas, motivasi, confidence, dan kualitas pelayanan terhadap faktor-faktor mahasiswa yang diprediksi berpotensi mengundurkan diri/pindah dan memerlukan perhatian ekstra. Model aturan yang diperoleh menunjukkan bahwa keenam variable predictor memberikan kontribusi 80.2 %. Sedangkan variabel terbaik dari prediktor yang digunakan adalah faktor ekonomi yang memberikan kontribusi sebesar 58.3% terhadap mahasiswa yang berpotensi mengundurkan diri/pindah.
iv
MODEL RULE THE CAUSE OF COLLEGE STUDENT MOVING
WITH A METHOD OF DECISION TREE
ABSTRACT
Factors that influence students' potential resigned still not be known with certainty. Student data obtained from the database of students STMIK Mikroskil and the results of a survey of student academic year 2011 and 2012 were carried out through the website. Algorithms data mining technique used is the algorithm C 4.5 to get the decision tree so getting a model rule that can demonstrate a grade point average connectedness between economic data of parents, family support, facilities, motivation, confidence, and quality of service to the factors students potentially predictable resigned and require extra attention. Model rules showed that six predictor variables contribute 80.2%. While the best of predictor variables used are economic factors which contributed 58.3% of the students who could potentially resigned. Key Word : Algorithms C 4.5, decision tree, model rule.
v DAFTAR ISI Halaman KATA PENGANTAR i ABSTRAK iii ABSTRACT iv DAFTAR ISI v
DAFTAR TABEL viii
DAFTAR GAMBAR x DAFTAR LAMPIRAN xi BAB I PENDAHULUAN 1 1.1 Latar Belakang 1 1.2 Perumusan Masalah 2 1.3. Batasan Masalah 2 1.4 Tujuan Penelitian 3 1.5 Manfaat Penelitian 3
BAB II TINJAUAN PUSTAKA 4
2.1 Pengunduran Diri Mahasiswa 4
2.2 Pengertian Data Mining 5
2.3 Pengelompokan Data Mining 10 2.4 Pengertian Decision Tree 12
2.5 Algoritma C 4.5 13
2.6 Ekstraksi Rule dari Decision Tree 20
2.7 Riset- riset Terkait 23
2.8 Persamaan dengan Riset – riset lain 23 2.9 Perbedaan dengan Riset-riset lain 24
2.10 Kontribusi Riset 24
BAB III METODE PENELITIAN 26
3.1. Pendahuluan 26
3.2 Lokasi dan Waktu Penelitian 26
vi
3.4 Prosedur Pengumpulan Data 27 3.4.1 Mahasiswa Mengundurkan Diri 27 3.4.2 Mahasiswa Berpotensi Mengundurkan Diri 27 3.5 Validitas dan Reabilitas (Keakuratan Data) 30
3.6 Preprocessing Data 30
3.6.1 Preprocessing Database Akademik 30 3.6.2 Preprocessing Data Kuesioner 33
3.7 Alat Analisis Data 34
3.7.1 Paket Statitik Untuk Ilmu Sosial 34 3.7.2 Komunitas Rapid Miner 34
3.8 Instrument Penelitian 35
3.9 Diagram Aktifitas Kerja Penelitian 37
BAB IV HASIL DAN PEMBAHASAN 40
4.1. Pendahuluan 40
4.2 Hasil Transformasi Data Set Pengunduran Diri
Mahasiswa 40
4.3 Hasil Transformasi Data Set 42 4.3.1 Hasil Percobaan Sampel Data 42 4.3.2 Hasil Percobaan Descriptive Data 45 4.3.3 Hasil Percobaan Frekuensi Data 46 4.3.3.1 Statistik Frekuensi Faktor Ekonomi 46 4.3.3.2 Statistik Frekuensi Faktor Dukungan
Keluarga 47
4.3.3.3 Statistik Frekuensi Faktor Fasilitas Belajar 47 4.3.3.4 Statistik Frekuensi Faktor Motivasi 48 4.3.3.5 Statistik Frekuensi Faktor Confidence 49 4.3.3.6 Statistik Frekuensi Faktor Kualitas
Pelayanan 50
4.3.4 Signifikan 51
4.4.4 Hasil Percobaan Decision Tree 53
BAB V KESIMPULAN DAN SARAN 70
5.1. Kesimpulan 70
vii
DAFTAR PUSTAKA 72
viii
DAFTAR TABEL
Halaman Tabel 2.1 Keputusan Bermain Tenis 15 Tabel 2.2 Perhitungan Node 1 17 Tabel 2.3 Perhitungan Node 1.1 18
Tabel 2.4 Perhitungan Node 1.1.2 19
Tabel 3.1 Tampilan Data Set Pertama Pengunduran Diri 27 Tabel 3.2 Tampilan Data Set Pertama Potensi Mengundurkan Diri 28 Tabel 3.3 Tampilan Data Set Kedua 28 Tabel 3.4 Tampilan Data Set Pertama dan Kedua 29
Tabel 3.5 Mahasiswa Pindah 31
Tabel 3.6 Biodata Mahasiswa 32
Tabel 3.7 Sks Lulus Mahasiswa 32
Tabel 3.8 Data Penelitian 33
Tabel 3.9 Data Kuesioner 33
Tabel 4.1 Korelasi Signifikan IPK dan Pendidikan Orang Tua 41 Tabel 4.2 Signifikan dan Reliabilitas Statistik Faktor Ekonomi
Orang Tua 42
Tabel 4.3 Signifikan dan Reliabilitas Statistik Faktor Dukungan
Keluarga 42
Tabel 4.4 Signifikan dan Reliabilitas Statistik Faktor Fasilitas Belajar 43 Tabel 4.5 Signifikan dan Reliabilitas Statistik Faktor Motivasi 43 Tabel 4.6 Signifikan dan Reliabilitas Statistik Faktor Confidence 43 Tabel 4.7 Signifikan dan Reliabilitas Statistik Faktor Kualitas Pelayanan 44 Tabel 4.8 Signifikan dan Reliabilitas Statistic Data 44 Tabel 4.9 Descriptive Statistik Testing Data 45 Tabel 4.10 Hasil Uji Frekuensi Faktor Ekonomi Orang Tua 46 Tabel 4.11 Hasil Uji Frekuensi Faktor Dukungan Keluarga 47 Tabel 4.12 Hasil Uji Frekuensi Faktor Fasilitas Belajar 48 Tabel 4.13 Hasil Uji Frekuensi Faktor Motivasi 48
ix
Tabel 4.14 Hasil Uji Frekuensi Faktor Confidence 49 Tabel 4.15 Hasil Uji Frekuensi Faktor Kualitas Pelayanan 50 Tabel 4.16 Statistik Frekuensi Enam Faktor Pendukung 51 Tabel 4.17 Korelasi Signifikan dari Enam Prediktor Variable Predikat 52 Tabel 4.18 Signifikan Dari Enam Variable Prediktor 53 Tabel 4.19 Keterangan Rule Grafik 54 Tabel 4.20 Keterangan Rule Text dengan Gain Rasio 59 Tabel 4.21 Model Aturan Penyederhanaan Induction Rule 64
x
DAFTAR GAMBAR
Halaman
Gambar 2.1 Bidang Ilmu Data Mining 6
Gambar 2.2 Taksonomi Data Mining 7
Gambar 2.3 Tahap-tahap Data Mining 8
Gambar 2.4 Pohon Keputusan Hasil Perhitungan Node 1 18
Gambar 2.5 Pohon Keputusan Hasil Perhitungan Node 1.1 19
Gambar 2.6 Pohon Keputusan Hasil Perhitungan Node 1.1.2 20
Gambar 3.1 Proses Percobaan 35
Gambar 3.2 Diagram Aktivitas Kerja Penelitian 38
Gambar 4.1 Grafik Decision Tree 53
Gambar 4.2 Model Aturan Text Decision Tree 58
Gambar 4.3 Model Aturan Induction Rule 64
Gambar 4.4 Hubungan Antara Predikat Dengan Ekonomi Orang Tua 66 Gambar 4.5 Hubungan Antara Predikat Dengan Dukungan Keluarga 67
Gambar 4.6 Hubungan Antara Predikat Dengan Fasilitas 67
Gambar 4.7 Hubungan Antara Predikat Dengan Motivasi 68
Gambar 4.8 Hubungan Antara Predikat Confidence 68
xi
DAFTAR LAMPIRAN
Halaman
Lampiran A Bentuk Kuesioner Mahasiswa 74
Lampiran B Jawaban Kuesioner Mahasiswa 77
Lampiran C Database Mahasiswa SIPT 78
Lampiran D Output Korelasi Signifikan 82
Lampiran E Output Reliabilitas Keenam Faktor 84
Lampiran F Output Descriptive Statistik Pengujian 96
Lampiran G Output Statistik Frekuensi Enam Faktor 98