MODEL
RULE
PENYEBAB MAHASISWA PERGURUAN TINGGI
PINDAH DENGAN METODE
DECISION TREE
TESIS
AFEN PRANA UTAMA SEMBIRING
097038029/TIF
PROGRAM STUDI S2 TEKNIK INFORMATIKA
FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI
UNIVERSITAS SUMATERA UTARA
MEDAN
2013
MODEL
RULE
PENYEBAB MAHASISWA PERGURUAN TINGGI
PINDAH DENGAN METODE
DECISION TREE
TESIS
Diajukan untuk melengkapi tugas dan memenuhi syarat memperoleh ijazah
Magister Teknik Informatika
AFEN PRANA UTAMA SEMBIRING
097038029/TIF
PROGRAM STUDI S2 TEKNIK INFORMATIKA
FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI
UNIVERSITAS SUMATERA UTARA
MEDAN
PERSETUJUAN
Judul : MODEL RULE PENYEBAB MAHASISWA
PERGURUAN TINGGI PINDAH DENGAN METODE DECISION TREE
Kategori : Tesis
Nama : Afen Prana Utama Sembiring
Nomor Induk Mahasiswa : 097038029
Program Studi : S2 Teknik Informatika
Fakultas : ILMUKOMPUTER DAN TEKNOLOGI INFORMASI
UNIVERSITAS SUMATERA UTARA Komisi Pembimbing :
Pembimbing 2 Pembimbing 1
Dr. ZakariasSitumorang Prof. Dr. Muhammad Zarlis
Diketahui/disetujui oleh
Program Studi S2 Teknik Informatika Ketua
Prof. Dr. Muhammad Zarlis NIP : 195707011986011003
PERNYATAAN
MODEL RULE PENYEBAB MAHASISWA PERGURUAN TINGGI PINDAH DENGAN METODE DECISION TREE
TESIS
Saya mengakui bahwa tesis ini adalah hasil kerja saya sendiri, kecuali beberapa kutipan
dan ringkasan yang masing-masing telah disebutkan sumbernya.
Medan, 10 Juli 2013
PERNYATAAN PERSETUJUAN PUBLIKASI
KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS
Sebagai sivitas akademika Universitas Sumatera Utara, saya yang bertanda tangan di bawah
ini:
Nama : AFEN PRANA UTAMA SEMBIRING
Nim : 097038029
Program Studi : Magister (S2) TeknikInformatika
JenisKaryaIlmiah : TESIS
Demi pengembangan ilmu pengetahuan, menyetujui untuk memberikan kepada Universitas
Sumatera Utara Hak Bebas Royalti Non-Eksklusif (Non-Exclusive Royalty free Right) atas
tesis saya yang berjudul:
MODEL
RULE
PENYEBAB MAHASISWA PERGURUAN TINGGI
PINDAH DENGAN METODE
DECISION TREE
Beserta perangkat yang ada (jika diperlukan).Dengan Hak Bebas Royalti Non-Eksklusif
ini, Universitas Sumatera Utara berhak menyimpan, mengalih media, memformat,
mengelola dalam bentuk database, merawat dan mempublikasikan Tesis saya tanpa
meminta izin dari saya selama tetap mencantumkan nama saya sebagai penulis dan sebagai
pemegang dan atau sebagai pemilik hak cipta.
Demikian pernyataan ini dibuat dengan sebenarnya.
Medan, 10 Juli 2013
Afen Prana Utama Sembiring. 097038029
Telah diuji pada Tanggal :10 Juli 2013
PANITIA PENGUJI TESIS
Ketua : Prof. Dr. Muhammad Zarlis. Anggota : 1. Dr. ZakariasSitumorang, M.T.
RIWAYAT HIDUP
DATA PRIBADI
Nama lengkap : AfenPranaUtama Sembiring, S.T., M.Kom.
TempatdanTanggalLahir : Medan, 27 April 1974
AlamatRumah : Jl. Sei Batanghari No. 58 A
Medan - 20121
Telepon / HP : (061)4155410 / +628126088893
Email : afen366@yahoo.com
InstansiTempatBekerja : STMIK-STIE MIKROSKIL
Alamat Kantor : Jl. Thamrin No 122, 124, 140
Medan - 20212
Telepon : (061) 4573767
DATA PENDIDIKAN
SD : SD NEGERI No. 060831 TAMAT : 1987
SMP : SMP TUNAS KARTIKA-1 TAMAT : 1990
SMU : SMA TUNAS KARTIKA-2 TAMAT : 1993
S1 : STT Mandala Bandung TAMAT : 2001
S2 : Teknik Informatika USU TAMAT : 2013
KATA PENGANTAR
Pertama-tama kami panjatkan puji syukur kehadirat Tuhan Yang Maha Esa
atas segala limpahan rakhmad dan karunia-Nya sehingga Tesis ini dapat diselesaikan
melalui bimbingan, arahan dan bantuan yang diberikan berbagai pihak khususnya
pembimbing, pembanding, para dosen, khususnya mahasiswa Program Studi S2
Teknik Informatika di Fakultas Ilmu Komputer dan Teknologi Informasi Universitas
Sumatera Utara.
Tesis dengan judul: ”Model Rule Penyebab Mahasiswa Perguruan Tinggi
Pindah Dengan Metode Decision Tree” adalah merupakan Tesis dan syarat untuk
memperoleh ijazah magister pada Program Studi S2 Teknik Informatika Fakultas Ilmu
Komputer dan Teknologi Informasi Universitas Sumatera Utara.
Dengan selesainya tesis ini, perkenankanlah penulis mengucapkan terima
kasih yang sebesar-besarnya kepada:
Ketua STMIK Mikroskil Dr. Mimpin Ginting, M.S, beserta jajarannya yang
telah memberikan izin, dukungan dan kesempatan kepada penulis untuk mengikuti
pendidikan lanjutan pada Program Studi S2 Teknik Informatika Universitas Sumatera
Utara.
Rektor Universitas Sumatera Utara, Prof. Dr. dr. Syahril Pasaribu, DTM&H,
M,Sc (CTM), Sp. A(K) atas kesempatan yang diberikan kepada penulis untuk
mengikuti dan menyelesaikan pendidikan Program Studi S2 Teknik Informatika
Universitas Sumatera Utara.
Dekan Fakultas Ilmu Komputer dan Teknologi Informasi Universitas Sumatera
Utara, Prof. Dr. Muhammad Zarlis yang juga sebagai Ketua Program Studi S2 Teknik
Informatika atas kesempatan yang diberikan kepada penulis menjadi mahasiswa
Program Studi S2 Teknik Informatika Fakultas Ilmu Komputer dan Teknologi
Informasi Universitas Sumatera Utara.
Sekretaris Program Studi S2 Teknik Informatika M. Andri Budiman, ST, M.
Comp. Sc, M.EM. beserta seluruh Staff Pengajar dan Staff Administrasi yang telah
memberikan bantuan dan pelayanan yang baik selama mengikuti perkuliahan.
Terimakasih yang tak terhingga dan penghargaan setinggi-tingginya kami
ii
Zakarias Situmorang, M.T selaku Pembimbing Anggota yang dengan penuh
kesabaran membimbing dan memotivasi, serta memberi saran yang berkaitan dengan
penyusunan tesis ini sehingga penulis dapat menyelesaikan tesis ini dengan baik.
Terimakasih yang tak terhingga dan penghargaan setinggi-tingginya kepada
Prof. Dr. Herman Mawengkang, Prof. Dr. Opim Salim Sitompul, Prof. Dr. Tulus
sebagai pembanding, yang telah memberikan saran, masukan dan arahan yang baik
demi penyelesaian tesis ini.
Orangtua tercinta Ibunda M Br Ginting, serta Ibu Mertua K Br Sitepu (+) serta
semua keluarga yang senantiasa mendoakan, dan memberikan dorongan kepada
penulis.
Istri tercinta, Helen Morina Ginting, A.Md, beserta anak anakku terkasih
Deryl Aditya, Jessica Nadine Regina dan Shelly Christine yang selalu mendoakan,
memberikan semangat, dengan kasih dan sabar selama penulis mengikuti pendidikan,
budi baik ini tidak dapat dibalas hanya diserahkan kepada Tuhan Yang Maha Esa.
Sekali lagi terima kasih.
Kepada semua pihak yang tidak dapat penulis sebutkan satu persatu dalam
tesis ini, terima kasih atas segala bantuan yang diberikan. Sekecil apapun yang Anda
berikan untuk penulis turut menghantarkan penulis untuk menyelesaikan pendidikan
yang ditempuh selama ini. Dengan segala kekurangan dan kerendahan hati, semoga
iii
ABSTRAK
Faktor-faktor yang mempengaruhi potensi mahasiswa mengundurkan diri/pindah masih belum dapat diketahui dengan pasti. Data mahasiswa diperoleh dari database
mahasiswa STMIK Mikroskil dan hasil survei terhadap mahasiswa tahun ajaran 2011 dan 2012 yang dilakukan melalui website. Algoritma teknik data mining yang digunakan adalah algoritma C 4.5 untuk mendapatkan decision tree sehingga mendapatkan suatu model aturan/rule yang dapat memperlihatkan keterhubungan IPK antara data ekonomi orang tua, dukungan keluarga, fasilitas, motivasi,
confidence, dan kualitas pelayanan terhadap faktor-faktor mahasiswa yang diprediksi berpotensi mengundurkan diri/pindah dan memerlukan perhatian ekstra. Model aturan yang diperoleh menunjukkan bahwa keenam variable predictor memberikan kontribusi 80.2 %. Sedangkan variabel terbaik dari prediktor yang digunakan adalah faktor ekonomi yang memberikan kontribusi sebesar 58.3% terhadap mahasiswa yang berpotensi mengundurkan diri/pindah.
iv
MODEL
RULE
THE CAUSE OF COLLEGE STUDENT MOVING
WITH A METHOD OF DECISION TREE
ABSTRACT
Factors that influence students' potential resigned still not be known with certainty. Student data obtained from the database of students STMIK Mikroskil and the results of a survey of student academic year 2011 and 2012 were carried out through the website. Algorithms data mining technique used is the algorithm C 4.5 to get the decision tree so getting a model rule that can demonstrate a grade point average connectedness between economic data of parents, family support, facilities, motivation, confidence, and quality of service to the factors students potentially predictable resigned and require extra attention. Model rules showed that six predictor variables contribute 80.2%. While the best of predictor variables used are economic factors which contributed 58.3% of the students who could potentially resigned.
Key Word : Algorithms C 4.5, decision tree, model rule.
v
2.1 Pengunduran Diri Mahasiswa 4
2.2 Pengertian Data Mining 5
2.3 Pengelompokan Data Mining 10
2.4 Pengertian Decision Tree 12
2.5 Algoritma C 4.5 13
2.6 Ekstraksi Rule dari Decision Tree 20
2.7 Riset- riset Terkait 23
2.8 Persamaan dengan Riset – riset lain 23
2.9 Perbedaan dengan Riset-riset lain 24
2.10 Kontribusi Riset 24
BAB III METODE PENELITIAN 26
3.1. Pendahuluan 26
3.2 Lokasi dan Waktu Penelitian 26
vi
3.4 Prosedur Pengumpulan Data 27
3.4.1 Mahasiswa Mengundurkan Diri 27
3.4.2 Mahasiswa Berpotensi Mengundurkan Diri 27
3.5 Validitas dan Reabilitas (Keakuratan Data) 30
3.6 Preprocessing Data 30
3.6.1 Preprocessing Database Akademik 30
3.6.2 Preprocessing Data Kuesioner 33
3.7 Alat Analisis Data 34
3.7.1 Paket Statitik Untuk Ilmu Sosial 34
3.7.2 Komunitas Rapid Miner 34
3.8 Instrument Penelitian 35
3.9 Diagram Aktifitas Kerja Penelitian 37
BAB IV HASIL DAN PEMBAHASAN 40
4.1. Pendahuluan 40
4.2 Hasil Transformasi Data Set Pengunduran Diri
Mahasiswa 40
4.3 Hasil Transformasi Data Set 42
4.3.1 Hasil Percobaan Sampel Data 42
4.3.2 Hasil Percobaan Descriptive Data 45
4.3.3 Hasil Percobaan Frekuensi Data 46
4.3.3.1 Statistik Frekuensi Faktor Ekonomi 46
4.3.3.2 Statistik Frekuensi Faktor Dukungan
Keluarga 47
4.3.3.3 Statistik Frekuensi Faktor Fasilitas Belajar 47
4.3.3.4 Statistik Frekuensi Faktor Motivasi 48
4.3.3.5 Statistik Frekuensi Faktor Confidence 49
4.3.3.6 Statistik Frekuensi Faktor Kualitas
Pelayanan 50
4.3.4 Signifikan 51
4.4.4 Hasil Percobaan Decision Tree 53
BAB V KESIMPULAN DAN SARAN 70
5.1. Kesimpulan 70
5.2 Saran 70
vii
DAFTAR PUSTAKA 72
viii
Tabel 2.4 Perhitungan Node 1.1.2 19
Tabel 3.1 Tampilan Data Set Pertama Pengunduran Diri 27
Tabel 3.2 Tampilan Data Set Pertama Potensi Mengundurkan Diri 28
Tabel 3.3 Tampilan Data Set Kedua 28
Tabel 3.4 Tampilan Data Set Pertama dan Kedua 29
Tabel 3.5 Mahasiswa Pindah 31
Tabel 3.6 Biodata Mahasiswa 32
Tabel 3.7 Sks Lulus Mahasiswa 32
Tabel 3.8 Data Penelitian 33
Tabel 3.9 Data Kuesioner 33
Tabel 4.1 Korelasi Signifikan IPK dan Pendidikan Orang Tua 41
Tabel 4.2 Signifikan dan Reliabilitas Statistik Faktor Ekonomi
Orang Tua 42
Tabel 4.3 Signifikan dan Reliabilitas Statistik Faktor Dukungan
Keluarga 42
Tabel 4.4 Signifikan dan Reliabilitas Statistik Faktor Fasilitas Belajar 43
Tabel 4.5 Signifikan dan Reliabilitas Statistik Faktor Motivasi 43
Tabel 4.6 Signifikan dan Reliabilitas Statistik Faktor Confidence 43
Tabel 4.7 Signifikan dan Reliabilitas Statistik Faktor Kualitas Pelayanan 44
Tabel 4.8 Signifikan dan Reliabilitas Statistic Data 44
Tabel 4.9 Descriptive Statistik Testing Data 45
Tabel 4.10 Hasil Uji Frekuensi Faktor Ekonomi Orang Tua 46
Tabel 4.11 Hasil Uji Frekuensi Faktor Dukungan Keluarga 47
Tabel 4.12 Hasil Uji Frekuensi Faktor Fasilitas Belajar 48
Tabel 4.13 Hasil Uji Frekuensi Faktor Motivasi 48
ix
Tabel 4.14 Hasil Uji Frekuensi Faktor Confidence 49
Tabel 4.15 Hasil Uji Frekuensi Faktor Kualitas Pelayanan 50
Tabel 4.16 Statistik Frekuensi Enam Faktor Pendukung 51
Tabel 4.17 Korelasi Signifikan dari Enam Prediktor Variable Predikat 52
Tabel 4.18 Signifikan Dari Enam Variable Prediktor 53
Tabel 4.19 Keterangan Rule Grafik 54
Tabel 4.20 Keterangan Rule Text dengan Gain Rasio 59
x
xi
DAFTAR LAMPIRAN
Halaman
Lampiran A Bentuk Kuesioner Mahasiswa 74
Lampiran B Jawaban Kuesioner Mahasiswa 77
Lampiran C Database Mahasiswa SIPT 78
Lampiran D Output Korelasi Signifikan 82
Lampiran E Output Reliabilitas Keenam Faktor 84
Lampiran F Output Descriptive Statistik Pengujian 96
Lampiran G Output Statistik Frekuensi Enam Faktor 98