commit to user
i
PEMANFAATAN METODE K-MEANS CLUSTERING DALAM
PENENTUAN PENJURUSAN SISWA SMA
SKRIPSI
Diajukan untuk Memenuhi Salah Satu Syarat Mencapai Gelar Strata Satu Jurusan Informatika
Disusun oleh :
CHANDRA PURNAMANINGSIH NIM. M0509018
JURUSAN INFORMATIKA
FAKULTAS MATEMATIKA & ILMU PENGETAHUAN ALAM UNIVERSITAS SEBELAS MARET
commit to user
i
PEMANFAATAN METODE K-MEANS CLUSTERING DALAM
PENENTUAN PENJURUSAN SISWA SMA
SKRIPSI
Diajukan untuk Memenuhi Salah Satu Syarat Mencapai Gelar Strata Satu Jurusan Informatika
Disusun oleh :
CHANDRA PURNAMANINGSIH NIM. M0509018
JURUSAN INFORMATIKA
FAKULTAS MATEMATIKA & ILMU PENGETAHUAN ALAM UNIVERSITAS SEBELAS MARET
commit to user
ii SKRIPSI
PEMANFAATAN METODE K-MEANS CLUSTERING DALAM
PENENTUAN PENJURUSAN SISWA SMA
Disusun oleh :
CHANDRA PURNAMANINGSIH NIM. M0509018
Skripsi ini telah disetujui untuk dipertahankan di hadapan Dewan Penguji pada tanggal 17 Desember 2013:
Pembimbing I
Ristu Saptono, S.Si., M.T. NIP. 19790210 200212 1 001
Pembimbing II
commit to user
iii SKRIPSI
PEMANFAATAN METODE K-MEANS CLUSTERING DALAM
PENENTUAN PENJURUSAN SISWA SMA
HALAMAN PENGESAHAN
Disusun oleh :
CHANDRA PURNAMANINGSIH NIM. M0509018
Telah dipertahankan di hadapan Dewan Penguji Pada tanggal 17 Desember 2013 :
Susunan Dewan Penguji
1. Ristu Saptono, S.Si., M.T.
NIP. 19790210 200212 1 001 ( )
2. Abdul Aziz, S. Kom, M.Cs
NIP. 19810413 200501 1 001 ( )
3. Umi Salamah S.Si, M.Kom
NIP. 19700217 199702 2 001 ( )
4. Rini Anggrainingsih, S.T.,M.T.
NIP.19780909 200812 2 002 ( )
Disahkan oleh
Dekan FMIPA UNS
Prof.Ir.Ari Handono Ramelan,M.Sc.(Hons),Ph.D NIP. 19610223 198601 1 001
Ketua Jurusan Informatika
commit to user
iv MOTTO
“Sesungguhnya Shalatku, Ibadahku, Hidupku dan Matiku hanya untuk Allah semata” (Q.S. Al-An’aam: 162)
“Karena sesungguhnya sesudah kesulitan itu ada kemudahan, sesungguhnya sesudah kesulitan itu ada kemudahan, Maka apabila kamu telah selesai (dari
sesuatu urusan), kerjakanlah dengan sungguh-sungguh (urusan) yang lain”
(Q.S. Al-Insyirah : 5-7)
“Don’t wish it were easier, wish you were better.” (Jim Rohn)
commit to user
v
PERSEMBAHAN
Karya ini penulis persembahkan kepada :
commit to user
vi
PEMANFAATAN METODE K-MEANS CLUSTERING DALAM PENENTUAN PENJURUSAN SISWA SMA
CHANDRA PURNAMANINGSIH
Jurusan Informatika. Fakultas MIPA. Universitas Sebelas Maret.
ABSTRAK
Penentuan penjurusan siswa SMA dilakukan berdasarkan kriteria nilai akademik yang menjadi ciri dari masing-masing jurusan IPA/IPS, hal ini memungkinkan bagi seorang siswa untuk memenuhi kriteria diterima di kedua jurusan atau ditolak di keduanya. Usaha untuk mengurangi kemungkinan tersebut adalah dengan cara memperhatikan pertimbangan kriteria lainnya seperti ditinjau dari nilai IQ dan minat siswa.
Proses penentuan penjurusan siswa SMA dengan teknik clustering menggunakan metode K-Means clustering. Pada penelitian ini dilakukan clustering sendiri-sendiri untuk IPA/IPS dan dipaparkan perbandingan hasil clustering K-Means kriteria nilai akademik, nilai IQ, minat siswa dengan clustering K-Means nilai akademik. Data siswa dikelompokkan sendiri-sendiri sesuai jurusan masing-masing. Jurusan IPA dikelompokkan menjadi dua yaitu diterima IPA dan ditolak IPA. Untuk jurusan IPS dikelompokkan menjadi dua yaitu diterima IPS dan ditolak IPS. Kemudian setiap cluster diklasifikasikan berdasarkan kriteria mana yang lebih diprioritaskan. Cluster dengan nilai terbesar pada centroid akhir merupakan cluster yang diterima IPA/IPS, sedangkan cluster dengan nilai terkecil pada centroid akhir merupakan cluster yang ditolak IPA/IPS.
Hasil penelitian pengujian terbaik pada praprocessing clustering K-Means IPA dengan hasil akurasi 0.905882, tingkat kesesuaian hasil prediksi dengan data sebenarnya (recall) 1, ketepatan hasil pengujian dalam memprediksi clustering (sensitivity) 0.876923, kesesuaian prediksi negatif terhadap aktual negatif (specificity) 0.714285. Sedangkan pengujian terbaik juga pada praprocessing clustering K-Means IPS didapatkan akurasi 0.905882, recall 0.714285, sensitivity 1, dan specificity 1. Hasil perbandingan clustering terbaik pada praprocessing
clustering K-Means IPA dengan praprocessing clustering K-Means IPS
menunjukkan bahwa tidak ada siswa yang diterima di dua jurusan IPA/IPS atau siswa ditolak di keduanya.
commit to user
vii
THE USE OF K-MEANS CLUSTERING METHOD TO DETERMINE MAJOR OF SENIOR HIGH SCHOOL STUDENT
CHANDRA PURNAMANINGSIH
Department of Informatic. Mathematic and Science Faculty. Sebelas Maret University
ABSTRACT
Major placement of senior high school student is conducted by the criteria of academic result of each major; the IPA/IPS. It is possible for the students are included into those two major or aren’t included into both.The effort to reduce the possibility that would occur if the students had an error in the placement of the majors is with due regard to other considerations like students’ IQ scores and students’ interest.
The process of determining the major of senior high school student by using K-Means clustering method. In this research, clustering are separately implemented for IPA/IPS and presented the comparison results using clustering criteria with modifications academic values between IQ criteria of students, students’ interest and academic grades of students using the K-Means clustering method. Data of the students are separately grouped according to their respective major. The IPA major are grouped into two, they are accepted to IPA and rejected to IPA. For the IPS major are grouped into two, that is accepted to IPS and rejected to IPS. Then each cluster is classified based on criteria which are more prioritized. Clusters with the greatest value at the end of centroid is the cluster which is received to IPA/IPS, while the cluster with the smallest value at the end of centroid is the cluster which is rejected to IPA/IPS.
The best research result of testing on K-Means clustering preprocessing IPA with accuracy results 0.905882, level of compatibility the predicted result with the actual data (recall) 1, accuracy in predicting test results clustering (sensitivity) 0.876923, negative predictive suitability to the negative actual (specificity) 0.714285. Meanwhile, the best testing result is also obtained on K-Means clustering preprocessing IPS that showed the accuracy 0.905882, recall 0.714285, sensitivity 1, and specificity 1. The best comparison clustering result on K-Means clustering preprocessing IPA with K-Means clustering preprocessing IPS indicates that no student who received into two majors IPA / IPS or students declined in both.
commit to user
viii
KATA PENGANTAR
Puji syukur penulis panjatkan kehadirat Allah Subhanahu Wa Ta’ala
yang senantiasa memberikan nikmat dan karunia-Nya sehingga penulis dapat menyelesaikan skripsi dengan judul Pemanfaatan Metode K-Means Clustering dalam Penentuan Penjurusan Siswa SMA, yang menjadi salah satu syarat wajib untuk memperoleh gelar Sarjana Informatika di Universitas Sebelas Maret (UNS) Surakarta.
Penulis menyadari akan keterbatasan yang dimiliki, begitu banyak bimbingan, bantuan, serta motivasi yang diberikan dalam proses penyusunan skripsi ini. Oleh karena itu, ucapan terima kasih penulis sampaikan kepada :
1. Bapak Ristu Saptono, S.Si., M.T selaku Dosen Pembimbing I yang penuh kesabaran, ketelitian, koreksi, masukan, motivasi, semangat dan memberikan waktunya untuk mengarahkan, dan membimbing penulis selama proses penyelesaian skripsi ini,
2. Bapak Abdul Aziz, S.Kom, M.Cs selaku Dosen Pembimbing IIterimakasih atas setiap diskusi, semangat, motivasi, ketelitian, koreksi, masukan dan kesabarannya selama proses penyelesaian skripsi ini.
3. Ibu Umi Salamah, S.Si.,M.Kom selaku Ketua Jurusan S1 Informatika FMIPA UNS,
4. Bapak Didiek S. Wiyono, S.T., M.T. selaku Pembimbing Akademik.
5. Bapak dan Ibu dosen serta karyawan di Jurusan Informatika FMIPA UNS yang telah mengajar penulis selama masa studi dan membantu dalam proses penyusunan skripsi ini,
6. Mama dan bapak tercinta yang tak hentinya memberikan dukungan moral dan material selama proses penyusunan Tugas Akhir ini,
7. Teman-teman semua terutama mahasiswa informatika FMIPA UNS dan Yudi Chandri Setiawan selalu memberikan dukungan, motivasi dan bantuan kepada penulis.
Penulis berharap semoga skripsi ini dapat bermanfaat bagi semua pihak yang berkepentingan.
Surakarta, 17 November 2013
commit to user
ix DAFTAR ISI
HALAMAN JUDUL ... i
HALAMAN PERSETUJUAN ... ii
HALAMAN PENGESAHAN ... iii
HALAMAN MOTTO ... iv
HALAMAN PERSEMBAHAN ... v
ABSTRAK ... vi
ABSTRACT ... vii
KATA PENGANTAR ... viii
DAFTAR ISI ... ix
DAFTAR TABEL ... xii
DAFTAR GAMBAR ... xiv
DAFTAR LAMPIRAN ... xv
BAB I PENDAHULUAN ... 1
1.1 Latar Belakang ... 1
1.2 Rumusan Masalah ... 3
1.3 Batasan Masalah ... 3
1.4 Tujuan Penelitian ... 3
1.5 Manfaat Penelitian ... 4
1.6 Sistematika Penulisan ... 4
BAB II TINJAUAN PUSTAKA ... 5
2.1 Landasan Teori ... 5
2.1.1 Clustering ... 5
commit to user
x
2.1.3 Confusion Matrik ... 11
2.1.4 Kriterian Penjurusan Sekolah Menengah Atas (SMA) ... 13
2.2 Penelitian Terkait ... 14
2.2.1 Aplikasi K-Means untuk Pengelompokkan Mahasiswa Berdasarkan Nilai Body Mass Index (BMI) dan Ukuran Kerangka (Tedy Rismawan dan Kusumadewi,2008)... 14
2.2.2 Sistem Pendukung Keputusan Penjurusan Siswa Kelas X SMA Negeri 2 Surakarta Dengan Metode Fuzzy C-Means Dengan Penggunaan Daya Dukung Minat Siswa (Erfan Agil Putranto, 2012)... 14
2.2.3 Performance Evaluation of K-Means and Fuzzy C-Means Clustering Algorithms for Statistical Distributions of Input Data Points (Santhanam dan Velmurugan, 2010)... 15
2.2.4 Clustering Data Non-Numerik Dengan Pendekatan Algoritma K-Means Dan Hamming Distance Studi Kasus Biro Jodoh (Darlis Heru Murti, Nanik Suciati, dan Daru Jani Nanjaya,2005)... 16
2.3 Rencana Penelitian ... 16
BAB III METODE PENELITIAN... 18
3.1 Pengumpulan Data ... 18
3.1.1 Study Literature ... 18
3.1.2 Telaah Dokumen ... 18
3.2 Pemodelan Data ... 19
3.3 Proses Clustering ... 20
3.3.1 Praprocessing Clustering K-Means ... 20
3.3.2 Clustering K-Means ... 21
3.4 Klasifikasi Hasil Clustering ... 24
3.5 Pengujian dan Validasi Hasil ... 25
3.5.1 Tahap Pengujian Perbandingan berdasarkan Clustering... 25
commit to user
xi
BAB IV PEMBAHASAN ... 27
4.1 Pemodelan Data ... 27
4.2 Proses Clustering ... 28
4.3 Klasifikasi Hasil Clustering ... 38
4.4 Hasil Pengujian Clustering ... 40
4.4.1 Hasil Pengujian Perbandingan berdasarkan Confusion Matrik ... 40
4.4.2 Hasil Pengujian berdasarkan Clustering ... 43
BAB V PENUTUP ... 40
5.1 Kesimpulan ... 46
5.2 Saran ... 46
commit to user
xii
DAFTAR TABEL
Tabel 2.1 Daftar Objek dalam Clustering ... 9
Tabel 2.2 Hasil Clustering ... 11
Tabel 2.3 Confusion Matrik (Fawcett,2006) ... 12
Tabel 3.1 Pengkatagorian Minat ... 19
Tabel 3.2 Pengkatagorian Nilai IQ ... 19
Tabel 3.3 Pembobotan IPA IPS ... 20
Tabel 3.4 Confusion Matrik Data Dua Kelas ... 26
Tabel 4.1 Pemodelan Data Jurusan IPA ... 27
Tabel 4.2 Pemodelan Data Jurusan IPS ... 27
Tabel 4.3 Jarak Awal Iterasi-1 clustering K-Means IPA ... 30
Tabel 4.4 Jarak Awal Iterasi-1 clustering K-Means IPS ... 31
Tabel 4.5 Jarak Awal Iterasi-1 clustering praprocessing K-Means IPA ... 31
Tabel 4.6 Jarak Awal Iterasi-1 clustering praprocessing K-Means IPS ... 32
Tabel 4.7 Hasil cluster K-Means IPA iterasi-1 ... 32
Tabel 4.8 Hasil cluster K-Means IPS iterasi-1 ... 33
Tabel 4.9 Hasil cluster praprocessing K-Means IPA iterasi-1 ... 33
Tabel 4.10 Hasil cluster praprocessing K-Means IPS iterasi-1 ... 34
Tabel 4.11 Hasil centroid akhir K-Means IPA... 36
Tabel 4.12 Hasil centroid akhir K-Means IPS ... 37
Tabel 4.13 Hasil centroid akhir praprocessing K-Means IPA ... 37
Tabel 4.14 Hasil centroid akhir praprocessing K-Means IPS ... 37
commit to user
xiii
Tabel 4.16 Klasifikasi cluster K-Means IPS ... 38
Tabel 4.17 Klasifikasi cluster praprocessing K-Means IPA ... 39
Tabel 4.18 Klasifikasi cluster praprocessing K-Means IPS ... 39
Tabel 4.19 Confusion Matrik K-Means IPA ... 40
Tabel 4.20 Confusion Matrik K-Means IPS ... 40
Tabel 4.21 Confusion Matrik praprocessing K-Means IPA ... 41
Tabel 4.22 Confusion Matrik praprocessing K-Means IPS ... 41
Tabel 4.23 Rata-Rata Hasil Pengujian ... 42
Tabel 4.24 Pengujian K-Means IPA dengan K-Means IPS ... 43
commit to user
xiv
DAFTAR GAMBAR
Gambar 2.1 Ilustrasi algoritma K-Means ... 6
Gambar 2.1 Diagram alir algoritma K-Means ... 8
Gambar 3.1 Alur Rancangan Penelitian ... 18
Gambar 3.2 Flowchart praprocessing clustering K-Means IPA/IPS ... 21
Gambar 3.3 Flowchart clustering K-Means IPA/IPS ... 22
Gambar 3.5 Ilustrasi Hasil Pengelompokan Penjurusan ... 25
commit to user
xv
DAFTAR LAMPIRAN
Lampiran A. Data Asli Siswa... 51
Lampiran B. Hasil Pemodelan Data Jurusan IPA ... 57
Lampiran C. Hasil Pemodelan Data Jurusan IPS ... 63
Lampiran D. Hasil Perhitungan Jarak Awal Iterasi-1 Clustering K-Means IPA, K-Means IPS, praprocessing K-K-Means IPA, praprocessing K-K-Means IPS ... 70
Lampiran E. Hasil Iterasi – 1 Clustering K-Means IPA, K-Means IPS, praprocessing K-Means IPA, praprocessing K-Means IPS ... 75
Lampiran F. Hasil Klasifikasi Siswa Clustering K-Means IPA / IPS ... 82
Lampiran G. Hasil Klasifikasi Siswa Clustering praprocessing K-Means IPA dan praprocessing K-Means IPS ... 89
Lampiran H. Hasil Pengujian K-Means IPA dengan Data Asli Sekolah. ... 96
Lampiran I. Hasil Pengujian K-Means IPS dengan Data Asli Sekolah.. ... 97
Lampiran J. Hasil Pengujian Clustering praprocessing K-Means IPA dengan Data Asli Sekolah ... 98
Lampiran K. Hasil Pengujian Clustering praprocessing K-Means IPS dengan Data Asli Sekolah. ... 99
Lampiran L. Hasil Pengujian Clustering K-Means IPA ... 100
Lampiran M. Hasil Pengujian Clustering K-Means IPS ... 101
Lampiran N. Hasil Pengujian Clustering praprocessing K-Means IPA ... 102