Perancangan Aplikasi Pengelompokan Nilai Mata Pelajaran Hasil Tryout Siswa Peserta Bimbingan Belajar Menggunakan Metode K-Means Clustering Di SMP Swasta Ira Medan. Oleh : Khairunnisa Azni
84
PERANCANGAN APLIKASI PENGELOMPOKAN NILAI MATA
PELAJARAN HASIL TRYOUT SISWA PESERTA BIMBINGAN
MENGGUNAKAN METODE K-MEANS CLUSTERING
Khairunnisa Azni
Mahasiswa Program Studi Teknik Informatika STMIK Budi Darma Medan Jl. Sisingamangaraja No. 338 Sp. Limun Medan
http://www.stmik-budidarma.ac.id // Email : [email protected]
ABSTRAK
Nilai hasil tryout siswa merupakan komponen penting dalam sistem pembelajaran di sekolah, karena nilai hasil tryout siswa menjadi salah satu tolak ukur penguasaan materi pelajaran oleh siswa. Nilai hasil tryout siswa juga menjadi acuan untuk pengambil keputusan kelulusan sekolah. Data nilai hasil tryout siswa perlu dikelompokkan untuk membedakan nilai terendah, sedang dan tingi dengan jangkauan kelompok nilai terendah, sedang dan tinggi. Hasil pengelompokkan nilai hasil tryout ini dapat digunakan untuk membuat suatu kebijakan pembelajaran disekolah. Kebijakan tersebut berupa dibuatnya remedial atau pelajaran tambahan bagi kelompok nilai terendah.Salah satu solusi untuk mengatasi masalah di atas, maka perlu dibangun sebuah aplikasi pengelompokkan nilai mata pelajaran hasil tryout peserta bimbingan belajar berdasarkan nilai masing-masing siswa pada mata pelajaran yang dibimbingkan kedalam kelompok nilai rendah, sedang dan tinggi. Pengelompokkan nilai dilakukan dengan algoritma K-means menggunakan bahasa pemograman Visual Basic dengan menggunakan proses stemming dan non stemming untuk mengetahui kerelevan hasil yang diperoleh dari masing-masing proses.
Kata Kunci : Clustering, K-means, Stemming, Visual Basic
1. Pendahuluan
1.1 Latar Belakang Masalah
Berdasarkan hasil wawancara dengan pihak sekolah bahwa hasil tryout terdapat nilai mata pelajaran hasil tryout siswa setelah diujiankan masih ada juga yang memiliki nilai di bawah standar kelulusan sehingga apabila dibiarkan maka, dapat menjadi salah satu faktor tidak lulusnya siswa tersebut pada Ujian Nasional (UN) mata pelajaran yang diujiankan.
Nilai hasil tryout siswa merupakan komponen penting dalam sistem pembelajaran di sekolah, karena nilai hasil tryout siswa menjadi salah satu tolak ukur penguasaan materi pelajaran oleh siswa. Nilai hasil tryout siswa juga menjadi acuan untuk pengambil keputusan kelulusan sekolah. Data nilai hasil tryout siswa perlu dikelompokkan untuk membedakan nilai terendah, sedang dan tingi dengan jangkauan kelompok nilai terendah, sedang dan tinggi. Hasil pengelompokkan nilai hasil tryout ini dapat digunakan untuk membuat suatu kebijakan pembelajaran disekolah. Kebijakan tersebut berupa dibuatnya remedial atau pelajaran tambahan bagi kelompok nilai terendah.
1.2 Rumusan Masalah
Berdasarkan uraian latar belakang di atas, maka dapat dirumuskan masalah yang dibahas adalah sebagai berikut :
1. Bagaimana prosedur pengelompokkan nilai mata pelajaran hasil tryout siswa peserta bimbingan belajar di SMP Swasta Ira Medan.
2. Bagaimana menerapkan metode clustering pada pengelompokkan nilai mata pelajaran hasil
tryout siswa peserta bimbingan belajar di SMP Swasta Ira Medan.
3. Bagaimana merancang aplikasi pengelompokkan nilai mata pelajaran hasil
tryout siswa peserta bimbingan belajar di SMP Swasta Ira Medan berdasarkan metode
clustering.
1.3 Batasan Masalah
Agar pembahasan masalah ini dapat mencapai sasaran dan tujuan yang diharapkan, maka permasalahan yang dibahas dibatasi sebagai berikut :
1. Algoritma yang digunakan dalam proses
clustering nilai mata pelajaran hasil tryout
peserta bimbingan belajar ini adalah algoritma
K-means.
2. Nilai mata pelajaran hasil tryout siswa bimbingan belajar yang dikelompokkan hanya untuk nilai tryout mata pelajaran Bahasa Indonesia.
3. Bahasa pemograman yang digunakan untuk membangun aplikasi adalah visual basic 2008 dengan database MYSQL.
1.4 Tujuan Penelitian
Adapun tujuan yang ingin dicapai dalam penelitian ini adalah sebagai berikut :
Perancangan Aplikasi Pengelompokan Nilai Mata Pelajaran Hasil Tryout Siswa Peserta Bimbingan Belajar Menggunakan Metode K-Means Clustering Di SMP Swasta Ira Medan. Oleh : Khairunnisa Azni
85
1. Mengetahui prosedur pengelompokkan nilai mata pelajaran hasil tryout peserta bimbingan belajar di SMP Swasta Ira Medan.
2. Menerapkan metode clustering pada pengelompokkan nilai mata pelajaran hasil
tryout siswa peserta bimbingan belajar di SMP Swasta Ira Medan.
3. Merancang aplikasi yang dapat mengelompokkan nilai mata pelajaran hasil
tryout siswa peserta bimbingan belajar secara valid.
2. Landasan Teori
2.1 Metode Clustering
Clustering merupakan suatu dari keseluruhan cluster (Fajar Astuti Hermawati, 2013 : 5). Beberapa tipe penting dari clustering adalah sebagai berikut : 1. Partitional vs Hirerarchical 2. Exclusive vs non-exclusive 3. Fuzzy vs non-fuzzy 4. Patical vs complete 2.2K-means
K-means merupakan metode analisis kelompok yang mengarah pada pamartisian N objek pengamatan ke dalam K kelompok (cluster) dimana setiap objek pengamatan dimiliki oleh sebuah kelompok dengan mean (rata-rata) terdekat, mirip dengan algoritma Expectation-Maximization untuk
Gaussian Mixture dimana keduanya mencoba untuk menemukan pusat dari kelompok dalam data sebanyak iterasi perbaikan yang dilakukan oleh kedua algoritma (Eko prasetyo, 2012 : 178).
K-means clustering menggunakan pendekatan partitional clustering. Tiap cluster
dihubungkan dengan sebuah centroid (titik pusat). Tiap titik ditempatkan ke dalam cluster dengan
centroid terdekat. Jumlah cluster, K, harus ditentukan. Algoritma dasarnya sangat sederhana (Fajar Astuti Hermawati, 2013 : 127), yaitu: 1. Pilih K titik sebagai centroid awal 2. Ulangi
3. Bentuk K cluster dengan menempatkan semua titik yang terdekat
4. Ulangi perhitungan centroid dari tiap cluster
5. Sampai centroid tidak berubah
Lokasi sentroid (titik pusat) setiap kelompok yang di ambil dari rata-rata (mean) semua nilai data pada setiap fiturnya harus dihitung kembali. Jika M menyatakan jumlah data dalam sebuah kelompok, i
menyatakan fitur ke-i dalam sbuah kelompok, dan p
menyatakan dimensi data, untuk menghitung
sentroid fitur ke-i digunakan formula.
Formula tersebut dilakukan sebanyak p
dimensi sehingga i mulai dari 1 sampai p.
Ada banyak model pengukuran jarak dan yang paling sering digunakan adalah jarak euclidean. Jarak euclidean memberikan jarak lurus
anatara dua buah data dengan N dimensi. Formula jarak yang lain adalah manhattan/city block (Eko prasetyo, 2012 : 179).
Pengukuran jarak pada ruang jarak euclidean
menggunakan formula
D(𝑥2, 𝑥1)=||𝑥2− 𝑥1||2=√∑𝑝𝑗=1||𝑥2𝑗− 𝑥1𝑗||²
Atau 𝐷𝑖𝑗= √Nilai barisi− Nilai C𝑖
Keterangan :
D = jarak antara dua x dan y C = centroid
| . | = nilai absolut
N = jumlah fitur (dimensi) data. Σ = jumlah
Maka λ adalah parameter jarak minkowsky. Secara umum, λ merupakan parameter penentu dalam karakteristik jarak. Jika λ=1, ruang jarak pada minkowsky sama dengan manhattan. Jika λ=2, ruang jaraknya akan sama dengan euclidean, jika λ=∞, ruang jaraknya akan sama dengan ruang jarak chebyshev. Namun demikian, cara yang paling banyak digunakan adalah euclidean dan manhattan.
Euclidean menjadi pilihan jika kita ingin memberikan jarak terpendek antara dua titik (jarak lurus), sedangkan manhattan memberikan jarak terjauh pada dua kata. Manhattan juga sering digunakan karena kemampuannya dalam mendeteksi keadaan khusus, seperti keberadaan
outlier, dengan lebih baik.
3. Analisa dan Perancangan
3.1 AnalisaSistem
Berdasarkan hasil pengamatan di SMP Swasta Ira Medan diketahui bahwa hasil tryout
tidak ditindak lanjuti, melainkan hanya diumumkan saja kepada siswa sehingga siswa yang memiliki nilai rendah (dibawah standar kelulusan) tidak dilakukan remedial atau bimbingan ulang. Analisa sistem yang dibangun bertujuan mengelompokkan nilai akhir hasil tryout kemudian dibuat kalkulasi atau kelompok-kelompok siswa yang harus diberi remedial ulang agar seluruh siswa tersebut mendapatkan nilai yang baik pada saat mengukuti ujian akhir nasional (UN) sekolah.
3.1.1 Analisa Sistem Yang Sedang Berjalan
Berdasarkan hasil wawancara yang dilakukan dengan Wakil Kepala Sekolah Bidang Kurikulum di SMP Swasta Ira Medan didapatkan prosedur yang sedang berjalan di bagian kurikulum adalah sebagai berikut :
1. Proses pendataan nilai tryout
Proses pendataan nilai tryout adalah proses dimana guru-guru mata pelajaran memberikan nilai hasil tryout siswa untuk setiap mata pelajaran bimbingan yang telah diikuti oleh siswa kepada Wali Kelas. Proses pendataan nilai hasil tryout ini digambarkan dengan
Perancangan Aplikasi Pengelompokan Nilai Mata Pelajaran Hasil Tryout Siswa Peserta Bimbingan Belajar Menggunakan Metode K-Means Clustering Di SMP Swasta Ira Medan. Oleh : Khairunnisa Azni
86 flowmap. Adapun proses-proses yang ada dalam
prosedur ini adalah sebagai berikut :
a. Setiap guru mata pelajaran memberikan nilai hasil tryout siswa untuk setiap mata pelajaran yang diikuti kepada Wali Kelas b. Pengecekan kelengkapan data nilai hasil
tryout siswa oleh Wali Kelas
c. Apabila nilai belum lengkap, maka guru mata pelajaran mengisi nilai yang belum lengkap tersebut
d. Apabila nilai sudah lengkap, nilai tersebut dilaporkan ke bagian Tata Usaha dan bagian Urusan Kurikulum untuk didokumentasikan
3.1.2 Penerapan Metode K-means Clustering
1. Inisialisasi data jumlah klaster digunakan untuk menghitung nilai hasil tryout yang hasilnya terdapat dalam tabel di bawah ini
Tabel 4.1 Nilai hasil tryout mata pelajaran
Bahasa Indonesia
2. Berdasarkan tabel diatas kita tentukan pusat awal (centroid) cluster untuk clustering
“Bahasa Indonesia” secara acak dengan cara memilih item nilai secara bebas, misalnya nilai yang didapat adalah sebagai berikut :
Tabel 4.2 Penentuan Pusat Awal (Centroid) Bahasa Indonesia
No NIS Bahasa Nilai
Indone sia 1 091010215 7.80 2 091010251 7.90 3 091010072 7.77 4 091010111 7.60 Rendah 5 091010148 7.70 6 091010182 7.67 7 091010257 8.07 Tinggi 8 091010150 8.03 9 091010077 8.00 10 091010258 7.70 11 091010292 7.77 Sedang 12 091010045 7.73
c1 = 7.60 ; diambil dari data ke-4 c2 = 7.77 ; diambil dari data ke-11 c3 = 8.07 ; diambil dari data ke-7
3. Menghitung jarak dari semua data ketiap titik pusat cluster pertama menggunakan euclidean distace dengan rumus sebagai berikut :
𝐷𝐿2 (𝑋1, 𝑋2) = ||𝑋2− 𝑋1|| =
√∑𝑃𝐽=1( 𝑋2𝐽− 𝑋1𝐽 )² atau 𝐷𝑖𝑗 = √Nilai B. Indonesia baris kei− Nilai Ci
a. Menghitung jarak data ke-1 dengan centroid
pertama (c1) 𝐷𝑖𝑗 =
√Nilai B. Indonesiai− Nilai C1
𝐷11 = √( 7.80 − 7.60) ² = 0.20 𝐷21 = √( 7.90 − 7.60) ² = 0.30 𝐷31 = √( 7.77 − 7.60) ² = 0.17 𝐷41 = √( 7.60 − 7.60) ² = 0.00 𝐷51 = √( 7.70 − 7.60) ² = 0.10 𝐷61 = √( 7.67 − 7.60) ² = 0.07 𝐷71 = √( 8.07 − 7.60) ² = 0.47 𝐷81 = √( 8.03 − 7.60) ² = 0.43 𝐷91 = √( 8.00 − 7.60) ² = 0.40 𝐷10,1 = √( 7.70 − 7.60) ² = 0.10 𝐷11,1 = √( 7.77 − 7.60) ² = 0.17 𝐷12,1 = √( 7.73 − 7.60) ² = 0.13
b. Menghitung jarak data ke-1 dengan centroid
kedua (c2) 𝐷𝑖𝑗 =
√Nilai B. Indonesiai− Nilai C2
𝐷12 = √( 7.80 − 7.77) ² = 0.03 𝐷22 = √( 7.90 − 7.77) ² = 0.13 𝐷32 = √( 7.77 − 7.77) ² = 0.00 𝐷42 = √( 7.60 − 7.77) ² = 0.17 𝐷52 = √( 7.70 − 7.77) ² = 0.07 𝐷62 = √( 7.67 − 7.77) ² = 0.10 𝐷72 = √( 8.07 − 7.77) ² = 0.30 𝐷82 = √( 8.03 − 7.77) ² = 0.26 𝐷92 = √( 8.00 − 7.77) ² = 0.23 𝐷10,2 = √( 7.70 − 7.77) ² = 0.07 N o NIS Ba has a Ind one sia Bah asa Ing gris Ma tem atik a Fisi ka Ki mia Biolo gi 1 09101 0215 7.8 0 7.63 7.40 7.73 7.50 8.03 2 09101 0251 7.9 0 7.83 7.70 7.97 7.63 8.00 3 09101 0072 7.7 7 7.77 7.40 7.73 7.27 7.87 4 09101 0111 7.6 0 7.53 7.17 7.57 7.43 7.87 5 09101 0148 7.7 0 7.57 7.17 7.53 7.27 7.77 6 09101 0182 7.6 7 7.50 7.07 7.60 7.27 7.80 7 09101 0257 8.0 7 7.60 7.33 7.70 7.40 7.93 8 09101 0150 8.0 3 7.53 7.80 8.77 8.07 8.37 9 09101 0077 8.0 0 7.50 8.33 7.60 7.87 7.93 1 0 09101 0258 7.7 0 7.50 7.40 7.77 7.17 7.97 1 1 09101 0292 7.7 7 7.33 7.30 7.53 7.20 7.80 1 2 09101 0045 7.7 3 7.73 7.23 7.90 7.33 7.90
Perancangan Aplikasi Pengelompokan Nilai Mata Pelajaran Hasil Tryout Siswa Peserta Bimbingan Belajar Menggunakan Metode K-Means Clustering Di SMP Swasta Ira Medan. Oleh : Khairunnisa Azni
87 𝐷11,2 = √( 7.77 − 7.77) ² = 0.00
𝐷12,2 = √( 7.73 − 7.77) ² = 0.04
c. Menghitung jarak data ke-1 dengan centroid
ketiga (c3) 𝐷𝑖𝑗 =
√Nilai B. Indonesiai− Nilai C3
𝐷13 = √( 7.80 − 8.07) ² = 0.27 𝐷23 = √( 7.90 − 8.07) ² = 0.17 𝐷33 = √( 7.77 − 8.07) ² = 0.30 𝐷43 = √( 7.60 − 8.07) ² = 0.47 𝐷53 = √( 7.70 − 8.07) ² = 0.37 𝐷63 = √( 7.67 − 8.07) ² = 0.40 𝐷73 = √( 8.07 − 8.07) ² = 0.00 𝐷83 = √( 8.03 − 8.07) ² = 0.04 𝐷93 = √( 8.00 − 8.07) ² = 0.07 𝐷10,3 = √( 7.70 − 8.07) ² = 0.37 𝐷11,3 = √( 7.77 − 8.07) ² = 0.30 𝐷12,3 = √( 7.73 − 8.07) ² = 0.34
Hasil perhitungan selengkapnya disajikan pada tabel 4.4
Tabel 4.3 Perhitungan jarak setiap data dan posisi cluster pada iterasi pertama
N o NIS Ni lai rat a-rat a
Hasil jarak Centroid
Di 1 Di 2 Di 3 C 1 C2 C3 1 091 010 215 7. 80 0. 20 0. 03 0. 27 2 091 010 251 7. 90 0. 30 0. 13 0. 17 3 091 010 072 7. 77 0. 17 0. 00 0. 30 4 091 010 111 7. 60 0. 00 0. 17 0. 47 5 091 010 148 7. 70 0. 10 0. 07 0. 37 6 091 010 182 7. 67 0. 07 0. 10 0. 40 7 091 010 257 8. 07 0. 47 0. 30 0. 00 8 091 010 150 8. 03 0. 43 0. 26 0. 04 9 091 010 077 8. 00 0. 40 0. 23 0. 07 1 091 7. 0. 0. 0. 0 010 258 70 10 07 37 1 1 091 010 292 7. 77 0. 17 0. 00 0. 30 1 2 091 010 045 7. 73 0. 13 0. 04 0.34 Keterangan :
a. Nilai kolom 𝐷𝑖1 diambil dari hasil centroid
(d) untuk c1
b. Nilai kolom 𝐷𝑖2 diambil dari hasil centroid
(d) untuk c2
c. Nilai kolom 𝐷𝑖3 diambil dari hasil centroid
(d) untuk c3
4. Setelah hasil perhitungan jarak antara setiap data dan pusat cluster didapat maka dilakukan proses pengelompokkan. Suatu data akan menjadi anggota suatu cluster apabila data tersebut memiliki nilai jarak terkecil dari pusat
clusternya.
Tabel 4.4 Hasil Perhitungan Jarak Iterasi Pertama N o NIS Ni lai rat a-rat a Di 1 Di 2 Di 3 C 1 C 2 C 3 1 09101 0215 7. 80 0. 20 0. 03 0. 27 * 2 09101 0251 7. 90 0. 30 0. 13 0. 17 * 3 09101 0072 7. 77 0. 17 0. 00 0. 30 * 4 09101 0111 7. 60 0. 00 0. 17 0. 47 * 5 09101 0148 7. 70 0. 10 0. 07 0. 37 * 6 09101 0182 7. 67 0. 07 0. 10 0. 40 * 7 09101 0257 8. 07 0. 47 0. 30 0. 00 * 8 09101 0150 8. 03 0. 43 0. 26 0. 04 * 9 09101 0077 8. 00 0. 40 0. 23 0. 07 * 1 0 09101 0258 7. 70 0. 10 0. 07 0. 37 * 1 1 09101 0292 7. 77 0. 17 0. 00 0. 30 * 1 2 09101 0045 7. 73 0. 13 0. 04 0. 34 * Keterangan :
Nilai kolom c1, c2, c3 didapatkan dari nilai jarak terkecil dari pusat cluster
5. Menentukan pusat cluster baru dengan cara menghitung rata-rata dari data yang ada pada masing-masing cluster
Perancangan Aplikasi Pengelompokan Nilai Mata Pelajaran Hasil Tryout Siswa Peserta Bimbingan Belajar Menggunakan Metode K-Means Clustering Di SMP Swasta Ira Medan. Oleh : Khairunnisa Azni
88
a. Perhitungan pusat cluster baru pertama Karena cluster pertama (c1) memiliki dua anggota berdasarkan tabel 4.4 maka: c1 = ( 7.60+7.67
2 ) = 7.63
b. Perhitungan pusat cluster baru kedua Karena cluster pertama (c2) memiliki tujuh anggota berdasarkan tabel 4.4 maka:
c2 = ( 7.80+7.90+7.77+7.70+7.70+7.77+7.73
7 ) =
7.77
c. Perhitungan pusat cluster baru ketiga Karena cluster pertama (c3) memiliki tiga anggota berdasarkan tabel 4.4 maka : c3 = ( 8.07+8.03+8.003 ) = 8.03
Menghitung jarak semua data ketiap titik pusat
cluster menggunakan euclidean distance dengan rumus sebagai berikut :
𝐷𝐿2 (𝑋1, 𝑋2) = ||𝑋2− 𝑋1|| = √∑𝑃 ( 𝑋2𝐽− 𝑋1𝐽 )
𝐽=1 ² atau 𝐷𝑖𝑗 = √Nilai B. Indonesia baris kei− Nilai Ci
1) Menghitung jarak data ke-1 dengan centroid
pertama (c1) 𝐷𝑖𝑗 =
√Nilai B. Indonesiai− Nilai C1
𝐷11 = √( 7.80 − 7.63) ² = 0.17 𝐷21 = √( 7.90 − 7.63) ² = 0.27 𝐷31 = √( 7.77 − 7.63) ² = 0.14 𝐷41 = √( 7.60 − 7.63) ² = 0.03 𝐷51 = √( 7.70 − 7.63) ² = 0.07 𝐷61 = √( 7.67 − 7.63) ² = 0.04 𝐷71 = √( 8.07 − 7.63) ² = 0.44 𝐷81 = √( 8.03 − 7.63) ² = 0.40 𝐷91 = √( 8.00 − 7.63) ² = 0.37 𝐷10,1 = √( 7.70 − 7.63) ² = 0.07 𝐷11,1 = √( 7.77 − 7.63) ² = 0.14 𝐷12,1 = √( 7.73 − 7.63) ² = 0.10 2) Menghitung jarak data ke-1 dengan centroid
kedua (c2) 𝐷𝑖𝑗 =
√Nilai B. Indonesiai− Nilai C2
𝐷12 = √( 7.80 − 7.77) ² = 0.03 𝐷22 = √( 7.90 − 7.77) ² = 0.13 𝐷32 = √( 7.77 − 7.77) ² = 0.00 𝐷42 = √( 7.60 − 7.77) ² = 0.17 𝐷52 = √( 7.70 − 7.77) ² = 0.07 𝐷62 = √( 7.67 − 7.77) ² = 0.10 𝐷72 = √( 8.07 − 7.77) ² = 0.30 𝐷82 = √( 8.03 − 7.77) ² = 0.26 𝐷92 = √( 8.00 − 7.77) ² = 0.23 𝐷10,2 = √( 7.70 − 7.77) ² = 0.07 𝐷11,2 = √( 7.77 − 7.77) ² = 0.00 𝐷12,2 = √( 7.73 − 7.77) ² = 0.04
3) Menghitung jarak data ke-1 dengan centroid
ketiga (c3) 𝐷𝑖𝑗 =
√Nilai B. Indonesiai− Nilai C3
𝐷13 = √( 7.80 − 8.03) ² = 0.27 𝐷23 = √( 7.90 − 8.03) ² = 0.17 𝐷33 = √( 7.77 − 8.03) ² = 0.30 𝐷43 = √( 7.60 − 8.03) ² = 0.47 𝐷53 = √( 7.70 − 8.03) ² = 0.37 𝐷63 = √( 7.67 − 8.03) ² = 0.40 𝐷73 = √( 8.07 − 8.03) ² = 0.00 𝐷83 = √( 8.03 − 8.03) ² = 0.04 𝐷93 = √( 8.00 − 8.03) ² = 0.07 𝐷10,3 = √( 7.70 − 8.03) ² = 0.37 𝐷11,3 = √( 7.77 − 8.03) ² = 0.30 𝐷12,3 = √( 7.73 − 8.03) ² = 0.34 Hasil perhitungan jarak selengkapnya dan pengalokasian data ke jarak terdekat disajikan pada tabel 4.5
Tabel 4.5 Perhitungan jarak setiap data dan posisi cluster pada iterasi kedua
N o NIS Ni lai rat a-rat a Di 1 Di 2 Di 3 C 1 C 2 C 3 1 09101 0215 7. 80 0. 17 0. 03 0. 23 2 09101 0251 7. 90 0. 27 0. 13 0. 13 3 09101 0072 7. 77 0. 14 0. 00 0. 26 4 09101 0111 7. 60 0. 03 0. 17 0. 43 5 09101 0148 7. 70 0. 07 0. 07 0. 33 6 09101 0182 7. 67 0. 04 0. 10 0. 36 7 09101 0257 8. 07 0. 44 0. 30 0. 04 8 09101 0150 8. 03 0. 40 0. 26 0. 00 9 09101 0077 8. 00 0. 37 0. 23 0. 03 1 0 09101 0258 7. 70 0. 07 0. 07 0. 33 1 1 09101 0292 7. 77 0. 14 0. 00 0. 26 1 2 09101 0045 7. 73 0. 10 0. 04 0. 30 Keterangan :
a. Nilai kolom 𝐷𝑖1 diambil dari hasil centroid
(d) untuk c1
b. Nilai kolom 𝐷𝑖2 diambil dari hasil centroid
Perancangan Aplikasi Pengelompokan Nilai Mata Pelajaran Hasil Tryout Siswa Peserta Bimbingan Belajar Menggunakan Metode K-Means Clustering Di SMP Swasta Ira Medan. Oleh : Khairunnisa Azni
89
c. Nilai kolom 𝐷𝑖3 diambil dari hasil centroid
(d) untuk c3
Setelah pusat cluster baru didapat, kemudian akan dilakukan perulangan langkah-langkah selanjutnya sampai tidak ada lagi anggota sebuah cluster yang berpindah cluster atau perubahan nilai pada jumlah iterasi melebihi nilai batas iterasi yang digunakan.
Tabel 4.6 Hasil Perhitungan Jarak Iterasi Kedua N o NIS Ni lai rat a-rat a Di 1 Di 2 Di 3 C 1 C 2 C 3 1 09101 0215 7. 80 0. 17 0. 03 0. 23 * 2 09101 0251 7. 90 0. 27 0. 13 0. 13 * * 3 09101 0072 7. 77 0. 14 0. 00 0. 26 * 4 09101 0111 7. 60 0. 03 0. 17 0. 43 * 5 09101 0148 7. 70 0. 07 0. 07 0. 33 * * 6 09101 0182 7. 67 0. 04 0. 10 0. 36 * 7 09101 0257 8. 07 0. 44 0. 30 0. 04 * 8 09101 0150 8. 03 0. 40 0. 26 0. 00 * 9 09101 0077 8. 00 0. 37 0. 23 0. 03 * 1 0 09101 0258 7. 70 0. 07 0. 07 0. 33 * * 1 1 09101 0292 7. 77 0. 14 0. 00 0. 26 * 1 2 09101 0045 7. 73 0. 10 0. 04 0. 30 *
Nilai kolom c1, c2, c3 didapatkan dari
Mementukan pusat cluster baru dengan cara menghitung rata-rata dari data yang ada masing-masing cluster
1. Perhitungan pusat cluster baru pertama Karena cluster pertama (c1) memiliki dua anggota maka :
c1 = ( 7.60+7.70+7.67+7.704 ) = 7.67 2. Perhitungan pusat cluster baru kedua
Karena cluster pertama (c2) memiliki tujuh anggota maka :
c2 = ( 7.80+7.90+7.77+7.70+7.70+7.77+7.73
7 ) =
7.77
3. Perhitungan pusat cluster baru ketiga Karena cluster pertama (c3) memiliki tiga anggota maka :
c3 = ( 7.90+8.07+8.03+8.004 ) = 8.00
Menghitung jarak semua data ketiap titik pusat
cluster menggunakan euclidean distance dengan rumus sebagai berikut :
𝐷𝐿2 (𝑋1, 𝑋2) = ||𝑋2− 𝑋1|| = √∑𝑃 ( 𝑋2𝐽− 𝑋1𝐽 )
𝐽=1 ² atau 𝐷𝑖𝑗 = √Nilai B. Indonesia baris kei− Nilai Ci
1) Menghitung jarak data ke-1 dengan centroid
pertama (c1) 𝐷𝑖𝑗 =
√Nilai B. Indonesiai− Nilai C1
𝐷11 = √( 7.80 − 7.67) ² = 0.13 𝐷21 = √( 7.90 − 7.67) ² = 0.23 𝐷31 = √( 7.77 − 7.67) ² = 0.10 𝐷41 = √( 7.60 − 7.67) ² = 0.07 𝐷51 = √( 7.70 − 7.67) ² = 0.03 𝐷61 = √( 7.67 − 7.67) ² = 0.00 𝐷71 = √( 8.07 − 7.67) ² = 0.40 𝐷81 = √( 8.03 − 7.67) ² = 0.36 𝐷91 = √( 8.00 − 7.67) ² = 0.33 𝐷10,1 = √( 7.70 − 7.67) ² = 0.33 𝐷11,1 = √( 7.77 − 7.67) ² = 0.03 𝐷12,1 = √( 7.73 − 7.67) ² = 0.06
2) Menghitung jarak data ke-1 dengan centroid
kedua (c2) 𝐷𝑖𝑗 =
√Nilai B. Indonesiai− Nilai C2
𝐷12 = √( 7.80 − 7.77) ² = 0.03 𝐷22 = √( 7.90 − 7.77) ² = 0.13 𝐷32 = √( 7.77 − 7.77) ² = 0.00 𝐷42 = √( 7.60 − 7.77) ² = 0.17 𝐷52 = √( 7.70 − 7.77) ² = 0.07 𝐷62 = √( 7.67 − 7.77) ² = 0.10 𝐷72 = √( 8.07 − 7.77) ² = 0.30 𝐷82 = √( 8.03 − 7.77) ² = 0.26 𝐷92 = √( 8.00 − 7.77) ² = 0.23 𝐷10,2 = √( 7.70 − 7.77) ² = 0.07 𝐷11,2 = √( 7.77 − 7.77) ² = 0.00 𝐷12,2 = √( 7.73 − 7.77) ² = 0.04 3) Menghitung jarak data ke-1 dengan centroid
ketiga (c3) 𝐷𝑖𝑗 =
√Nilai B. Indonesiai− Nilai C3
𝐷13 = √( 7.80 − 8.00) ² = 0.20 𝐷23 = √( 7.90 − 8.00) ² = 0.10 𝐷33 = √( 7.77 − 8.00) ² = 0.23 𝐷43 = √( 7.60 − 8.00) ² = 0.40 𝐷53 = √( 7.70 − 8.00) ² = 0.30 𝐷63 = √( 7.67 − 8.00) ² = 0.33 𝐷73 = √( 8.07 − 8.00) ² = 0.07 𝐷83 = √( 8.03 − 8.00) ² = 0.03 𝐷93 = √( 8.00 − 8.00) ² = 0.00
Perancangan Aplikasi Pengelompokan Nilai Mata Pelajaran Hasil Tryout Siswa Peserta Bimbingan Belajar Menggunakan Metode K-Means Clustering Di SMP Swasta Ira Medan. Oleh : Khairunnisa Azni
90
𝐷10,3 = √( 7.70 − 8.00) ² = 0.30
𝐷11,3 = √( 7.77 − 8.00) ² = 0.23 𝐷12,3 = √( 7.73 − 8.00) ² = 0.27 Tabel 4.7 Perhitungan jarak setiap data dan posisi cluster pada iterasi ketiga
N o NIS N il ai r at a -r at a Di 1 Di 2 Di 3 C 1 C 2 C 3 1 091 010 215 7 . 8 0 0.1 3 0.0 3 0.2 0 * 2 091 010 251 7 . 9 0 0.2 3 0.1 3 0.1 0 * 3 091 010 072 7 . 7 7 0.1 0 0.0 0 0.2 3 * 4 091 010 111 7 . 6 0 0.0 7 0.1 7 0.4 0 * 5 091 010 148 7 . 7 0 0.0 3 0.0 7 0.3 0 * 6 091 010 182 7.67 0.0 0 0.1 0 0.3 3 * 7 091 010 257 8.07 0.4 0 0.3 0 0.0 7 * 8 091 010 150 8.03 0.3 6 0.2 6 0.0 3 * 9 091 010 077 8.00 0.3 3 0.2 3 0.0 0 * 1 0 091 010 258 7.70 0.0 3 0.0 7 0.3 0 * 1 1 091 010 292 7.77 0.1 3 0.0 0 0.2 3 * 1 2 091 010 045 7.73 0.0 6 0.0 4 0.2 7 *
Tabel 4.8 Hasil perhitungan perulangan jarak iterasi ke empat N o Nis Nila i rata -rata Di 1 Di 2 Di 3 C 1 C 2 C 3 1 09101 0215 7.80 0. 13 0. 03 0.2 0 * 2 09101 0251 7.90 0. 23 0. 13 0.1 0 * 3 09101 0072 7.77 0. 10 0. 00 0.2 3 * 4 09101 0111 7.60 0. 07 0. 17 0.4 0 * 5 09101 0148 7.70 0. 03 0. 07 0.3 0 * 6 09101 0182 7.67 0. 00 0. 10 0.3 3 * 7 09101 0257 8.07 0. 40 0. 30 0.0 7 * 8 09101 0150 8.03 0. 36 0. 26 0.0 3 * 9 09101 0077 8.00 0. 33 0. 23 0.0 0 * 1 0 09101 0258 7.70 0. 03 0. 07 0.3 0 * 1 1 09101 0292 7.77 0. 13 0. 00 0.2 3 * 1 2 09101 0045 7.73 0. 06 0. 04 0.2 7 *
4. Pada iterasi ke-3 dan ke-4 (Tabel 8 dan 9) posisi
cluster tidak berubah, maka iterasi dihentikan dan hasil akhir yang diperoleh adalah 3 cluster : a. Cluster pertama memiliki pusat (7.60, 7.67,
7.70, 7.70) yang dapat diartikan sebagai kelompok nilai hasil tryout siswa terendah dengan kelas pertama dan kerangka terendah b. Cluster kedua memiliki pusat (7.73, 7.77, 7.77, 7.80) yang dapat diartikan sebagai kelompok nilai hasil tryout siswa sedang dengan kelas kedua dan kerangka sedang c. Cluster ketiga memiliki pusat (7.90, 8.00,
8.03, 8.07) yang dapat diartikan sebagai kelompok nilai hasil tryout siswa terbesar dengan kelas ketiga dan kerangka terbesar Tabel 4.9 Hasil pengelompokkan kelas
No NIS Nilai Keterangan 1 091010111 7.60 Rendah 2 091010148 7.67 Rendah 3 091010182 7.70 Rendah 4 091010258 7.70 Rendah 5 091010215 7.73 Sedang 6 091010072 7.77 Sedang 7 091010292 7.77 Sedang 8 091010045 7.80 Sedang 9 091010215 7.90 Tinggi 10 091010257 8.00 Tinggi
Perancangan Aplikasi Pengelompokan Nilai Mata Pelajaran Hasil Tryout Siswa Peserta Bimbingan Belajar Menggunakan Metode K-Means Clustering Di SMP Swasta Ira Medan. Oleh : Khairunnisa Azni
91
11 091010150 8.03 Tinggi 12 091010077 8.07 Tinggi Berdasarkan hasil clustering pada tabel 4.10 diatas maka dapat disimpulkan bahwa terdapat empat siswa yang mendapatkan nilai di bawah standar kelulusan yang perlu dibimbingkan kembali oleh pihak sekolah.
5. Algoritma dan Implementasi
5.1 Algoritma
Algoritma K-means Clustering
Deklarasi c1, c2, c3, hasil : char Deskripsi : Input C1 ← centroid 1 C2 ← centroid 2 C3 ← centroid 3 Output Hasil pengelompokkan Proses For i ← 1 to k do pusat [ i ] ← random ( n ) Endfor beres ← false maxiter ← 0
while (beres = false or maxiter <= 50 do) for i ← 1 to n do
for j ← 1 to k do
Min [ j ] ← a [ i ] – pusat [ k ] kuadrat [ i ] ← min [ j ] * min [ j ] jarak [ i, j ] ← sqrt ( kuadrat [ i ] ) Endfor Endfor for i← 1 to N do dist ← jarak [ i, 1 ] cluster ← 1 for j← 2 to K do
if jarak [ i, j ] < dist then dist ← jarak [ i, j ] cluster ← j Endif
Endif
anggota [ i ]. nilai ← data [ i ] anggota [ i ]. klaster ← cluster Endfor
for i ← 1 to k do for j ← 1 to n do
if anggota [ j ]. Klaster = 1 then c ← anggota [ j ]. Nilai hasil [ i, j ] ← c endif endfor Endfor for i ← 1 to k do jum ← 0 byk ← 0 for j ← 1 to n do
jum ← jum + hasil [ i, j ] if hasil [ i, j ] = 0 then
byk ← byk + 1 Endif
Endfor
centroid [ i ] ← jum / ( j – 1 – byk) Endfor
temp ← 0 temp1 ← 0 for i ← 1 to k do
temp ← temp + pusat [ i ] temp1 ← temp1 + centroid [ i ] Endfor
if temp = temp1 then Beres ← true Else for j ← 1 to k do pusat [ j ] ← centroid [ j ] endfor Endif maxiter ← maxiter + 1 Endwhile for i ← 1 to n do
write ( anggota [ i ]. nilai,’ ’, anggota [ i ]. Klaster )
endfor
6. Kesimpulan dan Saran
6.1 Kesimpulan
Setelah melalui proses penyelesaian, maka penulis menarik beberapa kesimpulan sebagai berikut :
1. SMP Swasta Ira Medan sebelumnya tidak menggunakan pengelompokkan nilai hasil
tryout dalam perhitungan nilai hasil tryout. Dimana nilai tersebut tidak mengelompokkan nilai terkecil dan terendahnya.
2. Sistem ini dibangun dengan metode K-means clustering sebagai pengelompokkan dari nilai hasil tryout tersebut.
3. Sistem yang dibangun menggunakan software visual basic 2008 dan database nya menggunakan MySql serta K-means clustering
sebagai metode nya. Form yang ada pada sistem ini meliputi [form menu utama, form import
data, form pengelompokkan
6.2 Saran
Penulis ingin memberikan beberapa saran yang mungkin berguna untuk pengembangan lebih lanjut pada pengelompokkan nilai mata pelajaran hasil
tryout siswa peserta bimbingan belajar dengan menggunakan algoritma K-means Clustering yaitu : 1. Diharapkan pihak sekolah lebih efisien dalam
proses pengelompokkan nilai mata pelajaran hasil tryout serta dapat membuat remedial atau pelajaran tambahan bagi siswa yang memiliki nilai yang terendah.
2. Diharapkan untuk kedepannya metode K-means clustering ini dapat dikembangkan lagi untuk kasus sistem pembagian kelompok dalam semua
Perancangan Aplikasi Pengelompokan Nilai Mata Pelajaran Hasil Tryout Siswa Peserta Bimbingan Belajar Menggunakan Metode K-Means Clustering Di SMP Swasta Ira Medan. Oleh : Khairunnisa Azni
92
proses kegiatan belajar mengajar di SMP Swasta Ira Medan.
Daftar Pustaka
1. Eko Prasetio (2013). “ Data Mining”. Yogyakarta, ANDI.
2. Fajar Astuti Herwati (2012). “Data Mining”. Yogyakarta, ANDI
3. Indrajani (2015). “Database Design”. Jakarta, PT. Elex Media Komputindo.
4. Yuni Sugiarti (2013). “Analisis dan Perancangan Unified Modelling Laguage (UML) Generate VB.6”. yogyakrta, Graha Ilmu