ANALISIS DAN PERANCANGAN
3.3. Analisis Clustering K-Means
Pada tahap ini dilakukan analisis dengan clustering k-means. Tahapan analisis yang akan dilakukan yaitu:
3.3.1. Menentukan Jumlah Cluster
Tahap awal dalam proses clustering adalah menentukan berapa jumlah cluster yang diinginkan. Pada sistem penentuan penerima bantuan bedah rumah akan digunakan 3 cluster yaitu cluster pertama (C1), cluster kedua (C2) dan cluster ketiga (C3).
3.3.2. Menentukan Pusat Cluster (centroid)
Pada tahap ini ditentukan nilai pusat cluster (centroid) awal secara random dari data yang telah diinputkan. Centroid kriteria 1 jenis lantai, centroid kriteria 2 jenis dinding, centroid kriteria 3 jenis atap, centroid kriteria 4 fasilitas buang air besar, centroid kriteria 5 jenis kloset, centroid kriteria 6 tempat pembuangan akhir tinja, centroid kriteria 7 jumlah anggota rumah tangga, centroid kriteria 8 status kesejahteraan. Maka diperoleh :
C1 = (9; 6; 9; 4; 0; 6; 8; 1) C2 = (4; 3; 4; 2; 2; 3; 5; 2) C3 = (1; 1; 1; 1; 1; 1; 3; 4)
3.3.3. Hitung Jarak Data dengan Euclidean Distance
Kemudian akan dihitung jarak dari setiap data ke setiap pusat cluster yang ada dengan euclidean distance sehingga ditemukan jarak terdekat dari tiap data ke centroid.
Perhitungan dengan euclidean distance dapat digunakan dengan persamaan 3.1 : ๐(๐ฅ๐, ๐๐) = โ(๐ฅ๐๐ โ ๐๐๐)2+ (๐ฅ๐๐ โ ๐๐๐)2โฆ (3.1) Dengan ketentuan sebagai berikut:
xi : data kriteria
ยตj : centroid pada cluster ke-j
Jarak data pertama ke pusat cluster pertama
d11=โ(6 โ 9)2+ (3 โ 6)2+ (6 โ 9)2+ (4 โ 4)2+(0 โ 0)2+ โฏ + (1 โ 1)2
= 9.433
Jarak data pertama ke pusat cluster kedua
d12=โ(6 โ 4)2+ (3 โ 3)2+ (6 โ 4)2+ (4 โ 2)2+(0 โ 2)2+ โฏ + (1 โ 2)2
= 7.280
Jarak data pertama ke pusat cluster ketiga
d13=โ(6 โ 1)2+ (3 โ 1)2+ (6 โ 1)2+ (4 โ 1)2+(0 โ 1)2+ โฏ + (1 โ 4)2
= 8.246
Jarak data kedua ke pusat cluster pertama
d21=โ(6 โ 9)2+ (1 โ 6)2+ (6 โ 9)2+ (1 โ 4)2+(1 โ 0)2+ โฏ + (4 โ 1)2
= 10.148
Jarak data kedua ke pusat cluster kedua
d22=โ(6 โ 4)2+ (1 โ 3)2+ (6 โ 4)2+ (1 โ 2)2+(1 โ 2)2+ โฏ + (4 โ 2)2
= 5
Jarak data kedua ke pusat cluster ketiga
d23=โ(6 โ 1)2+ (1 โ 1)2+ (6 โ 1)2+ (1 โ 1)2+(1 โ 1)2+ โฏ + (4 โ 4)2
= 6.480
Jarak data ketiga ke pusat cluster pertama
d31=โ(6 โ 9)2+ (1 โ 6)2+ (6 โ 9)2+ (4 โ 4)2+(0 โ 0)2+ โฏ + (4 โ 1)2
= 8.485
Jarak data ketiga ke pusat cluster kedua
d32=โ(6 โ 4)2+ (1 โ 3)2+ (6 โ 4)2+ (4 โ 2)2+(0 โ 2)2+ โฏ + (4 โ 2)2
= 6
Jarak data ketiga ke pusat cluster ketiga
d33=โ(6 โ 1)2+ (1 โ 1)2+ (6 โ 1)2+ (4 โ 1)2+(0 โ 1)2+ โฏ + (4 โ 4)2
= 7.810
Hasil perhitungan jarak awal pada iterasi-1 dapat dilihat pada Tabel 3.10.
Tabel 3.10. Pusat cluster iterasi 1
Nama Cluster 1 Cluster 2 Cluster 3
3.3.4. Kelompokkan Data pada Cluster Terdekat
Dari hasil hitungan pada Tabel 3.10, setiap data akan dialokasikan ke suatu cluster berdasarkan jarak terdekat dari pusat clusternya. Pada data pertama diperoleh jarak terdekat dengan pusat cluster kedua, maka data tersebut akan menjadi anggota cluster kedua. Hasil cluster pada iterasi 1 dapat dilihat pada Tabel 3.11:
Tabel 3.11. Hasil cluster iterasi 1
Nama Cluster 1 Cluster 2 Cluster 3
3.3.5. Hitung Pusat Cluster Baru
Menghitung pusat cluster baru dilakukan dengan cara menghitung nilai rata-rata dari masing-masing kriteria seluruh anggota yang menjadi anggota masing-masing cluster. Untuk menghitung pusat cluster baru digunakan persamaan 3.2:
ยต=
โ ๐ฅ๐n = banyaknya objek/jumlah objek yang menjadi anggota cluster
a. Pada cluster pertama terdapat 123 data, sehingga perhitungan cluster barunya sebagai berikut
b. Pada cluster kedua terdapat 1042 data, sehinga perhitungan cluster barunya sebagai berikut
C26= 4+1+4+1+4+..โฆ.+1+1+1
c. Pada cluster ketiga terdapat 15 data, sehinga perhitungan cluster barunya sebagai berikut
Sehingga didapat nilai hasil pusat cluster (centroid) baru adalah C1= (7.569 ; 3.650 ; 8.024 ; 3.780 ; 0,178 ; 4,121 ; 4.536 ; 2.601).
C2= (6.001 ; 2.687 ; 6.051 ; 2.314 ; 0.931; 2.998 ; 3.969; 3.300).
C3= (2 ; 1 ; 5.933 ; 1.2 ; 1 ; 1.333 ; 3.6 ; 3.933).
Setelah itu lakukan iterasi yang kedua dengan tahapan hitung jarak antar data dengan persamaan euclidean distance (3.1) dan diperoleh:
Jarak data pertama ke pusat cluster pertama
d11=โ(6 โ 7.56)2+ (3 โ 3.65)2+ (6 โ 8.02)2+ (4 โ 3.78)2+. . +(1 โ 2.60)2
= 4.641
Jarak data pertama ke pusat cluster kedua
d12=โ(6 โ 6.001)2+ (3 โ 268. )2+ (6 โ 6.05)2+ (4 โ 2.31)2+. . +(1 โ 3.30)2
= 3.757
Jarak data pertama ke pusat cluster ketiga
d13=โ(6 โ 2)2+ (3 โ 1)2+ (6 โ 5.933)2+ (4 โ 1.2)2+. . +(1 โ 3.933)2
= 6.536
Jarak data kedua ke pusat cluster pertama
d21=โ(6 โ 7.56)2+ (1 โ 3.65)2+ (6 โ 8.02)2+ (1 โ 3.78)2+ โฏ + (4 โ 2.60)2
= 5.829
Jarak data kedua ke pusat cluster kedua
d22=โ(6 โ 6.001)2+ (1 โ 2.68)2+ (6 โ 6.05)2+ (1 โ 2.31)2+ โฏ + (4 โ 3.3)2
= 3.010
Jarak data kedua ke pusat cluster ketiga
d23=โ(6 โ 2)2+ (1 โ 1)2+ (6 โ 5.933)2+ (1 โ 1.2)2+ โฏ + (4 โ 3.933)2
= 4.039
Jarak data ketiga ke pusat cluster pertama
d31=โ(6 โ 7.56)2+ (1 โ 3.65)2+ (6 โ 8.02)2+ (4 โ 3.78)2+ โฏ + (4 โ 2.60)2
= 3.990
Jarak data ketiga ke pusat cluster kedua
d32=โ(6 โ 6.001)2+ (1 โ 2.68)2+ (6 โ 6.05)2+ (4 โ 2.31)2+ โฏ + (4 โ 3.3)2
= 2.837
Jarak data ketiga ke pusat cluster ketiga
d33=โ(6 โ 2)2+ (1 โ 1)2+ (6 โ 5.933)2+ (4 โ 1.2)2+ โฏ + (4 โ 3.933)2
= 5.677
Hasil perhitungan diatas dapat dilihat pada Tabel 3.12.
Tabel 3.12. Pusat cluster iterasi 2
Nama Cluster 1 Cluster 2 Cluster 3
Yenemi Br Sitepu 4.641 3.757 6.536
Anto Girsang 5.829 3.010 4.039
Rasman Purba 3.990 2.837 5.667
Sayur Sitepu 5.237 3.168 5.175
โฆ.. โฆ.. โฆ.. โฆ..
Syamsudin 5.829 3.010 4.039
Dari Tabel 3.12 di atas, pilihlah cluster yang paling kecil sehingga hasilnya diperoleh seperti pada Tabel 3.13.
Tabel 3.13. Hasil cluster iterasi 2
Nama Cluster 1 Cluster 2 Cluster 3
Yenemi Br Sitepu 0 * 0
Anto Girsang 0 * 0
Rasman Purba 0 * 0
Sayur Sitepu 0 * 0
โฆ.. โฆ.. โฆ.. โฆ..
Syamsudin 0 * 0
Pada Tabel 3.13 di atas dapat dibandingkan dengan Tabel 3.11, bahwa posisi cluster masih berubah, maka dilanjutkan dengan iterasi 3. Pada percobaan kali ini, proses akan berhenti pada iterasi ke 6. Adapun titik pusat cluster pada iterasi ke 6 adalah C1= (6.355 ; 2.921 ; 6.421 ; 4 ; 0 ; 4.124 ; 3.680 ; 2.94).
C2= (6.232 ; 2.745 ; 6.128 ; 1.096 ; 1.623 ; 2.212 ; 4.268 ; 3.478).
C3= (2.040 ; 1.306 ; 5.979 ; 1.897 ; 0.918 ; 2.448 ; 4.836 ; 3.489).
3.3.6. Hasil Clustering
Proses iterasi berakhir pada iterasi ke 6 dan menghasilkan 538 data untuk cluster pertama, 593 data pada cluster kedua dan 49 data pada cluster ketiga yang dapat dilihat di Tabel 3.14, Tabel 3.15 dan Tabel 3.16.
Tabel 3.14. Hasil Cluster Pertama
No Nama Cluster
Tabel 3.15. Hasil Cluster Kedua
No Nama Cluster
1 Anto Girsang Cluster 2
2 Sayur Sitepu Cluster 2
3 Lohe Br Manik Cluster 2
4 Mersa Br Simanjuntak Cluster 2
5 Kariono Barus Cluster 2
Tabel 3.16. Hasil Cluster Ketiga
No Nama Cluster
1 Supendi Cluster 3
2 Rasna Br Sitepu Cluster 3
3 Ngadirit Cluster 3
4 Julieso Perangin Angin Cluster 3
5 Pirngadianian Saragih Cluster 3
6 Ramianta Br Damanik Cluster 3
โฆ โฆ.. Cluster 3
47 Sarman Damanik Cluster 3
48 Jumadi Cluster 3
49 Bistok Sibarani Cluster 3
Dari hasil pusat cluster didapatkan informasi sebagai berikut:
1. Cluster pertama berisi rumah yang memiliki jenis lantai semen; jenis dinding kayu; jenis atap seng; fasilitas buang air besar tidak ada; jenis kloset tidak ada;
tempat pembuangan akhir tinja di kolam/sawah/sungai; memiliki anggota rumah tangga sebanyak 4 orang; serta status kesejahteraannya berada di desil ke 3.
Keadaan rumah ini dianggap sebagai rumah tidak layak.
2. Cluster kedua berisi rumah yang memiliki jenis lantai semen; jenis dinding kayu; jenis atap seng; fasilitas buang air besar sendiri; jenis kloset plengsengan;
tempat pembuangan akhir tinja di SPAL; memiliki anggota rumah tangga sebanyak 4 orang; serta status kesejahteraannya berada di desil ke 3. Keadaan rumah ini dianggap sebagai rumah sedang sebab telah memiliki fasilitas buang air besar dan tidak terlalu buruk.
3. Cluster ketiga berisi rumah yang memiliki jenis lantai keramik; jenis dinding tembok; jenis atap seng; fasilitas buang air besar bersama ; jenis kloset leher angsa; tempat pembuangan akhir tinja di SPAL; memiliki anggota rumah tangga sebanyak 5 orang; serta status kesejahteraannya berada di desil ke 3. Keadaan rumah ini dianggap sebagai rumah hampir layak.
Oleh karena itu, hasil cluster untuk pengelompokkan keadaaan rumah yang berhak mendapatkan bantuan dikelompokkan menjadi 3 cluster yaitu :
1. Cluster tidak layak, dimana keadaan rumahnya sangat tidak layak dan paling berhak mendapatkan bantuan.
2. Cluster sedang, keadaan rumahnya lebih baik dari rumah di cluster tidak layak dan bisa mendapatkan bantuan setelah cluster tidak layak
3. Cluster hampir layak, keadaan rumahnya cukup baik dan akan mendapatkan bantuan jika cluster sedang telah mendapatkan bantuan terlebih dahulu.