• Tidak ada hasil yang ditemukan

Analisis Clustering K-Means

Dalam dokumen SKRIPSI NOVIRA NAILI ULYA SIREGAR (Halaman 39-48)

ANALISIS DAN PERANCANGAN

3.3. Analisis Clustering K-Means

Pada tahap ini dilakukan analisis dengan clustering k-means. Tahapan analisis yang akan dilakukan yaitu:

3.3.1. Menentukan Jumlah Cluster

Tahap awal dalam proses clustering adalah menentukan berapa jumlah cluster yang diinginkan. Pada sistem penentuan penerima bantuan bedah rumah akan digunakan 3 cluster yaitu cluster pertama (C1), cluster kedua (C2) dan cluster ketiga (C3).

3.3.2. Menentukan Pusat Cluster (centroid)

Pada tahap ini ditentukan nilai pusat cluster (centroid) awal secara random dari data yang telah diinputkan. Centroid kriteria 1 jenis lantai, centroid kriteria 2 jenis dinding, centroid kriteria 3 jenis atap, centroid kriteria 4 fasilitas buang air besar, centroid kriteria 5 jenis kloset, centroid kriteria 6 tempat pembuangan akhir tinja, centroid kriteria 7 jumlah anggota rumah tangga, centroid kriteria 8 status kesejahteraan. Maka diperoleh :

C1 = (9; 6; 9; 4; 0; 6; 8; 1) C2 = (4; 3; 4; 2; 2; 3; 5; 2) C3 = (1; 1; 1; 1; 1; 1; 3; 4)

3.3.3. Hitung Jarak Data dengan Euclidean Distance

Kemudian akan dihitung jarak dari setiap data ke setiap pusat cluster yang ada dengan euclidean distance sehingga ditemukan jarak terdekat dari tiap data ke centroid.

Perhitungan dengan euclidean distance dapat digunakan dengan persamaan 3.1 : ๐‘‘(๐‘ฅ๐‘–, ๐œ‡๐‘—) = โˆš(๐‘ฅ๐‘–๐‘Ž โˆ’ ๐œ‡๐‘—๐‘Ž)2+ (๐‘ฅ๐‘–๐‘ โˆ’ ๐œ‡๐‘—๐‘)2โ€ฆ (3.1) Dengan ketentuan sebagai berikut:

xi : data kriteria

ยตj : centroid pada cluster ke-j

Jarak data pertama ke pusat cluster pertama

d11=โˆš(6 โˆ’ 9)2+ (3 โˆ’ 6)2+ (6 โˆ’ 9)2+ (4 โˆ’ 4)2+(0 โˆ’ 0)2+ โ‹ฏ + (1 โˆ’ 1)2

= 9.433

Jarak data pertama ke pusat cluster kedua

d12=โˆš(6 โˆ’ 4)2+ (3 โˆ’ 3)2+ (6 โˆ’ 4)2+ (4 โˆ’ 2)2+(0 โˆ’ 2)2+ โ‹ฏ + (1 โˆ’ 2)2

= 7.280

Jarak data pertama ke pusat cluster ketiga

d13=โˆš(6 โˆ’ 1)2+ (3 โˆ’ 1)2+ (6 โˆ’ 1)2+ (4 โˆ’ 1)2+(0 โˆ’ 1)2+ โ‹ฏ + (1 โˆ’ 4)2

= 8.246

Jarak data kedua ke pusat cluster pertama

d21=โˆš(6 โˆ’ 9)2+ (1 โˆ’ 6)2+ (6 โˆ’ 9)2+ (1 โˆ’ 4)2+(1 โˆ’ 0)2+ โ‹ฏ + (4 โˆ’ 1)2

= 10.148

Jarak data kedua ke pusat cluster kedua

d22=โˆš(6 โˆ’ 4)2+ (1 โˆ’ 3)2+ (6 โˆ’ 4)2+ (1 โˆ’ 2)2+(1 โˆ’ 2)2+ โ‹ฏ + (4 โˆ’ 2)2

= 5

Jarak data kedua ke pusat cluster ketiga

d23=โˆš(6 โˆ’ 1)2+ (1 โˆ’ 1)2+ (6 โˆ’ 1)2+ (1 โˆ’ 1)2+(1 โˆ’ 1)2+ โ‹ฏ + (4 โˆ’ 4)2

= 6.480

Jarak data ketiga ke pusat cluster pertama

d31=โˆš(6 โˆ’ 9)2+ (1 โˆ’ 6)2+ (6 โˆ’ 9)2+ (4 โˆ’ 4)2+(0 โˆ’ 0)2+ โ‹ฏ + (4 โˆ’ 1)2

= 8.485

Jarak data ketiga ke pusat cluster kedua

d32=โˆš(6 โˆ’ 4)2+ (1 โˆ’ 3)2+ (6 โˆ’ 4)2+ (4 โˆ’ 2)2+(0 โˆ’ 2)2+ โ‹ฏ + (4 โˆ’ 2)2

= 6

Jarak data ketiga ke pusat cluster ketiga

d33=โˆš(6 โˆ’ 1)2+ (1 โˆ’ 1)2+ (6 โˆ’ 1)2+ (4 โˆ’ 1)2+(0 โˆ’ 1)2+ โ‹ฏ + (4 โˆ’ 4)2

= 7.810

Hasil perhitungan jarak awal pada iterasi-1 dapat dilihat pada Tabel 3.10.

Tabel 3.10. Pusat cluster iterasi 1

Nama Cluster 1 Cluster 2 Cluster 3

3.3.4. Kelompokkan Data pada Cluster Terdekat

Dari hasil hitungan pada Tabel 3.10, setiap data akan dialokasikan ke suatu cluster berdasarkan jarak terdekat dari pusat clusternya. Pada data pertama diperoleh jarak terdekat dengan pusat cluster kedua, maka data tersebut akan menjadi anggota cluster kedua. Hasil cluster pada iterasi 1 dapat dilihat pada Tabel 3.11:

Tabel 3.11. Hasil cluster iterasi 1

Nama Cluster 1 Cluster 2 Cluster 3

3.3.5. Hitung Pusat Cluster Baru

Menghitung pusat cluster baru dilakukan dengan cara menghitung nilai rata-rata dari masing-masing kriteria seluruh anggota yang menjadi anggota masing-masing cluster. Untuk menghitung pusat cluster baru digunakan persamaan 3.2:

ยต=

โˆ‘ ๐‘ฅ๐‘–

n = banyaknya objek/jumlah objek yang menjadi anggota cluster

a. Pada cluster pertama terdapat 123 data, sehingga perhitungan cluster barunya sebagai berikut

b. Pada cluster kedua terdapat 1042 data, sehinga perhitungan cluster barunya sebagai berikut

C26= 4+1+4+1+4+..โ€ฆ.+1+1+1

c. Pada cluster ketiga terdapat 15 data, sehinga perhitungan cluster barunya sebagai berikut

Sehingga didapat nilai hasil pusat cluster (centroid) baru adalah C1= (7.569 ; 3.650 ; 8.024 ; 3.780 ; 0,178 ; 4,121 ; 4.536 ; 2.601).

C2= (6.001 ; 2.687 ; 6.051 ; 2.314 ; 0.931; 2.998 ; 3.969; 3.300).

C3= (2 ; 1 ; 5.933 ; 1.2 ; 1 ; 1.333 ; 3.6 ; 3.933).

Setelah itu lakukan iterasi yang kedua dengan tahapan hitung jarak antar data dengan persamaan euclidean distance (3.1) dan diperoleh:

Jarak data pertama ke pusat cluster pertama

d11=โˆš(6 โˆ’ 7.56)2+ (3 โˆ’ 3.65)2+ (6 โˆ’ 8.02)2+ (4 โˆ’ 3.78)2+. . +(1 โˆ’ 2.60)2

= 4.641

Jarak data pertama ke pusat cluster kedua

d12=โˆš(6 โˆ’ 6.001)2+ (3 โˆ’ 268. )2+ (6 โˆ’ 6.05)2+ (4 โˆ’ 2.31)2+. . +(1 โˆ’ 3.30)2

= 3.757

Jarak data pertama ke pusat cluster ketiga

d13=โˆš(6 โˆ’ 2)2+ (3 โˆ’ 1)2+ (6 โˆ’ 5.933)2+ (4 โˆ’ 1.2)2+. . +(1 โˆ’ 3.933)2

= 6.536

Jarak data kedua ke pusat cluster pertama

d21=โˆš(6 โˆ’ 7.56)2+ (1 โˆ’ 3.65)2+ (6 โˆ’ 8.02)2+ (1 โˆ’ 3.78)2+ โ‹ฏ + (4 โˆ’ 2.60)2

= 5.829

Jarak data kedua ke pusat cluster kedua

d22=โˆš(6 โˆ’ 6.001)2+ (1 โˆ’ 2.68)2+ (6 โˆ’ 6.05)2+ (1 โˆ’ 2.31)2+ โ‹ฏ + (4 โˆ’ 3.3)2

= 3.010

Jarak data kedua ke pusat cluster ketiga

d23=โˆš(6 โˆ’ 2)2+ (1 โˆ’ 1)2+ (6 โˆ’ 5.933)2+ (1 โˆ’ 1.2)2+ โ‹ฏ + (4 โˆ’ 3.933)2

= 4.039

Jarak data ketiga ke pusat cluster pertama

d31=โˆš(6 โˆ’ 7.56)2+ (1 โˆ’ 3.65)2+ (6 โˆ’ 8.02)2+ (4 โˆ’ 3.78)2+ โ‹ฏ + (4 โˆ’ 2.60)2

= 3.990

Jarak data ketiga ke pusat cluster kedua

d32=โˆš(6 โˆ’ 6.001)2+ (1 โˆ’ 2.68)2+ (6 โˆ’ 6.05)2+ (4 โˆ’ 2.31)2+ โ‹ฏ + (4 โˆ’ 3.3)2

= 2.837

Jarak data ketiga ke pusat cluster ketiga

d33=โˆš(6 โˆ’ 2)2+ (1 โˆ’ 1)2+ (6 โˆ’ 5.933)2+ (4 โˆ’ 1.2)2+ โ‹ฏ + (4 โˆ’ 3.933)2

= 5.677

Hasil perhitungan diatas dapat dilihat pada Tabel 3.12.

Tabel 3.12. Pusat cluster iterasi 2

Nama Cluster 1 Cluster 2 Cluster 3

Yenemi Br Sitepu 4.641 3.757 6.536

Anto Girsang 5.829 3.010 4.039

Rasman Purba 3.990 2.837 5.667

Sayur Sitepu 5.237 3.168 5.175

โ€ฆ.. โ€ฆ.. โ€ฆ.. โ€ฆ..

Syamsudin 5.829 3.010 4.039

Dari Tabel 3.12 di atas, pilihlah cluster yang paling kecil sehingga hasilnya diperoleh seperti pada Tabel 3.13.

Tabel 3.13. Hasil cluster iterasi 2

Nama Cluster 1 Cluster 2 Cluster 3

Yenemi Br Sitepu 0 * 0

Anto Girsang 0 * 0

Rasman Purba 0 * 0

Sayur Sitepu 0 * 0

โ€ฆ.. โ€ฆ.. โ€ฆ.. โ€ฆ..

Syamsudin 0 * 0

Pada Tabel 3.13 di atas dapat dibandingkan dengan Tabel 3.11, bahwa posisi cluster masih berubah, maka dilanjutkan dengan iterasi 3. Pada percobaan kali ini, proses akan berhenti pada iterasi ke 6. Adapun titik pusat cluster pada iterasi ke 6 adalah C1= (6.355 ; 2.921 ; 6.421 ; 4 ; 0 ; 4.124 ; 3.680 ; 2.94).

C2= (6.232 ; 2.745 ; 6.128 ; 1.096 ; 1.623 ; 2.212 ; 4.268 ; 3.478).

C3= (2.040 ; 1.306 ; 5.979 ; 1.897 ; 0.918 ; 2.448 ; 4.836 ; 3.489).

3.3.6. Hasil Clustering

Proses iterasi berakhir pada iterasi ke 6 dan menghasilkan 538 data untuk cluster pertama, 593 data pada cluster kedua dan 49 data pada cluster ketiga yang dapat dilihat di Tabel 3.14, Tabel 3.15 dan Tabel 3.16.

Tabel 3.14. Hasil Cluster Pertama

No Nama Cluster

Tabel 3.15. Hasil Cluster Kedua

No Nama Cluster

1 Anto Girsang Cluster 2

2 Sayur Sitepu Cluster 2

3 Lohe Br Manik Cluster 2

4 Mersa Br Simanjuntak Cluster 2

5 Kariono Barus Cluster 2

Tabel 3.16. Hasil Cluster Ketiga

No Nama Cluster

1 Supendi Cluster 3

2 Rasna Br Sitepu Cluster 3

3 Ngadirit Cluster 3

4 Julieso Perangin Angin Cluster 3

5 Pirngadianian Saragih Cluster 3

6 Ramianta Br Damanik Cluster 3

โ€ฆ โ€ฆ.. Cluster 3

47 Sarman Damanik Cluster 3

48 Jumadi Cluster 3

49 Bistok Sibarani Cluster 3

Dari hasil pusat cluster didapatkan informasi sebagai berikut:

1. Cluster pertama berisi rumah yang memiliki jenis lantai semen; jenis dinding kayu; jenis atap seng; fasilitas buang air besar tidak ada; jenis kloset tidak ada;

tempat pembuangan akhir tinja di kolam/sawah/sungai; memiliki anggota rumah tangga sebanyak 4 orang; serta status kesejahteraannya berada di desil ke 3.

Keadaan rumah ini dianggap sebagai rumah tidak layak.

2. Cluster kedua berisi rumah yang memiliki jenis lantai semen; jenis dinding kayu; jenis atap seng; fasilitas buang air besar sendiri; jenis kloset plengsengan;

tempat pembuangan akhir tinja di SPAL; memiliki anggota rumah tangga sebanyak 4 orang; serta status kesejahteraannya berada di desil ke 3. Keadaan rumah ini dianggap sebagai rumah sedang sebab telah memiliki fasilitas buang air besar dan tidak terlalu buruk.

3. Cluster ketiga berisi rumah yang memiliki jenis lantai keramik; jenis dinding tembok; jenis atap seng; fasilitas buang air besar bersama ; jenis kloset leher angsa; tempat pembuangan akhir tinja di SPAL; memiliki anggota rumah tangga sebanyak 5 orang; serta status kesejahteraannya berada di desil ke 3. Keadaan rumah ini dianggap sebagai rumah hampir layak.

Oleh karena itu, hasil cluster untuk pengelompokkan keadaaan rumah yang berhak mendapatkan bantuan dikelompokkan menjadi 3 cluster yaitu :

1. Cluster tidak layak, dimana keadaan rumahnya sangat tidak layak dan paling berhak mendapatkan bantuan.

2. Cluster sedang, keadaan rumahnya lebih baik dari rumah di cluster tidak layak dan bisa mendapatkan bantuan setelah cluster tidak layak

3. Cluster hampir layak, keadaan rumahnya cukup baik dan akan mendapatkan bantuan jika cluster sedang telah mendapatkan bantuan terlebih dahulu.

Dalam dokumen SKRIPSI NOVIRA NAILI ULYA SIREGAR (Halaman 39-48)

Dokumen terkait