• Tidak ada hasil yang ditemukan

1

= = =

Dari hasil perhitungan diatas di dapatkan hasil bahwa jarak data pasien ke – 1 dengan pusat cluster pertama adalah 4

Akan dihitung jarak dari data pasien ke -1 ke pusat cluster kedua D(1,2) =

= = =

Dari hasil perhitungan diatas di dapatkan hasil bahwa jarak data pasien ke - 1 dengan pusat cluster kedua adalah 0

Akan dihitung jarak dari data pasien ke - 1 ke pusat cluster ketiga D(1,3) =

= = =

Dari hasil perhitungan diatas di dapatkan hasil bahwa jarak data pasien pertama dengan pusat cluster ketiga adalah = 6.083

Berdasarkan hasil perhitungan diatas disimpulkan bahwa jarak data pasien ke - 1 yang paling dekat adalah dengan cluster 3 yaitu 6.043, ini berarti data ke - 1 akan menjadi anggota pada kelompok cluster yang kedua (C2).

Tabel 4.12 Jarak Setiap Data Pasien ke Titik Centroid pada Iterasi ke – 1

No Nama W P U Jarak Ke Min Cluster

C1 C2 C3 C1 C2 C3 0 Daniel 2 1 33 4.0 0.0 6.083 * C2 1 Hendrik 3 2 25 12.083 8.124 2.236 * C3 2 Rinaldi 1 3 44 7.348 11.225 17.234 * C1 3 Marusaha 2 1 31 6.0 2.0 4.123 * C2 4 Ana 2 1 37 4.0 10.05 10.05 * C1

5 Linda 3 2 40 3.317 7.141 13.038 * C1 6 Keanu 4 2 24 13.191 9.274 3.317 * C3 7 Abadi 1 4 42 5.916 9.539 15.427 * C2 8 Zefri 4 4 38 3.742 6.164 11.446 * C2 9 Susan 4 5 28 10.05 6.708 4.234 * C3 10 Ilham 3 1 27 10.05 6.083 0.0 * C3 11 Titin 3 1 22 15.033 11.045 5.0 * C3 12 Roma 2 1 27 10.0 6.0 1.0 * C3 13 Pidia 2 5 30 8.062 5.0 5.099 * C2 14 Arki 4 2 44 7.348 11.225 17.059 * C1 15 Asima 1 3 41 4.583 8.307 14.283 * C1 16 Darleny 1 3 24 13.191 9.274 4.123 * C3 17 Arif 1 1 22 15.033 11.045 5.385 * C3 18 Indah 1 3 27 10.247 6.403 2.828 * C3 19 Humala 3 2 26 11.091 7.141 1.414 * C3 Langkah selanjutnya menghitung pusat cluster baru. Pusat cluster baru ditentukan berdasarkan pengelompokan anggota masing-masing cluster berdasarkan tabel diatas,

cluster pertama untuk parameter wilayah pasien memiliki 7 anggota (tujuh) yaitu pasien ke-2, ke-4, ke-5, ke-7, ke-8, ke-14, ke-15. Pusat cluster baru untuk cluster

pertama dihitung berdasarkan rata-rata koordinat ketujuh anggota tersebut adalah : C11 Wilayah _Pasien (Baru) = 1+2+3+1+4+4+1

= 16/7 = 2.285

Cluster yang kedua utnuk parameter umur memiliki 3 anggota (tiga) yaitu pasien ke- 0, ke-3, ke-13. Pusat cluster baru untuk cluster yang kedua dihitung berdasarkan rata- rata koordinat ketiga anggota tersebut.

C21 Wilayah_Pasien (Baru) = 2+2+2 = 6/3 = 2

Cluster yang ketiga untuk parameter umum memiliki 10 anggota (sepuluh) yaitu pasien ke-1, ke-6, ke-9, ke-10, ke-11, ke-12, ke-16, ke-17, ke-18, ke-19. Pusat cluster

baru untuk cluster ketiga dihitung berdasarkan rata – rata koordinat kesepuluh anggota anggota tersebut adalah :

C31 Wilayah_Pasien (Baru) = 3+4+4+3+3+2+1+1+1+3 = 25/10

Cluster pertama untuk parameter pekerjaan pasien memiliki 7 anggota (tujuh) yaitu pasien ke-2, ke-4, ke-5, ke-7, ke-8, ke-14, ke-15.. Pusat cluster baru untuk cluster

pertama dihitung berdasarkan rata-rata koordinat ketujuh anggota tersebut adalah :C11 Pekerjaan _Pasien (Baru) = 3+1+2+4+4+2+3

= 19/7 = 2.714

Cluster yang kedua untuk parameter umur memiliki 3 anggota (tiga) yaitu pasien ke- 0, ke-3, ke-13. Pusat cluster baru untuk cluster yang kedua dihitung berdasarkan rata- rata koordinat ketiga anggota tersebut.

C21 Pekerjaan_Pasien (Baru) = 1+1+5 = 7/3 = 2.333

Cluster yang ketiga untuk parameter umum memiliki 10 anggota (sepuluh) yaitu pasien ke-1, ke-6, ke-9, ke-10, ke-11, ke-12, ke-16, ke-17, ke-18, ke-19. Pusat cluster

baru untuk cluster ketiga dihitung berdasarkan rata – rata koordinat kesepuluh anggota anggota tersebut adalah :

C31 Pekerajaan_Pasien (Baru) = 2+2+5+1+1+1+3+1+3+2 = 21/10

= 2.1

Cluster pertama untuk parameter umur pasien memiliki 7 anggota (tujuh) yaitu pasien ke-2, ke-4, ke-5, ke-7, ke-8, ke-14, ke-15.. Pusat cluster baru untuk cluster pertama dihitung berdasarkan rata-rata koordinat ketujuh anggota tersebut adalah :

C11 Umur _Pasien (Baru) = 44+37+40+42+38+44+41 = 286/7

= 40.857

Cluster yang kedua utnuk parameter umur memiliki 3 anggota (tiga) yaitu pasien, ke- 0, ke-3, ke-13. Pusat cluster baru untuk cluster yang kedua dihitung berdasarkan rata- rata koordinat ketiga anggota tersebut.

C21 Umur_Pasien (Baru) = 33+31+30 = 94/3 = 31.333

Cluster yang ketiga untuk parameter umur memiliki 10 anggota (sepuluh) yaitu pasien ke-1, ke-6, ke-9, ke-10, ke-11, ke-12, ke-16, ke-17, ke-18, ke-19. Pusat cluster baru

untuk cluster ketiga dihitung berdasarkan rata – rata koordinat kesepuluh anggota anggota tersebut adalah :

C31 Pekerajaan_Pasien (Baru) = 25+24+28+27+22+27+24+22++27+26 = 252/10

= 25.2

4.10.2. Perhitungan Jarak Setiap Data ke Pusat Cluster pada Iterasi Kedua

Pada table 4.13 akan dihitung pusat clusterbaru berdasarkan nilai rata-rata koordinat dari masing-masing anggota tersebut.

Tabel 4.13 Pusat Cluster pada iterasi ke-2

Cluster Baru Wilayah Pekerjaan Umur

C1 2.286 2.714 40.857

C2 2.0 2.333 31.333

C3 2.5 2.1 25.2

a. Data pasien ke - 1

Akan dihitung jarak dari data pasien ke - 1 pusat cluster pertama. D(1,1) =

= = =

Dari hasil perhitungan diatas di dapatkan hasil bahwa jarak data pasien ke – 1 dengan pusat cluster pertama adalah 8.047. Akan dihitung jarak dari data pasien ke -1 ke pusat cluster kedua

D(1,2) = = = =

Dari hasil perhitungan diatas di dapatkan hasil bahwa jarak data pasien ke - 1 dengan pusat cluster kedua adalah 2.134

Akan dihitung jarak dari data pasien ke - 1 ke pusat cluster ketiga D(1,3) =

= = =

Dari hasil perhitungan diatas di dapatkan hasil bahwa jarak data pasien pertama dengan pusat cluster ketiga adalah = 7.893. Berdasarkan hasil perhitungan diatas disimpulkan bahwa jarak data pasien ke - 1 yang paling dekat adalah dengan cluster 3 yaitu 2.134, ini berarti data ke - 1 akan menjadi anggota pada kelompok cluster yang kedua (C2)

Tabel 4.14 Jarak Setiap Data Pasien ke Titik Centroid pada Iterasi ke – 2 No Nama W P U C1 Jarak Ke C2 C3 C1 C2 C3 Min Cluster

0 Daniel 2 1 33 8.047 2.134 7.893 * C2 1 Hendrik 3 2 25 15.889 6.42 0.548 * C3 2 Rinaldi 1 3 44 3.408 12.724 18.881 * C1 3 Marusaha 2 1 31 10.009 1.374 5.925 * C2 4 Ana 2 1 37 4.23 5.822 11.862 * C1 5 Linda 3 2 40 1.324 8.731 14.809 * C1 6 Keanu 4 2 24 16.959 7.608 1.924 * C3 7 Abadi 1 4 42 2.148 10.843 16.974 * C2 8 Zefri 4 4 38 3.571 7.157 13.027 * C2 9 Susan 4 5 28 13.171 4.714 4.301 * C3 10 Ilham 3 1 27 13.981 4.642 2.168 * C3 11 Titin 3 1 22 18.948 9.481 3.421 * C3 12 Roma 2 1 27 13.966 4.533 2.168 * C3 13 Pidia 2 5 30 11.099 2.982 5.63 * C2 14 Arki 4 2 44 3.65 12.828 18.86 * C1 15 Asima 1 3 41 1.325 9.741 15.897 * C1 16 Darleny 1 3 24 16.908 7.431 2.121 * C3 17 Arif 1 1 22 18.978 9.481 3.701 * C3 18 Indah 1 3 27 13.919 4.497 2.51 * C3 19 Humala 3 2 26 14.891 5.436 0.949 * C3

Langkah selanjutnya menghitung pusat cluster baru. Pusat cluster baru ditentukan berdasarkan pengelompokan anggota masing-masing cluster berdasarkan tabel diatas,

pasien ke-2, ke-4, ke-5, ke-7, ke-8, ke-14, ke-15. Pusat cluster baru untuk cluster

pertama dihitung berdasarkan rata-rata koordinat ketujuh anggota tersebut adalah : C11 Wilayah _Pasien (Baru) = 1+2+3+1+4+4+1

= 16/7 = 2.285

Cluster yang kedua utnuk parameter umur memiliki 3 anggota (tiga) yaitu pasien ke- 0, ke-3, ke-13. Pusat cluster baru untuk cluster yang kedua dihitung berdasarkan rata- rata koordinat ketiga anggota tersebut.

C21 Wilayah_Pasien (Baru) = 2+2+2 = 6/3 = 2

Cluster yang ketiga untuk parameter umum memiliki 10 anggota (sepuluh) yaitu pasien ke-1, ke-6, ke-9, ke-10, ke-11, ke-12, ke-16, ke-17, ke-18, ke-19. Pusat cluster

baru untuk cluster ketiga dihitung berdasarkan rata – rata koordinat kesepuluh anggota anggota tersebut adalah :

C31 Wilayah_Pasien (Baru) = 3+4+4+3+3+2+1+1+1+3 = 25/10

= 2.5

Cluster pertama untuk parameter pekerjaan pasien memiliki 7 anggota (tujuh) yaitu pasien ke-2, ke-4, ke-5, ke-7, ke-8, ke-14, ke-15.. Pusat cluster baru untuk cluster

pertama dihitung berdasarkan rata-rata koordinat ketujuh anggota tersebut adalah : C11 Pekerjaan _Pasien (Baru) = 3+1+2+4+4+2+3

= 19/7 = 2.714

Cluster yang kedua utnuk parameter umur memiliki 3 anggota (tiga) yaitu pasien ke- 0, ke-3, ke-13. Pusat cluster baru untuk cluster yang kedua dihitung berdasarkan rata- rata koordinat ketiga anggota tersebut.

C21 Pekerjaan_Pasien (Baru) = 1+1+5 = 7/3 = 2.333

Cluster yang ketiga untuk parameter umum memiliki 10 anggota (sepuluh) yaitu pasien ke-1, ke-6, ke-9, ke-10, ke-11, ke-12, ke-16, ke-17, ke-18, ke-19. Pusat cluster

baru untuk cluster ketiga dihitung berdasarkan rata – rata koordinat kesepuluh anggota anggota tersebut adalah :

C31 Pekerajaan_Pasien (Baru) = 2+2+5+1+1+1+3+1+3+2 = 21/10

= 2.1

Cluster pertama untuk parameter umur pasien memiliki 7 anggota (tujuh) yaitu pasien ke-2, ke-4, ke-5, ke-7, ke-8, ke-14, ke-15. Pusat cluster baru untuk cluster pertama dihitung berdasarkan rata-rata koordinat ketujuh anggota tersebut adalah :

C11 Umur _Pasien (Baru) = 44+37+40+42+38+44+41 = 286/7

= 40.857

Cluster yang kedua utnuk parameter umur memiliki 3 anggota (tiga) yaitu pasien, ke- 0, ke-3, ke-13. Pusat cluster baru untuk cluster yang kedua dihitung berdasarkan rata- rata koordinat ketiga anggota tersebut.

C21 Umur_Pasien (Baru) = 33+31+30 = 94/3 = 31.333

Cluster yang ketiga untuk parameter umur memiliki 10 anggota (sepuluh) yaitu pasien ke-1, ke-6, ke-9, ke-10, ke-11, ke-12, ke-16, ke-17, ke-18, ke-19. Pusat cluster baru untuk cluster ketiga dihitung berdasarkan rata – rata koordinat kesepuluh anggota anggota tersebut adalah :

C31 Pekerajaan_Pasien (Baru) = 25+24+28+27+22+27+24+22++27+26 = 252/10

= 25.2

4.10.3. Perhitungan Jarak Setiap Data ke Pusat Cluster pada Iterasi Ketiga

Pada table 4.15 akan dihitung pusat clusterbaru berdasarkan nilai rata-rata koordinat dari masing-masing anggota tersebut.

Tabel 4.15 Pusat Cluster pada iterasi ke-3

Cluster Baru Wilayah Pekerjaan Umur

C1 2.286 2.714 40.857

C2 2.0 2.333 31.333

C3 2.5 2.1 25.2

Pengulangan dihentikan karena hasil perhitungan menunjukkan adanya pusat cluster

yang sama pada iterasi ke-2 dan iterai ke-3.

4.11. Hasil Clustering Dengan Pusat Cluster Yang Paling Optimum

Berdasarkan hasil pengelompokan data menggunakan metode Modified K- MeansClustering berbasis Sum Of Squares Error (SSE), di dapatkan hasil Clustering

hingga iterasi ke-3, dimana titik pusat tidak lagi berubah dan tidak ada data yang berpindah antar cluster. Dari hasil cluster 1, terlihat bahwa karakteristik pasien pada

cluster 1 dominasi oleh pasien yang berada di wilayah Medan Perjuangan dan sebagian kecil berada di wilayah Medan Selayang, dan pekerjaan pasien di dominasi oleh pedagang dan sebagian kecil pekerjaan pasien adalah pegawai swasta dengan umur pasien sekitar 40 tahun.

Kemudian, hasil cluster 2 diatas dapat dilihat bahwa karakteristik pasien pada

cluster 2 didominasi oleh pasien yang berasal dari wilayah Medan Perjuangan dan pekerjaan pasien adalah pegawai swasta dan sebagian kecil adalah pedagang dengan umur pasien sekitar 31 Tahun.

Sedangkan, dari hasil cluster di atas dapat dilihat bahwa karakteristik pasien pada

cluster 3 didominasi oleh pasien yang berada di wilayah Medan Perjuangan dan Medan Selayang dan pekerjaan pasien adalah pegawai swasta dengan umur pasien sekitar 25 Tahun.

BAB V

KESIMPULAN DAN SARAN

5.1. KESIMPULAN

Berdasarkan hasil pengujian dan analisa terhadap hasil yang didapatkan, maka dapat diambil suatu kesimpulan yaitu:

1. Titik pusat cluster pertama sangat menentukan jumlah iterasi yang dihasilkan untuk memperoleh clustering akhir.

2. Algoritma K-MeansClustering walaupun cepat tetapi keakuratanya tidak dijamin. Seringkali algoritma ini mengalami konvergensi premature. Pada algoritma tersebut juga tidak dijamin jarak antara masing-masing centroid tidak merentang sehingga jika ada dua tau lebih kelompok dengan titik pusat massa yang berdekatan maka hasilnya terlihat kurang memuaskan.

3. Dengan metode K-Mean Clustering yang menghasilkan iterasi paling minimum tidak dapat disimpulkan merupakan pusat cluster yang paling optimum.

4. Modifikasi Algoritma K-MeanClustering dengan berbasis Sum of Squared Error (SSE) akan lebih optimum, karena dengan menghitung nilai SSE yang paling minimum, akan menghasilkan pusat cluster yang paling optimum.

5.2.SARAN

Disarankan untuk penelitian selanjutnya agar diteliti:

1. Hubungan jumlah iterasi dengan nilai Sum of Squared Error (SSE) yang paling minimum.

2. Modifikasi terhadap Metode K-Means atau metode cluster yang lain.

3. Metode untuk menentukan jumlah cluster terlebih dahulu, sehinnga diperoleh cluster yang paling optimum.

4. Metode untuk menentukan pusat cluster yang tepat sehingga akan menghasilkan jumlah iterasi yang paling minimum sehingga diperoleh hasil yang paling optimal.

Dokumen terkait