MENGGUNAKAN METODE CLUSTERING (STUDI KASUS PT PHP MOTOR)
5. Hasil dan Analisa
Untuk mengetahui apakah aplikasi yang dibuat telah berjalan dengan baik, maka dilakukan pengujian. Data yang digunakan dalam pengujian adalah data konsumen yang ada di PT. PHP Motor meliputi jumlah angsuran, lama angsuran, dan alasan. Tahapan dari proses pengujian menggunakan metode clustering dengan nilai centroid 3, jumlah data 100, dan jumlah iterasi maksimum 15 dengan menggunakan data real dapat dilihat pada Tabel 1.
Tabel 1(a). Pusat cluster awal dengan iterasi ke 1 Pusat Cluster Awal
c11=559 c12=33 c13=8
c21=1314 c12=33 c23=5
c31=598 c12=33 c33=5
Pada tabel 1(a) jumlah centroid 1=11, jumlah centroid 2=51, dan jumlah centroid 3=38 pada jumlah iterasi ke 1.
Tabel 1(b). Pusat cluster baru dengan iterasi ke 2 Menghitung Pusat Cluster Baru
c11=539.55 c12=33 c13=5.82
c21=1389.71 c22=14.76 c23=5.33
c31=759.21 c22=14.76 c33=5.39
Pada tabel 1(b) jumlah centroid 1=22, jumlah centroid 2=36, dan jumlah centroid 3=42 pada jumlah iterasi ke 2 dimana tingkat kesamaan dengan data sebelumnya 64 data.
Tabel 1(c). Pusat cluster baru dengan iterasi ke 3 Menghitung Pusat Cluster Baru
c11=596.77 c12=29.77 c13=5.5
c21=1629.03 c22=12.27 c23=5.37
c31=938.02 c32=21.23 c33=5.39
Pada tabel 1(c) jumlah centroid 1=26, jumlah centroid 2=30, dan jumlah centroid 3=44
pada jumlah iterasi iterasi ke 3 dimana tingkat kesamaan dengan data sebelumnya 90 data.
Tabel 1(d). Pusat cluster baru dengan iterasi ke 4 Menghitung Pusat Cluster Baru
c11=616.8 c12=28.8 c13=5.63
c21=1686.62 c22=11.92 c23=5.54
c31=984.18 c32=20.5 c33=5.18
Pada tabel 1(d) jumlah centroid 1=30, jumlah centroid 2=26, dan jumlah centroid 3=44 pada jumlah iterasi ke 4 dimana tingkat kesamaan dengan data sebelumnya 92 data.
Tabel 1(e). Pusat cluster baru dengan iterasi ke 5 Menghitung Pusat Cluster Baru
c11=655.79 c12=27.77 c13=5.62
c21=1756.18 c22=12.09 c23=5.41
c31=1062.77 c32=18.64 c33=5.21
Pada tabel 1(e) jumlah centroid 1=39, jumlah centroid 2=22, dan jumlah centroid 3=39 pada jumlah iterasi ke 5 dimana tingkat kesamaan dengan data sebelumnya 87 data.
Tabel 1(f). Pusat cluster baru dengan iterasi ke 6 Menghitung Pusat Cluster Baru
c11=655.79 c12=27.77 c13=5.62
c21=1899 c22=12.5 c23=5.19
c31=1104.44 c32=17.62 c33=5.31
Pada tabel 1(f) jumlah centroid 1=39, jumlah centroid 2=16, dan jumlah centroid 3=45 pada jumlah iterasi ke 6 dimana tingkat kesamaan dengan data sebelumnya 94 data.
Tabel 1(g). Pusat cluster baru dengan iterasi ke 7 Menghitung Pusat Cluster Baru
c11=666.56 c12=27.73 c13=5.56
c11=666.56 c22=12.5 c23=5.19
c31=1115.05 c32=17.19 c33=5.35
Pada tabel 1(g) jumlah centroid 1=41, jumlah centroid 2=16, dan jumlah centroid 3=43 pada jumlah iterasi ke 7 dimana tingkat kesamaan dengan data sebelumnya 98 data.
Tabel 1(h). Pusat cluster baru dengan iterasi ke 8 Menghitung Pusat Cluster Baru
c11=666.56 c12=27.73 c13=5.56
c21=1955.29 c22=12.14 c23=5
c31=1132.38 c32=17.09 c33=5.4
Pada tabel 1(h) jumlah centroid 1=41, jumlah centroid 2=14, dan jumlah centroid 3=45 pada
jumlah iterasi ke 8 dimana tingkat kesamaan dengan data sebelumnya 98 data.
Tabel 1(i). Pusat cluster baru dengan iterasi ke 9 Menghitung Pusat Cluster Baru
c11=666.56 c12=27.73 c13=5.56
c21=1988.69 c22=12.23 c23=5.15
c31=1140.83 c32=16.96 c33=5.35
Pada tabel 1(i) jumlah centroid 1=41, jumlah centroid 2=13, dan jumlah centroid 3=46 pada jumlah iterasi ke 9 dimana tingkat kesamaan dengan data sebelumnya 99 data. Setelah iterasi ke 9 masih belum di dapatkan kesamaan dengan data sebelumnya maka selanjutnya menghitung pusat cluster baru dengan iterasi ke 10 sehingga tingkat kesamaan dengan data sebelumnya mencapai 100.
Selanjutnya penulis melakukan pengujian dengan nilai centroid 3, jumlah data 100, dan jumlah iterasi maksimum 15 dengan menggunakan data hasil normalisasi dan dapat dilihat pada Tabel 2.
Tabel 2(a). Pusat cluster awal dengan iterasi ke 1 Pusat Cluster Awal
c11=0.13 c12=0.9 c13=0.9
c21=0.38 c12=0.1 c23=0.42
c31=0.15 c12=0.9 c33=0.42
Pada tabel 2(a) jumlah centroid 1=23, jumlah centroid 2=58, dan jumlah centroid 3=19 pada jumlah iterasi ke 1.
Tabel 2(b). Pusat cluster baru dengan iterasi ke 2 Menghitung Pusat Cluster Baru
c11=0.18 c12=0.77 c13=0.74
c21=0.38 c22=0.24 c23=0.47
c31=0.18 c22=0.74 c33=0.23
Pada tabel 2(b) jumlah centroid 1=44, jumlah centroid 2=51, dan jumlah centroid 3=5 pada jumlah iterasi ke 2 dimana tingkat kesamaan dengan data sebelumnya 54 data.
Tabel 2(c). Pusat cluster baru dengan iterasi ke 3 Menghitung Pusat Cluster Baru
c11=0.19 c12=0.72 c13=0.56
c21=0.39 c22=0.21 c23=0.46
c31=0.34 c32=0.61 c33=0.1
Pada tabel 2(c) jumlah centroid 1=63, jumlah centroid 2=36, dan jumlah centroid 3=1 pada jumlah iterasi iterasi ke 3 dimana tingkat kesamaan dengan data sebelumnya 81 data.
Tabel 2(d). Pusat cluster baru dengan iterasi ke 4 Menghitung Pusat Cluster Baru
c11=0.21 c12=0.62 c13=0.5
c21=0.43 c22=0.17 c23=0.47
c31=0.9 c32=0.1 c33=0.1
Pada tabel 2(d) jumlah centroid 1=72, jumlah centroid 2=27, dan jumlah centroid 3=1 pada jumlah iterasi ke 4 dimana tingkat kesamaan dengan data sebelumnya 91 data.
Tabel 2(e). Pusat cluster baru dengan iterasi ke 5 Menghitung Pusat Cluster Baru
c11=0.23 c12=0.58 c13=0.51
c21=0.46 c22=0.13 c23=0.44
c31=0.9 c32=0.1 c33=0.1
Pada tabel 2(e) jumlah centroid 1=69, jumlah centroid 2=30, dan jumlah centroid 3=1 pada jumlah iterasi ke 5 dimana tingkat kesamaan dengan data sebelumnya 95 data.
Tabel 2(f). Pusat cluster baru dengan iterasi ke 6 Menghitung Pusat Cluster Baru
c11=0.24 c12=0.56 c13=0.5
c21=0.41 c22=0.23 c23=0.47
c31=0.9 c32=0.1 c33=0.1
Pada tabel 2(f) jumlah centroid 1=71, jumlah centroid 2=28, dan jumlah centroid 3=1 pada jumlah iterasi ke 6 dimana tingkat kesamaan dengan data sebelumnya 98 data.
Tabel 2(g). Pusat cluster baru dengan iterasi ke 7 Menghitung Pusat Cluster Baru
c11=0.24 c12=0.54 c13=0.5
c21=0.41 c22=0.24 c23=0.47
c31=0.9 c32=0.1 c33=0.1
Pada tabel 2(g) jumlah centroid 1=74, jumlah centroid 2=25, dan jumlah centroid 3=1 pada jumlah iterasi ke 7 dimana tingkat kesamaan dengan data sebelumnya 97 data.
Tabel 2(h). Pusat cluster baru dengan iterasi ke 8 Menghitung Pusat Cluster Baru
c11=0.24 c12=0.53 c13=0.48
c21=0.43 c22=0.24 c23=0.51
c31=0.9 c32=0.1 c33=0.1
Pada tabel 2(h) jumlah centroid 1=75, jumlah centroid 2=24, dan jumlah centroid 3=1 pada jumlah iterasi ke 8 dimana tingkat kesamaan dengan data sebelumnya 99 data. Setelah iterasi ke 8 masih belum di dapatkan kesamaan dengan data
sebelumnya maka selanjutnya menghitung pusat cluster baru dengan iterasi ke 9 sehingga tingkat kesamaan dengan data sebelumnya mencapai 100.
Pada tabel 1 dan 2 dapat dilihat bahwa pengujian dengan menggunakan data hasil normalisasi memiliki jumlah iterasi yang lebih kecil yaitu pada iterasi ke 9 dan tingkat kesamaan dengan data sebelumnya 100 dibandingkan dengan pengujian menggunakan data yang real pada jumlah iterasi ke 10. Hasil pengolompokan data dapat dilihat pada tabel 3 berikut.
Tabel 3. Hasil Pengelompokan Data
Pengelompokan Data
Real Normalisasi Kelompok Data ke 1 41 75
Kelompok Data ke 2 13 24
Kelompok Data ke 3 46 1
Pada tabel 3 dapat dilihat bahwa pada data real hasil pengelompokan data ke 1 sebanyak 41 data, hasil pengelompokan data ke 2 sebanyak 13 data, dan hasil pengelompokan data ke 3 sebanyak 46 data. Sedangkan pada data hasil normalisasi hasil pengelompokan data ke 1 sebanyak 75 data, hasil pengelompokan data ke 2 sebanyak 24 data, dan hasil pengelompokan data ke 3 sebanyak 1 data.
Pada hasil pengelompokan dengan pengujian menggunakan data real hanya memperhatikan besarnya parameter jumlah angsuran saja tanpa memperhatikan parameter lama angsuran dan alasan. Sedangkan pada hasil pengelompokan dengan pengujian menggunakan data hasil normalisasi memperhatikan besarnya nilai pada tiap-tiap parameter. Perbandingan hasil pengelompokan data dengan menggunakan data real dan data hasil normalisasi dapat di lihat pada tabel 4, dan 5 (Lampiran).
Tabel 4 merupakan hasil pengelompokan data ke 1 menggunakan data real. Pada tabel 4 terlihat bahwa pengelompokan data dilakukan berdasarkan besarnya parameter jumlah angsuran antara 457 – 877. Pengelompokan data ke 2 dilakukan berdasarkan besarnya parameter jumlah angsuran antara 1576 – 2894 dan pengelompokan data ke 3 dilakukan berdasarkan besarnya parameter jumlah angsuran antara 908 – 1521.
Pada tabel 5 terlihat bahwa pengelompokan data dilakukan berdasarkan besarnya nilai dari tiap- tiap parameter. Nilai dari tiap-tiap parameter yang ada memiliki pengaruh pada pengelompokan data tersebut.
6. Kesimpulan
Dari hasil penelitian dapat diambil beberapa kesimpulan antara lain:
1. Pengelompokan data menggunakan data real
hanya memperhatikan besarnya parameter jumlah angsuran.
2. Pengelompokan data menggunakan data hasil normalisasi memperhatikan besarnya nilai pada tiap-tiap parameter.
3. Pengujian menggunakan data hasil normalisasi
untuk mencapai tingkat kesamaan dengan data sebelumnya didapatkan pada jumlah iterasi ke 9.
4. Pengujian menggunakan data real untuk
mencapai tingkat kesamaan dengan data sebelumnya didapatkan pada jumlah iterasi ke 10.
Daftar Pustaka
[1] Jain, Nilesh and Priyanka Mangal (2013). “An Approach To Build a Web Crawler Using Clustering Based K-means Algorithm”. Journal of Global Research in Computer Science, Volume 4, No. 12, December 2013. [2] Khotimah, Tutik (2014). “Pengelompokan
Surat Dalam Al Qur’an Menggunakan Algoritma K-means”. Jurnal SIMETRIS, Vol 5 No 1, April 2014.
[3] Ong, Johan Oscar (2013). “Implementasi Algoritma K-means Clustering untuk Menentukan Strategi Marketing President University”. Jurnal Ilmiah Teknik Industri, Vol. 12, No. 1, Juni 2013.
[4] Putri, Tri Utami, et al. “Penerapan Data Mining Untuk Menentukan Strategi Penjualan Pada Toko Buku Gramedia Menggunakan Metode Clustering”.
[5] T. Gomasathit (2013). “Cloud Coverage Identification Using Satellite Data and K- mean Clustering Algorithm”. Journal of Global Research in Computer Science, Volume 4, No. 7, July 2013.
LAMPIRAN :
Tabel 4. Hasil Pengelompokan Data ke 1 Menggunakan Data Real
Tabel 5. Hasil Pengelompokan Data ke 1 Menggunakan Data hasil Normalisasi