Penggunaan Algoritma K-Means Pada Aplikasi Pemetaaan Klaster Daerah Pariwisata
Lion Ferdinand Marini, Christian Dwi Suhendra*
Fakultas Teknik, Program Studi Teknik Informatika, Universitas Papua, Manokwari, Indonesia Email: 1[email protected], 2,*[email protected]
Email Penulis Korespondensi: [email protected]
Abstrak−Kabupaten Teluk Wondama memiliki berbagai potensi pariwisata dalam bidang wisata religi dan wisata alam.
Terdapat 13 distrik di Teluk Wondama, dimana sebagian distrik masuk dalam kawasan Taman Nasional Teluk Cendrawasih.
Hal ini membuat Kabupaten Teluk Wondama banyak dikunjungi oleh wisatawan setiap tahunnya. Namun, potensi ini tidak dimaksimalkan dengan baik oleh pemerintah setempat. Hal ini disebabkan karena jarak antara setiap distrik yang jauh, dengan waktu tempuh sekitar 1-2 jam. Penelitian ini akan mengelompokkan distrik-distrik yang memiliki potensi untuk dimaksimalkan oleh pemerintah daerah menggunakan algoritma clustering, yaitu K-Means. Algoritma ini akan menggunakan metode Elbow dan Silhouette pada proses penentuan klaster yang paling ideal. Hasil klaster yang dihasilkan akan dituangkan dalam bentuk peta wilayah pariwisata berbasis web. Hasil yang diperoleh dari kedua metode penentuan klaster adalah 2 klaster. Dari 13 distrik yang ada, setelah dilakukan proses normalisasi dengan menghilangkan distrik yang tidak memiliki data kunjungan wisata, hanya tersisa 7 distrik. Berdasarkan hasil analisis kluster, terdapat 3 distrik pada klaster 1 dan 5 distrik pada klaster 2.
Klaster wilayah pariwisata disajikan dalam bentuk peta yang dibuat menggunakan Shiny Web dengan bahasa Pemrograman R.
Kata Kunci: Teluk Wondama; Pariwisata; K-Means; Peta; Shiny Web
Abstract−The Teluk Wondama Regency has various potentials in the field of religious and natural tourism. There are 13 districts in Teluk Wondama, where some districts are included in the Teluk Cendrawasih National Park area. This makes Teluk Wondama regency visited by many tourists every year. However, this potential is not well maximized by the local government.
This is due to the long distance between each district, with a travel time of about 1-2 hours. This research will group districts that have potential to be maximized by the local government using the K-Means clustering algorithm. This algorithm will use the Elbow and Silhouette methods in the process of determining the most ideal cluster. The cluster results obtained will be presented in the form of web-based tourism area maps. The results obtained from the two cluster determination methods are 2 clusters. Of the 13 districts, after the normalization process is carried out by removing districts that do not have tourist data, only 7 districts remain. Based on the cluster analysis, there are 3 districts in cluster 1 and 5 districts in cluster 2. The cluster of tourism areas is presented in the form of a map created using the Shiny Web with R programming language.
Keywords: Teluk Wondama; Tourism; K-Means; Map; Shiny Web
1. PENDAHULUAN
Kabupaten Teluk Wondama memiliki 13 distrik yang sebagaian wilayahnya terletak di kawasan Taman Nasional Teluk Cendrawasih (TNTC)[1]. Melalui website kabupaten Wondama, Taman Nasional Teluk Cenderawasih merupakan taman laut terluas di Indonesia yang memiliki keanekaragaman baik flora maupun fauna. TNTC menjadi Kawasan konservasi melalui keputusan Menteri Kehutanan No. 472/Kpts-II/1993 pada tanggal 2 September 1993 dan Keputusan Dirjen Konservasi Sumber Daya Alam dan Ekosistem No. SK 148/KSDAE/SET/.0/11/2017[2], [3]. Selain potensi dari segi wisata konservasi, Kabupaten Teluk Wondama pun menjadi pusat kunjungan wisata rohani dengan berbagai situs peninggalan sejarah masuknya Injil di tanah Papua.
dengan potensi yang dimiliki ini Kabupaten Teluk Wondama menjadi salah satu tujuan kunjungan di provinsi Papua Barat. Namun banyak potensi wisata yang dimiliki tidak dimaksimalkan dengan baik oleh pemerintah daerah. Salah satu yang menjadi alasan adalah jarak antar distrik yang jauh dan hanya dapat ditempuh dengan perahu motor membuat kunjungan wisata ke berbagai tujuan menjadi mahal. Penelitian ini akan mengelompokan distrik yang memiliki potensi untuk pengembangan fasilitas sehingga mampu meningkatkan pendapatan daerah maupun masyarakat setempat dari segi pariwisata.
Klastering merupakan sebuah teknik analisis data mining yang mengelompokan sekumpulan data ke dalam beberapa grup, sehingga dalam sebuah grup memiliki tingkat kemiripan yang tinggi dibandingkan dengan data yang ada pada grup yang lain [4]. Teknik klastering digunakan Ketika data yang disajikan tidak memiliki kelas untuk diprediksi. Metode klastering klasik yang sering digunakan adalah K-Means. Menurut [5] pada metode K- Means Langkah pertama yang dilakukan adalah menentukan jumlah klaster yang akan dianalisis, parameter ini sering disebut dengan parameter K. selanjutnya menentukan titik pusat klaster sebanyak jumlah K secara random.
Setiap data kemudian akan dihitung jarak terhadap titik pusat kluster menggunakan Euclidean Distance. Kemudian centroid atau mean dari setiap data pada masing-masing cluster dihitung. Centroid ini akan menjadi titik pusat klaster selanjutnya. inilah mengapa algoritma ini disebut K-Means yaitu karena proses menentukan titik pusat klasternya akan dilakukan secara berulang kali sehingga titik pusat klasternya tidak berubah atau telah mencapai konvergen.
Penentuan jumlah klaster yang dilakukan secara random cenderung bukan merupakan metode yang optimal untuk mendapatkan global minimum karena dilakukan berdasarkan coba-coba. Penelitian Algoritma K-Means telah banyak dilakukan dengan menggunakan metode tambahan yaitu metode Elbow[6]. Penelitian yang
menggunakan metode Elbow pada Algoritma K-Means dilakukan oleh [7]. Pada penelitiannya metode Elbow menghasilkan jumlah K=4. Hasil penelitian ini juga menjadi strategi yang mendukung kegiatan promosi. Metode lainnya yang digunakan untuk mendapatkan global minimum terhadap penentuan parameter k yaitu dengan metode Silhoutte Coefficient. Penelitian yang dilakukan oleh [8] terhadap data obat menghasilkan nilai k=2 dengan nilai silhouette = 0.4854, hasil dari penentuan klaster menggunakan Silhouette merupakan jumlah klaster yang ideal. semakin besar jumlah klaster maka nilai dari Silhouette coefficient menjadi semakin kecil. Selain menggunakan elbow method dan silhouette Coefficient, metode untuk menentukan jumlah cluster juga dilakukan menggunakan Davies Bouldin Index(DBI). Penelitian yang dilakukan oleh [9] dengan melakukan 6 kali percobaan diperoleh nilai DBI terendah pada k=3 yaitu 0.47. Penentuan titik pusat klaster juga dapat dilakukan menggunakan algoritma optimasi seperti Algoritma Genetika [10] dan juga algoritma Pillar [11], [12]
Penelitian yang berkaitan dengan pariwisata dilakukan oleh [13] dengan menggunakan sistem pendukung keputusan untuk menentukan pemilihan pelaku wisata pada masa pandemi Covid-19. Pada penelitian ini sistem metode OCRA dengan pembobotan ROC digunakan memilih berdasarkan kriteria yaitu: jumlah pengunjung, penerapan prokes, pembatasan kunjungan, penggunaan bet vaksin, dan teguran gugus Covid terhadap 7 calon alternatif daerah pariwisata sebagai alternatif terbaik untuk sebagai pelaku wisata pada masa pandemi Covid-19.
Penentuan lokasi pariwisata lainnya menggunakan sistem pendukung keputusan juga dilakukan di Provinsi Bali oleh [14] penelitian yang dilakukan menggunakan metode TOPSIS dan Fuzzy terhadap 17 alternatif dan 3 kiteria.
Setelah hasil perankingan diperoleh selanjutnya penelitian ini akan melakukan integrasi pada Google Maps untuk menampilkan lokasi wisata.
Pemanfaatan peta atau dalam hal ini sistem informasi geografis yang dikombinasikan dengan metode lainnya sangat bermanfaat untuk mendukung hasil dari metode yang digunakan. Penelitian yang dilakukan oleh [15] memberikan gambaran jelas terhadap lokasi prioritas dari pembangunan Embung. Pemetaan pada metode K- Means dilakukan terhadap wilayah klaster. Penelitian X melakukan pemetaan klaster berdasarkan tingkat kemiskinan. Pemetaan dilakukan dalam bentuk diagram Scatter pada aplikasi RapidMiner untuk melihat wilayah apa saja yang termasuk pada cluster 0 dan cluster 1.
Berdasarkan uraian yang telah dijabarkan diatas, maka penelitian ini akan menggunakan Algoritma K- Means dengan membandingkan metode Elbow dan silhouette coeffient sebagai penentu parameter k dalam menentukan klaster prioritas daerah pariwisata yang ada di Kabupaten Teluk Wondama dan menampilkan daerah klaster dengan memanfaatkan teknologi sistem informasi geografis. Penelitian ini dibangun menggunakan bahasa pemrograman R dan framework shinyweb.
2. METODOLOGI PENELITIAN
2.1 Data Penelitian
Proses pengambilan data pada penelitian dilakukan secara primer dan sekunder. Data sekunder diperoleh dari dinas pariwisata Kabupaten Teluk Wondama yang berupa lokasi-lokasi pariwisata yang ada di teluk wondama.
Daftar daerah pariwisata dapat dilihat pada tabel 1.
Tabel 1. Daftar Daerah Wisata Setiap Distrik
No Distrik Wisata
1. Roon Kepulauan Auri, Pulau Rariau, Kampung Yende
2. Windesi Kamadiri
3. Roswar Kampung Waprak
4. Kuri Wamesa Dusner
5. Wondiboy Kaibi, Pantai Tanjung Kubiari
6. Teluk Duari Aisandami, Pantai Rowor, Bukit Selfie, Air Terjun Wandamui Sobey
7. Raisey Pantai Maria Pare, Tugu Pendaratan Injil
8. Wasior Batu Peradaban, Pantai Ketapang 6
Pada Tabel 1. Dapat dilihat dari 13 distrik yang ada di Kabupaten Teluk Wondama, hanya terdapat 8 distrik yang daerah wisatanya sering dikunjungi baik oleh kunjungan wisata rohani, maupun kunjungan wisata konservasi. Data primer dilakukan dengan mengunjungi secara langsung objek-objek wisata yang ada dan menghitung jumlah pengunjung berdasarkan buku tamu yang ada pada setiap objek wisata maupun home stay.
Dari pengamatan yang telah dilakukan diperoleh total pengunjung pada tahun 2022 di setiap distrik dapat dilihat pada tabel 2.
Tabel 2. Data Kunjungan Pariwisata
No Distrik Wisata
1. Teluk Duairi 807
2. Kuri Wamesa 250
3. Naikere 0
No Distrik Wisata
4. Nikiwar 0
5. Raisey 145
6. Roon 733
7. Roswar 65
8. Rumberpon 0
9. Soug Jaya 0
10. Wamesa 0
11. Wasior 308
12. Windesi 520
13. Wondiboy 84
Pada Tabel 2. Terdapat 5 distrik yang tidak memiliki jumlah kunjungan. Hal ini disebabkan oleh dua faktor yaitu: lokasi distrik yang jauh dan tujuan wisata yang sangat sedikit. Distrik yang paling sering dikunjungi oleh wisatawan adalah distrik Roon karena tidak hanya menawarkan wisata alam, namun juga pada distrik ini terdapat lokasi wisata rohani yang juga merupakan sejarah masuknya injil di tanah Papua.
2.2 Perancangan Sistem
Alur aplikasi pemetaan wilayah klaster pariwisata di Kabupaten Teluk Wondama menggunakan Algoritma K- Means dapat dilihat pada gambar 1.
Gambar 1. Alur Aplikasi Pemetaan Wilayah Klaster Menggunakan Algoritma K-Means.
2.2 Pemrosesan Awal
Tahapan normalisasi data dilakukan dengan dua Teknik yaitu Teknik cleansing dan Transformasi. cleansing data yaitu dengan menghilangkan distrik yg tidak memiliki jumlah kunjungan wisata. setelah melakukan normalisasi jumlah data distrik menjadi 9 distrik. Sedangkan tahap transformasi dilakukan dengan mengubah struktur dan format data menjadi lebih mudah untuk dilakukan perhitungan.
2.2 Klastering
Klastering merupakan sebuah metode untuk mengelompokan beberapa data yang memiliki kemiripan yang sama ke dalam sebuah grup [16]. Dalam data mining analisis klastering dapat diselesaikan dengan beberapa Teknik antara lain Hierarchical Clustering, K-Means Clustering, dan K-NN. Karena teknik pengelompokan data ke dalam grup maka Algoritma K-Means merupakan algoritma klastering yang sering digunakan. Terdapat beberapa Teknik untuk mengukur kemiripan antar data dilakukan dengan menggunakan metode Euclidean distance, Manhattan distance, dan Minkowski distance[17]. K-Means mengukur kemiripan antar data menggunakan rumus Euclidian distance. Salah satu kelemahan dari Algoritma K-Means adalah penentuan jumlah Klaster K [18]. Metode penentuan klaster dapat dilakukan menggunakan metode Elbow dan Silhoutte Coefficient [19][20][21]. Algoritma K-Means dapat dijabarkan sebagai berikut:
1. Menentukan jumlah Klaster K. parameter k tidak boleh melebihi jumlah data.
2. Menentukan titik pusat klaster. Titik pusat klaster ditentukan secara random.
3. Menghitung jarak ke titik pusat klaster. Rumus Euclidean Distance ditunjukan pada persamaan 1.
𝑑𝑥𝑦= √∑𝑛𝑖=1(𝑥𝑖− 𝑦𝑖) (1)
Dimana:
𝑑𝑥𝑦= jarak antara data dan titik pusat klaster 𝑥𝑖= titik pusat klaster
𝑦𝑖 = banyaknya atribut
4. Setelah menghitung jarak setiap data ke pusat klaster, Langkah selanjutnya adalah mengelompokan objek berdasarkan jarak minimum.
5. Menghitung titik pusat klaster yang baru. Centroid baru dihitung menggunakan persamaan 2.
𝑐𝑘𝑗 = ∑ 𝑥𝑖𝑗
𝑖𝑘
𝑝 (2)
Dimana 𝑥𝑖𝑗 adalah data hasil perhitungan pada iterasi sebelumnya. Dan p adalah banyaknya ada pada klaster.
6. Ulangi Langkah 2-4 hingga tidak ada data lagi yang berpindah ke kluster yang lain.
Metode Elbow merupakan grafik hubungan antara penurunan Error dan peningkatan nilai k [22]. Semakin besar nilai K maka akan diikuti grafik penurunan errornya. Sebagai contoh pada nilai k adalah 2 – 4 terjadi penurunan error yang sangat besar pada K=3 ke K=4 maka nilai k yang optimal adalah 3. Metode Silhoutte Coefficient menentukan kualitas hasil klastering pada proses klastering. Nilai Silhouette dihitung dengan persamaan 3.
𝑠𝑖𝑙(𝑐) = 𝑠𝑖𝑙(𝑘) 1
|𝑘|∑𝑘𝑖=1𝑠𝑖𝑙(𝑐𝑖) (3)
Dimana:
𝑠𝑖𝑙(𝑘) = nilai nilai silhouette semua klaster
|𝑘|= banyaknya klaster 𝑠𝑖𝑙(𝑐𝑖)= rata-rata nilai silhoutte
3. HASIL DAN PEMBAHASAN
Aplikasi pemetaan wilayah klaster pariwisata di Teluk Wondama dibuat menggunakan bahasa pemrograman R dengan framework Shiny Web. data yang diperoleh disimpan dalam file Excel. Gambar 1 merupakan tampilan untuk input data ke aplikasi. Pada halaman ini terdapat tahapan pemrosesan awal terhadap data. Pemrosesan awal dilakukan untuk menjamin kualitas data yang akan digunakan. Pemrosesan awal data pada penelitian ini menggunakan dua tahapan yaitu data cleaning dan data transformation. Pada data cleaning dilakukan dengan mengeliminasi missing value yaitu menghapus nilai 0 pada data. Data yang memiliki nilai 0 adalah distrik yang tidak memiliki data kunjungan wisata. Sedangkan untuk data transformation dilakukan dengan cara mengubah rentang nilai data dari 0-1 agar dapat memudahkan dalam melakukan perhitungan jarak ke titik pusat klaster.
Gambar 1. Tampilan Input Dataset
Langkah selanjutnya adalah melakukan proses analisis menggunakan algoritma K-means. Dalam melakukan proses klastering, Langkah pertama adalah menentukan parameter awal klaster yaitu penentuan jumlah klaster. Penentuan jumlah klaster pada penelitian ini dilakukan dengan melakukan analisis berdasarkan inersia menggunakan elbow method. Nilai k yang dihasilkan dari elbow method kemudian dibandingkan dengan nilai k hasil perhitungan menggunakan silhouette coefficient. Penentuan nilai k menggunakan elbow method dan silhouette coefficient pada aplikasi pemetaan ini dapat dilihat pada gambar 2 dan 3.
Gambar 2. Grafik Elbow Method
Gambar 3. Grafik Silhoutte Coefficient.
Hasil analisis penentuan jumlah K menggunakan Metode Elbow ditunjukan pada gambar 2. Berdasarkan grafik, jumlah k yang diperoleh adalah 3. Hal ini dapat terlihat setelah k=3 grafik cenderung landai. Pada menu ini dapat terlihat nilai k yang dihasilkan oleh Silhouette Coefficient. Pada gambar 3 diperoleh nilai k yang optimal adalah 2. Oleh karena itu jumlah klaster yang digunakan pada penelitian klasterisasi pariwisata di Kabupaten Teluk Wondama akan menggunakan jumlah k hasil elbow method dan Silhouette Coefficient. Masing-masing k=3 dan k=2.
Gambar 4. Hasil Kluster k=2
Gambar 5. Cluster Plot Distrik k=2
Gambar 6. Hasil Kluster k=3
Gambar 7. Cluster Plot Distrik k=3
Hasil analisis data menggunakan algoritma K-means dilakukan percobaan sebanyak 2 kali yaitu pada k=2 dan k3. Pada k =2, hasil klaster menunjukan terdapat 5 distrik yang masuk dalam Klaster 1 yaitu: Kuri Wamesa, Raisey, Roswar, Wasior, Wondiboy, dan 3 distrik yang masuk pada klaster 2 yaitu: Teluk Duairi, Roon, Windesi.
Klaster 2 merupakan distrik-distrik dengan jumlah kunjungan terbanyak dari 13 kabupaten yaitu dengan rentang kunjungan antara 500 hingga 800 pengunjung, sedangkan klaster 1 merupakan daerah dengan jumlah kunjungan yang sedikit. Pada gambar 4 SSE yang dihasilkan pada nilai k =2 adalah 0.85.
Percobaan pada k=3 hasil klaster menunjukan terdapat 4 distrik yang masuk pada klaster 1 yaitu: Kuri Wamesa, Raisey, Roswar, Wondiboy; dua distrik pada klaster 2 yaitu: Teluk Duari dan Distrik Roon; tiga distrik pada klaster 3 yaitu: Wasior dan Windesi. Klaster 1 menunjukan jumlah pengunjung yang paling sedikit, klaster 2 adalah distrik dengan jumlah pengunjung terbanyak dan klaster 3 adalah distrik-distrik dengan jumlah pengunjung menengah. Visualiasi klasterisasi data pengunjung pariwisata ditampilkan menggunakan scatter plot yang dapat dilihat pada gambar 5 dan 7.
Setelah menemukan klaster wilayah pariwisata, Langkah selanjutnya kemudian memetakan wilayah Klaster ke dalam peta wilayah Kabupaten Teluk Wondama. Distrik hasil klasterisasi K-means yang dipetakan adalah hasil yang memiliki nilai SSE terendah yaitu k=2. Peta wilayah klaster dapat dilihat pada Gambar 8.
Gambar 8. Peta klaster pariwisata Kabupaten Teluk Wondama
Setelah memperoleh hasil klasterisasi menggunakan algoritma K-means, kemudian data tersebut dipetakan pada peta kabupaten Teluk Wondama. Pada Gambar 8 klaster 1 digambarkan dengan warna ungu dan klaster 2 digambarkan dengan warna biru. Sedangkan distrik yang tidak memiliki jumlah kunjungan wisatawan digambarkan dengan warna putih. Pada Gambar 8 distrik yang termasuk dalam klaster jumlah kunjungan terbanyak berada dalam wilayah Kawasan Teluk Cendrawasih. Dalam membuat peta pada Shiny Web library yang digunakan adalah leaflet dari peta yang ditampilkan daerah klaster 2 merupakan daerah dengan titik pariwisata terbanyak dimana terdapat lokasi pariwisata religi dan lokasi ekowisata.
4. KESIMPULAN
Aplikasi Pemetaan wilayah Klaster Kabupaten Teluk Wondama dapat dibuat menggunakan bahasa pemrograman R dengan memanfaatkan framework Shiny Web. Penentuan jumlah klaster ditentukan menggunakan dua metode yaitu metode Elbow dan Silhouette Coefficient. Dari kedua metode tersebut diperoleh hasil dengan elbow method adalah k=3 dan Silhouette Coefficient adalah k=2. Parameter ini yang kemudian digunakan untuk melakukan analisis klaster menggunakan metode K-Means. Dari hasil analisis klaster diperoleh klaster 1 dengan jumlah kunjungan sedikit yang terdiri dari distrik Kuri Wamesa, Raisey, Roswar, Wasior, Wondiboy sedangkan klaster 2 dengan jumlah kunjungan terbanyak terdiri dari distrik Teluk Duairi, Roon, Windesi. Untuk penelitian selanjutnya adalah dengan menambah jumlah distrik yang tersebar di wilayah Kawasan Teluk Cendrawasih yaitu distrik- distrik yang masuk pada Kabupaten Nabire Provinsi Papua Tengah, selain itu penelitian selanjutnya juga dapat dilakukan dengan menghitung peringkat prioritas utama distrik yang akan dioptimalkan daerah pariwisatanya menggunakan sistem pengambilan keputusan. melalui penelitian ini juga diperoleh banyak daerah dari Kabupaten Teluk Wondama yang tidak memiliki kunjungan yang disebabkan banyak wilayah yang potensi wisatanya belum terdeteksi dan diperhatikan dengan maksimal oleh pemerintah daerah.
UCAPAN TERIMAKASIH
Terima kasih disampaikan kepada pihak-pihak yang telah mendukung terlaksananya penelitian ini yaitu Pemerintah Kabupaten Teluk Wondama, serta pihak lain yang mendukung dari segi dana dan semangat.
REFERENCES
[1] A. A. Sokoy et al., Jelajah Nasional Teluk Cendrawasih, 1st ed. Manokwari: Balai Besar Taman Nasional Teluk Cendrawasih, 2017.
[2] K. L. H. dan Kehutanan, Keputusan Direktur Jendral Konservasi Sumber Daya Alam dan Ekosistem. Indonesia, 2017, p.
2.
[3] P. P. Barat, Peraturan Daerah Khusus No. 10 Tahun 2019. Indonesia, 2019, p. 38.
[4] I. H. Witten, E. Frank, and M. A. Hall, Data Mining, 3rd ed. Burlington: Elsevier, 2011.
[5] R. W. Sari and D. Hartama, “Data Mining : Algoritma K-Means Pada Pengelompokkan Wisata Asing ke Indonesia Menurut Provinsi,” pp. 322–326, 2018.
[6] M. Albert, A. Lobo, S. Y. J. Prasetyo, and K. D. Hartomo, “Pemetaan Karakteristik Sekolah Sasaran Promosi pada UNKRISWINA SUMBA menggunakan K-Means,” vol. 6, pp. 1842–1850, 2022, doi: 10.30865/mib.v6i4.4464.
[7] D. M. K-means, E. Satria, H. S. Tambunan, I. S. Saragih, and I. S. Damanik, “Penerapan Cluster ing dalam Mengelompokkan Jumlah Kunjungan Wisatawan Mancanegara,” no. September, pp. 462–471, 2019.
[8] S. Paembonan and H. Abduh, “Penerapan Metode Silhouette Coeficient Untuk Evaluasi Clutering Obat,” vol. 6, no. 2, pp. 48–54, 2021.
[9] T. Hardiani, “Analisis Clustering Kasus Covid 19 di Indonesia Menggunakan Algoritma K-Means,” J. Nas. Pendidik.
Tek. Inform., vol. 11, no. 2, pp. 156–165, 2022, doi: 10.23887/janapati.v11i2.45376.
[10] D. A. Kuntjoro, B. D. Setiawan, and R. S. Perdana, “Algoritme Genetika Untuk Optimasi K-Means Clustering Dalam Pengelompokan Data Tsunami,” J. Pengemb. Teknol. Inf. dan Ilmu Komput., vol. 2, no. 10, pp. 3865–3872, 2018, [Online]. Available: http://j-ptiik.ub.ac.id
[11] A. Primandana, S. Adinugroho, and C. Dewi, “Optimasi Penentuan Centroid pada Algoritme K-Means Menggunakan Algoritme Pillar (Studi Kasus: Penyandang Masalah Kesejahteraan Sosial di Provinsi …,” … Teknol. Inf. dan Ilmu …, vol. 3, no. 11, pp. 10678–10683, 2020, [Online]. Available: http://j-ptiik.ub.ac.id/index.php/j- ptiik/article/download/6748/3264
[12] K. A. Saputra and I. N. W. Wijaya, “Penerapan Algoritma Pillar Untuk Inisialisasi Titik Pusat K- Application of Pillar Algorithm for Initialization of K-Means Dynamic Cluster Centroid,” vol. 7, no. 6, pp. 1213–1220, 2020, doi:
10.25126/jtiik.202072538.
[13] R. T. Aldisa and G. Ginting, “Sistem Pendukung Keputusan Penentuan Pelaku Pariwisata Terbaik dimasa Pandemi Covid-19 Menerapkan Metode OCRA dengan Pembobotan ROC,” vol. 6, no. 5, pp. 1056–1063, 2022, doi:
10.30865/mib.v6i2.4000.
[14] K. Selatan, B. Bali, and K. P. Tuban, “Jurusan Teknik Elektro , Politeknik Negeri Bali , Kampus Bukit Jimbaran ,” vol.
5, no. 5, pp. 621–628, 2018, doi: 10.25126/jtiik2018551120.
[15] T. Online, K. S. Budiyanto, I. P. Windasari, Y. Eko, and D. Ulfiana, “Jurnal Politeknik Caltex Riau Sistem Informasi Geografis berbasis Web untuk Penentuan Prioritas Pembangunan Embung,” vol. 6, no. 2, pp. 169–181, 2020.
[16] J. Han, K. Micheline, and P. Jian, Data Mining. Concept and Techniques, 3rd ed. Waltham: Elsevier, 2012.
[17] M. Nishom, “Perbandingan Akurasi Euclidean Distance, Minkowski Distance, dan Manhattan Distance pada Algoritma K-Means Clustering berbasis Chi-Square,” J. Inform. J. Pengemb. IT, vol. 4, no. 1, pp. 20–24, 2019, doi:
10.30591/jpit.v4i1.1253.
[18] M. E. Centre, “Selection of K in K -means clustering,” vol. 219, no. September 2004, pp. 103–119, 2005, doi:
10.1243/095440605X8298.
[19] G. Wang et al., “Integration K-Means Clustering Method and Elbow Method For Identification of The Best Customer Profile Cluster Integration K-Means Clustering Method and Elbow Method For Identification of The Best Customer Profile Cluster”, doi: 10.1088/1757-899X/336/1/012017.
[20] R. Hidayati et al., “Analisis Silhouette Coefficient pada 6 Perhitungan Jarak K-Means Clustering,” vol. 20, no. 2, pp.
186–197, 2021, doi: https://doi.org/10.33633/tc.v20i2.
[21] R. Ananda and A. Z. Yamani, “Penentuan Centroid Awal K-means pada proses Clustering Data Evaluasi Pengajaran Dosen,” J. RESTI, vol. 1, no. 3, pp. 544–550, 2017.
[22] E. U. Oti, M. O. Olusola, F. C. Eze, and S. U. Enogwe, “Comprehensive Review of K-Means Clustering Algorithms Comprehensive Review of K-Means Clustering Algorithms,” no. October, 2021, doi: 10.31695/IJASRE.2021.34050.