• Tidak ada hasil yang ditemukan

Pengelompokan Cuaca Kota Palembang Menggunakan Algoritma K-Means Clustering Untuk Mengetahui Pola Karakteristik Cuaca

N/A
N/A
Protected

Academic year: 2023

Membagikan "Pengelompokan Cuaca Kota Palembang Menggunakan Algoritma K-Means Clustering Untuk Mengetahui Pola Karakteristik Cuaca "

Copied!
9
0
0

Teks penuh

(1)

Pengelompokan Cuaca Kota Palembang Menggunakan Algoritma K-Means Clustering Untuk Mengetahui Pola Karakteristik Cuaca

Shanaz Khairunnisa*, Muhammad Ihsan Jambak

Fakultas Ilmu Komputer, Program Studi Sistem Informasi, Universitas Sriwijaya, Palembang, Indonesia Email: 1,*shahnazkhairunnisa2@gmail.com, 2mihsanjambak@gmail.com

Email Penulis Korespondensi: shahnazkhairunnisa2@gmail.com

Abstrak−Informasi terkait cuaca merupakan salah satu hal yang sangat penting dan besar pengaruhnya terhadap segala macam aktifitas kehidupan seperti dalam keselamatan masyarakat, sosial ekonomi, pertanian, penerbangan, dan sebagainya. Cuaca pada masing-masing tempat atau wilayah itu berbeda, hal ini terjadi karena adanya unsur-unsur cuaca yang berbeda-beda pada masing-masing tempat/wilayah. Dengan menggunakan tehnik clustering data mining akan dilakukan klasterisasi cuaca kota Palembang. K-means adalah algoritma yang dipilih dalam melakukan klasterisasi cuaca kota Palembang. Pengujian dilakukan menggunakan data cuaca harian tahun 2020-2021 dari BMKG dengan memanfaatkan aplikasi rapidminer dan SPSS sebagai teknik pembelajaran terhadap data. Sehingga akan didapat kelompok pola karakteristik cuaca kota Palembang berdasarkan kemiripan dan ketidakmiripan. Dari hasil pengujian k terbaik didapat pada k=3 dengan parameter Measure Types (NumericalMeasure) dan Divergences (DynamicTimeWarpingDistance) serta local random seed 2500 dilihat dari hasil Davies- Bouldin Index (DBI).

Kata Kunci: Cuaca; Clustering; K-Means; Rapidminer; DBI; SPSS.

Abstract−Weather related information is one of the things that is very important and has a big influence on all kinds of life activities such as in public safety, socio-economics, agriculture, aviation, and so on.The weather in each place or region is different, this happens because of the different weather elements in each place/region. By using data mining clustering techniques, weather clustering will be carried out in the city of Palembang. K-means is the algorithm chosen for clustering the weather in the city of Palembang. The test was carried out using daily weather data for 2020-2021 from BMKG by utilizing rapidminer application as learning techniques for data. So that we will get a group of weather characteristics of Palembang city based on similarities and dissimilarities. From the test results, the best k was obtained at k=3 with the parameters Measure Types ( NumericalMeasure ) and Divergences ( DynamicTimeWarpingDistance ) as well as a local random seed of 2500 seen from the results of the Davies-Bouldin Index (DBI). This weather grouping can later provide information on how the weather character is and reduce the impact of sudden changes in weather conditions.

Keywords: Weather; Clustering; K-Means; Rapidminer; DBI; SPSS.

1. PENDAHULUAN

Cuaca merupakan suatu keadaan pada saat tertentu dan pada wilayah tertentu yang relatif sempit serta pada jangka waktu yang singkat[1]. Keadaan cuaca suatu daerah dapat berubah-ubah tergantung faktor-faktor yang mempengaruhi[2]. Faktor-faktor tersebut ialah curah hujan, kelembaban rata-rata, lamanya penyinaran matahari, temperatur maksimum, temperatur minimum dan temperatur rata-rata. Dengan kata lain cuaca dapat diartikan sebagai keadaan atmosfer dalam waktu tertentu disuatu daerah/tempat dan menjadi salah satu dari banyak variabel yang menjadi penentu kondisi iklim

.

Cuaca di Indonesia diamati atau dipantau oleh suatu instansi pemerintah yang bernama BMKG (Badan Meteorologi, Klimatologi dan Geofisika). BMKG memberikan informasi yang berguna dan bermanfaat bagi berbagai penelitian terkait cuaca dan iklim[3]. Informasi tentang cuaca termasuk salah satu unsur yang sangat penting dan besar pengaruhnya terhadap segala macam aktifitas seperti dalam keselamatan masyarakat, sosial ekonomi, produksi pertanian, perkebunan, perikanan, penerbangan, dan lain sebagainya[4].

Informasi yang diperoleh dari BMKG berupa data cuaca tersebut dapat dimanfaatkan untuk melakukan penelitian yang berkaitan dengan kategorisasi atau pengelompokkan cuaca. Data cuaca akan diolah dan dianalisis sesuai karakteristik data agar dapat dikategorisasikan atau dikelompokkan. Dalam melakukan pengolahan data penulis memanfaatkan dan menerapkan metode dalam ilmu komputer yaitu data mining.

Data Mining merupakan suatu metode pengolahan data yang digunakan untuk mendapatkan sebuah pola tersembunyi dari data yang akan diolah[5]. Data yang di proses menggunakan teknik data mining akan menciptakan suatu pengetahuan baru yang bersumber dari data lama, hasil yang akan diperoleh dari pemprosesan data tersebut dapat digunakan untuk menentukan suatu keputusan di masa depan[6].

Teknik data mining yang dapat digunakan untuk melakukan pengelompokkan data cuaca menurut kemiripan/kesamaan (similarity) ialah dengan menggunakan teknik klastering. Klastering ialah suatu metode untuk mencari dan mengelompokkan data yang memiliki kemiripan/kesamaan karakteriktik (similarity) antara satu data dengan data yang lainnya[7]. klastering merupakan suatu metode dalam menganalisa data atau metode data mining yang dalam proses pemodelannya tanpa supervisi (unsupervised)[8], maksudnya metode ini diterapkan tanpa adanya latihan (training) dan tanpa adanya guru serta tidak memerlukan target output. Karakteristrik tiap cluster tidak ditentukan sebelumnya melainkan berdasarkan kemiripan yang ada pada atribut-atribut dari suatu kelompok atau cluster .

(2)

Pada penelitian ini, proses klasterisasi dipengaruhi oleh faktor-faktor cuaca dan iklim. Proses klasterisasi akan dikategorikan atau dikelompokkan berdasarkan kemiripan/ketidakmiripan sesuai tipe atau variasi yang ada.

Frenda Farahdinna, Irfan Nurdiansyah, Apriati Suryani dan Arief Wibowo melakukan penelitian membandingakan algoritma k-means dan k-medoids , dalam penelitian tersebut didapat hasil bahwa algoritma k-means lebih optimal dalam melakukan klasterisasi dibanding algoritma k-medoids dilihat dari nilai DBI sehingga dalam proses klasterisasi cuaca penulis menggunakan salah satu algoritma K-means[9].K-means termasuk metode klastering yang cukup sederhana dan umum digunakan. Metode k-Means terkenal cepat dan simpel.K-Means mempunyai kemampuan mengelompokkan data dalam jumlah yang cukup besar dengan waktu komputasi yang cepat dan efisien[10]. Menurut Sibarani Riama k-means termasuk kedalam clustering non hirarki dimana mempartisi data ke dalam cluster (kelompok) sehingga data yang karakteristik sama atau mirip akan dikelompokkan ke dalam kelompok yang sama dan data yang mempunyai karakteristik yang berbeda akan dikelompokkan ke dalam kelompok lain[11].

Berdasarkan penjelasan diatas penulis akan melakukan penelitian untuk mengklasterisasi cuaca Kota Palembang menggunakan algoritma k-means Pengelompokan cuaca ini nantinya dapat memberikan informasi bagaimana karakter cuaca dan mengurangi dampak perubahan kondisi cuaca yang secara mendadak.

2. METODOLOGI PENELITIAN

2.1 Tahapan Penelitian

Penelitian ini akan menerapkan atau mengadopsi metode CRISP-DM (Cross Industry Standart Process-Data Mining) sebagai standart proses data mining sekaligus tahapan penelitian[12]. Berikut tahapan penlitian dengan menerapkan metode CRISP-DM :

Gambar 1. Tahapan Penelitian 2.1.1 Data

Pada penelitian ini data diperoleh dari website BMKG (Badan Meteorologi, Klimatologi dan Geofisika) Stasiun Klimatologi Palembang (http://dataonline.bmkg.go.id). Data yang diambil adalah data perhari dengan record sebanyak 731 data selama 2 Tahun , periode 01 Januari 2020 - 31 Desember 2021.

Tabel 1. Atribut Data Cuaca Harian

Atribut Penjelasan Alat Ukur

Tanggal Tanggal Data Diambil -

Tn Temperatur minimum (℃) Termometer

Tx Temperatur maksimum (℃) Termometer

Tavg Temperatur rata-rata (℃) Termometer RH_avg Kelembapan rata-rata (℃) Termometer

(3)

Atribut Penjelasan Alat Ukur

RR Curah hujan (mm) Penakar hujan tipe observatorium

ss Lama penyinaran matahari (jam) Cample stokes ff_x Kecepatan angin maksimum (m/s) Anemometer dd_x Arah angin saat kecepatan maksimum (°) Wind vane ff_avg Kecepatan angin rata-rata (m/s) Anenometer ddd_car Arah angin terbanyak (°) Wind vane

Tabel 2. Sample Data Cuaca Harian Bulan Januari 2020 Tanggal Tn

(℃) Tx

(℃) Tavg

(℃) RH_av g (%)

RR (mm)

ss (jam)

ff_x (m/s)

Ddd_x (°)

ff_avg (m/s)

ddd_

car (°)

01-01-2020 23,7 29,7 25,7 88 0,2 1,5 6 320 2 NW

02-01-2020 23,9 33,0 27,2 80 8888,0 1,6 6 300 3 NW

03-01-2020 24,2 31,3 27,4 84 0,0 4,4 6 310 3 NW

04-01-2020 25,1 32,2 27,6 82 1,0 3,5 8 330 3 NW

05-01-2020 25,2 32,0 27,2 80 8888,0 7,0 5 340 2 C

06-01-2020 24,8 32,1 27,5 83 7,5 3,9 6 310 2 NW

07-01-2020 24,8 32,6 27,8 80 1,8 6,7 7 320 3 NW

08-01-2020 24,6 31,6 27,3 86 0,0 5,5 6 290 3 NW

09-01-2020 25,0 31,4 27,1 86 4,5 2,9 7 330 2 NW

10-01-2020 24,0 29,4 26,5 86 6,0 0,9 5 320 3 W

2.1.2 Persiapan Data

Tahap selanjutnya ialah tahapan persiapan data. Data penelitian yang telah dikumpulkan tidak bisa langsung diolah melainkan harus dipersiapkan terlebih dahulu. Tahapan ini bertujuan untuk mempersiapkan data yang ingin digunakan dan diolah menggunakan algoritma dan tools yang telah ditentukan[13]. Pada tahapan ini dilakukan data preprocessing. Adapun kegiatan-kegiatan yang dilakukan pada tahapan ini sebagai berikut:

1. Menggabungkan data cuaca harian dari tanggal 01 Januari 2020 sd 31 Desember 2021 kedalam satu file excel.

2. Menangani missing value (data kosong), missing value dan data yang tidak terukur (8888,0) akan diisi menggunakan nilai mean (rata-rata) atau modus (nilai yang sering muncul).

3. Transformasi data, pada penelitian ini transformasi data akan dilakukan pada atribut ddd_x, dan ddd_car.

Atribut ddd_x dan ddd_car akan di transformasikan ke dalam bentuk numerik dengan mengikuti ketentuan sebagai berikut:

Tabel 3. Sample Data Cuaca Harian Bulan Januari 2020 No Arah Mata Angin Derajat Arah Mata Angin Notasi

1 C - 0

2 N 0 1

3 NE 0 < X < 90 2

4 E 90 3

5 SE 90 < X < 180 4

6 S 90 5

7 SW 180 < X < 270 6

8 W 270 7

9 NW 270 < X < 360 8

Tabel 4. Sample Data Cuaca Harian Bulan Januari 2020 Tanggal Tn

(℃) Tx

(℃) Tavg

(℃) RH_av g (%)

RR (mm)

ss (jam)

ff_x (m/s)

Ddd_x (°)

ff_avg (m/s)

ddd_

car (°)

01-01-2020 23,7 29,7 25,7 88 0,2 1,5 6 8 2 8

02-01-2020 23,9 33,0 27,2 80 8888,0 1,6 6 8 3 8

03-01-2020 24,2 31,3 27,4 84 0,0 4,4 6 8 3 8

04-01-2020 25,1 32,2 27,6 82 1,0 3,5 8 8 3 8

05-01-2020 25,2 32,0 27,2 80 8888,0 7,0 5 8 2 0

06-01-2020 24,8 32,1 27,5 83 7,5 3,9 6 8 2 8

07-01-2020 24,8 32,6 27,8 80 1,8 6,7 7 8 3 8

08-01-2020 24,6 31,6 27,3 86 0,0 5,5 6 8 3 8

09-01-2020 25,0 31,4 27,1 86 4,5 2,9 7 8 2 8

10-01-2020 24,0 29,4 26,5 86 6,0 0,9 5 8 3 7

(4)

Setelah proses persiapan data selesai dilakukan, data yang didapat adalah data akhir yang siap digunakan untuk proses pengujian pada aplikasi rapidminer.

2.1.3 Pengolahan Data Menggunakan Rapidminer

Dalam melakukan pengolahan dan pemodelan data akan digunakan aplikasi RapidMiner. Untuk melakukan pengolahan kita harus memasukan data yang ingin kita uji coba, yaitu dengan menggunakan fitur import data.

Setelah itu memilih data mana yang akan diolah pada aplikasi RapidMiner.

Gambar 2. Import Data Penelitian

Setelah import data dilakukan, selanjutnya akan melakukan pengujian menggunakan algoritma k-means untuk melakukan klasterisasi data penelitian ini.

Gambar 3. Pemodelan Algoritma K-Means

Gambar 3. Penyesuaian Parameter K-Means Berikut tabel paramteter yang akan dilakukan dalam pengujian.

Tabel 5. Parameter Measure Types dan Divergence Parameter Measure Types Divergence 1 Bregman Divergence SquareEcludienDistance 2 BregmanDivergence MahalonobisDistance 3 MixedMeasure MixedEcludienDistance 4 NumericalMeasure EuclideanDistance 5 NumericalMeasure CorrelationSimilarity

(5)

Parameter Measure Types Divergence

6 NumericalMeasure Normalized Manhattan Distance 7 NumericalMeasure Manhattan Distance

8 NumericalMeasure DynamicTimeWarpingDistance 9 NumericalMeasure JaccardSimilarity

10 NumericalMeasure ChebychevDistance

3. HASIL DAN PEMBAHASAN

3.1 Hasil Pengujian

Pengujian yang dilakukan menggunakan algoritma k-means untuk melakukan klasterisasi cuaca di kota Palembang.

cluster yang memiliki nilai DBI yang paling rendah lebih baik dibandingkan nilai DBI yang lebih tinggi. Nilai DBI yang terbaik adalah nilai yang mendekati 0 (nol)[14]. untuk mendapatkan itu maka dilakukan pengujian dan penyesuaian terhadap paramater pada algoritma k-means untuk mencapai tujuan utama yaitu mendapatkan cluster terbaik yang dilihat dari nilai DBI.

Tabel 6. Hasil Pengujian Local

Random Seed DBI 250 -0.926 500 -0.565 1000 -0.565 1500 -0.926 1992 -0.565 2500 -0.553 3500 -0.565 4000 -0.926 4500 -0.565 5000 -0.926 3.1.1 Pengujian Mencari Nilai k Terbaik

Pada pengujian ini akan dilakukan pengujian untuk mencari nilai k yang terbaik. Dalam pengujian ini kita akan menguji dari k=2 sampai k=7. Hasil dari pengujian mencari nilai k yang terbaik, terdapat pada k=3 yang menghasilkan nilai DBI terkecil yaitu -0,553.

Tabel 7. Hasil Pengujian Mencari Nilai K

Uji ke- Banyaknya k

2 3 4 5 6 7

1 -0,579 -0,592 -0,625 -0,787 -1,004 -0,964 2 -3,974 -3,923 -2,155 -2,487 -2,909 -2,777 3 -0,579 -0,592 -1,051 -1,018 -1,006 -0,964 4 -0,579 -0,592 -1,051 -1,018 -1,006 -0,964 5 -0,592 -0,699 -1,106 -1,241 -1,325 -1,393 6 -0,632 -1,333 -1,205 -1,148 -1,303 -1,233 7 -0,575 -0,736 -1,063 -1,120 -1,120 -1,222 8 -0,734 -0,553 -0,857 -1,320 -1,259 -1,240 9 -0,683 -0,683 -0,683 -0,683 -0,687 -0,683 10 -0,583 -0,592 -0,620 -1,086 -1,045 -0,965

Setelah dilakukan pengujian mencari nilai k yang terbaik, yang hasil pengujiannya dapat dilihat pada tabel 7 diatas. Selanjutnya akan dilakukan uji kroskel wallis, uji kruskel wallis bertujuan untuk mengetahui apakah ada perbedaan rata-rata data lebih dari dua kelompok[15].

Tabel 8. Hasil Uji Normalitas

Banyak K- Kolmogorof-Smirnof Shapiro-Wilk

df Sig df Sig

K=2 10 0,000 10 0,000

K=3 10 0,000 10 0,000

(6)

Banyak K- Kolmogorof-Smirnof Shapiro-Wilk

df Sig df Sig

K=4 10 0,060 10 0,011

K=5 10 0,000 10 0,000

K=6 10 0,001 10 0,000

K=7 10 0,011 10 0,001

Tabel 9. Hasil Uji Kruskal-Wallis H Davies Boulden

Index Kruskal-Wallis H 19,770

df 5

Asymp. Sig 0,001

Sebelum kita menguji data pada tabel 7, kita harus menguji data tersebut terdistribusi normal atau tidak.

Dilihat dari tabel 8 hasil uji normalitas sig yang dihasilkan < 0,05 hasil ini menunjukan bahwa data penelitian yang kita uji tidak terdistribusi normal. Jika hasil sig > 0,05 menunjukan bahwa data terdistribusi normal[16] dan uji penelitian yang dipakai yaitu one way anova (uji parametrik). karena hasil pengujian menunjukan data tidak terdistribusi normal, maka pengujian dilakukan menggunakan kruskal wallis (uji non parametrik)[17].

Setelah dilakukan uji normalitas barulah kita lakukan uji kruskel wallis. Hasilnya dapat kita lihat pada tabel 9. Dimana pengujian tersebut didapatkan bahwa Asymp.Sig 0,001 (2-tailed), nilai tersebut lebih kecil dari 0,05[18]. maka dapat disimpulkan bahwa terdapat perbedaan yang signifikan antar cluster dengan nilai k= 2-7 terhadap hasil DBI.

3.1.2 Pengujian Mencari Setting Parameter K-Means

Setelah dilakukan pengujian untuk mendaptkan nilai k yang terbaik, dimana didapat bahwa k= 3 adalah yang terbaik dilihat dari nilai DBI. Selanjutnya dilakukan uji untuk mencari setting parameter algoritma k-means paling optimal. Dari pegujian tersebut didapat nilai k pada k= 3 serta parameter ke 8 (Measure Types=NumericalMeasure dan Divergence= DynamicTimeWarpingDistance serta Local Random Seed =2500 ) yang menghasilkan nilai DBI paling kecil yaitu -0,553. sehingga setting parameter ini menghasilkan cluster terbaik.

Tabel 10. Hasil Pengujian Setting Parameter Local

Random Seed

Parameter

1 2 3 4 5 6 7 8 9 10

250 -0.592 -2.492 -0.592 -0.926 -0.699 -1.138 -0.736 -0.926 -1.180 -0.592 500 -0.592 -3.966 -0.592 -0.565 -0.707 -1.138 -0.736 -0.565 -0.683 -0.592 1000 -0.592 -4.105 -0.592 -0.592 -0.707 -1.138 -0.736 -0.565 -1.927 -0.592 1500 -0.592 -2.540 -0.592 -0.592 -0.707 -1.138 -0.736 -0.926 -0.683 -0.592 1992 -0.592 -2.492 -0.592 -0.592 -0.699 -1.336 -0.736 -0.565 -1.087 -0.592 2500 -0.592 -2.492 -0.592 -0.592 -0.707 -1.138 -0.736 -0.553 -1.420 -0.592 3500 -0.592 -2.492 -0.592 -0.592 -0.699 -1.138 -0.736 -0.565 -1.053 -0.592 4000 -0.592 -2.492 -0.592 -0.592 -0.699 -1.138 -0.736 -0.926 -0.683 -0.592 4500 -0.592 -2.492 -0.592 -0.592 -0.707 -1.336 -0.736 -0.565 -1.053 -0.592 5000 -0.592 -2.492 -0.592 -0.592 -0.707 -1.138 -0.736 -0.926 -1.180 -0.592

Tabel 11. Hasil Uji Normalitas Uji Parameter

ke-

Kolmogorof-Smirnof Shapiro-Wilk

df Sig df Sig

1 10 10

2 10 0,000 10 0,000

3 10 10

4 10 0,000 10 0,000

5 10 0,000 10 0,000

6 10 0,000 10 0,000

7 10 10

8 10 0,000 10 0,000

9 10 0,185 10 0,070

10 10 10

(7)

Tabel 12. Hasil Uji Kruskal-Wallis H Davies Boulden

Index Kruskal-Wallis H 77,425

df 9

Asymp. Sig 0,000

Sebelum kita menguji data pada tabel 10 kita harus menguji data tersebut terdistribusi normal atau tidak.

Dilihat dari tabel 11 sig yang dihasilkan < 0,05. hasil ini menjukan bahwa data penelitian yang kita uji tidak terdistribusi normal. Jika hasil sig > 0,05 menunjukan bahwa data terdistribusi normal[16] dan uji penelitian yang dipakai yaitu one way anova (uji parametrik). karena hasil pengujian menunjukan data tidak terdistribusi normal, maka pengujian dilakukan menggunakan kruskal wallis (uji non parametrik)[17].

Setelah dilakukan uji normalitas barulah kita lakukan uji kroskel wallis. Hasilnya dapat kita lihat pada tabel 12. Dimana pengujian tersebut didapatkan bahwa Asymp.Sig 0,000 (2-tailed), nilai tersebut lebih kecil dari 0,05.

maka dapat disimpulkan bahwa terdapat perbedaan yang signifikan antar cluster dengan penyesuaian parameter terhadap hasil DBI.

3.2 Analisa Hasil Pengujian

3.2.1 Cluster Model Hasil Pengujian

Gambar 4. Cluster Model Hasil Penelitian 3.2.2 Plot Hasil Penelitian

Pada gambar plot dari hasil penelitian, terlihat bahwa atribut atau variabel RR (curah hujan) dan RH_avg (kelembapan rata-rata) merupakan atribut yang menyebabkan terbentuknya cluster pola karakteristik cuaca, dilihat dari grafik yang dihasilkan gambar di bawah :

Gambar 5. Plot Hasil Penelitian 3.2.3 Centroid Hasil Pengujian

Plot cluster diatas tidak bisa menjelaskan secara jelas bagaimana karakteristik yang dihasilkan dari setiap cluster.

Jadi kita perlu melihat gambar hasil centroid yang dihasilkan pada gambar dibawah ini:

Gambar 6. Centroid Hasil Penelitian Adapun penjelasan karakteristik yang dihasilkan dari setiap cluster yaitu:

(8)

a. Pada cluster 0 (cluster 1), memiliki karakteristik cuaca dengan temperatur (suhu) minumum, temperatur maksimum, temperatur rata-rata udara paling tinggi diantara cluster lainnya. Selain itu cluster ini memiliki kelembapan rata-rata udara paling rendah, serta curah hujan ringan. Sehingga dapat disimpulkan cluster ini merupakan cluster yang terjadi pada musim kemarau (panas) dan merupakan cluster yang paling banyak terjadi di kota Palembang pada 01 Januari 2020 sd 31 Desember 2021.

b. Pada cluster 1 (cluster 2), memiliki karakteristik.curah hujan sedang dan kelembapan rata-rata udara tidak setinggi yang ada pada cluster 2. ini merupakan cluster cuaca yang terjadi pada musim hujan.

c. Pada cluster 2 (cluster 3), memiliki karakteristik cuaca dengan temperatur (suhu) minimum, temperatur maksimum, temperatur rata-rata paling rendah dibandingkan dengan cluster lainnya. Selain itu cluster ini memilki kelembapan rata-rata udara paling tinggi, serta curah hujan ekstrem . Cluster cuaca ini merupakan cluster yang jarang terjadi, dimana hanya memiliki 3 items. Ini merupakan cluster cuaca musim hujan ekstream.

3.2.4 Visualisasi Hasil Pengujian

Dalam memvisualisasi hasil penelitian dapat menggunakan scatter plot. Visualisasi yang dihasilkan oleh scatter plot dibawah ini menunjukan sebaran-sebaran data yang dihasilkan dari setiap cluster. Dapat dilihat bahwa kelembapan rata-rata udara rendah maka hujan ringan, jika kelembapan rata-rata tinggi maka hujan semakin lebat.

Gambar 7. Scatter Plot 3D Hasil Penelitian

4. KESIMPULAN

Berdasarkan hasil pengujian, analisis dan pembahasan yang telah dilakukan terhadap algoritma k-Means didapatkan kesimpulan , yaitu Dari penelitian yang dilakukan diketahui bahwa k terbaik didapat pada k=3 dengan parameter Measure Types (NumericalMeasure) dan Divergences (DynamicTimeWarpingDistance) serta local random seed 2500. Atribut atau variabel yang menyebabkan pengelompokkan pola karakteristik cuaca kota Palembang periode 01 Januari 2020 sd 31 Desember 2021 ialah atribut curah hujan (RR) dan atribut kelembapan rata-rata (RH_avg). Informasi yang dihasilkan dari penelitian bahwa terdapat 3 pola cuaca yang sering muncul di Kota Palembang, dengan karakteristik pola oleh cluster 3 memiliki karakteristik cuaca ekstream yang perlu di waspadai, karena walaupun hanya memiliki 3 data (item) tetapi sudah membentuk cluster sendiri.

REFERENCES

[1] M. Yulianto and D. A. P. Putri, “Pengembangan Game Edukasi Pengenalan Iklim dan Cuaca untuk Siswa Kelas III Sekolah Dasar,” Emit. J. Tek. Elektro, vol. 20, no. 2, pp. 128–133, 2020, doi: 10.23917/emitor.v20i02.9088.

[2] D. Iskandar, Ensiklopedia Seri Cuaca dan Iklim. Alprin, 2020.

[3] BMKG, Masyarakat Indonesia Sadar Iklim dan Cuaca. 2019.

[4] M. Herviany, S. P. Delima, T. Nurhidayah, and Kasini, “Perbandingan Algoritma K-Means dan K-Medoids untuk Pengelompokkan Daerah Rawan Tanah Longsor di Provinsi Jawa Barat,” MALCOM Indones. J. Mach. Learn. Comput.

Sci., vol. 1, no. 1, pp. 34–40, 2021.

[5] J. P. Han Jiawei, Micheline Kamber, “Data Mining Concepts and Techniques,” 3rd ed., USA: Elsevier Inc, 2012.

[6] P. Alkhairi and A. P. Windarto, “Penerapan K-Means Cluster pada Daerah Potensi Pertanian Karet Produktif di Sumatera Utara,” Semin. Nas. Teknol. Komput. Sains, pp. 762–767, 2019.

[7] L. Fimawahib and E. Rouza, “Penerapan K-Means Clustering pada Penentuan Jenis Pembelajaran di Universitas Pasir Pengaraian,” INOVTEK Polbeng - Seri Inform., vol. 6, no. 2, p. 234, 2021, doi: 10.35314/isi.v6i2.2096.

[8] I. Wahyudi, S. Bahri, and P. Handayani, “Aplikasi Pembelajaran Pengenalan Budaya Indonesia,” vol. V, no. 1, pp. 135–

138, 2019, doi: 10.31294/jtk.v4i2.

[9] F. Farahdinna, I. Nurdiansyah, A. Suryani, and A. Wibowo, “Perbandingan Algoritma K-Means Dan K-Medoids Dalam Klasterisasi Produk Asuransi Perusahaan Nasional,” J. Ilm. FIFO, vol. 11, no. 2, p. 208, 2019, doi:

10.22441/fifo.2019.v11i2.010.

(9)

[10] Y. Darnita, R. Toyib, and Y. Kurniawan, “Penerapan Metode K-Means Clustering Pada Aplikasi Android Pada Tanaman Obat Herbal,” Pseudocode, vol. 7, no. 2, pp. 105–114, 2020, doi: 10.33369/pseudocode.7.2.18-27.

[11] R. Sibarani and O. Omby, “Algorithma K-Means Clustering Strategi Pemasaran Penerimaan Mahasisswa Baru Universitas Satya Negara Indonesia,” J. Algoritm. Log. dan Komputasi, vol. 1, no. 2, pp. 44–50, 2018, doi: 10.30813/j- alu.v1i2.1367.

[12] T. R. Rivanthio and M. Ramdhani, “Penerapan Teknik Clustering Data Mining untuk Memprediksi Kesesuaian Jurusan Siswa (Studi Kasus SMA PGRI 1 Subang),” Fakt. Exacta, vol. 13, no. 2, p. 125, 2020, doi:

10.30998/faktorexacta.v13i2.6588.

[13] D. Feblian and D. U. Daihani, “Implementasi Model Crisp-Dm Untuk Menentukan Sales Pipeline Pada Pt X,” J. Tek.

Ind., vol. 6, no. 1, 2017, doi: 10.25105/jti.v6i1.1526.

[14] Risman, Syaripuddin, and Suyitno, “Implementasi Metode Dbscan Pada Pengelompokan Kabupaten/Kota Di Pulau Kalimantan Berdasarkan Indikator Kesejahteraan Rakyat,” Pros. Semin. Nas. Mat., pp. 22–28, 2019.

[15] S. Santoso, Mahir Statistik Parametrik. Elex Media Komputindo, 2019.

[16] H. J. A. Rohmah Maghfirotur, “PENGARUH MODEL PEMBELAJARAN INKUIRI TERBIMBING TERHADAP KETERAMPILAN PROSES SAINS FISIKA PADA HUKUM KE NOL TERMODINAMIKA,” vol. 9, no. 2, 2022.

[17] M. K. Halimah Tus Sadiah, M. C. Muhamad Saad Nurul Ishlah, S. F. A. M. F. Nisa Najwa Rokhmah, and M. F. Zaldy Rusli, Aplikasi Komputer Farmasi: Buku Ajar Hasil Penelitian Hibah Dikti 2019. Lembaga Penelitian dan Pengabdian pada Masyarakat Universitas Pakuan, 2019.

[18] A. Quraisy and N. Hasni, “Analisis Kruskal-Wallis Terhadap Kemampuan Numerik Siswa,” VARIANSI J. Stat. Its Appl.

Teach. Res., vol. 3, no. 3, pp. 156–161, 2021, doi: 10.35580/variansiunm29957.

Referensi

Dokumen terkait

Some studies advocate that the thyroid gland need not be removed routinely in all laryngectomies, unless there is advanced disease with thyroid cartilage erosion and gross thyroid gland