• Tidak ada hasil yang ditemukan

View of CLUSTERING DAERAH MISKIN DI PROVINSI RIAU MENGGUNAKAN METODE K-MEANS

N/A
N/A
Nguyễn Gia Hào

Academic year: 2023

Membagikan "View of CLUSTERING DAERAH MISKIN DI PROVINSI RIAU MENGGUNAKAN METODE K-MEANS"

Copied!
12
0
0

Teks penuh

(1)

CLUSTERING DAERAH MISKIN DI PROVINSI RIAU MENGGUNAKAN METODE K-MEANS

Fatimah Isyarah1, Mhd, Arief Hasan2, Fana Wiza3

1,2,3Program Studi Teknik Informatika Fakultas Ilmu Komputer Universitas Lancang

Kuning

1.2.3Jl. Yos Sudarso KM. 8 Rumbai, Pekanbaru, Riau, telp. 0811 753 2015 e-mail: [email protected]1 , [email protected]2 , [email protected]3

Abstrak

Analisis Klaster sangat cocok untuk mengelompokkan data-data berukuran besar.

Dan penelitian kali ini bertujuan mengelompokan daerah miskin di Provinsi Riau berdasarkan Umur Harapan Hidup, Jumlah Penduduk, Pengeluaran perKapita, Rata-rata Lama Sekolah, Angkatan Kerja, dan Harapan Lama Sekolah agar tepat sasaran, dan masyarakat mendapat program-program sekaligus bantuan dari pemerintah, dengan menggunakan K-means sebagai metode peng-klasteran. K-means menjabarkan algoritma untuk menentukan sebuah obyek kedalam klaster tertentu berdasarkan rataan terdekat dan mudah di implementasikan. Dari hasil penelitian, klaster pertama memiliki 5 anggota, klaster kedua memiliki 6 anggota, dan klaster 3 yang memiliki 1 anggota.

Kata Kunci: Clustering, K-Means, Penduduk

Abstract

Cluster Analysis is perfect for grouping large data. And this research is trying to classify poor areas in Riau Province based on Life Expectancy, Population Amount, Per capita Expenditures, Old Average Schools, Labor Force, and Old Hope Schools to be on target, and the community gets government assistance programs, with using K-means as a Clustering method. K-means describing the algorithm to determine the object to a certain Cluster based on the nearest average and easy to implement. From the results of the study, the first Cluster has 5 members, the second Cluster has 6 members, and Cluster 3 has 1 member.

Keywords: Clustering, K-Means, Population

1. PENDAHULUAN

Pada era yang serba modern ini, kita dapat menikmati semua fasilitas dan kemajuan teknologi yang membuat semuanya dapat diakses dengan mudah dan cepat.

Teknologi sudah digunakan di hampir segala bidang untuk mempermudah pekerjaan kita.

Namun sayangnya, tidak semua orang dapat menikmati kenyamanan yang tersedia saat ini. Kemiskinan masih saja menjadi masalah bagi negara berkembang seperti Indonesia.

Badan Pusat Statistik (BPS) mencatat jumlah penduduk miskin Di provinsi Riau pada bulan Maret 2018 dengan 500,44 ribu. Jumlah penduduk miskin meningkat 4,05 ribu orang dibandingkan dengan september 2017, sedangkan maret 2017 mereka turun sebanyak 14,18 ribu orang. Dan jika di hitung kembali, penduduk miskin di provinsi Riau turun menjadi 7,39 persen.

Saat penyaluran bantuan, terkadang tak semua masyakat miskin mendapatkan bantuan yang memang seharusnya mereka dapatkan. Alasannya karena hingga saat ini pun banyak terjadi kesalahan dalam pembagian bantuan. Pemerintah terkadang tak terlalu memperhatikan masyarakat yang mendapatkan bantuan adalah masyarakat yang benar-benar membutuhkan bantuan atau tidak. Di sekitar kita masih sering terjadi kesalahan pemberian bantuan berupa orang yang tak berhak mendapatkan bantuan malah

(2)

mendapatkannya, sedangkan yang membutuhkan malah tidak mendapatkan bantuan. Hal ini terjadi karena kurangnya ketelitian pemerintah dalam mendata masyarakat miskin.

Pada penelitian ini peneliti menggunakan aplikasi Rapid Miner sebagai pengujian untuk perhitungan K-means Cluster. Sedangkan untuk penelitian terdahulu, beberapa peneliti menggunakan berbagai pengujian yang berbeda, yakni [8] Penelitian ini memiliki beberapa asumsi dalam pengujian Cluster K-Means. Yaitu Uji Multikolenieritas dan Uji Diskriminan, adapun uji Diskriminan terdiri dari : Uji Normal Multivariate, Uji Kehomogenan Matriks Kovarian Kedua Kelompok, Uji Perbedaan Vektor Rata-rata, dan Uji Variance. Peneliti [12] menggunakan Davies Bouldin Index untuk memaksimalkan jarak Inter-Cluster supaya memiliki skema Clustering yang optimal. Selain itu mereka juga menggunakan Min-max Normalization yang merupakan salah satu dari metode normalisasi data yang mengubah nilai pada dataset dalam skala yang lebih kecil dan bernilai 0 hingga 1. Sedangkan untuk penelitian [15] peneliti menggunakan pendeteksian Multikolinearitas yang memiliki artian adanya hubungan yang liniar di antara variabel penelitian. Lalu dilanjutkan dengan memilih ukuran kemiripan, yaitu untuk mengetahui seberapa mirip objek-objek yang diteliti butuhkan untuk ukuran jarak. Lalu selanjutnya standarisasi data, serta penentuan jumlah klaster.

Lalu pada penelitian [1] mereka melakukan pengujian asumsi mengenai multikolinearitas menggunakan korelasi Pearson. Mengatasi multikolinearitas dalam data dapat mengekstraksi faktor, yang mengakibatkan faktor tak dapat berkorelasi dengan sesamanya. Maka dari itu, sebelum melakukan analisis faktor maka harus dilakukan pengujian data menggunakan uji Bartlett dan KMO. Uji Bartlett menggunakan statistik Chi- square, dengan tujuan untuk melihat apakah variabel berkolerasi dengan variabel lainnya.

Sedangkan KMO itu sendiri digunakan untuk meneliti ketepatan analisis faktor. Pada penelitian [2] sebelum memulai proses perhitungan, sebelum itu mereka melakukan salah satu proses yang dilakukan adalah membersihkan data sebelum di proses, atau disebut juga dengan Preprosesing data. Teknik dalam preprosesing data itu sendiri diantaranya data Cleaning, yang berarti mengisi Missing Value dan membuang Outlier. Lalu data Integrasi yang berarti mengumpulkan data dari berbagai sumber, data transformasi, data reduksi, dan data diskretisisasi.

Berdasarkan penelitian yang telah dilakukan, dengan menerapkan Metode K- means dapat mengelompokkan daerah miskin menjadi tiga klaster, yaitu Mampu, Menengah, dan Kurang mampu. Berdasarkan masalah di atas, maka dilakukan penelitian yang membahas seputar “Clustering Pengelompokan Daerah Miskin Di Provinsi Riau Menggunakan Metode K-means”.

2. METODE PENELITIAN 2.1 Praproses Data

Praproses data adalah mengumpulkan data mentah dari Badan Pusat Statistik Provinsi Riau berupa data yang tersimpan dalam format PDF, yang nantinya akan dijadikan sebuah data baru yang terdiri dari data Jumlah Penduduk, Angkatan Kerja, Umur Harapan Hidup, Harapan Lama Sekolah, Rata-rata Lama Sekolah, serta Pengeluaran Perkapita se-Provinsi Riau yang akan dibuat dalam format (xls) [8].

Langkah ini menjelaskan bagaimana tahapan mengubah data mentah menjadi data yang bisa digunakan untuk proses klasterisasi. Tahapan dalam praproses data yaitu mengintegrasi data, membersihkan, dan mentranformasi.

a. Pembersihan Data

1. Menghilangkan Duplikat Data

2. Menghapus Data yang tidak Diperlukan

Tahapan ini melakukan proses penghapusan data yang tidak digunakan, untuk memperkecil jumlah data sesuai dengan kebutuhan, akan tetapi tetap mempertahankan

(3)

nilai dari data asli. Data yang digunakan kali ini adalah data dari tahun 2018, yang mencakup Umur Harapan Hidup, Jumlah Penduduk, Pengeluaran perKapita, Rata-rata Lama Sekolah, Angkatan Kerja, dan Harapan Lama Sekolah. Selain dari data yang tadi disebutkan, maka semuanya akan dihapus.

Gambar 1. Pembersihan Data b. Integrasi Data

Penggabungan data dari beberapa sumber, yang berguna untuk untuk mengolah data menggunakan aplikasi RapidMiner, yaitu menggabungkan data Kabupaten/kota, Umur Harapan Hidup, Jumlah Penduduk, Pengeluaran perKapita, Rata-rata Lama Sekolah, Angkatan Kerja, serta Harapan Lama Sekolah menjadi sebuah data baru.

Tabel 1. Integrasi Data Nama

Kabupaten

Umur Harapan

Hidup

Harapan Lama Sekolah

Rata- rata Lama Sekolah

Jumlah Penduduk

Angkatan Kerja

Pengeluaran Perkapita Kuantan

Singingi 68,17 13,27 8,31 324,41 147,906 10,476 Indragiri

Hulu 69,77 12,32 8,16 433,93 208,558 10,481

Indragiri

Hilir 67,32 11,89 7,19 731,40 330,363 10,254

Pelalawan 70,74 12,16 8,44 460,78 219,362 11,894

Siak 70,79 12,73 9,64 477,67 214,41 12,119

Kampar 70,35 13,21 9,10 851,54 372,775 11,128

Rokan Hulu 69,55 12,82 8,37 666,41 293,214 9,608 Bengkalis 70,85 12,83 9,21 566,23 259,127 11,64 Rokan Hilir 69,87 12,63 8,15 697,22 295,682 9,316

Kep.

Meranti 67,21 12,78 7,48 184,37 91,058 7,978

Pekanbaru 71,94 15,34 11,22 1117,36 539,831 14,778 Kota Dumai 70,55 12,98 9,84 303,29 136,112 12,063 Data Hasil Praproses

Data hasil praproses, terdiri dari 12 buah data sampel, serta terdiri dari enam buah atribut yang akan diklasterisasikan, yaitu Umur Harapan Hidup, Jumlah Penduduk,

(4)

Pengeluaran perKapita, Rata-rata Lama Sekolah, Angkatan Kerja, dan Harapan Lama Sekolah

Tabel 2. Data Hasil Praproses Nama

Kabupaten

Umur Harapan

Hidup

Harapan Lama Sekolah

Rata- rata Lama Sekolah

Jumlah Penduduk

Angkatan Kerja

Pengeluaran Perkapita Kuantan

Singingi 68,17 13,27 8,31 324,41 147,906 10,476 Indragiri

Hulu 69,77 12,32 8,16 433,93 208,558 10,481

Indragiri

Hilir 67,32 11,89 7,19 731,40 330,363 10,254

Pelalawan 70,74 12,16 8,44 460,78 219,362 11,894

Siak 70,79 12,73 9,64 477,67 214,41 12,119

Kampar 70,35 13,21 9,10 851,54 372,775 11,128

Rokan Hulu 69,55 12,82 8,37 666,41 293,214 9,608 Bengkalis 70,85 12,83 9,21 566,23 259,127 11,64 Rokan Hilir 69,87 12,63 8,15 697,22 295,682 9,316

Kep.

Meranti 67,21 12,78 7,48 184,37 91,058 7,978

Pekanbaru 71,94 15,34 11,22 1117,36 539,831 14,778 Kota Dumai 70,55 12,98 9,84 303,29 136,112 12,063 c. Analisa Pengelompokan Data

Pada penelitian ini akan di lakukan pengklasteran sebanyak tiga buah klaster, yakni Menengah, Mampu, dan Tidak Mampu. Jadi pada penelitian ini akan dibentuk sebanyak tiga kelompok atan nilai k=3. Selain itu akan digunakan enam buah atribut, yakni Umur Harapan Hidup, Jumlah Penduduk, Pengeluaran perKapita, Rata-rata Lama Sekolah, Angkatan Kerja, serta Harapan Lama Sekolah.

2.2 K-means Clustering

K-means Clustering adalah analisis kelompok non hirarki yang paling banyak di gunakan. Berikut langkah dalam metode K-means:

a. Menentukan titik pusat secara acak.

b. Hitunglah jarak setiap dengan setiap titik pusat menggunakan rumus Euclidian Distance.

c. Menentukan keseluruhan objek ke klaster terdekat.

d. Kembali menghitung pusat klaster berdasarkan anggota klaster yang baru.

e. Menugaskan setiap objek agar menggunakan pusat klaster yang baru.

2.3 Euclidian Distance

Penulis menggunakan rumus Euclidean Distance sebagai cara menghitung setiap jarak data yang ada pada pusat klaster.

Gambar 2. Rumus Euclidean Distance

(5)

3. HASIL DAN PEMBAHASAN 3.1 Perhitungan Manual

Tahapan ini melakukan proses utama yakni mengelompokan data tingkat mengggunakan metode algoritma K-means. Atribut per Provinsi Riau digunakan dalam proses analisa klastering algoritma K-means dan menghitung secara manual menggunakan aturan K-means yang sudah di tetapkan. Percobaan dilakukan menggunakan ukuran-ukuran di bawah ini :

a. Jumlah klaster: 3 b. Jumlah data : 12 c. Jumlah variabel : 6 Iterasi Pertama

1. Menentukan Pusat Cluster Awal

Tentukan centroid awal secara acak dari obyek yang tersedia sejumlah klaster k. Nilai untuk C1 di ambil dari baris PCDK12, C2 di ambil dari baris PCDK6, C3 di ambil dari baris data PCDK11. Di bawah ini merupakan nilai Centroid awal penelitian, C adalah Cluster:

C1 = (70,35 ; 13,21 ; 9,10 ; 851,84 ; 372,775 ; 11,128) C2 = (70,55 ; 12,98 ; 9,84 ; 303,29 ; 136,112 ; 12,063) C3 = (71,94 ; 15,34 ; 11,22 ; 1117,36 ; 539,831 ; 14.778)

2. Menghitung Jarak dengan Pusat Cluster

Proses menghitung jarak dengan Euclidean Distance untuk Iterasi satu dan Centroid satu :

           

           

           

           

           

70,55 70,35 12,98 13,21 9,84 9,1 303,29 851,84 136,112 372,775 12,063 11,128597,426

K12 ...

305 , 406 128 , 11 119 , 12 775 , 372 41 , 214 84 , 851 67 , 477 1 , 9 64 , 9 21 , 13 73 , 12 35 , 70 79 , 70 05

078 , 420 128 , 11 894 , 11 775 , 372 363 , 219 84 , 851 78 , 460 1 , 9 44 , 8 21 , 13 16 , 12 35 , 70 74 , 70 04

749 , 127 128 , 11 254 , 10 775 , 372 363 , 330 84 , 851 40 , 731 1 , 9 19 , 7 21 , 13 89 , 11 35 , 70 32 , 67 03

019 , 449 128 , 11 481 , 10 775 , 372 558 , 208 84 , 851 93 , 433 1 , 9 16 , 8 21 , 13 32 , 12 35 , 70 97 , 69 02

370 , 573 128 , 11 476 , 10 775 , 372 906 , 147 84 , 851 41 , 324 1 , 9 31 , 8 21 , 13 27 , 13 35 , 70 17 , 68 01

2 2

2 2

2 2

2 2

2 2

2 2

2 2

2 2

2 2

2 2

2 2

2 2

2 2

2 2

2 2

2 2

2 2

2 2

K K K K K

Setelah menghitung jarak dengan Euclidean Distance untuk Iterasi satu dan Centroid satu dilakukan, maka tahapan selanjutnya melakukan perhitungan dengan Centroid dua, dan tiga dengan rumus yang sama dengan perhitungan diatas.

3. Pengelompokan Data

Alokasikan masing-masing data ke Centroid terdekat. Mengalokasikan data ke masing- masing klaster di dasarkan perbandingan jarak antar data dan Centroid di tiap kluser yang ada, alokasikan data dengan tegas dalam klaster yang memiliki jarak terdekat ke Centroid dengan data tersebut.

Tabel 3. Hasil Perhitungan Iterasi Satu

Kode C1 C2 C3 C1 C2 C3

PCDK1 573,370 24,408 884,545 ᄆᄆ

PCDK2 449,019 149,403 759,512 ᄆᄆ

PCDK3 127,749 470,142 439,217 ᄆ

PCDK4 420,078 178,147 730,633 ᄆᄆ

PCDK5 406,305 191,152 717,718 ᄆᄆ

(6)

Kode C1 C2 C3 C1 C2 C3

PCDK6 0 597,426 313,740 ᄆ

PCDK7 201,786 395,659 514,026 ᄆ

PCDK8 307,391 290,294 618,514 ᄆᄆ

PCDK9 172,787 425,034 485,980 ᄆ

PCDK10 724,502 127,299 1035,353 ᄆᄆ

PCDK11 313,741 908,689 0 ᄆᄆᄆ

PCDK12 597,426 0 908,689 ᄆᄆ

Iterasi Kedua

1. Penentuan Pusat Cluster Baru

Menghitung nilai rataan dari rata-rata pada Centroid yang sama adalah cara menentukan Centroid baru.

Gambar 3. Menentukan Centroid Baru

 

 

71,94;15,34;11,22;1117,36;539,831 14,778

1 ;

778 , 14 831 , 539 36 , 1117 22 , 11 34 , 15 94 , 3 71

950 , 10

; 361 , 182

; 954 , 392

; 72 , 8

; 72 , 12

; 75 , 69

7 ;

063 , 12 978 , 7 64 , 11 119 , 12 894 , 11 481 , 10 476 , 10

7 ;

112 , 136 058 , 91 127 , 259 41 , 214 362 , 219 558 , 208 906 , 147

7 ;

29 , 303 37 , 184 23 , 566 67 , 477 78 , 460 93 , 433 41 , 324

7 ;

84 , 9 48 , 7 21 , 9 64 , 9 44 , 8 16 , 8 31 , 8

7 ;

98 , 12 78 , 12 83 , 12 73 , 12 16 , 12 32 , 12 27 , 13

7 ;

55 , 70 21 , 67 85 , 70 79 , 70 74 , 70 97 , 69 17 , 68

2

076 , 10

; 008 , 323

; 717 , 736

; 20 , 8

; 63 , 12

; 27 , 69 4 ;

316 , 9 608 , 9 128 , 11 254 ,

;10 4

682 , 295 214 , 293 775 , 372 363 , 330

4 ;

22 , 697 41 , 666 84 , 851 4 ,

;731 4

15 , 8 37 , 8 1 , 9 19 , 7

4 ;

63 , 12 82 , 12 21 , 13 89 ,

;11 4

87 , 69 55 , 69 35 , 70 32 , 67

1

C C C

2. Menghitung Jarak dengan Pusat Cluster yang Baru

Begitu mengetahui perhitungan dari pusat Cluster baru, lakukan perhitungan jarak dari masing-masing data pada pusat Cluster menggunakan Euclidean Distance. Di bawah ini adalah menghitung jarak dengan Euclidean Distance untuk Iterasi dua dan Centroid satu (pusat Cluster baru) :

(7)

           

           

           

           

           

70,55 69,27

 

12,98 12,63

 

9,84 8,20

 

303,29 736,717

 

136,112 323,008

 

12,063 10,076

472,014 12

...

905 , 280 076 , 10 119 , 12 008 , 323 41 , 214 717 , 736 67 , 477 20 , 8 64 , 9 63 , 12 73 , 12 27 , 69 79 , 70 05

770 , 294 076 , 10 894 , 11 008 , 323 363 , 219 717 , 736 78 , 460 20 , 8 44 , 8 63 , 12 16 , 12 27 , 69 74 , 70 04

369 , 9 076 , 10 254 , 10 008 , 323 363 , 330 717 , 736 40 , 731 20 , 8 19 , 7 63 , 12 89 , 11 27 , 69 32 , 67 03

697 , 323 076 , 10 481 , 10 008 , 323 558 , 208 717 , 736 93 , 433 20 , 8 16 , 8 63 , 12 32 , 12 27 , 69 97 , 69 02

951 , 477 076 , 10 476 , 10 008 , 323 906 , 147 717 , 736 41 , 324 20 , 8 31 , 8 63 , 12 27 , 13 27 , 69 17 , 68 01

2 2

2 2

2 2

2 2

2 2

2 2

2 2

2 2

2 2

2 2

2 2

2 2

2 2

2 2

2 2

2 2

2 2

2 2

K K K K K K

Setelah menghitung jarak dengan Euclidean Distance untuk Iterasi dua dan Centroid satu (pusat Cluster baru) dilakukan, maka tahapan selanjutnya melakukan perhitungan dengan Centroid dua dan tiga dengan rumus yang sama dengan perhitungan diatas.

3. Pengelompokan Data

Setelah diketahui jarak dari masing-masing data terhadap pusat Cluster menggunakan Euclidean Distance, maka tahap selanjutnya adalah melakukan pengelompokan data tersebut, dimana Cluster dengan jarak terdekat diberi nilai (I,II,III), sedangkan untuk jarak yang jauh dikosongkan. Berikut hasil pengelompokan data untuk Iterasi dua :

Tabel 4. Hasil Pengelompokan Data Iterasi Dua

Kode C1 C2 C3 C1 C2 C3

PCDK1 447,951 76,738 884,545 ᄆᄆ

PCDK2 323,697 48,641 759,512 ᄆᄆ

Kode C1 C2 C3 C1 C2 C3

PCDK3 9,369 369,403 439,217 ᄆ

PCDK4 294,770 77,276 730,633 ᄆᄆ

PCDK5 280,905 90,593 717,718 ᄆᄆ

PCDK6 125,432 496,823 313,741 ᄆ

PCDK7 76,362 295,073 514,026 ᄆ

PCDK8 182,079 189,523 618,514 ᄆ

PCDK9 48,038 324,687 485,980 ᄆ

PCDK10 599,080 227,729 1035,353 ᄆᄆ

PCDK11 438,116 807,824 0 ᄆᄆᄆ

PCDK12 472,014 100,905 908,689 ᄆ

4. Perbandingan Hasil Pengelompokan Iterasi

Sedangkan berikut tabel perbandingan hasil perhitungan Iterasi ke Satu dan ke Dua :

Tabel 5. Hasil Perhitungan Iterasi Satu dan Dua Iterasi ke-Satu Kode Iterasi ke-Dua

C1 C2 C3 C1 C2 C3

ᄆᄆ PCDK1 ᄆᄆ

(8)

C1 C2 C3 C1 C2 C3

ᄆᄆ PCDK2 ᄆᄆ

ᄆ PCDK3 ᄆ

ᄆᄆ PCDK4 ᄆᄆ

ᄆᄆ PCDK5 ᄆᄆ

ᄆ PCDK6 ᄆ

ᄆ PCDK7 ᄆ

ᄆᄆ PCDK8 ᄆ

ᄆ PCDK9 ᄆ

ᄆᄆ PCDK10 ᄆᄆ

ᄆᄆᄆ PCDK11 ᄆᄆᄆ

ᄆᄆ PCDK12 ᄆᄆ

Karena di Iterasi dua posisi klaster masih terjadi perubahan atau posisi tidak sama dengan posisi klaster pada Iterasi satu maka proses berlanjut ke Iterasi selanjutnya.

Iterasi ke-Tiga

Proses pada Iterasi ke-tiga dan seterusnya melalui tahapan yang sama dengan Iterasi ke-dua, mulai dari penentuan pusat Cluster baru, serta menghitung jarak dengan pusat Cluster yang baru. Yang berbeda adalah hasil dari pengelompokkan data.

1. Pengelompokkan Data

Tabel 6. Hasil Pengelompokan Data Iterasi Tiga

Kode C1 C2 C3 C1 C2 C3

PCDK1 411,576 45,222 884,545 ᄆᄆ

PCDK2 287,284 80,003 759,512 ᄆᄆ

Kode C1 C2 C3 C1 C2 C3

PCDK3 35,224 400,987 439,217 ᄆ

PCDK4 258,356 108,784 730,633 ᄆᄆ

PCDK5 244,520 122,142 717,718 ᄆᄆ

PCDK6 161,802 528,402 313,740 ᄆ

PCDK7 40,017 326,644 514,026 ᄆ

PCDK8 145,663 211,111 618,514 ᄆ

PCDK9 15,561 356,220 485,980 ᄆ

PCDK10 562,701 196,144 1035,353 ᄆᄆ

PCDK11 474,093 839,385 0 ᄆᄆᄆ

PCDK12 435,646 69,412 908,689 ᄆᄆ

(9)

2. Perbandingan Hasil Pengelompokan Iterasi

Sedangkan berikut tabel perbandingan hasil pengelompokan data Iterasi ke-Dua dan Iterasi ke-Tiga :

Tabel 7. Hasil Pengelompokan Data Iterasi Dua dan Iterasi Tiga Iterasi ke-Dua Kode Iterasi ke-Tiga

C1 C2 C3 C1 C2 C3

ᄆᄆ PCDK1 ᄆᄆ

ᄆᄆ PCDK2 ᄆᄆ

ᄆ PCDK3 ᄆ

ᄆᄆ PCDK4 ᄆᄆ

ᄆᄆ PCDK5 ᄆᄆ

ᄆ PCDK6 ᄆ

ᄆ PCDK7 ᄆ

ᄆ PCDK8 ᄆ

ᄆ PCDK9 ᄆ

ᄆᄆ PCDK10 ᄆᄆ

ᄆᄆᄆ PCDK11 ᄆᄆᄆ

ᄆᄆ PCDK12 ᄆᄆ

Pada tahap ini, posisi klaster Iterasi tiga tidak berubah dan sama seperti posisi pada Iterasi dua, maka proses Iterasi tidak perlu di lanjutkan. Jadi kesimpulannya proses Iterasi akan di hentikan di Iterasi tiga dengan nilai :

a. Anggota Cluster 1 : {PCDK3, PCDK6, PCDK7, PCDK8, PCDK9}= 5 data

b. Anggota Cluster 2 : { PCDK1, PCDK2, PCDK4, PCDK5, PCDK10, PCDK12} = 6 data c. Anggota Cluster 3 (C3) : { PCDK11} = 1 data

Berdasarkan proses pengelompokan di atas, maka di hasilkan pengelompokan pengelompokan daerah miskin di Provinsi Riau berdasarkan setiap atribut yang ada. Nilai atau hasil penelitian di uraikan menjadi tiga bagian, yakni :

1. Klaster Satu

Berdasarkan tabel di bawah, dapat di lihat jika atribut klaster satu yang mempunyai hasil rata-rata Umur Harapan Hidup 69,58, Angkatan Kerja 310,232, dan Jumlah Penduduknya 702,62 memiliki nilai yang lebih dominan dibandingkan dengan klaster dua yang memiliki Umur Harapan Hidup 69,57, Angkatan Kerja 169,567, dengan Jumlah Penduduk 364,075.

Dan jika semua nilai atribut dihitung, maka nilai rata-rata klaster satu lebih dominan di bandingkan klaster dua. Adapun anggota dari klaster satu adalah sebanyak lima anggota klaster, yaitu Rokan Hilir, Bengkalis, Rokan Hulu, Kampar, dan Indragiri Hilir.

2. Klaster Dua

Klaster dua memiliki nilai rata-rata atribut Pengeluaran Perkapita sebesar 10,835, Rata- rata Lama Sekolah sebesar 8,64, dan Harapan Lama Sekolah sebesar 12,7, nilai-nilai ini lebih dominan daripada Pengeluaran Perkapita, Rata-rata Lama Sekolah, dan Harapan Lama Sekolah , dan yang ada pada klaster satu. Klaster dua merupakan klaster dengan nilai yang lebih rendah dari pada klaster satu dan klaster tiga. Klaster dua memiliki enam anggota klaster, yaitu Kuantan Singingi, Indragiri Hulu, Pelalawan, Siak, Kepulauan Meranti, dan Kota Dumai.

(10)

3. Klaster Tiga

Sedangkan untuk klaster tiga, mempunyai hasil yang tinggi di setiap atributnya dari pada nilai di klaster satu dan dua. Dan mempunyai nilai rataan yang jauh di atas klaster satu dan klaster dua. Klaster tiga hanya memiliki satu anggota klaster saja, yaitu Kota Pekanbaru.

3.2 Perhitungan Menggunakan Rapid Miner 1. Konfigurasi Rapid Miner

Hubungkan Data yang kita miliki dengan metode Clustering dan sambungkan pada garis Res dan Clu, agar aplikasi dapat memulai perhitungan.

Gambar 4. Menyambungkan garis Res dan Clu 2. Hasil dari perhitungan

Gambar 5. Hasil Perhitungan

Gambar 6. Hasil Perhitungan (1)

(11)

3.3 Perbandingan antara Perhitungan Manual dan Software

Tabel 8. Perbandingan Perhitungan Manual dan Software Perhitungan Manual Software RapidMiner Cluster Anggota Kelompok Jumlah

Anggota Cluster Anggota Kelompok Jumlah Anggota 1 PCDK3, PCDK6, PCDK7,

PCDK8, PCDK9 6 0

PCDK3, PCDK6, PCDK7, PCDK8,

PCDK9 6

2

PCDK1, PCDK2, PCDK4, PCDK5, PCDK10,

PCDK12 5 1

PCDK1, PCDK2, PCDK4, PCDK5,

PCDK10, PCDK12 5

3 PCDK11 1 2 PCDK11 1

4. KESIMPULAN

Adapun kesimpulan yang bisa di ambil dari penelitian Clustering Pengelompokan Daerah Miskin di Provinsi Riau Menggunakan Metode K-means, yakni :

1. Berdasarkan hasil dari perhitungan manual dan juga pengujian dengan perangkat lunak RapidMiner, menunjukkan bahwa hasil pengujian bernilai sama. Yang artinya hasil pengujian bernilai sangat baik, sehingga dapat dijadikan sebagai referensi atau sebagai salah satu bahan pertimbangan bagi pemerintah untuk menyalurkan bantuan ataupun program-program bantuan pemerintah lainnya.

2. Berdasarkan pengelompokan 12 Kabupaten di Provinsi Riau, dapat dibentuk tiga buah Cluster. Cluster pertama termasuk dalam wilayah menengah, yang terdiri dari lima Kabupaten/kota, yakni : Rokan Hilir, Bengkalis, Rokan Hulu, Kampar, dan Indragiri Hilir. Sedangkan untuk Cluster kedua termasuk dalam wilayah kurang mampu, yang terdiri dari enam Kabupaten/kota, yakni : Siak, Pelalawan, Indragiri Hulu, Kuantan Singingi, Kep.Meranti, dan Kota Dumai. Lalu untuk Cluster Tiga termasuk dalam wilayah mampu, dan terdiri dari satu anggota saja, yakni : Kota Pekanbaru.

3. Dari hasil perhitungan rata-rata menunjukkan bahwa, Cluster Tiga dan Cluster Satu lebih dominan dibandingkan dengan Cluster Dua.Yang artinya, Cluster Dua seharusnya lebih di prioritaskan oleh pemerintah dalam pemberian bantuan atau program- program pemerintah lainnya dibandingkan dengan Cluster Tiga dan Juga Cluster Satu.

DAFTAR PUSTAKA

[1] Dita Prima Tri Hapsari, Edy Widodo, “Pengelompokan Daerah Rawan Kriminalitas di Indonesia Menggunakan Analisis K-means Clustering” Yogyakarta, Vol 1 No.1, 149, 2017.

[2] C.T.I., B. R., Gafar, A. A., Fajriani, N., Ramdanif, U., Uyun, F. R., P, Y. P., & Ransi, N,

“Implemetasi K-means Clustering pada rapidminer untuk analisis daerah rawan kecelakaan” Seminar Nasional Riset Kuantitatif Terapan 2017, April, 58–60, 2017.

[3] Retno Tri Vulandari. “Data Mining (Teori dan Aplikasi RapidMiner)” Surakarta, Gava Media, 53, 2017.

[4] Badan Pusat Statistik Provinsi DIY, “Berita Resmi Statistik” DIY.Bps.Go.Id, 27, 1–16.

https://jakarta.bps.go.id/pressrelease/2019/11/01/375/tingkat-penghunian-kamar- -tpk--hotel--berbintang-dki-jakarta-pada-bulan-september-2019-mencapai-58-97- persen.html,2018.

[5] Priambodo, Y. A., & Prasetyo, S. Y. J, “Pemetaan Penyebaran Guru di Provinsi Banten

(12)

dengan Menggunakan Metode Spatial Clustering K-means (Studi kasus : Wilayah Provinsi Banten)” Indonesian Journal of Computing and Modeling, 1(1), 18–27, 2018.

https://doi.org/10.24246/j.icm.2018.v1.i1.p18-27

[6] Sormartini, Supartini Enny, “Analisis K-means Untuk Pengelompokan Kabupaten/kota di Jawa Barat Berdasarkan Indikator Masyarakat” Bandung, 146, 2017.

[7] Yohanes Aji Priambodo, Sri Yulianto Joko Prasetyo, “Pemetaan Penyebaran Guru di Provinsi Banten dengan Menggunakan Metoded Spatial Clustering K-means” Salatiga, e-ISSN : 2598-9421, 2018.

[8] Fitri Larasati Sibuea, Andy Sapta, “Pemetaan Siswa Berprestasi Menggunakan Metode K-means Clustering” Vol IV, No.1, http://jurnal.stmikroyal.ac.id/index/php/jurteksi, 2017.

[9] Aldi Nurzahputra, Much Aziz Muslim, Miranita Khusniati, “Penerapan Algoritma K- means untuk Clustering Penilaian Dosen Berdasarkan Indeks Kepuasan Mahasiwa”

Semarang, Vol. 16 No.1, 2017.

[10] Siti Syahidatul Helma, Mustakim, Risma Rustiyan R, Eva Normala, “Clustering Pada Data Pelayanan Kesehatan Kota Pekanbaru Menggunakan Algoritma K-means”

Pekanbaru, 133, 2017.

[11] S., Ramadhani. I., Ambarita. A.M.H., Pardede, “Metode K-means untuk Pengelompokan Masyarakat Miskin Dengan Menggunakan Jarak Kedekatan Manhattan City dan Euclidian (Studi Kasus Kota Binjai.)” Binjai, Vol 4, No.2 Juli 2019.

[12] Eric Fammaido, Lukman Hakim, “Penerapan Algoritma K-means Clustering untuk Pengelompokan Tingkat Kesejahteraan Keluarga Untuk Program Kartu Indonesia Pintar” Jakarta. ISSN : 2407-3911, Vol V, No. 1. 15 Desember 2018.

[13] Fitra Ramdhani, Abdul Hoyyi, Moch. Abdul Mukid, “Pengelompokan Provinsi di Indonesia Berdasarkan Karakteristik Kesejahteraan Rakyat Menggunakan Metode K- means Cluster Jurnal Gaussian” Vol 4, No.4, 876, 2015.

Prosiding- SEMASTER: Seminar Nasional Teknologi Informasi & Ilmu Komputer is licensed under a Creative Commons Attribution International (CC BY- SA 4.0)

Referensi

Dokumen terkait

Jenis data yang digunakan dalam penelitian ini adalah data sekunder deret waktu (time series data) yang diperoleh dari Badan Pusat Statistik Kabupaten