• Tidak ada hasil yang ditemukan

View of Implementasi K-Means Clustering Dalam Pengelompokkan Banyaknya Jumlah Petani Berdasarkan Kecamatan di Provinsi Jawa Barat

N/A
N/A
Protected

Academic year: 2024

Membagikan "View of Implementasi K-Means Clustering Dalam Pengelompokkan Banyaknya Jumlah Petani Berdasarkan Kecamatan di Provinsi Jawa Barat"

Copied!
14
0
0

Teks penuh

(1)

Jurnal Teknik Informatika dan Sistem Informasi ISSN 2407-4322

Vol. 10, No. 3, September 2023, Hal. 131-144 E- ISSN 2503-2933 131

th th

Implementasi K-Means Clustering Dalam Pengelompokkan Banyaknya Jumlah Petani Berdasarkan Kecamatan Di Provinsi Jawa Barat

Muhammad Yamin Nurzaman1, Betha Nurina Sari2

1,2Teknik Informatika, Universitas Singaperbanga Karawang

e-mail: 11910631170108@student.unsika.ac.id, 2betha.nurina@staff.unsika.ac.id ,

Abstrak

Sektor pertanian memiliki peran penting di Provinsi Jawa Barat. Provinsi ini memiliki luas lahan pertanian yang besar, sehingga memiliki potensi yang tinggi untuk menghasilkan produksi pertanian yang melimpah. Namun, untuk mengetahui jumlah para petani yang memadai sangat penting. Oleh karena itu, implementasi K-Means Clustering dapat memberikan kontribusi yang signifikan bagi Dinas Pertanian Provinsi Jawa Barat dalam mengelompokkan petani berdasarkan kecamatan. Untuk mencapai hasil yang optimal, penentuan nilai K yang terbaik perlu diperhatikan secara cermat. Pada penelitian ini hasil Evaluasi menggunakan silhouette coefficient score menunjukkan bahwa cluster dengan nilai 0.7374355377121188 adalah yang terbaik. Sehingga, K-Means Clustering berhasil diimplementasikan dalam mengelompokkan jumlah populasi petani secara optimal berdasarkan kecamatan di Provinsi Jawa Barat.

Kata kunci : K-Means Clustering, Petani, Silhouette Coefficient.

Abstract

The agricultural sector has an important role in West Java Province. This province has a large agricultural land area, so it has a high potential to produce abundant agricultural production. However, to know the adequate number of farmers is very important. Therefore, the implementation of K-Means Clustering can make a significant contribution to the West Java Provincial Agriculture Office in grouping farmers based on sub-districts. To achieve optimal results, the determination of the best K value needs to be considered carefully. In this study the evaluation results using the silhouette coefficient score showed that the cluster with a value of 0.7374355377121188 was the best. Thus, K-Means Clustering was successfully implemented in optimally grouping the total population of farmers based on sub-districts in West Java Province

Keywords : K-Means Clustering, Farmer, Silhouette Coefficient.

1. PENDAHULUAN

Pentingnya sektor pertanian di Indonesia dapat dilihat dari beberapa aspek yang relevan.

Pertama, sektor ini berperan sebagai sumber penghasil devisa yang signifikan bagi negara.

Selain itu, Sektor pertanian memiliki peran penting sebagai mata pencaharian utama bagi sebagian besar penduduk Indonesia. Dilihat dari segi jumlah tenaga kerja, sektor pertanian merupakan sektor yang paling banyak menyerap tenaga kerja. dengan mayoritas pekerja tidak memiliki pendidikan formal, keterampilan yang terbatas, dan pendapatan yang tidak merata [1].

Pertanian memegang peranan yang krusial dalam kelangsungan hidup manusia karena menjadi

(2)

132 Jatisi ISSN 2407-4322 Vol. 10, No. 3, September 2023, Hal. 133-144 E-ISSN 2503-2933

Muhammad Yamin Nurzaman, et., al [Implementasi K-Means Clustering Dalam Pengelompokkan Banyaknya Jumlah Petani Berdasarkan Kecamatan di Provinsi Jawa Barat]

sumber makanan yang sangat penting bagi keberlanjutan kehidupan manusia. Oleh karena itu, diperlukan adanya para petani yang dapat mengelola lahan pertanian dengan baik sehingga dapat menghasilkan produksi pertanian yang optimal. Pertanian merupakan sektor yang sangat penting dalam menopang kelangsungan hidup manusia, karena pertanian merupakan sumber utama makanan bagi keberlangsungan hidup manusia. Petani dihadapkan pada perubahan lingkungan strategis di tingkat nasional, terutama terkait dengan permintaan pangan dan bahan baku yang terus berubah, serta tantangan signifikan seperti liberalisasi perdagangan internasional dan kehadiran Masyarakat Ekonomi Asia (MEA)[2].

Berdasarkan data yang dirilis oleh Badan Pusat Statistik (BPS), sektor pertanian memiliki kontribusi terbesar terhadap Produk Domestik Bruto (PDB) Indonesia, yaitu sebesar 13,65% pada tahun 2020. Peran penting petani juga terlihat dalam menjaga kualitas makanan yang dihasilkan untuk memenuhi kebutuhan makanan manusia. Menurut data BPS, produksi hortikultura di Indonesia pada tahun 2020 mencapai 39,17 juta ton, dengan komoditas hortikultura terbesar adalah sayuran dengan produksi sebesar 12,97 juta ton. Di Provinsi Jawa Barat, sektor pertanian memiliki kepentingan yang signifikan. Jawa Barat memiliki lahan pertanian yang luas, sehingga memiliki potensi besar untuk menghasilkan produksi pertanian yang tinggi. Namun, pengelolaan lahan pertanian yang efektif membutuhkan peran penting dan jumlah ketersediaan para petani.

Oleh karena itu, penelitian clustering banyaknya jumlah petani berdasarkan kecamatan di Provinsi Jawa Barat sangat penting untuk dilakukan. Penelitian ini dapat membantu dalam mengetahui jumlah petani yang ada di setiap kecamatan di Provinsi Jawa Barat, serta dapat mengidentifikasi kecamatan yang memiliki jumlah petani yang relatif sedikit atau banyak.

Dengan demikian, dapat diambil langkah-langkah yang sesuai untuk meningkatkan jumlah petani di kecamatan yang memiliki jumlah petani yang tergolong rendah. Penurunan sektor pertanian juga berpotensi mempengaruhi ketahanan pangan di masa depan di Indonesia, terutama karena penurunan jumlah orang yang terlibat dalam profesi petani. Di era millenial saat ini, minat generasi muda terhadap bidang pertanian kurang signifikan [3].

Selain itu, penelitian ini juga dapat menyediakan data statistik yang dapat menjadi landasan dalam pengambilan kebijakan yang tepat terkait pengembangan pertanian di Provinsi Jawa Barat. Dengan demikian, penelitian ini menjadi salah satu upaya untuk memastikan kemajuan sektor pertanian di Provinsi Jawa Barat, sehingga dapat mencapai produksi pertanian yang optimal.

2. KAJIAN PUSTAKA

2.1 Data Mining

Data mining merupakan proses pengambilan informasi dari dataset dengan menggunakan teknik dan algoritma khusus yang memiliki dampak luas pada berbagai disiplin ilmu, termasuk di antaranya basis data, statistika, pembelajaran mesin, dan kecerdasan buatan [4]. Data mining juga dapat didefinisikan sebagai sebuah proses mencari pengetahuan pada database menggunakan beberapa metode seperti clustering, asosiasi, klasifikasi, dan lain sebagainya [5].

2.2 Clustering

Clustering merupakan suatu proses di mana data dikelompokkan ke dalam berbagai kelompok yang berbeda, dengan tujuan agar objek-objek serupa tergabung dalam satu kelompok atau cluster, sedangkan objek-objek yang berbeda ditempatkan dalam kelompok yang berbeda pula. Setiap cluster berisi data yang memiliki kesamaan sebanyak mungkin [6]. Clustering

(3)

Jatisi ISSN 2407-4322

Vol. 10, No. 3, September 2023, Hal. 133-144 E- ISSN 2503-2933 133

Muhammad Yamin Nurzaman, et., al [Implementasi K-Means Clustering Dalam Pengelompokkan Banyaknya Jumlah Petani Berdasarkan Kecamatan di Provinsi Jawa Barat]

merupakan salah satu metode analisis data yang digunakan untuk mengelompokkan data menjadi beberapa kelompok (cluster) berdasarkan kesamaan fitur atau atribut yang dimiliki oleh setiap data.

2.3 Algoritma K-Means

Algoritma K-Means adalah suatu teknik clustering yang menggunakan perhitungan jarak untuk mengelompokkan data ke dalam beberapa cluster. Metode ini hanya dapat digunakan pada atribut yang bersifat angka atau numerik [7]. Algoritma ini mampu meminimalkan jarak antara data ke clusternya [8]. Berikut adalah langkah algoritma K-Means [9]:

1. Pilihlah nilai k sebagai jumlah cluster yang akan terbentuk.

2. Atur posisi awal pusat(centroid) dari setiap cluster.

Atau yang langkah yang lebih detailnya adalah sebagai berikut [10]:

1. Menentukan banyaknya cluster yang dibentuk.

2. Menentukan pusat (centroid) secara random sebanyak jumlah cluster.

3. Hitung jarak terhadap centroid menggunakan euclidean distance. Berikut adalah rumus euclidean distance :

J( , ) = ()

Keterangan :

J(ai, bi) : Jarak antara nilai data dan pusat (centroid) dari suatu objek ai : data awal dari dimensi

bi : centroid dari dimensi

n : Jumlah dimensi atau atribut data yang ada

4. Menggabungkan data berdasarkan jarak terpendek dengan centroid.

5. Tentukan nilai pusat baru dengan rumus berikut.

Wk =

Keterangan :

nk : jumlah data pada cluster

ji : jumlah nilai distance yang masuk ke setiap cluster

6. Ulangilah langkah ke-3 sampai ke-5 hingga keanggotaan setiap cluster tetap

Metode K-Means dipilih karena metode ini membutuhkan data fisik yang konkret dan jelas, yang sesuai dengan data yang akan digunakan dalam masalah pengelompokan kelas unggulan di sekolah dengan menggunakan nilai rapor siswa sebagai data acuan. Selain itu, metode ini bersifat fleksibel karena pengguna dapat menentukan jumlah cluster yang akan dibentuk [11].

2.4 Python

Python merupakan sebuah bahasa pemrograman yang memiliki tingkat kesulitan yang tinggi, bersifat dinamis, interpretatif, serta memiliki kemampuan yang sangat bermanfaat dalam berbagai keperluan. Python juga termasuk bahasa pemrograman yang dapat dengan mudah dipelajari dan digunakan. Selain itu, Python juga sangat fleksibel untuk berbagai macam keperluan pemrograman. Dengan Python, Anda dapat membuat aplikasi desktop, web, dan mobile yang beragam. Python juga populer digunakan untuk melakukan data science, machine learning, dan berbagai macam analisis data lainnya.

(4)

134 Jatisi ISSN 2407-4322 Vol. 10, No. 3, September 2023, Hal. 133-144 E-ISSN 2503-2933

Muhammad Yamin Nurzaman, et., al [Implementasi K-Means Clustering Dalam Pengelompokkan Banyaknya Jumlah Petani Berdasarkan Kecamatan di Provinsi Jawa Barat]

2.5 CRISP-DM

CRISP-DM (Cross-Industry Standard Process for Data Mining) adalah suatu metodologi yang digunakan untuk mengatur proyek data mining atau analisis data. definisi dari Metode Metode CRISP-DM (Cross Industry Standard Process for Data Mining) secara luas digunakan oleh para pakar untuk melakukan pemodelan data. Tujuan utamanya adalah untuk menemukan pola-pola yang signifikan dan memiliki makna dalam data yang digunakan [4].

CRISP-DM terdiri dari enam tahap, yaitu:

1. Business Understanding: langkah ini bertujuan untuk memperoleh pemahaman tentang tujuan dan kebutuhan bisnis, serta untuk menentukan apakah proyek tersebut layak untuk dilakukan atau tidak.

2. Data Understanding: tahap ini bertujuan untuk memahami karakteristik data yang akan digunakan dalam proyek, serta untuk mengidentifikasi data yang kurang bermanfaat atau tidak sesuai dengan tujuan proyek.

3. Data Preparation: tahap ini bertujuan untuk membersihkan dan menyiapkan data agar sesuai dengan kebutuhan analisis yang akan dilakukan.

4. Modeling: tahap ini bertujuan untuk membangun model analisis yang akan digunakan untuk mengekstrak informasi dari data.

5. Evaluation: tahap ini bertujuan untuk mengevaluasi model yang telah dibangun, serta untuk menentukan apakah model tersebut dapat digunakan atau tidak.

6. Deployment: tahap ini bertujuan untuk menyajikan hasil analisis kepada pihak yang berkepentingan, serta untuk mengimplementasikan model yang telah disetujui ke dalam sistem atau proses bisnis.

2.6 Elbow Method

Metode K-Elbow adalah salah satu teknik yang sering digunakan untuk mengidentifikasi jumlah optimal dari kelompok dalam dataset yang akan dikelompokkan. Jika terdapat nilai yang menunjukkan sebuah sudut pada grafik atau penurunan paling signifikan dalam nilai, maka itu menunjukkan jumlah kelompok yang optimal atau terbaik [12]. Elbow method menggunakan prinsip bahwa semakin kecil nilai SSE, maka semakin baik pengelompokan data tersebut. Namun, pada suatu titik tertentu, nilai SSE akan mulai mengalami peningkatan yang cukup signifikan. Titik ini disebut sebagai "elbow point" atau

"titik siku". Titik ini merupakan titik dimana peningkatan jumlah cluster tidak lagi memberikan peningkatan yang signifikan terhadap nilai SSE.

2.7 Silhouette Coefficient

Silhouette Coefficient adalah sebuah metrik validitas yang umumnya digunakan untuk mengevaluasi hasil dari algoritma clustering. Metrik Silhouette menghitung rata-rata nilai dari setiap titik data dengan mengukur perbedaan antara tingkat pemisahan dan kepadatan data, kemudian membaginya dengan nilai maksimum antara keduanya [10]. Berikut Tabel 1 adalah rentang nilai silhouette

Tabel 1. Rentang Nilai Silhouette Nilai Interpretasi 0.71 – 1.0 Struktur yang kuat

0.51 – 0.70 Struktur yang beralasan / standard 0.26 – 0.50 Struktur yang lemah

< 0.25 Tidak ditemukan struktur yang substansial

(5)

Jatisi ISSN 2407-4322

Vol. 10, No. 3, September 2023, Hal. 133-144 E- ISSN 2503-2933 135

Muhammad Yamin Nurzaman, et., al [Implementasi K-Means Clustering Dalam Pengelompokkan Banyaknya Jumlah Petani Berdasarkan Kecamatan di Provinsi Jawa Barat]

3. METODE PENELITIAN

Dalam penelitian ini, teknik data mining clustering digunakan dengan menerapkan algoritma K-means. Pendekatan CRISP-DM terdiri dari beberapa langkah, termasuk pemahaman bisnis, pemahaman data, persiapan data, pemodelan, evaluasi, dan implementasi.

Berikut adalah Gambar 1. Metode CRISP-DM

Gambar 1. Metode CRISP-DM

3.1 Business Understanding

Pada tahap pemahaman bisnis, langkah ini merupakan langkah pertama dalam proses CRISP-DM. Di tahap ini, tujuan dan target dari proses data mining ditetapkan. Selain itu, tahap ini juga melibatkan pengaitan data mining dengan aspek bisnis dan integrasi data mining dengan proses bisnis yang sudah ada, sehingga tujuan penelitian dapat tercapai.

3.2 Data Understanding

Pada tahap pemahaman data, langkah ini melibatkan pengumpulan dan analisis data yang akan digunakan. Tahap ini juga merupakan saat data divalidasi dan diuji keabsahannya.

3.3 Data Preparation

Pada tahap persiapan data, langkah ini melibatkan mempersiapkan data yang telah dikumpulkan untuk proses data mining. Tahap ini mencakup pembersihan data, penyajian data, dan transformasi data.

3.4 Modeling

Pada tahap pemodelan, langkah ini melibatkan penggunaan algoritma data mining untuk mengidentifikasi pola-pola yang ada dalam data. Selain itu, tahap ini juga melibatkan validasi dan pengujian kehandalan model data mining.

(6)

136 Jatisi ISSN 2407-4322 Vol. 10, No. 3, September 2023, Hal. 133-144 E-ISSN 2503-2933

Muhammad Yamin Nurzaman, et., al [Implementasi K-Means Clustering Dalam Pengelompokkan Banyaknya Jumlah Petani Berdasarkan Kecamatan di Provinsi Jawa Barat]

3.5 Evaluation

Pada tahap evaluasi, langkah ini melibatkan pengujian kehandalan model data mining yang telah dibuat dan menentukan apakah model tersebut layak atau tidak untuk digunakan dalam proses bisnis.

3.6 Deployment

Pada tahap implementasi, langkah ini melibatkan integrasi model data mining yang telah dianggap layak ke dalam proses bisnis yang sudah ada. Tahap ini juga merupakan saat dimana hasil dari proses data mining disajikan kepada pihak yang berkepentingan.

4. HASIL DAN PEMBAHASAN

4.1 Business Understanding

Pada tahap awal, dilakukan pemahaman bisnis dan penjelasan mengenai masalah data mining agar tujuan penelitian dapat tercapai. Pemahaman masalah dalam penelitian ini fokus pada distribusi jumlah populasi petani di daerah Jawa Barat. Sektor pertanian dianggap sebagai salah satu sektor yang memiliki kepentingan penting. Wilayah Jawa Barat memiliki luas lahan pertanian yang signifikan, sehingga potensi untuk menghasilkan produksi pertanian yang tinggi juga cukup besar. Namun, untuk dapat mengelola lahan pertanian dengan baik, diperlukan adanya para petani dalam mengelola lahan pertanian.

4.2 Data Understanding

Dataset yang digunakan dalam penelitian ini adalah data mengenai jumlah petani berdasarkan desa atau kelurahan di Jawa Barat pada periode tahun 2019-2020.

Dataset ini diperoleh dari opendata.jabarprov.go.id sebagai sumbernya. Dataset ini berisi jumlah populasi dokter laki-laki dan perempuan di daerah jawa barat. Dataset ini terdiri dari 10624 catatan data dengan 17 atribut, termasuk: kode provinsi, nama provinsi, kode kabupaten/kota BPS, nama kabupaten/kota BPS, kode kecamatan BPS, nama kecamatan BPS, kode desa/kelurahan BPS, nama desa/kelurahan BPS, kode kecamatan Kemendagri, nama kecamatan Kemendagri, kode desa/kelurahan Kemendagri, nama desa/kelurahan Kemendagri, jumlah dokter laki-laki, jumlah dokter perempuan, satuan, tahun, dan ID.

4.3 Data Preparation

Dalam tahap persiapan data, dilakukan penyesuaian dataset agar sesuai dengan kebutuhan yang akan digunakan saat tahap pemodelan.

1. Data Selection

Dataset yang diperoleh dari opendatajabar untuk jumlah petani pada periode 2019-2020 terdiri dari 10624 data. Selanjutnya, dilakukan seleksi data dimana hanya 6 atribut yang dipilih, yaitu bps_nama_kabupaten_kota, bps_nama_kecamatan, bps_nama_desa_kelurahan, jumlah_petani_lk, jumlah_petani_pr, dan tahun. Informasi lebih lanjut mengenai data hasil seleksi dapat ditemukan pada Gambar 2 berikut ini.

(7)

Jatisi ISSN 2407-4322

Vol. 10, No. 3, September 2023, Hal. 133-144 E- ISSN 2503-2933 137

Muhammad Yamin Nurzaman, et., al [Implementasi K-Means Clustering Dalam Pengelompokkan Banyaknya Jumlah Petani Berdasarkan Kecamatan di Provinsi Jawa Barat]

Gambar 2. Hasil Data Seleksi

2. Data Preprocessing

Pada tahap preprocessing data, biasanya melibatkan proses pembersihan data seperti cleaning data, termasuk penanganan missing value. Namun, pada dataset yang digunakan dalam penelitian ini, data lengkap dan tidak terdapat missing value atau data yang inkonsisten. Oleh karena itu, dapat melanjutkan ke tahap berikutnya, yaitu tahap transformasi data.

3. Data Transformation

Langkah berikutnya adalah tahap transformasi data, di mana data akan diubah menjadi skala nilai antara 0 hingga 1. Teknik transformasi yang digunakan adalah Standard Scaler.

Informasi lebih lanjut tentang proses transformasi data dapat ditemukan pada Gambar 3 berikut ini.

Gambar 3. Proses transformasi data

4.4 Modeling

Selanjutnya, algoritma clustering yang digunakan dalam pemodelan adalah k-means.

Langkah pertama yang harus dilakukan adalah menentukan jumlah cluster. Untuk menentukan jumlah cluster (k) yang optimal, peneliti menggunakan metode Elbow Method. Informasi lebih lanjut tentang penggunaan metode Elbow Method dapat ditemukan pada Gambar 4 berikut ini.

(8)

138 Jatisi ISSN 2407-4322 Vol. 10, No. 3, September 2023, Hal. 133-144 E-ISSN 2503-2933

Muhammad Yamin Nurzaman, et., al [Implementasi K-Means Clustering Dalam Pengelompokkan Banyaknya Jumlah Petani Berdasarkan Kecamatan di Provinsi Jawa Barat]

Gambar 4. Grafik Elbow Method

Dapat dilihat pada grafik gambar 4, bahwa titik siku terletak pada jumlah cluster=2, Setelah mendapatkan nilai K, Langkah berikutnya adalah melakukan pemodelan dengan menggunakan algoritma k-means. Berikut ini adalah kode untuk melakukan clustering k-means pada dataset jumlah petani tahun 2019-2020. Informasi lebih lanjut tentang kode k-means clustering dapat ditemukan pada Gambar 5 berikut ini.

Gambar 5. Source Code K-Means Modeling

Setelah melakukan pemodelan clustering, didapatkan hasil kelompok atau cluster yang ditampilkan pada Gambar 6 dalam bentuk grafik pengelompokkan cluster. Terdapat dua titik centroid yang ditandai dengan warna kuning, serta titik-titik lain di sekitarnya yang mewakili setiap cluster..

(9)

Jatisi ISSN 2407-4322

Vol. 10, No. 3, September 2023, Hal. 133-144 E- ISSN 2503-2933 139

Muhammad Yamin Nurzaman, et., al [Implementasi K-Means Clustering Dalam Pengelompokkan Banyaknya Jumlah Petani Berdasarkan Kecamatan di Provinsi Jawa Barat]

Gambar 6. Grafik Pengelompokkan Cluster

Selanjutnya, dilakukan pengujian jumlah cluster untuk menentukan jumlah cluster yang optimal dengan melihat hasil dari nilai koefisien Silhouette yang dihasilkan dari pengujian yang telah dilakukan. Pengujian dilakukan dengan menggunakan jumlah nilai K mulai dari 2 hingga 7. Hasil pengujian ditampilkan dalam Tabel 2 berikut ini.

Tabel 2. Hasil Pengujian Cluster (k)

Data Uji Nilai K Nilai Rata-rata Silhouette Coefficient

2 0.7374355377121188

10624 3 0.5826600221506802

4 0.5842267480729738

5 0.579496836992891

6 0.5748623679093682

7 0.6056493767989628

Hasil pengujian jumlah cluster menunjukkan nilai-nilai yang diperoleh untuk setiap cluster, dan hasil tertinggi diperoleh saat menggunakan jumlah cluster k=2 dengan nilai rata-rata koefisien Silhouette sebesar 0.7374355377121188. Hasil pengujian menunjukkan bahwa k=2 adalah jumlah cluster optimal yang menghasilkan informasi terbaik dengan struktur yang kuat.

Cluster 2 atau k=2 memiliki jumlah anggota sebanyak 9743 data dan 881 data. Informasi lebih lanjut tentang cluster 2 dapat ditemukan pada Tabel 3 berikut ini.

(10)

140 Jatisi ISSN 2407-4322 Vol. 10, No. 3, September 2023, Hal. 133-144 E-ISSN 2503-2933

Muhammad Yamin Nurzaman, et., al [Implementasi K-Means Clustering Dalam Pengelompokkan Banyaknya Jumlah Petani Berdasarkan Kecamatan di Provinsi Jawa Barat]

Tabel 3

Cluster Kecamatan Jumlah Petani Kriteria Cluster 1

(9743 Data)

Gunung Putri Citeureup Sukaraja Blanakan Tanjungsiang Compreng Patokbeusi Cibogo Cipunagara Cijambe Cipeundeuy Legonkulon Cikaum Serangpanjang Tambakdahan Kasomalang Pagaden Barat Ciater

Pusakajaya Purwakarta Jatiluhur Sukatani Darangdan Maniis Tegalwaru Wanayasa Bojong Babakancikao Bungursari Pondoksalam Kiarapedes Pangkalan

Telukjambe Timur Ciampel

Klari

Rengasdengklok Kutawaluya Batujaya Tirtajaya Pedes Cibuaya Pakisjaya Cikampek Jatisari

Cilamaya Wetan Tirtamulya Telagasari

0 – 2196 Jiwa Kurang

(11)

Jatisi ISSN 2407-4322

Vol. 10, No. 3, September 2023, Hal. 133-144 E- ISSN 2503-2933 141

Muhammad Yamin Nurzaman, et., al [Implementasi K-Means Clustering Dalam Pengelompokkan Banyaknya Jumlah Petani Berdasarkan Kecamatan di Provinsi Jawa Barat]

Rawamerta Tempuran Jayakerta Cilamaya Kulon Banyusari Kota Baru Karawang Timur Langensari (Dst.) Cluster 2 (881

Data)

Citeureup

Babakan Madang Jonggol

Cileungsi Cariu

Sukamakmur Kemang Leuwiliang Cibungbulang Pamijahan Rumpin Nanggung Cigudeg Ciawi Caringin Tamansari Ciseeng Sukajaya Tanjungsari Cigombong Tenjolaya Palabuhanratu Simpenan Cikakak Cisolok Lengkong Jampangtengah Warungkiara Parakansalak Cidahu Waluran Ciemas Kalibunder Surade Cibitung Ciracap Cisaat Kadudampit Cireunghas Pabuaran

760 - 22120 Jiwa Cukup

(12)

142 Jatisi ISSN 2407-4322 Vol. 10, No. 3, September 2023, Hal. 133-144 E-ISSN 2503-2933

Muhammad Yamin Nurzaman, et., al [Implementasi K-Means Clustering Dalam Pengelompokkan Banyaknya Jumlah Petani Berdasarkan Kecamatan di Provinsi Jawa Barat]

Purabaya Nyalindung Gegerbitung Curugkembar Cidolog Cidadap Tegalbuleud Cibeber Cilaku Bojongpicung Karangtengah Sukaluyu Sukasari Pangkalan Rengasdengklok Kutawaluya Batujaya Pedes Cibuaya Pakisjaya Cilamaya Wetan Tirtamulya Lemahabang Tempuran Jayakerta Cilamaya Kulon Kota Baru Purwasari Cilebar Babelan Sukawangi Tambun Utara Karang Bahagia Cikarang Timur Kedung Waringin Pebayuran Cabangbungin Muaragembong Setu

Serang Baru Parongpong Cisarua (Dst.)

4.5 Evaluation

Pada tahap evaluasi, digunakan teknik pengukuran Silhouette Score dengan menggunakan kode yang ditampilkan pada Gambar 7 berikut ini.

(13)

Jatisi ISSN 2407-4322

Vol. 10, No. 3, September 2023, Hal. 133-144 E- ISSN 2503-2933 143

Muhammad Yamin Nurzaman, et., al [Implementasi K-Means Clustering Dalam Pengelompokkan Banyaknya Jumlah Petani Berdasarkan Kecamatan di Provinsi Jawa Barat]

Gambar 7. Proses Evaluasi Silhouette Coefficient

Dalam Gambar 7, terlihat bahwa Silhouette Score pada k=2 memiliki nilai tertinggi dibandingkan dengan nilai lainnya. Hal ini menunjukkan bahwa kualitas klaster pada k=2 termasuk dalam kategori Struktur Kuat, dan ditemukan klaster yang terbaik.

4.6 Deployment

Setelah menyelesaikan tahap evaluasi untuk mendapatkan penilaian detail tentang hasil model, langkah selanjutnya adalah melaksanakan implementasi dari keseluruhan model yang telah dibangun. Dalam penelitian ini, implementasi akan diwujudkan dalam bentuk laporan yang berisi hasil yang sesuai dengan tahapan CRISP-DM.

4. KESIMPULAN

K Cluster terbaik yang didapat menggunakan elbow method ternyata mendapatkan nilai tertinggi pada silhouette coefficient dengan score sebesar 0.7374355377121188 lebih besar dibanding cluster yang lain, dengan jumlah data uji sebanyak 10624 data jumlah petani laki-laki dan petani perempuan. Penentuan analisis persebaran jumlah popolasi petani berdasarkan kecamatan di provinsi jawa barat menghasilkan 2 cluster uji. Pada cluster 1 memiliki 9743 data dan cluster 2 memiliki 881 data. kecamatan yang memiliki daerah dengan populasi yang cukup ditujukan kepada cluster 2 dengan jumlah populasi petani mencapai 22120 jiwa. Berdasarkan penelitian yang telah dilakukan dapat diambil kesimpulan algoritma K-Means telah berhasil mengelompokkan atau mengklasterisasi jumlah populasi petani berdasarkan kecamatan diprovinsi jawa barat dengan mendapatkan anggota cluster yang optimal. Kelebihan pada penelitian ini adalah penggunaan silhouette coefficient score sebagai evaluasi nilai k terbaik dalam penelitian K-means clustering.

DAFTAR PUSTAKA

[1] C. D. Manaraja, D. S. M. Engka, I. P. F. Rorong, and U. S. Ratulangi, “Analisis Potensi Unggulan dan Daya Saing Sub Sektor Pertanian, Kehutanan dan Perikanan di Kabupaten Minahasa Selatan Jurusan Ekonomi Pembangunan , Fakultas Ekonomi dan Bisnis ,” Vol. 23, No. 4, pp. 49–60, 2023.

(14)

144 Jatisi ISSN 2407-4322 Vol. 10, No. 3, September 2023, Hal. 133-144 E-ISSN 2503-2933

Muhammad Yamin Nurzaman, et., al [Implementasi K-Means Clustering Dalam Pengelompokkan Banyaknya Jumlah Petani Berdasarkan Kecamatan di Provinsi Jawa Barat]

[2] W. Wardani and O. Anwarudin, “Peran Penyuluh Terhadap Penguatan Kelompok Tani dan Regenerasi Petani di Kabupaten Bogor Jawa Barat,” J. TABARO Agric. Sci., Vol. 2, No. 1, p. 191, 2018, doi: 10.35914/tabaro.v2i1.113.

[3] A. W. Santoso, L. Effendy, and E. Krisnawati, “Percepatan Regenerasi Petani pada Komunitas Usahatani Sayuran di Kecamatan Samarang Kabupaten Garut Provinsi Jawa Barat,” J. Inov. Penelit., Vol. 1, No. 3, pp. 325–336, 2020, doi: 10.47492/jip.v1i3.59.

[4] F. N. Dhewayani, D. Amelia, D. N. Alifah, B. N. Sari, and M. Jajuli, “Implementasi K- Means Clustering untuk Pengelompokkan Daerah Rawan Bencana Kebakaran Menggunakan Model CRISP-DM,” J. Teknol. dan Inf., Vol. 12, No. 1, pp. 64–77, 2022, doi: 10.34010/jati.v12i1.6674.

[5] S. F. Mandang and B. N. Sari, “Penerapan K-Means Cluster pada Daerah Penggunaan Teknologi di Indonesia,” JOINS (Journal Inf. Syst., Vol. 6, No. 1, pp. 131–138, 2021, doi: 10.33633/joins.v6i1.4545.

[6] T. Tendean and W. Purba, “Analisis Cluster Provinsi Indonesia Berdasarkan Produksi Bahan Pangan Menggunakan Algoritma K-Means,” J. Sains dan Teknol., Vol. 1, No. 2, pp. 5–11, 2020.

[7] A. S. Wibowo, I. D. Mulyastuti, I. Teknologi, and B. Rakyat, “Penerapan Algoritma K- Means Clustering pada Jumlah Fasilitas Kesehatan Menurut Pemerintah Provinsi DKI Jakarta,” Vol. 23, No. 2, pp. 116–122, 2022.

[8] M. G. Sadewo, A. P. Windarto, and A. Wanto, “Penerapan Algoritma Clustering Dalam Mengelompokkan Banyaknya Desa/Kelurahan Menurut Upaya Antisipasi/ Mitigasi Bencana Alam Menurut Provinsi Dengan K-Means,” KOMIK (Konferensi Nas. Teknol.

Inf. dan Komputer), Vol. 2, No. 1, pp. 311–319, 2018, doi: 10.30865/komik.v2i1.943.

[9] S. Setiawan, “Analisis Cluster Menggunakan Algoritma K-Means Untuk Mengetahui Kemampuan Pegawai Dibidang IT pada CV. Roxed Ltd,” J. Pelita Inform., Vol. 18, pp.

80–86, 2019, [Online]. Available: https://ejurnal.stmik- budidarma.ac.id/index.php/pelita/article/view/1142

[10] Y. P. Sari, A. Primajaya, and A. S. Y. Irawan, “Implementasi Algoritma K-Means untuk Clustering Penyebaran Tuberkulosis di Kabupaten Karawang,” INOVTEK Polbeng - Seri Inform., Vol. 5, No. 2, p. 229, 2020, doi: 10.35314/isi.v5i2.1457.

[11] A. Sulistiyawati and E. Supriyanto, “Implementasi Algoritma K-means Clustring Dalam Penetuan Siswa Kelas Unggulan,” J. Tekno Kompak, Vol. 15, No. 2, p. 25, 2021, doi:

10.33365/jtk.v15i2.1162.

[12] Abdussalam Amrullah, Intam Purnamasari, Betha Nurina Sari, Garno, and Apriade Voutama, “Analisis Cluster Faktor Penunjang Pendidikan Menggunakan Algoritma K- Means (Studi Kasus: Kabupaten Karawang),” J. Inform. dan Rekayasa Elektron., Vol. 5, No. 2, pp. 244–252, 2022, doi: 10.36595/jire.v5i2.701.

Referensi

Dokumen terkait

Berdasarkan latar belakang yang telah diuraikan diatas, masalah pokok yang akan dibahas dalam penelitian ini adalah bagaimana metode K-Means Clustering dapat

Pada tugas akhir ini digunakan algoritma K-means Clustering yang akan menghasilkan sebuah sistem perangkat lunak yang dapat digunakan untuk mengelompokkan Sekolah

Berdasarkan Tabel 5.10, hasil uji coba implementasi algoritma clustering K-Means dalam domain wavelet menggunakan adaptif soft-thresholding menghasilkan nilai output

Hasil penelitian menunjukkan bahwa implementasi kombinasi dari metode skin color detection dan k-means clustering memberikan kinerja yang baik dalam hal kecepatan namun

Perbedaan penelitian ini dengan sebelumnya adalah pada evaluasi kualitas penerapan clustering yang akan dilakukan menggunakan perbandingan dua evaluasi yaitu dengan

Implementasi metode Fuzzy C-MEANS untuk pengelompokkan dari 400 data tes ujian PMB dengan menggunakan software matlab, dengan tujuan menentukan anggota pada klaster

a) Data Mining dengan algoritma K-means dapat diterapkan untuk mengelompokkan banyaknya desa/kelurahan menurut keberadaan permukiman di bantaran sungai berdasarkan

IMPLEMENTASI DATA MINING UNTUK CLUSTERING DAERAH PENYEBARAN PENYAKIT DEMAM BERDARAH DI KOTA TANGERANG SELATAN MENGGUNAKAN ALGORITMA K-MEANS Studi Kasus : Dinas Kesehatan Tangerang