• Tidak ada hasil yang ditemukan

APLIKASI K-MEANS CLUSTER UNTUK PENGELOMPOKKAN PROVINSI BERDASARKAN PRODUKSI PADI, JAGUNG, KEDELAI, DAN KACANG HIJAU TAHUN 2009

N/A
N/A
Protected

Academic year: 2021

Membagikan "APLIKASI K-MEANS CLUSTER UNTUK PENGELOMPOKKAN PROVINSI BERDASARKAN PRODUKSI PADI, JAGUNG, KEDELAI, DAN KACANG HIJAU TAHUN 2009"

Copied!
13
0
0

Teks penuh

(1)

APLIKASI K-MEANS CLUSTER UNTUK PENGELOMPOKKAN

PROVINSI BERDASARKAN PRODUKSI PADI, JAGUNG, KEDELAI,

DAN KACANG HIJAU TAHUN 2009

Edmira Rivani

Pusat Pengkajian Pengolahan Data dan Informasi, Sekretariat Jenderal DPR RI. Jurusan Statistika Terapan, Universitas Padjadjaran, Bandung

rif_green@yahoo.com.

ABSTRACT

Men with all of their ability are always trying to meet their needs in different ways. Food adequacy for a nation is very strategic. In this study, the main food crops that will be discussed are rice, corn, soybeans, and mungo beans. One of clustering algorithm is K-Means clustering, can be applied to the main data production of food crops rice, corn, soybeans, and green beans each province, so the province can be grouped based on the data. From each group were also seen their respective characteristics. From the analysis, it seems that in 2009 provinces in Group 3 (West Java, Central Java and East Java) is provinces with the highest production of rice, corn, soybeans, green beans or the provinces in the third group is an area of high production, while provinces in Group 2 (North of Sumatra, South Sumatra, Lampung and South Sulawesi) is an area of middle production, and provinces in Group 1 (Nanggroe Aceh Darussalam, West Sumatra, Riau, Jambi, Bengkulu, Bangka Belitung, Kepulauan Riau, DKI Jakarta, DI Yogyakarta, Banten) is an area of low production due to low production of rice, corn, soy beans and green beans.

Keywords: K-Means Cluster, food adequacy, main food crops

ABSTRAK

Manusia dengan segala kemampuannya selalu berusaha mencukupi kebutuhannya dengan berbagai cara. Kecukupan pangan bagi suatu bangsa merupakan hal yang sangat strategis. Dalam penelitian ini tanaman pangan utama yang akan dibahas adalah padi, jagung, kedelai, dan kacang hijau. Algoritma clustering, salah satunya adalah K-Means clustering dapat diaplikasikan terhadap data produksi tanaman pangan utama padi, jagung, kedelai, dan kacang hijau masing-masing provinsi, sehingga bisa diketahui pengelompokan provinsi berdasarkan data tersebut. Dari masing-masing pengelompokan tersebut juga dapat dilihat masing-masing-masing-masing karakteristiknya. Dari hasil analisis, terlihat bahwa pada tahun 2009 provinsi pada klaster 3 (Jawa Barat, Jawa Tengah, dan Jawa Timur) merupakan provinsi dengan jumlah produksi padi, jagung, kedelai, dan kacang hijau terbanyak atau dapat dikatakan provinsi pada klaster 3 merupakan daerah produksi tinggi, sementara provinsi pada klaster 2 (Sumatera Utara, Sumatera Selatan, Lampung, dan Sulawesi Selatan) merupakan daerah produksi menengah, dan provinsi pada klaster 1 (Nanggroe Aceh Darussalam, Sumatera Barat, Riau, Jambi, Bengkulu, Bangka Belitung, Kepulauan Riau, DKI Jakarta, DI Yogyakarta, dan Banten) merupakan daerah produksi rendah karena memproduksi padi, jagung, kedelai, dan kacang hijau dalam jumlah paling sedikit.

(2)

PENDAHULUAN

Pertanian merupakan salah satu sektor utama dalam pembangunan ekonomi di Indonesia, mengingat Indonesia merupakan daerah agraris. Selain kontribusinya dalam Produk Domestik Bruto (PDB), peranan sektor pertanian dalam pembangunan ekonomi sangat luas, diantaranya sebagai sektor penyerap tenaga kerja terbesar, sebagai penghasil makanan penduduk dan sebagai penentu stabilitas harga. Pemerintah pun mengharapkan produksi pertanian tanaman pangan utama akan mengalami peningkatan tiap tahunnya. Produksi pertanian tanaman pangan utama yang akan dibahas dalam penelitian ini adalah padi, jagung, kedelai, dan kacang hijau.

Krisis ekonomi yang dialami oleh Indonesia dan negara – negara yang sedang berkembang di penghujung abad kedua puluh (tahun 1997/ 1998) telah menunjukkan kehandalan sektor pertanian dan membangkitkan keyakinan serta harapan bahwa sektor pertanian dapat difungsikan sebagai penggerak pembangunan nasional. Untuk mewujudkan harapan tersebut, maka fokus utama pembangunan sektor pertanian perlu diarahkan tidak saja kepada upaya pemenuhan kebutuhan pangan, namun harus memperlakukan komoditas pangan sebagai alat tukar dan peningkatan pendapatan bagi petani. Secara makro masalah pangan dapat bergeser tingkat prioritasnya pada aspek politik, ekonomi dan sosial. Namun, secara mikro peranan pangan sebagai pemenuhan biologis tidak mengalami perubahan, sehingga ketersediaan pangan bagi masyarakat harus selalu terjamin.

Manusia dengan segala kemampuannya selalu berusaha mencukupi kebutuhannya dengan berbagai cara. Dalam perkembangan peradaban masyarakat untuk memenuhi kualitas hidup yang maju, mandiri, dalam suasana tentram serta sejahtera lahir dan bathin, semakin dituntut penyediaan pangan yang cukup, berkualitas dan merata. Oleh karena itu, kecukupan pangan bagi suatu bangsa merupakan hal yang sangat strategis.

Algoritma clustering, salah satunya adalah K-Means clustering dapat diaplikasikan terhadap data produksi tanaman pangan utama seperti padi, jagung, kedelai, dan kacang hijau masing-masing provinsi, sehingga bisa diketahui pengelompokan provinsi berdasarkan data tersebut. Dari masing-masing pengelompokan tersebut juga dapat dilihat masing-masing-masing-masing karakteristiknya sehingga diketahui kelompok mana yang memproduksi keempat tanaman pangan utama tersebut dalam jumlah yang paling banyak dan sedikit.

Berdasarkan latar belakang masalah di atas, maka masalah yang akan diteliti adalah pengelompokan provinsi berdasarkan hasil produksi padi, jagung, kedelai, dan kacang hijau pada tahun 2009 dan karakteristik masing-masing klaster provinsi hasil pengelompokkan dengan K-Means

cluster.

Disisi lain tujuan yang ingin dicapai dari penelitian ini adalah mengetahui pengelompokan 33 provinsi berdasarkan produksi tanaman pangan utama padi, jagung, kedelai, dan kacang hijau tahun 2009 dan mengetahui klaster provinsi mana yang memproduksi padi, jagung, kedelai, dan kacang hijau paling banyak dan palig sedikit pada tahun 2009.

Ukuran Similaritas

Melakukan perhitungan ukuran similaritas atau ukuran yang dapat mengatakan bahwa objek tertentu mempunyai kemiripan dengan objek lainnya merupakan landasan bagi teknik pengklasteran atau pengelompokkan objek. Ukuran similaritas pada dasarnya dapat dibedakan dalam dua bentuk menurut sifat data. Bila data mempunyai sifat metrik, maka bentuk ukuran jarak (distance-type) yang digunakan, namun bila bersifat kualitatif digunakan bentuk ukuran kesepadanan (matching-type).

(3)

Ukuran-ukuran Berbentuk Jarak

Misalkan objek atau individu atau data yang dikumpulkan sebanyak n. Masing-masing objek akan diwakili oleh vector pengamatan X' =(X X1, 2,...,Xp) dari p variabel. Misal pula

'

1 2

( , ,..., )

i i i ip

X = X X X menyatakan ukuran yang dicatat dari objek atau individu ke-i. Beberapa ukuran yang menggambarkan jarak antara individu ke-i dank ke-j dapat dilakukan. Diantaranya adalah

1/ 1 r p r ij ik jk k

d

X

X

=

=

di mana dij menyatak jarak antara individu I dan j. Jika r = 2 maka jarak tersebut adalah jarak yang sudah dikenal yaitu jarak Euclidean antara objek i dan j,

1/ 2 2 1 p ij ik jk k

d

X

X

=

=

dan bila r = 1, maka

1 p ij ik jk k

d

X

X

=

=

yang disebut sebagai jarak absolut atau city-blok.

Jarak Euclidean mempunyai sifat scale invariant, artinya jarak akan berbeda kalau skala data diganti. Ukuran jarak lain yang juga sering digunakan adalah ukuran jarak Mahalanobis D2.

(

) (

'

)

2 1

i j i j

D

=

X

X

S

X

X

dimana S adalah matriks kovarians dari gabungan semua variabel, Xi dan Xj masing-masing adalah vector pengukuran dari objek i dan j. Ukuran jarak ini telah mempertimbangkan kemungkinan adanya korelasi antar variabel.

Ukuran-ukuran Bentuk Kesepadanan

Ukuran kesepadanan, yang sering dikenal dengan koefisien asosiasi, lebih tepat digunakan untuk data yang berbentuk kualitatif khususnya yang mempunyai skala nominal. Ukuran kemiripan untuk data seperti ini biasanya menggunakan nilai 0 atau 1 sebagai atribut dan didasarkan akan adanya alasan kuat bahwa dua individu akan dipandang mirip kalau mereka mempunyai banyak kesamaan atribut.

Jika divisualisasikan maka data dapat dibentuk dalam tabel kontingensi dua arah. Dalam tabel ini, baris-baris dan kolom-kolom dikaitkan dengan ada atau tidak adanya atribut, (+) atau (-), dari individu i dan j. Sel dalam tabel tersebut menunjukkan banyaknya atribut yang dipunyai atau tidak dipunyai bersama.

(4)

Tabel di bawah ini adalah berbagai ukuran asosiasi yang banyak digunakan. Huruf a, b, c dan d menyatakan sel dalam tabel kontingensi.

Tabel 1 Ukuran-ukuran Kemiripan

a + d 2(a + d) ( ) ( ) a + b + c + d 2(a + d ) + b + c a a ( ) ( ) a + b + c a + 2(b + c) 2a a ( ) ( ) 2a + b + c a + b + c + d i iv ii v iii vi Algoritma Pengelompokkan

Algoritma (set of rules) pengelompokkan objek ke dalam klasternya diklasifikasikan menjadi dua metode yaitu metode hierarki dan metode nonhierarki.

Metode Hierarki

Metode hierarki merupakan suatu teknik pengelompokkan untuk membentuk konstruksi hierarki atau berdasarkan tingkatan tertentu seperti struktur pohon. Jadi, proses pengelompokkan dilakukan secara bertingkat dan bertahap. Metode ini dibedakan menjadi dua, yakni :

Metode agglomerative

Metode ini dimulai dengan kenyataan bahwa setiap objek membentuk klasternya masing-masing. Kemudian, dua objek dengan jarak terdekat bergabung. Selanjutnya, objek ketiga akan bergabung dengan klaster yang ada atau bersama objek yang lain dan membentuk klaster baru. Hal ini tetap memperhitungkan jarak kedekatan antar objek. Proses akan terus berlanjut sampai akhirnya terbentuk satu klaster yang terdiri dari keseluruhan objek. Terdapat beberapa metode agglomerative, yakni : (1) Single linkage atau nearest neighbor method. Metode ini menggunakan prinsip jarak minimum. Dimulai dengan mencari dua objek yang memiliki jarak terdekat. Keduanya membentuk klaster yang pertama. Pada langkah selanjutnya, terdapat dua kemungkinan yaitu objek ketiga akan bergabung dengan klaster yang telah dibentuk atau dua objek lain akan membentuk klaster baru. Proses ini akan berlanjut sampai akhirnya terbentuk klaster tunggal. Pada metode ini, jarak antar klaster didefinisikan sebagai jarak terdekat antar anggotanya; (2) Complete linkage atau farthest neighbor method. Metode ini merupakan kebalikan dari pendekatan yang digunakan pada single linkage. Prinsip jarak yang digunakan adalah jarak terjauh antar objek; (3) Average linkage. Metode ini mengikuti prosedur yang sama dengan kedua metode sebelumnya. Prinsip ukuran jarak yang digunakan adalah jarak rata-rata antar tiap pasangan objek yang mungkin; (4) Centroid method. Pada metode ini, jarak antara dua klaster adalah jarak diantara dua centroid klaster-klaster tersebut.

Centroid adalah rata jarak yang ada pada sebuah klaster yang didapat dengan menghitung

rata-rata pada semua anggota suatu klaster tertentu. Dengan metode ini, setiap terjadi klaster baru, segera terjadi perhitungan ulang centroid sampai terbentuk klaster yang tetap; (5) Ward’s method. Pada metode ini, jarak antara dua klaster yang terbentuk adalah sum of squares diantara dua klaster tersebut.

(5)

Metode divisive

Metode ini berlawanan dengan metode agglomerative. Dimulai dengan satu klaster besar yang mencakup keseluruhan objek. Selanjutnya, objek yang memiliki ketidakmiripan besar dipisahkan sehingga membentuk klaster yang lebih kecil. Pemisahan ini dilanjutkan sampai tercapai sejumlah klaster yang diinginkan. Yang termasuk kepada metode divisive, yaitu: Splinter average distance method. Metode ini didasarkan pada perhitungan jarak rata-rata masing-masing objek dengan objek pada klaster splinter (terpisah) dan jarak rata-rata objek tersebut dengan objek lain pada klasternya. Proses dimulai dengan memisahkan objek dengan jarak terjauh sehingga terbentuk dua klaster. Kemudian, bandingkan jarak rata-rata masing-masing objek dengan klaster splinter dan klasternya sendiri. Apabila suatu objek memiliki jarak yang lebih dekat ke klaster splinter daripada ke klasternya sendiri, maka objek tersebut harus dikeluarkan dari klasternya dan dipindahkan ke klaster splinter. Apabila komposisinya sudah stabil, yaitu jarak suatu objek ke klasternya selalu lebih kecil daripada jarak objek itu ke klaster splinter, maka proses berhenti dan dilanjutkan dengan tahap pemisahan dalam klaster.

Metode Nonhierarki. Metode dimulai dengan menentukan terlebih dahulu jumlah klaster

yang diinginkan (dua klaster atau lebih). Setelah jumlah klaster diketahui, baru proses klaster dilakukan tanpa mengikuti proses hierarki. Kelemahan dalam metode ini adalah bahwa banyaknya klaster harus disebutkan sebelumnya dan pemilihan pusat klaster sembarang Pengklasteran dengan menggunakan metode ini lebih cepat daripada metode hierarkhi dan lebih menguntungkan untuk jumlah objek/kasus yang besar. Oleh karena itu sangat disarankan untuk menggunakan metode hierarhi dan non hierarkhi secara berdampingan. Pertama pemecahan pengklasteran awal diperoleh dengan menggunakan prosedur hierarkhi. “Banyaknya klaster dan centroid klaster yang diperoleh dipergunakan sebagai input untuk analisis non hierarkhi” (Hair, Anderson,Tatham dan Black,1992).

METODE PENELITIAN

Para peneliti dan akademisi sering dihadapkan pada situasi yang memungkinkan mereka dapat mendefinisikan objek yang homogen dengan banyak cara. Objek bisa merupakan individu, perusahaan, produk atau bahkan tingkah laku seseorang. Dalam hal ini, interpretasi yang tepat tidaklah mungkin didapat tanpa metodologi yang tepat pula. Oleh karenanya, diperlukan suatu teknik atau cara untuk mengatasinya. Analisis klaster merupakan teknik yang biasa dipakai untuk maksud tersebut. Analisis klaster meliputi algoritma pengelompokkan objek yang berbeda-beda. Tujuan utama analisis ini adalah mengelompokkan objek-objek atau kasus-kasus ke dalam satu atau lebih klaster (kelompok) berdasarkan kesamaan karakteristik di antara objek-objek tersebut. Sehingga, objek-objek yang berada dalam satu klaster akan mempunyai kemiripan satu sama lain. Analisis klaster termasuk analisis interdependensi multivariat yaitu analisis multivariat yang memperhatikan struktur keterkaitan antar variabel independen saja (tidak ada variabel dependen).

Secara garis besar, tahapan analisis klaster dalam diagram alir adalah sebagai berikut :

Gambar 1 Diagram Alir Tahapan Analisis Klaster

Tahap Partisi

Merupakan teknik dalam pengelompokkan yang merupakan dasar analisis. Beberapa hal yang perlu diperhatikan pada tahap ini adalah: Pertama, tentukan objek dan variabel yang akan dianalisis.

Interpretasi

(6)

Tentukan jumlah klaster yang akan dibentuk. Kedua, tentukan algoritma pengelompokkan objek.

Ketiga, tentukan ukuran similaritas yang akan digunakan. Tahap Interpretasi

Pada tahap ini, hasil pengelompokkan berupa klaster-klaster akan diinterpretasikan sesuai nilai karakteristik yang terkandung dalam objek-objeknya. Biasanya, interpretasi dilakukan berdasarkan nilai rata-rata dari karakteristik objek dalam klaster. Hasil interpretasi berupa label atau nama dari masing-masing klaster.

Tahap Validasi dan Profil

Validasi dilakukan untuk menguji bahwa hasil pengelompokkan dapat mewakili populasi penelitian, sifatnya stabil dan berlaku umum untuk objek lainnya. Sedangkan profil, menyangkut penjelasan karakteristik dari setiap klaster yang telah diinterpretasikan. Sehingga, perbedaan dimensi antar klaster menjadi jelas.

Asumsi-Asumsi

Agar terbentuk suatu klaster yang baik, yaitu klaster yang mempunyai kesamaan yang tinggi antar anggota dalam satu klaster (within cluster) dan perbedaan yang tinggi antara klaster yang satu dengan klaster yang lain (between cluster), maka haruslah dipenuhi asumsi-asumsi seperti sampel yang diambil benar-benar bisa mewakili populasi yang ada (representatif). Kemudian mempunyai sifat multikolinieritas, yakni kemungkinan adanya korelasi antar objek, sebaiknya tidak ada. Atau seandainya ada, besar multikolinieritas tersebut tidaklah tinggi (misalnya di atas 0,5).

Penjelasan Data

Data berikut merupakan data produksi tanaman pangan utama (Padi, Jagung, Kedelai, & Kacang hijau) tahun 2009 untuk masing-masing provinsi.

Tabel 2 Produksi Padi, Jagung, Kedelai, dan Kacang Hijau di 33 Provinsi Tahun 2009

(7)

K-Means Cluster

Data Clustering merupakan salah satu metode data mining yang bersifat tanpa arahan (unsupervised). Ada dua jenis data clustering yang sering dipergunakan dalam proses pengelompokan data yaitu hierarchical (hierarki) data clustering dan non-hierarchical (non hierarki) data clustering.

K-Means merupakan salah satu metode data clustering non hierarki yang berusaha mempartisi data yang

ada ke dalam bentuk satu atau lebih klaster/kelompok. Metode ini mempartisi data ke dalam klaster/kelompok sehingga data yang memiliki karakteristik yang sama dikelompokkan ke dalam satu klaster yang sama dan data yang mempunyai karakteristik yang berbeda dikelompokkan ke dalam kelompok yang lain. Adapun tujuan dari data clustering ini adalah untuk meminimalisasikan fungsi obyektif yang diset dalam proses clustering, yang pada umumnya berusaha meminimalisasikan variasi di dalam suatu klaster dan memaksimalisasikan variasi antar klaster.

Berbeda dengan metode hierarki, metode nonhierarki justru dimulai dengan menentukan sejumlah nilai klaster awal sesuai dengan jumlah yang diinginkan. Setelah ditentukan, objek kemudian digabungkan ke dalam klaster-klaster tersebut.

Gambar 2 Teknik Pengelompokan

Algoritma K-Means

Algoritma K-Means merupakan algoritma yang relatif sederhana untuk mengklasifikasikan atau mengelompokkan sejumlah besar obyek dengan atribut tertentu ke dalam kelompok-kelompok (cluster) sebanyak K. Pada algoritma K-Means, jumlah klaster K sudah ditentukan lebih dahulu.

Setiap klaster memiliki titik pusat dan anggota-anggota dari satu klaster dipilih berdasarkan jarak dari titik pusat klaster terdekat. Penentuan keanggotaan dan titik pusat klaster kemudian menjadi tidak mudah, karena penambahan satu anggota pada lokasi yang signifikan akan merubah lokasi titik pusat klaster, dan status keanggotaan harus ditinjau kembali, perubahan keanggotaan kemudian akan kembali merubah lokasi titik pusat dan seterusnya keanggotaan mungkin akan berubah lagi. Karena itu, proses penentuan titik pusat dan keanggotaan klaster harus dilakukan dalam iterasi (perulangan) hingga posisi titik pusat dan angota-anggota klaster benar-benar stabil. Dasar algoritma K-Means adalah sebagai berikut: (1) Tentukan nilai k sebagai jumlah klaster yang ingin dibentuk; (2) Bangkitkan k centroid (titik pusat klaster) awal secara random; (3) Hitung jarak setiap data ke

(8)

masing-masing centroid menggunakan rumus korelasi antar dua objek seperti Euclidean Distance; (4) Kelompokkan setiap data berdasarkan jarak terdekat antara data dengan centroidnya; (5) Tentukan posisi centroid baru (

C

k) dengan cara menghitung nilai rata-rata dari data-data yang ada pada centroid yang sama.

Dimana

n

k adalah jumlah anggota dalam cluster k dan

d

i adalah anggota dalam cluster k; (6) Kembali ke langkah 3 jika posisi centroid baru dengan centroid lama tidak sama.

Secara sederhana algoritma K-Means dapat digambarkan dalam diagram alur sebagai berikut:

Gambar 3 Diagram Alur Algoritma K-Means Cluster

Akses Validitas Hasil

Masalah utama dalam validasi analisis klaster ialah menentukan banyaknya klaster dan penentuan metode klaster yang tepat. Ada beberapa cara yang dapat menjadi petunjuk dalam penentuan banyaknya klaster diantaranya yaitu: Pertama, pertimbangan teoretis atau konseptual bisa diusulkan untuk menentukan berapa banyaknya klaster yang sebenarnya. Kedua, dengan menggunakan pengklasteran hierarkhi, jarak dimana klaster digabung bisa dipergunakan sebagai kriteria. Informasi ini bisa diperoleh dari agglomeration schedule. Bila nilai dalam kolom coefficient, tiba-tiba menjadi dua kali antara tahapan sebelumnya. Ketiga, suatu pengelompokkan(klaster) seharusnya berguna/bermanfaat. “Bila suatu klaster hanya memiliki 1 anggota maka klaster tersebut lebih baik digabung dengan klaster lain yang memiliki jarak terdekat” (Supranto, 2004).

Namun cara-cara diatas belum memiliki ukuran yang jelas dalam menentukan berapa banyak klaster yang terjadi dan metode mana yang lebih tepat untuk digunakan, oleh karena itu pada penelitian ini digunakan nilai pseudo-F, dengan didasari oleh perbandingan jumlah kuadrat diantara klaster dan jumlah kuadrat didalam klaster yang dihitung dengan rumusan

(9)

) / ( ) 1 / ( K n W tr K B tr F pseudo − − = −

Dengan W adalah Jumlah kuadrat didalam klaster dan B adalah jumlah kuadrat antar klaster. Dimana:

= − − = k j j j j x x x x n B 1 )' )( (

∑∑

= =

=

k j n i j ji j ji j

x

x

x

x

W

1 1

)'

)(

(

∑∑

= =

=

=

+

k j n i ji ji j

x

x

x

x

T

W

B

1 1

)'

)(

(

“Semakin besar nilai pseudo-F maka semakin baik pula hasil pengklasteran yang kita miliki atau dapat diartikan pula bahwa metode pengklasteran terbaik ditunjukkan oleh nilai pseudo yang terbesar”

(Lattin, Carroll, dan Green, 2003). Penentuan jumlah klaster bisa juga berdsarkan judgement peneliti

dengan berbagai pertimbangan. Pengklasteran ini dinamakan dengan klaster kamin.

HASIL DAN PEMBAHASAN

Pembentukan Klaster Pertama pada K-Means Cluster

Dengan menggunakan bantuan software SPSS 13, diperoleh output sebagai berikut :

Initial Cluster Centers

430.00 4323765 1E+007 1064.00 1371014 5266720 2.00 41279.00 355260.00 1.00 23295.00 83629.00 Padi Jagung Kedele Kacang_Hijau 1 2 3 Cluster

Gambar 4 Initial Cluster

Tabel Initial Cluster di atas menunjukkan tiga buah klaster yang pertama kali terbentuk. Kemudian metode K-Means Cluster akan menguji dan melakukan realokasi klaster yang ada. Proses tersebut dinamakan Iteration, yang memuat perubahan pada initial cluster sebagai berikut

Iteration Historya 727087.4 932326.5 2301420 .000 .000 .000 Iteration 1 2 1 2 3

Change in Cluster Centers

Convergence achieved due to no or small change in cluster centers. The maximum absolute coordinate change for any center is . 000. The current iteration is 2. The minimum distance between initial centers is 4535442.087. a.

(10)

Hasil dari K-Means adalah Final Cluster Centers, yang berisi tiga klaster untuk membagi 33 provinsi berdasarkan produksi padi, jagung, kedelai, dan kacang hijau pada tahun 2009.

Analisis Pengelompokan Provinsi Produksi Padi, Jagung, Kedelai, dan Kacang Hijau

Dari empat variabel yang relevan, untuk membedakan isi klaster, dapat dianalisis provinsi yang termasuk klaster 1, klaster 2, dan klaster 3. Pengelompokkan 33 provinsi adalah sebagai berikut:

Tabel 3 Hasil Pengelompokan 33 Provinsi

Berdasarkan tabel di atas terlihat bahwa pengelompokkan 33 provinsi ke dalam tiga klaster adalah sebagai berikut: Pertama, klaster 1 dengan prosentase 78.79% terdiri dari Nanggroe Aceh Darussalam, Sumatera Barat, Riau, Jambi, Bengkulu, Bangka Belitung, Kepulauan Riau, DKI Jakarta, DI Yogyakarta, Banten, Bali, NTB, NTT, Kalimantan Timur, Sulawesi Utara, Sulawesi Tengah, Sulawesi Tenggara, Gorontalo, Sulawesi Barat, Maluku, Papua, Maluku Barat, dan Papua Barat.

Kedua, klaster 2 dengan prosentase 12.12% terdiri dari Sumatera Utara, Sumatera Selatan, Lampung,

dan Sulawesi Selatan. Ketiga, klaster 3 dengan prosentase 9.09% terdiri dari Jawa Barat, Jawa Tengah, dan Jawa Timur.

Interpretasi Karakteristik Klasifikasi Provinsi

Interpretasi terhadap ketiga klaster yang terbentuk dimulai dengan menganalisis variabel-variabel yang membedakan antara tiga klaster. Analisis ini dilakukan dengan melihat nilai signifikansi pada tabel ANOVA. Apabila nilai signifikansi > 0.05, maka tidak ada perbedaan yang berarti antara klaster 1, klaster 2 dan klaster 3 dan jika sebaliknya, nilai signifikansi < 0.05 maka ada perbedaan yang berarti antara klaster 1, klaster 2 dan klaster 3, yang berhubungan dengan variabel tersebut. Tabel berikut menyajikan variabel-variabel pembeda kedua segmen:

ANOVA 1.394E+014 2 4.783E+011 30 291.436 .000 1.220E+013 2 4.291E+011 30 28.422 .000 4.628E+010 2 1905281177 30 24.292 .000 5710903240 2 196775242.6 30 29.022 .000 Padi Jagung Kedele Kacang_Hijau Mean Square df Cluster Mean Square df Error F Sig.

The F tests should be used only for descriptive purposes because the clusters have been chosen to maximize the differences among cases in different clusters. The observed significance levels are not corrected for this and thus cannot be interpreted as tests of the hypothesis that the cluster means are equal.

(11)

Berdasarkan tabel anava di atas, terlihat bahwa angka signifikan untuk semua variabel produksi padi, jagung, kedelai, dan kacang hijau lebih kecil dari 0.05. Hal ini menunjukkan bahwa ada perbedaan yang berarti antara klaster 1, klaster 2, dan klaster 3, yang berhubungan dengan semua variabel tersebut. Sebagai pedoman, semakin besar angka F maka semakin besar perbedaan klaster 1, klaster 2 dan klaster 3 untuk variabel yang bersangkutan. Berdasarkan tabel anava di atas, terlihat angka F terbesar adalah 291,436. Hal ini menunjukkan provinsi-provinsi dalam klaster 1 memproduksi padi dalam jumlah yang sangat berbeda bila dibandingkan dengan jumlah produksi padi pada klaster 2, klaster 1 memproduksi padi dalam jumlah yang sangat berbeda bila dibandingkan dengan jumlah produksi padi klaster 3, dan klaster 2 memproduksi padi dalam jumlah yang sangat berbeda bila dibandingkan dengan jumlah produksi padi pada klaster 3.

Setelah diketahui variabel-variabel yang relevan untuk membedakan klaster 1, klaster 2, dan klaster 3, selanjutnya dianalisis produksi masing provinsi yang termasuk ke dalam masing-masing klaster yang dapat dilihat dari nilai akhir pusat klaster pada variabel yang membedakan.

Final Cluster Centers

713071.50 3411632 1E+007 144795.85 1179610 3036393 11447.19 21335.00 196659.33 2902.00 8693.00 68058.67 Padi Jagung Kedele Kacang_Hijau 1 2 3 Cluster

Gambar 7 Hasil Akhir Karakteristik Masing-Masing Klaster

Berdasarkan tabel final cluster center di atas dapat disimpulkan bahwa dari empat variabel yang relevan untuk membedakan isi klaster dalam mengelompokkan provinsi yang termasuk klaster 1, klaster 2, dan klaster 3.

Variabel Produksi Padi

Rata-rata Produksi padi untuk klaster 1 (713071.5) < klaster 2 (3411632) < klaster 3 (10714313.67). Hal ini berarti pada tahun 2009 provinsi pada klaster 3 (Jawa Barat, Jawa Tengah, dan Jawa Timur) memproduksi padi paling banyak dibandingkan dengan jumlah produksi padi pada klaster lainnya, dimana provinsi pada klaster 1 (Nanggroe Aceh Darussalam, Sumatera Barat, Riau, Jambi, Bengkulu, Bangka Belitung, Kepulauan Riau, DKI Jakarta, DI Yogyakarta, Banten, Bali, NTB, NTT, Kalimantan Timur, Sulawesi Utara, Sulawesi Tengah, Sulawesi Tenggara, Gorontalo, Sulawesi Barat, Maluku, Papua, Maluku Barat, dan Papua Barat) memproduksi padi dengan jumlah yang paling sedikit.

Variabel Produksi Jagung

Rata-rata Produksi jagung untuk klaster 1 (144795.85) < klaster 2 (1179610) < klaster 3 (3036393). Hal ini berarti pada tahun 2009 provinsi pada klaster 3 (Jawa Barat, Jawa Tengah, dan Jawa Timur) memproduksi jagung paling banyak dibandingkan dengan jumlah produksi jagung pada klaster lainnya, dimana provinsi pada klaster 1 (Nanggroe Aceh Darussalam, Sumatera Barat, Riau, Jambi, Bengkulu, Bangka Belitung, Kepulauan Riau, DKI Jakarta, DI Yogyakarta, Banten, Bali, NTB, NTT, Kalimantan Timur, Sulawesi Utara, Sulawesi Tengah, Sulawesi Tenggara, Gorontalo, Sulawesi Barat, Maluku, Papua, Maluku Barat, dan Papua Barat) memproduksi jagung dengan jumlah yang paling sedikit.

(12)

Variabel Produksi Kedelai

Rata-rata Produksi kedelai untuk klaster 1 (11447.19) < klaster 2 (21335) < klaster 3 (196659.33). Hal ini berarti pada tahun 2009 provinsi pada klaster 3 (Jawa Barat, Jawa Tengah, dan Jawa Timur) memproduksi kedelai paling banyak dibandingkan dengan jumlah produksi kedelai pada klaster lainnya, dimana provinsi pada klaster 1 (Nanggroe Aceh Darussalam, Sumatera Barat, Riau, Jambi, Bengkulu, Bangka Belitung, Kepulauan Riau, DKI Jakarta, DI Yogyakarta, Banten, Bali, NTB, NTT, Kalimantan Timur, Sulawesi Utara, Sulawesi Tengah, Sulawesi Tenggara, Gorontalo, Sulawesi Barat, Maluku, Papua, Maluku Barat, dan Papua Barat) memproduksi kedelai dengan jumlah yang paling sedikit.

Variabel Produksi Kacang Hijau

Rata-rata Produksi kacang hijau untuk klaster 1 (2902) < klaster 2 (8693) < klaster 3 (68058.67). Hal ini berarti pada tahun 2009 produksi kacang hijau pada provinsi klaster 3 (Jawa Barat, Jawa Tengah, dan Jawa Timur) merupakan produksi yang paling banyak dibandingkan dengan produksi kacang hijau pada klaster lainnya, dimana provinsi klaster 1 (Nanggroe Aceh Darussalam, Sumatera Barat, Riau, Jambi, Bengkulu, Bangka Belitung, Kepulauan Riau, DKI Jakarta, DI Yogyakarta, dan Banten) memproduksi kacang hijau dengan jumlah yang paling sedikit.

Berdasarkan hasil karakteristik masing-masing klaster, terlihat bahwa pada tahun 2009 provinsi pada klaster 3 (Jawa Barat, Jawa Tengah, dan Jawa Timur) merupakan provinsi dengan jumlah produksi padi, jagung, kedelai, dan kacang hijau terbanyak atau dapat dikatakan provinsi pada klaster 3 merupakan daerah produksi tinggi, sementara provinsi pada klaster 2 (Sumatera Utara, Sumatera Selatan, Lampung, dan Sulawesi Selatan) merupakan daerah produksi menengah, dan provinsi pada klaster 1 (Nanggroe Aceh Darussalam, Sumatera Barat, Riau, Jambi, Bengkulu, Bangka Belitung, Kepulauan Riau, DKI Jakarta, DI Yogyakarta, dan Banten) merupakan daerah produksi rendah karena memproduksi padi, jagung, kedelai, dan kacang hijau dalam jumlah paling sedikit.

PENUTUP

Berdasarkan hasil pembahasan dan analisis data di atas, dapat disimpulkan pengelompokkan 33 provinsi ke dalam tiga klaster yaitu klaster 1 dengan prosentase 78.79% terdiri dari Nanggroe Aceh Darussalam, Sumatera Barat, Riau, Jambi, Bengkulu, Bangka Belitung, Kepulauan Riau, DKI Jakarta, DI Yogyakarta, Banten, Bali, NTB, NTT, Kalimantan Timur, Sulawesi Utara, Sulawesi Tengah, Sulawesi Tenggara, Gorontalo, Sulawesi Barat, Maluku, Papua, Maluku Barat, dan Papua Barat. Klaster 2 dengan prosentase 12.12% terdiri dari Sumatera Utara, Sumatera Selatan, Lampung, dan Sulawesi Selatan dan Klaster 3 dengan prosentase 9.09% terdiri dari Jawa Barat, Jawa Tengah, dan Jawa Timur. Pada tahun 2009 provinsi pada klaster 3 (Jawa Barat, Jawa Tengah, dan Jawa Timur) merupakan provinsi dengan jumlah produksi padi, jagung, kedelai, dan kacang hijau terbanyak atau dapat dikatakan provinsi pada klaster 3 merupakan daerah produksi tinggi, sementara provinsi pada klaster 2 (Sumatera Utara, Sumatera Selatan, Lampung, dan Sulawesi Selatan) merupakan daerah produksi menengah, dan provinsi pada klaster 1 (Nanggroe Aceh Darussalam, Sumatera Barat, Riau, Jambi, Bengkulu, Bangka Belitung, Kepulauan Riau, DKI Jakarta, DI Yogyakarta, dan Banten) merupakan daerah produksi rendah karena memproduksi padi, jagung, kedelai, dan kacang hijau dalam jumlah paling sedikit.

(13)

DAFTAR PUSTAKA

Hair, J.F. Jr., Anderson, R.E., Tatham, R.L., dan Black W. C. (1992). Multivariate Data Analysis, Fifth Edition. New Jersey:Prentice Hall.

Lattin, J., Carroll, D., dan Green, P. (2003) Analyzing Multivariate Data. United States of America : Thomson Learning.

Referensi

Dokumen terkait

Angka Ramalan I (ARAM I) produksi kacang tanah Provinsi Jawa Tengah tahun 2009 diperkirakan sebesar 170,52 ribu ton biji kering, turun sebanyak 864 ton (0,50 persen) dibandingkan

Penerapan metode K-Means Clustering untuk mengelompokkan provinsi menurut jumlah produksi bahan pangan dimulai dari analisa data yang terdiri dari produksi jagung,

Penelitian dilaksanakan pada April hingga Oktober 2012 dengan mengambil tanaman terinfeksi bulai dari Provinsi Aceh, Sumatera Utara, Lampung, Kalimantan Barat, Jawa Barat, Jawa

Penerapan metode K-Means Clustering untuk mengelompokkan provinsi menurut jumlah produksi bahan pangan dimulai dari analisa data yang terdiri dari produksi jagung,

“Optimasi Jumlah Cluster K-Means Dengan Metode Elbow dan Silhoutte pada Produktivitas Tanaman Pangan di Provinsi Jawa Tengah Tahun 2018” dalam penelitian tersebut

Berbeda dengan dinamika produksi daging sapi di Jawa Timur dan Jawa Tengah, pada wilayah Provinsi Jawa Barat produksi daging sapi baik secara serempak maupun secara

Penerapan metode K-Means Clustering untuk mengelompokkan provinsi menurut jumlah produksi bahan pangan dimulai dari analisa data yang terdiri dari produksi jagung,

Berdasarkan kriteria Kementerian Pertanian (2013), Jawa Tengah termasuk dalam kategori JABALSIM 1 (gambar 3), namun dalam praktek di lapangan pada umumnya termasuk dalam