Perbandingan Metode Fuzzy C Means Clustering dan Fuzzy C Shell Clustering (Studi Kasus KabupatenKota di Pulau Jawa Berdasarkan Variabel Pembentuk Indeks Pembangunan Manusia)

(1)

Perbandingan Metode Fuzzy C-Means Clustering dan Fuzzy C-Shell Clustering

(Studi Kasus: Kabupaten/Kota di Pulau Jawa Berdasarkan Variabel Pembentuk

Indeks Pembangunan Manusia)

Agus Widodo1, Purhadi2

1_{Mahasiswa Pascasarjana Jurusan Statistika, FMIPA, ITS} 2

Jurusan Statistika, FMIPA, ITS

1,2_{Jurusan Statistika Kampus ITS Sukolilo, Surabaya, 60111}

E-mail: [email protected], [email protected]

Abstract

Cluster analysis is a multivariate analysis technique with the main purpose is to classify objects into groups based on the characteristics observation. Clustering methods currently being developed is the method of grouping based on the fuzzy sets, also called as fuzzy clustering analysis. Various methods of fuzzyclustering analysis, such as Fuzzy C-Means Cluster (FCM) and Fuzzy C-Shell Cluster (FCS). FCM is developed based on c-means using fuzzy weighting, while the FCS applying geometric partition, in particular using the circle and ellipse shapes. While the optimum number of groups is obtained by the criteria of validity measure, mentioned as Xie and Beni index, while for the right method is used the ratio of standard deviation within the group against the standard deviation between groups. FCM and FCS will be applied to the grouping of districts/cities by using the variable forming the Human Development Index (HDI) in 2008 for the districts/cities on the island of Jawa. HDI forming variables, consisting of the life expectancy; literacy rates, mean years school, and the Purchasing Power Parity . The results obtained FCM method has optimum number of groups is six groups, and FCS method has optimum number of groups is four groups.

Keywords : Fuzzy C-Means cluster, Fuzzy C-shell Cluster, Xie and Beni Index, Human Development Index (HDI)

Abstrak

(2)

FCM dan FCS akan diterapkan pada pengelompokkan kabupaten/kota dengan menggunakan variabel pembentuk Indeks Pembangunan Manusia (IPM) tahun 2008 untuk kabupaten/kota di pulau Jawa. Variabel-variabel pembentuk IPM, terdiri dari angka harapan hidup; angka melek huruf; rata-rata lamanya sekolah, dan Purchasing Power Parity (paritas daya beli). Pada FCM jumlah kelompok optimum sebanyak enam kelompok, sedangkan pada FCS jumlah kelompok optimum sebanyak 4 kelompok.

Kata kunci : Fuzzy C-Means cluster, Fuzzy C-shell Cluster, Indeks Xie dan Beni, Indeks Pembangunan Manusia

1. Pendahuluan

Pada proses pengelompokkan berhierarki atau tak berhierarki, pembentukan kelompok dilakukan dengan sedemikian rupa sehingga setiap objek berada tepat pada satu kelompok. Namun, pada suatu saat, hal itu tidak dapat dilakukan untuk menempatkan suatu objek tepat pada suatu kelompok, karena sebenarnya objek tersebut terletak diantara dua atau lebih kelompok yang lain. Sehingga perlu dilakukan penggelompokkan dengan menggunakan fuzzy

clustering yang memperhitungkan tingkat keanggotaan himpunan fuzzy sebagai dasar

pembobotan [1]. Pengelompokkan dengan logika fuzzy terus berkembang karena pada umumnya data tidak bisa dipisahkan secara tegas ke dalam kelompok, tetapi memiliki kecenderungan yang dinyatakan sebagai derajat keanggotaan, yang bernilai diantara 0 dan 1, terhadap kelompoknya [2].

Pengelompokkan dengan menggunakan algoritma Fuzzy c-means (FCM) merupakan salah satu teknik yang merupakan perkembangan metode pengelompokkan tak berhierarki (C-means) dengan menggunakan logika fuzzy. FCM pertama kali diperkenalkan oleh Dunn pada tahun 1973 [3] yang kemudian dikembangkan oleh Bezdek [4] yang digunakan dalam bidang pengenalan pola (pattern recognition). Metode FCM sering digunakan dalam pengelompokkan, karena metode ini memberikan hasil yang halus dan cukup efektif untuk meningkatkan homogenitas tiap kelompok yang dihasilkan [5]. Dalam penelitian ini akan digunakan metode Fuzzy c-shell cluster sebagai pembanding dari fuzzy c-means cluster untuk melihat seberapa efisien metode fuzzy c-mean clsuter digunakan dalam fuzzy clustering karena metode FCS jarang digunakan. [6], menjelaskan teknik pendekatan yang dipakai dalam FCS menggunakan pengelompokkan bersifat geomteris, khususnya menggunakan bentuk lingkaran dan ellips. Bentuk dasar kelompok adalah p-dimensi hyper-spherical shell yang dikarakteristikan dengan pusat dan radius. Dalam penelitiannya diaplikasikan sebagai pengenalan pola (pattern recognition) dalam bidang analisa citra.

(3)

beli perbulan dalam rupiah). Tinggi rendahnya IPM Kabupaten/Kota di pulau Jawa hanya ditunjukkan Indeks Komposit tetapi tidak ditunjukkan variabel mana yang dominan terhadap tinggi/rendahnya peringkat IPM. Provinsi-provinsi di pulau Jawa pada tahun 2008, memiliki peringkat IPM diatas 20 besar, kecuali provinsi Banten yang memiliki peringkat ke-23. Provinsi DKI Jakarta sebagai peringkat pertama, kemudian propinsi Daerah Istimewa Yogyakarta dengan peringkat 4. Pada provinsi Jawa Tengah, memiliki peringkat ke-14, sedangkan propinsi Jawa Barat pada peringkat ke-15, serta propinsi Jawa Timur memiliki peringkat ke-19 dari seluruh propinsi yang ada di Indonesia.

Pengelompokkan wilayah bertujuan untuk membagi wilayah-wilayah dalam beberapa kelompok dengan karakteristik yang memiliki tingkat keserupaan yang tinggi di dalam setiap kelompok dan memiliki perbedaan antar kelompok. Pada kasus pengelompokkan kabupaten/kota di pulau Jawa berdasarkan Indikator Pembangunan Manusia ini ingin didapatkan metode pengelompokkan yang tepat untuk data komponen pembentuk IPM. Pengelompokan dengan kedua metode ini memerlukan indeks validitas yang digunakan untuk mengetahui banyak kelompok yang optimum yang terbentuk. Indeks validitas yang digunakan adalah Indeks Xie dan Beni [7]. Dalam penelitiannya, indeks ini memiliki ketepatan dan keandalan yang tinggi dalam memberikan banyak kelompok optimum. Penentuan jumlah kelompok yang optimum yang akan digunakan dari kedua metode tersebut berdasarkan pada kiteria fungsi objektif, ukuran validitas, dan waktu komputasi. Adapun tujuan penelitian ini adalah membandingkan pengelompokkan antara metode fuzzy shell cluster dan fuzzy c-means cluster dengan menggunakan indeks validitas cluster dalam kasus pengelompokkan kabupaten/kota di Pulau Jawa berdasarkan variabel pembentuk IPM.

2. Tinjauan Pustaka

Pada bagian ini membahas bahan rujukan yang digunakan sebagai tinjauan pustaka, sebagai berikut:

2.1.Distribusi Multivariat Normal

Pengujian data normal multivariat di uji dengan membandingkan jarak kuadrat [8]:

(

) (

)

 adalah sampel random ke j, j=1,2,…,n, X adalah vektor rata-rata kolom,

1

S− _adalah

matrik varians kovarians, Hipotesis yang digunakan adalah H0 adalah data berdistribusi

normal multivariat sedangkan H1 adalah data tidak berdistribusi normal multivariat. H0

diterima jika nilai d2_j <χ2_p_,_αlebih dari 50%.

2.2.Pengujian Mean Vektor untuk Beberapa Populasi

Untuk melihat rata-rata vektor dari p buah populasi mempunyai nilai yang sama atau tidak, maka perlu dilakukan uji hipotesis. Bentuk hipotesisnya adalah

0

:

1 2

...

c

,

H

µ µ

=

= = =

µ µ



dan

H

1

:

paling sedikit ada satu

µ



i yang berbeda. Statistik uji

yang digunakan adalah Wilk’s Lambda dengan rumus [8]. Dimana tolak H0 jika

(4)

(

)(

)

2.3.Pengujian Covarian Matrik untuk Beberapa Populasi

Analisis selanjutnya adalah pengujian covarian matrik untuk beberapa populasi yang

menggunakan statistik uji Box M, dengan hipotesisnya:

H

₀

:

Σ = Σ = = Σ

₁ ₂

...

_csedangkan

. Terima hipotesa nol yang berarti matriks varian-kovarians

bersifat homogen jika 2 2₁

( 1) ( 1), 2

hitung

c q q α

χ ≤χ ₋ ₊ .

2.4.Teori Himpunan Fuzzy

Konsep dari himpunan fuzzy sejalan dengan himpunan tegas, hanya saja derajat atau tingkat keanggotaan dari himpunan fuzzy tersebut bersifat kontiyu dimana nilainya dalam

interval [0,1]. Dimisalkan didefinisikan suatu himpunan

Z

yang anggotanya dapat

dilambangkan dengan z. Suatu himpunan fuzzy A dalam

Z

yang didefinisikan dengan

{( , ( ) | }

A=∈ z uA z z Z , uA z( ) adalah fungsi keanggotaan untuk himpunan fuzzy A. Dimana

fungsi keanggotaan akan memetakan setiap elemen dari

Z

ke derajat keanggotaan antara 0

dan 1. Semakin nilai fungsi keanggotaan mendekati satu, maka semakin tinggi derajat atau tingkat keanggotaan z dalam A. Himpunan fuzzy dalam pengelompokan berperan dalam pembentukan fungsi dan tingkat keanggotaan dari setiap objek dalam kelompok.

2.5.Fuzzy C-means Cluster

Metode FCM merupakan pengembangan dari metode tak berhierarki c-means cluster yang mengalokasikan data ke dalam masing-masing kelompok dengan memanfaatkan teori

himpunan fuzzy. Dalam metode FCM digunakan variabel fungsi keanggotaan, uik, yang

merujuk pada seberapa besar kemungkinan suatu data bisa menjadi anggota ke dalam suatu kelompok. Kemudian [4] memperkenalkan suatu variabel m yang merupakan weigthing

exponent dari membership function. Nilai m mempunyai nilai diatas satu (1 < m < ∞). Pada

(5)

Fungsi keanggotaan untuk suatu data ke dalam suatu kelompok tertentu dihitung dengan menggunakan rumus sebagai berikut:

1

Fungsi keanggotaan tersebut diatas, merujuk pada seberapa besar kemungkinan suatu objek bisa menjadi anggota ke dalam suatu kelompok, atau derajat keanggotaan objek ke-k ke

kelompok ke-i, yang mempunyai nilai 0≤u_ik ≤1, dan

formulasi jarak yang digunakan, yang dirumuskan sebagai berikut:

2

dimana

v

_i adalah nilai pusat kelompok ke-i, dan

v

_jadalah nilai pusat kelompok ke-j yang

dihitung dengan menggunakan persamaan dibawah ini :

1

Dalam FCM, pusat awal kelompok masih belum akurat. Setiap data memiliki derajat keanggotaan untuk setiap kelompok, dengan melakukan perulangan akan memperbaiki pusat kelompok dan derajat keanggotaan, sehingga pusat kelompok akan bergerak menuju lokasi yang tepat. Perulangan ini berdasarkan pada minimalisasi fungsi objektif. Fungsi objektif didasarkan pada pendekatan jarak antara data dengan setiap pusat kelompok. Fungsi objektif yang digunakan pada FCM adalah sebagai berikut:

2

Berikut ini algoritma FCM sebagai berikut :

1. Menentukan jumlah kelompok yang akan dibentuk (2 ≤ c ≤ n)

2. Menginisialisasi matriks fungsi keanggotaan awal U0, biasanya dipilih secara acak.

3. Menghitung nilai pusat kelompok ke-k dengan menggunakan persamaan 3.

4. Menghitung matriks derajat keanggotaan yang baru Ut+1 dengan persamaan 1.

Menbandingkan nilai keanggotaan dalam matriks

U

, jika Ut+1−Ut <

ε

maka sudah

konvergen dan iterasi dihentikan, dimana

ε

merupakan nilai threshold yang ditentukan.

Jika Ut+1−Ut ≥

ε

, maka kembali ke langkah 4. Nilai threshold adalah suatu bilangan

positif yang kecil sekali mendekati nol, 0.00001 (10-5).

2.6.Fuzzy C-shell Cluster

Algoritma pada fuzzy c-shell cluster, bentuk dasar dari kelompok adalah p-dimensi

(6)

ℜ

adalah himpunan riil, dan ℜpadalah himpunan dari p-tuples. Misalkan

   menjadi suatu himpunan data yang infinte sedimikian

k

x

∈

X



adalah vektor ke-k. Misal

U

∈

M

fcadalah keanggotaan dari X; dan misal V adalah

c-tuple

{

v v₁, ₂,,vc

}

 Untuk FCS, fungsi objektifnya adalah sebagai berikut :

2

 

merupakan formulasi jarak yang dirumuskan

sebagai berikut:

Fungsi keanggotaannya dirumuskan sebagai berikut : 1

Berikut ini algoritma FCS [6] sebagai berikut:

1. Menentukan jumlah kelompok yang akan dibentuk (2 ≤ c ≤ n) :

2. Menginisialisasi matriks fungsi keanggotaan awal U0, biasanya dipilih secara acak.

3. Menghitung pusat kelompok

v

_i dan jari-jari kelompok

r

_i dengan mengunakan persamaan

3 dan 10, dibawah ini:

4. Menghitung jarak,

D

_ik2 menggunakan persamaan 6

5. Menghitung matriks derajat keanggotaan yang baru Ut+1 dengan persamaan 7.

6. Membandingkan nilai keanggotaan dalam matriks

U

, jika Ut+1−Ut <

ε

maka sudah

konvergen dan iterasi dihentikan, dimana

ε

merupakan nilai threshold yang ditentukan.

Jika Ut+1−Ut ≥

ε

, maka kembali ke langkah 4. Nilai threshold adalah suatu bilangan

positif yang kecil sekali mendekati nol, 0.00001 (10-5).

2.7.Indeks Validitas

(7)

yang optimum. Kriteria banyak kelompok yang optimum ditunjukan pada nilai Indeks Xie dan Beni yang minimum pada lembah pertama. Indeks Xie dan Beni adalah sebagai berikut :

2

2.8.Indeks Pembangunan Manusia (IPM)

Salah satu indikator keberhasilan pembangunan adalah Indeks Pembangunan Manusia (IPM), dimana IPM sebagai indikator modal manusia dalam mencapai kualitas hidup yang lebih baik tergambar melalui komponen pendidikan, ekonomi, dan kesehatan. Penghitungan IPM didasarkan 4 variabel yang memliki satuan pengukuran yang berbeda, terdiri dari: peluang hidup (diukur dengan variabel Angka Harapan Hidup dalam tahun), pendidikan (diukur dengan variabel Angka Melek Huruf dalam persen dan Angka Rata-rata Lama Sekolah dalam tahun), dan hidup layak (diukur dengan variabel paritas daya beli perbulan dalam rupiah).

3. Metodologi Penelitian

Data yang digunakan dalam penelitian ini adalah data sekunder yang diperoleh dari Publikasi Badan Pusat Statistik (BPS) 2009 mengenai IPM menurut kabupaten/kota tahun 2008. Komponen-komponen IPM tersebut dipakai sebagai variabel dalam penelitian ini. Variabel tersebut yaitu:

1. X1 = Angka harapan hidup (tahun)/AHH

2. X2 = Angka melek huruf (persen)/AMH

3. X3 = Rata-rata lama sekolah (tahun)/MYS

4. X4 = Rata-rata pengeluaran riil per kapita per bulan (ribuan Rp)/PPP

Obyek dari penelitian ini adalah kabupaten/kota di pulau Jawa sebanyak 117 kabupaten/kota, terdiri dari 33 kota dan 84 kabupaten.

Tahapan penelitian adalah sebagai berikut :

a. Melakukan pengelompokkan dari c=2 sampai 10, baik dengan menggunakan FCM dan

FCS, serta menentukan faktor fuzzy (weigthing exponent) hasil pengelompokkan(m). Pada penelitian ini digunakan m = 2,

b. Menghitung indeks validitas clustering, dengan indeks Xie dan Beni, untuk metode FCM

dan FCS.

c. Membandingkan hasil pengelompokkan yang terbentuk dari FCM dan FCS dengan jumlah

(8)

4. Hasil dan Pembahasan

Berikut ini deskripsi variabel penelitian yang digunakan dapat dilihat pada Tabel 1. Berdasarkan Tabel 1 dapat dijelaskan bahwa standar deviasi yang paling tinggi adalah pada

variabel X4, ini menunjukkan bahwa variansi data pada variabel tersebut cukup bervariasi,

sedangkan standar deviasi yag paling kecil adalah pada variabel X3.

Tabel 1. Statistik Diskriptif Variabel Penelitian

Variabel N Min Max Rata-rata Standar Deviasi

X1 117 60.560 74.430 68.743 2.903

X2 117 64.120 93.010 91.843 6.293

X3 117 3.770 11.420 7.604 1.603

X4 117 588.04 647.03 632.00 9.29

Sebelum proses pengelompokkan, dilakukan terlebih dahulu pengujian multivariat normal terhadap variabel penelitian tersebut. Pemeriksaan distribusi multivariat normal dapat

dilakukan dengan cara membuat q-q plot dari nilai

d

2_j[8]. Jika hasi q-q plot nilai

d

2_j

menunjukan ada lebih 50 persen yang memiliki nilai

d

2_j

≤

χ

_n2_;0.05maka keputusan yang

diambil adalah gagal menolak H0, yang berarti bahwa data berdistribusi multivariate normal.

Hasil pengujian asumsi multivariat normal, menunjukkan bahwa ada 61,53 persen data yang

memiliki nilai

d

2_j

≤

χ

_n2_;0.05sehingga dapat disimpulkan bahwa data telah berditribusi

multivariat normal, dan data dapat dilakukan proses pengelompokkan dengan menggunakan kedua metode tersebut.

Dengan data yang telah berdistribusi multivariat normal, maka tahapan berikutnya adalah melakukan pengelompokkan dengan mengunakan metode FCM dan metode FCS. Jumlah kelompok yang digunakan sebagai input adalah c= 1 sampai dengan c =10. Dengan melakukan 10 kali pengulangan, hasil dari ukuran kriteria pengelompokkan disajikan pada Tabel 2. Dari Tabel 2, dapat dilihat bahwa nilai fungsi objektif semakin menurun, apabila jumlah kelompok yang inginkan bertambah. Pada jumlah kelompok sama dengan dua, banyaknya iterasi hampir sama pada setiap pengulangan, dengan rata-rata iterasi sebanyak 15,6 iterasi. Demikian juga untuk nilai fungsi objektif yang nilainya relatif sama, yang berarti fungsi objektif ini konvergen pada nilai 54,9181. Nilai indeks validitas Xie dan Beni pada c=2, pada setiap pengulangan nilai relatif sama, yaitu pada nilai 0,0019. Pada c=5, jumlah iterasi berbeda pada setiap pengulangan, namun nilai fungsi objektif relatif sama. Nilai indeks validitas Xie dan Beni pada setiap pengulangan menghasilkan nilai yang relatif sama, dengan rata-rata 0,0037. Pada setiap pengulangan, jumlah iterasi pada c = 5 sampai dengan c = 10, mendapatkan hasil yang berbeda satu dengan yang lain. Apabila memperhatikan algoritma FCM, dapat dilihat bahwa FCM, pada tahap awal, inisialisasi derajat keanggotaannya dilakukan secara random.

(9)

Sehingga sesuai dengan kreteria diatas bahwa jumlah kelompok mencapai optimum dengan jumlah kelompok sebanyak 6, dimana rata-rata iterasinya 154,90 dan nilai indeks validitas Xie dan Beni pada lembah pertama minimum, sebesar 0,0036.

Tabel 2 Rata-rata Iterasi, Fungsi Objektif, Indeks Xie dan Beni, dan Waktu

Komputasi, dengan metode FCM Jumlah

kelompok

Banyaknya

Iterasi Fungsi Objektif

Indeks Xie dan

Beni Waktu Komputasi

2 15,6 54,91810502 0,001993298 0,741448173

3 22,1 31,91411894 0,002263152 1,011946319

4 60,6 22,85390327 0,005038049 1,217283024

5 133,6 18,03633625 0,003781829 1,393808393

6 154,9 14,70658773 0,003641467 1,786786863

7 188,5 12,11427890 0,003735356 2,279097467

8 177,3 10,37901985 0,004283722 2,421107644

9 121,5 9,125209527 0,004060736 2,676930352

10 112,4 8,010650976 0,003941949 2,536219871

Pada metode FCS juga menggunakan jumlah kelompok sebagai input adalah c= 1 sampai dengan c =10, serta setiap kelompok dilakukan 10 kali pengulangan, hasil dari ukuran kriteria pengelompokkan dapat disajikan pada Tabel 3. Pada metode FCS, nilai fungsi objektifnya menunjukkan, bahwa semakin turun apabila jumlah kelompok semakin bertambah, dapat dilihat pada Tabel 3. Setiap penggulangan pada jumlah kelompok c=2, memberikan hasil yang relatif sama. Namun pada jumlah kelompok c=3 sampai dengan c=10, hasil setiap pengulangan, memberikan hasil yang relatif berbeda. Hal ini disebabkan pada tahap inisialisasi awal derajat keanggotaan dilakukan secara random. Pada algoritma FCS juga memperhitungkan radius atau jari-jari pada masing-masing kelompok dalam menghitung jaraknya. Waktu komputasi yang dipakai untuk metode FCS, akan bertambah lebih lama apabila jumlah kelompok ditambahkan. Dengan metode FCM, waktu komputasi lebih cepat apabila dibandingkan dengan metode FCS.

Jumlah kelompok yang optimum pada metode FCS, juga menggunakan nilai indeks validitas Xie dan Beni, yang ditunjukkan pada nilainya yang minimum pada lembah pertama. Pada Tabel 3 menunjukkan nilai indeks validitas pada jumlah kelompok dua sampai dengan jumlah kelompok empat, nilainya semakin menurun, kemudian meningkat pada jumlah kelompok 5 namun turun lagi, sampai jumlah kelompok sebanyak 6. Sehingga sesuai dengan kreteria diatas bahwa jumlah kelompok mencapai optimum dengan jumlah kelompok sebanyak 4, dimana rata-rata iterasinya 40,4 dan nilai indeks validitas Xie dan Beni pada lembah pertama minimum, sebesar 0,0005.

Tahapan selanjutnya adalah melakukan pengujian perbedaan rata-rata kelompok untuk

masing-masing metode, berdasarkan hasil pengolahan didapatkan, dengan menggunakan uji

Wilks Lambda untuk kedua metode tersebut. Berdasarkan pengujian yang telah dilakukan

pada nilai Wilk’s Lambda (Λ*) untuk metode FCM dengan jumlah kelompok sebanyak 6

(10)

kecil yaitu sebesar 0.000 atau p-value < 0,05, sehingga dapat diputuskan untuk menolak H0

sehingga bisa dikatakan bahwa terdapat perbedaan rata-rata antar kelompok pada metode FCM yang terbentuk. Untuk metode FCS dengan menggunakan jumlah kelompok yang optimum

sebanyak 4 kelompok diperoleh nilai Wilk’s Lambda (Λ*), sebesar 0.7420 dan nilai Chi

Squarenya sebesar 33.4216. Nilai p-value yang diperoleh cukup kecil yaitu 0,000 bila dibandingkan dengan derajat kepercayaan atau p-value < 0,05, sehingga diputuskan untuk

menolak H0 yang berarti terdapat perbedaan rata-rata antar kelompok pada metode FCS.

Tabel 3 Rata-rata Iterasi, Fungsi Objektif, Indeks Xie dan Beni, dan Waktu

Komputasi, dengan metode FCS Jumlah

kelompok

Banyaknya

Iterasi Fungsi Objektif

Indeks Xie dan

Beni Waktu Komputasi

2 27,6 706,023521395 0,008038464 35,105140122

3 41,5 190,670830048 0,007628473 96,764461173

4 40,4 102,818966609 0,005013489 135,020787350

5 46,0 58,652288055 0,013566060 149,064922086

6 48,0 39,922629811 0,005645252 212,843493769

7 53,7 30,386437454 0,021967206 270,998872936

8 54,9 23,650643668 0,014782679 313,227428878

9 41,9 21,008471343 0,017612013 317,912637367

10 42,5 14,652646693 0,007557815 352,556117707

Pengelompokkan kabupaten/kota dengan menggunakan metode FCM diperoleh 6 kelompok, sedangkan pengelompokkan dengan menggunakan FCS diperoleh 4 kelompok. Untuk mengetahui hasil pengelompokkan yang lebih baik dari kedua metode tersebut maka digunakan uji homogenitas. Uji Box’s M digunakan untuk uji homogenitas hasil pengelompokkan. Berdasarkan hasil pengolahan didapatkan hasil Uji Box’s M untuk kedua metode tersebut. Dengan metode FCM, hasil uji Box’s M sebesar 62,5243 dengan nilai Chi-square sebesaar 55.1648, sedangkan untuk pengelompokkan dengan metode FCS sebesar 30.0946 dengan nilai chi-square 27.6152. Kedua nilai p-value menunjukkan lebih besar dari

nilai α= 0,05 yang berarti gagal tolak H0 , maka dapat disimpulkan bahwa matriks varians dan

kovarians dari kedua metode tersebut adalah sama (homogen).

Pada jumlah kelompok 4 dengan menggunakan metode FCM, nilai indeks Xie dan Beni mempunyai selisih sedikit dengan jumlah kelompok yang sama pada FCS. Namun pada nilai fungsi objektif, metode FCM lebih kecil daripada metode FCS, demikian juga dengan waktu komputasinya yang lebih cepat daripada metode FCS. Dengan melihat jumlah kelompok pada metode FCM dengan jumlah kelompok yang sama pada metode FCS yaitu 6 kelompok, dapat dilihat bahwa nilai indeks validitas Xie dan Beni nilainya lebih kecil daripada dengan metode FCS. Demikian juga dengan waktu komputasi yang dibutuhkan semakin cepat. Pada kasus ini metode FCM lebih baik untuk digunakan daripada FCS. Oleh karena itu, hasil pengelompokkan dengan metode fuzzy c-means cluster akan digunakan untuk pengelompokkan kabupaten/kota berdasarkan variabel IPM.

(11)

sebanyak 6 kelompok. Banyaknya kabupaten/kota anggota kelompok pertama sampai dengan kelompok keenam berturut-turut 28, 25, 8, 29, 12, 15.

Setelah kelompok terbentuk, terhadap seluruh obyek penelitian sebanyak 117 kabupaten/kota diambil rata-rata dari masing-masing variabel pembentuk IPM, yaitu AHH,

AMH, MYS, dan PPP

( )

X

dapat dilihat Tabel 1. Selanjutnya masing-masing kelompok

diambil rata-rata untuk variabel AHH, AMH, MYS, dan PPP (Xc). Pada setiap variabel di

dalam kelompok diberi tanda, jika (X_c≥ X) adalah tanda + , sedangkan apabila

(X_c< X)akan diberikan tanda –. Pada Tabel 4 memberikan hasil selengkapnya.

Dari Tabel 4, dapat kita amati bahwa keompok 3 dan kelompok 4 mempunyai kesamaan karakteristik. Nilai rata-rata variabel AHH, AMH, MYS, dan PPP di dalam kelompok masih berada dibawah rata-rata tersebut untuk semua kabupaten/kota di pulau Jawa. Apabila dilihat dari nilai rata-rata variabel pada kelompok 6 lebih besar daripada nilai rata-rata variabel pada kelompok 3, kecuali untuk variabel PPP.

Tabel 4 _{Karateristik Kelompok berdasarkan Rata-rata}

Kelompok Karekteristik

AHH AMH MYS PPP

1 + – – –

2 + + + +

3 – – – –

4 – + – –

5 + – – +

6 – – – –

Karakteristik kelompok yang paling berhasil dari kelompok lainnya adalah kelompok ke-2, pada rata-rata nilai variabel-variabel pembentuk IPM merupakan yang tertinggi diantara kelompok lainnya. Pada kelompok ke-5, variabel yang memiliki nilai rata diatas nilai rata-rata di pulau Jawa adalah variabel angka harapan hidup dan paritas daya beli, sehingga variabel yang perlu mendapatkan perhatian adalah variabel pendidikan yaitu angka melek huruf dan rata-rata lamanya sekolah. Kelompok ke-4, variabel yang memiliki nilai rata-rata diatas nilai rata-rata di pulau Jawa hanya pada angka melek huruf, sedangkan variabel lainnya berada di bawah nilai rata-rata di pulau Jawa, yaitu angka harapan hidup, rata-rata lamanya sekolah dan paritas daya beli. Sehingga variabel tersebut yang mendapatkan perhatian untuk pembangunan manusia yang lebih baik. Pada kelompok pertama, hanya variabel angka harapan hidup yang nilai rata-ratanya diatas nilai rata-rata di pulau Jawa, sehingga untuk kelompok ini, variabel yang perlu dilakukan ditingkatkan adalah variabel angka melek huruf, rata-rata lama sekolah dan paritas daya beli. Pada kelompok ke-3 dan kelompok ke-6, merupakan kelompok yang semua nilai rata-rata variabelnya dibawah nilai rata-rata di pulau Jawa. Kelompok ke-6 nilai rata-rata variabelnya lebih bagus daripada nilai rata-rata di kelompok pertama. Variabel-variabel pada kelompok pertama memiliki nilai rata-rata terendah diantara kelompok lainnya.

(12)

5. Kesimpulan

Berdasarkan hasil dan pembahasan yang dilakukan pada bab sebelumnya dapat diambil kesimpulan bahwa berdasarkan nilai indeks validitas Xie dan Beni yang minimum pada lembah pertama, hasil pengelompokkan dengan menggunakan metode fuzzy c-means

cluster diperoleh sebanyak 6 kelompok, dengan nilai indeks validitas Xie dan Beni 0,0036.

Hasil pengelompokkan dengan menggunakan metode fuzzy c-shell cluster diperoleh sebanyak 4 kelompok, dengan nilai indeks validitas Xie dan Beni 0,005. Berdasarkan nilai fungsi objektif, nilai indeks validitas Xie dan Beni, serta waktu komputasinya, metode fuzzy c-means

cluster digunakan sebagai metode yang akan digunakan dengan jumlah kelompok sebanyak 6

kelompok.

Daftar Pustaka

[1] _{Abonyi, J. dan Szeifert, (2002), “Supervised Fuzzy Clustering for the Identification of}

Fuzzy Classifiers”, Journal Elseiver, Vol. 24, 2195-2207

[2] Hoppner, F. dan Klawonn, F., (2004), “Learning Fuzzy Systems – An Objective

Function-Approach”,Mathware & Soft Computing, Vol 11, pp.143-162

[3] Dunn, J. (1973). A Fuzzy Relative of the ISODATA Process and Its Use in Detecting

Compact well-Separated Cluster. Jurnal of Cybernetic 3 , 32-37.

[4] Bezdek, J. (1981). Pattern Recognition with Fuzzy Objective Function Algorithm. New

York: Plenum Press.

[5] Shihab, A. (2000). Fuzzy Clustering Algorithm and Their Application to Medical

Image Analysis. Dissertation, University of London, London.

[6] Dave, R. (1992). Generalized Fuzzy C-Shell Clustering and Detection of Circular and

Elliptical Boundaries. Pattern Recognition , Vol. 25 No. 7, 713-721

[7] Duo, C., Xue, L., & Du-Wu, C. (2007). An Adaptive Cluster Validiti Index for the

Fuzzy C-Means. International Journal of Computer Science and Nework Security 7

No. 2 , 146-156.

[8] Johnson, RA, & Wichern, E. (2002), Applied Multivariate Statistical Analysis,

Prentice-Hall, New York

[9] Rencher, A.C. (2002), Methods of Multivariate Analysis, John Wiley and Sons, New York [10] Yu, J., Cheng, Q., & Huang, H. (2004). Analysis of the Weighting Exponent in the

FCM. IEEE Transactions on Systems, Man, and Cybernetics , vol 34, 634-639.

[11] Wu, K.-L., & Yang, M.-S. (2005). A Cluster Validity Index for Fuzzy Clustering.

Pattern Recognition Letters , 1275–1291.

(13)