• Tidak ada hasil yang ditemukan

Perbandingan metode penggerombolan dengan komponen utama nonlinier dan gerombol dua langkah pada data campuran

N/A
N/A
Protected

Academic year: 2017

Membagikan "Perbandingan metode penggerombolan dengan komponen utama nonlinier dan gerombol dua langkah pada data campuran"

Copied!
24
0
0

Teks penuh

(1)

PERBANDINGAN METODE PENGGEROMBOLAN DENGAN

KOMPONEN UTAMA NONLINIER DAN GEROMBOL DUA

LANGKAH PADA DATA CAMPURAN

YOGI YUNIANTO

DEPARTEMEN STATISTIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

INSTITUT PERTANIAN BOGOR

(2)

RINGKASAN

YOGI YUNIANTO. Perbandingan Metode Penggerombolan Dengan Komponen Utama Nonlinier Dan Gerombol Dua Langkah Pada Data Campuran. Dibimbing oleh MOHAMMAD MASJKUR dan PIKA SILVIANTI.

Skala pengukuran yang berbeda sering ditemui pada berbagai kasus, termasuk pada kasus penggerombolan. Dalam kasus penggerombolan jika terdapat perbedaan skala pengukuran pada peubah yang akan digerombolkan, maka metode penggerombolan konvensional tidak dapat digunakan. Diperlukan penanganan khusus atau metode tertentu untuk menggerombolkan peubah yang memiliki skala campuran, yaitu skala numerik dan kategorik.Pada studi ini, akan dilakukan pembandingan hasil penggerombolan dengan melakukan dua metode yang berbeda, yaitu dengan transformasi terhadap data menggunakan Analisis Komponen Utama Nonlinier dan dengan menggunakan metode penggerombolan dua langkah. Data yang digunakan dalam penelitian ini adalah data kesejahteraan daerah – daerah di wilayah Jawa Barat. Hasil penggerombolan optimum dengan menggunakan metode gerombol dua langkah menghasilkan tiga gerombol, sementara penggerombolan menggunakan pautan centroid dengan transformasi AKU Nonlinier menghasilkan dua gerombol. Metode gerombol dua langkah dapat menjelaskan hasil penggerombolan yang lebih baik dan lebih spesifik dibandingkan metode pautan centroid dengan transformasi AKU Nonlinier. Selain itu, keragaman dalam gerombol dan antar gerombol yang dihasilkan metode gerombol dua langkah juga lebih baik dibandingkan metode pautan centroid dengan transformasi AKU Nonlinier. Hal ini menjelaskan bahwa metode gerombol dua langkah lebih baik dibandingkan metode pautan centroid dengan transformasi AKU Nonlinier.

(3)

PERBANDINGAN METODE PENGGEROMBOLAN DENGAN

KOMPONEN UTAMA NONLINIER DAN GEROMBOL DUA

LANGKAH PADA DATA CAMPURAN

YOGI YUNIANTO

Skripsi Sebagai Salah Satu Syarat untuk Memperoleh

Gelar Sarjana Statistika pada Departemen Statistika

DEPARTEMEN STATISTIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

INSTITUT PERTANIAN BOGOR

(4)

Judul : Perbandingan Metode Penggerombolan Dengan Komponen Utama Nonlinier Dan Gerombol Dua Langkah Pada Data Campuran

Nama : Yogi Yunianto NRP : G14060730

Menyetujui,

Pembimbing I Pembimbing II

Ir. Mohammad Masjkur, MS Pika Silvianti, S.Si, M.Si NIP. 19610608 1986011002

Mengetahui, Ketua Departemen Statistika

Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor

Dr. Ir. Hari Wijayanto NIP. 19650421 1990021001

(5)

KATA PENGANTAR

Segala puji hanya milik Allah, kami memuji-Nya, memohon pertolongan kepada-Nya, memohon ampun kepada-Nya dan berlindung kepada-Nya dari kejelekan diri – diri kami serta dari kejelekan amalan kami. Shalawat serta salam semoga tercurah kepada junjungan kita Nabi Muhammad SAW, kepada keluarganya, sahabatnya, dan pengikutnya yang setia hingga akhir zaman.

Banyak ilmu, pelajaran dan masukan yang penulis dapatkan dan rasakan selama proses penyusunan karya ilmiah ini, sehingga pada kesempatan kali ini penulis ingin mengucapkan terima kasih kepada:

1. Bapak Ir. Mohammad Masjkur, MS dan ibu Pika Silvianti, M.Si selaku pembimbing yang telah meluangkan waktu, serta memberikan saran dan masukan yang bermanfaat bagi penulis.

2. Kedua orang tua, Mama dan Papa yang telah sabar mendidik penulis dan memberi penulis semangat agar cepat lulus serta kepada seluruh kakak penulis.

3. Tiara Kencana Ayu, atas dukungan, bantuan, masukan, semangat dan keceriaannya yang telah diberikan kepada penulis.

4. Teman – teman STK 43 dan teman – teman Radiv Community atas semangat dan bantuannya serta masukan yang diberikan.

5. Teman – teman Statistika Center atas dukungan dan ilmunya.

6. Serta kepada semua pihak yang telah membantu penulis dalam proses penyusunan karya ilmiah ini, yang tidak dapat penulis tuliskan satu per satu.

Akhir kata, penulis meminta maaf apabila dalam proses penyusunan karya ilmiah ini terdapat kesalahan – kesalahan yang dilakukan oleh penulis. Semoga karya ilmiah ini bermanfaat.

Bogor, Januari 2011

(6)

RIWAYAT HIDUP

Penulis dilahirkan di kota Bekasi pada tanggal 27 Juni 1988 sebagai anak kelima dari pasangan Bapak Sukma Janani Tamin dan Ibu Mega Lelasuari. Penulis berasal dari Sumatra Barat. Pada tahun 2000 penulis lulus dari SD Negeri Jatibening VII Bekasi, dan melanjutkan ke sekolah menengah pertama SLTP Negeri 255 Jakarta. Penulis menyelesaikan studi di SMU Negeri 61 Jakarta pada tahun 2006 dan pada tahun yang sama penulis diterima di Institut Pertanian Bogor melalui jalur Undangan Seleksi Masuk IPB (USMI). Pada tahun 2007, penulis diterima di departemen Statistika Institut Pertanian Bogor.

(7)

DAFTAR ISI

Hal

DAFTAR TABEL………... vii

DAFTAR GAMBAR……… vii

DAFTAR LAMPIRAN………. vii

PENDAHULUAN Latar Belakang………. 1

Tujuan……….. 1

TINJAUAN PUSTAKA Analisis Gerombol………...……...………...…………...……… 1

Analisis Komponen Utama Nonlinier……….. 1

Analisis Gerombol Dua Langkah………. 2

Keragaman Gerombol……….. 3

Validitas Gerombol……….. 3

METODOLOGI Data………... 4

Metode……….. 4

HASIL DAN PEMBAHASAN Deskripsi Data……….. 4

Analisis Komponen Utama Nonlinier……….. 4

Gerombol Pautan Centroid dengan Transformasi Komponen Utama Nonlinier…….…… 5

Gerombol Dua Langkah………... 5

Perbandingan Hasil Penggerombolan………... 7

SIMPULAN DAN SARAN Simpulan………... 7

Saran………. 7

DAFTAR PUSTAKA……… 7

(8)

DAFTAR TABEL

Hal

1. Hasil AKU Nonlinier………... 4

2. Validasi Gerombol Optimum ….……….. 5

3. Distribusi Hasil Penggerombolan……….. 5

4. Distribusi Hasil Penggerombolan……….. 5

5. Perbandingan Keragaman Gerombol………. 7

DAFTAR GAMBAR

Hal 1. Daerah Contoh………...……… 4

2. Letak Wilayah ………...………... 4

DAFTAR LAMPIRAN

Hal 1. Peubah – peubah yang Digunakan dalam Analisis Gerombol…………... 9

2. Nilai Komponen Loading Analisis Komponen Utama Nonlinier ………. 10

3. Tabel Rasio Perubahan BIC (Bayesian Information Criterion)………. 11

4. Ukuran Masing-masing Gerombol Pada Metode Gerombol Dua Langkah……… 12

5. Tingkat Kepentingan Peubah Kontinu dari Gerombol Pertama pada Metode Pautan Centroid………... 12

6. Tingkat Kepentingan Peubah Kontinu dari Gerombol Pertama pada Metode Pautan Centroid………... 13

7. Tingkat Kepentingan Peubah Kategorik dari Gerombol Pertama pada Metode Gerombol Dua Langkah………... 13

8. Tingkat Kepentingan Peubah Kategorik dari Gerombol Kedua pada Metode Gerombol Dua Langkah……… 14

9. Tingkat Kepentingan Peubah Kategorik dari Gerombol Ketiga pada Metode Gerombol Dua Langkah……… 14

10.Tingkat Kepentingan Peubah Kontinu dari Gerombol Pertama pada Metode Gerombol Dua Langkah……… 15

11.Tingkat Kepentingan Peubah Kontinu dari Gerombol Kedua pada Metode Gerombol Dua Langkah……….... 15

(9)

1

PENDAHULUAN

Latar Belakang

Peneliti dalam studinya biasa memakai beberapa peubah untuk menggambarkan karakteristik populasi yang diteliti. Seringkali, peubah yang digunakan memiliki skala pengukuran yang berbeda, yaitu skala numerik dan kategorik.

Dalam penggerombolan jika skala peubah – peubah yang akan digerombolkan memiliki skala pengukuran yang berbeda, peneliti tidak dapat langsung menggunakan metode penggerombolan konvensional baik penggerombolan berhirarki maupun non-hirarki. Diperlukan penanganan khusus atau metode tertentu untuk menggerombolkan peubah yang memiliki skala campuran.

Metode alternatif untuk mengatasi masalah perbedaan skala pengukuran adalah metode transformasi Komponen Utama Nonlinier. Metode ini menghasilkan skor komponen obyek yang berskala rasio atau berjenis data numerik, sehingga dapat dianalisis menggunakan analisis penggerombolan. Pada penelitian terdahulu mengenai AKU Nonlinier dikatakan bahwa AKU nonlinier tidak dapat mentransformasi nilai data yang nilainya diatas 10000 (Anonim 2005).

Metode lainnya adalah metode penggerombolan dua langkah. Metode ini bertujuan untuk mengatasi masalah perbedaan skala pengukuran dalam penggerombolan, tanpa harus melakukan transformasi terhadap data.

Tujuan

Studi ini bertujuan untuk membandingkan metode penggerombolan jika peubah yang akan digerombolkan berskala campuran. Metode yang dibandingkan yaitu penggerombolan pautan centroid dengan transformasi Komponen Utama Nonlinier dan Metode Penggerombolan Dua Langkah.

TINJAUAN PUSTAKA

Analisis Gerombol

Analisis gerombol merupakan suatu analisis statistika peubah ganda yang digunakan untuk mengelompokan objek pengamatan menjadi beberapa gerombol berdasarkan ukuran kemiripan antar objek, sehingga objek – objek yang berada dalam satu gerombol memiliki kemiripan yang lebih

besar dibandingkan objek dari gerombol yang berbeda (Johnson & Wichern 1992).

Salah satu ukuran jarak yang paling umum dipakai dalam analisis gerombol adalah ukuran jarak Euclid yang didefinisikan sebagai berikut

dimana:

dij = jarak objek ke-i dengan objek ke-j

xi1 = nilai objek ke-i pada peubah ke-1

xj1 = nilai objek ke-j pada peubah ke-1

p = banyaknya peubah yang diamati Secara umum terdapat dua metode penggerombolan, yaitu metode berhirarki dan metode tidak berhirarki. Metode berhirarki mengelompokkan dua atau lebih objek yang mempunyai kesamaan paling dekat, kemudian proses diteruskan ke objek lain yang mempunyai kedekatan kedua. Metode tak berhirarki dimulai dengan menentukan terlebih dahulu jumlah gerombol yang diinginkan sehingga sifat pengelompokkannya tidaklah alamiah karena dikondisikan untuk jumlah kelompok tertentu.

Metode Pautan Centroid

Metode ini merupakan metode penggerombolan berhirarki. Pada metode ini jarak antara dua gerombol didefinisikan sebagai jarak antar centroid gerombol kedua gerombol tersebut. Centroid gerombol adalah nilai tengah observasi pada variabel dalam suatu set variabel gerombol. Keuntungan metode ini adalah tidak terlalu dipengaruhi oleh pencilan. Jarak centroid didefinisikan sebagai berikut

dengan:

cent(wi,wj) = jarak centroid gerombol i dan j.

Ni = jumlah objek gerombol ke-i.

Nj = jumlah objek gerombol ke-j.

dm = jarak antara objek ke-m dalam

gerombol i dengan centroidnya. dn = jarak antara objek ke-n dalam

gerombol j dengan centroidnya.

Analisis Komponen Utama Nonlinier

(10)

2

dengan menggunakan pendekatan alternating least squares (Gifi 1990).

Apabila terdapat suatu data yang dibentuk ke dalam matriks H yang berukuran n x m, maka untuk memudahkan perhitungan Analisis Komponen Utama Nonlinier dipakai notasi: bernilai satu dan lainnya 0.

Model Analisis Komponen Utama Nonlinier adalah sebagai berikut

1 2$2

2

dimana i = 1,2,…,n; j = 1,2,…,m; s = 1,2,…,p. Analisis Komponen Utama Nonlinier didasarkan pada teori meet loss yang bertujuan untuk meminimumkan fungsi homogeneity loss 34 : sedikit p. Algoritma alternating least squares

untuk meminimumkan 34 adalah,

6 ; <8 /=5

algoritma diatas juga menghitung dimensi dari ranking pertama p dari analisis kehomogenan secara simultan (Gifi 1990).

Analisis Gerombol Dua Langkah

Metode ini digunakan untuk mengatasi masalah skala pengukuran peubah yang berbeda, yaitu skala numerik dan skala kategorik. Jarak antar gerombol didefinisikan sebagai jarak dari vektor centroid masing – masing peubah yang terdapat dalam suatu gerombol. Jarak yang digunakan dalam metode analisis gerombol dua langkah adalah jarak Log-Likelihood dan jarak Euclid.

Jarak Log-Likelihood dapat digunakan untuk peubah numerik dan kategorik. Jarak Log-Likelihood didefinisikan sebagai berikut (Rong Liu 2005),

Penggerombolan dua langkah terdiri dari penggerombolan langkah awal dan penggerombolan optimal. Penggerombolan langkah awal dimulai dengan pembentukan

Clustering Feature Tree (CF Tree).

Selanjutnya, hasil dari CF Tree dipakai dalam penentuan gerombol optimal. Suatu gerombol dikatakan optimal apabila memiliki jarak antar gerombol paling jauh dan jarak antar objek paling dekat.

Gerombol optimal diperoleh setelah melakukan penghitungan terhadap nilai AIC (Akaike’s Information Criterion) dan BIC (Bayesian Information Criterion). Hasil perhitungan tersebut digunakan untuk menduga jumlah gerombol awal. Langkah kedua adalah mencari peningkatan jarak terbesar antara dua gerombol terdekat pada masing –masing tahapan penggerombolan.

(11)

3

? # W? #

dengan :

R(k1) = rasio perubahan jarak terbesar pertama

R(k2) = rasio perubahan jarak terbesar kedua

dan rumus R(k) sebagai berikut

? # X8 Y X

X (X8 (X

dengan :

R(k) = rasio perubahan jarak lv = (mvlog n – BICv)/2

v = k, k-1

dk-1 = jarak jika k gerombol digabungkan

dengan k-1 gerombol

Jika rasio perubahan lebih besar dari batas

c2 , jumlah gerombol optimum ditetapkan

Pada dasarnya pada penggerombolan terdapat dua keragaman, yaitu, keragaman dalam gerombol dan keragaman antar gerombol. Beberapa definisi keragaman yaitu (Lathifaturrahmah 2010),

1. Keragaman antar gerombol

ZZB [\ ]

^

SSB = Sum of Square Between Cluster

dengan : ] = rata-rata total seluruh objek

2. Keragaman dalam gerombol

ZZa [\

^ X

SSW = Sum of Square WithinCluster

dengan : xij = objek ke-i gerombol ke-j

[

\ = rata-rata objek pada gerombol j

k = banyaknya gerombol nj = banyaknya objek gerombol

ke-j

Hasil penggerombolan yang baik adalah jika objek dalam gerombol yang sama memiliki keragaman yang rendah sedangkan objek antar gerombol memiliki tingkat keragaman yang tinggi. Dengan kata lain, objek dalam satu gerombol memiliki tingkat kemiripan yang tinggi dan objek berbeda gerombol memiliki tingkat kemiripan yang rendah (Serban & Grigoreta 2006).

Validitas Gerombol

Uji validitas cluster digunakan untuk mengevaluasi hasil dari analisis cluster secara kuantitatif sehingga dihasilkan kelompok optimum. Kelompok optimum adalah kelompok yang mempunyai jarak yang padat antar individu dalam kelompok dan terisolasi dari kelompok lain dengan baik (Dubes & Jain 1988).

Indeks yang biasa dijadikan tolok ukur dalam pengujian validitas cluster antara lain, 1. Indeks Dunn (D)

2. Indeks Davies-Bouldin (DB)

<B bhig J = = N

dengan: n = jumlah kelompok = jarak antar kelompok

3. Indeks Scattering Dissimilarity (SD) Dasar dari indeks SD adalah rata – rata dari ketersebaran anggota gerombol dan total dari pemisahan gerombol.

Rata – rata ketersebaran anggota

Total pemisahan gerombol adalah

<"o bhi0n pm m p

Indeks SD didefinisikan sebagai

Z< u\ Z $ <"o

dengan : Scatt =Scattering

Dis = Dissimilarity

Dimana sebagai faktor pembobot yang nilainya sama dengan nilai parameter Dis

apabila jumlah gerombol maksimum terpenuhi.

(12)

4

METODOLOGI

Data

Data yang digunakan dalam penelitian ini adalah data sekunder, yaitu data hasil survey yang dilakukan oleh rand organization labor and population. Data tersebut merupakan data kesejahteraan penduduk pada daerah – daerah di Provinsi Jawa Barat (Indonesian Life Family Survey 2007).

Data tersebut diperoleh dari situs resmi

rand organization (www.rand.org). Data tersebut terdiri dari demografi wilayah di Jawa Barat dan karakteristik pekerjaan serta kesejahteraan dari penduduk di wilayah Jawa Barat. Objek yang dijadikan amatan dalam survey ini adalah desa – desa yang berada di Jawa Barat. Metode penarikan contoh yang digunakan dalam survey yang dilakukan oleh

rand organization ini adalah pengambilan contoh acak berstrata dengan kota atau kabupaten sebagai stratanya.

Peubah yang digunakan dalam penelitian ini sebanyak 19 peubah, 14 peubah kategorik dan 5 peubah kontinu, antara lain luas wilayah, letak pemukiman, bidang pekerjaan, dan peubah lainnya. Keterangan dari peubah yang dipakai dapat dilihat pada Lampiran 1.

Metode

Langkah – langkah yang digunakan dalam penelitian ini antara lain,

1. Melakukan eksplorasi terhadap data yang digunakan.

2. Melakukan analisis deskriptif untuk menjelaskan data yang digunakan. 3. A) Melakukan transformasi AKU

nonlinier terhadap data campuran untuk mendapatkan data skor komponen utama yang berskala rasio. Selanjutnya di lakukan penggerombolan pautan centroid terhadap skor komponen utama.

B) Melakukan uji validitas penggerombolan untuk menentukan jumlah gerombol optimum yang dapat diperoleh dari metode pautan centroid. 4. Melakukan penggerombolan dua langkah

terhadap data campuran.

5. Membandingkan hasil akhir penggerombolan dari masing – masing metode dan menghitung keragaman penggerombolan yang terbentuk dari masing – masing metode. Metode yang baik yaitu metode yang dapat menjelaskan dan memisahkan objek – objek yang jaraknya berbeda jauh dengan baik sementara objek yang mirip dijadikan sebagai satu gerombol.

HASIL DAN PEMBAHASAN

Deskripsi Data

Data yang digunakan merupakan data sekunder hasil survey yang terdiri dari 19 peubah, 14 peubah kategorik dan 5 peubah kontinu. Keterangan masing – masing peubah dapat dilihat pada Lampiran 1.

Daerah yang dijadikan contoh dalam survey tersebut merupakan desa – desa diwilayah Jawa Barat. Wilayah yang dijadikan contoh dapat dilihat pada Gambar 1. Terlihat bahwa desa di Kabupaten Bogor merupakan daerah dengan data contoh yang terbesar.

Gambar 1 Daerah Contoh

Sementara itu, untuk letak wilayah yang dijadikan contoh, sebanyak 65% didaerah yang mudah dijangkau. Sedangkan sebanyak 35% terletak didaerah terpencil (Gambar 2).

Gambar 2 Letak Wilayah

Analisis Komponen Utama Nonlinier

(13)

5

Tabel 1 Hasil AKU Nonlinier

KU akar ciri keragaman kumulatif 1 0.1712 18%

Hasil akhir Analisis Komponen Utama Nonlinier adalah skor komponen objek ke sembilan belas dimensi yang terbentuk, yang digunakan untuk analisis gerombol.

Gerombol Pautan Centroid dengan Transformasi Komponen Utama Nonlinier

Hasil dari komponen utama nonlinier berupa nilai skor rasio, digunakan sebagai data yang akan digerombolkan menggunakan metode pautan centroid. Hasil komponen

loading AKU Nonlinier dari 19 peubah yang telah ditransformasi dapat dilihat pada Lampiran 2.

Tabel 2 Validasi Gerombol Optimum Jumlah

Penggerombolan centroid menghasilkan dua gerombol. Gerombol pertama terdiri dari 520 objek, sementara gerombol kedua hanya memiliki dua objek saja. Dua gerombol merupakan solusi gerombol optimum yang dihasilkan oleh metode centroid (Tabel 2).

Dari Tabel 2 terlihat bahwa pada jumlah gerombol dua memiliki nilai indeks Dunn terbesar dibandingkan jumlah gerombol lainnya. Sementara itu, nilai indeks Davies dan SD-nya relatif kecil bila dibandingkan dengan jumlah gerombol lain.

Tabel 3 Distribusi Hasil Penggerombolan Gerombol N % Total

1 520 99.62% 2 2 0.38% Total 522 100%

Gerombol 1

Dari Tabel 3 terlihat bahwa gerombol satu memiliki 520 anggota dengan peubah yang mendasari penggerombolan yaitu peubah tipe jalan, letak area, rumah tangga penerima beras miskin (raskin) dan keberadaan pabrik. Dimana desa pada gerombol ini umumnya memiliki tipe jalan aspal dan program raskin terdapat diseluruh desa yang menjadi anggota pada gerombol ini. Peubah rumah tangga penerima raskin merupakan peubah yang membedakan desa digerombol satu dengan desa digerombol dua karena desa pada gerombol dua tidak ada rumah tangga yang menerima raskin. Keterangan kepentingan dari peubah – peubah untuk gerombol satu dapat dilihat pada Lampiran 5

Gerombol 2

Gerombol dua hanya memiliki dua anggota. Hal ini dikarenakan desa pada objek amatan ini berbeda dengan desa pada gerombol satu berdasarkan pada peubah program raskin. Kedua desa tersebut tidak pernah mendapat bantuan program raskin dari pemerintah. Kedua desa ini terletak di Bogor. Selain peubah program raskin yang mempengaruhi dasar penggerombolan pada gerombol dua, peubah penghasilan non-tani pria, tipe jalan dan sumber air rumah tangga juga turut mempengaruhi proses pembentukan gerombol pada gerombol dua. Keterangan kepentingan dari peubah – peubah untuk gerombol dua dapat dilihat pada Lampiran 6.

Gerombol Dua Langkah

(14)

6

bertipe kategorik dan kontinu. Dalam penentuan jumlah gerombol digunakan nilai BIC.

Gerombol yang dihasilkan pada tahap pertama sebanyak enam gerombol. Hal ini terlihat dari nilai rasio perubahan BIC yang pertama kali lebih kecil dari 0.04 (Tatara et.al

dalam Bacher 2004). Pada gerombol enam, nilai dari rasio tersebut sebesar 0.028. Sedangkan untuk menentukan gerombol optimal ditentukan dari rasio perhitungan jarak antara dua gerombol terbesar. Pada

Oleh karena itu, dalam kasus ini tiga gerombol merupakan solusi optimum. Distribusi dari anggota populasi dapat dilihat pada Tabel 4.

Tabel 4 Distribusi Hasil Penggerombolan Gerombol N % Total

Gerombol satu memiliki 164 anggota dengan peubah kategorik yang paling berpengaruh yang mendasari penggerombolan yaitu penghasilan bertani penduduk wanita dan penghasilan bertani penduduk pria sementara peubah kontinu yang berpengaruh adalah peubah rumah tangga penerima raskin dan peubah rumah tangga penerima Bantuan Langsung Tunai (BLT). Keterangan kepentingan dari peubah – peubah untuk gerombol satu dapat dilihat pada Lampiran 7 dan 10.

Desa pada gerombol satu umumnya terletak didaerah urban, yaitu sebanyak 146 desa, dan sisanya sebanyak 18 desa terletak didaerah rural. Pekerjaan utama yang banyak dijadikan profesi oleh penduduknya adalah dibidang industri dan perdagangan. Tidak terdapat satu orang pun penduduk desa digerombol ini, baik pria maupun wanita, yang bekerja dibidang pertanian. Ciri menonjol lainnya adalah jumlah rumah tangga yang menerima raskin dan menerima BLT lebih sedikit jika dibandingkan desa digerombol dua dan tiga, bahkan ada desa yang tidak menerima bantuan raskin. Anggota desa gerombol ini umumnya berasal dari Bandung, Kabupaten Bandung, Bogor, Bekasi, Depok dan Cirebon.

Gerombol 2

Gerombol dua memiliki jumlah anggota paling banyak yaitu 239 anggota, dengan peubah kategorik yang paling berpengaruh yaitu peubah penghasilan non-tani pria dan keberadaan pabrik sementara peubah kontinu tidak ada yang berpengaruh. Keterangan kepentingan dari peubah – peubah untuk masing – masing gerombol dapat dilihat pada Lampiran 8 dan 11.

Ciri utama anggota desa pada gerombol dua yaitu terdapat pabrik disemua desa. Dari 239 anggota gerombol, 143 desa terletak didaerah urban dan 96 desa terletak didaerah rural. Pekerjaan penduduk desa anggota gerombol dua didominasi oleh bidang industri dan pertanian. Penduduk prianya banyak yang berprofesi sebagai petani sementara penduduk wanitanya banyak yang menjadi buruh pabrik. Hal ini terlihat dari penghasilan bertani penduduk pria yang nilainya selalu ada disetiap objek dan penghasilan non-tani wanita yang nilainya juga selalu ada disetiap objek. Anggota desa gerombol dua umumnya berasal dari Kabupaten Bogor, Kabupaten Bekasi, Karawang, Cianjur, Sukabumi, Kabupaten Sukabumi, dan Subang.

Gerombol 3

Gerombol tiga memiliki 119 anggota dengan peubah kategorik yang mendasari penggerombolan yaitu keberadaan pabrik dan penghasilan non-tani pria maupun wanita sementara peubah kontinu tidak ada yang berpengaruh. Keterangan kepentingan dari peubah – peubah untuk gerombol satu dapat dilihat pada Lampiran 9 dan 12.

(15)

7

Perbandingan Hasil Gerombol

Dari kedua metode yang digunakan untuk mengatasi masalah penggerombolan dengan data campuran, masing – masing metode menghasilkan keragaman yang berbeda, baik keragaman antar gerombol maupun keragaman dalam gerombol. Perbandingan keragaman gerombol untuk setiap metode yang digunakan dapat dilihat pada Tabel 5.

Tabel 5 Perbandingan Keragaman Gerombol

Keragaman Dalam Gerombol 179227.616 177687.283 Antar Gerombol 145489.014 425792.260 Rasio 1.2319 0.4173

Dari Tabel 5 dapat dilihat bahwa metode gerombol dua langkah menghasilkan keragaman dalam gerombol yang lebih kecil dibandingkan dengan AKU Nonlinier sementara keragaman antar gerombolnya lebih besar. Apabila dirasiokan antara keragaman dalam dengan keragaman antar gerombol, metode gerombol dua langkah menghasilkan rasio sebesar 0.4173 sementara metode pautan centroid transformasi AKU Nonlinier menghasilkan rasio sebesar 1.2319. Hal ini menjelaskan bahwa metode gerombol dua langkah lebih baik dibandingkan metode pautan centroid dengan transformasi AKU Nonlinier untuk kasus ini.

SIMPULAN DAN SARAN

Simpulan

Metode gerombol dua langkah dapat menjelaskan hasil penggerombolan yang lebih baik dan lebih spesifik dibandingkan metode pautan centroid dengan transformasi AKU Nonlinier dan keragaman penggerombolan untuk jumlah gerombol optimum yang lebih baik juga. Hal ini menjelaskan bahwa metode gerombol dua langkah lebih baik dibandingkan metode pautan centroid dengan transformasi AKU Nonlinier.

Gerombol optimum yang dihasilkan metode gerombol dua langkah adalah tiga gerombol sementara gerombol optimum yang dihasilkan metode pautan centroid dengan transformasi AKU Nonlinier adalah dua gerombol.

Saran

Saran untuk penelitian selanjutnya adalah membandingkan antara metode gerombol dua langkah dengan pendekatan penggerombolan lainnya menggunakan transformasi AKU Nonlinier dengan menggunakan data simulasi.

DAFTAR PUSTAKA

Anonim. 2005. Penggunaan Transformasi AKU Nonlinier dalam Data Campuran. http://www.topstats.com/~doc/465746. html. [16 Juni 2010]

Bacher J, Wenzig K, Vogler M. 2004. SPSS Two Step Cluster – A First Evaluation.

http://www.statisticalinnovations.com/p roducts/Two Step.pdf.[8 Juni 2010] BPS. 2008. Jawa Barat dalam Angka 2007.

Badan Pusat Statistik : Jakarta.

Dubes & Jain, A.K. 1988. Algorithm for Clustering Data. Prentice Hall : New Jersey.

Gifi, A. 1990. Nonlinear Multivariate Analysis. Chichester : John Wiley & Sons.

Johnson, R.A. & Wichern, D.W. 1992.

Applied Multivariate Statistical

Analysis. Edisi-3. New Jersey : Prentice Hall Inc.

Jolliffe, I.T. 2002. Principal Component Analysis. Second Edition. New York : Springer-Verlag.

Lathifathurrahmah. 2010. Perbandingan Hasil Penggerombolan Metode K-Means, Fuzzy K-Means, dan Two Step Cluster

[Tesis]. Bogor : Fakultas Matemetika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor

Liu, R. 2005. The SPSS Two-Step Cluster.

Departement of Mathematics : University of North Texas.

Serban, G. & Grigoreta, S.M. 2006. A Comparison of Clustering Techniques In Aspect Mining. Studia Univ.Babes-Bolyai.

(16)

8

(17)

9

Lampiran 1 Peubah – peubah yang Digunakan dalam Analisis Gerombol

Peubah Keterangan Tipe Peubah Satuan

X1 Letak Pemukiman Kategorik

1 : Urban

6 : Pedagang Besar, Restoran 7 : Transportasi, Gudang,

Komunikasi

8 : Keuangan, Insuransi, Pinjaman

9 : Pekerja Sosial 10 : Lainnya X4 Bidang Pekerjaan II Kategorik

X5 Bidang Pekerjaan III Kategorik

X6 Tipe Jalan Kategorik

1 : lewat kendaraan 2 : tidak

X11 Keberadaan Pabrik Kategorik

1 : ada

diterima RT Numerik Kilogram

X15 RT Penerima BLT Numerik Persen

X16

Penghasilan Bertani

Penduduk Pria Kategorik

1 : ada 2 : tidak ada 3 : tidak tahu X17 Penghasilan Bertani

Penduduk Wanita Kategorik

X18

Penghasilan Non-tani

Penduduk Pria Kategorik

X19 Penghasilan Non-tani

(18)

10

Lampiran 2 Nilai Komponen Loading Analisis Komponen Utama Nonlinier

X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 KU1 0.318 0.667 0.437 0.093 0.031 0.099 0.047 0 0.2 0.182 KU2 0.01 0.635 0.071 0.061 0.062 0.002 0.009 0 0.04 0.045 KU3 0.143 0.711 0.155 0.048 0.059 0.096 0 0 0.05 0.037 KU4 0.061 0.679 0.037 0.089 0.044 0.193 0.055 0 0.337 0.025 KU5 0 0.7 0.012 0.332 0.277 0.022 0.063 0 0.111 0.121 KU6 0.031 0.622 0.009 0.017 0.162 0.024 0.259 0 0.072 0.343 KU7 0 0.653 0.069 0.015 0.173 0.123 0.022 0 0.08 0.182 KU8 0.001 0.589 0.03 0.079 0.132 0.06 0.41 0 0.07 0.156 KU9 0.003 0.785 0.078 0.331 0.021 0.023 0.002 0 0.056 0.008 KU10 0.007 0.676 0.023 0.08 0.066 0.005 0.106 0 0.055 0.158 KU11 0 0.68 0.011 0.031 0.038 0.063 0.002 0 0.063 0.067 KU12 0.076 0.674 0.096 0.048 0.128 0.275 0.024 0 0.102 0.042 KU13 0.181 0.687 0.026 0.035 0.01 0.024 0 0 0.31 0.02 KU14 0.167 0.644 0.328 0.019 0.049 0.024 0.001 0 0.056 0.023 KU15 0.001 0.698 0.02 0.019 0.015 0.002 0 0 0.028 0.014 KU16 0 0.669 0.006 0.007 0.014 0.003 0.001 0 0.044 0.008 KU17 0 0.691 0.031 0.026 0.027 0.001 0 0 0.028 0.03 KU18 0 0.641 0.012 0.018 0.02 0 0 0 0.05 0.003 KU19 0 0.612 0.02 0.012 0.016 0.029 0 0 0.081 0.021

(19)

11

Lampiran 3 Tabel Rasio Perubahan BIC (Bayesian Information Criterion)

Jumlah

Gerombol Nilai BIC Perubahan BIC

Rasio Perubahan BIC

Rasio Pengukuran Jarak

1 14252.139

(20)

12

Lampiran 4 Ukuran Masing-masing Gerombol Pada Metode Gerombol Dua Langkah

(21)

13

Lampiran 6 Tingkat Kepentingan Peubah Kontinu dari Gerombol Kedua pada Metode Pautan Centroid

(22)

14

Lampiran 8 Tingkat Kepentingan Peubah Kategorik dari Gerombol Kedua pada Metode Gerombol Dua Langkah

(23)

15

Lampiran 10 Tingkat Kepentingan Peubah Kontinu dari Gerombol Pertama pada Metode Gerombol Dua Langkah

(24)

16

Gambar

Gambar 2  Letak Wilayah
Tabel 2  Validasi Gerombol Optimum
Tabel 4  Distribusi Hasil Penggerombolan
Tabel 5  Perbandingan Keragaman Gerombol
+2

Referensi

Dokumen terkait

Sistem lolos uji jika semua fungsi dalam sistem berjalan sesuai dengan yang diharapkan dan dapat membantu meningkatkan kualitas perusahaan dalam pelayanan terhadap client.

Sebagai bahan pangan, minyak kacang tanah dipergunakan untuk minyak goreng, bahan dasar pembuatan margarine, mayonnaise, salad dressing dan mentega putih (shortening) dan

Proses review yang dilakukan untuk pemenuhan standar akreditasi JCI telah dibakukan dalam bentuk Kebijakan JCI, namun proses review terhadap seluruh proyek perubahan,

LDR, FBIR, dan ROA secara parsial mempunyai pengaruh negatif yang tidak signifikan terhadap CAR, sedangkan PDN dan BOPO secara parsial mempunyai pengaruh positif yang tidak

Kesalahan timbul dalam bentuk burst yaitu lebih dari satu bit terganggu dalam satu satuan waktu.Deteksi error dengan Redundansi, yaitu data tambahan yang tidak ada

Pegawai negeri sipil sebagai aparatur negara perlu meningkatkan kinerjanya dalam melaksanakan tanggung jawabnya sebagai aparatur negara. Hal yang perlu diperhatikan

Selanjutnya, BI, LPS dan OJK juga memiliki kewenangan baru dalam rangka mengoptimalkan gabungan kebijakan moneter dan menjaga stabilitas ekonomi nasional (Aria,