RINGKASAN
YOGI YUNIANTO. Perbandingan Metode Penggerombolan Dengan Komponen Utama Nonlinier Dan Gerombol Dua Langkah Pada Data Campuran. Dibimbing oleh MOHAMMAD MASJKUR dan PIKA SILVIANTI.
Skala pengukuran yang berbeda sering ditemui pada berbagai kasus, termasuk pada kasus penggerombolan. Dalam kasus penggerombolan jika terdapat perbedaan skala pengukuran pada peubah yang akan digerombolkan, maka metode penggerombolan konvensional tidak dapat digunakan. Diperlukan penanganan khusus atau metode tertentu untuk menggerombolkan peubah yang memiliki skala campuran, yaitu skala numerik dan kategorik.Pada studi ini, akan dilakukan pembandingan hasil penggerombolan dengan melakukan dua metode yang berbeda, yaitu dengan transformasi terhadap data menggunakan Analisis Komponen Utama Nonlinier dan dengan menggunakan metode penggerombolan dua langkah. Data yang digunakan dalam penelitian ini adalah data kesejahteraan daerah – daerah di wilayah Jawa Barat. Hasil penggerombolan optimum dengan menggunakan metode gerombol dua langkah menghasilkan tiga gerombol, sementara penggerombolan menggunakan pautan centroid dengan transformasi AKU Nonlinier menghasilkan dua gerombol. Metode gerombol dua langkah dapat menjelaskan hasil penggerombolan yang lebih baik dan lebih spesifik dibandingkan metode pautan centroid dengan transformasi AKU Nonlinier. Selain itu, keragaman dalam gerombol dan antar gerombol yang dihasilkan metode gerombol dua langkah juga lebih baik dibandingkan metode pautan centroid dengan transformasi AKU Nonlinier. Hal ini menjelaskan bahwa metode gerombol dua langkah lebih baik dibandingkan metode pautan centroid dengan transformasi AKU Nonlinier.
1
PENDAHULUAN
Latar Belakang
Peneliti dalam studinya biasa memakai beberapa peubah untuk menggambarkan karakteristik populasi yang diteliti. Seringkali, peubah yang digunakan memiliki skala pengukuran yang berbeda, yaitu skala numerik dan kategorik.
Dalam penggerombolan jika skala peubah – peubah yang akan digerombolkan memiliki skala pengukuran yang berbeda, peneliti tidak dapat langsung menggunakan metode penggerombolan konvensional baik penggerombolan berhirarki maupun non-hirarki. Diperlukan penanganan khusus atau metode tertentu untuk menggerombolkan peubah yang memiliki skala campuran.
Metode alternatif untuk mengatasi masalah perbedaan skala pengukuran adalah metode transformasi Komponen Utama Nonlinier. Metode ini menghasilkan skor komponen obyek yang berskala rasio atau berjenis data numerik, sehingga dapat dianalisis menggunakan analisis penggerombolan. Pada penelitian terdahulu mengenai AKU Nonlinier dikatakan bahwa AKU nonlinier tidak dapat mentransformasi nilai data yang nilainya diatas 10000 (Anonim 2005).
Metode lainnya adalah metode penggerombolan dua langkah. Metode ini bertujuan untuk mengatasi masalah perbedaan skala pengukuran dalam penggerombolan, tanpa harus melakukan transformasi terhadap data.
Tujuan
Studi ini bertujuan untuk membandingkan metode penggerombolan jika peubah yang akan digerombolkan berskala campuran. Metode yang dibandingkan yaitu penggerombolan pautan centroid dengan transformasi Komponen Utama Nonlinier dan Metode Penggerombolan Dua Langkah.
TINJAUAN PUSTAKA
Analisis Gerombol
Analisis gerombol merupakan suatu analisis statistika peubah ganda yang digunakan untuk mengelompokan objek pengamatan menjadi beberapa gerombol berdasarkan ukuran kemiripan antar objek, sehingga objek – objek yang berada dalam satu gerombol memiliki kemiripan yang lebih
besar dibandingkan objek dari gerombol yang berbeda (Johnson & Wichern 1992).
Salah satu ukuran jarak yang paling umum dipakai dalam analisis gerombol adalah ukuran jarak Euclid yang didefinisikan sebagai berikut
dimana:
dij = jarak objek ke-i dengan objek ke-j xi1 = nilai objek ke-i pada peubah ke-1 xj1 = nilai objek ke-j pada peubah ke-1 p = banyaknya peubah yang diamati Secara umum terdapat dua metode penggerombolan, yaitu metode berhirarki dan metode tidak berhirarki. Metode berhirarki mengelompokkan dua atau lebih objek yang mempunyai kesamaan paling dekat, kemudian proses diteruskan ke objek lain yang mempunyai kedekatan kedua. Metode tak berhirarki dimulai dengan menentukan terlebih dahulu jumlah gerombol yang diinginkan sehingga sifat pengelompokkannya tidaklah alamiah karena dikondisikan untuk jumlah kelompok tertentu.
Metode Pautan Centroid
Metode ini merupakan metode penggerombolan berhirarki. Pada metode ini jarak antara dua gerombol didefinisikan sebagai jarak antar centroid gerombol kedua gerombol tersebut. Centroid gerombol adalah nilai tengah observasi pada variabel dalam suatu set variabel gerombol. Keuntungan metode ini adalah tidak terlalu dipengaruhi oleh pencilan. Jarak centroid didefinisikan sebagai berikut
dengan:
cent(wi,wj) = jarak centroid gerombol i dan j.
Ni = jumlah objek gerombol ke-i. Nj = jumlah objek gerombol ke-j. dm = jarak antara objek ke-m dalam
gerombol i dengan centroidnya. dn = jarak antara objek ke-n dalam
gerombol j dengan centroidnya.
1
PENDAHULUAN
Latar Belakang
Peneliti dalam studinya biasa memakai beberapa peubah untuk menggambarkan karakteristik populasi yang diteliti. Seringkali, peubah yang digunakan memiliki skala pengukuran yang berbeda, yaitu skala numerik dan kategorik.
Dalam penggerombolan jika skala peubah – peubah yang akan digerombolkan memiliki skala pengukuran yang berbeda, peneliti tidak dapat langsung menggunakan metode penggerombolan konvensional baik penggerombolan berhirarki maupun non-hirarki. Diperlukan penanganan khusus atau metode tertentu untuk menggerombolkan peubah yang memiliki skala campuran.
Metode alternatif untuk mengatasi masalah perbedaan skala pengukuran adalah metode transformasi Komponen Utama Nonlinier. Metode ini menghasilkan skor komponen obyek yang berskala rasio atau berjenis data numerik, sehingga dapat dianalisis menggunakan analisis penggerombolan. Pada penelitian terdahulu mengenai AKU Nonlinier dikatakan bahwa AKU nonlinier tidak dapat mentransformasi nilai data yang nilainya diatas 10000 (Anonim 2005).
Metode lainnya adalah metode penggerombolan dua langkah. Metode ini bertujuan untuk mengatasi masalah perbedaan skala pengukuran dalam penggerombolan, tanpa harus melakukan transformasi terhadap data.
Tujuan
Studi ini bertujuan untuk membandingkan metode penggerombolan jika peubah yang akan digerombolkan berskala campuran. Metode yang dibandingkan yaitu penggerombolan pautan centroid dengan transformasi Komponen Utama Nonlinier dan Metode Penggerombolan Dua Langkah.
TINJAUAN PUSTAKA
Analisis Gerombol
Analisis gerombol merupakan suatu analisis statistika peubah ganda yang digunakan untuk mengelompokan objek pengamatan menjadi beberapa gerombol berdasarkan ukuran kemiripan antar objek, sehingga objek – objek yang berada dalam satu gerombol memiliki kemiripan yang lebih
besar dibandingkan objek dari gerombol yang berbeda (Johnson & Wichern 1992).
Salah satu ukuran jarak yang paling umum dipakai dalam analisis gerombol adalah ukuran jarak Euclid yang didefinisikan sebagai berikut
dimana:
dij = jarak objek ke-i dengan objek ke-j xi1 = nilai objek ke-i pada peubah ke-1 xj1 = nilai objek ke-j pada peubah ke-1 p = banyaknya peubah yang diamati Secara umum terdapat dua metode penggerombolan, yaitu metode berhirarki dan metode tidak berhirarki. Metode berhirarki mengelompokkan dua atau lebih objek yang mempunyai kesamaan paling dekat, kemudian proses diteruskan ke objek lain yang mempunyai kedekatan kedua. Metode tak berhirarki dimulai dengan menentukan terlebih dahulu jumlah gerombol yang diinginkan sehingga sifat pengelompokkannya tidaklah alamiah karena dikondisikan untuk jumlah kelompok tertentu.
Metode Pautan Centroid
Metode ini merupakan metode penggerombolan berhirarki. Pada metode ini jarak antara dua gerombol didefinisikan sebagai jarak antar centroid gerombol kedua gerombol tersebut. Centroid gerombol adalah nilai tengah observasi pada variabel dalam suatu set variabel gerombol. Keuntungan metode ini adalah tidak terlalu dipengaruhi oleh pencilan. Jarak centroid didefinisikan sebagai berikut
dengan:
cent(wi,wj) = jarak centroid gerombol i dan j.
Ni = jumlah objek gerombol ke-i. Nj = jumlah objek gerombol ke-j. dm = jarak antara objek ke-m dalam
gerombol i dengan centroidnya. dn = jarak antara objek ke-n dalam
gerombol j dengan centroidnya.
2
dengan menggunakan pendekatan alternating least squares (Gifi 1990).
Apabila terdapat suatu data yang dibentuk ke dalam matriks H yang berukuran n x m, maka untuk memudahkan perhitungan Analisis Komponen Utama Nonlinier dipakai notasi: bernilai satu dan lainnya 0.
Model Analisis Komponen Utama Nonlinier adalah sebagai berikut
1 2$2
2
dimana i = 1,2,…,n; j = 1,2,…,m; s = 1,2,…,p. Analisis Komponen Utama Nonlinier didasarkan pada teori meet loss yang bertujuan untuk meminimumkan fungsi homogeneity loss 34 : sedikit p. Algoritma alternating least squares untuk meminimumkan 34 adalah,
6 ; <8 /=5
algoritma diatas juga menghitung dimensi dari ranking pertama p dari analisis kehomogenan secara simultan (Gifi 1990).
Analisis Gerombol Dua Langkah Metode ini digunakan untuk mengatasi masalah skala pengukuran peubah yang berbeda, yaitu skala numerik dan skala kategorik. Jarak antar gerombol didefinisikan sebagai jarak dari vektor centroid masing – masing peubah yang terdapat dalam suatu gerombol. Jarak yang digunakan dalam metode analisis gerombol dua langkah adalah jarak Log-Likelihood dan jarak Euclid.
Jarak Log-Likelihood dapat digunakan untuk peubah numerik dan kategorik. Jarak Log-Likelihood didefinisikan sebagai berikut (Rong Liu 2005), Penggerombolan dua langkah terdiri dari penggerombolan langkah awal dan penggerombolan optimal. Penggerombolan langkah awal dimulai dengan pembentukan Clustering Feature Tree (CF Tree). Selanjutnya, hasil dari CF Tree dipakai dalam penentuan gerombol optimal. Suatu gerombol dikatakan optimal apabila memiliki jarak antar gerombol paling jauh dan jarak antar objek paling dekat.
Gerombol optimal diperoleh setelah melakukan penghitungan terhadap nilai AIC (Akaike’s Information Criterion) dan BIC (Bayesian Information Criterion). Hasil perhitungan tersebut digunakan untuk menduga jumlah gerombol awal. Langkah kedua adalah mencari peningkatan jarak terbesar antara dua gerombol terdekat pada masing –masing tahapan penggerombolan.
3
? # W? # dengan :
R(k1) = rasio perubahan jarak terbesar pertama R(k2) = rasio perubahan jarak terbesar kedua dan rumus R(k) sebagai berikut
? # X8 Y X
X (X8 (X
dengan :
R(k) = rasio perubahan jarak lv = (mvlog n – BICv)/2 v = k, k-1
dk-1 = jarak jika k gerombol digabungkan dengan k-1 gerombol
Jika rasio perubahan lebih besar dari batas c2 , jumlah gerombol optimum ditetapkan
Pada dasarnya pada penggerombolan terdapat dua keragaman, yaitu, keragaman dalam gerombol dan keragaman antar gerombol. Beberapa definisi keragaman yaitu (Lathifaturrahmah 2010),
1. Keragaman antar gerombol
ZZB [\ ]
^
SSB = Sum of Square Between Cluster dengan : ] = rata-rata total seluruh objek
2. Keragaman dalam gerombol
ZZa [\
^ X
SSW = Sum of Square WithinCluster dengan : xij = objek ke-i gerombol ke-j
[
\ = rata-rata objek pada gerombol j
k = banyaknya gerombol nj = banyaknya objek gerombol
ke-j
Hasil penggerombolan yang baik adalah jika objek dalam gerombol yang sama memiliki keragaman yang rendah sedangkan objek antar gerombol memiliki tingkat keragaman yang tinggi. Dengan kata lain, objek dalam satu gerombol memiliki tingkat kemiripan yang tinggi dan objek berbeda gerombol memiliki tingkat kemiripan yang
Validitas Gerombol
Uji validitas cluster digunakan untuk mengevaluasi hasil dari analisis cluster secara kuantitatif sehingga dihasilkan kelompok optimum. Kelompok optimum adalah kelompok yang mempunyai jarak yang padat antar individu dalam kelompok dan terisolasi dari kelompok lain dengan baik (Dubes & Jain 1988).
Indeks yang biasa dijadikan tolok ukur dalam pengujian validitas cluster antara lain, 1. Indeks Dunn (D)
2. Indeks Davies-Bouldin (DB)
<B bhig J = = N
dengan: n = jumlah kelompok = jarak antar kelompok
3. Indeks Scattering Dissimilarity (SD) Dasar dari indeks SD adalah rata – rata dari ketersebaran anggota gerombol dan total dari pemisahan gerombol.
Rata – rata ketersebaran anggota
Total pemisahan gerombol adalah
<"o bhi0n pm m p
Indeks SD didefinisikan sebagai Z< u\ Z $ <"o dengan : Scatt =Scattering
Dis = Dissimilarity
Dimana sebagai faktor pembobot yang nilainya sama dengan nilai parameter Dis apabila jumlah gerombol maksimum terpenuhi.
4
METODOLOGI
Data
Data yang digunakan dalam penelitian ini adalah data sekunder, yaitu data hasil survey yang dilakukan oleh rand organization labor and population. Data tersebut merupakan data kesejahteraan penduduk pada daerah – daerah di Provinsi Jawa Barat (Indonesian Life Family Survey 2007).
Data tersebut diperoleh dari situs resmi rand organization (www.rand.org). Data tersebut terdiri dari demografi wilayah di Jawa Barat dan karakteristik pekerjaan serta kesejahteraan dari penduduk di wilayah Jawa Barat. Objek yang dijadikan amatan dalam survey ini adalah desa – desa yang berada di Jawa Barat. Metode penarikan contoh yang digunakan dalam survey yang dilakukan oleh rand organization ini adalah pengambilan contoh acak berstrata dengan kota atau kabupaten sebagai stratanya.
Peubah yang digunakan dalam penelitian ini sebanyak 19 peubah, 14 peubah kategorik dan 5 peubah kontinu, antara lain luas wilayah, letak pemukiman, bidang pekerjaan, dan peubah lainnya. Keterangan dari peubah yang dipakai dapat dilihat pada Lampiran 1.
Metode
Langkah – langkah yang digunakan dalam penelitian ini antara lain,
1. Melakukan eksplorasi terhadap data yang digunakan.
2. Melakukan analisis deskriptif untuk menjelaskan data yang digunakan. 3. A) Melakukan transformasi AKU
nonlinier terhadap data campuran untuk mendapatkan data skor komponen utama yang berskala rasio. Selanjutnya di lakukan penggerombolan pautan centroid terhadap skor komponen utama.
B) Melakukan uji validitas penggerombolan untuk menentukan jumlah gerombol optimum yang dapat diperoleh dari metode pautan centroid. 4. Melakukan penggerombolan dua langkah
terhadap data campuran.
5. Membandingkan hasil akhir penggerombolan dari masing – masing metode dan menghitung keragaman penggerombolan yang terbentuk dari masing – masing metode. Metode yang baik yaitu metode yang dapat menjelaskan dan memisahkan objek – objek yang jaraknya berbeda jauh dengan baik sementara objek yang mirip dijadikan sebagai satu gerombol.
HASIL DAN PEMBAHASAN
Deskripsi Data
Data yang digunakan merupakan data sekunder hasil survey yang terdiri dari 19 peubah, 14 peubah kategorik dan 5 peubah kontinu. Keterangan masing – masing peubah dapat dilihat pada Lampiran 1.
Daerah yang dijadikan contoh dalam survey tersebut merupakan desa – desa diwilayah Jawa Barat. Wilayah yang dijadikan contoh dapat dilihat pada Gambar 1. Terlihat bahwa desa di Kabupaten Bogor merupakan daerah dengan data contoh yang terbesar.
Gambar 1 Daerah Contoh
Sementara itu, untuk letak wilayah yang dijadikan contoh, sebanyak 65% didaerah yang mudah dijangkau. Sedangkan sebanyak 35% terletak didaerah terpencil (Gambar 2).
Gambar 2 Letak Wilayah
4
METODOLOGI
Data
Data yang digunakan dalam penelitian ini adalah data sekunder, yaitu data hasil survey yang dilakukan oleh rand organization labor and population. Data tersebut merupakan data kesejahteraan penduduk pada daerah – daerah di Provinsi Jawa Barat (Indonesian Life Family Survey 2007).
Data tersebut diperoleh dari situs resmi rand organization (www.rand.org). Data tersebut terdiri dari demografi wilayah di Jawa Barat dan karakteristik pekerjaan serta kesejahteraan dari penduduk di wilayah Jawa Barat. Objek yang dijadikan amatan dalam survey ini adalah desa – desa yang berada di Jawa Barat. Metode penarikan contoh yang digunakan dalam survey yang dilakukan oleh rand organization ini adalah pengambilan contoh acak berstrata dengan kota atau kabupaten sebagai stratanya.
Peubah yang digunakan dalam penelitian ini sebanyak 19 peubah, 14 peubah kategorik dan 5 peubah kontinu, antara lain luas wilayah, letak pemukiman, bidang pekerjaan, dan peubah lainnya. Keterangan dari peubah yang dipakai dapat dilihat pada Lampiran 1.
Metode
Langkah – langkah yang digunakan dalam penelitian ini antara lain,
1. Melakukan eksplorasi terhadap data yang digunakan.
2. Melakukan analisis deskriptif untuk menjelaskan data yang digunakan. 3. A) Melakukan transformasi AKU
nonlinier terhadap data campuran untuk mendapatkan data skor komponen utama yang berskala rasio. Selanjutnya di lakukan penggerombolan pautan centroid terhadap skor komponen utama.
B) Melakukan uji validitas penggerombolan untuk menentukan jumlah gerombol optimum yang dapat diperoleh dari metode pautan centroid. 4. Melakukan penggerombolan dua langkah
terhadap data campuran.
5. Membandingkan hasil akhir penggerombolan dari masing – masing metode dan menghitung keragaman penggerombolan yang terbentuk dari masing – masing metode. Metode yang baik yaitu metode yang dapat menjelaskan dan memisahkan objek – objek yang jaraknya berbeda jauh dengan baik sementara objek yang mirip
HASIL DAN PEMBAHASAN
Deskripsi Data
Data yang digunakan merupakan data sekunder hasil survey yang terdiri dari 19 peubah, 14 peubah kategorik dan 5 peubah kontinu. Keterangan masing – masing peubah dapat dilihat pada Lampiran 1.
Daerah yang dijadikan contoh dalam survey tersebut merupakan desa – desa diwilayah Jawa Barat. Wilayah yang dijadikan contoh dapat dilihat pada Gambar 1. Terlihat bahwa desa di Kabupaten Bogor merupakan daerah dengan data contoh yang terbesar.
Gambar 1 Daerah Contoh
Sementara itu, untuk letak wilayah yang dijadikan contoh, sebanyak 65% didaerah yang mudah dijangkau. Sedangkan sebanyak 35% terletak didaerah terpencil (Gambar 2).
Gambar 2 Letak Wilayah
5
Tabel 1 Hasil AKU Nonlinier
KU akar ciri keragaman kumulatif
1 0.1712 18%
Hasil akhir Analisis Komponen Utama Nonlinier adalah skor komponen objek ke sembilan belas dimensi yang terbentuk, yang digunakan untuk analisis gerombol.
Gerombol Pautan Centroid dengan Transformasi Komponen Utama Nonlinier
Hasil dari komponen utama nonlinier berupa nilai skor rasio, digunakan sebagai data yang akan digerombolkan menggunakan metode pautan centroid. Hasil komponen loading AKU Nonlinier dari 19 peubah yang telah ditransformasi dapat dilihat pada Lampiran 2.
Tabel 2 Validasi Gerombol Optimum Jumlah
Penggerombolan centroid menghasilkan dua gerombol. Gerombol pertama terdiri dari 520 objek, sementara gerombol kedua hanya memiliki dua objek saja. Dua gerombol merupakan solusi gerombol optimum yang dihasilkan oleh metode centroid (Tabel 2).
Dari Tabel 2 terlihat bahwa pada jumlah gerombol dua memiliki nilai indeks Dunn terbesar dibandingkan jumlah gerombol lainnya. Sementara itu, nilai indeks Davies dan SD-nya relatif kecil bila dibandingkan dengan jumlah gerombol lain.
Tabel 3 Distribusi Hasil Penggerombolan Gerombol N % Total
1 520 99.62%
2 2 0.38%
Total 522 100%
Gerombol 1
Dari Tabel 3 terlihat bahwa gerombol satu memiliki 520 anggota dengan peubah yang mendasari penggerombolan yaitu peubah tipe jalan, letak area, rumah tangga penerima beras miskin (raskin) dan keberadaan pabrik. Dimana desa pada gerombol ini umumnya memiliki tipe jalan aspal dan program raskin terdapat diseluruh desa yang menjadi anggota pada gerombol ini. Peubah rumah tangga penerima raskin merupakan peubah yang membedakan desa digerombol satu dengan desa digerombol dua karena desa pada gerombol dua tidak ada rumah tangga yang menerima raskin. Keterangan kepentingan dari peubah – peubah untuk gerombol satu dapat dilihat pada Lampiran 5
Gerombol 2
Gerombol dua hanya memiliki dua anggota. Hal ini dikarenakan desa pada objek amatan ini berbeda dengan desa pada gerombol satu berdasarkan pada peubah program raskin. Kedua desa tersebut tidak pernah mendapat bantuan program raskin dari pemerintah. Kedua desa ini terletak di Bogor. Selain peubah program raskin yang mempengaruhi dasar penggerombolan pada gerombol dua, peubah penghasilan non-tani pria, tipe jalan dan sumber air rumah tangga juga turut mempengaruhi proses pembentukan gerombol pada gerombol dua. Keterangan kepentingan dari peubah – peubah untuk gerombol dua dapat dilihat pada Lampiran 6.
Gerombol Dua Langkah
6
bertipe kategorik dan kontinu. Dalam penentuan jumlah gerombol digunakan nilai BIC.
Gerombol yang dihasilkan pada tahap pertama sebanyak enam gerombol. Hal ini terlihat dari nilai rasio perubahan BIC yang pertama kali lebih kecil dari 0.04 (Tatara et.al dalam Bacher 2004). Pada gerombol enam, nilai dari rasio tersebut sebesar 0.028. Sedangkan untuk menentukan gerombol optimal ditentukan dari rasio perhitungan jarak antara dua gerombol terbesar. Pada
Oleh karena itu, dalam kasus ini tiga gerombol merupakan solusi optimum. Distribusi dari anggota populasi dapat dilihat pada Tabel 4.
Tabel 4 Distribusi Hasil Penggerombolan Gerombol N % Total
Gerombol satu memiliki 164 anggota dengan peubah kategorik yang paling berpengaruh yang mendasari penggerombolan yaitu penghasilan bertani penduduk wanita dan penghasilan bertani penduduk pria sementara peubah kontinu yang berpengaruh adalah peubah rumah tangga penerima raskin dan peubah rumah tangga penerima Bantuan Langsung Tunai (BLT). Keterangan kepentingan dari peubah – peubah untuk gerombol satu dapat dilihat pada Lampiran 7 dan 10.
Desa pada gerombol satu umumnya terletak didaerah urban, yaitu sebanyak 146 desa, dan sisanya sebanyak 18 desa terletak didaerah rural. Pekerjaan utama yang banyak dijadikan profesi oleh penduduknya adalah dibidang industri dan perdagangan. Tidak terdapat satu orang pun penduduk desa digerombol ini, baik pria maupun wanita, yang bekerja dibidang pertanian. Ciri menonjol lainnya adalah jumlah rumah tangga yang menerima raskin dan menerima BLT lebih sedikit jika dibandingkan desa digerombol dua dan tiga, bahkan ada desa yang tidak menerima bantuan raskin. Anggota desa gerombol ini umumnya berasal dari Bandung, Kabupaten Bandung, Bogor,
Gerombol 2
Gerombol dua memiliki jumlah anggota paling banyak yaitu 239 anggota, dengan peubah kategorik yang paling berpengaruh yaitu peubah penghasilan non-tani pria dan keberadaan pabrik sementara peubah kontinu tidak ada yang berpengaruh. Keterangan kepentingan dari peubah – peubah untuk masing – masing gerombol dapat dilihat pada Lampiran 8 dan 11.
Ciri utama anggota desa pada gerombol dua yaitu terdapat pabrik disemua desa. Dari 239 anggota gerombol, 143 desa terletak didaerah urban dan 96 desa terletak didaerah rural. Pekerjaan penduduk desa anggota gerombol dua didominasi oleh bidang industri dan pertanian. Penduduk prianya banyak yang berprofesi sebagai petani sementara penduduk wanitanya banyak yang menjadi buruh pabrik. Hal ini terlihat dari penghasilan bertani penduduk pria yang nilainya selalu ada disetiap objek dan penghasilan non-tani wanita yang nilainya juga selalu ada disetiap objek. Anggota desa gerombol dua umumnya berasal dari Kabupaten Bogor, Kabupaten Bekasi, Karawang, Cianjur, Sukabumi, Kabupaten Sukabumi, dan Subang.
Gerombol 3
Gerombol tiga memiliki 119 anggota dengan peubah kategorik yang mendasari penggerombolan yaitu keberadaan pabrik dan penghasilan non-tani pria maupun wanita sementara peubah kontinu tidak ada yang berpengaruh. Keterangan kepentingan dari peubah – peubah untuk gerombol satu dapat dilihat pada Lampiran 9 dan 12.
7
Perbandingan Hasil Gerombol Dari kedua metode yang digunakan untuk mengatasi masalah penggerombolan dengan data campuran, masing – masing metode menghasilkan keragaman yang berbeda, baik keragaman antar gerombol maupun keragaman dalam gerombol. Perbandingan keragaman gerombol untuk setiap metode yang digunakan dapat dilihat pada Tabel 5.
Tabel 5 Perbandingan Keragaman Gerombol
Keragaman Dalam Gerombol 179227.616 177687.283 Antar Gerombol 145489.014 425792.260
Rasio 1.2319 0.4173
Dari Tabel 5 dapat dilihat bahwa metode gerombol dua langkah menghasilkan keragaman dalam gerombol yang lebih kecil dibandingkan dengan AKU Nonlinier sementara keragaman antar gerombolnya lebih besar. Apabila dirasiokan antara keragaman dalam dengan keragaman antar gerombol, metode gerombol dua langkah menghasilkan rasio sebesar 0.4173 sementara metode pautan centroid transformasi AKU Nonlinier menghasilkan rasio sebesar 1.2319. Hal ini menjelaskan bahwa metode gerombol dua langkah lebih baik dibandingkan metode pautan centroid dengan transformasi AKU Nonlinier untuk kasus ini.
SIMPULAN DAN SARAN
Simpulan
Metode gerombol dua langkah dapat menjelaskan hasil penggerombolan yang lebih baik dan lebih spesifik dibandingkan metode pautan centroid dengan transformasi AKU Nonlinier dan keragaman penggerombolan untuk jumlah gerombol optimum yang lebih baik juga. Hal ini menjelaskan bahwa metode gerombol dua langkah lebih baik dibandingkan metode pautan centroid dengan transformasi AKU Nonlinier.
Gerombol optimum yang dihasilkan metode gerombol dua langkah adalah tiga gerombol sementara gerombol optimum yang dihasilkan metode pautan centroid dengan transformasi AKU Nonlinier adalah dua gerombol.
Saran
Saran untuk penelitian selanjutnya adalah membandingkan antara metode gerombol dua langkah dengan pendekatan penggerombolan lainnya menggunakan transformasi AKU Nonlinier dengan menggunakan data simulasi.
DAFTAR PUSTAKA
Anonim. 2005. Penggunaan Transformasi AKU Nonlinier dalam Data Campuran. http://www.topstats.com/~doc/465746. html. [16 Juni 2010]
Bacher J, Wenzig K, Vogler M. 2004. SPSS Two Step Cluster – A First Evaluation. http://www.statisticalinnovations.com/p roducts/Two Step.pdf.[8 Juni 2010] BPS. 2008. Jawa Barat dalam Angka 2007.
Badan Pusat Statistik : Jakarta.
Dubes & Jain, A.K. 1988. Algorithm for Clustering Data. Prentice Hall : New Jersey.
Gifi, A. 1990. Nonlinear Multivariate Analysis. Chichester : John Wiley & Sons.
Johnson, R.A. & Wichern, D.W. 1992. Applied Multivariate Statistical Analysis. Edisi-3. New Jersey : Prentice Hall Inc.
Jolliffe, I.T. 2002. Principal Component Analysis. Second Edition. New York : Springer-Verlag.
Lathifathurrahmah. 2010. Perbandingan Hasil Penggerombolan Metode K-Means, Fuzzy K-Means, dan Two Step Cluster [Tesis]. Bogor : Fakultas Matemetika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor
Liu, R. 2005. The SPSS Two-Step Cluster. Departement of Mathematics : University of North Texas.
Serban, G. & Grigoreta, S.M. 2006. A Comparison of Clustering Techniques In Aspect Mining. Studia Univ.Babes-Bolyai.
7
Perbandingan Hasil Gerombol Dari kedua metode yang digunakan untuk mengatasi masalah penggerombolan dengan data campuran, masing – masing metode menghasilkan keragaman yang berbeda, baik keragaman antar gerombol maupun keragaman dalam gerombol. Perbandingan keragaman gerombol untuk setiap metode yang digunakan dapat dilihat pada Tabel 5.
Tabel 5 Perbandingan Keragaman Gerombol
Keragaman Dalam Gerombol 179227.616 177687.283 Antar Gerombol 145489.014 425792.260
Rasio 1.2319 0.4173
Dari Tabel 5 dapat dilihat bahwa metode gerombol dua langkah menghasilkan keragaman dalam gerombol yang lebih kecil dibandingkan dengan AKU Nonlinier sementara keragaman antar gerombolnya lebih besar. Apabila dirasiokan antara keragaman dalam dengan keragaman antar gerombol, metode gerombol dua langkah menghasilkan rasio sebesar 0.4173 sementara metode pautan centroid transformasi AKU Nonlinier menghasilkan rasio sebesar 1.2319. Hal ini menjelaskan bahwa metode gerombol dua langkah lebih baik dibandingkan metode pautan centroid dengan transformasi AKU Nonlinier untuk kasus ini.
SIMPULAN DAN SARAN
Simpulan
Metode gerombol dua langkah dapat menjelaskan hasil penggerombolan yang lebih baik dan lebih spesifik dibandingkan metode pautan centroid dengan transformasi AKU Nonlinier dan keragaman penggerombolan untuk jumlah gerombol optimum yang lebih baik juga. Hal ini menjelaskan bahwa metode gerombol dua langkah lebih baik dibandingkan metode pautan centroid dengan transformasi AKU Nonlinier.
Gerombol optimum yang dihasilkan metode gerombol dua langkah adalah tiga gerombol sementara gerombol optimum yang dihasilkan metode pautan centroid dengan transformasi AKU Nonlinier adalah dua gerombol.
Saran
Saran untuk penelitian selanjutnya adalah membandingkan antara metode gerombol dua langkah dengan pendekatan penggerombolan lainnya menggunakan transformasi AKU Nonlinier dengan menggunakan data simulasi.
DAFTAR PUSTAKA
Anonim. 2005. Penggunaan Transformasi AKU Nonlinier dalam Data Campuran. http://www.topstats.com/~doc/465746. html. [16 Juni 2010]
Bacher J, Wenzig K, Vogler M. 2004. SPSS Two Step Cluster – A First Evaluation. http://www.statisticalinnovations.com/p roducts/Two Step.pdf.[8 Juni 2010] BPS. 2008. Jawa Barat dalam Angka 2007.
Badan Pusat Statistik : Jakarta.
Dubes & Jain, A.K. 1988. Algorithm for Clustering Data. Prentice Hall : New Jersey.
Gifi, A. 1990. Nonlinear Multivariate Analysis. Chichester : John Wiley & Sons.
Johnson, R.A. & Wichern, D.W. 1992. Applied Multivariate Statistical Analysis. Edisi-3. New Jersey : Prentice Hall Inc.
Jolliffe, I.T. 2002. Principal Component Analysis. Second Edition. New York : Springer-Verlag.
Lathifathurrahmah. 2010. Perbandingan Hasil Penggerombolan Metode K-Means, Fuzzy K-Means, dan Two Step Cluster [Tesis]. Bogor : Fakultas Matemetika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor
Liu, R. 2005. The SPSS Two-Step Cluster. Departement of Mathematics : University of North Texas.
Serban, G. & Grigoreta, S.M. 2006. A Comparison of Clustering Techniques In Aspect Mining. Studia Univ.Babes-Bolyai.
PERBANDINGAN METODE PENGGEROMBOLAN DENGAN
KOMPONEN UTAMA NONLINIER DAN GEROMBOL DUA
LANGKAH PADA DATA CAMPURAN
YOGI YUNIANTO
DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
PERBANDINGAN METODE PENGGEROMBOLAN DENGAN
KOMPONEN UTAMA NONLINIER DAN GEROMBOL DUA
LANGKAH PADA DATA CAMPURAN
YOGI YUNIANTO
DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
RINGKASAN
YOGI YUNIANTO. Perbandingan Metode Penggerombolan Dengan Komponen Utama Nonlinier Dan Gerombol Dua Langkah Pada Data Campuran. Dibimbing oleh MOHAMMAD MASJKUR dan PIKA SILVIANTI.
Skala pengukuran yang berbeda sering ditemui pada berbagai kasus, termasuk pada kasus penggerombolan. Dalam kasus penggerombolan jika terdapat perbedaan skala pengukuran pada peubah yang akan digerombolkan, maka metode penggerombolan konvensional tidak dapat digunakan. Diperlukan penanganan khusus atau metode tertentu untuk menggerombolkan peubah yang memiliki skala campuran, yaitu skala numerik dan kategorik.Pada studi ini, akan dilakukan pembandingan hasil penggerombolan dengan melakukan dua metode yang berbeda, yaitu dengan transformasi terhadap data menggunakan Analisis Komponen Utama Nonlinier dan dengan menggunakan metode penggerombolan dua langkah. Data yang digunakan dalam penelitian ini adalah data kesejahteraan daerah – daerah di wilayah Jawa Barat. Hasil penggerombolan optimum dengan menggunakan metode gerombol dua langkah menghasilkan tiga gerombol, sementara penggerombolan menggunakan pautan centroid dengan transformasi AKU Nonlinier menghasilkan dua gerombol. Metode gerombol dua langkah dapat menjelaskan hasil penggerombolan yang lebih baik dan lebih spesifik dibandingkan metode pautan centroid dengan transformasi AKU Nonlinier. Selain itu, keragaman dalam gerombol dan antar gerombol yang dihasilkan metode gerombol dua langkah juga lebih baik dibandingkan metode pautan centroid dengan transformasi AKU Nonlinier. Hal ini menjelaskan bahwa metode gerombol dua langkah lebih baik dibandingkan metode pautan centroid dengan transformasi AKU Nonlinier.
PERBANDINGAN METODE PENGGEROMBOLAN DENGAN
KOMPONEN UTAMA NONLINIER DAN GEROMBOL DUA
LANGKAH PADA DATA CAMPURAN
YOGI YUNIANTO
Skripsi Sebagai Salah Satu Syarat untuk Memperoleh
Gelar Sarjana Statistika pada Departemen Statistika
DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
Judul : Perbandingan Metode Penggerombolan Dengan Komponen Utama Nonlinier Dan Gerombol Dua Langkah Pada Data Campuran
Nama : Yogi Yunianto NRP : G14060730
Menyetujui,
Pembimbing I Pembimbing II
Ir. Mohammad Masjkur, MS Pika Silvianti, S.Si, M.Si NIP. 19610608 1986011002
Mengetahui, Ketua Departemen Statistika
Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor
Dr. Ir. Hari Wijayanto NIP. 19650421 1990021001
KATA PENGANTAR
Segala puji hanya milik Allah, kami memuji-Nya, memohon pertolongan kepada-Nya, memohon ampun kepada-Nya dan berlindung kepada-Nya dari kejelekan diri – diri kami serta dari kejelekan amalan kami. Shalawat serta salam semoga tercurah kepada junjungan kita Nabi Muhammad SAW, kepada keluarganya, sahabatnya, dan pengikutnya yang setia hingga akhir zaman.
Banyak ilmu, pelajaran dan masukan yang penulis dapatkan dan rasakan selama proses penyusunan karya ilmiah ini, sehingga pada kesempatan kali ini penulis ingin mengucapkan terima kasih kepada:
1. Bapak Ir. Mohammad Masjkur, MS dan ibu Pika Silvianti, M.Si selaku pembimbing yang telah meluangkan waktu, serta memberikan saran dan masukan yang bermanfaat bagi penulis.
2. Kedua orang tua, Mama dan Papa yang telah sabar mendidik penulis dan memberi penulis semangat agar cepat lulus serta kepada seluruh kakak penulis.
3. Tiara Kencana Ayu, atas dukungan, bantuan, masukan, semangat dan keceriaannya yang telah diberikan kepada penulis.
4. Teman – teman STK 43 dan teman – teman Radiv Community atas semangat dan bantuannya serta masukan yang diberikan.
5. Teman – teman Statistika Center atas dukungan dan ilmunya.
6. Serta kepada semua pihak yang telah membantu penulis dalam proses penyusunan karya ilmiah ini, yang tidak dapat penulis tuliskan satu per satu.
Akhir kata, penulis meminta maaf apabila dalam proses penyusunan karya ilmiah ini terdapat kesalahan – kesalahan yang dilakukan oleh penulis. Semoga karya ilmiah ini bermanfaat.
Bogor, Januari 2011
RIWAYAT HIDUP
Penulis dilahirkan di kota Bekasi pada tanggal 27 Juni 1988 sebagai anak kelima dari pasangan Bapak Sukma Janani Tamin dan Ibu Mega Lelasuari. Penulis berasal dari Sumatra Barat. Pada tahun 2000 penulis lulus dari SD Negeri Jatibening VII Bekasi, dan melanjutkan ke sekolah menengah pertama SLTP Negeri 255 Jakarta. Penulis menyelesaikan studi di SMU Negeri 61 Jakarta pada tahun 2006 dan pada tahun yang sama penulis diterima di Institut Pertanian Bogor melalui jalur Undangan Seleksi Masuk IPB (USMI). Pada tahun 2007, penulis diterima di departemen Statistika Institut Pertanian Bogor.
DAFTAR ISI
Hal
DAFTAR TABEL………... vii
DAFTAR GAMBAR……… vii
DAFTAR LAMPIRAN………. vii
PENDAHULUAN Latar Belakang………. 1
Tujuan……….. 1
TINJAUAN PUSTAKA Analisis Gerombol………...……...………...…………...……… 1
Analisis Komponen Utama Nonlinier……….. 1
Analisis Gerombol Dua Langkah………. 2
Keragaman Gerombol……….. 3
Validitas Gerombol……….. 3
METODOLOGI Data………... 4
Metode……….. 4
HASIL DAN PEMBAHASAN Deskripsi Data……….. 4
Analisis Komponen Utama Nonlinier……….. 4
Gerombol Pautan Centroid dengan Transformasi Komponen Utama Nonlinier…….…… 5
Gerombol Dua Langkah………... 5
Perbandingan Hasil Penggerombolan………... 7
SIMPULAN DAN SARAN Simpulan………... 7
Saran………. 7
DAFTAR PUSTAKA……… 7
DAFTAR TABEL
Hal
1. Hasil AKU Nonlinier………... 4
2. Validasi Gerombol Optimum ….……….. 5
3. Distribusi Hasil Penggerombolan……….. 5
4. Distribusi Hasil Penggerombolan……….. 5
5. Perbandingan Keragaman Gerombol………. 7
DAFTAR GAMBAR
Hal 1. Daerah Contoh………...……… 42. Letak Wilayah ………...………... 4
DAFTAR LAMPIRAN
Hal 1. Peubah – peubah yang Digunakan dalam Analisis Gerombol…………... 92. Nilai Komponen Loading Analisis Komponen Utama Nonlinier ………. 10
3. Tabel Rasio Perubahan BIC (Bayesian Information Criterion)………. 11
4. Ukuran Masing-masing Gerombol Pada Metode Gerombol Dua Langkah……… 12
5. Tingkat Kepentingan Peubah Kontinu dari Gerombol Pertama pada Metode Pautan Centroid………... 12
6. Tingkat Kepentingan Peubah Kontinu dari Gerombol Pertama pada Metode Pautan Centroid………... 13
7. Tingkat Kepentingan Peubah Kategorik dari Gerombol Pertama pada Metode Gerombol Dua Langkah………... 13
8. Tingkat Kepentingan Peubah Kategorik dari Gerombol Kedua pada Metode Gerombol Dua Langkah……… 14
9. Tingkat Kepentingan Peubah Kategorik dari Gerombol Ketiga pada Metode Gerombol Dua Langkah……… 14
10.Tingkat Kepentingan Peubah Kontinu dari Gerombol Pertama pada Metode Gerombol Dua Langkah……… 15
11.Tingkat Kepentingan Peubah Kontinu dari Gerombol Kedua pada Metode Gerombol Dua Langkah……….... 15
1
PENDAHULUAN
Latar Belakang
Peneliti dalam studinya biasa memakai beberapa peubah untuk menggambarkan karakteristik populasi yang diteliti. Seringkali, peubah yang digunakan memiliki skala pengukuran yang berbeda, yaitu skala numerik dan kategorik.
Dalam penggerombolan jika skala peubah – peubah yang akan digerombolkan memiliki skala pengukuran yang berbeda, peneliti tidak dapat langsung menggunakan metode penggerombolan konvensional baik penggerombolan berhirarki maupun non-hirarki. Diperlukan penanganan khusus atau metode tertentu untuk menggerombolkan peubah yang memiliki skala campuran.
Metode alternatif untuk mengatasi masalah perbedaan skala pengukuran adalah metode transformasi Komponen Utama Nonlinier. Metode ini menghasilkan skor komponen obyek yang berskala rasio atau berjenis data numerik, sehingga dapat dianalisis menggunakan analisis penggerombolan. Pada penelitian terdahulu mengenai AKU Nonlinier dikatakan bahwa AKU nonlinier tidak dapat mentransformasi nilai data yang nilainya diatas 10000 (Anonim 2005).
Metode lainnya adalah metode penggerombolan dua langkah. Metode ini bertujuan untuk mengatasi masalah perbedaan skala pengukuran dalam penggerombolan, tanpa harus melakukan transformasi terhadap data.
Tujuan
Studi ini bertujuan untuk membandingkan metode penggerombolan jika peubah yang akan digerombolkan berskala campuran. Metode yang dibandingkan yaitu penggerombolan pautan centroid dengan transformasi Komponen Utama Nonlinier dan Metode Penggerombolan Dua Langkah.
TINJAUAN PUSTAKA
Analisis Gerombol
Analisis gerombol merupakan suatu analisis statistika peubah ganda yang digunakan untuk mengelompokan objek pengamatan menjadi beberapa gerombol berdasarkan ukuran kemiripan antar objek, sehingga objek – objek yang berada dalam satu gerombol memiliki kemiripan yang lebih
besar dibandingkan objek dari gerombol yang berbeda (Johnson & Wichern 1992).
Salah satu ukuran jarak yang paling umum dipakai dalam analisis gerombol adalah ukuran jarak Euclid yang didefinisikan sebagai berikut
dimana:
dij = jarak objek ke-i dengan objek ke-j xi1 = nilai objek ke-i pada peubah ke-1 xj1 = nilai objek ke-j pada peubah ke-1 p = banyaknya peubah yang diamati Secara umum terdapat dua metode penggerombolan, yaitu metode berhirarki dan metode tidak berhirarki. Metode berhirarki mengelompokkan dua atau lebih objek yang mempunyai kesamaan paling dekat, kemudian proses diteruskan ke objek lain yang mempunyai kedekatan kedua. Metode tak berhirarki dimulai dengan menentukan terlebih dahulu jumlah gerombol yang diinginkan sehingga sifat pengelompokkannya tidaklah alamiah karena dikondisikan untuk jumlah kelompok tertentu.
Metode Pautan Centroid
Metode ini merupakan metode penggerombolan berhirarki. Pada metode ini jarak antara dua gerombol didefinisikan sebagai jarak antar centroid gerombol kedua gerombol tersebut. Centroid gerombol adalah nilai tengah observasi pada variabel dalam suatu set variabel gerombol. Keuntungan metode ini adalah tidak terlalu dipengaruhi oleh pencilan. Jarak centroid didefinisikan sebagai berikut
dengan:
cent(wi,wj) = jarak centroid gerombol i dan j.
Ni = jumlah objek gerombol ke-i. Nj = jumlah objek gerombol ke-j. dm = jarak antara objek ke-m dalam
gerombol i dengan centroidnya. dn = jarak antara objek ke-n dalam
gerombol j dengan centroidnya.
2
dengan menggunakan pendekatan alternating least squares (Gifi 1990).
Apabila terdapat suatu data yang dibentuk ke dalam matriks H yang berukuran n x m, maka untuk memudahkan perhitungan Analisis Komponen Utama Nonlinier dipakai notasi: bernilai satu dan lainnya 0.
Model Analisis Komponen Utama Nonlinier adalah sebagai berikut
1 2$2
2
dimana i = 1,2,…,n; j = 1,2,…,m; s = 1,2,…,p. Analisis Komponen Utama Nonlinier didasarkan pada teori meet loss yang bertujuan untuk meminimumkan fungsi homogeneity loss 34 : sedikit p. Algoritma alternating least squares untuk meminimumkan 34 adalah,
6 ; <8 /=5
algoritma diatas juga menghitung dimensi dari ranking pertama p dari analisis kehomogenan secara simultan (Gifi 1990).
Analisis Gerombol Dua Langkah Metode ini digunakan untuk mengatasi masalah skala pengukuran peubah yang berbeda, yaitu skala numerik dan skala kategorik. Jarak antar gerombol didefinisikan sebagai jarak dari vektor centroid masing – masing peubah yang terdapat dalam suatu gerombol. Jarak yang digunakan dalam metode analisis gerombol dua langkah adalah jarak Log-Likelihood dan jarak Euclid.
Jarak Log-Likelihood dapat digunakan untuk peubah numerik dan kategorik. Jarak Log-Likelihood didefinisikan sebagai berikut (Rong Liu 2005), Penggerombolan dua langkah terdiri dari penggerombolan langkah awal dan penggerombolan optimal. Penggerombolan langkah awal dimulai dengan pembentukan Clustering Feature Tree (CF Tree). Selanjutnya, hasil dari CF Tree dipakai dalam penentuan gerombol optimal. Suatu gerombol dikatakan optimal apabila memiliki jarak antar gerombol paling jauh dan jarak antar objek paling dekat.
Gerombol optimal diperoleh setelah melakukan penghitungan terhadap nilai AIC (Akaike’s Information Criterion) dan BIC (Bayesian Information Criterion). Hasil perhitungan tersebut digunakan untuk menduga jumlah gerombol awal. Langkah kedua adalah mencari peningkatan jarak terbesar antara dua gerombol terdekat pada masing –masing tahapan penggerombolan.
3
? # W? # dengan :
R(k1) = rasio perubahan jarak terbesar pertama R(k2) = rasio perubahan jarak terbesar kedua dan rumus R(k) sebagai berikut
? # X8 Y X
X (X8 (X
dengan :
R(k) = rasio perubahan jarak lv = (mvlog n – BICv)/2 v = k, k-1
dk-1 = jarak jika k gerombol digabungkan dengan k-1 gerombol
Jika rasio perubahan lebih besar dari batas c2 , jumlah gerombol optimum ditetapkan
Pada dasarnya pada penggerombolan terdapat dua keragaman, yaitu, keragaman dalam gerombol dan keragaman antar gerombol. Beberapa definisi keragaman yaitu (Lathifaturrahmah 2010),
1. Keragaman antar gerombol
ZZB [\ ]
^
SSB = Sum of Square Between Cluster dengan : ] = rata-rata total seluruh objek
2. Keragaman dalam gerombol
ZZa [\
^ X
SSW = Sum of Square WithinCluster dengan : xij = objek ke-i gerombol ke-j
[
\ = rata-rata objek pada gerombol j
k = banyaknya gerombol nj = banyaknya objek gerombol
ke-j
Hasil penggerombolan yang baik adalah jika objek dalam gerombol yang sama memiliki keragaman yang rendah sedangkan objek antar gerombol memiliki tingkat keragaman yang tinggi. Dengan kata lain, objek dalam satu gerombol memiliki tingkat kemiripan yang tinggi dan objek berbeda gerombol memiliki tingkat kemiripan yang
Validitas Gerombol
Uji validitas cluster digunakan untuk mengevaluasi hasil dari analisis cluster secara kuantitatif sehingga dihasilkan kelompok optimum. Kelompok optimum adalah kelompok yang mempunyai jarak yang padat antar individu dalam kelompok dan terisolasi dari kelompok lain dengan baik (Dubes & Jain 1988).
Indeks yang biasa dijadikan tolok ukur dalam pengujian validitas cluster antara lain, 1. Indeks Dunn (D)
2. Indeks Davies-Bouldin (DB)
<B bhig J = = N
dengan: n = jumlah kelompok = jarak antar kelompok
3. Indeks Scattering Dissimilarity (SD) Dasar dari indeks SD adalah rata – rata dari ketersebaran anggota gerombol dan total dari pemisahan gerombol.
Rata – rata ketersebaran anggota
Total pemisahan gerombol adalah
<"o bhi0n pm m p
Indeks SD didefinisikan sebagai Z< u\ Z $ <"o dengan : Scatt =Scattering
Dis = Dissimilarity
Dimana sebagai faktor pembobot yang nilainya sama dengan nilai parameter Dis apabila jumlah gerombol maksimum terpenuhi.
4
METODOLOGI
Data
Data yang digunakan dalam penelitian ini adalah data sekunder, yaitu data hasil survey yang dilakukan oleh rand organization labor and population. Data tersebut merupakan data kesejahteraan penduduk pada daerah – daerah di Provinsi Jawa Barat (Indonesian Life Family Survey 2007).
Data tersebut diperoleh dari situs resmi rand organization (www.rand.org). Data tersebut terdiri dari demografi wilayah di Jawa Barat dan karakteristik pekerjaan serta kesejahteraan dari penduduk di wilayah Jawa Barat. Objek yang dijadikan amatan dalam survey ini adalah desa – desa yang berada di Jawa Barat. Metode penarikan contoh yang digunakan dalam survey yang dilakukan oleh rand organization ini adalah pengambilan contoh acak berstrata dengan kota atau kabupaten sebagai stratanya.
Peubah yang digunakan dalam penelitian ini sebanyak 19 peubah, 14 peubah kategorik dan 5 peubah kontinu, antara lain luas wilayah, letak pemukiman, bidang pekerjaan, dan peubah lainnya. Keterangan dari peubah yang dipakai dapat dilihat pada Lampiran 1.
Metode
Langkah – langkah yang digunakan dalam penelitian ini antara lain,
1. Melakukan eksplorasi terhadap data yang digunakan.
2. Melakukan analisis deskriptif untuk menjelaskan data yang digunakan. 3. A) Melakukan transformasi AKU
nonlinier terhadap data campuran untuk mendapatkan data skor komponen utama yang berskala rasio. Selanjutnya di lakukan penggerombolan pautan centroid terhadap skor komponen utama.
B) Melakukan uji validitas penggerombolan untuk menentukan jumlah gerombol optimum yang dapat diperoleh dari metode pautan centroid. 4. Melakukan penggerombolan dua langkah
terhadap data campuran.
5. Membandingkan hasil akhir penggerombolan dari masing – masing metode dan menghitung keragaman penggerombolan yang terbentuk dari masing – masing metode. Metode yang baik yaitu metode yang dapat menjelaskan dan memisahkan objek – objek yang jaraknya berbeda jauh dengan baik sementara objek yang mirip dijadikan sebagai satu gerombol.
HASIL DAN PEMBAHASAN
Deskripsi Data
Data yang digunakan merupakan data sekunder hasil survey yang terdiri dari 19 peubah, 14 peubah kategorik dan 5 peubah kontinu. Keterangan masing – masing peubah dapat dilihat pada Lampiran 1.
Daerah yang dijadikan contoh dalam survey tersebut merupakan desa – desa diwilayah Jawa Barat. Wilayah yang dijadikan contoh dapat dilihat pada Gambar 1. Terlihat bahwa desa di Kabupaten Bogor merupakan daerah dengan data contoh yang terbesar.
Gambar 1 Daerah Contoh
Sementara itu, untuk letak wilayah yang dijadikan contoh, sebanyak 65% didaerah yang mudah dijangkau. Sedangkan sebanyak 35% terletak didaerah terpencil (Gambar 2).
Gambar 2 Letak Wilayah
5
Tabel 1 Hasil AKU Nonlinier
KU akar ciri keragaman kumulatif
1 0.1712 18%
Hasil akhir Analisis Komponen Utama Nonlinier adalah skor komponen objek ke sembilan belas dimensi yang terbentuk, yang digunakan untuk analisis gerombol.
Gerombol Pautan Centroid dengan Transformasi Komponen Utama Nonlinier
Hasil dari komponen utama nonlinier berupa nilai skor rasio, digunakan sebagai data yang akan digerombolkan menggunakan metode pautan centroid. Hasil komponen loading AKU Nonlinier dari 19 peubah yang telah ditransformasi dapat dilihat pada Lampiran 2.
Tabel 2 Validasi Gerombol Optimum Jumlah
Penggerombolan centroid menghasilkan dua gerombol. Gerombol pertama terdiri dari 520 objek, sementara gerombol kedua hanya memiliki dua objek saja. Dua gerombol merupakan solusi gerombol optimum yang dihasilkan oleh metode centroid (Tabel 2).
Dari Tabel 2 terlihat bahwa pada jumlah gerombol dua memiliki nilai indeks Dunn terbesar dibandingkan jumlah gerombol lainnya. Sementara itu, nilai indeks Davies dan SD-nya relatif kecil bila dibandingkan dengan jumlah gerombol lain.
Tabel 3 Distribusi Hasil Penggerombolan Gerombol N % Total
1 520 99.62%
2 2 0.38%
Total 522 100%
Gerombol 1
Dari Tabel 3 terlihat bahwa gerombol satu memiliki 520 anggota dengan peubah yang mendasari penggerombolan yaitu peubah tipe jalan, letak area, rumah tangga penerima beras miskin (raskin) dan keberadaan pabrik. Dimana desa pada gerombol ini umumnya memiliki tipe jalan aspal dan program raskin terdapat diseluruh desa yang menjadi anggota pada gerombol ini. Peubah rumah tangga penerima raskin merupakan peubah yang membedakan desa digerombol satu dengan desa digerombol dua karena desa pada gerombol dua tidak ada rumah tangga yang menerima raskin. Keterangan kepentingan dari peubah – peubah untuk gerombol satu dapat dilihat pada Lampiran 5
Gerombol 2
Gerombol dua hanya memiliki dua anggota. Hal ini dikarenakan desa pada objek amatan ini berbeda dengan desa pada gerombol satu berdasarkan pada peubah program raskin. Kedua desa tersebut tidak pernah mendapat bantuan program raskin dari pemerintah. Kedua desa ini terletak di Bogor. Selain peubah program raskin yang mempengaruhi dasar penggerombolan pada gerombol dua, peubah penghasilan non-tani pria, tipe jalan dan sumber air rumah tangga juga turut mempengaruhi proses pembentukan gerombol pada gerombol dua. Keterangan kepentingan dari peubah – peubah untuk gerombol dua dapat dilihat pada Lampiran 6.
Gerombol Dua Langkah
6
bertipe kategorik dan kontinu. Dalam penentuan jumlah gerombol digunakan nilai BIC.
Gerombol yang dihasilkan pada tahap pertama sebanyak enam gerombol. Hal ini terlihat dari nilai rasio perubahan BIC yang pertama kali lebih kecil dari 0.04 (Tatara et.al dalam Bacher 2004). Pada gerombol enam, nilai dari rasio tersebut sebesar 0.028. Sedangkan untuk menentukan gerombol optimal ditentukan dari rasio perhitungan jarak antara dua gerombol terbesar. Pada
Oleh karena itu, dalam kasus ini tiga gerombol merupakan solusi optimum. Distribusi dari anggota populasi dapat dilihat pada Tabel 4.
Tabel 4 Distribusi Hasil Penggerombolan Gerombol N % Total
Gerombol satu memiliki 164 anggota dengan peubah kategorik yang paling berpengaruh yang mendasari penggerombolan yaitu penghasilan bertani penduduk wanita dan penghasilan bertani penduduk pria sementara peubah kontinu yang berpengaruh adalah peubah rumah tangga penerima raskin dan peubah rumah tangga penerima Bantuan Langsung Tunai (BLT). Keterangan kepentingan dari peubah – peubah untuk gerombol satu dapat dilihat pada Lampiran 7 dan 10.
Desa pada gerombol satu umumnya terletak didaerah urban, yaitu sebanyak 146 desa, dan sisanya sebanyak 18 desa terletak didaerah rural. Pekerjaan utama yang banyak dijadikan profesi oleh penduduknya adalah dibidang industri dan perdagangan. Tidak terdapat satu orang pun penduduk desa digerombol ini, baik pria maupun wanita, yang bekerja dibidang pertanian. Ciri menonjol lainnya adalah jumlah rumah tangga yang menerima raskin dan menerima BLT lebih sedikit jika dibandingkan desa digerombol dua dan tiga, bahkan ada desa yang tidak menerima bantuan raskin. Anggota desa gerombol ini umumnya berasal dari Bandung, Kabupaten Bandung, Bogor, Bekasi, Depok dan Cirebon.
Gerombol 2
Gerombol dua memiliki jumlah anggota paling banyak yaitu 239 anggota, dengan peubah kategorik yang paling berpengaruh yaitu peubah penghasilan non-tani pria dan keberadaan pabrik sementara peubah kontinu tidak ada yang berpengaruh. Keterangan kepentingan dari peubah – peubah untuk masing – masing gerombol dapat dilihat pada Lampiran 8 dan 11.
Ciri utama anggota desa pada gerombol dua yaitu terdapat pabrik disemua desa. Dari 239 anggota gerombol, 143 desa terletak didaerah urban dan 96 desa terletak didaerah rural. Pekerjaan penduduk desa anggota gerombol dua didominasi oleh bidang industri dan pertanian. Penduduk prianya banyak yang berprofesi sebagai petani sementara penduduk wanitanya banyak yang menjadi buruh pabrik. Hal ini terlihat dari penghasilan bertani penduduk pria yang nilainya selalu ada disetiap objek dan penghasilan non-tani wanita yang nilainya juga selalu ada disetiap objek. Anggota desa gerombol dua umumnya berasal dari Kabupaten Bogor, Kabupaten Bekasi, Karawang, Cianjur, Sukabumi, Kabupaten Sukabumi, dan Subang.
Gerombol 3
Gerombol tiga memiliki 119 anggota dengan peubah kategorik yang mendasari penggerombolan yaitu keberadaan pabrik dan penghasilan non-tani pria maupun wanita sementara peubah kontinu tidak ada yang berpengaruh. Keterangan kepentingan dari peubah – peubah untuk gerombol satu dapat dilihat pada Lampiran 9 dan 12.
7
Perbandingan Hasil Gerombol Dari kedua metode yang digunakan untuk mengatasi masalah penggerombolan dengan data campuran, masing – masing metode menghasilkan keragaman yang berbeda, baik keragaman antar gerombol maupun keragaman dalam gerombol. Perbandingan keragaman gerombol untuk setiap metode yang digunakan dapat dilihat pada Tabel 5.
Tabel 5 Perbandingan Keragaman Gerombol
Keragaman Dalam Gerombol 179227.616 177687.283 Antar Gerombol 145489.014 425792.260
Rasio 1.2319 0.4173
Dari Tabel 5 dapat dilihat bahwa metode gerombol dua langkah menghasilkan keragaman dalam gerombol yang lebih kecil dibandingkan dengan AKU Nonlinier sementara keragaman antar gerombolnya lebih besar. Apabila dirasiokan antara keragaman dalam dengan keragaman antar gerombol, metode gerombol dua langkah menghasilkan rasio sebesar 0.4173 sementara metode pautan centroid transformasi AKU Nonlinier menghasilkan rasio sebesar 1.2319. Hal ini menjelaskan bahwa metode gerombol dua langkah lebih baik dibandingkan metode pautan centroid dengan transformasi AKU Nonlinier untuk kasus ini.
SIMPULAN DAN SARAN
Simpulan
Metode gerombol dua langkah dapat menjelaskan hasil penggerombolan yang lebih baik dan lebih spesifik dibandingkan metode pautan centroid dengan transformasi AKU Nonlinier dan keragaman penggerombolan untuk jumlah gerombol optimum yang lebih baik juga. Hal ini menjelaskan bahwa metode gerombol dua langkah lebih baik dibandingkan metode pautan centroid dengan transformasi AKU Nonlinier.
Gerombol optimum yang dihasilkan metode gerombol dua langkah adalah tiga gerombol sementara gerombol optimum yang dihasilkan metode pautan centroid dengan transformasi AKU Nonlinier adalah dua gerombol.
Saran
Saran untuk penelitian selanjutnya adalah membandingkan antara metode gerombol dua langkah dengan pendekatan penggerombolan lainnya menggunakan transformasi AKU Nonlinier dengan menggunakan data simulasi.
DAFTAR PUSTAKA
Anonim. 2005. Penggunaan Transformasi AKU Nonlinier dalam Data Campuran. http://www.topstats.com/~doc/465746. html. [16 Juni 2010]
Bacher J, Wenzig K, Vogler M. 2004. SPSS Two Step Cluster – A First Evaluation. http://www.statisticalinnovations.com/p roducts/Two Step.pdf.[8 Juni 2010] BPS. 2008. Jawa Barat dalam Angka 2007.
Badan Pusat Statistik : Jakarta.
Dubes & Jain, A.K. 1988. Algorithm for Clustering Data. Prentice Hall : New Jersey.
Gifi, A. 1990. Nonlinear Multivariate Analysis. Chichester : John Wiley & Sons.
Johnson, R.A. & Wichern, D.W. 1992. Applied Multivariate Statistical Analysis. Edisi-3. New Jersey : Prentice Hall Inc.
Jolliffe, I.T. 2002. Principal Component Analysis. Second Edition. New York : Springer-Verlag.
Lathifathurrahmah. 2010. Perbandingan Hasil Penggerombolan Metode K-Means, Fuzzy K-Means, dan Two Step Cluster [Tesis]. Bogor : Fakultas Matemetika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor
Liu, R. 2005. The SPSS Two-Step Cluster. Departement of Mathematics : University of North Texas.
Serban, G. & Grigoreta, S.M. 2006. A Comparison of Clustering Techniques In Aspect Mining. Studia Univ.Babes-Bolyai.
8
9
Lampiran 1 Peubah – peubah yang Digunakan dalam Analisis Gerombol
Peubah Keterangan Tipe Peubah Satuan
X1 Letak Pemukiman Kategorik 1 : Urban 2 : Rural
X2 Luas Daerah Numerik Hektar
X3 Bidang Pekerjaan I Kategorik 1 : Pertanian 2 : Tambang 3 : Industri 4 : Listrik,Gas,Air 5 : Konstruksi
6 : Pedagang Besar, Restoran 7 : Transportasi, Gudang,
Komunikasi
8 : Keuangan, Insuransi, Pinjaman
9 : Pekerja Sosial 10 : Lainnya X4 Bidang Pekerjaan II Kategorik
X5 Bidang Pekerjaan III Kategorik
X6 Tipe Jalan Kategorik
1 : Aspal 2 : jalan batu 3 : jalan tanah 8 : Sungai atau laut
X7 Status Jalan Kategorik 1 : lewat kendaraan 2 : tidak
X8 Ketersediaan Listrik Kategorik 1 : ada 2 : tidak ada X9 RT Pemakai Listrik Numerik Persen
X10 Sumber Air RT Kategorik
2 : air pompa 3 : air sumur 4 : mata air 6 : air sungai 11 : pipa air
12 : pipa air dari hydrant 13 : pipa air dari PAM 99 : tidak tahu
X11 Keberadaan Pabrik Kategorik 1 : ada 2 : tidak ada
X12 Program Raskin Kategorik 1 : ada 2 : tidak ada X13 RT Penerima Raskin Numerik Persen
X14 Jumlah Raskin yang
diterima RT Numerik Kilogram
X15 RT Penerima BLT Numerik Persen
X16 Penghasilan Bertani
Penduduk Pria Kategorik
1 : ada 2 : tidak ada 3 : tidak tahu X17 Penghasilan Bertani
Penduduk Wanita Kategorik
X18 Penghasilan Non-tani
Penduduk Pria Kategorik
X19 Penghasilan Non-tani
10
Lampiran 2 Nilai Komponen Loading Analisis Komponen Utama Nonlinier
X1 X2 X3 X4 X5 X6 X7 X8 X9 X10
KU1 0.318 0.667 0.437 0.093 0.031 0.099 0.047 0 0.2 0.182 KU2 0.01 0.635 0.071 0.061 0.062 0.002 0.009 0 0.04 0.045 KU3 0.143 0.711 0.155 0.048 0.059 0.096 0 0 0.05 0.037 KU4 0.061 0.679 0.037 0.089 0.044 0.193 0.055 0 0.337 0.025 KU5 0 0.7 0.012 0.332 0.277 0.022 0.063 0 0.111 0.121 KU6 0.031 0.622 0.009 0.017 0.162 0.024 0.259 0 0.072 0.343 KU7 0 0.653 0.069 0.015 0.173 0.123 0.022 0 0.08 0.182 KU8 0.001 0.589 0.03 0.079 0.132 0.06 0.41 0 0.07 0.156 KU9 0.003 0.785 0.078 0.331 0.021 0.023 0.002 0 0.056 0.008 KU10 0.007 0.676 0.023 0.08 0.066 0.005 0.106 0 0.055 0.158 KU11 0 0.68 0.011 0.031 0.038 0.063 0.002 0 0.063 0.067 KU12 0.076 0.674 0.096 0.048 0.128 0.275 0.024 0 0.102 0.042 KU13 0.181 0.687 0.026 0.035 0.01 0.024 0 0 0.31 0.02 KU14 0.167 0.644 0.328 0.019 0.049 0.024 0.001 0 0.056 0.023 KU15 0.001 0.698 0.02 0.019 0.015 0.002 0 0 0.028 0.014 KU16 0 0.669 0.006 0.007 0.014 0.003 0.001 0 0.044 0.008 KU17 0 0.691 0.031 0.026 0.027 0.001 0 0 0.028 0.03 KU18 0 0.641 0.012 0.018 0.02 0 0 0 0.05 0.003 KU19 0 0.612 0.02 0.012 0.016 0.029 0 0 0.081 0.021
11
Lampiran 3 Tabel Rasio Perubahan BIC (Bayesian Information Criterion)
Jumlah
Gerombol Nilai BIC Perubahan BIC
Rasio Perubahan BIC
Rasio Pengukuran Jarak
1 14252.139
2 13093.358 -1158.781 1.000 1.109
3 12082.607 -1010.751 .872 2.638
4 11917.143 -165.464 .143 1.089
5 11793.845 -123.298 .106 1.237
6 11761.272 -32.573 .028 1.153
7 11779.415 18.143 -.016 1.221
8 11857.624 78.209 -.067 1.106
9 11961.885 104.261 -.090 1.307
10 12123.995 162.110 -.140 1.015
11 12288.883 164.888 -.142 1.003
12 12454.265 165.381 -.143 1.078
13 12633.004 178.739 -.154 1.149
14 12834.064 201.060 -.174 1.022
12
Lampiran 4 Ukuran Masing-masing Gerombol Pada Metode Gerombol Dua Langkah
13
Lampiran 6 Tingkat Kepentingan Peubah Kontinu dari Gerombol Kedua pada Metode Pautan Centroid
14
Lampiran 8 Tingkat Kepentingan Peubah Kategorik dari Gerombol Kedua pada Metode Gerombol Dua Langkah
15
Lampiran 10 Tingkat Kepentingan Peubah Kontinu dari Gerombol Pertama pada Metode Gerombol Dua Langkah
16
8
9
Lampiran 1 Peubah – peubah yang Digunakan dalam Analisis Gerombol
Peubah Keterangan Tipe Peubah Satuan
X1 Letak Pemukiman Kategorik 1 : Urban 2 : Rural
X2 Luas Daerah Numerik Hektar
X3 Bidang Pekerjaan I Kategorik 1 : Pertanian 2 : Tambang 3 : Industri 4 : Listrik,Gas,Air 5 : Konstruksi
6 : Pedagang Besar, Restoran 7 : Transportasi, Gudang,
Komunikasi
8 : Keuangan, Insuransi, Pinjaman
9 : Pekerja Sosial 10 : Lainnya X4 Bidang Pekerjaan II Kategorik
X5 Bidang Pekerjaan III Kategorik
X6 Tipe Jalan Kategorik
1 : Aspal 2 : jalan batu 3 : jalan tanah 8 : Sungai atau laut
X7 Status Jalan Kategorik 1 : lewat kendaraan 2 : tidak
X8 Ketersediaan Listrik Kategorik 1 : ada 2 : tidak ada X9 RT Pemakai Listrik Numerik Persen
X10 Sumber Air RT Kategorik
2 : air pompa 3 : air sumur 4 : mata air 6 : air sungai 11 : pipa air
12 : pipa air dari hydrant 13 : pipa air dari PAM 99 : tidak tahu
X11 Keberadaan Pabrik Kategorik 1 : ada 2 : tidak ada
X12 Program Raskin Kategorik 1 : ada 2 : tidak ada X13 RT Penerima Raskin Numerik Persen
X14 Jumlah Raskin yang
diterima RT Numerik Kilogram
X15 RT Penerima BLT Numerik Persen
X16 Penghasilan Bertani
Penduduk Pria Kategorik
1 : ada 2 : tidak ada 3 : tidak tahu X17 Penghasilan Bertani
Penduduk Wanita Kategorik
X18 Penghasilan Non-tani
Penduduk Pria Kategorik
X19 Penghasilan Non-tani
10
Lampiran 2 Nilai Komponen Loading Analisis Komponen Utama Nonlinier
X1 X2 X3 X4 X5 X6 X7 X8 X9 X10
KU1 0.318 0.667 0.437 0.093 0.031 0.099 0.047 0 0.2 0.182 KU2 0.01 0.635 0.071 0.061 0.062 0.002 0.009 0 0.04 0.045 KU3 0.143 0.711 0.155 0.048 0.059 0.096 0 0 0.05 0.037 KU4 0.061 0.679 0.037 0.089 0.044 0.193 0.055 0 0.337 0.025 KU5 0 0.7 0.012 0.332 0.277 0.022 0.063 0 0.111 0.121 KU6 0.031 0.622 0.009 0.017 0.162 0.024 0.259 0 0.072 0.343 KU7 0 0.653 0.069 0.015 0.173 0.123 0.022 0 0.08 0.182 KU8 0.001 0.589 0.03 0.079 0.132 0.06 0.41 0 0.07 0.156 KU9 0.003 0.785 0.078 0.331 0.021 0.023 0.002 0 0.056 0.008 KU10 0.007 0.676 0.023 0.08 0.066 0.005 0.106 0 0.055 0.158 KU11 0 0.68 0.011 0.031 0.038 0.063 0.002 0 0.063 0.067 KU12 0.076 0.674 0.096 0.048 0.128 0.275 0.024 0 0.102 0.042 KU13 0.181 0.687 0.026 0.035 0.01 0.024 0 0 0.31 0.02 KU14 0.167 0.644 0.328 0.019 0.049 0.024 0.001 0 0.056 0.023 KU15 0.001 0.698 0.02 0.019 0.015 0.002 0 0 0.028 0.014 KU16 0 0.669 0.006 0.007 0.014 0.003 0.001 0 0.044 0.008 KU17 0 0.691 0.031 0.026 0.027 0.001 0 0 0.028 0.03 KU18 0 0.641 0.012 0.018 0.02 0 0 0 0.05 0.003 KU19 0 0.612 0.02 0.012 0.016 0.029 0 0 0.081 0.021
11
Lampiran 3 Tabel Rasio Perubahan BIC (Bayesian Information Criterion)
Jumlah
Gerombol Nilai BIC Perubahan BIC
Rasio Perubahan BIC
Rasio Pengukuran Jarak
1 14252.139
2 13093.358 -1158.781 1.000 1.109
3 12082.607 -1010.751 .872 2.638
4 11917.143 -165.464 .143 1.089
5 11793.845 -123.298 .106 1.237
6 11761.272 -32.573 .028 1.153
7 11779.415 18.143 -.016 1.221
8 11857.624 78.209 -.067 1.106
9 11961.885 104.261 -.090 1.307
10 12123.995 162.110 -.140 1.015
11 12288.883 164.888 -.142 1.003
12 12454.265 165.381 -.143 1.078
13 12633.004 178.739 -.154 1.149
14 12834.064 201.060 -.174 1.022
12
Lampiran 4 Ukuran Masing-masing Gerombol Pada Metode Gerombol Dua Langkah
13
Lampiran 6 Tingkat Kepentingan Peubah Kontinu dari Gerombol Kedua pada Metode Pautan Centroid
14
Lampiran 8 Tingkat Kepentingan Peubah Kategorik dari Gerombol Kedua pada Metode Gerombol Dua Langkah
15
Lampiran 10 Tingkat Kepentingan Peubah Kontinu dari Gerombol Pertama pada Metode Gerombol Dua Langkah
16