DI PROVINSI RIAU DI PROVINSI RIAU
Oleh : ANGSOKA DEWI ANGSOKA DEWI NRP. 1310201713 Dosen Pembimbing : Dr. Sutikno, S.Si, M.Si Dr. rer. pol. Heri Kuswanto, M.Si
Pasca Sarjana Jurusan Statistika
Fakultas Matematika dan Ilmu Pengetahuan Alam (FMIPA) I tit t T k l i S l h N b
Institut Teknologi Sepuluh Nopember
Outline
PENDAHULUAN PENDAHULUAN TINJAUAN PUSTAKA
METODOLOGI
HASIL DAN PEMBAHASAN KESIMPULAN DAN SARAN
DAFTAR PUSTAKA DAFTAR PUSTAKA
KLASIFIKASI VARIABEL MIXED
KLASIFIKASI DESA/KOTA (BPS)
PERDESAAN METODE CLUSTER
VARIABEL MIXED KATEGORIK DAN KONTINU
PERDESAAN
>70%
PERKOTAAN
KARAKTERISTIK BERAGAM
LAPORAN DAERAH SULIT
( )
METODE CLUSTER ENSEMBLE
METODE FULL KATEGORIK
METODE FULL KONTINU
BERAGAM (REMOTE)
PENGELOMPOKKAN DESA PERDESAAN
KATEGORIK KONTINU
ALGORITMA DAN PROGRAM IMPLEMENTASI
DESA PERDESAAN
KELOMPOK DESA PERDESAAN
PROGRAM
PEMANFAATAN HASIL PENGELOMPOKKAN
PERDESAAN (OPTIMUM)
PENGELOMPOKKAN
Bab 1.2
Bagaimana algoritma pengelompokkan
ensembel pada variabel berskala campuran Bagaimana algoritma pengelompokkan
ensembel pada variabel berskala campuran
Bagaimana pengelompokkan desa perdesaan Bagaimana pengelompokkan desa perdesaan Bagaimana pengelompokkan desa perdesaan di Provinsi Riau dengan pengelompokkan
ensembel
Bagaimana pengelompokkan desa perdesaan di Provinsi Riau dengan pengelompokkan
ensembel
Bagaimana perbandingan kinerja
pengelompokkan ensembel full kategorik Bagaimana perbandingan kinerja
pengelompokkan ensembel full kategorik pengelompokkan ensembel, full kategorik, dan full kontinyu
pengelompokkan ensembel, full kategorik,
dan full kontinyu
• Menyusun algoritma dan program aplikasi berbasais GUI untuk pengelompokkan
ensembel pada variabel berskala
• Menyusun algoritma dan program aplikasi berbasais GUI untuk pengelompokkan
ensembel pada variabel berskala
1 campuran campuran
l kk d d d
l kk d d d
• Mengelompokkan desa perdesaan di Provinsi Riau dengan metode
pengelompokkan ensembel
• Mengelompokkan desa perdesaan di Provinsi Riau dengan metode
pengelompokkan ensembel
2
• Membandingkan kinerja pengelompokkan ensembel, full kategorik dan full kontinyu
• Membandingkan kinerja pengelompokkan ensembel, full kategorik dan full kontinyu
3 untuk pengelompokkan desa perdesaan , f g f y di Provinsi Riau
, f g
fy
untuk pengelompokkan desa perdesaan di Provinsi Riau
3
Bab 1.4
BPS
• Sebagai bahan pertimbangan dalam
BPS
• Sebagai bahan pertimbangan dalam
• Sebagai bahan pertimbangan dalam pengembangan metodologi sensus dan survei yang mempertimbangkan remote area
• Sebagai bahan pertimbangan dalam pengembangan metodologi sensus dan survei yang mempertimbangkan remote area
area.
area.
Keilmuan Statistika Keilmuan Statistika
• Mengembangkan wawasan keilmuan statistika khususnya metode
l kk b l t l t
• Mengembangkan wawasan keilmuan statistika khususnya metode
l kk b l t l t
pengelompokkan ensambel atau cluster ensemble.
pengelompokkan ensambel atau cluster
ensemble.
Provinsi Riau
Desa Perdesaan
Cluster Ensemble
Squeezer
Combining Cluster (Squeezer)
Aglomeratif
Bab 2.1
Definisi BPS
PERKOTAAN PERDESAAN
memenuhi tidak memenuhi
1. Kepadatan penduduk
2. Persentase rumah tangga pertanian 3. Fasilitas perkotaan
UU No.22 Tahun 1999 dan UU No.26 Tahun 2007 UU No.22 Tahun 1999 dan UU No.26 Tahun 2007
Kawasan perkotaan ⊳ kegiatan bukan pertanian, fungsi kawasan sebagai tempat pemukiman perkotaan, pemusatan dan distribusi pelayanan jasa pemerintahan, pelayanan sosial, dan kegiatan ekonomi.
p , p y , g
Kawasan perdesaan ⊳ kegiatan utama pertanian, termasuk pengelolaan sumber daya alam, susunan fungsi kawasan sebagai tempat permukiman perdesaan.
Remoteness
Berhubungan dengan aktivitas pertanian dan pertambangan.
Menyatakan jarak/distance
Index of remoteness Karlj (2000)
Rurality index
Variabel : kepadatan penduduk, waktu menuju wilayah rujukan terdekat, waktu menuju wilayah lain yang menjadi rujukan.
Australian Bureau of Statistics, ABS (2003)
Major Cities, Inner Regional, Outer Regional, Remote Area, Very Remote Area Variabel :
Kepadatan penduduk
Jarak, akses, ketinggian wilayah dari permukaan laut
Departemen Pekerjaan Umum (2007) l
Desa terpencil :
Daerah perdesaan
Sarana aksesibilitas kurang/tidak ada
Secara geografis jauh dari pusat pertumbuhan (perkotaan)
Ada isolasi geografis yang memisahkan dengan daerah lain
Ada isolasi geografis yang memisahkan dengan daerah lain
Bab 2.3
CLUSTERING CLUSTERING
Objek Desa Perdesaan
Kelompok ( Groups )
Homogen dalam kelompok Heterogen antar kelompok
Ukuran
Kemiripan Metode
Kemiripan
(similarity) Pengelompokkan
Simple Matching Jaccard Coefficient
Pengelompokkan Hirarki
Jarak Euclidean
Jarak Pengelompokkan
Jarak
Mahalanobis Non‐hirarki
Cl t E bl
Bab 2.4
Cluster Ensemble
He, et.al (2005a), Yoon, et.al (2006), Ghaemi, et.al (2009)
Algoritma Pengelompokan
K1
Hasil Pengelompokan
SK1Cj
Algoritma Pengelompokan
K2
Hasil Pengelompokan
SK2Cj
Penggabungan
Final Cluster (Combining) Final Cluster
... ...
Algoritma Pengelompokan
Ki
Hasil Pengelompokan
SKiCj
Tahapan Umum Pengelompokkan Ensambel Tahapan Umum Pengelompokkan Ensambel
Cl t E bl Cluster Ensemble
He, et.al (2005a)
PENGELOMPOKAN DATA KATEGORIK
PENGELOMPOKAN DATA KONTINU Cluster Ensemble Splitting
ALGORITMA CLUSTER ENSEMBLE BASED MIXED DATA CLUSTERING (CEBMDC)
Bab 2.4
Pengelompokkan Data Kategorik (Algoritma Squeezer)
k lk l h l h
Diperkenalkan oleh Zengyou He, et. al. tahun 2002.
Untuk pengelompokkan data kategorik dengan dimensi data yang besar.
yang besar.
Banyaknya kelompok belum diketahui.
One scan algorithm efisien dalam memory dan waktu
Robust
Penggunaan dan pengembangan Algoritma Squeezer:
He, et.al (2005b), He, et.al (2006),
Reddy dan Kavitha (2010), Maryanto (2010)
Algoritma Squeezer
Cluster :
Definisi 1
Algoritma Squeezer
tid tid TID
Cl |
Definisi 2
Definisi 3 adalah banyaknya tuple pada cluster Cl yang mengandung nilai
tid A tid Cl
Cl
VALl( ) . l | )
(al
Sup al
Definisi 4
Definisi 5 Cluster Structure : CS = { Cl, Summary } )}
( ,
{(al Sup al Summary
Definisi 6
{ , y }
Kemiripan :
k
l l
m
l a VAL Cl l
l
a Sup a tid Sup
Cl Sim
1 ( ) ( )
) ) (
, (
Definisi 7 Definisi 8
Al T Al T Al l mk
T T
Sim( 1, 2) | 1. 2. ,1
i
i Sim T T T
T T sim
Avg _ ( 1, )
1, /| |i
Bab 2.4
Algoritma Squeezer
Pembobotan Ukuran Kemiripan
Li dan Biswas(2002) dan He et al (2006)
Algoritma Squeezer
Li dan Biswas(2002) dan He, et.al (2006)
More Similar Feature Value Set (MSFVS)
Misalkan objek i dan j dengan nilai/kategori yang sama dalam variabel l dinotasikan Vil, maka MSFVS dari Vil adalah
)}
( )
(
| { )
(
Vil Vil f Vjl f VilMSFVS
(2.10) Ukuran Kemiripan menjadi :
)
(
( 1 )
1 ) ( ).
1 ( ) (
Vil
MSFVS l
il il
il
n n
V f V
V f
w
(2.11) Ukuran Kemiripan menjadi :
k
l l
m
l a VAL C l
l
l Sup a
a a Sup
w tid
Cl Sim
1 ( ) ( )
) ) (
( )
,
( (2.12)
al VALl(C)
Algoritma Squeezer Threshold (s)
Di k k k k h l k k
Algoritma Squeezer
Digunakan untuk menentukan apakah suatu tuple akan masuk ke dalam cluster yang telah ada, atau memembentuk cluster baru.
Subjektif Jika telah mengetahui karakteristik data
Teknik sampling, dengan cara :
a) Mengambil sampel dari data, dinotasikan dengan S.
b) Untuk setiap pasang tuple dalam S, hitung kemiripannya.
) Hit t t k i i ( i ) d i l k h b) c) Hitung rata‐rata kemiripan (avg_sim) dari langkah b).
d) Tentukan threshold s=avg_sim+1 atau s=avg_sim+2
Bab 2.4
Pengelompokkan Data Kontinyu (Hirarki Aglomeratif)
Jarak antar kelompok dengan metode Linkage
Jarak antar kelompok dengan metode Linkage
C bi i Cl (T h E b l) Combining Cluster (Tahapan Ensembel) He, et.al (2005a)
Combining cluster dengan algoritma pengelompokkan data kategorik (Algoritma Squeezer)
Lebih efisien, dan computational cost rendah
Metode ensembel sederhana
I d k V lidi k P l kk Hi ki
Bab 2.5
Indeks Validitas untuk Pengelompokkan Hirarki Sharma (1996), Halkidi, et.al (2001)
1. Root Mean Square Standard Deviation (RMSSTD) 2. Semi‐Partial R‐Squared (SPR)
3 R S d (RS) 3. R‐Squared (RS)
4. Distance Between Cluster (CD) Kelompok optimum :
Titik di mana terjadi penurunan nilai indeks yang tertinggi j p y g gg (steepest knee / greatest jump)
Detail
Untuk Variabel Kontinyu (Bunkers, et.al, 1996)
1
C
C
1
Cc
c
W
S
S C
1
1
21
2
1
1
C
c
B
x
cx
S C
dan
(2.20) (2.21)
Simpangan baku dalam kelompok
Simpangan baku kelompok ke‐c
Simpangan baku antar kelompok
Rata‐rata kelompok ke‐c
Rata‐rata total
C : banyaknya kelompok
Kriteria : SW minimum dan SB maksimum atau Rasio SW / SB terkecil
Bab 2.6
Untuk Variabel Kategorik
2 /
1
Light & Margolin (1971), Okada(1999), Kader & Perry (2007)
1 1
. 2 2
/ 1
'
2
1 2
C n n n
C S WSS
C
c
K
k
kc c
c
W (2.26)
n C n C
W
2 /
1
(2.27)
2 / 1
1 2
1 1
2 .
2 / 1
'
2
1 1
2 1
n n n n
S BSS
K
k
k C
c
K
k
kc c
B
1 1
C C
S
BMATLAB versi 7.12 (R2011a)
• GUI untuk Algoritma Pengelompokkan GIS k Ek l i D d Vi li i
• GIS untuk Eksplorasi Data dan Visualisasi Hasil Pengelompokkan
Bab 3.1
Data PODES 2008 1.383 desa perdesaan di Provinsi Riau
SKALA VARIABEL
PENGUKURAN
X1 Letak geografis desa Kategorik
X2 Akses menuju desa Kategorik
VARIABEL
j g
X3 Jenis jalan terpanjang Kategorik
X4 Alat transportasi umum utama Kategorik
X5 Kepadatan penduduk Kontinyu
X6 Persentase keluarga pertanian Kontinyu X77 Jarak desa ke kecamatanJ des e ec Kontinyuo yu X8 Jarak desa ke kabupaten/kota Kontinyu X9 Jarak desa ke kabupaten/kota lain terdekat Kontinyu
1. Menyusun Algoritma dan Program Pengelompokkan Ensembel
DATA
Variabel k
Algoritma
Squeezer Output 1
Cluster Ensemble
Kategorik Squeezer
Variabel Hirarki
Output 2
Combining (Algoritma Squeezer)
Output Akhir Variabel
Kontinyu Aglomeratif Output 2
Bab 3.2
2 Mengelompokkan Desa Perdesaan di Provinsi Riau dengan 2. Mengelompokkan Desa Perdesaan di Provinsi Riau dengan
Pengelompokkan Ensembel
a. Memisahkan variabel kategorik (X1 – X4) dan variabel kontinyu (X5 – X9) a. Memisahkan variabel kategorik (X1 X4) dan variabel kontinyu (X5 X9) b. Mengelompokkan X1 – X4 dengan algoritma Squeezer.
c. Menentukan kelompok terbaik untuk b.
d Mengelompokkan X5 X9 dengan aglomeratif dengan k ran jarak d. Mengelompokkan X5 – X9 dengan aglomeratif dengan ukuran jarak
Euclidean dan Mahalanobis, dan metode pautan Complete Linkage dan Average Linkage.
e Menentukan kelompok terbaik untuk d e. Menentukan kelompok terbaik untuk d.
f. Combining hasil c dan e menjadi kelompok akhir.
g. Menentukan kelompok terbaik untuk kelompok akhir.
3 Membandingkan Hasil Pengelompokkan Ensembel Full Kategorik 3. Membandingkan Hasil Pengelompokkan Ensembel, Full Kategorik
dan Full Kontinyu
Full Kategorik
Variabel Kategorik
DATA
Full Kategorik
Variabel Kontinyu
Algoritma
Squeezer Output
Variabel Kategorik Transformasi
Variabel Kategorik
Full Kontinyu
Transformasi
Variabel Kontinyu
Hirarki
Aglomeratif Output
DATA
Variabel Kontinyu
Bab 4.1
Al it
• Algoritma Squeezer
hi b b i il i i i /
Algoritma
hitung bobot, similarity, summaries, rasio SW/SB
• Aglomeratif
modifikasi toolbox clustering dan CVAP 3.7
• Menampilkan Peta
modifikasi toolbox ArcMat 1.0
Semua fungsi diintegrasikan dalam toolbox baru:
Clustering: CEBMDC
P B b i GUI
Program Berbasis GUI
Bab 4.2
1 P l kk D t K t ik
Karakteristik Riau
1. Pengelompokkan Data Kategorik
• Pengelompokkan dengan pembobot menghasilkan kelompok yang lebih besar.
• Kinerja pengelompokkan dengan pembobot lebih baik (Rasio
SW/SB secara umum lebih kecil)
1 P l kk D t K t ik
Kelompok Terbaik :
1. Pengelompokkan Data Kategorik
Pengelompokkan dengan pembobot dan threshold 0.9 (WS0.9) Rasio SW dan SB terkecil (0,0382).
4 Kelompok dengan rincian :
4 Kelompok , dengan rincian : Kelompok 1 : 793 desa
Kelompok 2 : 349 desa p Kelompok 3 : 148 desa Kelompok 4 : 65 desa
Karakteristik
Bab 4.2
2 P l kk D t K ti
2. Pengelompokkan Data Kontinyu
Banyaknya Euclidean‐
A
Euclidean‐
C l t
Mahalanobis‐
A
Mahalanobis‐
C l t
y y
Kelompok Average Linkage
Complete Linkage
Average Linkage
Complete Linkage
3 0.3205 0.2853 0.5384 0.8475
4 0.3123 0.3815 0.4012 0.8906
5 0.3422 0.4326 0.4542 0.7255
Hasil pengelompokkan yang digunakan dalam tahapan ensembel
Euclidean‐Complete Linkage 3 kelompok (ECL3) p g p ( )
Euclidean‐Average Linkage 4 kelompok (EAL4)
Euclidean‐Average Linkage 5 kelompok (EAL5)
Karakteristik3 T h Akhi (E b l)
Kombinasi kelompok yang dilakukan :
WS0 9 ECL3 WS0 9 EAL4 WS0 9 EAL5
3. Tahapan Akhir (Ensembel)
WS0.9 – ECL3, WS0.9 – EAL4, WS0.9 – EAL5 Kelompok terbaik adalah : WS0.9 – EAL4
R i SW/SB 0 0072 Rasio SW/SB : 0,0072.
Kelompok yang dihasilkan : 4 kelompok
Kelompok Banyaknyak
Anggota Karakteristik Urutan
1 793 Tidak remote 1
2 349 Tidak remote 3
3 148 Tidak remote 2
4 65 Remote 4 Karakteristik
Bab 4.2
P t T tik H il P l kk E b l
Peta Tematik Hasil Pengelompokkan Ensembel
P l kk F ll K t ik Pengelompokkan Full Kategorik
Kelompok terbaik metode full kategorik adalah pengelompokkan tanpa pembobot menghasilkan 2 kelompok
Sebagai pembanding dengan pengelompokkan ensembel digunakan hasil 4 kelompok.
Bab 4.3
P l kk F ll K t ik
Pengelompokkan Full Kategorik
Banyaknya Metode Kelompok Banyaknya
Anggota Karakteristik Urutan Full Kategorik
2 Kelompok
1 1139 Tidak remote 1
2 216 R t 2
2 Kelompok 2 216 Remote 2
Full Kategorik
1 488 Tidak remote 1
2 431 Tidak remote 2
Full Kategorik
4 Kelompok 3 207 Tidak remote 3
4 229 Remote 4
P l kk F ll K t ik
Pengelompokkan Full Kategorik
Bab 4.3
P l kk F ll K ti
Pengelompokkan Full Kontinyu
B k Euclidean‐ Euclidean‐ Mahalanobis‐ Mahalanobis‐
Banyaknya Kelompok
uc dea Average
Linkage
uc dea Complete
Linkage
a a a ob s Average
Linkage
a a a ob s Complete
Linkage
3 0.2679 0.2811 0.4491 1.3649
4 0.2981 0.3571 0.6802 1.4383
Metode terbaik yang menghasilkan 3 (tiga) kelompok dan 4 Metode terbaik yang menghasilkan 3 (tiga) kelompok dan 4 (empat) kelompok adalah Euclidean‐Average Linkage (EAL3 dan EAL4) dengan rasio SW dan SB 0,2679 dan 0,2981.
Karakteristik
P l kk F ll K ti
Pengelompokkan Full Kontinyu
Bab 4.3
Perbandingan Pengelompokkan Ensembel, Full Kategorik, Perbandingan Pengelompokkan Ensembel, Full Kategorik, dan Full Kontinyu
T b l 4 15 P b di Nil i R i SW d SB
Banyaknya
Kelompok Ensembel Full Kategorik Full Kontinyu Tabel 4.15 Perbandingan Nilai Rasio SW dan SB
Kelompok
2 0.0316 0.0660 ‐
3 ‐ 0.0799 0.2679
4 0.0072 0.0904 0.2981
Secara umum pengelompokkan ensembel menghasilkan
Secara umum pengelompokkan ensembel menghasilkan
kinerja yang lebih baik.
Metode Kelompok Banyaknya
Anggota Karakteristik Urutan
1 793 Tidak remote 1
Cluster Ensemble
2 349 Tidak remote 3
3 148 Tidak remote 2
4 65 Remote 4
4 65 Remote 4
Full Kategorik
1 488 Tidak remote 1
2 431 Tidak remote 2
3 207 Tid k t 3
3 207 Tidak remote 3
4 229 Remote 4
1 392 Tidak remote 2
Full Kontinyu 2 755 Tidak remote 3
3 2 Remote 4
4 206 Tidak remote 1
Bab 4.3 Pengelompokkan Full
Kategorikg
Pengelompokkan Ensembel
Pengelompokkan Full Kontinyu
Ensembel Ensembel
Pengelompokkan Full Kontinyu
Remote
Tidak Remote
Pengelompokkan Full Kategorik
Outlier Perkotaan
Kategorik
KESIMPULAN
1. Algoritma dan program yang dibangun dapat digunakan untuk pengelompokkan ensembel untuk menangani variabel campuran kategorik dan kontinyu berdasar Algoritma Cluster untuk menangani variabel campuran kategorik dan kontinyu berdasar Algoritma Cluster Ensemble Based Mixed Data Clustering (CEBMDC). GUI yang dibangun dapat mempermudah pengguna dalam melakukan pengelompokkan khususnya dengan metode ensembel (CEBMDC).
2 P l kk d d di P i i Ri d l kk b l d t
2. Pengelompokkan desa perdesaan di Provinsi Riau dengan pengelompokkan ensembel dapat disimpulkan:
a. Desa‐desa perdesaan di Provinsi Riau dapat dikelompokkan menjadi 4 (empat) kelompok dari kombinasi metode pengelompokkan algoritma Squeezer dengan threshold 0.9 (WS0.9) dan metode Euclidean‐Average Linkage 4 kelompok (EAL4). Daerah remote yang dapat diidentifikasi dengan metode ini adalah sebanyak 65 desa.
b. Baik pada tahapan pengelompokkan data kategorik dan pengelompokkan akhir diperoleh kelompok terbaik melalui algoritma Squeezer dengan pembobot.
3. Metode ensembel memiliki kinerja yang lebih baik daripada metode full kategorik dan full kontinyu dengan kriteria rasio Sw dan Sb dalam pengelompokkan desa‐desa perdesaan di Provinsi Riau. Namun metode ensembel memiliki kompleksitas pemrograman dan waktu yang lebih tinggi daripada metode full kategorik atau full kontinyu.
yang lebih tinggi daripada metode full kategorik atau full kontinyu.
SARAN
1. Untuk memperbaiki kinerja hasil pengelompokkan, maka pengelompokkan dapat
dit k d b hk i b l i b l d t b k
diterapkan dengan menambahkan variabel‐variabel yang dapat menggambarkan karakteristik daerah remote seperti kondisi jalan yang dilalui, waktu tempuh, frekuensi beroperasinya moda transportasi dalam sehari, dan biaya yang diperlukan untuk menuju daerah perkotaan.p j p
2. Penguasaan atau pengetahuan kondisi dan karakteristik daerah juga sangat diperlukan dalam analisis.
3. Menerapkan metode lain dalam tahapan akhir pengelompokkan ensembel yang dapat diterapkan antara lain consensus function dan genetic algorithm.
4. Penelitian ini hanya membandingkan metode pengelompokkan ensembel dengan metode pengelompokkan khusus data kategorik dan khusus data kontinyu, sehingga perlu dikaji perbandingannya dengan metode yang sama sama dapat sehingga perlu dikaji perbandingannya dengan metode yang sama‐sama dapat menangani data campuran kategorik dan kontinyu seperti Two Step Cluster.
Andreopoulos, B., An, A., Wang, X., dan Schroeder, M. (2008), ”A roadmap of clustering algorithms: finding a match for biomedical application”, Briefings in Bioinformatics Advance Access, hal. 1‐18.
Australian Bureau of Statistics. (2003), ASGC Remoteness Classification : Purpose and Use (Cencus Paper No.03/01), Canberra: Australian Bureau of Statistics.
Avogadri, R., dan Valentini, G. (2008), "Ensemble Clustering with Fuzzy Approach", Springer.
Badan Pusat Statistik (2009), Klasifikasi Desa Perkotaan Perdesaan, Jakarta: BPS.
Bunkers, W., Miller, J., dan De Gaetano, A. (1996), "Definition of Climate Regions in the Northern Plains Using an Objective Cluster Modification Technique", Journal of Climate 9 , hal. 130‐146.
Commonwealth of Australia (1994), Rural, Remote and Metropolitan Areas Classification 1991 Census Edition, Canberra: Australian Government Publishing Service.
Dewangan, R.R., Sharma, L.K, dan Akasapu, A.K. (2010), "Fuzzy Clustering Technique for Numerical and
l " l l d h l
Categorical Dataset", International Journal on Computer Science and Engineering, hal. 75‐80.
Ghaemi, R., Sulaiman, N., Ibrahim, H., dan Mustapha, N. (2009), "A Survey: Clustering Ensembles Techniques", World Academy of Science, Engineering and Technology, 50 , hal. 636‐645.
He, Z., Xu, X., dan Deng, S. (2002), "Squeezer: An Efficient Algorithm for Clustering Categorical Data", Journal Computer Science and Technology Vol 17 No 5 hal 611 624
Computer Science and Technology, Vol.17, No.5 , hal. 611‐624.
He, Z., Xu, X., dan Deng, S. (2005a), "Clustering Mixed Numeric and Categorical Data: A Cluster Ensemble Approach", Department of Computer Science and Engineering, Harbin Institute of Technology .
He, Z., Xu, X., dan Deng, S. (2005b), "Scalable Algorithms for Clustering Large Datasets with Mixed Type Attributes" International Journal of Intelligent Systems Vol 20 hal 1077‐1089
Attributes International Journal of Intelligent Systems, Vol.20 , hal. 1077 1089.
Johnson, A., dan Wichern, D. W. (2002), Applied Multivariate Statistical Analysis, 5thedition, Prentice Hall, Inc., New Jersey.
Kralj, B. (2000), "Measuring Rurality, RIO2008 BASIC : Methodology and Results", Ontario: OMA Economics Department.j, ( ), g y, gy , p Lathifaturrahmah (2010), Perbandingan Hasil Penggerombolan Metode K‐Means, Fuzzy K‐Means, dan Two Step Cluster‐,
Tesis, Pasca Sarjana, Institut Pertanian Bogor.
LeSage, J. P., dan Pace, R. K. (2004), "Arc_Mat, A Matlab Toolbox for Using ArcView Shape Files for Spatial", National Science Foundation.
Li, T., dan Chen, Y. (2010), "Fuzzy Clustering Ensemble with Selection of Number of Clusters", Journal of Computers, Vol 5 No 7 hal 1112 1119
Vol.5, No.7 , hal. 1112‐1119.
Okada, Takashi. (1999), "Sum of Squares Decomposition for Categorical Data", Kwansei Gakuin Studies in Computer Science, Vol.14, hal. 1‐6.
Reddy, M.V.J, Kavitha, B. (2010), "Efficient Ensemble Algorithm for Mixed Numeric and Categorical Data", Computational Intelligence and Computing research (ICCIC), IEEE International Conference.
Rismawan, T., Kusumadewi, S. (2008), "Aplikasi K‐Means untuk Pengelompokkan Mahasiswa Berdasarkan Nilai Body Rismawan, T., Kusumadewi, S. (2008), Aplikasi K Means untuk Pengelompokkan Mahasiswa Berdasarkan Nilai Body
Mass Index (BMI) dan Ukuran Kerangka", Seminar Nasional Aplikasi Teknologi Informasi, Universitas Islam Indonesia, hal. 43‐47.
Sharma, S. (1996), Applied Multivariate Technique, John Wiley & Sons, Inc., New York.
Statistics New Zealand (2006), "Urban/Rural Profile (Experimental) Classification Categories", diunduh dari http://www.stats.govt.nz/surveys_and_methods/ pada 23 Mei 2011.
S hl A d Gh h J (2002) "Cl E bl A K l d R F k f C bi i M l i l
Strehl, A., dan Ghosh, J. (2002), "Cluster Ensembles ‐ A Knowledge Reuse Framework for Combining Multiple Partitions", Journal of Machine Learning Research 3 , hal. 583‐617.
United Nations (2008), Designing Household Survey Samples: Practical Guidelines. Department of Economic and Social Affairs, New York.
Yoon, H.‐S., Ahn, S.‐Y., Lee, S.‐H., Cho, S.‐B., dan Kim, J.‐H. (2006), "Heterogeneous Clustering Ensemble Method for Combining Different Cluster Results", BioDM, LNBI 3916 , hal. 82‐92g , , ,