PENGELOMPOKKAN DESA PERDESAAN

(1)

DI PROVINSI RIAU DI PROVINSI RIAU

Oleh : ANGSOKA DEWI ANGSOKA DEWI NRP. 1310201713 Dosen Pembimbing : Dr. Sutikno, S.Si, M.Si Dr. rer. pol. Heri Kuswanto, M.Si

Pasca Sarjana Jurusan Statistika

Fakultas Matematika dan Ilmu Pengetahuan Alam (FMIPA) I tit t T k l i S l h N b

Institut Teknologi Sepuluh Nopember

(2)

Outline

PENDAHULUAN PENDAHULUAN TINJAUAN PUSTAKA

METODOLOGI

HASIL DAN PEMBAHASAN KESIMPULAN DAN SARAN

DAFTAR PUSTAKA DAFTAR PUSTAKA

(3)

KLASIFIKASI VARIABEL MIXED

KLASIFIKASI DESA/KOTA (BPS)

PERDESAAN METODE CLUSTER

VARIABEL MIXED KATEGORIK DAN KONTINU

PERDESAAN

>70%

PERKOTAAN

KARAKTERISTIK BERAGAM

LAPORAN DAERAH SULIT

( )

METODE CLUSTER ENSEMBLE

METODE FULL KATEGORIK

METODE FULL KONTINU

BERAGAM (REMOTE)

PENGELOMPOKKAN DESA PERDESAAN

KATEGORIK KONTINU

ALGORITMA DAN PROGRAM IMPLEMENTASI

DESA PERDESAAN

KELOMPOK DESA PERDESAAN

PROGRAM

PEMANFAATAN HASIL PENGELOMPOKKAN

PERDESAAN (OPTIMUM)

PENGELOMPOKKAN

(4)

Bab 1.2

Bagaimana algoritma pengelompokkan

ensembel pada variabel berskala campuran Bagaimana algoritma pengelompokkan

ensembel pada variabel berskala campuran

Bagaimana pengelompokkan desa perdesaan Bagaimana pengelompokkan desa perdesaan Bagaimana pengelompokkan desa perdesaan di Provinsi Riau dengan pengelompokkan

ensembel

Bagaimana pengelompokkan desa perdesaan di Provinsi Riau dengan pengelompokkan

ensembel

Bagaimana perbandingan kinerja

pengelompokkan ensembel full kategorik Bagaimana perbandingan kinerja

pengelompokkan ensembel full kategorik pengelompokkan ensembel, full kategorik, dan full kontinyu

pengelompokkan ensembel, full kategorik,

dan full kontinyu

(5)

• Menyusun algoritma dan program aplikasi berbasais GUI untuk pengelompokkan

ensembel pada variabel berskala

• Menyusun algoritma dan program aplikasi berbasais GUI untuk pengelompokkan

ensembel pada variabel berskala

1 campuran campuran

l kk d d d

• Mengelompokkan desa perdesaan di Provinsi Riau dengan metode

pengelompokkan ensembel

• Mengelompokkan desa perdesaan di Provinsi Riau dengan metode

pengelompokkan ensembel

2

• Membandingkan kinerja pengelompokkan ensembel, full kategorik dan full kontinyu

3 untuk pengelompokkan desa perdesaan ^{, f} ^g

^f

^y di Provinsi Riau

, f g

f

y

untuk pengelompokkan desa perdesaan di Provinsi Riau

3

(6)

Bab 1.4

BPS

• Sebagai bahan pertimbangan dalam

BPS

• Sebagai bahan pertimbangan dalam

• Sebagai bahan pertimbangan dalam pengembangan metodologi sensus dan survei yang mempertimbangkan remote area

area.

Keilmuan Statistika Keilmuan Statistika

• Mengembangkan wawasan keilmuan statistika khususnya metode

l kk b l t l t

• Mengembangkan wawasan keilmuan statistika khususnya metode

l kk b l t l t

pengelompokkan ensambel atau cluster ensemble.

pengelompokkan ensambel atau cluster

ensemble.

(7)

Provinsi Riau

Desa Perdesaan

Cluster Ensemble

Squeezer

Combining Cluster (Squeezer)

Aglomeratif

(8)

Bab 2.1

Definisi BPS

PERKOTAAN PERDESAAN

memenuhi tidak memenuhi

1. Kepadatan penduduk

2. Persentase rumah tangga pertanian 3. Fasilitas perkotaan

UU No.22 Tahun 1999 dan UU No.26 Tahun 2007 UU No.22 Tahun 1999 dan UU No.26 Tahun 2007

 Kawasan perkotaan ⊳ kegiatan bukan pertanian, fungsi kawasan sebagai tempat pemukiman perkotaan, pemusatan dan distribusi pelayanan jasa pemerintahan, pelayanan sosial, dan kegiatan ekonomi.

p , p y , g

 Kawasan perdesaan ⊳ kegiatan utama pertanian, termasuk pengelolaan sumber daya alam, susunan fungsi kawasan sebagai tempat permukiman perdesaan.

(9)

Remoteness

 Berhubungan dengan aktivitas pertanian dan pertambangan.

 Menyatakan jarak/distance

 Index of remoteness Karlj (2000)

 Rurality index

 Variabel : kepadatan penduduk, waktu menuju wilayah rujukan terdekat, waktu menuju wilayah lain yang menjadi rujukan.

Australian Bureau of Statistics, ABS (2003)

Major Cities, Inner Regional, Outer Regional, Remote Area, Very Remote Area Variabel :

 Kepadatan penduduk

 Jarak, akses, ketinggian wilayah dari permukaan laut

Departemen Pekerjaan Umum (2007) l

Desa terpencil :

 Daerah perdesaan

 Sarana aksesibilitas kurang/tidak ada

 Secara geografis jauh dari pusat pertumbuhan (perkotaan)

 Ada isolasi geografis yang memisahkan dengan daerah lain

(10)

Bab 2.3

CLUSTERING CLUSTERING

Objek  Desa Perdesaan

Kelompok ( Groups )

Homogen dalam kelompok Heterogen antar kelompok

(11)

Ukuran

Kemiripan Metode

Kemiripan

(similarity) Pengelompokkan

Simple Matching Jaccard Coefficient

Pengelompokkan Hirarki

Jarak Euclidean

Jarak Pengelompokkan

Jarak

Mahalanobis Non‐hirarki

(12)

Cl t E bl

Bab 2.4

Cluster Ensemble

He, et.al (2005a), Yoon, et.al (2006), Ghaemi, et.al (2009)

Algoritma Pengelompokan

K1

Hasil Pengelompokan

SK1Cj

K2

Hasil Pengelompokan

SK2Cj

Penggabungan

Final Cluster (Combining) Final Cluster

... ...

Ki

Hasil Pengelompokan

SKiCj

Tahapan Umum Pengelompokkan Ensambel Tahapan Umum Pengelompokkan Ensambel

(13)

Cl t E bl Cluster Ensemble

He, et.al (2005a)

PENGELOMPOKAN DATA KATEGORIK

PENGELOMPOKAN DATA KONTINU Cluster Ensemble Splitting

ALGORITMA CLUSTER ENSEMBLE BASED MIXED DATA CLUSTERING (CEBMDC)

(14)

Bab 2.4

Pengelompokkan Data Kategorik (Algoritma Squeezer)

k lk l h l h

 Diperkenalkan oleh Zengyou He, et. al. tahun 2002.

 Untuk pengelompokkan data kategorik dengan dimensi data yang besar.

yang besar.

 Banyaknya kelompok belum diketahui.

 One scan algorithm  efisien dalam memory dan waktu

 Robust

 Penggunaan dan pengembangan Algoritma Squeezer:

He, et.al (2005b), He, et.al (2006),

Reddy dan Kavitha (2010), Maryanto (2010)

(15)

Algoritma Squeezer

Cluster :

Definisi 1

Algoritma Squeezer



^tid ^tid ^TID



Cl  | 

Definisi 2

Definisi 3 adalah banyaknya tuple pada cluster Cl yang mengandung nilai



^tid ^A ^tid ^Cl



Cl

VAL_l( )  . _l |  )

(a_l

Sup a_l

Definisi 4

Definisi 5 Cluster Structure : CS = { Cl, Summary } )}

( ,

{(a_l Sup a_l Summary 

Definisi 6

{ , y }

Kemiripan :

 

^  









 ^k 

l l

m

l a VAL Cl l

l

a Sup a tid Sup

Cl Sim

1 ( ) ( )

) ) (

, (

Definisi 7 Definisi 8



Â_l ^T Â_l ^T Â_l ^l ^m_k



T T

Sim( ₁, ₂)  | ₁.  ₂_. ,1 

 



 _i

i Sim T T T

T T sim

Avg _ ( ₁, )



₁, /| |

i

(16)

Bab 2.4

Algoritma Squeezer

Pembobotan Ukuran Kemiripan

Li dan Biswas(2002) dan He et al (2006)

Algoritma Squeezer

Li dan Biswas(2002) dan He, et.al (2006)

 More Similar Feature Value Set (MSFVS)

 Misalkan objek i dan j dengan nilai/kategori yang sama dalam variabel l dinotasikan Vil, maka MSFVS dari Vil adalah

)}

( )

(

| { )

(

V_il V_il f V_jl f V_il

MSFVS

 

^(2.10)

 Ukuran Kemiripan menjadi :

 



 

 



)

(

( 1 )

1 ) ( ).

1 ( ) (

Vil

MSFVS l

il il

il

n n

V f V

V f

w

(2.11)

 Ukuran Kemiripan menjadi :



^



 









 ^k 

l l

m

l a VAL C l

l

l Sup a

a a Sup

w tid

Cl Sim

1 ( ) ( )

) ) (

( )

,

( (2.12)



 

 ^a^l ^VAL^l⁽^C⁾

(17)

Algoritma Squeezer Threshold (s)

Di k k k k h l k k

Algoritma Squeezer

 Digunakan untuk menentukan apakah suatu tuple akan masuk ke dalam cluster yang telah ada, atau memembentuk cluster baru.

 Subjektif  Jika telah mengetahui karakteristik data

 Teknik sampling, dengan cara :

a) Mengambil sampel dari data, dinotasikan dengan S.

b) Untuk setiap pasang tuple dalam S, hitung kemiripannya.

) Hit t t k i i ( i ) d i l k h b) c) Hitung rata‐rata kemiripan (avg_sim) dari langkah b).

d) Tentukan threshold s=avg_sim+1 atau s=avg_sim+2

(18)

Bab 2.4

Pengelompokkan Data Kontinyu (Hirarki Aglomeratif)

 Jarak antar kelompok dengan metode Linkage

(19)

C bi i Cl (T h E b l) Combining Cluster (Tahapan Ensembel) He, et.al (2005a)

 Combining cluster dengan algoritma pengelompokkan data kategorik (Algoritma Squeezer)

 Lebih efisien, dan computational cost rendah

 Metode ensembel sederhana

(20)

I d k V lidi k P l kk Hi ki

Bab 2.5

Indeks Validitas untuk Pengelompokkan Hirarki Sharma (1996), Halkidi, et.al (2001)

1. Root Mean Square Standard Deviation (RMSSTD) 2. Semi‐Partial R‐Squared (SPR)

3 R S d (RS) 3. R‐Squared (RS)

4. Distance Between Cluster (CD) Kelompok optimum :

Titik di mana terjadi penurunan nilai indeks yang tertinggi j p y g gg (steepest knee / greatest jump)

Detail

(21)

Untuk Variabel Kontinyu (Bunkers, et.al, 1996)

1 

C



^C



¹



^C

c

W

S

S C

1

1  

²

1

2

1 1 



 



 

  

 C

c

B

x

c

x

S C

dan

(2.20) (2.21)

Simpangan baku dalam kelompok

Simpangan baku kelompok ke‐c

Simpangan baku antar kelompok

Rata‐rata kelompok ke‐c

Rata‐rata total

C : banyaknya kelompok

Kriteria : S_W minimum dan S_B maksimum atau Rasio S_W / S_B terkecil

(22)

Bab 2.6

Untuk Variabel Kategorik

2 /



1

  

Light & Margolin (1971), Okada(1999), Kader & Perry (2007)

1 1

. 2 2

/ 1

'

2 1 2

 

 

 

 

 

 



 

 

 

   

 

C n n n

C S WSS

C

c

K

k

kc c

c

W (2.26)

 



 

 



 

  n C n C

W

2 /



1



(2.27)

2 / 1

1 2

1 1

2 .

2 / 1

'

2 1 1

2 1

 

 

 

 

 



 





 

 

    



 

n n n n

S BSS

K

k

k C

c

K

k

kc c

B

1 1

 



 

 



 

  C C

S

_B

(23)

MATLAB versi 7.12 (R2011a)

• GUI untuk Algoritma Pengelompokkan GIS k Ek l i D d Vi li i

• GIS untuk Eksplorasi Data dan Visualisasi Hasil Pengelompokkan

(24)

Bab 3.1

Data PODES 2008  1.383 desa perdesaan di Provinsi Riau

SKALA VARIABEL

PENGUKURAN

X1 Letak geografis desa Kategorik

X2 Akses menuju desa Kategorik

VARIABEL

j g

X3 Jenis jalan terpanjang Kategorik

X4 Alat transportasi umum utama Kategorik

X5 Kepadatan penduduk Kontinyu

X6 Persentase keluarga pertanian Kontinyu X77 Jarak desa ke kecamatanJ des e ec Kontinyuo yu X8 Jarak desa ke kabupaten/kota Kontinyu X9 Jarak desa ke kabupaten/kota lain terdekat Kontinyu

(25)

1. Menyusun Algoritma dan Program Pengelompokkan Ensembel

DATA

Variabel k

Algoritma

Squeezer Output 1

Cluster Ensemble

Kategorik Squeezer

Variabel Hirarki

Output 2

Combining (Algoritma Squeezer)

Output Akhir Variabel

Kontinyu Aglomeratif Output 2

(26)

Bab 3.2

2 Mengelompokkan Desa Perdesaan di Provinsi Riau dengan 2. Mengelompokkan Desa Perdesaan di Provinsi Riau dengan

Pengelompokkan Ensembel

a. Memisahkan variabel kategorik (X1 – X4) dan variabel kontinyu (X5 – X9) a. Memisahkan variabel kategorik (X1 X4) dan variabel kontinyu (X5 X9) b. Mengelompokkan X1 – X4 dengan algoritma Squeezer.

c. Menentukan kelompok terbaik untuk b.

d Mengelompokkan X5 X9 dengan aglomeratif dengan k ran jarak d. Mengelompokkan X5 – X9 dengan aglomeratif dengan ukuran jarak

Euclidean dan Mahalanobis, dan metode pautan Complete Linkage dan Average Linkage.

e Menentukan kelompok terbaik untuk d e. Menentukan kelompok terbaik untuk d.

f. Combining hasil c dan e menjadi kelompok akhir.

g. Menentukan kelompok terbaik untuk kelompok akhir.

(27)

3 Membandingkan Hasil Pengelompokkan Ensembel Full Kategorik 3. Membandingkan Hasil Pengelompokkan Ensembel, Full Kategorik

dan Full Kontinyu

Full Kategorik

Variabel Kategorik

DATA

Full Kategorik

Variabel Kontinyu

Algoritma

Squeezer Output

Variabel Kategorik Transformasi

Variabel Kategorik

Full Kontinyu

Transformasi

Variabel Kontinyu

Hirarki

Aglomeratif Output

DATA

Variabel Kontinyu

(28)

Bab 4.1

Al it

• Algoritma Squeezer

 hi b b i il i i i /

Algoritma

 hitung bobot, similarity, summaries, rasio SW/SB

• Aglomeratif

 modifikasi toolbox clustering dan CVAP 3.7

• Menampilkan Peta

 modifikasi toolbox ArcMat 1.0

Semua fungsi diintegrasikan dalam toolbox baru:

Clustering: CEBMDC

(29)

P B b i GUI

Program Berbasis GUI

(30)

Bab 4.2

1 P l kk D t K t ik

Karakteristik Riau

1. Pengelompokkan Data Kategorik

• Pengelompokkan dengan pembobot menghasilkan kelompok yang lebih besar.

• Kinerja pengelompokkan dengan pembobot lebih baik (Rasio

SW/SB secara umum lebih kecil)

(31)

1 P l kk D t K t ik

Kelompok Terbaik :

1. Pengelompokkan Data Kategorik

 Pengelompokkan dengan pembobot dan threshold 0.9 (WS0.9)  Rasio SW dan SB terkecil (0,0382).

 4 Kelompok dengan rincian :

 4 Kelompok , dengan rincian : Kelompok 1 : 793 desa

Kelompok 2 : 349 desa p Kelompok 3 : 148 desa Kelompok 4 : 65 desa

Karakteristik

(32)

Bab 4.2

2 P l kk D t K ti

2. Pengelompokkan Data Kontinyu

Banyaknya Euclidean‐

A

Euclidean‐

C l t

Mahalanobis‐

A

Mahalanobis‐

C l t

y y

Kelompok Average Linkage

Complete Linkage

Average Linkage

Complete Linkage

3 0.3205 0.2853 0.5384 0.8475

4 0.3123 0.3815 0.4012 0.8906

5 0.3422 0.4326 0.4542 0.7255

Hasil pengelompokkan yang digunakan dalam tahapan ensembel

 Euclidean‐Complete Linkage 3 kelompok (ECL3) p g p ( )

 Euclidean‐Average Linkage 4 kelompok (EAL4)

 Euclidean‐Average Linkage 5 kelompok (EAL5)

Karakteristik

(33)

3 T h Akhi (E b l)

Kombinasi kelompok yang dilakukan :

 WS0 9 ECL3 WS0 9 EAL4 WS0 9 EAL5

3. Tahapan Akhir (Ensembel)

 WS0.9 – ECL3, WS0.9 – EAL4, WS0.9 – EAL5 Kelompok terbaik adalah : WS0.9 – EAL4

R i SW/SB 0 0072 Rasio SW/SB : 0,0072.

Kelompok yang dihasilkan : 4 kelompok

Kelompok Banyaknyak

Anggota Karakteristik Urutan

1 793 Tidak remote 1

4 65 Remote 4 Karakteristik

(34)

Bab 4.2

P t T tik H il P l kk E b l

Peta Tematik Hasil Pengelompokkan Ensembel

(35)

P l kk F ll K t ik Pengelompokkan Full Kategorik

Kelompok terbaik metode full kategorik adalah pengelompokkan tanpa pembobot  menghasilkan 2 kelompok

Sebagai pembanding dengan pengelompokkan ensembel digunakan hasil 4 kelompok.

(36)

Bab 4.3

P l kk F ll K t ik

Pengelompokkan Full Kategorik

Banyaknya Metode Kelompok Banyaknya

Anggota Karakteristik Urutan Full Kategorik

2 Kelompok

2 216 R t 2

2 Kelompok 2 216 Remote 2

Full Kategorik

4 Kelompok 3 207 Tidak remote 3

4 229 Remote 4

(37)

P l kk F ll K t ik

Pengelompokkan Full Kategorik

(38)

Bab 4.3

P l kk F ll K ti

Pengelompokkan Full Kontinyu

B k Euclidean‐ Euclidean‐ Mahalanobis‐ Mahalanobis‐

Banyaknya Kelompok

uc dea Average

Linkage

uc dea Complete

Linkage

a a a ob s Average

Linkage

a a a ob s Complete

Linkage

3 0.2679 0.2811 0.4491 1.3649

4 0.2981 0.3571 0.6802 1.4383

Metode terbaik yang menghasilkan 3 (tiga) kelompok dan 4 Metode terbaik yang menghasilkan 3 (tiga) kelompok dan 4 (empat) kelompok adalah Euclidean‐Average Linkage (EAL3 dan EAL4) dengan rasio SW dan SB 0,2679 dan 0,2981.

Karakteristik

(39)

P l kk F ll K ti

Pengelompokkan Full Kontinyu

(40)

Bab 4.3

Perbandingan Pengelompokkan Ensembel, Full Kategorik, Perbandingan Pengelompokkan Ensembel, Full Kategorik, dan Full Kontinyu

T b l 4 15 P b di Nil i R i SW d SB

Banyaknya

Kelompok Ensembel Full Kategorik Full Kontinyu Tabel 4.15 Perbandingan Nilai Rasio SW dan SB

Kelompok

2 0.0316 0.0660 ‐

3 ‐ 0.0799 0.2679

4 0.0072 0.0904 0.2981

Secara umum pengelompokkan ensembel menghasilkan

kinerja yang lebih baik.

(41)

Metode Kelompok Banyaknya

Anggota Karakteristik Urutan

Cluster Ensemble

4 65 Remote 4

Full Kategorik

3 207 Tid k t 3

4 229 Remote 4

Full Kontinyu 2 755 Tidak remote 3

3 2 Remote 4

(42)

Bab 4.3 Pengelompokkan Full

Kategorikg

Pengelompokkan Ensembel

Pengelompokkan Full Kontinyu

(43)

Ensembel Ensembel

Pengelompokkan Full Kontinyu

Remote

Tidak Remote

Pengelompokkan Full Kategorik

Outlier Perkotaan

Kategorik

(44)

KESIMPULAN

1. Algoritma dan program yang dibangun dapat digunakan untuk pengelompokkan ensembel untuk menangani variabel campuran kategorik dan kontinyu berdasar Algoritma Cluster untuk menangani variabel campuran kategorik dan kontinyu berdasar Algoritma Cluster Ensemble Based Mixed Data Clustering (CEBMDC). GUI yang dibangun dapat mempermudah pengguna dalam melakukan pengelompokkan khususnya dengan metode ensembel (CEBMDC).

2 P l kk d d di P i i Ri d l kk b l d t

2. Pengelompokkan desa perdesaan di Provinsi Riau dengan pengelompokkan ensembel dapat disimpulkan:

a. Desa‐desa perdesaan di Provinsi Riau dapat dikelompokkan menjadi 4 (empat) kelompok dari kombinasi metode pengelompokkan algoritma Squeezer dengan threshold 0.9 (WS0.9) dan metode Euclidean‐Average Linkage 4 kelompok (EAL4). Daerah remote yang dapat diidentifikasi dengan metode ini adalah sebanyak 65 desa.

b. Baik pada tahapan pengelompokkan data kategorik dan pengelompokkan akhir diperoleh kelompok terbaik melalui algoritma Squeezer dengan pembobot.

3. Metode ensembel memiliki kinerja yang lebih baik daripada metode full kategorik dan full kontinyu dengan kriteria rasio Sw dan Sb dalam pengelompokkan desa‐desa perdesaan di Provinsi Riau. Namun metode ensembel memiliki kompleksitas pemrograman dan waktu yang lebih tinggi daripada metode full kategorik atau full kontinyu.

yang lebih tinggi daripada metode full kategorik atau full kontinyu.

(45)

SARAN

1. Untuk memperbaiki kinerja hasil pengelompokkan, maka pengelompokkan dapat

dit k d b hk i b l i b l d t b k

diterapkan dengan menambahkan variabel‐variabel yang dapat menggambarkan karakteristik daerah remote seperti kondisi jalan yang dilalui, waktu tempuh, frekuensi beroperasinya moda transportasi dalam sehari, dan biaya yang diperlukan untuk menuju daerah perkotaan.p j p

2. Penguasaan atau pengetahuan kondisi dan karakteristik daerah juga sangat diperlukan dalam analisis.

3. Menerapkan metode lain dalam tahapan akhir pengelompokkan ensembel yang dapat diterapkan antara lain consensus function dan genetic algorithm.

4. Penelitian ini hanya membandingkan metode pengelompokkan ensembel dengan metode pengelompokkan khusus data kategorik dan khusus data kontinyu, sehingga perlu dikaji perbandingannya dengan metode yang sama sama dapat sehingga perlu dikaji perbandingannya dengan metode yang sama‐sama dapat menangani data campuran kategorik dan kontinyu seperti Two Step Cluster.

(46)

Andreopoulos, B., An, A., Wang, X., dan Schroeder, M. (2008), ”A roadmap of clustering algorithms: finding a match for biomedical application”, Briefings in Bioinformatics Advance Access, hal. 1‐18.

Australian Bureau of Statistics. (2003), ASGC Remoteness Classification : Purpose and Use (Cencus Paper No.03/01), Canberra: Australian Bureau of Statistics.

Avogadri, R., dan Valentini, G. (2008), "Ensemble Clustering with Fuzzy Approach", Springer.

Badan Pusat Statistik (2009), Klasifikasi Desa Perkotaan Perdesaan, Jakarta: BPS.

Bunkers, W., Miller, J., dan De Gaetano, A. (1996), "Definition of Climate Regions in the Northern Plains Using an Objective Cluster Modification Technique", Journal of Climate 9 , hal. 130‐146.

Commonwealth of Australia (1994), Rural, Remote and Metropolitan Areas Classification 1991 Census Edition, Canberra: Australian Government Publishing Service.

Dewangan, R.R., Sharma, L.K, dan Akasapu, A.K. (2010), "Fuzzy Clustering Technique for Numerical and

l " l l d h l

Categorical Dataset", International Journal on Computer Science and Engineering, hal. 75‐80.

Ghaemi, R., Sulaiman, N., Ibrahim, H., dan Mustapha, N. (2009), "A Survey: Clustering Ensembles Techniques", World Academy of Science, Engineering and Technology, 50 , hal. 636‐645.

He, Z., Xu, X., dan Deng, S. (2002), "Squeezer: An Efficient Algorithm for Clustering Categorical Data", Journal Computer Science and Technology Vol 17 No 5 hal 611 624

Computer Science and Technology, Vol.17, No.5 , hal. 611‐624.

He, Z., Xu, X., dan Deng, S. (2005a), "Clustering Mixed Numeric and Categorical Data: A Cluster Ensemble Approach", Department of Computer Science and Engineering, Harbin Institute of Technology .

He, Z., Xu, X., dan Deng, S. (2005b), "Scalable Algorithms for Clustering Large Datasets with Mixed Type Attributes" International Journal of Intelligent Systems Vol 20 hal 1077‐1089

Attributes International Journal of Intelligent Systems, Vol.20 , hal. 1077 1089.

(47)

Johnson, A., dan Wichern, D. W. (2002), Applied Multivariate Statistical Analysis, 5^thedition, Prentice Hall, Inc., New Jersey.

Kralj, B. (2000), "Measuring Rurality, RIO2008 BASIC : Methodology and Results", Ontario: OMA Economics Department.j, ( ), g y, gy , p Lathifaturrahmah (2010), Perbandingan Hasil Penggerombolan Metode K‐Means, Fuzzy K‐Means, dan Two Step Cluster‐,

Tesis, Pasca Sarjana, Institut Pertanian Bogor.

LeSage, J. P., dan Pace, R. K. (2004), "Arc_Mat, A Matlab Toolbox for Using ArcView Shape Files for Spatial", National Science Foundation.

Li, T., dan Chen, Y. (2010), "Fuzzy Clustering Ensemble with Selection of Number of Clusters", Journal of Computers, Vol 5 No 7 hal 1112 1119

Vol.5, No.7 , hal. 1112‐1119.

Okada, Takashi. (1999), "Sum of Squares Decomposition for Categorical Data", Kwansei Gakuin Studies in Computer Science, Vol.14, hal. 1‐6.

Reddy, M.V.J, Kavitha, B. (2010), "Efficient Ensemble Algorithm for Mixed Numeric and Categorical Data", Computational Intelligence and Computing research (ICCIC), IEEE International Conference.

Rismawan, T., Kusumadewi, S. (2008), "Aplikasi K‐Means untuk Pengelompokkan Mahasiswa Berdasarkan Nilai Body Rismawan, T., Kusumadewi, S. (2008), Aplikasi K Means untuk Pengelompokkan Mahasiswa Berdasarkan Nilai Body

Mass Index (BMI) dan Ukuran Kerangka", Seminar Nasional Aplikasi Teknologi Informasi, Universitas Islam Indonesia, hal. 43‐47.

Sharma, S. (1996), Applied Multivariate Technique, John Wiley & Sons, Inc., New York.

Statistics New Zealand (2006), "Urban/Rural Profile (Experimental) Classification Categories", diunduh dari http://www.stats.govt.nz/surveys_and_methods/ pada 23 Mei 2011.

S hl A d Gh h J (2002) "Cl E bl A K l d R F k f C bi i M l i l

Strehl, A., dan Ghosh, J. (2002), "Cluster Ensembles ‐ A Knowledge Reuse Framework for Combining Multiple Partitions", Journal of Machine Learning Research 3 , hal. 583‐617.

United Nations (2008), Designing Household Survey Samples: Practical Guidelines. Department of Economic and Social Affairs, New York.

Yoon, H.‐S., Ahn, S.‐Y., Lee, S.‐H., Cho, S.‐B., dan Kim, J.‐H. (2006), "Heterogeneous Clustering Ensemble Method for Combining Different Cluster Results", BioDM, LNBI 3916 , hal. 82‐92g , , ,

(48)

PENGELOMPOKKAN DESA PERDESAAN

DI PROVINSI RIAU DI PROVINSI RIAU

Outline

Bagaimana algoritma pengelompokkan

ensembel pada variabel berskala campuran Bagaimana algoritma pengelompokkan

ensembel pada variabel berskala campuran

Bagaimana pengelompokkan desa perdesaan Bagaimana pengelompokkan desa perdesaan Bagaimana pengelompokkan desa perdesaan di Provinsi Riau dengan pengelompokkan

ensembel

Bagaimana pengelompokkan desa perdesaan di Provinsi Riau dengan pengelompokkan

ensembel

Bagaimana perbandingan kinerja

pengelompokkan ensembel full kategorik Bagaimana perbandingan kinerja

pengelompokkan ensembel full kategorik pengelompokkan ensembel, full kategorik, dan full kontinyu

pengelompokkan ensembel, full kategorik,

dan full kontinyu

• Menyusun algoritma dan program aplikasi berbasais GUI untuk pengelompokkan

ensembel pada variabel berskala

• Menyusun algoritma dan program aplikasi berbasais GUI untuk pengelompokkan

ensembel pada variabel berskala

1 campuran campuran

l kk d d d

l kk d d d

• Mengelompokkan desa perdesaan di Provinsi Riau dengan metode

pengelompokkan ensembel

• Mengelompokkan desa perdesaan di Provinsi Riau dengan metode

pengelompokkan ensembel

2

• Membandingkan kinerja pengelompokkan ensembel, full kategorik dan full kontinyu

• Membandingkan kinerja pengelompokkan ensembel, full kategorik dan full kontinyu

3 untuk pengelompokkan desa perdesaan , f g

y di Provinsi Riau

, f g

y

untuk pengelompokkan desa perdesaan di Provinsi Riau

3

BPS

• Sebagai bahan pertimbangan dalam

BPS

• Sebagai bahan pertimbangan dalam

• Sebagai bahan pertimbangan dalam pengembangan metodologi sensus dan survei yang mempertimbangkan remote area

• Sebagai bahan pertimbangan dalam pengembangan metodologi sensus dan survei yang mempertimbangkan remote area

area.

area.

Keilmuan Statistika Keilmuan Statistika

• Mengembangkan wawasan keilmuan statistika khususnya metode

l kk b l t l t

• Mengembangkan wawasan keilmuan statistika khususnya metode

l kk b l t l t

pengelompokkan ensambel atau cluster ensemble.

pengelompokkan ensambel atau cluster

ensemble.

Provinsi Riau

Desa Perdesaan

Cluster Ensemble

Definisi BPS

UU No.22 Tahun 1999 dan UU No.26 Tahun 2007 UU No.22 Tahun 1999 dan UU No.26 Tahun 2007

CLUSTERING CLUSTERING

Ukuran

Kemiripan Metode

Kemiripan

(similarity) Pengelompokkan

Cl t E bl

Cluster Ensemble

Cl t E bl Cluster Ensemble

Pengelompokkan Data Kategorik (Algoritma Squeezer)

k lk l h l h

 Diperkenalkan oleh Zengyou He, et. al. tahun 2002.

 Untuk pengelompokkan data kategorik dengan dimensi data yang besar.

yang besar.

 Banyaknya kelompok belum diketahui.

 One scan algorithm  efisien dalam memory dan waktu

 Robust

 Penggunaan dan pengembangan Algoritma Squeezer:

He, et.al (2005b), He, et.al (2006),

Reddy dan Kavitha (2010), Maryanto (2010)

Algoritma Squeezer

Algoritma Squeezer







3 untuk pengelompokkan desa perdesaan ^{, f} ^g

^y di Provinsi Riau