Laporan Praktikum Analisis Multivariat Laporan Praktikum Analisis Multivariat
“
“Analisis KlusterAnalisis Kluster””
Disusun untuk memenuhi praktikum Analisis
Disusun untuk memenuhi praktikum Analisis MultivariatMultivariat
oleh: oleh: Nama
Nama : Suprianto: Suprianto NIM
NIM : 0910950069: 0910950069 Asisten
Asisten : : 1. 1. Danny Danny Prasetyo Prasetyo HartantoHartanto 2. Aris Wicaksono
2. Aris Wicaksono Tanggal
Tanggal : : 8 8 Mei Mei 20122012
LABORATORIUM STATISTIKA LABORATORIUM STATISTIKA
JURUSAN
JURUSAN MATEMATIMATEMATIKAKA
FAKULTAS MATEMATIKA DAN ILMU PEGETAHUAN ALAM FAKULTAS MATEMATIKA DAN ILMU PEGETAHUAN ALAM
UNIVERSITAS BRAWIJAYA UNIVERSITAS BRAWIJAYA MALANG MALANG 2012 2012
BAB I BAB I
TINJAUAN PUSTAKA TINJAUAN PUSTAKA
1.1
1.1 Analisis ClusterAnalisis Cluster (Cl(Cl ususteter r AAnalnalysysiiss) ) ..
Analisis Cluster adalah teknik yang digunakan untuk Analisis Cluster adalah teknik yang digunakan untuk mengidentifikasi objek atau individu yang serupa dengan mengidentifikasi objek atau individu yang serupa dengan memperhatikan beberapa kriteria (Kuncoro, 2003:242).
memperhatikan beberapa kriteria (Kuncoro, 2003:242).
Analisis cluster yaitu analisis untuk mengelompokkan Analisis cluster yaitu analisis untuk mengelompokkan elemen yang mirip sebagai objek penelitian menjadi elemen yang mirip sebagai objek penelitian menjadi kelompok (cluster) yang berbeda dan
kelompok (cluster) yang berbeda dan mutually exclusivemutually exclusive (Supranto, 2004:26).
(Supranto, 2004:26).
Analisis cluster termasuk dalam analisis statistik Analisis cluster termasuk dalam analisis statistik multivariat metode interdependen. Sebagai alat analisis multivariat metode interdependen. Sebagai alat analisis interdependen maka tujuan analisis cluster tidak untuk interdependen maka tujuan analisis cluster tidak untuk
menghubungkan ataupun membedakan dengan
menghubungkan ataupun membedakan dengan
sampel/variabel lain. Analisis cluster merupakan salah satu sampel/variabel lain. Analisis cluster merupakan salah satu alat analisis yang berguna sebagai peringkas data. Dalam alat analisis yang berguna sebagai peringkas data. Dalam meringkas data ini dapat dilakukan dengan jalan meringkas data ini dapat dilakukan dengan jalan mengelompokkan objek-objek berdasarkan kesamaan mengelompokkan objek-objek berdasarkan kesamaan karakteristik tertentu di antara objek-objek yang hendak karakteristik tertentu di antara objek-objek yang hendak diteliti (Tim Penelitian
diteliti (Tim Penelitian dan Pengembangan, 2005:120).dan Pengembangan, 2005:120).
Analisis cluster adalah suatu alat untuk mengelompokkan Analisis cluster adalah suatu alat untuk mengelompokkan sejumlah
sejumlah nn obyek berdasarkanobyek berdasarkan p p variat yang secara relatif variat yang secara relatif mempunyai kesamaan karakteristik diantara obyek
mempunyai kesamaan karakteristik diantara obyek – – obyek obyek tersebut, sehingga keragaman di dalam suatu kelompok tersebut, sehingga keragaman di dalam suatu kelompok tersebut lebih kecil dibandingkan keragaman antar kelompok. tersebut lebih kecil dibandingkan keragaman antar kelompok. Obyek dapat berupa barang, jasa, tumbuhan, binatang dan Obyek dapat berupa barang, jasa, tumbuhan, binatang dan orang (responden, konsumen, atau yang lainnya). Obyek orang (responden, konsumen, atau yang lainnya). Obyek tersebut akan diklasifikasikan ke dalam satu atau lebih tersebut akan diklasifikasikan ke dalam satu atau lebih cluster (kelompok) sehingga obyek
cluster (kelompok) sehingga obyek – – obyek yang beradaobyek yang berada dalam satu cluster akan mempunyai kemiripan atau dalam satu cluster akan mempunyai kemiripan atau kesamaan karakter.
kesamaan karakter. Jika terdapat
Jika terdapat nn obyek danobyek dan p p variat, maka observasi xvariat, maka observasi x
ij ij
dengan
dengan ii == 1, 1, 22,…,,…, nn dandan j j == 1, 1, 22, , …,…, p p, dapat digambarkan, dapat digambarkan sebagai berikut:
Var 1 Var 2 … Var j … Var p Obyek 1 x 11 x12 … x1j … x1p Obyek 2 x 21 x22 … x2j … x2p : : : : : : : Obyek i x i1 xi2 : xij : xip : : : : : : : Obyek n x n1 xn2 : xnj : xnp
Adapun ciri-ciri cluster adalah:
1. Homogenitas (kesamaan) yang tinggi antar anggota dalam satu cluster (within-cluster ).
2. Heterogenitas (perbedaan) yang tinggi antar cluster yang satu dengan cluster yang lainnya (between-cluster ).
Analisis cluster mempunyai beberapa istilah penting, antara lain:
1. Skedul aglomerasi (agalomeration schedule), ialah jadwal yang memberikan informasi tentang objek atau kasus yang akan dikelompokkan pada setiap tahap pada suatu proses analisis cluster yang hierarkis.
2. Rata-rata cluster (cluster centroid ), ialah nilai rata-rata variabel dari semua objek atau observasi dalam cluster tertentu.
3. Pusat cluster (cluster centers), ialah titik awal dimulainya pengelompokkan di dalam cluster nonhierarki.
4. Keanggotaan cluster (cluster membership), ialah keanggotaan yang menunjukkan cluster untuk setiap objek yang menjadi anggotanya.
5. Dendogram, disebut juga grafik pohon, output SPSS yang memvisualisasikan hasil analisis cluster yang dilakukan peneliti. Garis vertikal atau tegak menunjukkan cluster yang digabung bersama. Posisi garis pada pada skala menunjukkan jarak untuk mana cluster digabung. Dendogram harus dibaca dari kiri ke kanan.
6. Distances between cluster centers, ialah jarak yang menunjukkan bagaimana terpisahnya pasangan individu cluster (Supranto, 2004:146).
1.2 Tujuan Analisis Cluster
Setelah mengelompokkan n buah obyek pengamatan kedalam m kelompok berdasarkan p variat dapat diketahui bahwa tujuan utama dari pengclusteran obyek adalah untuk
mendapatkan kelompok obyek yang memiliki nilai relatif sama. Sehingga kelak dalam interpretasi, obyek-obyek yang berada pada satu cluster memiliki peluang yang cukup tinggi
akan muncul bersamaan pada satu individu. 1.3 Konsep Dasar dalam Analisis Cluster
Analisis cluster merupakan suatu kelas teknik, dipergunakan untuk mengklasifikasi obyek atau kasus ke dalam kelompok yang relatif homogen, yang disebut cluster. Obyek dalam setiap kelompok cenderung mirip satu sama lain dan berbeda jauh (tidak sama) dengan obyek dari cluster lainnya (Supranto, 2004:142).
Pengelompokkan dilakukan berdasarkan kemiripan ( similarity) antar obyek. Kemiripan diperoleh dengan meminimalkan jarak antar obyek dalam kelompok ( within-cluster ) dan memaksimalkan jarak antar kelompok ( between-cluster ).
1.4 Proses Analisis Cluster
Untuk melakukan analisis cluster ada beberapa proses yang harus dilakukan . Proses analisis cluster tersebut meliputi :
1. Menentukan ukuran ketakmiripan antar dua objek.
Sesuai prinsip daftar cluster yaitu mengelompokkan objek yang mempunyai kemiripan, maka proses pertama adalah mengukur seberapa jauh ada kesamaan antar objek. Dengan memiliki sebuah ukuran kuantitatif untuk mengatakan bahwa dua obyek tertentu lebih mirip dibandingkan dengan obyek lain, akan menghilangkan kebingungan dan mempermudah proses formal dalam pengclusteran. Salah satu yang jelas bisa menjadi ukuran ketakmiripan adalah fungsi jarak antara objek a dan b, yang biasa dinotasikan dengan d(a,b).
Sifat – sifat ukuran ketakmiripan adalah :
1) d(a.b) ≥ 0
2) d(a,a) = 0
3) d(a,b) = d(b,a)
4) (a,b) meningkat seiring semakin tidak mirip kedua objek a dan b.
5) d(a,c) ≤ d(a,b) + d(b,c) (Sartono, 2003:216).
Jarak yang paling umum digunakan adalah jarak
euclidean. Ukuran jarak atau ketidaksamaan antar obyek ke-i dengan obyek ke-h, disimbolkan dengan d
ih. Nilai dih
diperoleh melalui perhitungan jarak kuadrat Euclidean sebagai berikut ∑
dimana: d
ih = jarak kuadrat Euclidean antar obyek ke-i dengan
obyek ke-h.
p = jumlah variabel cluster. x
ij= nilai atau data dari obyek ke-i pada variabel ke-j.
x
hj = nilai atau data dari obyek ke-h pada variabel ke-j
(Everitt, 1993). 2. Membuat Cluster
Proses cluster atau pengelompokan data bisa dilakukan dengan dua metode:
a. Metode Hirarki
Metode ini memulai pengelompokan dengan dua atau lebih objek yang mempunyai kesamaan paling dekat. Kemudiaan operasi diteruskan ke objek lain yang mempunyai kedekatan kedua. Demikian seterusnya
sehingga cluster akan membentuk semacam ‘pohon’
dimana ada hirarki (tingkatan) yang jelas antar objek, dari yang paling mirip sampai paling tidak mirip. Metode yang digunakan untuk proses Clustering secara hirarki adalah Single Linkage (Pauatan Tunggal). Metode ini akan mengelompokan dua objek yang mempunyai jarak terdekat dahulu. Jadi pada setiaptahapan, banyaknya cluster berkurang satu.
Secara formal, dua buah cluster B
r dan Bs, jarak antara B
r dan Bsmisalkan h(Br ,Bs) didefinisikan sebagai : h(B
r ,Bs) = min{d(xi,x j); xi anggota Br , x j anggota B
s}
Hasil berupa single linkage clustering dapat disajikan dalam bentuk suatu dendogram atau diagram pohon. Cabang-cabang pohon menunjukkan cluster/kelompok. Cabang-cabang tersebut bertemu bersama-sama (menggabung) pada simpul yang posisinya sepanjang suatu sumbu jarak (kemiripan) menunjukkan tingkat dimana penggabungan terjadi.
b. Metode Non-hirarki
Metode ini dimulai dengan proses penentuan jumlah cluster terlebih dahulu. Metode Non-hirarki yang digunakan adalah k-means. Metode k-means digunakan sebagai alternatif metode cluster untuk data dengan ukuran yang besar karena memiliki kecepatan yang lebih tinggi dibandingkan metode hirarki.
Mac Queen menyarankan bahwa penggunaan k-means untuk menjelaskan algoritma dalam penentuan suatu objek ke dalam cluster tertentu berdasarkan rataan terdekat. Proses Pengelusteran dengan metode k-means adalah :
1) Menetukan besarnya k, yaitu banyaknya cluter dan menentukan centroid di tiap cluster.
2) Menghitung jarak tiap objek dengan setiap centroid . 3) Menghitung kembali rataan (centroid ) untuk cluster
yang baru terbentuk.
4) Mengulangi langkah 2 sampai tidak ada lagi pemindahan objek antar cluster (Sartono, 2003:
230).
3. Setelah cluster terbentuk, baik dengan metode hirarki maupun non hirarki, langkah selanjutnya melakukan interpretasi terhadap cluster yang terbentuk,yang pada intinya memberi nama spesifik untuk menggambar isi cluster tersebut.
4. Melakukan validasi cluster.
Untuk menguji validasi cluster digunakan uji parsial F. Hipotesis:
H
0: variabel i bukan variabel pembeda dalam pengclusteran.
H
1: variabel i merupakan variabel pembeda dalam pengclusteran Taraf signifikansi α Statistik uji Kriteria Uji : Tolak H 0 jika F > Fα, k -1,n-k
BAB II
METODOLOGI 2.1 Sumber Data
Data yang digunakan untuk analisis kluster adalah Data Data indikator kesejahteraan beberapa negara. Data ini di peroleh dari contoh data SPSS world95.sav.
2.2 Tahapan Analisis
2.2.1 Standarisasi dan Analisis Komponen Utama 1. Masukkan data ke SPSS 16.
2. Kemudian lakukan transformasi (standarisasi)
Klik Analyze Descriptive Statistics Descriptives Seperti di bawah ini :
3. Akan muncul kotak dialog seperti di bawah ini, masukkan semua variable kedalam kolom Variable(s), kemudian centang Save standardized values as variables. Lalu klik OK.
4. Maka akan muncul hasilnya, seperti di bawah ini
5. Menghitung korelasi pearson.
6. Akan muncul kotak dialog seperti di bawah ini, masukkan semua variable Zscore ke kolom Variables. Lalu klik OK .
7. Selanjutnya, melakukan Analisis Komponen karena ada variabel-variabel yang berkorelasi.
Klik Analyze Data Reduction Factor.
8. Dan akan muncul kotak dialog seperti dibawah ini :
Masukkan variabel Zscore ke dalam kotak variables, karena nilai standar deviasi antar variabel besar.
9. Pilih Extraction,maka akan muncul kotak dialog, seperti di bawah ini.
Selanjutnya centang Covariance matrix karena data yang digunakan adalah variabel standardized . Dan number of factor diisi 7 atau sesuai banyaknya variabel. lalu Continue. 10.Pilih Scores, maka akan muncul kotak dialog, seperti di
bawah ini, setelah itu centang Save as variables Regression, dan centang juga Display factor score coefficient matrix. Lalu continue.
2.2.2 Analisis Cluster Hierarchy
1. Klik Analyze Classify Hierarchical cluster
2. Dan akan muncul kotak dialog seperti dibawah ini :
Masukkan variabel Country ke dalam kotak Label Cases By, dan juga masukkan Komponen utama yang terbentuk ( REGR Factor Score) ke dalamVariable(s).
3. PilihStatistics, maka akan muncul kotak dialog, seperti di bawah ini.
Selanjutnya centang Aglomeration schedule dan Proximity matrix. Pada Cluster membership pilih none. lalu Continue.
4. Pilih Plots,akan muncul kotak dialog seperti di bawah ini
Selanjutnya centang Dendogram dan icicle pilih none lalu Continue.
5. Pilih Methods, akan muncul kotak dialog seperti di bawah ini
setelah itu pada Cluster Method pilih Between-Group linkage dan pada Measure pilih Euclidean Distance. Lalu continue.
6. Pilih Save, maka akan muncul kotak dialog seperti di bawah ini
setelah itu pada Cluster Membership pilih None. Lalu continue.
2.2.3 Penentuan Jumlah Cluster
1. Copy tabel Aglomeration Schedule pada Output SPSS ke Microsoft Excel
2. Selanjutnya cari selisih dari stage-stage secara berurutan dari niai Coefficiens. Kemudian cari nilai stage terkecil dari selisih terbesar untuk menentukan jumlah kluster dengan rumus:
Jumlah Cluster = banyaknya Objek -stage terkecil dari selisih terbesar
3. Untuk melihat iterasi sampai terbentuk jumlah kluster dengan mengurutkan mulai dari stage 1 dengan anggota Cluster 1 dan Cluster 2 dan stage selanjutnya dengan melihat
next stage. Dan seterusnya sampai diperoleh iterasi sampai akhir (diberi warna hijau).
2.2.4 menentukan Anggota Kluster
2. Dan akan muncul kotak dialog seperti dibawah ini :
Masukkan variabel Country ke dalam kotak Label Cases By, dan juga variabel awal yang lain ke Variable(s).
3. PilihStatistics, maka akan muncul kotak dialog, seperti di bawah ini.
Selanjutnya centang Aglomeration schedule dan Proximity matrix. Pada Cluster membership pilih single solution dan pada Number of cluster isi dengan 3. lalu Continue.
4. Pilih Plots, maka akan muncul kotak dialog, seperti di bawah ini.
Selanjutnya centang Dendogram dan icicle pilih all cluster lalu Continue.
5. Pilih Methods, maka akan muncul kotak dialog seperti di bawah ini
setelah itu pada Cluster Method pilih Between-Group linkage dan pada Measure pilih Euclidean Distance. Lalu
continue.
6. Pilih Save, akan muncul kotak dialog seperti di bawah ini
Setelah itu Pada Cluster membership pilih single solution
dan pada Number of cluster isi dengan 3. lalu Continue.
2.2.5 Menentukan Karakteristik Tiap Kluster
1. Klik Data Select CaseSeperti di bawah ini :
2. Lalu akan muncul kotak dialog seperti di bawah ini dan Pilih If Cinditional issatisfied If…
3. Masukkan average linkage pada dialog dan tuliskan CLU3_1=1 pada dialog dan klik continue
4. Klik OK dan akan muncul sebagai berikut.
5. Cari nilai mean, Klik Analyze Descriptive Statistics
Descriptives
6. Akan muncul kotak dialog seperti di bawah ini, masukkan semua variable ke dalam kolom Variable(s), kemudian. Lalu klik OK.
7. Pilih Optios pilih Mean. Klik Continue
8. Klik OK
9. Lakukan dengan cara yang sama untuk CLU3_1=2 dan CLU3_1=3
10. Kemudian dari mean ketiga kluster tersebut dicari mean terbesar tiap-tiap kriteria dan mean terbesar tersebut merupakan karakteristik dari kluster dengan mean terbesar itu sendiri.
BAB III
HASIL DAN PEMBAHASAN 3.1 Data dan Kasus
Data indikator kesejahteraan beberapa negara.
COUNTRY D E N S I T Y U R B A N L I F E E X P F L I F E E X P M L I T E R A C Y B A B Y M O R T G D P _ C A P Afghanistan 25 18 44 45 29 168 205 Bangladesh 800 16 53 53 35 106 202 Cambodia 55 12 52 50 35 112 260 China 124 26 69 67 78 52 377 Hong Kong 5494 94 80 75 77 5.8 14641 India 283 26 59 58 52 79 275 Indonesia 102 29 65 61 77 68 681 Japan 330 77 82 76 99 4.4 19860 Malaysia 58 43 72 66 78 25.6 2995 N. Korea 189 60 73 67 99 27.7 1000 Pakistan 143 32 58 57 35 101 406 Philippines 221 43 68 63 90 51 867 S. Korea 447 72 74 68 96 21.7 6627 Singapore 4456 100 79 73 88 5.7 14990 Taiwan 582 71 78 72 91 5.1 7055 Thailand 115 22 72 65 93 37 1800 Vietnam 218 20 68 63 88 46 230
Keterangan variabel :
Variabel Penjelasan
Density Banyaknya penduduk per km persegi
Urban Persentase penduduk yang tinggal di perkotaan Lifeexpf Harapan hidup penduduk perempuan (tahun) Ligeexpm Harapan hidup penduduk laki-laki (tahun) Literacy Persentase penduduk yang bisa baca-tulis Babymort Banyaknya kematian bayi per 1000 kelahiran
Gdp_cap Penghasilan penduduk per kapita pertahun (US$) Tujuan penelitian:
1. Mengetahui banyaknya kelompok yang terbentuk
2. Mengidentifikasi indikator kesejahteraan dari kelompok tersebut
3.2 Output dan Interpretasi
Descriptive Statistics
N Minimum Maximum Mean Std. Deviation DENSITY 17 25 5494 802.47 1594.105 URBAN 17 12 100 44.76 28.556 LIFEEXPF 17 44 82 67.41 10.886 LIFEEXPM 17 45 76 63.47 8.726 LITERACY 17 29 99 72.94 25.168 BABYMORT 17 4 168 53.88 46.441 GDP_CAP 17 202 19860 4263.00 6291.046 Valid N (listwise) 17
Dari tabel di atas dapat dilihat bahwa variabel-variabel tersebut memiliki keragamana yang besar sehingga harus di standarisasi.
Dari tabel Correlation di atas dapat diketahui ada variabel-variabel yang berkorelasi maka harus dilakukan analisis komponen utama.
Total Variance Explained
Com pone nt
Initial Eigenvaluesa
Extraction Sums of Squared Loadings Total % of Variance Cumulative % Total % of Variance Cumulative % Raw 1 5.317 75.959 75.959 5.317 75.959 75.959 2 1.171 16.727 92.686 1.171 16.727 92.686 3 .292 4.173 96.859 .292 4.173 96.859 4 .116 1.662 98.521 .116 1.662 98.521 5 .081 1.161 99.682 .081 1.161 99.682 6 .020 .279 99.961 .020 .279 99.961 7 .003 .039 100.000 .003 .039 100.000 Rescal ed 1 5.317 75.959 75.959 5.317 75.959 75.959 2 1.171 16.727 92.686 1.171 16.727 92.686 3 .292 4.173 96.859 .292 4.173 96.859 4 .116 1.662 98.521 .116 1.662 98.521 5 .081 1.161 99.682 .081 1.161 99.682 6 .020 .279 99.961 .020 .279 99.961 7 .003 .039 100.000 .003 .039 100.000 Extraction Method: Principal Component
Analysis.
a. When analyzing a covariance matrix, the initial eigenvalues are the same across the raw and rescaled solution.
Dari tabel di atas terbentuk 2 komponen utama dengan keragaman kumulatif sebesar 92,686%. Dan untuk selanjutnya 2 komponen utama ini yang akan digunakan untuk analisis kluster. Agglomeration Schedule Stage Cluster Combined Coefficient s
Stage Cluster First Appears
Next Stage Cluster 1 Cluster 2 Cluster 1 Cluster 2
1 4 12 .177 0 0 4 2 13 15 .257 0 0 12 3 10 16 .370 0 0 6 4 4 17 .399 1 0 6 5 3 11 .421 0 0 8 6 4 10 .476 4 3 9 7 7 9 .614 0 0 9 8 2 3 .676 0 5 10 9 4 7 .687 6 7 12 10 2 6 .833 8 0 13 11 5 14 .953 0 0 15 12 4 13 1.297 9 2 14 13 1 2 1.409 0 10 14 14 1 4 2.175 13 12 15 15 1 5 3.194 14 11 16 16 1 8 3.925 15 0 0
Tabel di atas digunakan untuk menentukan jumlah
cluster yang terbentuk. Dari
cari selisih dari stage-stage secara berurutan dari niai Coefficiens. Kemudian cari nilai stage terkecil dari selisih terbesar untuk menentukan jumlah kluster dengan rumus:Jumlah Cluster = banyaknya Objek - stage terkecil dari selisih terbesar
Dengan bantuan excel didapatkan selisih terbesar yaitu selisih antara stage 14 dan 15 yaitu sebesar 1,01844133. Dan nilai yang koeficeient terkecil yaitu stage 14 sehingga diperolehJumlah Cluster = 17 – 14 = 3 cluster.
Agglomeration Schedule
Stage
Cluster Combined
Coefficient s
Stage Cluster First Appears
Next Stage Cluster 1 Cluster 2 Cluster 1 Cluster 2
1 4 12 .177 0 0 4 2 13 15 .257 0 0 12 3 10 16 .370 0 0 6 4 4 17 .399 1 0 6 5 3 11 .421 0 0 8 6 4 10 .476 4 3 9 7 7 9 .614 0 0 9 8 2 3 .676 0 5 10 9 4 7 .687 6 7 12 10 2 6 .833 8 0 13 11 5 14 .953 0 0 15 12 4 13 1.297 9 2 14 13 1 2 1.409 0 10 14 14 1 4 2.175 13 12 15 15 1 5 3.194 14 11 16 16 1 8 3.925 15 0 0
Baris yang di warna kuning merupakan banyaknya iterasi sampai diperoleh 3 cluster. Yaitu sebanyak 8 iterasi.
1. Anggota Cluster
Cluster Membership Case 3 Clusters 1:Afghanistan 1 2:Bangladesh 1 3:Cambodia 1 4:China 1 5:Hong Kong 2 6:India 1 7:Indonesia 1 8:Japan 3 9:Malaysia 1 10:N. Korea 1 11:Pakistan 1 12:Philippines 1 13:S. Korea 1 14:Singapore 2 15:Taiwan 1 16:Thailand 1 17:Vietnam 1Dari tabel di atas diperoleh bahwa terdapat 3 cluster dengan rincian:
Cluster 1 : Afghanistan, Bangladesh, Cambodia, China, India, Indonesia, Malaysia, N. Korea, Pakistan, Philippines, S. Korea, Taiwan, Thailand, dan vietnam.
Cluster 2 : Hongkong dan Singapore. Cluster 3 : Japan.
2. Karakteristik Cluster
Cluster 1 Cluster 2 Cluster 3
Max Descriptive Statistics Descriptive Statistics Descriptive Statistics
N Mean N Mean N Mea n DENSITY 1 4 240,14 29 DENSITY 2 4975 DENSITY 1 330 4975 URBAN 1 4 35 URBAN 2 97 URBAN 1 77 97 LIFEEXP F 1 4 64,642 86 LIFEEXP F 2 79,5 LIFEEXP F 1 82 82 LIFEEXP M 1 4 61,071 43 LIFEEXP M 2 74 LIFEEXP M 1 76 76 LITERAC Y 1 4 69,714 29 LITERAC Y 2 82,5 LITERAC Y 1 99 99 BABYMO RT 1 4 64,292 86 BABYMO RT 2 5,75 BABYMO RT 1 4,4 64,292 86 GDP_CA P 1 4 1641,4 29 GDP_CA P 2 14815 ,5 GDP_CA P 1 198 60 19860 Valid N (listwise) 1 4 Valid N (listwise) 2 Valid N (listwise) 1
Dari tabel di atas dapat diketahui bahwa karakteristik dari tiap-tiap kluster yaitu
Cluster 1 : Banyaknya kematian bayi per 1000 kelahiran yang tinggi.
Cluster 2 : Banyaknya penduduk per km persegi dan Persentase penduduk yang tinggal di perkotaan yang tinggi.
Cluster3 :Harapan hidup penduduk perempuan (tahun), Harapan hidup penduduk laki-laki (tahun), Persentase penduduk yang bisa baca-tulis, dan Penghasilan penduduk per kapita pertahun (US$) yang tinggi.
BAB IV
KESIMPULAN DAN SARAN 4.1 Kesimpulan
Data kesejahteraan dari berbagai negara dengan 7 indikator kesejahteraan diperoleh 3 cluster.Cluster 1 terdiri dari negara-negara Afghanistan, Bangladesh, Cambodia, China, India, Indonesia, Malaysia, N. Korea, Pakistan, Philippines, S. Korea, Taiwan, Thailand, dan vietnam dengan karakteristik Banyaknya kematian bayi per 1000 kelahiran yang tinggi. Sehingga cluster 1 dapat digolongkan ke negara-negara dengan kesejahteraan rendah.
Cluster 2 terdiri dari Hongkong dan Singapore dengan karakteristik Banyaknya penduduk per km persegi dan Persentase penduduk yang tinggal di perkotaan yang tinggi. Sehingga cluster 2 dapat digolongkan ke negara-negara dengan kesejahteraan sedang.
Cluster 3 hanya terdiri dari Japan dengan karakteristik Harapan hidup penduduk perempuan (tahun), Harapan hidup penduduk laki-laki (tahun), Persentase penduduk yang bisa baca-tulis, dan Penghasilan penduduk per kapita pertahun (US$) yang tinggi.Sehingga cluster 3 dapat digolongkan ke negara-negara dengan kesejahteraan tinggi.
4.2 Saran
Perlu adanya penambahan indikator kesejahteraan dan juga jumlah negara ditambah lebih banyak lagi.