LAPORAN ANALISIS CLUSTER

(1)

(2)

LAPORAN ANALISIS CLUSTER Mata Kuliah Metode Analisa Perencanaan 1

Dosen Pengampu

Widiyanto Hari Subagyo Widodo, ST., M. Sc

Disusun oleh : Ester Parmanes / 2224034

PROGRAM STUDI PERENCANAAN WILAYAH DAN KOTA FAKULTAS TEKNIK SIPIL DAN PERENCANAAN

INSTITUT TEKNOLOGI NASIONAL MALANG 2023

BAB I PENDAHULUAN

(3)

1.1 Analisis Cluster

Robert Tryon Tahun 1939 merupakan salah satu pionir dalam penggunaan metode clustering di bidang psikologi. Ia mengembangkan pendekatan untuk mengelompokkan individu berdasarkan kesamaan karakteristik tertentu. Sedangkan J. A. Hartigan tahun 1975 mengembangkan algoritma partisi yang dikenal sebagai K-means clustering. Metode ini membagi data menjadi sejumlah k kelompok di mana setiap individu termasuk ke dalam kelompok dengan rata-rata terdekat.Analisis Cluster adalah suatu teknik dalam analisis statistik yang digunakan untuk mengelompokkan objek atau individu berdasarkan kesamaan karakteristik tertentu.

Tujuannya adalah untuk membentuk kelompok atau cluster yang memiliki kesamaan yang tinggi di antara anggotanya, sementara perbedaan antar kelompok sebisa mungkin besar. Hal ini memungkinkan untuk mengidentifikasi pola atau struktur yang ada dalam data dan membantu dalam pengambilan keputusan atau interpretasi lebih lanjut terkait dengan objek yang diteliti.

Metode analisis cluster dapat digunakan dalam berbagai bidang, termasuk ilmu sosial, ekonomi, biologi, dan lain sebagainya. Analisis cluster adalah teknik yang digunakan untuk mengelompokkan elemen yang memiliki kesamaan sebagai obyek penelitian ke dalam kelompok (cluster) yang berbeda dan saling eksklusif. Analisis cluster merupakan bagian dari analisis statistik multivariat yang termasuk dalam metode interdependen. Oleh karena itu, tujuan dari analisis cluster bukanlah untuk menghubungkan atau membedakan dengan sampel atau variabel lain. Analisis cluster terdiri dari dua metode, yaitu:

1.2 Metode Hirarki

Metode ini memulai pengelompokan dengan mengelompokkan dua atau lebih objek yang memiliki kesamaan paling dekat. Proses kemudian dilanjutkan ke objek lain yang memiliki tingkat kesamaan berikutnya. Hasil akhirnya adalah struktur hirarkis berupa "pohon" yang menunjukkan tingkat kesamaan antar objek, dari yang paling mirip hingga yang paling tidak mirip. Pohon ini membantu memvisualisasikan hierarki yang terbentuk. Dalam metode hirarki, terdapat dua tipe dasar: agglomerative (pemusatan) dan divisive (penyebaran). Metode agglomerative memulai dengan menganggap setiap objek sebagai cluster terpisah, dan kemudian menggabungkan dua cluster yang memiliki kesamaan tertinggi. Di sisi lain, metode divisive dimulai dengan satu cluster besar yang berisi semua objek, dan kemudian memisahkan objek berdasarkan tingkat ketidakmiripannya.

Ada lima metode agglomerative yang terkenal, yaitu Single Linkage, Complete Linkage, Average Linkage, Ward’s Method, dan Centroid Method. Masing-masing metode memiliki karakteristiknya sendiri, seperti mengukur jarak berdasarkan jarak terdekat atau terjauh antara dua objek.

1.3 Metode Non-Hirarki

Berbeda dengan metode hirarki, metode non-hirarki dimulai dengan menentukan terlebih dahulu jumlah cluster yang diinginkan. Setelah jumlah cluster ditentukan, proses pengelompokan dilakukan tanpa mengikuti proses hirarki. Metode non-hirarki yang umum digunakan adalah K- Means Cluster. Dalam metode non-hirarki, ada tiga pendekatan yang digunakan untuk menempatkan observasi pada cluster, yaitu Sequential Threshold, Parallel Threshold, dan Optimization. Masing-masing pendekatan memiliki cara tersendiri dalam menempatkan objek ke dalam cluster yang sesuai dengan jarak tertentu.

Keuntungan dari penggunaan metode hierarki adalah memungkinkan pengorganisasian data ke dalam kelompok-kelompok berdasarkan kesamaannya, yang dapat memudahkan

(4)

pemahaman dan interpretasi data. Namun, ada kemungkinan terjadi kesalahan atau ketidakcocokan data, dan sulit untuk mengukur perbedaan di antara berbagai hal dengan akurat. Di sisi lain, metode non-hirarki memungkinkan analisis sampel yang lebih besar, tetapi mungkin tidak efektif dengan data yang tidak biasa atau informasi yang tidak relevan. Jika melibatkan titik acak, metode hierarki lebih disarankan.Pada metode hirarki, dimulai dengan mengelompokkan dua atau lebih objek yang memiliki kesamaan yang paling dekat. Proses ini dilanjutkan dengan menggabungkan objek lain yang memiliki kesamaan kedua terdekat, dan seterusnya. Hal ini menghasilkan suatu struktur hierarkis yang menggambarkan tingkatan kesamaan antar objek, mulai dari yang paling mirip hingga yang paling berbeda. Dendrogram sering digunakan untuk membantu memvisualisasikan hierarki tersebut. Sementara itu, pada metode non-hirarki, jarak Euclidean digunakan untuk menentukan tingkat kedekatan antara objek. Cluster pertama terdiri dari observasi pertama dalam dataset. Cluster berikutnya adalah observasi selanjutnya yang memiliki jarak minimum khusus dari cluster sebelumnya.

1.4 Ciri-ciri dari cluster (kelompok) Ciri – ciri dari Cluster (Kelompok), antara lain :

a. Tingkat kesamaan yang tinggi antar anggota dalam satu cluster (homogenitas).

b. Tingkat perbedaan yang tinggi antara satu cluster dengan cluster lainnya (heterogenitas).

1.5 Tujuan Analisis Cluster

Tujuan utama dari analisis cluster adalah untuk menggolongkan objek-objek berdasarkan kesamaan karakteristik tertentu di antara objek-objek yang diteliti. Tujuan dari Analisis Cluster setelah mengelompokkan n objek pengamatan ke dalam m kelompok berdasarkan p variabel adalah untuk mendapatkan kelompok objek yang memiliki nilai relatif serupa. Dengan demikian, objek-objek dalam satu cluster memiliki kemungkinan tinggi untuk muncul bersamaan pada satu individu.

1.6 Analisis MDS

Multidimensional Scaling (MDS) adalah suatu teknik analisis multivariat yang menunjukkan hubungan antar objek dalam ruang multidimensional berdasarkan penilaian responden terhadap tingkat kemiripan atau kedekatan antar objek. MDS metrik dan MDS non- metrik. MDS metrik menggunakan data jarak yang bersifat rasio atau interval. Tujuannya adalah menemukan himpunan titik dalam ruang dimensi n, di mana setiap titik mewakili satu objek.

MDS metrik mengatur titik-titik objek sedekat mungkin dengan input jarak yang diberikan.

Sementara itu, MDS non-metrik mengasumsikan data bersifat kualitatif (nominal dan ordinal).

Program MDS non-metrik menggunakan transformasi monoton pada data untuk dapat melakukan operasi aritmatika terhadap nilai ketidaksamaannya. Hasil transformasi ini disebut sebagai disparitas, yang digunakan untuk mengukur tingkat ketidaksesuaian konfigurasi objek dalam peta multidimensional dengan data ketidaksamaannya. Untuk menggunakan MDS, terdapat beberapa persyaratan yang harus dipenuhi. Model harus telah dijelaskan dengan tepat, menggunakan level pengukuran yang sesuai, jumlah objek harus paling tidak sebanyak dimensi, dan skala yang digunakan harus setara atau distandarisasi. Selain itu, objek yang diperbandingkan harus memiliki kesamaan yang cukup berarti sehingga dapat dibandingkan. Beberapa istilah yang terkait dengan MDS meliputi "Stress" yang merupakan ukuran ketidakcocokan antara data dengan pengukuran MDS, "R Square" yang menunjukkan proporsi varian yang dijelaskan oleh prosedur penskalaan multidimensional, dan "Peta Konfigurasi" yang menggambarkan hubungan geometris antara objek dalam ruang koordinat multidimensional.

(5)

1.7 Tujuan Analisi MDS

Tujuan dari penggunaan MDS adalah untuk membantu peneliti melihat struktur data yang diperoleh. Secara lebih spesifik, MDS digunakan untuk mempresentasikan tingkat kemiripan dan ketidaksamaan data, menguji kriteria yang membedakan objek, menemukan dimensi yang mendasari kesamaan atau ketidaksamaan objek, serta merepresentasikan informasi yang terdapat dalam matriks korelasi.

(6)

BAB 2

TAHAPAN ANALISIS

1.1 Hirarki

Praktikum analisis cluster menggunakan metode hirarki dengan studi kasus yang berkaitan langsung dengan bidang Perencanaan Wilayah Kota.

1.1.1 Studi Kasus

Dengan memiliki pendidikan yang berkualitas, seseorang dapat meningkatkan taraf hidupnya menuju kesejahteraan di masa depan. Meningkatkan mutu pendidikan atau Sumber Daya Manusia (SDM) di suatu daerah tidak dapat terjadi dengan mudah. Dibutuhkan kerja keras dari semua pihak . Di Indonesia Nusa Tenggara Timur (NTT) dikenal sebagai salah satu provinsi dengan mutu pendidikan terendah di Indonesia. Data Badan Pusat Statistik (BPS) menunjukkan, Indeks Pembangunan Manusia (IPM) untuk NTT, yang antara lain salah satu indikatornya terkait pendidikan, berada di urutan ke-32 dari total 34 provinsi atau hanya bisa mengungguli Provinsi Papua dan Papua Barat. Dengan angka 63,13, IPM NTT terpaut cukup jauh di bawah angka rata- rata nasional 70,18. Pada Studi kasus ini menggunakan Klaster Hirarki dan MDS untuk mengetahui tercukupnya jumlah fasilitas Pendidikan di NTT Indonesia.

1. Cluster

Berikut merupakan data Case Processing untuk melihat data yang telah di proses.

(7)

Dari semua data yang ada, memiliki tingkat validitas 100% atau yang berarti tidak ada data yang hilang

2. Ward Linkage

● Pada tahap 1 (stage 1), kasus nomor 14 (Kab Malaka ) dan kasus nomor 18 (Kecamatan Kesugihan) adalah kasus yang paling mirip karakteristiknya, sehingga mereka menjadi satu kelompok terlebih dahulu. Kemudian dilihat dari kolom bagian next page pada stage 9, yang merupakan kelanjutan stage untuk cluster. Terlihat stage 9 yang berarti proses dilanjutkan dengan meloncat ke stage 9.

● Pada stage 9, perhatikan angka 13 ( Kab Kupang ) dan nomor 14 (Kabupaten Malaka). Hal ini berarti kecamatan Cimanggu masuk pada kelompok pertama, yaitu kelompok yang beranggotakan Kab Sikka dan Kab Timor tengah Selatan. Kemudian pada Next Stage pada stage 12.

● Pada stage 12, perhatikan angka 13 (Kab Kupang ) dan nomor 21 ( Kab

(8)

Sabu Raijua) satu kelompok dengan Kabupaten sebelumnya 21 dan 22 Kabupaten tersebut telah menjadi sekelompok,selanjutnya lompat next stage yaitu stage 20.

● Pada stage 18, perhatikan nomor 3 (Kabupaten Sikka) dan nomor 13 (Kabupaten Manggarai) masuk kelompok Kabupaten sebelumnya kemudian lanjut ke stage 19

● Pada stage 19, perhatikan nomor 3 (Kabupaten Sikka) dan nomor 11 (Kabupaten Sumba Timur). Lalu pada kolom next stage menuju stage 20.

● Pada stage 20, perhatikan nomor 3 (Kabupaten Sikka) dan nomor 20 (Kabupateen Sumba Barat ) masuk kelompok Kabupaten sebelumnya kemudian lanjut ke stage 21.

● Pada stage 21, perhatikan nomor 1 (Kabupaten Timor Tengah Selatan) dan nomor 3 (Kabupaten Sikka) dimana berarti masuk ke dalam kelompok Kabupaten sebelumnya.

3. Cluster Membership

Seperti pada proses input cluster, akan dibuat 3 dan 4 cluster.

Tabel cluster membership secara praktis memberi informasi anggota yang ada pada tiap cluster jika dibuat 3 dan 4 cluster.

4. Dendogram

(9)

2 cluster maka :

1) Anggota Cluster 1 Kabupaten Malaka, Kabupaten Rote-Ndao, Kota Kupang, Kabupaten Belu, Kabupaten Sabu Rai Jua, Kabupaten Sumba Tengah , Kabupaten Sikka, Kabupaten Manggarai, Kabupaten Flores Timur, Kabpaten Lembata, Kabuapten Timor Tengah Utara, Kabupaten Manggarai Barat, Kaupaten Sumba Barat Daya, Kabupaten Ende, Kabupaten Ngada, Kabupaten Nagekeo, Kabupaten Sumba Timur, Kabupaten Sumba Barat

2) Cluster 2 beranggotakan, Kabupaten Alor, Kabupaten Manggarai Timur, Kabupaten Timor Tengah Selatan, Kabupaten Kupang.

(10)

1.8 METODE MDS

Semua data (9 data) mengenai Sekolah Provinsi Nusa Tenggara Timur yang dimasukkan/diproses tidak ada yang hilang/missing sehingga tingkat kevalidannya 100%.

2. ALSCAL Note # 14690

You cannot use an ALSCAL individual difference scaling model

(MODEL = INDSCAL or MODEL = GEMSCAL) with only one matrix. These models require at least two matrices.

ALSCAL will continue the analysis using the Euclidean model (MODEL= EUCLID).

Raw (unscaled) Data for Subject 1

1 2 3 4 5 6 7 8 9 10 1 ,000

2 ,485 ,000

3 ,819 ,783 ,000

4 ,387 ,459 ,618 ,000

5 ,781 ,718 ,219 ,591 ,000

6 ,503 ,403 ,519 ,413 ,508 ,000

7 ,856 ,716 ,226 ,632 ,217 ,558 ,000

8 ,739 ,529 ,342 ,528 ,258 ,409 ,218 ,000

9 ,743 ,775 ,180 ,527 ,224 ,508 ,331 ,390 ,000 10 ,781 ,735 ,096 ,568 ,224 ,451 ,245 ,315 , 185 ,000

(11)

11 ,540 ,696 ,390 ,376 ,394 ,436 ,517 ,498 , 249 ,360

12 ,668 ,575 ,251 ,489 ,190 ,323 ,278 ,194 , 262 ,206

13 ,937 ,774 ,380 ,652 ,352 ,675 ,240 ,319 , 414 ,402

14 ,909 ,799 ,157 ,682 ,231 ,548 ,206 ,306 , 273 ,173

15 ,918 ,788 ,225 ,692 ,192 ,564 ,202 ,274 , 302 ,237

16 ,711 ,888 ,542 ,461 ,585 ,670 ,661 ,686 , 395 ,523

17 ,808 ,922 ,371 ,572 ,438 ,641 ,531 ,597 , 235 ,362

18 ,942 ,823 ,212 ,682 ,288 ,628 ,156 ,330 , 319 ,241

19 ,835 ,814 ,230 ,553 ,283 ,599 ,290 ,394 , 182 ,240

20 ,993 ,851 ,315 ,731 ,273 ,690 ,194 ,334 , 378 ,340

21 1,065 ,943 ,286 ,813 ,342 ,703 ,300 ,431 ,380 ,314

22 1,037 ,938 ,268 ,791 ,288 ,704 ,276 ,420 ,342 ,300

23 10,972 11,091 11,757 11,193 11,712 11,363 11,727 11,590 11,690 11,715

11 12 13 14 15 16 17 18 19 20 11 ,000

12 ,349 ,000

13 ,595 ,418 ,000

14 ,493 ,268 ,323 ,000

15 ,517 ,263 ,298 ,102 ,000

16 ,299 ,581 ,661 ,634 ,669 ,000

17 ,280 ,471 ,570 ,459 ,500 ,239 ,000

18 ,539 ,355 ,228 ,165 ,202 ,626 ,476 ,000

19 ,373 ,349 ,300 ,274 ,304 ,409 ,277 ,227 ,000 20 ,596 ,391 ,190 ,233 ,190 ,688 ,539 ,164 , 287 ,000

21 ,619 ,423 ,343 ,165 ,182 ,710 ,519 ,198 , 331 ,213

22 ,583 ,405 ,332 ,178 ,171 ,676 ,482 ,194 , 294 ,173

(12)

23 11,481 11,600 11,745 11,834 11,837 11,505 11,700 11,821 11,726 11,861

21 22 23 21 ,000

22 ,095 ,000

23 11,980 11,958 ,000 1.9 Interpretasi

Iterasi sejarah untuk solusi 2 dimensi (dalam jarak kuadrat), Rumus S-stress Young 1 digunakan.

Iterasi S-stress Peningkatan 1,00149. Iterasi dihentikan karena S-stress kurang dari , 005000. Stres dan korelasi kuadrat (RSQ) dalam jarak.

Nilai RSQ adalah proporsi varian dari data yang telah diukur ulang (disparitas) dalam partisi (baris, matriks, atau seluruh data) yang diakui oleh jarak-jarak mereka yang sesuai. Nilai Stres adalah rumus stres Kruskal 1.

Untuk matriks

Stres = ,02273 RSQ = ,99972

1.10 Derived Stimulus Configuration

Keterangan :

(13)

Var 1 : Sumba Barat Var 2 : Sumba Timur Var 3 : Kupang

Var 4 : Timor Tengah Selatan Var 5 : Timor Tengah Utara Var 6 : Belu

Var 7 : Alor Var 8 : Lembata Var 9 : Flores Timur Var 10 : Sikka Var 11 : Ende Var 12 : Ngada Var 14 : Manggarai Var 15 : Rote Ndao Var 16 : Manggarai Barat Var 17 : Sumba Tengah Var 18 : Sumba Barat Daya Var 19 : Nagekeo

Var 20 : Manggarai Timur Var 21 : Sabu Raijua Var 22 : Malaka Var 23 : Kota Kupang

Var 24 : Nusa Tenggara Timur

Berdasarkan hasil analisis Multidimensional Scaling dapat dikelompokkan menjadi 4 tipe kelompok wilayah sebagai berikut :

1. Kelompok 1 Kurang (Kelompok 1 adalah wilayah-wilayah yang termasuk dalam kuadran 1)

2. Kelompok 2 Sangat Kurang (Kelompok 2 wilayah-wilayah yang termasuk dalam kuadran 2)

3. Kelompok Baik (Kelompok 3 wilayah-wilayah yang termasuk dalam kuadran 3) 4. Kelompok sangat baik ( Kelompok 4 wilayah-wilayah yang termasuk dalam kuadram

4)

(14)

Gambar diatas Merupakan uji keselarasan, semakin selaras pengisian data, semakin lurus diagonal yang terbentuk oleh kumpulan data. Dengan demikian berarti model diatas menggambarkan model terbagi menjadi 2 cluster, yang mana selaras pengisisan data saling berjauhan tidak membentuk lurus diagonal. Data ini menunjukkan terdapat 2 cluster yang kurang baik.