• Tidak ada hasil yang ditemukan

PENGELOMPOKAN KABUPATEN/KOTA BERDASARKAN FAKTOR-FAKTOR YANG MEMPENGARUHI KEMISKINAN DI JAWA TENGAH MENGGUNAKAN METODE WARD DAN AVERAGE LINKAGE.

N/A
N/A
Protected

Academic year: 2017

Membagikan "PENGELOMPOKAN KABUPATEN/KOTA BERDASARKAN FAKTOR-FAKTOR YANG MEMPENGARUHI KEMISKINAN DI JAWA TENGAH MENGGUNAKAN METODE WARD DAN AVERAGE LINKAGE."

Copied!
122
0
0

Teks penuh

(1)

1 BAB I PENDAHULUAN

A. Latar Belakang

Analisis multivariat merupakan analisis multivariabel yang berhubungan dengan semua teknik statistik yang secara simultan menganalisis sejumlah pengukuran pada individu atau objek (Santoso, 2010: 7). Analisis ini dikelompokkan menjadi dua, yaitu analisis dependensi dan analisis interdependensi. Analisis dependensi merupakan analisis untuk mengetahui hubungan antara variabel dependen dan independen. Contoh analisis dependensi, yaitu: anova, ancova, analisis regresi berganda, dan analisis diskriman. Sedangkan analisis interdependensi adalah analisis untuk mengetahui hubungan antar variabel independen. Contoh analisis interdependensi, yaitu: analisis faktor, analisis cluster, penskalaan multidimensi, dan analisis kategori.

(2)

2

karakteristik. Ciri-ciri pengelompokan yang baik yaitu (Yulianto dan Hidayatullah, 2014: 57):

a) mempunyai kesamaan (homogenitas) yang tinggi antar anggota dalam satu cluster (within cluster), dan

b) mempunyai ketaksamaan (heterogenitas) yang tinggi antar cluster (between cluster).

Secara garis besar analisis cluster terdiri dari dua metode, yaitu metode hirarki dan non hirarki. Metode hirarki merupakan metode pembentukkan cluster yang dilakukan secara bertahap sehingga membentuk tingkatan tertentu. Sedangkan metode non hirarki adalah metode pembentukkan cluster dengan menentukan banyaknya cluster terlebih dahulu, kemudian mencari objek-objek yang termasuk ke dalam cluster-cluster tersebut (Supranto, 2010: 150-151).

(3)

3

Pada analisis cluster terdapat asumsi-asumsi yang harus dipenuhi, yaitu sampel yang diambil harus mewakili populasi dan multikolinearitas. Multikolinearitas adalah adanya hubungan linear atau korelasi yang tinggi antar variabel. Sebaiknya dalam analisis cluster tidak terjadi multikolinearitas. Setiap variabel diberi bobot yang sama dalam perhitungan jarak (Gudono, 2014: 284). Apabila terjadi multikolinearitas, dapat menyebabkan pembobotan yang tidak seimbang sehingga mempengaruhi hasil analisis. Jika terjadi multikolinearitas, maka harus dilakukan penanganan terhadap multikolinearitas.

Terdapat beberapa cara untuk mengatasi multikolinearitas, diantaranya: menghilangkan variabel yang mengalami multikolinearitas, menambah variabel baru, dan tetap mempertahankan variabel yang digunakan dengan meminimumkan masalah multikolinearitas menggunakan suatu metode tertentu. Principal Component Analysis (PCA) merupakan metode yang dapat digunakan untuk mengatasi masalah multikolinearitas (Soemartini, 2008: 7).

(4)

4

Component Analysis (PCA), yaitu: dapat menghilangkan korelasi secara bersih (korelasi = 0), dapat digunakan untuk segala kondisi data/penelitian, dapat digunakan tanpa mengurangi jumlah variabel asal, hasil yang diperoleh lebih akurat dibandingkan dengan metode lain (Soemartini, 2008: 8).

Dalam kehidupan sehari-hari terdapat permasalahan yang dapat diatasi menggunakan analisis cluster, salah satunya masalah kemiskinan. Menurut Badan Pusat Statistik, kemiskinan merupakan suatu kondisi kehidupan seseorang yang serba kekurangan sehingga ia tidak mampu dalam memenuhi kebutuhan minimum hidupnya. Kebutuhan minimum tersebut meliputi kebutuhan makanan terutama energi kalori, sehingga memungkinkan seseorang dapat bekerja untuk memperoleh pendapatan. Selain makanan, kebutuhan minimum yang dipenuhi meliputi tempat perlindungan rumah termasuk fasilitas penerangan, pakaian, pendidikan, kesehatan, dan transportasi.

(5)

5

Tabel 1.1. Jumlah dan Persentase Penduduk Miskin Menurut Provinsi di Indonesia Periode September 2015

Sumatera Utara 1508,14 10,79

Sumatera Barat 349,53 6,71

Riau 562,92 8,82

Jambi 311,57 9,12

Sumatera Selatan 1112,53 13,77

Bengkulu 322,83 17,16

Lampung 1100,68 13,53

Kep. Bangka Belitung 66,62 4,83

Kep. Riau 114,84 5,78

DKI Jakarta 368,67 3,61

Jawa Barat 4485,66 9,57

Jawa Tengah 4505,78 13,32

DI Yogyakarta 485,56 13,16

Jawa Timur 4775,97 12,28

Banten 690,66 5,75

Bali 218,79 5,25

Nusa Tenggara Barat 802,29 16,54

Nusa Tenggara Timur 1160,53 22,58

Kalimantan Barat 405,51 8,44

Kalimantan Tengah 148,13 5,91

Kalimantan Selatan 189,16 4,72

Kalimantan Timur 209,98 6,10

Kalimantan Utara 40,93 6,32

Sulawesi Utara 217,14 8,98

(6)

6

Provinsi Jumlah Penduduk Miskin (jiwa)

Persentase Penduduk Miskin (%)

Sulawesi Selatan 864,52 10,12

Sulawesi Tenggara 345,02 13,74

Gorontalo 206,52 18,16

Sulawesi Barat 153,21 11,90

Maluku 327,77 19,36

Maluku Utara 72,64 6,22

Papua Barat 225,54 25,73

Papua 898,21 28,40

Indonesia 28513,60 11,13

Sumber: Berita Resmi Statistik BPS (4 Januari 2016)

Berdasarkan tabel 1.1 terlihat bahwa provinsi yang mempunyai jumlah penduduk miskin tinggi berada di provinsi Jawa Timur, Jawa Tengah, dan Jawa Barat. Ketiga provinsi tersebut mempunyai jumlah penduduk miskin lebih dari empat juta jiwa. Dari ketiga provinsi tersebut, Jawa Tengah mempunyai persentase penduduk miskin paling tinggi.

(7)

7

Gambar 1.1. Jumlah Penduduk Miskin di Tiga Provinsi Terpadat Indonesia

Kemiskinan dipengaruhi oleh beberapa faktor, baik secara langsung ataupun tidak langsung. Faktor-faktor yang mempengaruhi kemiskinan di provinsi Jawa Tengah, antara lain (Prastyo, 2010): pertumbuhan ekonomi, upah minimum, tingkat pendidikan dan pengangguran. Berdasarkan hasil Survei Sosial Ekonomi Nasional (Susenas) BPS, penduduk yang tidak bekerja di Jawa Tengah sebesar 34,73%. Angka tersebut sudah termasuk pengangguran dan bukan angkatan kerja. Rendahnya tingkat pendidikan masyarakat juga sangat mempengaruhi kemiskinan. Semakin rendah tingkat pendidikan seseorang, maka peluang untuk bersaing dalam dunia kerja semakin kecil.

Selama ini pemerintah pusat maupun daerah telah melakukan berbagai upaya dalam menanggulangi kemiskinan. Berikut program-program yang dilakukan pemerintah Jawa Tengah sebagai upaya penanggulangan kemiskinan, antara lain: Bantuan Siswa Miskin (BSM), Program Keluarga Harapan (PKH), Bantuan Langsung Sementara Masyarakat (BLSM), beras

0 1.000.000 2.000.000 3.000.000 4.000.000 5.000.000 6.000.000

2010 2011 2012 2013 2014

(8)

8

untuk rumah tangga miskin (raskin), Program Nasional Pemberdayaan Masyarakat (PNPM) Mandiri, Usaha Mikro, Kecil, dan Menengah (UMKM), dll.

Meskipun telah dilakukan berbagai upaya penanggulangan kemiskinan, angka kemiskinan masih terus melonjak naik. Hal ini mengindikasikan bahwa program-program tersebut belum berhasil secara menyeluruh. Banyak faktor yang menyebabkan kurang berhasilnya program pemerintah, salah satunya adalah pemberian bantuan yang tidak tepat atau salah sasaran.

(9)

9

kedua metode tersebut adalah ukuran jarak Euclid kuadrat (Supranto, 2010: 154). Apabila terjadi multikolinearitas antar variabel akan diatasi menggunakan Principal Component Analysis (PCA).

Beberapa penelitian sebelumnya mengenai analisis cluster dan penanganan masalah multikolinearitas menggunakan Principal Component Analysis (PCA) pada analisis cluster sebagai berikut:

a) Sofya Laeli (2014) dalam penelitiannya yang berjudul ‘Analisis Cluster dengan Average Linkage Method dan Ward Method untuk Data

Responden Nasabah Asuransi Jiwa Unit Link’. Pada penelitian ini tidak

menjelaskan tentang asumsi analisis cluster. Penelitian ini tidak menggunakan Principal Component Analysis (PCA) untuk mengatasi masalah multikolinearitas.

b) Safa’at Yulianto dan Kishera Hilya Hidayatullah (2014) dalam

penelitiannya yang berjudul ‘Analisis Klaster untuk Pengelompokan

Kabupaten/Kota di Provinsi Jawa Tengah Berdasarkan Indikator

Kesejahteraan Rakyat’. Penelitian ini menggunakan tujuh variabel yang

tidak multikolinearitas kemudian dianalisis cluster menggunakan metode average linkage.

c) Chorina Sagita Cahyani dan Hery Tri Sutanto (2014) dalam penelitiannya

yang berjudul “Pengelompokan Kabupaten/Kota Berdasarkan

(10)

10

Analysis (PCA) yang selanjutnya dianalisis cluster menggunakan metode Ward.

d) Diah Safitri, dkk (2012) dalam penelitiannya yang berjudul ‘Analisis Cluster pada Kabupaten/Kota di Jawa Tengah Berdasarkan Produksi

Palawija’. Penelitian ini mengalami masalah multikolinearitas dan diatasi

menggunakan Principal Component Analysis (PCA) yang selanjutnya dianalisis cluster menggunakan metode non hirarki K-Means.

Oleh karena itu, skripsi ini diberi judul ‘‘Pengelompokan Kabupaten/Kota Berdasarkan Faktor-faktor yang Mempengaruhi Kemiskinan di Jawa Tengah Menggunakan Metode Ward dan Average Linkage’’.

B. Batasan Masalah

Dalam penelitian ini akan dibahas tentang cara mengelompokkan kabupaten/kota berdasarkan faktor-faktor yang mempengaruhi kemiskinan di Jawa Tengah tahun 2014 menggunakan metode Ward dan Average Linkage. Apabila terjadi multikolinearitas diatasi menggunakan Principal Component Analysis (PCA).

C. Rumusan Masalah

(11)

11

1) Bagaimana metode Ward dalam mengelompokkan kabupaten/kota di Provinsi Jawa Tengah berdasarkan faktor-faktor yang mempengaruhi kemiskinan tahun 2014?

2) Bagaimana metode Average Linkage dalam mengelompokkan kabupaten/kota di Provinsi Jawa Tengah berdasarkan faktor-faktor yang mempengaruhi kemiskinan tahun 2014?

3) Bagaimana perbandingan kinerja antara metode Ward dan Average Linkage dalam mengelompokkan kabupaten/kota di Provinsi Jawa Tengah berdasarkan faktor-faktor yang mempengaruhi kemiskinan tahun 2014?

D. Tujuan Penelitian

Berdasarkan rumusan masalah diatas, maka dapat ditentukan tujuan penelitian sebagai berikut:

1) Mengetahui dan menjelaskan metode Ward dalam mengelompokkan kabupaten/kota di Provinsi Jawa Tengah berdasarkan faktor-faktor yang mempengaruhi kemiskinan tahun 2014.

2) Mengetahui dan menjelaskan metode Average Linkage dalam mengelompokkan kabupaten/kota di Provinsi Jawa Tengah berdasarkan faktor-faktor yang mempengaruhi kemiskinan tahun 2014.

(12)

12

Provinsi Jawa Tengah berdasarkan faktor-faktor yang mempengaruhi kemiskinan tahun 2014.

E. Manfaat Penelitian

Penelitian ini memberikan beberapa manfaat antara lain sebagai berikut:

1) Bagi Penulis

Penulisan skripsi ini dapat menambah pengetahuan dan wawasan penulis tentang penerapan analisis cluster khususnya metode Ward dan Average Linkage dalam mengelompokkan kabupaten/kota Provinsi Jawa Tengah di bidang kemiskinan serta Principal Component Analysis (PCA) dalam mengatasi masalah multikolinearitas.

2) Bagi Pembaca

Penelitian ini dapat dijadikan sebagai bahan materi untuk mempelajari penerapan analisis cluster khususnya metode Ward dan Average Linkage serta Principal Component Analysis (PCA) dalam mengatasi masalah multikolinearitas dan dapat dijadikan referensi untuk penelitian selanjutnya di bidang lain, seperti peternakan, kesehatan, pariwisata, dll.

3) Bagi Perpustakaan Universitas Negeri Yogyakarta

(13)

13 BAB II KAJIAN TEORI

Pada bab II akan dibahas tentang materi-materi dasar yang digunakan untuk mendukung pembahasan pada bab selanjutnya, yaitu matriks, kombinasi linier, varian dan simpangan baku, standarisasi data, koefisien korelasi, matriks korelasi, matriks kovarian, nilai eigen dan vektor eigen, analisis multivariat, multikolinearitas, analisis cluster, dan kemiskinan.

A. Matriks

Definisi 2. 1 (‘Imrona, 2013: 1)

Matriks adalah susunan bilangan atau fungsi yang terbentuk dalam baris dan kolom serta diapit oleh dua kurung siku. Bilangan atau fungsi tersebut dinamakan entri atau elemen dari matriks. Matriks berukuran baris dan kolom dapat ditulis sebagai berikut:

atau

dengan = 1, 2, ..., dan = 1, 2, ..., . Elemen yang berada pada baris ke dan kolom ke pada matriks disimbolkan . Misal adalah elemen matriks yang terletak pada baris kedua kolom pertama.

(14)

14 Definisi 2. 2 (Anton dan Rorres, 2010)

Dua matriks dikatakan sama jika mempunyai ukuran sama dan elemen-elemen yang seletak bernilai sama. Jika dan maka dapat ditulis:

atau dengan = 1, 2, ..., dan = 1, 2, ..., .

Definisi 2. 3 (Anton dan Rorres, 2010)

Matriks berukuran baris dan kolom disebut matriks persegi berukuran . Matriks persegi mempunyai elemen , , ..., yang disebut sebagai diagonal utama matriks .

Definisi 2. 4 (‘Imrona, 2013: 3)

Matriks diagonal adalah matriks persegi yang semua elemen diluar diagonal utama bernilai nol.

Contoh:

Definisi 2. 5 (‘Imrona, 2013: 3)

Matriks identitas adalah matriks diagonal yang elemen pada diagonal utamanya adalah bilangan satu dan elemen lainnya bernilai nol. Matriks identitas dilambangkan dengan adalah ukuran dari matriks.

(15)

15 Definisi 2. 6 (‘Imrona, 2013: 3)

Matriks skalar adalah matriks diagonal yang semua elemen pada diagonal utamanya bernilai sama tetapi tidak nol ( ), dengan adalah skalar. Definisi 2. 7 (Anton dan Rorres, 2010)

Jika matriks berukuran , maka transpose matriks berukuran . Transpose matriks dinotasikan atau . Transpose matriks mengubah baris pada matriks menjadi kolom pada matriks dan kolom pada matriks

menjadi baris pada matriks . Definisi 2. 8 (Johnson dan Wichern, 2007: 57)

Matriks persegi disebut sebagai matriks simetri jika atau . Contoh:

Definisi 2. 9 (Anton dan Rorres, 2010)

Jika dan matriks berukuran sama, maka jumlah dari matriks dan merupakan penjumlahan dari elemen-elemen matriks yang seletak

(16)

16

merupakan pengurangan dari elemen-elemen matriks yang seletak dengan elemen-elemen matriks .

Contoh: Definisi 2. 10 (Anton dan Rorres, 2010)

Jika matriks dan skalar, maka adalah matriks hasil kali dari elemen Definisi 2. 11 (Anton dan Rorres, 2010)

(17)

17 Definisi 2. 12 (Anton dan Rorres, 2010)

Jika matriks persegi berukuran , maka determinan matriks dihitung dengan mengalikan elemen pada baris ke- atau kolom ke- dengan masing-masing kofaktor dan menjumlahkan hasil perkalian tersebut. Determinan matriks dinyatakan sebagai berikut:

(ekspansi kofaktor sepanjang kolom ke- ) dan

(ekspansi kofaktor sepanjang baris ke- ) Misal:

Definisi 2. 13 (Anton dan Rorres, 2010)

(18)

18

Kofaktor dari matriks adalah:

Definisi 2. 14 (Anton dan Rorres, 2010)

(19)

19 Definisi 2. 15 (Anton dan Rorres, 2010)

Jika matriks persegi, maka trace dari matriks didefinisikan sebagai penjumlahan elemen-elemen pada diagonal utama matriks . Trace dari matriks dinotasikan tr ). Trace dari matriks tidak dapat didefinisikan jika matriks bukan matriks persegi.

Definisi 2. 16 (Johnson dan Wichern, 2007: 59)

(20)

20 B. Kombinasi Linear

Definisi 2. 17 (Anton dan Rorres, 2010)

Jika adalah matriks berukuran sama dan

Varian adalah rata-rata hitung dari kuadrat simpangan setiap objek terhadap rata-rata hitungnya. Simpangan baku adalah salah satu ukuran dispersi yang diperoleh dari akar kuadrat positif varian (Supranto, 2008: 139). Rumus varian ( ) dan simpangan baku ( ) untuk populasi sebagai berikut:

(2. 3)

(2. 4)

(21)

21

Sedangkan rumus varian ( ) dan simpangan baku ( ) untuk sampel sebagai berikut:

(2. 5)

(2. 6)

dengan = nilai atau objek ke- dan = rata-rata sampel

D. Standarisasi Data

Standarisasi data adalah pengubahan nilai-nilai variabel asal menjadi nilai-nilai baru yang memiliki rata-rata nol dan simpangan baku satu (Supranto, 2010: 328). Standarisasi data dilakukan apabila data mempunyai skala berbeda. Persamaan standarisasi adalah sebagai berikut:

(2. 7)

dengan merupakan rata-rata variabel dan merupakan

simpangan baku persamaan (2. 6).

E. Koefisien Korelasi

Koefisien korelasi digunakan untuk mengukur hubungan antara dua variabel dalam analisis korelasi dan dinotasikan dengan . Koefisien korelasi sampel antara variabel dan dinotasikan adalah sebagai berikut (Johnson dan Wichern, 2007: 8):

(22)

22

dengan adalah kovarian dari dan sedangkan dan adalah simpangan baku. Nilai dari koefisien korelasi untuk mengukur hubungan antara dua variabel berkisar antara -1 sampai 1. Jika koefisien bertanda (+) maka kedua variabel mempunyai hubungan searah dan jika koefisien bertanda (-) maka kedua variabel mempunyai hubungan tidak searah.

F. Matriks Korelasi

Matriks korelasi populasi dinotasikan terdiri dari koefisien korelasi dan dapat dituliskan sebagai berikut:

(23)

23

Sedangkan untuk matriks kovarian sampel dinyatakan sebagai berikut:

H. Nilai Eigen dan Vektor Eigen Definisi 2. 18 (‘Imrona, 2013: 111)

Misalkan adalah matriks berordo . Vektor dengan disebut vektor eigen jika terdapat (nilai eigen), sehingga memenuhi persamaan:

(2. 9)

Persamaan (2. 9) dapat ditulis sebagai berikut:

(24)

24

karena vektor eigen , maka persamaan (2. 11) harus mempunyai penyelesaian tak nol, dan didapatkan persamaan:

`(2. 12)

Persamaan (2. 12) disebut sebagai persamaan karakteristik dari matriks . Persamaan ini menyederhanakan permasalahan pencarian nilai eigen dengan mencari akar-akar dari polinomial berderajat .

Analisis multivariat merupakan metode statistik untuk menganalisis hubungan antara lebih dari dua variabel secara bersamaan. Analisis ini berhubungan dengan semua teknik statistik yang secara simultan menganalisis sejumlah pengukuran pada individu atau objek.

(25)

25

observasi dengan = 1, 2, 3, ..., dan = 1, 2, 3, ..., dapat ditunjukkan sebagai berikut:

Variabel 1 Variabel 2 ... Variabel ... Variabel

Objek 1: ... ...

Objek 2: ... ...

Objek : ... ...

Objek : ... ...

atau dapat dinyatakan dalam matriks berukuran , dengan

menyatakan baris dan menyatakan kolom sebagai berikut:

(26)

26 J. Multikolinearitas

Multikolinearitas adalah adanya korelasi atau hubungan yang sangat tinggi antar variabel independen (Yamin, Rachmach, dan Kurniawan, 2011: 115). Multikolinearitas dibedakan menjadi dua, yaitu (Sembiring, 2003: 239): 1. Multikolinearitas sempurna

Multikolinearitas sempurna terjadi apabila berlaku hubungan sebagai berikut:

(2. 13)

dengan merupakan bilangan konstan dan . Untuk mengetahui adanya multikolinearitas sempurna, misal , dapat ditunjukkan untuk setiap observasi ke- , persamaan (2. 12) dinyatakan sebagai berikut:

(2. 14) Persamaan (2. 13) menunjukkan bahwa variabel berhubungan linear sempurna dengan variabel lain secara keseluruhan.

2. Multikolinearitas tidak sempurna

Hubungan linear tidak sempurna terjadi apabila berlaku hubungan sebagai berikut:

(2. 15)

dengan adalah galat sisa. Untuk mengetahui adanya multikolinearitas tidak sempurna, misal , dapat ditunjukkan untuk setiap observasi , persamaan (2. 14) dinyatakan sebagai berikut:

(27)

27

Persamaan (2. 15) menunjukkan bahwa variabel tidak berhubungan linear sempurna dengan variabel lain, karena masih tergantung pada galat

.

Untuk mengetahui adanya multikolinearitas salah satunya menggunakan matriks korelasi. Interpretasi nilai korelasi antar variabel menurut Yamin dan Kurniawan (2014: 70) diklasifikasikan sebagai berikut: a. 0,00 – 0,09 : hubungan korelasi diabaikan

b. 0,10 – 0,29 : hubungan korelasi rendah c. 0,30 – 0,49 : hubungan korelasi moderat d. 0,50 – 0,70 : hubungan korelasi sedang e. > 0,70 : hubungan korelasi sangat kuat

Dua variabel atau lebih dikatakan terjadi multikolinearitas apabila memiliki nilai korelasi lebih dari 0,7. Cara untuk mengatasi masalah multikolinearitas antara lain dengan menghilangkan variabel yang mengalami multikolinearitas, menambah variabel baru, dan tetap mempertahankan variabel yang digunakan dengan meminimumkan masalah multikolinearitas menggunakan suatu metode tertentu.

K. Analisis Cluster

(28)

28

cluster yang sama. Hasil pengelompokan bergantung pada variabel-variabel yang digunakan sebagai dasar untuk menilai kesamaan. Ciri-ciri cluster yang baik yaitu:

1. mempunyai kesamaan (homogenitas) yang tinggi antar anggota dalam satu cluster (within cluster), dan

2. mempunyai ketaksamaan (heterogenitas) yang tinggi antar cluster (between cluster).

Terdapat asumsi-asumsi yang harus dipenuhi dalam analisis cluster, yaitu: sampel yang diambil harus mewakili populasi dan multikolinearitas. Sebaiknya dalam analisis cluster tidak terjadi multikolinearitas antar variabel. Dalam analisis cluster setiap variabel diberi bobot yang sama dalam perhitungan jarak. Jika terjadi multikolinearitas, menyebabkan pembobotan yang tidak seimbang sehingga dapat mempengaruhi hasil dari analisis cluster. Langkah dalam melakukan analisis cluster adalah sebagai berikut (Supranto, 2010: 147):

1. Merumuskan Masalah

(29)

29

yang tidak relevan mengakibatkan penyimpangan hasil cluster yang kemungkinan bermanfaat (Supranto, 2010: 148).

2. Memilih Ukuran Jarak

Ukuran jarak digunakan untuk mengetahui kesamaan atau ketaksamaan karakteristik antar objek. Semakin besar jarak menunjukkan ketaksamaan antar objek, sebaliknya semakin kecil jarak menunjukkan kesamaan antar objek. Terdapat beberapa macam ukuran jarak yang dapat digunakan, antara lain:

a. Jarak Euclid (Euclidean Distance)

Jarak Euclid adalah akar dari jumlah kuadrat perbedaan nilai untuk tiap variabel. Ukuran jarak antar objek ke- dengan objek ke- disimbolkan dengan dan = 1, 2, 3, ..., . Nilai dapat dihitung dengan persamaan:

(2. 17)

Keterangan:

= jarak antar objek ke-i dan objek ke-j p = jumlah variabel cluster

= nilai atau data dari objek ke-i pada variabel ke-k = nilai atau data dari objek ke-j pada variabel ke-k b. Jarak Euclid kuadrat (Squared Euclidean Distance)

Jarak Euclid kuadrat akan dijelaskan pada bab III. c. Jarak Manhattan (Cityblock Distance)

(30)

30

= (2. 18) d. Jarak Chebychev (Chebychev Distance)

Jarak Chebychev adalah perbedaan nilai mutlak maksimum antar kedua objek untuk tiap variabel.

= max ( ) (2. 19)

3. Memilih Prosedur Pengelompokan

Secara garis besar, metode-metode pada analisis cluster terbagi menjadi dua metode, yaitu:

a. Metode Hirarki (Hirarchical Method)

Metode hirarki adalah metode pembentukkan cluster yang dilakukan secara bertahap dan membentuk tingkatan tertentu. Hasil dari pengelompokan divisualisasikan dalam bentuk diagram pohon (dendogram). Dendogram adalah representasi visual yang menunjukkan pembentukkan cluster dan nilai koefisien jarak pada tiap langkah. Metode hirarki terbagi menjadi dua metode, yaitu metode agglomerative dan metode divisive.

1) Metode Agglomerative

(31)

31

(a) Membuat matriks jarak berukuran N  N (matriks similaritas) D = { }.

(b) Menemukan pasangan cluster dalam matriks yang mempunyai jarak paling dekat, misal cluster I dan J maka jaraknya

(c) Menggabungkan cluster I dan J menjadi sebuah cluster baru dan memberi nama cluster IJ.

(d) Membuat matriks jarak yang baru dengan cara menghapus baris dan kolom yang menghubungkan cluster I dan J, kemudia menambah baris dan kolom untuk memberi jarak antara cluster IJ dan cluster-cluster yang lain.

(e) Mengulangi langkah (a) dan (b) sampai semua objek tergabung ke dalam satu cluster .

Metode agglomerative terdiri dari tiga metode, yaitu: linkage method dan variance method. Linkage method terbagi menjadi tiga metode, yaitu:

(1) Metode Pautan Tunggal (Single Linkage Method)

Metode pautan tunggal adalah metode pengelompokan yang didasarkan pada jarak terdekat antar dua cluster yang ada. Untuk menghitung jarak terdekat digunakan persamaan:

(2. 20)

Keterangan:

= jarak terpendek antara cluster IJ dan cluster K = jarak terpendek antara cluster I dan K

(32)

32

(2) Metode Pautan Lengkap (Complete Linkage Method)

Metode pautan lengkap adalah metode pengelompokan yang didasarkan pada jarak terjauh antar dua cluster yang ada. Untuk menghitung jarak terjauh digunakan persamaan:

(2. 21)

Keterangan:

= jarak terjauh antara cluster IJ dan cluster K = jarak terjauh antara cluster I dan K

= jarak terjauh antara cluster J dan K

(3) Metode Pautan Rata-rata (Average Linkage Method)

Metode pautan rata-rata akan dijelaskan lebih lanjut di bab selanjutnya yaitu bab III.

Selain linkage method, metode agglomerative yang lain yaitu variance method. Variance method hanya terdiri dari satu metode yaitu metode Ward. Pembahasan lebih lanjut tentang metode Ward pada bab III.

2) Metode Divisive

Metode divisive adalah metode yang memiliki sebuah cluster besar terdiri dari semua objek. Objek yang mempunyai nilai ketaksamaan tertinggi dipisahkan dari cluster besar tersebut menjadi beberapa cluster.

b. Metode Non Hirarki (Non Hirarchical Method)

(33)

33

yaitu: Sequential Threshold, Parallel Threshold, dan Optimizing Partitioning

Dari uraian diatas, skripsi ini menggunakan metode hirarki agglomerative. Metode agglomerative yang digunakan yaitu metode Ward dan Average Linkage.

4. Menentukan Banyaknya Cluster

Masalah utama dalam analisis cluster adalah menentukan jumlah cluster yang akan dibentuk. Beberapa petunjuk yang dapat digunakan (Supranto, 2010: 159-160), yaitu:

a. pertimbangan teoritis, konseptual, dan praktis dapat digunakan untuk menentukan jumlah cluster yang sebenarnya,

b. dalam analisis hirarki, jarak antar cluster yang digabung dapat digunakan sebagai kriteria penentuan banyaknya cluster,

c. dalam analisis non hirarki, perbandingan jumlah varian dalam cluster dan antar cluster digunakan sebagai kriteria penentuan banyaknya cluster,

d. jumlah cluster yang terbentuk harus berguna dan bermanfaat.

5. Menginterpretasi Cluster

(34)

34

cluster pada tiap variabel. Nilai centroid dapat dihitung menggunakan persamaan di bawah ini:

(2. 22)

Keterangan:

= nilai centroid tiap cluster

= nilai atau data dari objek ke-j pada variabel ke-k; dengan j = 1, 2, 3, ..., n dan k = 1, 2, 3, ..., p = jumlah objek tiap cluster

L. Kemiskinan

Kemiskinan merupakan suatu kondisi kehidupan serba kekurangan yang dialami seseorang sehingga ia tidak mampu dalam memenuhi kebutuhan minimum hidupnya. Badan Pusat Statistik (BPS) menggunakan konsep kemampuan memenuhi kebutuhan dasar (basic needs approach) dalam mengukur kemiskinan. Kemiskinan dipandang sebagai ketidakmampuan dari sisi ekonomi untuk memenuhi kebutuhan dasar makanan dan bukan makanan yang diukur dari sisi pengeluaran. Penduduk yang memiliki rata-rata pengeluaran perkapita per bulan dibawah garis kemiskinan dikategorikan sebagai penduduk miskin.

(35)

35

susu, sayuran, dll. Sedangkan Garis Kemiskinan Non Makanan (GKNM) adalah kebutuhan minimum untuk perumahan, sandang, pendidikan dan kesehatan. Paket komoditi kebutuhan dasar non makanan diwakili oleh 51 jenis komoditi di perkotaan dan 47 jenis komoditi di pedesaan.

Terdapat beberapa faktor yang mempengaruhi kemiskinan, khususnya di Provinsi Jawa Tengah. Menurut Prastyo (2010), pertumbuhan ekonomi, upah minimum, pendidikan, dan tingkat pengangguran berpengaruh signifikan terhadap tingkat kemiskinan. Pertumbuhan ekonomi, upah minimum, dan pendidikan mempunyai hubungan negatif dengan tingkat kemiskinan. Hal ini berarti bahwa apabila pertumbuhan ekonomi, upah minimum, dan pendidikan meningkat maka tingkat kemiskinan mengalami penurunan. Sedangkan tingkat pengangguran mempunyai hubungan positif dengan tingkat kemiskinan. Artinya, semakin tinggi tingkat pengangguran maka kemiskinan juga semakin meningkat.

(36)

36 BAB III PEMBAHASAN

Analisis cluster merupakan analisis yang bertujuan untuk mengelompokkan objek-objek pengamatan berdasarkan karakteristik yang dimiliki. Asumsi-asumsi dalam analisis cluster yaitu sampel yang diambil harus mewakili populasi dan multikolinearitas. Apabila terjadi multikolinearitas diatasi menggunakan Principal Component Analysis (PCA). Hasil dari Principal Component (PC) yang terbentuk digunakan sebagai variabel bebas baru untuk mengelompokkan kabupaten/kota berdasarkan faktor-faktor yang mempengaruhi kemiskinan di Jawa Tengah menggunakan metode Ward dan Average Linkage. Perbandingan kinerja antara metode Ward dan Average Linkage dilakukan untuk memilih metode yang menghasilkan cluster lebih baik.

A. Analisis Cluster

Telah dijelaskan sebelumnya bahwa analisis cluster merupakan analisis yang digunakan untuk mengelompokkan objek-objek pengamatan berdasarkan karakteristik yang dimiliki. Seperti teknik analisis lain, analisis cluster menetapkan adanya asumsi-asumsi yang harus dipenuhi. Asumsi dalam analisis cluster yaitu:

1. Sampel yang diambil harus mewakili populasi yang ada

(37)

37

Olkin (KMO) adalah indeks perbandingan nilai koefisien korelasi terhadap korelasi parsial (Yamin dan Kurniawan, 2014: 181).

(3. 1) (3. 2)

Keterangan:

= banyaknya variabel

= koefisien korelasi antara variabel dan

= koefisien korelasi parsial antara variabel dan

Menurut Yamin, Rachmach dan Kurniawan (2011: 122), jika nilai KMO < 0,5, maka sampel tidak mewakili populasi, sedangkan jika nilai KMO > 0,5, maka sampel mewakili populasi sehingga layak untuk dilakukan analisis cluster.

2. Multikolinearitas

(38)

38 B. Principal Component Analysis (PCA)

Principal Component Analysis (PCA) bertujuan untuk menyederhanakan variabel yang diamati dengan cara mereduksi dimensinya. Prinsip utama dari PCA adalah terdapatnya korelasi antar variabel sehingga diduga bahwa variabel-variabel tersebut dapat direduksi. Hal ini dilakukan dengan cara menghilangkan korelasi antar variabel bebas melalui transformasi variabel bebas asal ke variabel bebas baru yang tidak berkorelasi sama sekali atau sering disebut dengan principal component (Johnson dan Wichern, 2007: 430).

Principal component (PC) merupakan suatu kombinasi linear dari variabel-variabel asal. Pembentukan PC berdasarkan dua cara yaitu matriks kovarian atau matriks korelasi (Johnson dan Wichern, 2007: 431). Pembentukan PC berdasarkan matriks kovarian digunakan apabila variabel yang diamati mempunyai satuan pengukuran yang sama, sedangkan matriks korelasi digunakan apabila variabel yang diamati mempunyai satuan berbeda. Pada skripsi ini digunakan matriks korelasi karena variabel yang digunakan memiliki satuan berbeda.

Tahapan menentukan PC berdasarkan matriks korelasi adalah sebagai berikut (Johnson dan Wichern, 2007: 436-437):

1. Membuat matriks yang berisi data dari variabel X yang telah distandarisasi.

(39)

39

(3. 3)

dimana jumlahan nilai eigen merupakan trace matriks korelasi atau jumlah diagonal matriks korelasi, yaitu:

(3. 4)

Nilai eigen selalu diurutkan dari yang terbesar sampai nilai terkecil. Nilai eigen menunjukkan besarnya total varian yang dijelaskan oleh PC yang terbentuk. saling orthogonal dan dibentuk berdasarkan persamaan:

(3. 5)

Vektor eigen diperoleh dari setiap nilai eigen yang memenuhi persamaan:

(3. 6)

Beberapa ketentuan PCA dalam membentuk principal component adalah sebagai berikut (Johnson dan Wichern, 2007: 431-432):

1. Principal Component (PC) yang terbentuk sebanyak variabel yang diamati dan setiap PC merupakan kombinasi linear dari variabel-variabel tersebut. 2. Setiap PC saling orthogonal dan saling bebas.

3. Principal Component (PC) dibentuk berdasarkan urutan total varian yang terbesar hingga paling kecil, dalam arti sebagai berikut:

a. Principal Component pertama adalah kombinasi linear dari seluruh variabel yang diamati dan memiliki varian terbesar.

(40)

40

c. Principal Component ketiga adalah kombinasi linear dari seluruh variabel yang diamati dan bersifat orthogonal terhadap maupun dan memiliki varian terbesar ketiga.

d. Principal Component ke- adalah kombinasi linear dari seluruh variabel yang diamati dan bersifat orthogonal terhadap , ,..., dan memiliki varian paling kecil.

Sebelum dilakukan PCA, terlebih dahulu dilakukan beberapa pengujian sebagai berikut:

1. Uji Kaiser Meyer Olkin (KMO)

Syarat yang harus dipenuhi sebelum dilakukan PCA yaitu data yang digunakan telah mencukupi untuk dianalisis. Nilai KMO dapat dicari menggunakan persamaan (3. 1) dan (3. 2).

2. Uji Bartlett

Uji Bartlett digunakan untuk mengetahui apakah matriks korelasi hubungan antara variabel adalah matriks identitas. Hal ini digunakan untuk menguji kecukupan hubungan antara variabel, dimana matriks identitas mempunyai diagonal matriks bernilai 1 dan yang lainnya adalah 0. Urutan pengujian sebagai berikut:

Hipotesis:

: matriks korelasi = matriks identitas : matriks korelasi  matriks identitas

Statistik uji :

(41)

41 Keterangan:

= nilai determinan matriks korelasi = banyaknya data

= banyaknya variabel Kriteria keputusan:

Tolak jika > atau 

Setelah dilakukan uji KMO dan Bartlett, dilakukan pemeriksaan terhadap nilai-nilai Measure of Sampling Adequacy (MSA). Measure of Sampling Adequacy (MSA) digunakan untuk mengetahui variabel mana saja yang layak dilakukan PCA. Nilai MSA dapat dilihat pada output SPSS anti images matrices bagian correlation yang ditunjukkan oleh diagonal dari kiri atas ke kanan bawah yang bertanda huruf a dan diperoleh dari persamaan berikut:

(3. 8) dengan = 1, 2, 3, ..., 7 , = 1, 2, 3, ..., 7 , dan

Jika nilai MSA > 0,5 maka variabel layak dilakukan PCA (Yamin dan Kurniawan, 2014: 186).

Principal component hasil dari PCA akan digunakan sebagai variabel bebas baru untuk dianalisis cluster menggunakan metode Ward dan Average Linkage. Sebelum penyusunan cluster, terlebih dahulu dilakukan pemilihan ukuran jarak. Ukuran jarak yang digunakan adalah jarak Euclid kuadrat. Adapun persamaan Euclid kuadrat adalah sebagai berikut:

(42)

42 C. Metode Ward

Metode Ward merupakan salah satu metode hirarki dalam analisis cluster. Metode Ward bertujuan untuk memperoleh cluster yang memiliki varian dalam cluster (within cluster) sekecil mungkin. Ukuran kesamaan yang digunakan adalah jarak Euclid kuadrat (Supranto, 2010: 154). Metode Ward mengelompokkan objek didasarkan pada kenaikan sum square error (SSE). Pada tiap tahap, dua cluster yang memiliki kenaikan SSE paling kecil digabungkan (Simamora, 2005: 218). Sum Square Error (SSE) dapat dihitung menggunakan persamaan (Gudono, 2014: 294):

(3. 10)

Keterangan:

SSE = sum square error = jumlah anggota cluster

= nilai atau data dari objek ke-

= rata-rata (mean) nilai objek dalam sebuah cluster

Langkah-langkah pengelompokan menggunakan metode Ward adalah sebagai berikut (Johnson dan Wichern, 2007: 692-693):

1. Dimulai dari setiap objek dianggap sebagai sebuah cluster tersendiri, maka terdapat N cluster yang mempunyai satu objek. Pada tahap ini SSE bernilai nol.

(43)

43

3. Membuat kombinasi dua pasang cluster baru yang terdiri dari satu cluster yang telah terbentuk dan cluster yang lain, lalu menghitung nilai SSE lagi. Memilih dua pasang cluster yang memiliki nilai SSE terkecil untuk digabungkan menjadi satu cluster.

4. Mengulangi langkah (3) sampai semua objek bergabung menjadi satu cluster.

D. Metode Average Linkage

Metode average linkage (pautan rata-rata) adalah metode pengelompokan yang jarak antara dua cluster didefinisikan sebagai rata-rata jarak seluruh pasangan yang berada dalam satu cluster dengan cluster yang lain. Untuk menghitung rata-rata jarak pada metode average linkage digunakan persamaan (Johnson dan Wichern, 2007: 690):

(3. 11)

Keterangan:

= jarak antara cluster dan cluster

= jarak antara objek pada cluster dan objek pada cluster = jumlah anggota pada cluster

= jumlah anggota pada cluster

Langkah-langkah pengelompokan menggunakan metode average linkage adalah sebagai berikut (Johnson dan Wichern, 2007: 690):

1. Mencari dua objek yang memiliki kesamaan paling dekat pada matriks similaritas. Misal kedua objek itu adalah objek dan .

(44)

44

3. Penggabungan kedua merupakan penggabungan cluster dengan cluster lain yang memiliki kesamaan paling dekat, misal cluster . Penggabungan kedua dihitung menggunakan persamaan (3. 10).

4. Mengulangi langkah (3) sebanyak N-1 kali, dimana N adalah jumlah objek.

E. Penentuan Metode Terbaik

Untuk menentukan metode yang menghasilkan cluster terbaik, digunakan nilai-nilai simpangan baku dalam cluster (within cluster) dan antar cluster (between cluster). Persamaan-persamaan simpangan baku dalam dan antar cluster sebagai berikut:

1. Simpangan baku dalam cluster (within cluster)

(3. 12)

Keterangan:

= simpangan baku dalam cluster = banyaknya cluster yang terbentuk

= simpangan baku cluster ke-k

2. Simpangan baku antar cluster (between cluster)

(3. 13)

Keterangan:

= simpangan baku antar cluster = banyaknya cluster yang terbentuk = rata-rata cluster ke-k

= rata-rata seluruh cluster

(45)

45

maka metode yang digunakan mempunyai kinerja yang baik, artinya homogenitasnya tinggi.

Dari uraian diatas, langkah-langkah yang dilakukan dalam analisis cluster disajikan dalam bagan sebagai berikut:

tidak ya

memenuhi tidak

Gambar 3. 1 Langkah-langkah Analisis Cluster PCA Menguji asumsi

dalam analisis cluster

Kecukupan sampel

Multikoli nearitas

Mengelompokkan objek menggunakan metode Ward dan Average Linkage

Menentukan metode yang menghasilkan cluster terbaik

Menghitung ukuran jarak Euclid kuadrat

Menginterpretasi hasil cluster Menambah

(46)

46

F. Pengelompokan Kabupaten/Kota Berdasarkan Faktor-faktor yang Mempengaruhi Kemiskinan di Jawa Tengah Menggunakan Metode

Ward dan Average Linkage

1. Deskripsi Data

Data yang digunakan merupakan data tentang faktor-faktor yang mempengaruhi kemiskinan di Jawa Tengah tahun 2014. Data diambil dari publikasi BPS berupa buku yang berjudul “Jawa Tengah Dalam Angka

2015”, “Tinjauan PDRB Kabupaten/Kota Se Jawa Tengah 2014”, dan

“Data dan Informasi Kemiskinan Kabupaten/Kota Tahun 2014”. Adapun

faktor-faktor yang mempengaruhi kemiskinan di Jawa Tengah tahun 2014 antara lain sebagai berikut:

a. Produk Domestik Regional Bruto (PDRB)

Menurut Sri Aditya (2010) dalam Prastyo (2010: 44) PDRB merupakan salah satu alat pengukur pertumbuhan ekonomi. Badan Pusat Statistik (BPS) menggunakan metode pendekatan produksi dalam menghitung PDRB. Dengan menggunakan metode pendekatan produksi, PDRB merupakan penjumlahan Nilai Tambah Bruto (NTB) dari barang dan jasa yang dihasilkan oleh unit-unit kegiatan ekonomi di suatu wilayah pada satu periode tertentu.

(47)

47

yang dimaksud merupakan harga pada tingkat produsen. Biaya antara adalah nilai seluruh barang dan jasa yang digunakan dalam proses produksi.

Secara matematis penghitungan PDRB menggunakan metode pendekatan produksi dirumuskan sebagai berikut (BPS):

(3. 14)

(3. 15)

(3. 16)

Keterangan:

= kuantitas produksi = harga produsen = biaya antara = output

= nilai tambah bruto b. Pengeluaran perkapita

Pengeluaran perkapita merupakan salah satu faktor yang mempengaruhi kemiskinan (Widiastuti, 2016: 9). Badan Pusat Statistik (BPS) menggunakan rata-rata besarnya pengeluaran perkapita sebagai pendekatan pendapatan yang mewakili capaian pembangunan untuk hidup layak. Pengukuran hidup layak menggunakan indikator kemampuan daya beli masyarakat terhadap sejumlah kebutuhan pokok makanan dan bukan makanan.

c. Upah minimum

(48)

48

penurunan. Upah minimum merupakan suatu standar minimum yang digunakan oleh para pengusaha atau pelaku industri untuk memberikan upah kepada pekerja. Upah minimum yang digunakan dalam skripsi ini adalah upah minimum kabupaten/kota. Penetapan upah minimum kabupaten/kota harus lebih besar dari upah minimum provinsi dan ditetapkan selambat-lambatnya 40 hari sebelum tanggal berlakunya upah minimum yaitu 1 Januari (www.gajimu.com) .

d. Gizi buruk balita

Tingkat kesehatan mempunyai hubungan negatif dengan tingkat kemiskinan (Wahyudi dan Rejekingsih, 2013: 14). Hal ini menunjukkan bahwa apabila tingkat kesehatan baik maka tingkat kemiskinan mengalami penurunan. Dalam skripsi ini digunakan banyaknya balita yang mengalami gizi buruk untuk mengukur tingkat kesehatan. Semakin sedikit balita yang mengalami gizi buruk di suatu daerah, maka tingkat kesehatan masyarakat di daerah tersebut semakin baik. e. Rata-rata lama sekolah

Rata-rata lama sekolah digunakan sebagai salah satu tolak ukur tingkat pendidikan di suatu daerah. Semakin tinggi tingkat pendidikan dapat membantu menurunkan tingkat kemiskinan di suatu daerah (Wahyudi dan Rejekingsih, 2013: 14).

f. Rasio Ketergantungan

(49)

49

65 tahun keatas dibandingkan dengan jumlah penduduk usia 15-64 tahun. Adapun persamaan rasio ketergantungan adalah sebagai berikut:

(3. 17)

Keterangan:

= rasio ketergantungan

= jumlah penduduk usia 0-14 tahun

= jumlah penduduk usia 65 tahun keatas

= jumlah penduduk usia 15-64 tahun

Rasio ketergantungan dapat digunakan sebagai indikator yang menunjukkan keadaan ekonomi suatu daerah. Semakin tinggi persentase rasio ketergantungan menunjukkan semakin tinggi beban yang harus ditanggung penduduk usia produktif untuk membiayai hidup penduduk usia tidak produktif (Badan Pusat Statistik).

g. Pengangguran

Pengangguran mempunyai hubungan positif dengan tingkat kemiskinan (Prastyo, 2010: 109). Semakin banyak pengangguran maka tingkat kemiskinan juga semakin meningkat. Menurut BPS, pengangguran adalah seseorang yang termasuk kelompok penduduk usia kerja yang selama periode tertentu tidak bekerja, bersedia menerima pekerjaan, dan sedang mencari pekerjaan. Dalam skripsi ini pengangguran yang dimaksud adalah pengangguran yang sedang mencari pekerjaan.

(50)

50

kemiskinan kabupaten/kota di Jawa Tengah menggunakan metode Ward dan Average Linkage.

2. Uji Asumsi Analisis Cluster

Terdapat asumsi-asumsi yang harus dipenuhi dalam analisis cluster, yaitu:

a. Sampel yang diambil harus mewakili populasi yang ada

Untuk mengetahui apakah sampel yang digunakan telah mewakili populasi, dapat dilihat dari nilai Kaiser Meyer Olkin (KMO). Berdasarkan persamaan (3.1) dan (3.2) dan perhitungan menggunakan SPSS 20, diperoleh nilai KMO sebesar 0,713. Nilai tersebut lebih dari 0,5, maka sampel telah mewakili populasi sehingga layak untuk dilakukan analisis cluster.

b. Multikolinearitas

(51)

51

Tabel 3.1. Korelasi Antar Variabel

1,00

0,250 1,00

0,435 0,466 1,00

0,502 -0,403 -0,036 1,00

0,247 0,777 0,476 -0,425 1,00

-0,269 -0,646 -0,586 0,441 -0,683 1,00

0,516 -0,234 0,147 0,862 -0,281 0,207 1,00 Tabel 3. 1 menunjukkan bahwa variabel dan , dan mengalami multikolinearitas karena nilai korelasi lebih dari 0,7. Karena terjadi multikolinearitas antar variabel, maka perlu dilakukan penanganan multikolinearitas guna memenuhi asumsi dalam analisis cluster. Penanganan masalah multikolinearitas menggunakan Principal Component Analysis (PCA).

3. Principal Component Analysis (PCA)

PCA bertujuan untuk menyederhanakan variabel-variabel yang diamati dengan mereduksi dimensinya tanpa kehilangan banyak informasi dari variabel asal/aslinya. Pemilihan metode PCA dikarenakan metode ini mampu mengatasi masalah multikolinearitas secara bersih. Artinya, setiap principal component yang terbentuk dari PCA bebas dari multikolinearitas.

(52)

52

matriks identitas, sehingga diketahui korelasi antar variabel. Berdasarkan persamaan (3.7) dan perhitungan menggunakan SPSS 20 diperoleh hasil (Lampiran 3) nilai = 0,000 < = 0,05. Hal ini menunjukkan bahwa terdapat korelasi antar variabel sehingga perlu dilakukan PCA.

Setelah dilakukan uji KMO dan Bartlett, dilakukan pemeriksaan terhadap nilai-nilai Measure of Sampling Adequacy (MSA). MSA digunakan untuk mengetahui variabel mana saja yang layak dilakukan PCA. Berdasarkan persamaan (3.8) dan perhitungan menggunakan SPSS 20 diperoleh nilai-nilai MSA yang terdapat pada output anti image matrices bagian correlation pada Lampiran 3. Nilai MSA ditunjukkan oleh diagonal dari kiri atas ke kanan bawah yang bertanda huruf a. Hasil dari MSA ditunjukkan oleh tabel berikut:

Tabel 3.2. Nilai Measures of Sampling Adequacy (MSA) Variabel

MSA 0,659 0,805 0,853 0,577 0,811 0,745 0,630

Variabel layak dilakukan PCA apabila mempunyai nilai MSA lebih dari 0,5. Dari tabel 3. 2 terlihat bahwa nilai-nilai MSA dari ketujuh variabel semuanya lebih dari 0,5, maka ketujuh variabel tersebut layak untuk dilakukan PCA.

(53)

53

maka harus dilakukan standarisasi data terlebih dahulu. Berdasarkan persamaan (2. 7) dan perhitungan menggunakan program Excel diperoleh data yang telah distandarisasi pada Lampiran 4, dan dapat dibuat matriks sebagai berkut: Berdasarkan matriks (3. 18) diperoleh matriks sebagai berikut:

Dengan mengalikan matriks (3.19) dengan (3.18) diperoleh matriks korelasi sebagai berikut:

Langkah selanjutnya yaitu mencari nilai eigen dari matriks korelasi . Dengan perhitungan menggunakan SPSS 20 diperoleh output pada

(54)

54

Tabel 3.3. Nilai Eigen, Total Varian, Total Kumulatif Varian Komponen Nilai Eigen Total Varian

(%)

Total Kumulatif Varian (%)

1 3,243 46,323 46,323

2 2,295 32,781 79,103

3 0,534 7,630 86,733

4 0,343 4,893 91,626

5 0,287 4,103 95,729

6 0,218 3,118 98,848

7 0,081 1,152 100,000

Dari tabel 3. 3 terlihat bahwa terdapat tujuh komponen yang terbentuk dari ketujuh variabel yang digunakan. Nilai eigen diperoleh dari persamaan (3. 3) dan selalu diurutkan dari nilai yang terbesar hingga yang paling kecil. Nilai eigen menunjukkan besarnya total varian yang dijelaskan oleh komponen yang terbentuk. Kriteria minimal yang digunakan untuk menentukan Principal Component (PC) yaitu apabila nilai eigen lebih dari 1 ( >1), maka komponen tersebut terpilih sebagai PC

(55)

55

Nilai-nilai eigen yang diperoleh dapat dijelaskan secara grafik menggunakan scree plot. Scree plot menjelaskan hubungan antara banyaknya komponen yang terbentuk dengan eigenvalue.

Gambar 3. 2. Scree Plot

Untuk mengetahui nilai-nilai korelasi (loading) antara variabel dengan PC yang terbentuk dapat dilihat pada output SPSS component matrix (Lampiran 5), dengan hasil sebagai berikut:

Tabel 3.4. Komponen Matriks Variabel

0,445 0,854 0,744 -0,358 0,870 -0,867 -0,151 0,765 -0,155 0,302 0,897 -0,183 0,124 0,918

(56)

56

Tabel 3.5. Variabel dan

Dari tabel 3.5 terlihat bahwa terdiri dari variabel pengeluaran perkapita ( ), upah minimum ( ), rata-rata lama sekolah ( ), dan rasio ketergantungan ( ). Sedangkan terdiri dari variabel PDRB ( ), gizi buruk balita ( ), dan pengangguran ( ). Nilai-nilai loading pada tabel 3.4 digunakan untuk memperoleh nilai-nilai communalities dengan mensubstitusikannya ke dalam persamaan sebagai berikut:

(3. 21)

Keterangan: = nilai korelasi (loading) variabel ke- pada PC 1 = nilai korelasi (loading) variabel ke- pada PC 2

Communalities digunakan untuk menunjukkan berapa varian yang dapat dijelaskan oleh principal component (PC) yang terbentuk. Berikut hasil subtitusi nilai loading tabel 3. 4 ke dalam persamaan (3. 21):

Tabel 3.6. Communalities Variabel

Extraction 0,784 0,753 0,645 0,934 0,790 0,767 0,865

(57)

57

dijelaskan oleh PC yang terbentuk, sebesar 0,645 yang berarti bahwa sebesar 64,5% varian dapat dijelaskan oleh PC yang terbentuk, sebesar 0,934 yang berarti bahwa sebesar 93,4% varian dapat dijelaskan oleh PC yang terbentuk, sebesar 0,790 yang berarti bahwa sebesar 79,0% varian dapat dijelaskan oleh PC yang terbentuk, sebesar 0,767 yang berarti bahwa sebesar 76,7% varian dapat dijelaskan oleh PC yang terbentuk, dan sebesar 0,865 yang berarti bahwa sebesar 86,5% varian dapat dijelaskan oleh PC yang terbentuk.

Setelah diperoleh dua principal component hasil dari reduksi variabel, akan ditentukan koefisien dari principal component yang akan digunakan untuk membentuk persamaan PC. Berikut hasil yang diperoleh:

Tabel 3.7. Koefisien Principal Component (PC) Variabel Principal Component (PC)

1 2

0,174 0,341

0,269 -0,032

0,252 0,157

-0,080 0,365

0,273 -0,043

-0,274 0,018

-0,013 0,381

Dengan mensubtitusikan hasil tabel 3.7 dengan persamaan (3.5) diperoleh persamaan berikut:

(58)

58

(3. 23)

Persamaan (3. 22) dan (3. 23) akan digunakan untuk mencari nilai-nilai dari principal component (PC) dengan hasil pada Lampiran 6. Skor principal component inilah yang akan digunakan untuk mengelompokkan kabupaten/kota di Jawa Tengah menggunakan metode Ward dan Average Linkage, karena kedua komponen yang terbentuk sudah bebas dari multikolinearitas.

4. Pemilihan Ukuran Jarak

Sebelum melakukan pengelompokan kabupaten/kota di Jawa Tengah menggunakan metode Ward dan Average Linkage, terlebih dahulu dilakukan penghitungan jarak antar objek. Jarak inilah yang digunakan sebagai ukuran kesamaan antar objek. Ukuran kesamaan antar objek yang digunakan adalah jarak Euclid kuadrat. Semakin besar jarak menunjukkan ketaksamaan antar objek, sebaliknya semakin kecil jarak menunjukkan kesamaan antar objek.

(59)

59

Tabel 3.8. Perhitungan Kedekatan Kab. Cilacap dan Kab. Banyumas

Objek Total

Kab. Cilacap -0,30701 1,91600 Kab. Banyumas -0,39474 0,87607

0,08773 1,03993

0,00769 1,08145 1,089

Dari perhitungan tabel 3. 8 diperoleh nilai jarak Kab. Cilacap dengan Kab. Banyumas sebesar 1,089.

Tabel 3.9. Perhitungan Kedekatan Kab. Cilacap dan Kab. Purbalingga

Objek Total

Kab. Cilacap -0,30701 1,91600 Kab. Purbalingga -0,74843 -0,33454

0,44142 2,25054

0,19485 5,06493 5,260

Dari perhitungan tabel 3. 9 diperoleh nilai jarak Kab. Cilacap dengan Kab. Purbalingga sebesar 5,260.

Tabel 3.10. Perhitungan Kedekatan Kab. Banyumas dan Kab. Purbalingga

Objek Total

Kab. Banyumas -0,39474 0,87607 Kab. Purbalingga -0,74843 -0,33454

0,35369 1,21061

(60)

60

Dari perhitungan tabel 3. 10 diperoleh nilai jarak Kab. Banyumas dan Kab. Purbalingga sebesar 1,591.

5. Metode Ward

Metode Ward adalah salah satu metode pengelompokan hirarki yang pengelompokannya berdasarkan pada sum square error (SSE). Langkah-langkah pengelompokan menggunakan metode Ward adalah sebagai berikut:

Dimulai dari setiap objek dianggap sebagai sebuah cluster tersendiri, maka terdapat 35 cluster (karena terdapat 35 kabupaten/kota di Provinsi Jawa Tengah) yang mempunyai satu objek. Pada tahap ini SSE bernilai nol.

Menghitung nilai SSE untuk setiap kombinasi dua pasang cluster dari 35 cluster, lalu memilih dua pasang cluster yang memiliki nilai SSE terkecil untuk digabungkan menjadi satu cluster. Secara sistematik, 35 cluster akan berkurang 1 pada setiap tahap. Diberikan contoh perhitungan SSE untuk Kab. Cilacap dan Kab. Banyumas. Data yang digunakan adalah nilai-nilai dari principal component (Lampiran 6).

Nilai rata-rata Kab. Cilacap dan Kab. Banyumas sebagai berikut: (-0,30701 + 1,91600 -0,39474 + 0,87607) / 4 = 0,52258. Rata-rata yang diperoleh digunakan untuk menghitung SSE Kab. Cilacap dan Kab. Banyumas. Berdasarkan persamaan (3.10) diperoleh nilai SSE Kab. Cilacap dan Kab. Banyumas sebagai berikut:

(61)

61

. Dua objek yang mempunyai nilai SSE paling kecil

akan bergabung menjadi satu cluster.

Setelah terbentuk satu cluster yang terdiri dari dua objek pada tahap pertama, kemudian membuat kombinasi dua pasang cluster baru lagi. Dua pasang cluster baru tersebut terdiri dari satu cluster yang telah terbentuk pada tahap pertama dan cluster yang lain, kemudian menghitung nilai SSE lagi. Memilih dua pasang cluster yang memiliki nilai SSE terkecil untuk digabungkan menjadi satu cluster. Demikian seterusnya sampai semua objek bergabung menjadi satu cluster.

Untuk mempermudah proses pengelompokkan kabupaten/kota di Jawa Tengah menggunakan metode Ward, digunakan program SPSS 20. Tahapan pembentukan cluster dapat dilihat dari output SPSS bagian agglomeration schedule (Lampiran 9).

(62)

62

Tahap kedua yaitu pada stage ke-14 terlihat objek nomor 21 (Kab. Demak) bergabung dengan objek nomor 22 (Kab. Semarang) dengan jarak 0,504. Jarak tersebut merupakan jarak minimal objek terakhir yang bergabung (Kab. Semarang) dengan dua objek sebelumnya yaitu Kab. Demak dan Kab. Kendal. Pada kolom next stage, menunjukkan angka 24 yang menjelaskan bahwa pada stage ke-24 proses pengelompokan dilanjutkan.

Tahap ketiga yaitu pada stage ke-24 terlihat objek nomor 19 (Kab. Kudus) bergabung dengan objek nomor 21 (Kab. Demak) dengan jarak 3,134. Jarak tersebut merupakan jarak minimal objek terakhir yang bergabung (Kab. Kudus) dengan tiga objek sebelumnya yaitu Kab. Demak, Kab. Kendal, dan Kab. Semarang. Pada kolom next stage, menunjukkan angka 25 yang menjelaskan bahwa pada stage ke-25 proses pengelompokan dilanjutkan. Demikian seterusnya dari stage 25 dilanjutkan ke stage 29 sampai ke stage terakhir, sehingga semua objek bergabung menjadi satu cluster.

(63)

63

cluster yang terbentuk sebanyak empat cluster. Anggota-anggota tiap cluster dapat dilihat pada output cluster membership (Lampiran 11) dan dapat ditunjukkan pada tabel di bawah ini:

Tabel 3.11. Cluster Membership Metode Ward

No Cluster 1 Cluster 2 Cluster 3 Cluster 4 1 Kab. Cilacap Kab. Purbalingga Kota Magelang Kota Semarang 2 Kab. Banyumas Kab. Banjarnegara Kota Surakarta

(64)

64 6. Metode Average Linkage

Metode Average Linkage adalah metode pengelompokan yang jarak antara dua cluster didefinisikan sebagai rata-rata jarak seluruh pasangan yang berada dalam satu cluster dengan cluster yang lain. Langkah-langkah pengelompokan menggunakan metode average linkage adalah sebagai berikut:

Menghitung jarak dua objek berdasarkan persamaan (3.9), kemudian memilih dua pasang objek yang memiliki jarak paling dekat. Dari Lampiran 12 terlihat bahwa objek nomor 21 (Kab. Demak) dan nomor 24 (Kab. Kendal) bergabung menjadi satu cluster dengan jarak 0,011. Selanjutnya, menghitung jarak antara cluster yang telah terbentuk pada tahap pertama (Kab. Demak & Kab. Kendal) dengan cluster yang lain menggunakan persamaan (3.11). Dari Lampiran 12 terlihat bahwa objek yang bergabung selanjutnya adalah objek nomor 22 (Kab. Semarang). Kab. Semarang inilah yang mempunyai jarak paling dekat dengan (Kab. Demak & Kab. Kendal) daripada kabupaten/kota yang lainnya. Adapun jarak antara (Kab. Demak & Kab. Kendal) dan Kab. Semarang adalah sebagai berikut:

(3. 24)

Begitu seterusnya sampai semua kabupaten/kota bergabung menjadi satu cluster.

(65)

65

SPSS 20. Tahapan pembentukan cluster dapat dilihat dari output SPSS bagian agglomeration schedule (Lampiran 12).

Pada tahap pertama, terlihat bahwa objek nomor 21 (Kab. Demak) dan nomor 24 (Kab. Kendal) bergabung menjadi satu cluster, karena memiliki jarak (pada kolom coefficients) paling kecil yaitu 0,011. Hal ini menunjukkan bahwa jarak antara kedua kabupaten tersebut merupakan jarak yang paling dekat dari banyaknya kombinasi jarak 35 kabupaten/kota. Kemudian pada kolom next stage, menunjukkan angka 14 yang menjelaskan bahwa pada stage ke-14 proses pengelompokan dilanjutkan.

Tahap kedua yaitu pada stage ke-14 terlihat objek nomor 21 (Kab. Demak) bergabung dengan objek nomor 22 (Kab. Semarang) dengan jarak 0,165. Jarak tersebut merupakan jarak minimal objek terakhir yang bergabung (Kab. Semarang) dengan dua objek sebelumnya yaitu (Kab. Demak dan Kab. Kendal). Perolehan jarak tersebut sama seperti persamaan (3. 24). Pada kolom next stage, menunjukkan angka 22 yang menjelaskan bahwa pada stage ke-22 proses pengelompokan dilanjutkan.

(66)

66

pengelompokan dilanjutkan. Demikian seterusnya dari stage 27 dilanjutkan ke stage 31 sampai ke stage terakhir, sehingga semua objek bergabung menjadi satu cluster.

Banyaknya cluster dapat ditentukan dengan melihat dendogram (Lampiran 13). Tahap terakhir penggabungan terlihat bahwa cluster digabung dengan jarak yang tinggi. Penggabungan ini menyebabkan kesamaan (homogenitas) yang rendah antar anggota dalam suatu cluster. Karena akan dilakukan perbandingan hasil cluster dengan metode Ward, maka ditetapkan banyaknya cluster yang terbentuk sebanyak empat cluster. Anggota-anggota tiap cluster dapat dilihat pada output cluster membership (Lampiran 14) dan dapat ditunjukkan pada tabel di bawah ini:

Tabel 3.12. Cluster Membership Metode Average Linkage

No Cluster 1 Cluster 2 Cluster 3 Cluster 4 1 Kab. Cilacap Kab. Banyumas Kota Magelang Kota Semarang 2 Kab. Pemalang Kab. Purbalingga Kota Surakarta

(67)

67

No Cluster 1 Cluster 2 Cluster 3 Cluster 4

19 Kab. Jepara

20 Kab. Demak

21 Kab. Semarang

22 Kab. Temanggung

23 Kab. Kendal

24 Kab. Batang

25 Kab. Pekalongan

Dari tabel 3.12 terlihat bahwa cluster 1 terdiri dari 4 kabupaten, cluster 2 terdiri dari 25 kabupaten, cluster 3 terdiri dari 5 kota, dan cluster 4 terdiri dari 1 kota.

7. Penentuan Metode Terbaik

Setelah terbentuk 4 cluster dari masing-masing metode, dilakukan penentuan metode yang menghasilkan hasil cluster terbaik. Pengecekkan dilakukan menggunakan simpangan baku dalam cluster (within cluster) dan antar cluster (between cluster). Adapun perhitungannya sebagai berikut:

a. Metode Ward

1. Simpangan baku dalam cluster ( )

Diketahui cluster yang terbentuk sebanyak 4 buah (K = 4).

Simpangan baku cluster 1, rata-rata nilai principal component tiap kabupaten/kota dapat dilihat pada Lampiran 15 (tabel 1) dengan rata-rata nilai principal component cluster 1 = 0,160444. Berdasarkan persamaan (2. 6) diberikan perhitungan sebagai berikut:

(68)

68

Simpangan baku cluster 2, rata-rata nilai principal component tiap kabupaten/kota dapat dilihat pada Lampiran 15 (tabel 2) dengan rata-rata nilai principal component cluster 2 = -0,21369.

Simpangan baku cluster 3, rata-rata nilai principal component tiap kabupaten/kota dapat dilihat pada Lampiran 15 (tabel 3) dengan rata-rata nilai principal component cluster 3 = 0,01779.

(69)

69

Simpangan baku cluster 4 bernilai 0, karena cluster 4 hanya terdiri dari satu kota saja.

Berdasarkan persamaan (3.12) diperoleh nilai simpangan baku dalam cluster ( ) sebagi berikut:

2. Simpangan baku antar cluster ( )

Telah diketahui bahwa rata-rata nilai principal component cluster 1 = 0,160444, cluster 2 = -0,21369, cluster 3 =

0,01779, cluster 4 = 3,115045. Diberikan perhitungan rata-rata seluruh cluster sebagai berikut:

=

Berdasarkan persamaan (3.13) diperoleh nilai simpangan baku antar cluster ( ) sebagi berikut:

(70)

70

b. Metode Average Linkage

1. Simpangan baku dalam cluster ( )

Diketahui cluster yang terbentuk sebanyak 4 buah (K = 4).

Simpangan baku cluster 1, rata-rata nilai principal component tiap kabupaten/kota dapat dilihat pada Lampiran 16 (tabel 1) dengan rata-rata nilai principal component cluster 1 = 0,277563. Berdasarkan persamaan (2. 6) diberikan perhitungan sebagai berikut:

Simpangan baku cluster 2, rata-rata nilai principal component tiap kabupaten/kota dapat dilihat pada Lampiran 16 (tabel 2) dengan rata-rata nilai principal component cluster 2 = -0,17257.

(71)

71

Simpangan baku cluster 3, rata-rata nilai principal component tiap kabupaten/kota dapat dilihat pada Lampiran 16 (tabel 3) dengan rata-rata nilai principal component cluster 3 = 0,01779.

Simpangan baku cluster 4 bernilai 0, karena cluster 4 hanya terdiri dari satu kota saja.

Dengan menggunakan persamaan (3.12) diperoleh nilai simpangan baku dalam cluster ( ) sebagi berikut:

Gambar

Tabel 1.1. Jumlah dan Persentase Penduduk Miskin Menurut Provinsi di
Gambar 1.1. Jumlah Penduduk Miskin di Tiga Provinsi Terpadat
Gambar 3. 1 Langkah-langkah Analisis Cluster
Tabel 3.1. Korelasi Antar Variabel
+7

Referensi

Dokumen terkait

diperlukan penelitian lebih lanjut mengenai faktor-faktor yang dapat mempengaruhi tingkat kemiskinan di seluruh kabupaten/kota, sehingga dapat digunakan sebagai dasar

Analisis Faktor-faktor Yang Mempengaruhi Pembentukan Upah Minimum Kabupaten Kota Di Provinsi Jawa Timur serta Dampaknya terhadap Pengangguran dan Kemiskinan Kabupaten Kota

Sehingga dalam penelitian ini cluster Analysis digunakan untuk mengelompokkan kabupaten/kota di Provinsi Jawa Timur berdasarkan indikator kemiskinan yang kemudian akan

Pengelompokan siswa berdasarkan faktor-faktor yang mempengaruhi keberhasilan siswa dalam belajar bertujuan untuk membantu dan mempermudah pada proses pengelolaan data

Klaster tiga: klaster yang beranggotakan 22 Kabupaten/Kota dimana klaster ini memiliki rata-rata tenaga kesehatan paling rendah dibanding rata-rata variabel pada klaster

Metode Principal Component Analysis (PCA) akan mendapatkan variabel bebas baru yang tidak berkorelasi, bebas satu sama lainnya, lebih sedikit jumlahnya daripada variabel

Sehingga dapat disimpulkan bahwa Model Galat Spasial lebih baik dari model OLS dalam menganalisis faktor-faktor yang mempengaruhi kemiskinan di provinsi Jawa Tengah

Berdasarkan pada Tabel 4.3 dan 4.4 hasil dari rasio simpangan baku (S) menunjukkan bahwa metode Ward dengan 6 cluster mempunyai kinerja yang paling baik dalam membentuk cluster