• Tidak ada hasil yang ditemukan

K. Analisis Cluster

5. Menginterpretasi Cluster

Menginterpretasi dan memprofilkan hasil cluster bertujuan untuk memberikan gambaran karakteristik dari cluster yang terbentuk. Metode yang digunakan yaitu dengan melihat nilai centroid tiap cluster (Supranto, 2010: 160). Centroid adalah rata-rata nilai objek yang terdapat dalam

34

cluster pada tiap variabel. Nilai centroid dapat dihitung menggunakan persamaan di bawah ini:

(2. 22)

Keterangan:

= nilai centroid tiap cluster

= nilai atau data dari objek ke-j pada variabel ke-k; dengan j = 1, 2, 3, ..., n dan k = 1, 2, 3, ..., p = jumlah objek tiap cluster

L. Kemiskinan

Kemiskinan merupakan suatu kondisi kehidupan serba kekurangan yang dialami seseorang sehingga ia tidak mampu dalam memenuhi kebutuhan minimum hidupnya. Badan Pusat Statistik (BPS) menggunakan konsep kemampuan memenuhi kebutuhan dasar (basic needs approach) dalam mengukur kemiskinan. Kemiskinan dipandang sebagai ketidakmampuan dari sisi ekonomi untuk memenuhi kebutuhan dasar makanan dan bukan makanan yang diukur dari sisi pengeluaran. Penduduk yang memiliki rata-rata pengeluaran perkapita per bulan dibawah garis kemiskinan dikategorikan sebagai penduduk miskin.

Garis kemiskinan merupakan penjumlahan dari Garis Kemiskinan Makanan (GKM) dan Garis Kemiskinan Non Makanan (GKNM). Garis Kemiskinan Makanan (GKM) merupakan nilai pengeluaran kebutuhan minimum makanan yang disetarakan dengan 2100 kilokalori perkapita perhari. Paket komoditi kebutuhan dasar makanan diwakili oleh 52 jenis komoditi, diantaranya: padi-padian, umbi-umbian, ikan, daging, telur dan

35

susu, sayuran, dll. Sedangkan Garis Kemiskinan Non Makanan (GKNM) adalah kebutuhan minimum untuk perumahan, sandang, pendidikan dan kesehatan. Paket komoditi kebutuhan dasar non makanan diwakili oleh 51 jenis komoditi di perkotaan dan 47 jenis komoditi di pedesaan.

Terdapat beberapa faktor yang mempengaruhi kemiskinan, khususnya di Provinsi Jawa Tengah. Menurut Prastyo (2010), pertumbuhan ekonomi, upah minimum, pendidikan, dan tingkat pengangguran berpengaruh signifikan terhadap tingkat kemiskinan. Pertumbuhan ekonomi, upah minimum, dan pendidikan mempunyai hubungan negatif dengan tingkat kemiskinan. Hal ini berarti bahwa apabila pertumbuhan ekonomi, upah minimum, dan pendidikan meningkat maka tingkat kemiskinan mengalami penurunan. Sedangkan tingkat pengangguran mempunyai hubungan positif dengan tingkat kemiskinan. Artinya, semakin tinggi tingkat pengangguran maka kemiskinan juga semakin meningkat.

Menurut Wahyudi dan Rejekingsih (2013), pendidikan, kesehatan, pengeluaran pemerintah, dan pertumbuhan ekonomi mempunyai hubungan negatif dengan tingkat kemiskinan. Hal ini berarti bahwa apabila pendidikan, kesehatan, pengeluaran pemerintah, dan pertumbuhan ekonomi meningkat maka tingkat kemiskinan mengalami penurunan. Sedangkan tingkat pengangguran mempunyai hubungan positif dengan tingkat kemiskinan. Artinya, semakin tinggi tingkat pengangguran maka kemiskinan juga semakin meningkat.

36 BAB III PEMBAHASAN

Analisis cluster merupakan analisis yang bertujuan untuk mengelompokkan objek-objek pengamatan berdasarkan karakteristik yang dimiliki. Asumsi-asumsi dalam analisis cluster yaitu sampel yang diambil harus mewakili populasi dan multikolinearitas. Apabila terjadi multikolinearitas diatasi menggunakan Principal Component Analysis (PCA). Hasil dari Principal Component (PC) yang terbentuk digunakan sebagai variabel bebas baru untuk mengelompokkan kabupaten/kota berdasarkan faktor-faktor yang mempengaruhi kemiskinan di Jawa Tengah menggunakan metode Ward dan Average Linkage. Perbandingan kinerja antara metode Ward dan Average Linkage dilakukan untuk memilih metode yang menghasilkan cluster lebih baik.

A. Analisis Cluster

Telah dijelaskan sebelumnya bahwa analisis cluster merupakan analisis yang digunakan untuk mengelompokkan objek-objek pengamatan berdasarkan karakteristik yang dimiliki. Seperti teknik analisis lain, analisis cluster menetapkan adanya asumsi-asumsi yang harus dipenuhi. Asumsi dalam analisis cluster yaitu:

1. Sampel yang diambil harus mewakili populasi yang ada

Untuk mengetahui apakah sampel yang digunakan telah mewakili populasi, dapat dilihat dari nilai Kaiser Meyer Olkin (KMO). Kaiser Meyer

37

Olkin (KMO) adalah indeks perbandingan nilai koefisien korelasi terhadap korelasi parsial (Yamin dan Kurniawan, 2014: 181).

(3. 1) (3. 2) Keterangan: = banyaknya variabel

= koefisien korelasi antara variabel dan

= koefisien korelasi parsial antara variabel dan

Menurut Yamin, Rachmach dan Kurniawan (2011: 122), jika nilai KMO < 0,5, maka sampel tidak mewakili populasi, sedangkan jika nilai KMO > 0,5, maka sampel mewakili populasi sehingga layak untuk dilakukan analisis cluster.

2. Multikolinearitas

Multikolinearitas adalah adanya hubungan linear atau korelasi yang tinggi antar variabel. Untuk mengetahui ada tidaknya multikolinearitas, dapat dilihat dari nilai-nilai korelasi pada matriks korelasi. Dua variabel atau lebih dikatakan multikolinearitas apabila nilai korelasinya > 0,70 (Yamin dan Kurniawan, 2014: 70). Apabila terjadi multikolinearitas diatasi menggunakan Principal Component Analysis (PCA). Kelebihan dari PCA yaitu dapat mengatasi multikolinearitas secara bersih. Artinya, principal component hasil dari PCA bebas dari multikolinearitas.

38 B. Principal Component Analysis (PCA)

Principal Component Analysis (PCA) bertujuan untuk menyederhanakan variabel yang diamati dengan cara mereduksi dimensinya. Prinsip utama dari PCA adalah terdapatnya korelasi antar variabel sehingga diduga bahwa variabel-variabel tersebut dapat direduksi. Hal ini dilakukan dengan cara menghilangkan korelasi antar variabel bebas melalui transformasi variabel bebas asal ke variabel bebas baru yang tidak berkorelasi sama sekali atau sering disebut dengan principal component (Johnson dan Wichern, 2007: 430).

Principal component (PC) merupakan suatu kombinasi linear dari variabel-variabel asal. Pembentukan PC berdasarkan dua cara yaitu matriks kovarian atau matriks korelasi (Johnson dan Wichern, 2007: 431). Pembentukan PC berdasarkan matriks kovarian digunakan apabila variabel yang diamati mempunyai satuan pengukuran yang sama, sedangkan matriks korelasi digunakan apabila variabel yang diamati mempunyai satuan berbeda. Pada skripsi ini digunakan matriks korelasi karena variabel yang digunakan memiliki satuan berbeda.

Tahapan menentukan PC berdasarkan matriks korelasi adalah sebagai berikut (Johnson dan Wichern, 2007: 436-437):

1. Membuat matriks yang berisi data dari variabel X yang telah distandarisasi.

2. Membuat matriks korelasi dari yaitu . Pereduksian PC dimulai dengan mencari nilai eigen yang diperoleh dari persamaan:

39

(3. 3)

dimana jumlahan nilai eigen merupakan trace matriks korelasi atau jumlah diagonal matriks korelasi, yaitu:

(3. 4)

Nilai eigen selalu diurutkan dari yang terbesar sampai nilai terkecil. Nilai eigen menunjukkan besarnya total varian yang dijelaskan oleh PC yang terbentuk. saling orthogonal dan dibentuk berdasarkan persamaan:

(3. 5)

Vektor eigen diperoleh dari setiap nilai eigen yang memenuhi persamaan:

(3. 6)

Beberapa ketentuan PCA dalam membentuk principal component adalah sebagai berikut (Johnson dan Wichern, 2007: 431-432):

1. Principal Component (PC) yang terbentuk sebanyak variabel yang diamati dan setiap PC merupakan kombinasi linear dari variabel-variabel tersebut. 2. Setiap PC saling orthogonal dan saling bebas.

3. Principal Component (PC) dibentuk berdasarkan urutan total varian yang terbesar hingga paling kecil, dalam arti sebagai berikut:

a. Principal Component pertama adalah kombinasi linear dari seluruh variabel yang diamati dan memiliki varian terbesar.

b. Principal Component kedua adalah kombinasi linear dari seluruh variabel yang diamati dan bersifat orthogonal terhadap dan memiliki varian terbesar kedua.

40

c. Principal Component ketiga adalah kombinasi linear dari seluruh variabel yang diamati dan bersifat orthogonal terhadap maupun dan memiliki varian terbesar ketiga.

d. Principal Component ke- adalah kombinasi linear dari seluruh variabel yang diamati dan bersifat orthogonal terhadap , ,..., dan memiliki varian paling kecil.

Sebelum dilakukan PCA, terlebih dahulu dilakukan beberapa pengujian sebagai berikut:

1. Uji Kaiser Meyer Olkin (KMO)

Syarat yang harus dipenuhi sebelum dilakukan PCA yaitu data yang digunakan telah mencukupi untuk dianalisis. Nilai KMO dapat dicari menggunakan persamaan (3. 1) dan (3. 2).

2. Uji Bartlett

Uji Bartlett digunakan untuk mengetahui apakah matriks korelasi hubungan antara variabel adalah matriks identitas. Hal ini digunakan untuk menguji kecukupan hubungan antara variabel, dimana matriks identitas mempunyai diagonal matriks bernilai 1 dan yang lainnya adalah 0. Urutan pengujian sebagai berikut:

Hipotesis:

: matriks korelasi = matriks identitas : matriks korelasi  matriks identitas Statistik uji :

41 Keterangan:

= nilai determinan matriks korelasi = banyaknya data

= banyaknya variabel Kriteria keputusan:

Tolak jika > atau 

Setelah dilakukan uji KMO dan Bartlett, dilakukan pemeriksaan terhadap nilai-nilai Measure of Sampling Adequacy (MSA). Measure of Sampling Adequacy (MSA) digunakan untuk mengetahui variabel mana saja yang layak dilakukan PCA. Nilai MSA dapat dilihat pada output SPSS anti images matrices bagian correlation yang ditunjukkan oleh diagonal dari kiri atas ke kanan bawah yang bertanda huruf a dan diperoleh dari persamaan berikut:

(3. 8) dengan = 1, 2, 3, ..., 7 , = 1, 2, 3, ..., 7 , dan

Jika nilai MSA > 0,5 maka variabel layak dilakukan PCA (Yamin dan Kurniawan, 2014: 186).

Principal component hasil dari PCA akan digunakan sebagai variabel bebas baru untuk dianalisis cluster menggunakan metode Ward dan Average Linkage. Sebelum penyusunan cluster, terlebih dahulu dilakukan pemilihan ukuran jarak. Ukuran jarak yang digunakan adalah jarak Euclid kuadrat. Adapun persamaan Euclid kuadrat adalah sebagai berikut:

42 C. Metode Ward

Metode Ward merupakan salah satu metode hirarki dalam analisis cluster. Metode Ward bertujuan untuk memperoleh cluster yang memiliki varian dalam cluster (within cluster) sekecil mungkin. Ukuran kesamaan yang digunakan adalah jarak Euclid kuadrat (Supranto, 2010: 154). Metode Ward mengelompokkan objek didasarkan pada kenaikan sum square error (SSE). Pada tiap tahap, dua cluster yang memiliki kenaikan SSE paling kecil digabungkan (Simamora, 2005: 218). Sum Square Error (SSE) dapat dihitung menggunakan persamaan (Gudono, 2014: 294):

(3. 10)

Keterangan:

SSE = sum square error = jumlah anggota cluster

= nilai atau data dari objek ke-

= rata-rata (mean) nilai objek dalam sebuah cluster

Langkah-langkah pengelompokan menggunakan metode Ward adalah sebagai berikut (Johnson dan Wichern, 2007: 692-693):

1. Dimulai dari setiap objek dianggap sebagai sebuah cluster tersendiri, maka terdapat N cluster yang mempunyai satu objek. Pada tahap ini SSE bernilai nol.

2. Menghitung nilai SSE untuk setiap kombinasi dua pasang cluster dari N cluster, lalu memilih dua pasang cluster yang memiliki nilai SSE terkecil untuk digabungkan menjadi satu cluster. Secara sistematik, N cluster akan berkurang 1 pada setiap tahap (N-1).

43

3. Membuat kombinasi dua pasang cluster baru yang terdiri dari satu cluster yang telah terbentuk dan cluster yang lain, lalu menghitung nilai SSE lagi. Memilih dua pasang cluster yang memiliki nilai SSE terkecil untuk digabungkan menjadi satu cluster.

4. Mengulangi langkah (3) sampai semua objek bergabung menjadi satu cluster.

Dokumen terkait