• Tidak ada hasil yang ditemukan

HIERARCHICAL CLUSTERING VIA MINIMAX LINKAGE PADA PENGELOMPOKKAN KECAMATAN DI PULAU MADURA BERDASARKAN INDIKATOR PEMERATAAN PENDIDIKAN

N/A
N/A
Protected

Academic year: 2021

Membagikan "HIERARCHICAL CLUSTERING VIA MINIMAX LINKAGE PADA PENGELOMPOKKAN KECAMATAN DI PULAU MADURA BERDASARKAN INDIKATOR PEMERATAAN PENDIDIKAN"

Copied!
13
0
0

Teks penuh

(1)

HIERARCHICAL CLUSTERING VIA MINIMAX LINKAGE PADA PENGELOMPOKKAN KECAMATAN DI PULAU MADURA BERDASARKAN INDIKATOR PEMERATAAN PENDIDIKAN

Padmi Ganifandari1, Dwiatmono Agus W.2

1Mahasiswa Jurusan Statistika FMIPA-ITS, 2Dosen Jurusan Statistika FMIPA-ITS,

Abstrak

Pulau Madura secara geografis sangat strategis berada di antara Laut Jawa dan Selat Madura yang menyimpan banyak potensi. Madura terdiri dari empat kabupaten, yaitu Bangkalan, Sampang, Pamekasan dan Sumenep. Pendidikan sangat berpengaruh terhadap kemajuan suatu daerah dan pemerataan pendidikan sangat diperlukan karena dapat meningkatkan kesejahteraan masyarakat secara merata. Hal ini mendorong penelitian-penelitian mengenai pemerataan pendidikan semakin dikembangkan, salah satunya dalam hal pengelompokkan kecamatan berdasarkan indikator pemerataan pendidikan. Pengelompokkan kecamatan penting dilakukan dalam rangka membantu pihak terkait membuat perencanaan dan kebijakan yang sesuai, Pada penelitian ini digunakan metode single, complete, average, dan minimax linkage, kemudian dilakukan perbandingan antara keempat metode tersebut. Hasil analisis data indikator pemerataan pendidikan di kecamatan-kecamatan pulau Madura menunjukkan bahwa metode minimax linkage merupakan metode pengelompokkan terbaik dengan jumlah kelompok optimum sebanyak 3.

Kata kunci :minimax linkage, pemerataan pendidikan, Madura 1. Pendahuluan

Jembatan Suramadu adalah jembatan yang melintasi Selat Madura, menghubungkan Pulau Jawa (di Surabaya) dan Pulau Madura (di Bangkalan, tepatnya timur Kamal). Menurut Keputusan Presiden Nomor 79 Tahun 2003 tentang tujuan dibangunnya jembatan Suramadu adalah untuk lebih meningkatkan pembangunan di Pulau Madura, sebagai upaya dalam memacu perluasan kawasan industri, perumahan, dan sektor lainnya, serta mendorong pertumbuhan ekonomi masyarakat dengan menghubungkan Pulau Jawa dan Madura. Tujuan tersebut dapat tercapai jika terdapat sumber daya manusia (SDM) yang kreatif dan memiliki tingkat pendidikan yang optimal. Tingkat pendidikan warga Madura selama kurun waktu sampai sekarang ini, merupakan salah satu indikator penting akan ketersediaan sumber daya manusia (SDM) lokal yang handal. Oleh karena itu, pemerataan pendidikan sangat diperlukan karena dapat meningkatkan kesejahteraan masyarakat secara merata. Hal ini mendorong penelitian-penelitian mengenai pemerataan pendidikan semakin dikembangkan, salah satunya dalam hal pengelompokkan kecamatan berdasarkan indikator pemerataan pendidikan. Pengelompokkan kecamatan penting dilakukan dalam rangka membantu pihak terkait membuat perencanaan dan kebijakan yang sesuai, khususnya untuk kecamatan di pulau Madura. Upaya pengelompokkan ini diharapkan mampu menggabungkan kecamatan yang memiliki kesamaan pada beberapa indikator pemerataan pendidikan.

Metode pengelompokkan yang biasa digunakan pada hierarchical clustering yaitu single

linkage, complete linkage, average linkage, dan sebagainya. Namun pada tahun 2011, Jacob Bien dan

Robert Tibshirani memperkenalkan metode hierarchical clustering via minimax linkage. Minimax

linkage memiliki beberapa kelebihan, salah satunya yaitu robust terhadap gangguan berupa outlier.

Untuk mendapatkan hasil pengelompokkan yang baik, penelitian ini melakukannya pada beberapa metode hierarchical clustering, kemudian dipilih hasil yang terbaik. Dengan adanya penelitian ini diharapkan mampu menunjukkan kelompok-kelompok kecamatan dan permasalahan-permasalahannya yang perlu mendapatkan perhatian dalam upaya pemerataan pendidikan dan diharapkan dapat membantu pemerintah dalam mengambil suatu kebijakan tentang pendidikan. Tujuan pada penelitian ini antara lain, mendapatkan karakteristik kecamatan dengan analisis statistika deskriptif, membandingkan hasil pengelompokkan kecamatan dengan metode hierarchical clustering

(2)

kecamatan yang berkelompok dan menganalisis kaerakteristik kecamatan berdasarkan hasil pengelompokkan terbaik, dan mengelompokkan kecamatan di tiap kabupaten dengan metode minimax

linkage.

2. Tinjauan Pustaka

Untuk menyelesaikan permasalahan dalam penelitian ini, perlu adanya pendalaman teori yang akan diuraikan sebagai berikut.

2.1 Analisis Faktor

Uji asumsi yang digunakan sebelum melakukan analisis faktor yaitu pengujian kecukupan data dan uji korelasi antar variabel. Secara statistik pengujian kecukupan data atau sampel dapat diidentifikasi melalui nilai Kaiser-Meyer-Olkin(KMO) dan Measure of Sampling Adequency(MSA). Hipotesis dari KMO adalah sebagai berikut :

H0: Jumlah data cukup untuk difaktorkan H1 : Jumlah data tidak cukup untuk difaktorkan Statistik uji : KMO =





       p 1 i p 1 i p 1 j 2 ij p 1 j 2 ij p 1 i p 1 j 2 ij a r r MSA =

    p j ij p j ij p j ij a r r 1 2 1 2 1 2 (1) Dimana : i = 1, 2, 3, ..., p dan j = 1, 2, ..., p serta i ≠ j rij = Koefisien korelasi antara variabel i dan j aij = Koefisien korelasi parsial antara variabel i dan j

Jika nilai KMO dan MSA > 0,5 maka data cukup untuk difaktorkan. Secara umum data yang dapat digunakan untuk analisis faktor yaitu sampel data pengamatan yang digunakan harus melebihi jumlah variabel (Hair, Black, Babin, dan Anderson, 2010).

Pengujian korelasi antar variabel dilakukan dengan uji Bartlet, hipotesis yang digunakan sebagai berikut (Morrison, 2005).

H0: Matriks korelasi merupakan matriks identitas H1: Matriks korelasi bukan matriks identitas

Statistik uji : hitung n p lnR

6 5 2 ) 1 ( 2           (2) Daerah Penolakan : 2 ) 1 ( 2 1 , p p 

Keputusan : Tolak hipotesis H0jika 2 ) 1 ( 2 1 , 2 

p p hitung

Dimana, n = Jumlah observasi p = Jumlah variabel

| | = Determinan dari matriks korelasi

Analisis faktor pada prinsipnya digunakan untuk mereduksi data, yaitu proses untuk meringkas sejumlah variabel menjadi sedikit dan menamakannya sebagai faktor. Apabila terdapat vektor acak x’= (x1, x2, ...,xp) mempunyai matrik korelasi Rdan memiliki nilai mean μmaka model analisis faktor adalah :

1 1 2 12 1 11 1 1

F

F

m

F

m

X

(3)p m pm p p p p F F F X

 1 1 2 2  

Dimana :

Fj= Common factorke-j

Lij= Loading factorke-j dari variabel ke-i

(3)

i = 1, 2, . . . , p dan j = 1, 2, . . . , m

Nilai eigenvalue yang dijadikan acuan untuk menentukan banyaknya faktor yang terbentuk adalah nilai eigenvalue yang lebih besar dari satu. Rotasi faktor memiliki tujuan untuk menyederhanakan struktur dengan mentransformasi faktor untuk mendapatkan faktor baru yang lebih mudah untuk diinterpretasikan.

Metode rotasi ada dua macam yaitu rotasi orthogonal, dan rotasi oblique. Rotasi orthogonal

ada 3 macam yaitu varimax, quartimax dan equamax. (Dillon dan Goldstein, 1981 diacu dalam Purwaningsih, 2004). Prosedur dari metode varimax dengan meminimalkan jumlah variabel yang mempunyai loadingtinggi pada suatu faktor (Norusis, 1986 diacu dalam Purwaningsih, 2004).

2.2 Analisis Cluster

Analisis clusteratau biasa disebut analisis kelompok digunakan untuk mengelompokkan objek pengamatan berdasarkan karakteristik-karakteristik yang dimiliki. Pengelompokkan dilakukan dengan memaksimalkan kehomogenan objek pengamatan dalam satu cluster sekaligus memaksimalkan keheterogenan antar cluster. Analisis kelompok terdiri atas prosedur hirarki dan non-hirarki.

Prosedur cluster hirarki terdiri atas dua metode yaitu agglomerative dan divisive. Adapun beberapa algoritma metode agglomerative yang digunakan untuk membentuk kelompok (cluster) adalah single linkage, complete linkage, dan average linkage(Johnson dan Winchern, 2007).

Untuk menghitung jarak antar kelompok digunakan suatu fungsi yang disebut jarak (distance). Salah satu distance adalah dengan menggunakan fiungsi jarak Euclidean dimana formulanya sebagai berikut (Johnson dan Winchern, 2007) :

p k jk ik ij

x

x

d

1 2 (4) a. Single Linkage

Metode pautan tunggal (single linkage) prosedurnya berdasarkan jarak minimum, dengan rumus sebagai berikut (Johnson dan Winchern, 2007) :

) , min( ) , (i jk dik djk d  (5)

dimana : - dik= jarak antara kelompok i dan k - djk= jarak antara kelompok j dan k

b. Complete Linkage

Complete linkage adalah proses clustering yang didasarkan pada jarak terjauh antar

obyeknya ( maksimum distance).

) , max( ) , (ijk dik djk d  (6) c. Average Linkage

Average linkage adalah proses clustering yang didasarkan pada jarak rata-rata antar

obyeknya (average distance).

) , ( ) , (i jk average dik djk d  (7) d. Minimax Linkage

Bien dan Thibshirani (2011), minimax linkagemerupakan metode hierarchical clusteringyang dikembangkan dari metode single, complete, dan average linkage serta centroid linkage. Minimax

linkage adalah pengelompokkan berdasarkan nilai minimum dari jarak yang maksimum. Definisi

minimax linkageantar dua cluster Gdan Hyaitu :

max

(

,

'

)

min

)

,

(

'

d

x

x

H

G

d

H G x H G x   

(8)

Sifat-sifat minimax linkageyaitu :

1. Dendrogramdari minimax linkagetidak memiliki inversions.

2. Minimax linkagemenghasilkan k-groupyang terstruktur dengan baik.

Sebuah linkage dapat menghasilkan k-group yang terstruktur dengan baik jika pada cluster C1,…,Ck jarak antar semua anggota cluster lebih kecil daripada jarak antar cluster (homogenitas dalam cluster lebih besar daripada heterogenitas antar cluster). Hierarchical clustering akan terbentuk setelah proses penggabungan sebanyak nk.

3. Adanya jarak antar anggota cluster yang sama tidak mempengaruhi bentuk clusterdan memiliki sifat transformasi monoton. Transformasi monoton akan memelihara jarak antar anggota cluster,

(4)

paling tidak mendekati jarak awalnya.

Single dan complete linkage juga memiliki kedua sifat tersebut, sedangkan average linkage

tidak memilikinya. Kedua sifat ini menunjukkan bahwa minimax linkage robust terhadap gangguan, misalnya gangguan berupa outlier. Fisher dan Van Ness (1971) menyatakan bahwa aspek pengukuran jarak pada cluster lebih penting daripada kepadatan (jumlah) point dalam

cluster.

4. Minimax linkagememenuhi sifat reducibility.

Gordon (1987), clustering yang menggunakan linkage juga membutuhkan sifat reducibility, dimana untuk setiap cluster G1, G2, H,

d(G1G2, H) ≥ min{d(G1, H), d(G2, H)} (9)

Reducibility menunjukkan bahwa cluster baru yang terbentuk yaitu G1G2 memiliki jarak

sejauh mungkin dengan H, daripada jarak antara G1atau G2 terhadap H. Misalkan, jika Jdan H memilki jarak yang dekat sebelum penggabungan G1dan G2maka Jdan Hakan tetap tetap dekat setelah G1dan G2digabung (Murtagh, 1983).

Algoritma :

 Mulai dengan C0= {{x1},…,{xn}} dan d({xi},{xj}) = d(xi,xj) untuk semua i j

 Untuk l=1,…,n– 1 :

1.Temukan sebuah pasangan (G1,G2) yang memiliki jarak terdekat (RNN / reciprocal nearest –

neighbor)

2.Hitung d(G1G2, H) untuk semua HCl

3. Ulangi langkah (1), dengan G1danG2awal telah berkelompok Dimana ladalah jumlah pengamatan.

Pemilihan metode clusteryang terbaik dapat dilakukan dengan analisa cluster. Analisa cluster

bisa diperoleh dari kepadatan cluster yang terbentuk (cluster density). Kepadatan suatu cluster bisa ditentukan dengan variance within cluster(Vw2) dan variance between cluster(Vb2) (Man, Lim, Jian, Yue, 2009 diacu dalam Martiana, Rosyid, Agusetia, 2010). Varian tiap tahap pembentukan cluster bisa dihitung dengan rumus :

n i c i c

y

y

n

Vc

1 2 2

1

1

(10) Dimana :

Vc2= varian pada clusterc

c = 1…k, dimana k = jumlah cluster

nc= jumlah data pada clusterc yi= data ke-i pada suatu cluster

yc= rata-rata dari data pada suatu cluster

Selanjutnya dari nilai varian diatas, kita bisa menghitung nilai variance within cluster (Vw2) dan nilai variance between cluster(Vb2) dengan rumus :

    c i i i V n c N Vw 1 2 2 1 1

    c i i i y y n c Vb 1 2 2 1 1 (11) Dimana :

N = jumlah semua data ni= jumlah data cluster i Vi2= varian pada cluster i

y= rata-rata dari

y

i

Salah satu metode yang digunakan untuk menentukan cluster yang ideal adalah batasan

variance, yaitu dengan menghitung kepadatan cluster berupa variance within cluster (Vw2) dan

variance between cluster(Vb2). Clusteryang ideal mempunyai Vw2minimum yang mempresentasikan

internal homogeneitydan maksimum Vb2yang menyatakan external homogeneity.

2 2 Vb Vw V  (12)

(5)

Penentuan jumlah clusteroptimum dapat ditentukan dengan pola pergerakan varian. Identikasi pola pergerakan varian merupakan metode untuk memperoleh cluster yang mencapai global optimum (Arai, Barakbah, 2007). Posisi yang mungkin untuk menemukan global optimum pada pergerakan varian, dikelompokkan menjadi 2 yaitu hill-climbing dan valley-tracing (Noor dan Hariadi, 2009). Pada valley-tracing didefinisikan bahwa kemungkinan mencapai global optimum terletak pada tahap ke-i, jika memenuhi persamaan berikut :

v

i1

v

i

 

v

i1

v

i

(13)

Dimana Vi = varian pada cluster ke-i hasil perbandingan Vw2 dengan Vb2, i = 1..k, dan k tahap terakhir pembentukan cluster. Selanjutnya, baik dengan pendekatan metode valley-tracing maupun

hill-climbing dilakukan identifikasi perbedaan nilai tinggi (∂) pada tiap tahap, yang didefinisikan

dengan :

v

i 1

v

i 1

 

2

xv

i

(14)

Nilai ∂ digunakan untuk menghindari local optima, dimana persamaan ini diperoleh dari maksimum ∂ yang dipenuhi pada persamaan 14. Untuk mengetahui keakuratan dari suatu metode pembentukan cluster pada hierarchical method, baik menggunakan valley-tracing maupun

hill-climbing, digunakan persamaan berikut.

 

 

   max _ _ _ max ke terdekat nilai

(15) Dimana :

Nilai terdekat ke max (∂) adalah nilai kandidat max (∂) sebelumnya.

Nilai φ yang lebih besar dari 2, menunjukkan cluster yang terbentuk merupakan cluster yang

well-separated / terpisah dengan baik. Jika nilai φ bertanda negatif berarti global optimum yang ditentukan

telah benar dan cluster yang terbentuk terpisah dengan baik (Arai, Barakbah, 2007). 2.3 Definisi Operasional Indikator Pemerataan Pendidikan

Puspowati (2009), menurut UU no 20 tahun 2003, pendidikan adalah suatu usaha sadar untuk menyiapkan peserta didik melalui kegiatan bimbingan, pengajaran dan atau latihan bagi peranannya di masa yang akan datang. Definisi operasional enam variable tersebut dapat dijelaskan sebagai berikut : 1. APK (Angka Partisipasi Kasar)

Hasil perhitungan APK digunakan untuk mengetahui banyaknya anak yang bersekolah di suatu jenjang pendidikan tertentu pada wilayah tertentu.

APK =jumlah penduduk usia sekolah (16)jumlah murid jenjang tertentu

2. APM (Angka Partisipasi Murni)

Indikator APM digunakan untuk mengetahui banyaknya anak usia sekolah yang bersekolah pada suatu jenjang pendidikan yang sesuai. Kelompok umur untuk usia SD 7-12 tahun, SMP 13-15 tahun, SMA 16-18 tahun. Besarnya APM di suatu daerah dapat dihitung dengan rumus berikut :

APM =jumlah murid usia jenjang tertentujumlah penduduk usia sekolah (17)

3. Rasio Murid-Guru

Indikator rasio murid dengan guru digunakan untuk menggambarkan beban kerja guru dalam mengajar. Indikator ini juga dapat digunakan untuk melihat mutu pengajaran di kelas karena semakin tinggi nilai rasio ini berarti semakin berkurang tingkat pengawasan atau perhatian guru terhadap murid sehingga mutu pengajaran cenderung semakin rendah.

Rasio Murid_Guru =jumlah muridjumlah guru (18)

4. Rasio Murid-Kelas

Indikator rasio murid dengan kelas digunakan untuk menggambarkan kepadatan kelas pada suatu jenjang pendidikan.

(6)

5. Rasio Murid-Sekolah

Indikator rasio murid dengan sekolah digunakan untuk menggam-barkan rata-rata daya tampung per sekolah.

Rasio Murid_Sekolah =jumlah sekolah (20)jumlah murid

6. Angka Shift

Angka yang diperoleh memberikan gambaran tentang waktu penyelenggaraan proses belajar mengajar.

Angka Shift =jumlah rombongan belajarjumlah ruang kelas (21)

Apabila angka shift > 1, maka waktu penyeleng-garaan proses belajar mengajar tidak dilakukan pada waktu yang bersamaan (lebih dari satu kali).

2.4 Penelitian Sebelumnya

Terdapat beberapa penelitian yang telah dilakukan yang berkaitan dengan pengelompokkan kecamatan berdasarkan indikator pemerataan pendidikan, di antaranya adalah penelitian Puspowati (2009) yang meneliti pengelompokkan kecamatan di kabupaten Malang berdasarkan indikator pemerataan pendidikan. Dalam peneitiannya, Puspowati menggunakan data kecamatan di kabupaten Malang dan menggunakan metode self organizing maps (SOM). Pada penelitian saat ini akan digunakan data kecamatan di pulau Madura dan menggunakan metode hierarchical clustering via

minimax linkage. Penelitian tentang metode hierarchical clustering via minimax linkage telah

dilakukan oleh Jacob dan Tibshirani (2011). Minimax linkagememiliki beberapa kelebihan, antara lain

dendrogram dari minimax linkage tidak mempunyai susunan yang terbalik dan robust terhadap

beberapa gangguan pada dataset. Dengan demikian, pengelompokkan kecamatan di pulau Madura dengan metode hierarchical clustering via minimax linkagedapat menghasilkan kelompok-kelompok kecamatan yang memiliki homogenitastinggi.

3. Metodologi Penelitian

Data yang digunakan dalam penelitian ini adalah data sekunder mnegenai indikator pemerataan pendidikan 2010/2011 yang didapat dari Dinas Pendidikan Jawa Timur. Variabel penelitian yang digunakan yaitu APK (Angka Partisipasi Kasar), APM (Angka Partisipasi Murni), rasio murid dengan guru, rasio murid dengan kelas, rasio murid dengan sekolah, dan angka shift untuk jenjang SD, SMP, dan SMA. Variabel-variabel tersebut dihitung untuk masing-masing kecamatan di pulau Madura. Kabupaten Bangkalan memiliki 18 kecamatan, Sampang memilki 14 kecamatan, Pamekasan memiliki 13 kecamatan, dan Sumenep memiliki 27 kecamatan. Jadi, terdapat 72 kecamatan di pulau Madura.

Setelah data terkumpul dan variabel penelitian ditentukan maka langkah-langkah dalam menganalisis data adalah sebagai berikut.

1. Melakukan analisis statistika deskriptif yaitu rata-rata, varians, nilai minimum, nilai maksimum,

dan boxplotdari masing-masing variabel.

2. Membandingkan hasil pengelompokkan kecamatan di pulau Madura berdasarkan indikator pemerataan pendidikan dengan metode hierarchical clustering dengan single linkage, complete

linkage, average linkage, dan minimax linkagedan mendapatkan kecamatan di pulau Madura yang

berkelompok berdasarkan hasil pengelompokkan terbaik dengan langkah- langkah sebagai berikut. a. Mereduksi dimensi data dengan menggunakan analisis faktor. Analisis faktor juga berguna

untuk menghilangkan korelasi jika antar variabel pada data terdapat korelasi. Sebelum melakukan analisis faktor, terlebih dahulu melakukan uji KMO dan MSA serta uji Bartlett

pada data.

b. Melakukan pengelompokkan kecamatan-kecamatan di pulau Madura berdasarkan indikator pemerataan pendidikan dengan menggunakan metode hierarchical clustering dengan single

linkage, complete linkage, average linkage, dan minimax linkage.

c. Membandingkan hasil pengelompokkan dengan semua metode menggunakan nilai variance

within clusterdan variance between cluster.

(7)

3. Melakukan analisis terhadap karakteristik kecamatan hasil pengelompokkan terbaik dalam upaya pemerataan pendidikan di Pulau Madura.

4. Melakukan pengelompokkan kecamatan-kecamatan di tiap kabupaten pulau Madura dengan metode minimax linkage.

4. Analisis dan Pembahasan

Hasil analisis statistika deskriptif kecamatan-kecamatan di pulau Madura pada Tabel 1 menunjukkan bahwa nilai rata-rata tertinggi merupakan rata-rata dari variabel rasio murid dan sekolah tingkat SMA dengan nilai varians yang sangat tinggi pula yaitu 51313,60, nilai minimumnya adalah 0 dan nilai maksimumnya adalah 1263. Nilai minimum menunjukkan bahwa terdapat kecamatan di pulau Madura yang belum memiliki sekolah tingkat SMA dan nilai maksimum menunjukkan bahwa terdapat kecamatan yang memiliki jumlah murid sebanyak 1263 pada satu sekolah tingkat SMA.

Nilai minimum yang bernilai nol menunjukkan terdapat kecamatan di pulau Madura yang belum memiliki sekolah tingkat SMA dan semua kecamatan-kecamatan di pulau Madura telah memiliki sekolah tingkat SD dan SMP karena nilai minimum tidak menunjukkan angka nol.

Tabel 1 Nilai Rata-Rata, Varians, Minimum (Min), dan Maksimum (Maks) Variabel-Variabel Indikator Pemerataan Pendidikan

Variabel Rata-Rata Varians Min Maks Variabel Rata-Rata Varians Min Maks APK SD 76,46 505,99 33,32 123,59 Murid/Kelas SMP 30,62 256,71 6,16 75,52 APM SD 66,29 393,69 27,78 109,39 Murid/Sekolah SMP 174,1 17090 42 720 Murid/Guru SD 17,99 171,37 5,8 88,7 Angka shift SMP 1,25 0,24 0,46 3,5 Murid/Kelas SD 24,9 65,69 11,09 54,07 APK SMA 22,41 947,86 0 186,39 Murid/Sekolah SD 146,41 2419,12 67,21 291,13 APM SMA 14,43 467,9 0 145,69 Angka shift SD 1,15 0,14 0,8 3,6 Murid/Guru SMA 7,93 41,29 0 24,29

APK SMP 37,67 665,34 6,74 156,68 Murid/Kelas SMA 35,7 4216,31 0 532 APM SMP 25,59 419,08 2,76 121,63 Murid/Sekolah SMA 208,8 51313,6 0 1263 Murid/Guru SMP 8,33 11,6 3,07 16,09 Angka shift SMA 0,93 1,77 0 11

Keragaman data terutama adanyaoutlier pada setiap variabel indikator pemerataan pendidikan dapat diketahui melaluiboxplot. Agar keragaman dapat dilihat secara serentak, maka keragaman masing-masing variabel perlu disajikan secara bersama dalam satu diagram yaitu pada Gambar 4.1. Angk a shif t SMA Murid /Sek olah SMA Murid /Kela s SMA Murid /Guru SMA APM SMA APK SMA Angk ash iftSM P Murid /Sek olah SMP Murid /Kela s SM P Murid /Gur uSM P APM SMP APK SMP Angk a shif t SD Murid /Sek olah SD Murid /Kelas SD Murid /Gur uSD APM SD APK SD 8 6 4 2 0 -2 D a ta

Gambar 1 BoxplotVariabel-Variabel Indikator Pemerataan Pendidikan di Kecamatan-Kecamatan Pulau Madura

Outlier yang paling banyak terdapat pada variabel APM dan angka shift tingkat SMP. Pada

(8)

pengamatan yang outlier, akan tetapi jumlahnya tidak sebanyak pada variabel APM dan angka shift tingkat SMP.

4.1 Analisis Faktor pada Variabel-Variabel Indikator Pemerataan Pendidikan

Uji kecukupan data secara keseluruhan yang digunakan adalah Kaiser-Meyer-Olkin (KMO). Hipotesis dari KMO adalah sebagai berikut :

H0: Jumlah data indikator pemerataan pendidikan cukup untuk difaktorkan H1 : Jumlah data indikator pemerataan pendidikan tidak cukup untuk difaktorkan

Pengujian kecukupan data keseluruhan dapat dilakukan dengan menggunakan persamaan 1 sehingga diperoleh nilai KMO sebesar 0,670, jadi dapat disimpulkan bahwa asumsi kecukupan data indikator pemerataan pendidikan keseluruhan telah terpenuhi dan data indikator pemerataan pendidikan pada kecamatan-kecamatan di pulau Madura cukup untuk difaktorkan.

Pengujian kecukupan data pada masing-masing variabel indikator pemerataan pendidikan dapat dilakukan dengan menggunakan persamaan 1. Hasil perhitungan nilai MSA (Tabel 2) yang telah dilakukan menghasilkan nilai MSA yang lebih besar dari 0,5 untuk semua variabel indikator pemerataan pendidikan, maka hasil uji MSA terpenuhi oleh masing-masing variabel.

Tabel 2Uji Kecukupan Data pada Masing-Masing Variabel Indikator Pemerataan Pendidikan

No Variabel MSA No Variabel MSA

1 APK SD 0,656 10 Murid/Kelas SMP 0,682

2 APM SD 0,67 11 Murid/Sekolah SMP 0,756 3 Murid/Guru SD 0,781 12 Angka shift SMP 0,469

4 Murid/Kelas SD 0,75 13 APK SMA 0,586

5 Murid/Sekolah SD 0,731 14 APM SMA 0,589 6 Angka shift SD 0,653 15 Murid/Guru SMA 0,725

7 APK SMP 0,64 16 Murid/Kelas SMA 0,598

8 APM SMP 0,609 17 Murid/Sekolah SMA 0,694 9 Murid/Guru SMP 0,839 18 Angka shift SMA 0,522 Uji korelasi yang digunakan adalah uji Bartlett dengan hipotesis :

H0: Matriks korelasi data indikator pemerataan pendidikan merupakan matriks identitas H1: Matriks korelasi data indikator pemerataan pendidikan bukan matriks identitas

Uji korelasi data indikator pemerataan pendidikan yang telah dilakukan menghasilkan nilai

P-value sebesar 0,000. Maka dapat dikatakan bahwa antar variabel pada data indikator pemerataan

pendidikan di kecamatan-kecamatan pulau Madura saling berkorelasi.

Cara untuk menentukan jumlah faktor yang tepat untuk mewakili variabilitas data indikator pemerataan pendidikan yaitu dengan mengidentifikasi nilai eigenvalue pada gambar scree plot. Gambar scree plotyang dihasilkan dapat dilihat pada Gambar 2.

18 16 14 12 10 8 6 4 2 6 5 4 3 2 1 0 Fa ct o r Numbe r Ei ge nv a lu e 1 0 .0 0 2 9 8 0 .0 0 9 9 4 0 .0 3 2 4 3 0 .0 4 6 3 9 0 .0 5 7 9 5 0 .0 8 9 9 9 0 .1 3 0 0 2 0 .2 0 9 5 0 0 .2 6 5 0 6 0 .4 0 4 6 2 0 .6 3 1 3 4 0 .8 3 2 5 4 0 .8 9 8 6 3 1 .0 6 5 4 1 1 .2 6 6 4 9 2 .2 6 1 0 3 3 .9 6 6 7 2 5 .8 2 8 9 5

Gambar 2 Scree Plot Variabel-Variabel Indikator Pemerataan Pendidikan di Kecamatan-Kecamatan Pulau Madura

(9)

Pada Gambar 2 dapat diketahui bahwa jumlah faktor yang tepat untuk mewakili variabel indikator pemerataan pendidikan di kecamatan-kecamatan pulau Madura yaitu sebanyak lima faktor. Penggunaan lima faktor akan mewakili 79,9 % variabilitas data.

Pembagian variabel-variabel ke dalam kelompok faktor tertentu dilakukan dengan memilih nilai loadingfaktor terbesar antara loading faktor 1, 2, 3, 4, dan 5. Loading faktor yang digunakan adalah loadingfaktor yang telah dirotasi varimax. Nilai loadingfaktor yang telah dirotasi varimax dan yang telah diurutkan berdasarkan nilai loadingfaktor terbesar dapat dilihat pada Tabel 3.

Tabel 3Nilai LoadingFaktor dengan Rotasi Varimax

Variabel Faktor 1 Faktor 2 Faktor 3 Faktor 4 Faktor 5

APK SD 0,928 -0,077 -0,078 -0,023 -0,077 APM SD 0,926 0,001 -0,011 -0,101 -0,052 Murid/Guru SD 0,882 0,069 0,171 0,054 0,167 Murid/Kelas SD 0,881 0,08 0,216 0,032 0,146 Murid/Sekolah SD 0,81 -0,184 -0,291 0,095 -0,013 Angka shift SD 0,005 0,916 0,191 0,032 0,002 APK SMP -0,015 0,916 0,214 0,01 0,002 APM SMP -0,028 0,691 0,246 -0,3 -0,038 Murid/Guru SMP -0,077 0,573 0,234 -0,571 -0,244 Murid/Kelas SMP 0,018 0,417 0,794 -0,056 -0,118 Murid/Sekolah SMP -0,003 0,415 0,791 -0,066 -0,086 Angka shift SMP -0,174 0,345 0,737 -0,191 -0,273 APK SMA -0,059 0,426 0,72 -0,071 0,038 APM SMA -0,184 0,173 -0,492 0,082 -0,057 Murid/Guru SMA 0,001 0,048 0,118 -0,946 -0,167 Murid/Kelas SMA 0,014 0,064 0,082 -0,944 -0,092 Murid/Sekolah SMA 0,011 -0,029 -0,067 -0,13 -0,898 Angka shift SMA -0,149 0,138 0,399 -0,244 -0,773

Keterangan : angka yang dicetak tebal merupakan nilai tertinggi dari masing-masing loading faktor

Penentuan variabel akan dikelompokkan pada faktor 1, 2, 3, 4 atau 5 berdasarkan nilai mutlak

loadingfaktor terbesar dari masing-masing variabel. Faktor 1 dapat disebut sebagai faktor murid SD,

sedangkan faktor 2 dapat diberi nama faktor murid SMP. Faktor 3 disebut faktor fasilitas SMP dan faktor 4 disebut faktor murid SMA, serta faktor 5 disebut faktor fasilitas SMA.

4.2 Analisis Clusterpada Kecamatan-Kecamatan di Pulau Madura

Hasil dendrogrampada pengelompokkan kecamatan-kecamatan di pulau Madura menjadi satu kelompok dengan metode single linkage, complete linkage, average linkage, dan minimax linkage

yaitu sebagai berikut.

(10)

(c) (d)

Gambar 3 Dendrogram Single Linkage(a), Complete Linkage (b), Average Linkage (c), Minimax Linkage (d) Kecamatan-Kecamatan Pulau Madura

Pada Gambar 3 dapat dilihat bahwa kecamatan yang bergabung terakhir adalah kecamatan Camplong (22) kabupaten Sampang. Minimax linkage adalah pengelompokkan berdasarkan nilai minimum dari jarak yang maksimum. Dendrogram dari metode minimax linkage memiliki susunan yang lebih teratur jika dibandingkan dengan dendrogramdari metode single, complete, dan average

linkage.

Cluster yang ideal mempunyai Vw2 minimum yang mempresentasikan internal homogeneity

dan maksimum Vb2yang menyatakan external homogeneity. Perbandingan nilai Vw2yang minimum dan nilai Vb2 yang maksimum menghasilkan suatu nilai varianceyang minimum. Pemilihan metode

cluster terbaik dilakukan dengan menentukan peringkat pada setiap jumlah cluster yang terbentuk

pada keempat metode berdasarkan nilai varianceyang terkecil. Jumlah peringkat pada metode single,

complete, average, dan minimax linkagedapat dilihat pada Tabel 4.

Tabel 4Jumlah Peringkat Atas dan Bawah pada Metode Single, Complete, Average, dan Minimax Linkage

Peringkat Metode Pengelompokkan

Single Complete Average Minimax

Atas 36,62% 60,56% 74,65% 77,46% a

Bawah 63,38% 39,44% 25,35% 22,54%

Keterangan : amerupakan jumlah peringkat atas terbanyak

Metode minimax linkage merupakan metode terbaik daripada metode single, complete, dan

average linkagekarena memiliki jumlah peringkat atas terbanyak yaitu sebanyak 77,46% dan jumlah

peringkat bawah sebanyak 22,54%. Setelah itu, dilakukan penentuan jumlah clusteroptimum dengan pergerakan variance pola valley-tracing. Nilai variance yang digunakan merupakan hasil perbandingan variance within cluster(Vw2) dan variance between cluster(Vb2). Perbedaan nilai tinggi (∂) pada tiap jumlah clusterdengan metode minimax linkage ditampilkan pada Gambar 4.

(11)

80 70 60 50 40 30 20 10 0 0.050 0.025 0.000 -0.025 -0.050 -0.075 -0.100 jumlah cluster b e d a ti n g g i 3 0.037

Gambar 4Perbedaan Nilai Tinggi pada Tiap Jumlah Clusterdengan Metode Minimax Linkage

Perbedaan nilai tinggi yang maksimum yaitu ketika jumlah cluster sebanyak 3 dengan perbedaan nilai tinggi sebesar 0,037. Hal ini berarti bahwa jumlah cluster yang optimum pada pengelompokkan kecamatan-kecamatan berdasarkan indikator pemerataan pendidikan dengan metode

minimax linkage yaitu sebanyak 3 cluster. Keakuratan dari suatu metode pembentukan cluster pada

hierarchical methodmenggunakan valley-tracingdapat diketahui dengan menggunakan persamaan 15,

didapatkan nilai φ yaitu -0,378. Nilai φ yang bertanda negatif berarti global optimum yang ditentukan telah benar dan clusteryang terbentuk terpisah dengan baik.

4.3 Analisis Karakteristik Tiap Kelompok Kecamatan-Kecamatan di Pulau Madura

Hasil pengelompokkan dengan metode minimax linkagemenghasilkan jumlah kelompok yang optimum yaitu sebanyak 3 kelompok .Tiap kelompok memiliki karakteristik yang berbeda-beda. Kelompok 1 terdiri dari kecamatan Camplong kabupaten Sampang. Kecamatan Camplong memiliki nilai angka shift > 1. Hal ini berarti bahwa waktu penyelenggaraan proses belajar mengajar tidak dilakukan pada waktu yang bersamaan (lebih dari satu kali). Kebijakan yang sesuai untuk kecamatan Camplong yaitu penambahan ruang kelas untuk pendidikan tingkat SMA. Kelompok 2 terdiri dari kecamatan Kota Sumenep kabupaten Sumenep. Kota Sumenep merupakan kecamatan yang memiliki nilai-nilai tinggi untuk tiap variabel indikator pemerataan pendidikan sehingga dapat dijadikan contoh. Kelompok 3 terdiri dari kecamatan-kecamatan di pulau Madura selain kecamatan Camplong dan Kota Sumenep. Secara umum, kelompok 3 memiliki karakteristik yaitu variabel-variabel indikator pemerataan pendidikan tingkat SMA memiliki nilai varians yang cukup tinggi sehingga fasilitas untuk jenjang pendidikan SMA perlu ditingkatkan dalam upaya pemerataan pendidikan tingkat kecamatan. 4.4 Pengelompokkan Kecamatan-Kecamatan Tiap Kabupaten di Pulau Madura

Pengelompokkan kecamatan-kecamatan tiap kabupaten di pulau Madura menggunakan metode minimax linkage. Penentuan jumlah kelompok yang optimum pada masing-masing kebupaten menggunakan valley-tracing. Perbedaan nilai tinggi (∂) pada tiap jumlah cluster dengan metode

minimax linkage ditampilkan pada Gambar 5.

14 12 10 8 6 4 2 0.10 0.05 0.00 -0.05 -0.10 -0.15 jumlah cluste r b e d a ti n g g i 4 0.1009 (a) (b) 18 16 14 12 10 8 6 4 2 0 0.10 0.05 0.00 -0.05 -0.10 -0.15 -0.20 -0.25 jumlah clust er b ed a ti ng gi 3 0.1098

(12)

25 20 15 10 5 0 0.02 0.01 0.00 -0.01 -0.02 -0.03 -0.04 -0.05 -0.06 jumlah cluster b e d a ti n g g i 4 0.0172 (c) (d)

Gambar 5 Perbedaan Nilai Tinggi pada Tiap Jumlah Clusterpada Pengelompokkan di Bangkalan (a), Sampang (b), Pamekasan (c), dan Sumenep (d)

Pada Gambar 5 dapat dilihat bahwa jumlah clusteryang optimum pada kabupaten Bangkalan yaitu sebanyak 3 kelompok dengan nilai keakuratan yaitu sebesar -0,4482, pada kabupaten Sampang sebanyak 4 kelompok dengan nilai keakuratan -1,3212, pada kabupaten Pamekasan sebanyak 3 kelompok dengan nilai keakuratan -0,5116, dan pada kabupaten Sumenep sebanyak 4 kelompok dengan nilai keakuratan 8,887. Hal ini berarti bahwa cluster yang terbentuk pada tiap kabupaten di pulau Madura telah terpisah dengan baik.

5. Kesimpulan

Hasil analisis dan pembahasan yang telah dilakukan pada penelitian ini memperoleh kesimpulan yaitu varians tertinggi terdapat pada variabel rasio murid dengan sekolah tingkat SMA dan SMP yang berarti bahwa terdapat kesenjangan yang cukup tinggi antar kecamatan dan metode

minimax linkage merupakan metode pengelompokkan terbaik dengan jumlah kelompok optimum

sebanyak 3 dan hasil pengelompokkan kecamatan di pulau Madura sebagai berikut. Kelompok 1 : kecamatan Camplong kabupaten Sampang.

Kelompok 2 : kecamatan Kota Sumenep kabupaten Sumenep.

Kelompok 3 : kecamatan-kecamatan di pulau Madura selain kecamatan Camplong dan Kota Sumenep.

Karakteristik kecamatan-kecamatan di pulau Madura berdasarkan kelompok yaitu : kelompok 1 memiliki nilai angka shift untuk pendidikan jenjang SMA yang cukup tinggi sehingga perlu adanya penambahan ruang kelas untuk pendidikan tingkat SMA, kelompok 2 memiliki nilai-nilai tinggi untuk tiap variabel indikator pemerataan pendidikan sehingga dapat dijadikan contoh oleh kecamatan lain, dan kelompok 3 memiliki nilai varians yang cukup tinggi untuk variabel-variabel indikator pemerataan pendidikan tingkat SMA sehingga fasilitas untuk jenjang pendidikan SMA perlu ditingkatkan. Hasil pengelompokkan kecamatan di kabupaten Bangkalan dengan metode minimax linkage dan

valley-tracing menghasilkan jumlah kelompok yang optimum sebanyak 3 kelompok, kabupaten Sampang

sebanyak 4 kelompok, kabupaten Pamekasan sebanyak 3 kelompok, dan kabupaten Sumenep sebanyak 4 kelompok.

6. Saran

Agar mendapatkan karakteristik pendidkan yang lebih lengkap, disarankan untuk melakukan survei langsung mengenai kualitas pendidikan untuk tiap kecamatan. Penggunaan berbagai cara untuk membandingkan metode pengelompokkan perlu dilakukan agar hasil yang didapat lebih optimal. 7. Daftar Pustaka

Arai, K., Barakbah, A.R. 2007. Cluster Construction Method Based on Global Optimum Cluster Determination with The Newly Defined Moving Variance. Reports of the Faculty of Science

and Engineering, Saga University. 36(1) : 9-15

Bien, J. dan Tibshirani, R. 2011. Hierarchical Clustering With Prototype via Minimax Linkage.

Journal of the American Statistical Association

12 10 8 6 4 2 0.050 0.025 0.000 -0.025 -0.050 -0.075 -0.100 jumlah cluste r b e d a ti n g g i 3 0.0482

(13)

Dillon, W., Goldstein, M. 1981. Multivariate Analysis Methods and Application. Canada : John Wiley and Sons, Inc

Fisher, L., Van Ness, J. 1971. Admissible Clustering Procedures. Biometrica58(1) : 91-104

Gordon, A.D. 1987. A Review of Hierarchical Classification. Journal of Royal Statistical Society, Ser.

A 150(2) : 119-137

Hair, J. F., Black, W.C., Babin, B.J., Anderson, R.E. 2010. Multivariate Data Analysis. New Jersey : Upper saddle river

Johnson, R.A., Winchern, D.W. 2007. Applied Multivariate Statistical Analysis. USA : Pearson Education International

Man L, Chew Lim T, Jian S, Yue L. 2009. Supervised and Traditional Term Weighting Methods for Automatic Text Categorization. Pattern Analysis and Machine Intelligence, IEEE

Transactions on. 31(4) : 721-735

Martiana, E., Rosyid, N., Agusetia, U. 2010. Mesin Pencari Dokumen dengan Pengklasteran secara Otomatis. TELKOMNIKA8(1) : 41-48

Morrison, D.F. 2005. Multivariate Statistical Methods Fourth Edition. USA : Thomson Learning, Inc Murtagh, F. 1983. A Survey of Recent advances in Hierarchical Clustering Algorithms. The Computer

Journal26 : 354-359

Noor, M. H., Hariadi, M. 2009. Image Cluster Berdasarkan Warna untuk Identifikasi Kematangan Buah Tomat dengan Metode Valley Tracing. Seminar Nasional Informatika 2009

Norusis, M.J. 1986. Advanced Statistics SPSS/PC+ for the IBM PC/XT/AT. Michigan Avenue Chicago Illinois

Purwaningsih, A. 2004. Penentuan Rotasi yang Sesuai dalam Analisis Faktor dengan Analisis Procrustes. Pusat Pengembangan Teknologi Informasi dan Komputasi, BATAN

Puspowati, T. 2009. Algoritma Self Organizing Maps (SOM) untuk Pengelompokkan Kecamatan di

Kabupaten Malang berdasarkan Indikator Pemerataan Pendidikan[tesis]. Surabaya : Jurusan

Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Teknologi Sepuluh Nopember

Gambar

Gambar 1 Boxplot Variabel-Variabel Indikator Pemerataan Pendidikan di Kecamatan-Kecamatan Pulau Madura Outlier yang paling  banyak  terdapat  pada variabel APM  dan  angka  shift  tingkat  SMP
Tabel 2 Uji Kecukupan Data pada Masing-Masing Variabel Indikator Pemerataan Pendidikan
Tabel 3 Nilai Loading Faktor dengan Rotasi Varimax
Gambar 3 Dendrogram Single Linkage (a), Complete Linkage (b), Average Linkage (c), Minimax Linkage  (d)  Kecamatan-Kecamatan Pulau Madura
+3

Referensi

Dokumen terkait

Sehingga diperlukanperspektif alternatif untuk studi atau penelitian tentang gender di masamendatang dengan memperhatikan heterogenitas perempuan diIndonesia baik dari

Akan tetapi, biarpun kelihatannya lambat, Gwat Kong maklum bahwa pedang di tangan kiri inilah yang paling berbahaya di antara kedua pedang itu, karena kelambatan dan kelemasan

Menanggapi hal tersebut, maka tertarik untuk diteliti “pengaruh pendidikan kesehatan melalui metode ceramah dengan metode diskusi terhadap pengetahuan dan sikap

Sejak BPTP berdiri lebih dari 10 tahun yang lalu, maka telah banyak teknologi inovasi yang didiseminasikan melalui berbagai macam media, yaitu media elektronika, cetak, kegiatan

Konsultasi dengan pihak yang berkepentingan adalah salah satu bagian yang paling penting dalam proses sertifikasi; dalam konsultasi tersebut, pihak yang berkepentingan baik

Jakarta: Dept Pulmonologi & Ilmu Kedokteran Respirasi FKUI (Perhimpunan Dokter Paru Indonesia).. Asma Pedoman Diagnosis & Penatalaksanaan di

kesempatan bagi pendidik utama untuk melakukan pendekatan individual kepada siswa, mengatur kegiatan secara efektif, dan mengamati pembelajaran seluruh siswa di kelas. Asisten

perusahan ini yang nantinya saya gunakan untuk mendukung data skripsi kami dan juga untuk menjadi bahan referensi untuk perubahan website bapak.yang saya mau tanya seperti apa