Abstrak— Indeks Pembangunan Manusia (IPM) merupakan salah satu indeks komposit yang digunakan untuk mengukur pembangunan manusia dalam tiga dimensi kehidupan yaitu dimensi kesehatan yang diukur dari rata-rata lama sekolah serta dimensi ekonomi yang diukur dari tingkat kehidupan yang layak (kesejahteraan) secara keseluruhan. Pengujian tentang asumsi distribusi multivariat normal satu populasi serta menguji nilai perbedaan rata-rata antar populasi pengamatan menggunakan uji T2 Hotelling untuk data satu populasi dan dua
populasi. Pengamatan ini akan dilakukan pada data pada data faktor-faktor yang mempengaruhii IPM tahun 2007. Indikator yang digunakan adalah posentase penduduk yang tinggal di daerah perkotaan, prosentase pendudukyan berpendidikan diatas SLTP, dan prosentase penduduk miskin. Sumber data berasal dari data Tesis mahasiswa. Hasil analisis dengan pengujian normal univariat dan multivariat pada data pengamatan tersebut dapat disimpulkan bahwa data tidak berdistribusi multivariat normal namun diasumsikan berdistribusi multivariat normal. Pengujian vektor mean satu populasi, faktor-faktor yang mempengaruhi IPM provinsi Jawa Timur didapatkan hasil bahwa mean populasi untuk faktor-faktor tersebut berbeda, dan dalam pengujian vektor mean dua populasi didapatkan hasil bahwa rata-rata populasi dari faktor-faktor yang mempengaruhi IPM di Jawa Timur dan Jawa Barat tidak berbeda nyata.
Kata Kunci— Homogenitas, IPM, uji asumsi multivariat normal T2 Hotelling
I. PENDAHULUAN
embangunan manusia merupakan paradigma pembagunan yang menempatkan manusia sebagai fokus dan sasaran akhir dari seluruh kegiatan pembangunan, yaitu untuk tercapainya penguasaan atas sumber daya, guna memperoleh pendapatan untuk mencapai hidup layak dan peningkatan pendidikan terutama dalm kemampuan baca tulis dan keterampilan untuk dapat berpartisipasi dalam masyarakat dan kegiatan ekonomi. Untuk mengetahui perkembangan mengenai kualitas pembangunan manusia, pada tahun 1990 United Nations (PBB) memperkenalkan Indeks Pembangunan Manusia (IPM). Menurut Badan Pusat Statistika (BPS) IPM merupakan indeks komposit yang digunakan sebagai alat untuk mengukur atau mengntrol perkembangan pembagunan sosial-ekonomi yang dipresentasikan oleh 3 dimensi, yaitu angka harapan hidup, pencapaian pendidikan dan paritas daya beli.
IPM dapat digunakan untuk mengukur kinerja pembagunan
manusia. Namaun demikian perlu disadari bahwa IPM (sebagai indeks komposit) hanya dapat memperlihatkan perbandingan antar daerah (provinsi atau kabupaten/kota) dan perkembangan antar waktu. Karena itu, perlu juga dilihat komponen-komponen yang membentuk IPM tersebut sehingga diketahui pencapaian dari komponen secara simultan. Untuk mengamati indikator-indikator beberapa komponen IPM tersebut dengan menggunakan pengujian normal multivariat yang merupakan salah satu teknik statistik yang digunakan untuk mengetahui apakah data tersebut berasal dari distribusi normal multivariat. Pengujian tentang perbedaan antar populasi pengamatan menggunakan T2 Hotelling pada data
satu populasi dan dua populasi. Pengamatan kali ini akan dilakukan pada data faktor-faktor yang mempengaruhi IPM tahun 2007.
II. TINJAUANPUSTAKA A. Statistika Deskriptif
Statistika deskriptif adalah metode-metode yang berkaitan dengan pengumpulan dan penyajian suatu gugus data sehingga memberikan informasi yang berguna.
Mean adalah salah satu ukuran untuk memberikan gambaran yang lebih jelas dan singkat tentang sekumpulan data. Mean juga merupakan wakil dari sekumpulan data atau dianggap suatu nilai yang paling dekat dengan hasil pengukuran yang sebenarnya.
Rumus yang digunakan untuk menghitung mean data adalah :
n
i i x n x
1
1 (1) Keterangan:
xi = data pengamatan ke-i
n = banyaknya data
Standar deviasi merupakan akar kuadrat dari varians. Rumus yang digunakan untuk menghitung nilai standar deviasi adalah :
1 1
2
n n
i x i x
s (2)
Keterangan : s = standar deviasi
Pengujian Normal Multivariat T
2
Hotteling pada
Faktor-Faktor yang Mempengaruhi IPM di Jawa
Timur dan Jawa Barat Tahun 2007
Dedi Setiawan, Zuyyin Inesa Pratiwi, Devi Lindasari, dan Santi Puteri Rahayu
Jurusan Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam,
Institut Teknologi Sepuluh Nopember (ITS)
Jl. Arief Rahman Hakim, Surabaya 60111 Indonesia
e-mail:devilindasari13@gmail.com,sprahayu@gmail.com
xi = nilai tengah
x = rata-rata n = banyak data
Minimum adalah nilai terendah dari suatu data. Sedangkan maksimum adalah nilai tertinggi dari suatu data.[1]
B. Distribusi Normal Multivariate
Variabel X1,X2,...,Xp dikatakan berditribusi normal
multivariat dengan parameter μ dan Ʃ jika mempunyai probability density function :
)
pemeriksaan distribusi multinormal dapat dilakukan dengan cara membuat q-q plot dari nilai di2= (Xi-x)'S-1(Xi-x),
i= 1,...,n.[2]
Tahapan dari pembuatan q-q plot ini adalah sebagai berikut. 1. Menentukan nilai vektor rata-rata :
x
2. Menentukan nilai matriks varians-kovarians : S
3. Menentukan nilai jarak Mahalanobis setiap titik pengamatan dengan vektor rata-ratanya di2= (Xi-x)'S-1(Xi-x), i= 1,...,n
6. Tentukan nilai
q
i sedemikian hinggai
Pada Proporsi Square Distance menggunakan pemeriksaan data berdistribusi multivariat normal jika prosentase di2≤ χ2p,0.5
mendekati 50%.
Pemeriksaan distribusi normal multivariat juga dapat dilakukan secara visual dengan melihat pola sebaran data pada scatterplot antara nilai Square Distance (
d
2j ) dengan nilai dapat diputuskan data berdistribusi normal multivariat, apabila tidak maka dapat dikatakan data tidak berdistribusi normal multivariat.[2]Selain menggunakan kedua metode diatas pengujian distribusi multivariat biasa menggunakan uji korelasi untuk menguji tingkat signifikansi. Uji ini dilakukan dengan mengkorelasikan antara nilai dj2 dengan nilai qc,p. Uji ini
dilakukan untuk melihat apakah data distribusi normal multivariat atau tidak.[1]
Hipotesis :
H0 : Data berdistribusi normal nultivariat
H1 : Data tidak berdistribusi normal nultivariat
Daerah Penolakan : Tolak H0 jika rq<rp,a
Statistik Uji :
r = Koefisien Korelasi n = Jumlah Data C. Pengujian T-Test
Dalam analisis multivariat, uji vector mean 1 populasi dimaksudkan untuk melihat ada atau tidak adanya perbedaan vektor rata-rata dari 1 populasi yang mewakili oleh sampel yang diukur dari beberapa variabel-variabel dengan vektor mean dugaan.[2]
Hipotesis : H0 : µ1 = µ2
H1 : µ1≠ µ2
Daerah Penolakan : Tolak H0, T2>(n-1)p/(n-p).Fp,(n-p),α
Statistik Uji :
xμ0
S xμ0
Pengujian T2 Hotelling digunakan untuk mengetahui
apakah ada perbedaan rata-rata antar variabel pengamatan. Uji T2 Hotelling digunakan untuk data multivariat atau memiliki
dua atau lebih populasi pengamatan. [2] Hipotesis :
sehingga pada akhirnya akan meningkatkan mutu hidup dalam arti hidup layak.[3]
III. METODOLOGI PENELITIAN A. Sumber Data
Sumber data yang digunakan dalam penelitian ini merupakan data sekunder. Data sekunder yang diperoleh dari
Tesis mahasiswa dengan judul “Uji Kesamaan Vektor Parameter Model Regresi Multivariate, Studi Kasus :
Faktor-faktor yang Mempengaruhi IPM Tahun 2007” oleh Rita Diana
(1308 201 030). Pengambilan data dilakukan pada hari Jumat, 24 Februari 2017 pada pukul 09.15 WIB sampai selesai di Ruang Baca Statistika ITS.
B. Variabel Penelitian
Variabel penelitian yang digunakan dalam penelitian ini adalah mengenai data faktor-faktor yang mempengaruhi IPM tahun 2007 untuk masing-masing provinsi Jawa Timur dan Jawa Barat sebagai berikut.
Tabel 1.
Variabel Penelitian yang Digunakan
Variabel Keterangan
Y1 Prosentase penduduk yang tinggal di daerah perkotaan
Y2 Prosentase penduduk yang berpendidikan diatas SLTP
Y3 Prosentase penduduk miskin
C. Langkah Analisis
Langkah-langkah analisis yang digunakan dalam penelitian ini adalah sebagai berikut.
1. Mencari data sekunder multivariat yang terdiri atas dua populasi dan tiga variabel,
2. Menginputkan data faktor-faktor yang mempengaruhi IPM tahun 2007,
3. Melakukan pengujian distribusi normal multivariate pada data faktor-faktor yang mempengaruhi IPM tahun 2007 untuk provinsi Jawa Timur,
4. Melakukan uji T2 Hotelling’s pada data faktor-faktor yang
mempengaruhi IPM tahun 2007 untuk provinsi Jawa Timur, 5. Melakukan uji T2 Hotelling’s pada data faktor-faktor yang
mempengaruhi IPM tahun 2007 untuk kedua provinsi Jawa Timur dan Jawa Barat.
6. Menarik kesimpulan berdasarkan analisis yang telah dilakukan.
IV. HASIL DAN PEMBAHASAN A. Statistika Deskriptif
Pada tahun 2007 IPM (Indeks Pembangunan Manusia) Provinsi Jawa Timur sebesar 69.78 dan untuk Jawa Barat sebesar 70,71[3]. Beberapa faktor-faktor yang Mempengaruhi tinggi rendahnya IPM di suatu wilayah diantaranya adalah prosentase penduduk yang tinggal di darah perkotaan (Y1),
prosentase penduduk yang berpendidikan diatas SLTP (Y2)
dan juga prosentase penduduk miskin (Y3). Berikut
karakteristik data untuk masing-masing variabel yang mempengaruhi IPM di Jawa Timur dan Jawa Barat.
Tabel 2.
Statistika Deskriptif Variabel yang Mempengaruhi IPM di Jawa Timur dan Jawa Barat
Provinsi Variabel Mean Stdev Min Maks Jawa
Timur
Y1 44,76 30,25 9,33 100,00 Y2 39,30 12,87 12,64 66,50 Y3 20,09 7,12 7,07 39,42 Jawa
Barat
Y1 46,92 27,63 14,57 100,00 Y2 37,40 11,35 21,82 62,77 Y3 19,31 7,15 5,16 32,29
Berdasarkan Tabel 2 diatas dapat diketahui bahwa untuk variabel prosentase penduduk yang tinggal di daerah perkotaan (Y1) provinsi Jawa Timur memiliki rata-rata yang lebih rendah
dibandingkan dengan Jawa Barat, namun memiliki standar deviasi yang lebih tinggi artinya data untuk variabel Y1 di Jawa
Timur lebih heterogen dibandingkan dengan Jawa Barat. Untuk variabel prosentase penduduk yang berpendidikan diatas SLTP (Y2) provinsi Jawa Timur memiliki rata-rata lebih
tinggi dibandingkan dengan provinsi Jawa Barat, dan juga memiliki standar deviasi yang lebih tinggi itu berarti bahwa di Jawa Timur untuk variabel Y2 sangat heterogen. Sedangkan,
untuk variabel prosentase penduduk miskin (Y3) provinsi Jawa
Timur memiliki rata-rata dan juga standar deviasi yang lebih tinggi dibanding dengan provinsi Jawa Barat itu berarti bahwa untuk variabel ini Jawa Barat lebih homogen dibandingkan dengan Jawa Timur. Secara keseluruhan untuk nilai rata-rata faktor yang mempengaruhi IPM untuk Jawa timur lebih unggul dibandingkan dengan Provinsi Jawa Barat, namun untuk data Jawa Timur lebih heterogen.
B. Pengujian Normalitas
Untuk dapat dilanjutkan untuk analisis Hotelling’s T2 (uji
vektor mean) maka data mengikuti distribusi normal multivariate (diasumsikan). Data faktor-faktor yang mempengaruhi Indeks Pembangunan Manusia (IPM) provinsi Jawa Timur tahun 2007, selanjutnya akan dianalisis apakah data tersebut berasal dari populasi yang berdistribusi normal multivariate atau tidak. Pengujian dialakukan dengan tiga (3) metode yaitu proporsi square distance, plot chi-square, dan koefisien korelasi, hasil analisis akan dijelaskan pada pembahasan dibawah ini.
1. Proporsi Square Distance
Pemeriksaan distribusi normal multivariate dapat di-lakukan menggunakan proporsi Square Distance. Data dikatakan mengikuti distribusi normal multivariate jika nilai
p
berada di sekitar 0,5. Perhitungan Square Distance diapat dilihat pada lampiran. Berikut ini adalah hasil pengujian distribusi normal multivariate menggunakan proporsi Square Distance pada data faktor-faktor yang mempengaruhi IPM di Jawa Timur 2007, perhitungan menggunakan macro minitab dengan syntax pada lampiran 2 dan hasil dapat dilihat pada lampiran 4.
Manusia (IPM) provinsi Jawa Timur tahun 2007 tidak mengikuti distribusi normal multivariate.
2. Plot Chi-square
Pemeriksaan distribusi normal multivariat juga dapat dilakukan secara visual dengan melihat pola sebaran data pada scatterplot antara nilai Square Distance (
d
2j) dengan nilai,
c p
q untuk output
,
c p
q dapat dilihat pada lampiran 3. Berikut ini adalah hasil pengujian distribusi normal multivariate menggunakan scatterplot pada data faktor-faktor yang mempengaruhi Indeks Pembangunan Manusia (IPM) provinsi Jawa Timur tahun 2007 tidak mengikuti distribusi normal multivariate.
12 10 8 6 4 2 0 12
10
8
6
4
2
0
qc
d
j2
Gambar 1. Pengujian Normal multivariate Menggunakan Scatterplot
Berdasarkan Gambar 1 di atas terlihat bahwa titik-titik pada scatterplot tidak mengikuti garis normal (membentuk garis lurus), sehingga dapat disimpulkan bahwa data faktor-faktor yang mempengaruhi Indeks Pembangunan Manusia (IPM) provinsi Jawa Timur tahun 2007 tidak mengikuti distribusi normal multivariate.
3. Koefisien Korelasi
Uji korelasi digunakan untuk menguji tingkat signifikansi dengan cara mengkorelasikan nilai Square Distance (
d
2j) dengan nilai, c p q . Hipotesis :
H0 : Data faktor-faktor yang mempengaruhi Indeks
Pembangunan Manusia (IPM) provinsi Jawa Timur tahun 2007, mengikuti distribusi normal multivariate H1 : Data faktor-faktor yang mempengaruhi Indeks
Pembangunan Manusia (IPM) provinsi Jawa Timur tahun 2007, tidak mengikuti distribusi normal multivariate
Dengan menggunakan taraf signifikan 5% , maka dapat diperoleh daerah kritis atau tolak H0 saat r < r(35;0,05) (0,968).
Berdasarkan perhitungan korelasi pearson diperoleh nilai korelasi sebesar 0,941. Sehingga dapat diputuskan bahwa Tolak H0, sehingga dapat disimpulkan bahwa sehingga dapat
disimpulkan bahwa data faktor-faktor yang mempengaruhi Indeks Pembangunan Manusia (IPM) provinsi Jawa Timur tahun 2007 tidak mengikuti distribusi normal multivariate.
Ketiga metode diatas memberikan hasil yang sama yaitu data faktor-faktor yang mempengaruhi Indeks Pembangunan Manusia (IPM) provinsi Jawa Timur tahun 2007 tidak mengikuti distribusi normal multivariate. Namun pada kasus ini data diasumsikan mengikuti distribusi normal multivariate.
C. Uji Vektor Mean Satu Populasi
Uji vektor mean satu populasi digunakan untuk menguji hipotesis rata-rata vektor dari populasi. Berikut dilakukan pengujian hipotesis untuk data faktor-faktor yang mempengaruhi IPM di Jawa Timur, dengan hipotesis yaitu; Hipotesis:
Dengan menggunakan taraf signifikan 5% , maka dapat diperoleh daerah kritis atau tolak H0 saat T2 > c2 (9,24732).
Berdasarkan perhitungan (lampiran 7) nilai T2 diperoleh
83,8729, sehingga dapat disimpulkan bahwa minimal ada satu rata-rata dari variabel-variabel yang mempengaruhi IPM provinsi Jawa Timur tahun 2007 berbeda dengan hipotesis. D. Uji Vektor Mean Dua Populasi
Uji hipotesis vektor mean dua populasi digunakan untuk mengetahui apakah ada atau tidak perbedaan vektor mean populasi antara variabel-variabel yang mempengaruhi IPM di Jawa Timur dengan provinsi Jawa Barat. Populasi satu adalah provinsi Jawa Timur dan populasi dua adalah provinsi Jawa Barat. Dalam pengujian ini data diasumsikan berdistribusi normal multivariate dan matriks kovarian populasi bersifat homogen. Berikut ini hipotesis yang digunakan,
Hipotesis :
Dengan menggunakan taraf signifikan 5% , maka dapat diperoleh daerah kritis atau tolak H0 saat T2 > c2 (8,40).
Berdasarkan perhitungan (lampiran 8) nilai T2 diperoleh
4,505, sehingga dapat disimpulkan bahwa rata-rata variabel yang mem-pengaruhi IPM (prosentase penduduk yang tinggal di darah perkotaan, prosentase penduduk yang berpendidikan diatas SLTP dan juga prosentase penduduk miskin) di provinsi Jawa Timur tidak berbeda signifikan dengan provinsi Jawa Barat dengan taraf signifikansi alfa 5%.
BAB V. KESIMPULAN DAN SARAN A. Kesimpulan
Berdasarkan analisis dan pembahasan diatas dapat diperoleh kesimpulan sebagai berikut.
1. Karakteristik data dari faktor-faktor yang mempengaruhi Indeks Pembangunan Manusia (IPM) rata-rata adalah untuk variabel prosentase penduduk yang tinggal di daerah perkotaan di Jawa Timur lebih rendah dibandingkan di Jawa barat, untuk variabel prosentase penduduk yang berpendidikan diatas SLTP Jawa Timur lebih besar dibandingkan provinsi Jawa Barat, sedangkan untuk variabel prosentase penduduk miskin di Jawa Timur lebih tinggi dibandingkan provinsi Jawa Barat.
memberikan hasil yang sama, yaitu data tersebut tidak berdistribusi normal multivariate.
3. Dalam pengujian vektor mean satu populasi, faktor-faktor yang mempengaruhi IPM (prosentase penduduk yang tinggal di darah perkotaan, prosentase penduduk yang berpendidikan diatas SLTP dan juga prosentase penduduk miskin) provinsi Jawa Timur didapatkan hasil bahwa mean populasi untuk faktor-faktor tersebut berbeda dengan rata-rata dugaan.
4. Dalam pengujian vektor mean dua populasi didapatkan hasil bahwa rata-rata populasi dari faktor-faktor yang mempengaruhi IPM (prosentase pen-duduk yang tinggal di darah perkotaan, prosentase penduduk yang berpendidikan diatas SLTP dan juga prosentase penduduk miskin) di Jawa Timur dan Jawa Barat tidak berbeda nyata dengan taraf signifikan alfa 5%.
B. Saran
Saran yang diberikan untuk penelitian selanjutnya adalah selain itu, sebelum melakukan pengujian vektor mean satu populasi maupun dua populasi perlu adanya penguji normalitas multivariate, homogenitas, dan juga independen antar variabel maupun antar populasi. Ketika dalam pengujian vektor mean menggunakan metode T2 Hotelling’s didapat keputusan tolak
H0 maka perlu dilanjutkan pengujian menggunakan Confidence
Interval atau menggunakan Confidence Region sehingga dapat diketahui variabel mana yang berbeda atau yang menyebabkan tolak H0.
DAFTAR PUSTAKA
[1] Walpole. 1995. Pengantar Metode Statistika. Gramedia : Jakarta. [2] Johnson, R. A., $ Winchern, D. W. (2007). Applied Multivariat
Statistical Analysis : Sixth Edition. New Jersey : Pearson Prentice Hall [3] Badan Pusat Statistik. (2008). Indeks Pembangunan Manusia