SENATEK 2015| Malang, 17 Januari 2015 639
Small Area Estimation dengan Pendekatan Empirical Bayes
Berbasis Model Beta-Binomial Untuk Estimasi Angka
Pengangguran di Kabupaten Sumba Timur
Lamatur Heribertus Sidabutar1, Dr. Dra. Ismaini Zain, M.Si2 1 Mahasiswa Magister Statistika, Institut Teknologi Sepuluh Nopember
2, Dosen Jurusan Statistika, Institut Teknologi Sepuluh Nopember Email: 1[email protected], 2[email protected]
ABSTRAK
Dalam era otonomi daerah, dibutuhkan suatu perencanaan dan pengambilan kebijakan sampai level yang terkecil. Untuk itu diperlukan informasi yang rinci mengenai indikator pembangunan, tidak hanya untuk level kabupaten/kota saja namun diharapkan sampai level kecamatan dan bahkan hingga level kelurahan/desa. Salah satu indikator pembangunan yang penting adalah data pengangguran. Akan tetapi, data pengangguran yang menjadi kebutuhan pemerintah otonomi daerah tersebut hingga saat ini belum bisa tersedia pada tingkat kecamatan karena keterbatasan cakupan sampel pada Survei Angkatan Kerja Nasional (Sakernas) yang dilaksanakan oleh BPS. Masalah tersebut dapat diberikan solusi dengan menerapkan Small Area Estimation (SAE), salah satunya dengan pendekatan Empirical Bayes berbasis model Beta-Binomial. Empirical Bayes merupakan suatu metode pendugaan yang terdiri dari fungsi kepekatan peluang prior, fungsi kepekatan peluang posterior dan fungsi kepekatan peluang marginal. Salah satu model yang dapat digunakan dalam metode Empirical Bayes adalah model Beta-Binomial, karena model ini memenuhi ketiga fungsi kepekatan peluang tersebut. Model Beta-Binomial digunakan dalam penelitian ini karena cocok untuk data biner. Tujuan dari penelitian ini adalah melakukan kajian terhadap estimator pada metode Empirical Bayes berbasis model Beta-Binomial dan menerapkannya untuk mendapatkan estimasi angka pengangguran tingkat kecamatan di Kabupaten Sumba Timur. Kemudian dilakukan perbandingan hasil estimasi langsung dan metode Empirical Bayes berbasis model Beta-Binomial melalui nilai MSE dengan pendekatan Jackknife dan Bootstrap.
Kata kunci: Angka Pengangguran, Small Area Estimation, Empirical Bayes, Model Beta-Binomial, Jackknife, Bootstrap
ABSTRACT
In the era of regional autonomy, we need a planning and policy-making until the smallest level of area. It required detailed information on development indicators, not only to the level of district/city, but it is expected to district level and even up to the level of the urban/rural. One of important development indicator is the unemployment data. However, the unemployment data that is needed by the local autonomous government until now could not be available at the district level due to the limited scope of the sample at the National Labour Force Survey conducted by the BPS. These problems may be given a solution by applying the Small Area Estimation (SAE), one of the Empirical Bayes approach based Beta-Binomial models. Empirical Bayes is an estimation method comprising density function prior opportunities, opportunities posterior density function and density function of marginal opportunities. One model that can be used in the method of Empirical Bayes is Beta-Binomial models, because this model meets the third function of density opportunity. Beta-Binomial models used in this study because it is suitable for binary data. The purpose of this study is a review of the method of Empirical Bayes estimator based on Beta-Binomial models and apply them to obtain the estimated unemployment rate of districts in East Sumba. Then performed a direct comparison of the results of estimation and Empirical Bayes methods based on Beta-Binomial models through the MSE with Jackknife and Bootstrap approach.
Keywords: Unemployment, Small Area Estimation, Empirical Bayes, Model Beta-Binomial, Jackknife,
Bootstrap
Pendahuluan
Dalam era otonomi daerah dibutuhkan suatu perencanaan dan pengambilan kebijakan sampai level yang terkecil. Untuk itu diperlukan suatu informasi yang rinci mengenai indikator pembangunan, tidak hanya untuk level kabupaten/kota saja namun diharapkan sampai level kelurahan/desa. Seiring dengan perkembangan otonomi daerah tersebut, Badan Pusat Statistik (BPS) dituntut untuk memproduksi statistik dan menyajikannya sebagai informasi, sesuai
SENATEK 2015| Malang, 17 Januari 2015 640
kebutuhan daerah sebagai bentuk kontribusi positif BPS sebagai lembaga statistik nasional dalam mendukung perencanaan dan kebijakan pembangunan daerah. Salah satu indikator penting yang dapat digunakan untuk mendukung perencanaan dan kebijakan pembangunan daerah adalah indikator ketenagakerjaan. Indikator ketenagakerjaan di Indonesia diukur oleh Badan Pusat Statistik salah satunya dengan Tingkat Pengangguran Terbuka (TPT) atau disebut angka pengangguran. Angka pengangguran di Kabupaten Sumba Timur yaitu sebesar 3,05 persen, menempati urutan ke-7 tertinggi dari 21 kabupaten/kota yang ada di Provinsi NTT.
Angka pengangguran di Kabupaten Sumba Timur yang masih cukup tinggi bila dibandingkan dengan kabupaten/kota lain di Provinsi NTT ini menjadi salah satu perhatian pemerintah daerah sehingga membutuhkan informasi pengangguran sampai level area kecil di bawah kabupaten/kota sebagai dasar kebijakan yang akan dilakukan. Akan tetapi, data pengangguran tingkat kecamatan yang menjadi kebutuhan pemerintah otonomi daerah tersebut belum bisa direalisasikan oleh pemerintah pusat. Selama ini pemerintah pusat melalui BPS menyajikan angka pengangguran hanya sampai tingkat kabupaten/kota saja. Penyebabnya adalah cakupan sampel Survei Angkatan Kerja Nasional (Sakernas) sebagai dasar penghitungan pengangguran hanya dirancang untuk estimasi pada tingkat kabupaten/kota.
Pada dasarnya, estimasi angka pengangguran tingkat kecamatan akan terpenuhi apabila pemerintah daerah mampu menyediakan anggaran untuk menambah jumlah ukuran sampel. Namun, masalah muncul ketika tidak semua daerah mampu mengalokasikan anggaran tersebut sehingga perlu diterapkan metode statistik yang dapat memenuhi ketersediaan informasi meskipun sumber daya yang dimiliki terbatas. Jika penghitungan angka pengangguran tingkat kecamatan dilakukan secara langsung tanpa penambahan sampel maka disebut sebagai estimasi langsung yang dihadapkan dengan masalah besarnya standard error yang dihasilkan sebagai akibat dari kecilnya ukuran sampel serta dipaksakan untuk mendapatkan estimasi area kecilnya. Menurut Hasanudin [2], masalah tersebut menjadi alasan perlunya metode estimasi dengan cara tidak langsung yang dapat mengurangi standard error. Solusi yang tepat untuk masalah tersebut adalah dengan menerapkan metode Small Area Estimation (SAE).
Pendugaan sederhana area kecil yang didasarkan pada penerapan model desain penarikan sampel (design-based) disebut sebagai pendugaan langsung (direct estimation). Pendugaan langsung tidak mampu memberikan ketelitian yang cukup bila ukuran sampel dalam
small area berukuran kecil, sehingga statistik yang dihasilkan akan memiliki varian yang besar
atau bahkan pendugaan tidak dapat dilakukan karena tidak terwakili dalam survei (Prasad dan Rao, [4]). Metode-metode pendugaan parameter alternatif dalam SAE antara lain Empirical Best
Linier Unbiased Prediction (EBLUP), Empirical Bayes (EB) dan Hierarchical Bayes (HB) Estimation (Ghosh dan Rao, [1]).
Metode EBLUP menduga parameter yang meminimumkan Mean Square Error dengan mensubstitusi komponen varian yang tidak diketahui dengan penduga varian melalui data sampel. Dalam metode EB, parameter model diestimasi dari distribusi marginal data untuk selanjutnya inferensi didasarkan pada distribusi posterior yang diestimasi. Kemudian dalam metode HB, pendugaan didasarkan pada distribusi posterior dimana parameter diestimasi dengan rata-rata posterior dan presisinya diukur dengan varian posteriornya (Ghosh dan Rao, [1]).
Dikatakan Kismiantini [3] bahwa model standar untuk data biner adalah model Binomial. Pada metode Bayes parameter yang digunakan merupakan variabel random yang mempunyai distribusi tertentu (distribusi prior) (Walpole dan Myers, [6]). Dalam kasus data berdistribusi Binomial, distribusi prior yang digunakan diantaranya adalah distribusi prior konjugate Beta (Rao, [5]). Dengan demikian dalam kerangka SAE, metode SAE pendekatan Empirical Bayes berbasis model Beta-Binomial dapat menjadi alternatif untuk mengatasi masalah estimasi angka pengangguran. Pada makalah ini bertujuan untuk menerapkan metode
Empirical Bayes berbasis model Beta-Binomial untuk mendapatkan estimasi angka
pengangguran tingkat kecamatan di Kabupaten Sumba Timur Provinsi NTT dan melakukan perbandingan hasil estimasi langsung dan metode Empirical Bayes berbasis model Beta-Binomial melalui nilai MSE.
Metode Penelitian
Data yang digunakan dalam makalah ini adalah data sekunder yang bersumber dari Badan Pusat Statistik (BPS) yaitu raw data SAKERNAS 2013 dan raw data Podes 2014. Variabel yang menjadi perhatian dalam makalah ini adalah tingkat pengangguran terbuka (TPT) atau yang
SENATEK 2015| Malang, 17 Januari 2015 641
biasa disebut dengan angka pengangguran, dimana variabel pengamatan yi adalah jumlah
pengangguran pada kecamatan ke-i dan ni adalah jumlah angkatan kerja pada kecamatan ke-i.
Tahapan Analisis Data
1. Menghitung dugaan langsung proporsi dan ragam proporsi pengangguran masing-masing kecamatan di kabupaten Sumba Timur dengan formula:
ˆ
i i iy
n
dan
ˆ
ˆ
ˆ
i i i iVar
n
dimana iy
= jumlah pengangguran pada kecamatan ke-i in
= jumlah angkatan kerja pada kecamatan ke-iˆ
i
= dugaan langsung proporsi rumah tangga miskin kelurahan ke-i2. Menghitung proporsi dan ragam proporsi pengangguran di kabupaten Sumba Timur menggunakan rataan dan ragam terboboti dengan formula:
ˆ
iˆ
i i Tn
n
dan
2 2 iˆ
ˆ
i i Tn
s
n
dimanaˆ
= rataan terboboti kabupaten Sumba TimurT T i
n
n
2
s
= ragam terboboti kabupaten Sumba Timur3. Menduga parameter sebaran beta-binomial
ˆ
dan
ˆ
dengan metode momen Kleinman menggunakan rataan dan ragam contoh terboboti dari persamaan:ˆ
ˆ
ˆ
ˆ
dan
2 2ˆ
1
ˆ
1
1
ˆ
ˆ
ˆ
ˆ
1
1
1
T T i i Tn s
m
n
n n
m
dan diperoleh:
2 2ˆ
1
ˆ
1
ˆ
ˆ
1
ˆ
1
ˆ
1
T i i T Tn
n n
m
n s
m
dan
2 2ˆ
1
ˆ
1
1
ˆ
ˆ
1
1
ˆ
1
ˆ
1
T i i T Tn
n n
m
n s
m
dimana
ˆ
dan
ˆ
dugaan parameter sebaran Beta-Binomial4. Melakukan pendugaan Empirical Bayes proporsi pengangguran
ˆ
iEB masing-masing kecamatan di kabupaten Sumba Timur menggunakan formula:
ˆ
EBˆ
ˆ
,
ˆ
ˆ
ˆ
1
ˆ
ˆ
i i i i i
dimanaˆ
ˆ
ˆ
i i in
n
ˆ
i
= dugaan langsung proporsi pengangguran kecamatan ke-iˆ
= dugaan langsung proporsi pengangguran di kabupaten Sumba Timur5. Menghitung kuadrat galat tengah (MSE) dari penduga Empirical Bayes menggunakan metode Jackknife, dan Bootstrap dengan tahapan sebagai berikut:
SENATEK 2015| Malang, 17 Januari 2015 642
a. Metode Jacknife
Proses perhitungan MSE menggunakan metode Jacknife adalah sebagai berikut: o Hitung nilai
M
ˆ
1i dengan formula:
1 1 1 1 11
ˆ
ˆ
ˆ
ˆ
ˆ
, ,
mˆ
,
,
ˆ
, ,
i i i i l l i i i lm
M
g
y
g
y
g
y
m
dimana
1iˆ, ,
ˆ
ig
y
merupakan ragam posterior
1i
ˆ ,
lˆ
l,
ig
y
merupakan ragam posterior yang diperoleh dengan menghapus pengamatan ke-lo Hitung
M
ˆ
2i dengan formula: 2 2 , 11
ˆ
ˆ
ˆ
m EB EB i i l i lm
M
m
dimanaˆ
EB i
adalah penduga proporsi Empirical Bayes ,ˆ
EB i l
adalah penduga proporsi Empirical Bayes yang diperoleh dengan menghapus pengamatan ke-l.Hitung
ˆ
EB J iMSE
dengan formula:
ˆ
ˆ
1ˆ
2EB
J i i i
MSE
M
M
b. Metode Bootstrap
Proses perhitungan MSE menggunakan metode Bootstrap adalah sebagai berikut:
o Menghitung penduga ragam proporsi Empirical Bayes
g
1i
ˆ
v2 dan penduga ragam proporsi Empirical Bayes
2
1 1
ˆ
B i v bg
b
hasil resampling bootstrap sebanyak B kali. o MenghitungM
ˆ
1 ,i B menggunakan persamaan:
2
2
1 , 1 1 11
ˆ
2
ˆ
Bˆ
i B i v i v bM
g
g
b
B
o Menghitung penduga proporsi Empirical Bayes
ˆ
iEB dan penduga proporsi EmpiricalBayes
ˆ
EB
i
b
hasil resampling bootstrap. o MenghitungM
ˆ
2 ,i B menggunakan persamaan
2 2 , 11
ˆ
ˆ
ˆ
B EB EB i B i i bM
b
B
o Menghitung kuadrat tengah galat
MSE
B
ˆ
iEB dengan menggunakan persamaan
ˆ
ˆ
1 ,ˆ
2 ,EB
B i i B i B
MSE
M
M
6. Membandingkan kuadrat tengah galat dari penduga langsung dengan penduga Empirical
Bayes.
7. Membandingkan kuadrat galat tengah galat dari penduga Empirical Bayes antara metode Jacknife dan Bootstrap.
SENATEK 2015| Malang, 17 Januari 2015 643
Hasil dan Pembahasan
Pada makalah ini, terdapat dua penduga proporsi yang digunakan dalam menduga proporsi angka pengangguran di Kabupaten Sumba Timur yakni dengan penduga langsung dan dengan penduga Empirical Bayes dari model Beta-Binomial. Penduga langsung merupakan penduga yang diperoleh dari banyaknya pengangguran per jumlah angkatan kerja yang diperoleh dari survei. Sedangkan penduga Empirical Bayes merupakan penduga yang dihitung berdasarkan penduga langsung dengan pembobot yang diperoleh dari model Beta-Binomial. Dugaan proporsi angka pengangguran pada setiap kecamatan untuk masing-masing metode dapat dilihat pada tabel 1 di bawah ini:
Tabel 1. Hasil perhitungan dugaan angka pengangguran di Kabupaten Sumba Timur
No Nama Kecamatan Langsung EB
1 Lewa 1,4706 1,5484
2 Nggaha Ori Angu 3,3333 3,2768 3 Lewa Tidahu 5,2632 5,1132 4 Katala Hamu Lingu 4,6610 4,3257 5 Tabundung 2,7778 2,4553 6 Pinu Pahar 1,7857 1,8312 7 Paberiwai 2,9703 2,7688 8 Karera 3,4091 3,3087 9 Matawai La Pawu 3,5714 3,4733 10 Kahaungu Eti 3,0303 3,1233 11 Mahu 4,7619 4,7544 12 Ngadu Ngala 2,2222 2,3122 13 Pahunga Lodu 4,0816 3,9943 14 Wula Waijelu 3,7736 3,5954 15 Rindi 3,0021 3,1052 16 Umalulu 2,4783 2,4557 17 Pandawai 2,1078 2,0067 18 Kambata Mapambuhang 3,1403 3,1288 19 Kota Waingapu 1,3278 1,2153 20 Kambera 1,5724 1,4459 21 Haharu 2,5573 2,5698 22 Kanatang 2,4736 2,4554
Kemudian untuk membandingkan keakuratan antara penduga langsung dengan penduga Empirical Bayes, dilihat dari nilai MSE nya. Pada tabel 2 dapat dilihat bahwa nilai MSE untuk penduga Empirical Bayes lebih kecil dibandingkan dengan MSE penduga langsung. Hal ini menunjukkan bahwa penduga proporsi area kecil menggunakan model Beta-Binomial lebih akurat jika dibandingkan dengan penduga langsung.
Tabel 1. Hasil perhitungan MSE dengan metode langsung, Jackknife dan Bootstrap
No Nama Kecamatan Langsung
Empirical Bayes
Jackknife Bootstrap
1 Lewa 0,1523 0,0073 0,0071
2 Nggaha Ori Angu 0,1875 0,0089 0,0087 3 Lewa Tidahu 0,0586 0,0033 0,0032
SENATEK 2015| Malang, 17 Januari 2015 644
4 Katala Hamu Lingu 0,25 0,0127 0,0122 5 Tabundung 0,0303 0,0010 0,0010 6 Pinu Pahar 0,1094 0,0054 0,0053 7 Paberiwai 0,1875 0,0089 0,0087 8 Karera 0,2461 0,0130 0,0124 9 Matawai La Pawu 0,1709 0,0046 0,0046 10 Kahaungu Eti 0,1600 0,0081 0,0078 11 Mahu 0,0622 0,0037 0,0036 12 Ngadu Ngala 0,0850 0,0024 0,0024 13 Pahunga Lodu 0,0604 0,0018 0,0018 14 Wula Waijelu 0,1875 0,0089 0,0087 15 Rindi 0,1523 0,0073 0,0071 16 Umalulu 0,0482 0,0027 0,0025 17 Pandawai 0,1957 0,0065 0,0062 18 Kambata Mapambuhang 0,0301 0,0013 0,0013 19 Kota Waingapu 0,1423 0,0043 0,0041 20 Kambera 0,1534 0,0035 0,0031 21 Haharu 0,2755 0,0112 0,0110 22 Kanatang 0,1054 0,0083 0,0081 Kesimpulan
Berdasarkan hasil penerapan pada data pengangguran di kabupaten Sumba Timur dapat diambil kesimpulan bahwa penduga Empirical Bayes berbasis model Beta-Binomial lebih dapat diandalkan daripada penduga langsung, yang diperlihatkan dengan semakin kecilnya nilai MSE. Sebagai saran, perbaikan pendugaan Empirical Bayes pada model Beta-Binomial dapat dilakukan dengan memasukkan variabel penyerta ke dalam model.
Daftar Pustaka
1. Gosh, M. dan Rao, J.N.K., (1994), “Small Area Estimation : An Appraisal”, Statistical Sciences,
Institute of Mathematical Statistics, Vol. 9, No. 1, hal. 55-76
2. Hasanudin, N. (2011). Pertimbangan Penting yang Mendasari Penggunaan Metode Small Area Estimation. Prosiding Seminar Nasional Statistika 2011 Universitas Padjadjaran (hal. 218-226). Bandung: UNPAD.
3. Kismiantini (2007), Pendugaan Statistik Area Kecil dengan Metode Empirical Constrained Bayes. Makalah ini disampaikan pada Seminar Nasional Matematika. UPI Bandung, 8 Desember 2007 4. Prasad, N.G.N. dan Rao, J.N.K., (1990), “The Estimation of Mean Squared Errors of Small Area
Estimation”, Journal of American Statistical Association, 85, hal.163-171.
5. Rao, J.N.K. (2003), Small Area Estimation. New Jersey: John Wiley & Sons, Inc.
6. Walpole, R. E dan Myers, R. H., (1986), Ilmu Peluang dan Statistika untuk Insinyur dan