KAJIAN METODE BAYESIAN BERHIERARKI PADA PENDUGAAN AREA KECIL DENGAN PEUBAH PENYERTA
YANG MENGANDUNG GALAT PENGUKURAN
LELI LATIFAH
PROGRAM STUDI STATISTIKA TERAPAN
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR
BOGOR 2023
PERNYATAAN MENGENAI TESIS DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA
Dengan ini saya menyatakan bahwa tesis dengan judul Kajian Metode Bayesian Berhierarki pada Pendugaan Area Kecil dengan Peubah Penyerta yang Mengandung Galat Pengukuran adalah karya saya dengan arahan dari dosen pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir tesis ini.
Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor.
Bogor, September 2023 Leli Latifah G152194014
RINGKASAN
LELI LATIFAH. Kajian Metode Bayesian Berhierarki pada Pendugaan Area Kecil dengan Peubah Penyerta yang Mengandung Galat Pengukuran. Dibimbing oleh KUSMAN SADIK dan INDAHWATI.
Pendugaan area kecil (small area estimation/SAE), merupakan metode yang dilakukan dengan meminjam kekuatan dari informasi tambahan yang disebut peubah penyerta. Umumnya, peubah penyerta yang digunakan merupakan pendataan registrasi seperti sensus dan data administrasi. Hal ini dilakukan karena asumsi peubah penyerta tersedia untuk setiap area tanpa adanya galat pengukuran sehingga dapat memperkecil kuadrat tengah galat. Ketersediaan peubah penyerta yang terbatas seperti data sensus yang tidak tersedia setiap tahunnya dapat menjadi kendala dalam pendugaan dengan metode SAE. Informasi tambahan dari data survei dapat menjadi alternatif data dalam permasalahan tersebut. Akan tetapi, peubah penyerta yang berasal dari survei diasumsikan mengandung galat pengukuran. Oleh karena itu, diperlukan metode pendugaan area kecil yang dapat mengakomodir adanya kesalahan dalam pengukuran.
Model SAE with measurement error Ybarra-Lohr (SaeME Ybarra-Lohr) merupakan salah satu metode SAE yang dikembangkan dari metode SAE Empirical Best Linear Unbiased Prediction Fay Herrot (SAE EBLUP-FH) untuk mengakomodir permasalahan peubah penyerta yang mengandung galat pengukuran.
Pengembangan model yang lainnya adalah model SAE with measurement error Hierarchical Bayesian (SaeME HB), yang dilakukan dengan mengadopsi pendekatan Bayesian Berhiraki. Penelitian ini membandingkan tiga metode pendugaan area kecil SAE EBLUP-FH, SaeME Ybarra-Lohr dan SaeME HB. Ketiga metode diterapkan pada kajian simulasi dan kajian empiris yang peubah penyertanya mengandung galat pengukuran.
Terdapat dua kajian simulasi yang dilakukan. Pada simulasi pertama dibangkitkan skenario pada besaran galat pengukuran dan persentase area yang mengandung galat pengukuran. Hal tersebut bertujuan untuk melihat pendugaan pada kondisi galat pengukuran yang berbeda di setiap area. Simulasi kedua dibangkitkan dengan skenario yang berbeda pada peubah penyertanya. Tujuannya adalah untuk melihat kondisi saat dua peubah penyerta mengandung galat pengukuran dan kondisi saat salah satu peubah penyerta mengandung galat pengukuran. Pada kajian empiris dilakukan pendugaan indeks harga konsumen kelompok pengeluaran (IHK-KP) Januari 2019 di Provinsi Jawa Barat dengan menggunakan peubah penyerta yang berasal dari data survei, yaitu SUSENAS Maret 2019.
Hasil kajian simulasi menunjukkan bahwa semakin besar nilai ragam pengaruh acak dan semakin besar nilai galat pengukuran maka kuadrat tengah galat (KTG) yang dihasilkan semakin besar. Pada simulasi pertama, semakin besar persentase area yang mengandung galat pengukuran maka pendugaan dengan pendekatan model SaeME HB adalah lebih baik dibandingkan SAE EBLUP-FH dan SaeME Ybarra- Lohr. Hal ini ditunjukkan dengan KTG yang terkecil. Pada simulasi kedua, skenario dengan dua peubah penyerta yang mengandung galat pengukuran menghasilkan KTG yang lebih besar dibandingkan hanya salah satu peubah penyerta yang mengandung galat pengukuran. Pendekatan model SaeME HB juga memperoleh KTG yang lebih kecil dibandingkan kedua model lainnya. Pendugaan IHK-KP dalam
kajian empiris dengan pendekatan model SaeME Bayes Berhierarki juga menghasilkan rata-rata akar kuadrat tengah galat relatif (AKTGR) yang lebih kecil dibandingkan model EBLUP-FH dan SaeME Ybarra-Lohr. Statistik IHK-KP dan IHK Umum Provinsi Jawa Barat dengan pendekatan SaeME HB mampu menghasilkan statistik yang mendekati dengan Publikasi BPS
Kata Kunci: EBLUP-FH, galat pengukuran, indeks harga konsumen, SaeME Hierarchical Bayesian, SaeME Ybarra-Lohr
SUMMARY
LELI LATIFAH. Study of Hierarchical Bayesian Methods for Small Area Estimation with Auxiliary Variables Containing Measurement Error. Supervised by KUSMAN SADIK and INDAHWATI.
In small area estimation (SAE), the method is carried out by borrowing the strength of additional information (auxiliary variables). Commonly, the auxiliary variables used are registration data such as census and administrative data. This is because the assumption of the auxiliary variables is available for all area without any measurement errors so as to reduce the mean squared error (MSE). The availability of limited auxiliary variables such as census data which is not available every year can be an obstacle in estimating with the SAE method. Additional information from survey can be an alternative data for handling this problem. However, the auxiliary variables from the survey are assumed to contain measurement errors. Therefore, it is required small area estimation method that can accommodate measurement errors in auxiliary variables.
Ybarra-Lohr SAE model with measurement error (Ybarra-Lohr SaeME) is one of the SAE methods developed from Fay Herrot's SAE empirical best linear unbiased prediction method (EBLUP-FH) to accommodate auxiliary variables problems that contain measurement errors. Another model development is the hierarchical bayesian SAE model with measurement error (HB SaeME), which is carried out by adopting a hierarchical bayesian approach. This study compared three small area estimation models, including the EBLUP-FH, Ybarra-Lohr SaeME and HB SaeME. The three methods are applied to simulation studies and empirical studies where the auxiliary variables contain measurement errors.
There are two simulation studies conducted. In the first simulation, scenarios were generated the different of the measurement error and the percentage of areas containing measurement errors. It aims to see the estimation under different measurement error conditions in the area. The second simulation is based on a different scenario on the auxiliary variables. The aim is to analyze conditions when two auxiliary variables contain measurement errors and conditions when one of the auxiliary variables contains measurement errors. In an empirical study, an estimation of the January 2019 expenditure group consumer price index (CPI-EG) in West Java Province was conducted using auxiliary variables derived from The National Socioeconomic Survey (SUSENAS).
The results of the simulation study show that the greater the value of the random effect variances and the greater the measurement error, the greater the mean square error. In the first simulation, the greater the percentage of areas containing measurement errors, the better the estimation with the HB SaeME model approach compared to EBLUP-FH and Ybarra-Lohr SaeME. This is indicated by the smallest MSE. In the second simulation, a scenario with two auxiliary variables containing errors resulted in a larger MSE than only one auxiliary variable containing errors.
The HB SaeME model approach also obtains a smaller MSE than the other two models. CPI-EG estimation in an empirical study using the HB SaeME model approach also produces a smaller average relative root mean square error (ARRMSE) compared to the EBLUP-FH and Ybarra-Lohr SaeME models. Statistics of CPI-EG
and General CPI of West Java Province with the HB SaeME approach are able to produce statistics that are close to BPS publications
Keywords: consumer price index, EBLUP FH, HB SaeME, measurement error, Ybarra-Lohr SaeME
Β© Hak Cipta milik IPB, tahun 2023 Hak Cipta dilindungi Undang-Undang
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan atau menyebutkan sumbernya. Pengutipan hanya untuk kepentingan pendidikan, penelitian, penulisan karya ilmiah, penyusunan laporan, penulisan kritik, atau tinjauan suatu masalah, dan pengutipan tersebut tidak merugikan kepentingan IPB.
Dilarang mengumumkan dan memperbanyak sebagian atau seluruh karya tulis ini dalam bentuk apa pun tanpa izin IPB.
Tesis
sebagai salah satu syarat untuk memperoleh gelar Magister pada
Program Studi Statistika Terapan
KAJIAN METODE BAYESIAN BERHIERARKI PADA PENDUGAAN AREA KECIL DENGAN PEUBAH PENYERTA
YANG MENGANDUNG GALAT PENGUKURAN
LELI LATIFAH
PROGRAM STUDI STATISTIKA TERAPAN
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR
BOGOR 2023
Tim Penguji pada Ujian Tesis:
Dr. Anang Kurnia, S.Si., M.Si.
PRAKATA
Alhamdulillahi Rabbilβ Alamin. Puji syukur penulis panjatkan kehadirat Allah subhanahu wa taβala atas limpahan rahmat dan karunia-Nya dalam memberikan kelancaran pada proses penulisan karya ilmiah ini. Tema yang dipilih dalam penelitian ini ialah Pendugaan Area Kecil, dengan judul βKajian Metode Bayesian Berhierarki pada Pendugaan Area Kecil dengan Peubah Penyerta yang Mengandung Galat Pengukuranβ.
Penulisan karya ilmiah ini tidak terlepas dari dukungan, bimbingan, dan bantuan banyak pihak. Maka, dalam kesempatan ini penulis menyampaikan ucapan terima kasih kepada:
1. Komisi pembimbing, Bapak Dr. Kusman Sadik, S.Si., M.Si. dan Ibu Dr.
Ir. Indahwati, M.Si. yang telah sabar memberikan bimbingan, masukan, dan arahan.
2. Bapak Dr. Anang Kurnia, S.Si., M.Si., selaku penguji luar komisi pembimbing yang memberikan masukan dan saran kepada penulis;
3. Ibu Dr. Mersi Kurniati, S.Si., M.Si., selaku dosen seminar, serta Bapak Dr. Agus M. Soleh, S.Si., M.T. selaku moderator kolokium dan moderator ujian tesis, yang memberikan masukan perbaikan pada penulis;
4. Badan Pusat Statistik (BPS) yang telah memberikan kesempatan dan beasiswa kepada penulis.
5. Seluruh Dosen pengajar di Departemen Statistika atas ilmu yang telah diberikan.
6. Staf Tata Usaha Departemen Statistika IPB yang selalu membantu segala proses administrasi.
7. Keluarga yang telah memberikan doa, semangat dan kasih sayang, suami, anak, kedua orang tua dan keluarga lainnya yang selalu menemani dan mendukung penulis.
8. Teman-teman Program Studi Statistika Terapan BPS 2019 dan teman- teman lainnya yang telah banyak membantu dan memberikan dukungan.
Semoga karya ilmiah ini bermanfaat bagi pihak yang membutuhkan dan bagi kemajuan ilmu pengetahuan.
Bogor, September 2023 Leli Latifah
DAFTAR ISI
DAFTAR TABEL xii
DAFTAR GAMBAR xii
DAFTAR LAMPIRAN xiii
I PENDAHULUAN 1
1.1 Latar Belakang 1
1.2 Tujuan 4
II TINJAUAN PUSTAKA 5
2.1 Indeks Harga Konsumen 5
2.2 Metode Penghitungan IHK 7
2.3 Pendugaan Langsung 8
2.4 Pendugaan Area Kecil 9
2.5 Model Level Area pada SAE 10
2.6 EBLUP Model Level Area pada SAE 10
2.7 Pendugaan Area Kecil dengan Peubah Penyerta Mengandung Galat
Pengukuran 11
2.8 EBLUP Model Level Area pada SAEME 12
2.9 Model Bayesian pada Pendugaan Area Kecil 12
2.10 Metode Markov Chain Monte Carlo 14
2.11 The Gibss Sampler 15
2.12 Pemeriksaan Konvergensi Metode MCMC 15
2.13 Model Bayes Berhierarki dengan Galat Pengukuran 15 2.14 Evaluasi Pendugaan dengan Metode Jackknife 16
III METODE 18
3.1 Data 18
3.2 Model 19
3.2.1 Model Pendugaan IHK-KP Kabupaten/Kota 19 3.2.2 Model Pendugaan IHK-T Kabupaten/Kota 20
3.3 Metode 21
3.3.1 Tahapan Data Simulasi 21
3.3.2 Tahapan Data Riil 23
IV HASIL DAN PEMBAHASAN 25
4.1 Kajian Simulasi 25
4.1.1 Kajian Simulasi 1 25
4.1.2 Kajian Simulasi 2 29
4.2 Kajian Data Riil 31
4.2.1 Eksplorasi IHK Indonesia dan IHK Kota Contoh di Provinsi
Jawa Barat 31
4.2.2 Pemodelan Pendugaan Area Kecil IHK-KP Kota Contoh
di Provinsi Jawa Barat 35
4.2.3 Pendugaan Area Kecil IHK-KP Kota Contoh
di Provinsi Jawa Barat 36 4.2.4 Pendugaan IHK-KP Kota Nircontoh di Provinsi Jawa Barat 40 4.2.5 Pendugaan IHK-T Kabupaten/Kota di Provinsi Jawa Barat 41
V SIMPULAN DAN SARAN 43
5.1 Simpulan 43
5.2 Saran 43
DAFTAR PUSTAKA 44
LAMPIRAN 47
RIWAYAT HIDUP 67
DAFTAR TABEL
1 Kelompok komoditas barang dan jasa berdasarkan kelompok pengeluaran
(2012=100) 6
2 Peubah respons yang digunakan dalam penelitian 18
3 Peubah penyerta yang digunakan dalam penelitian 18
4 Tahapan kajian simulasi 21
5 Rata-rata bias pada kajian simulasi 1 dengan pengaruh acak area ππ’2 =2 25 6 Rata-rata bias pada kajian simulasi 1 dengan pengaruh acak area ππ’2 =4 26 7 Rata-rata kuadrat tengah galat pada kajian simulasi 1 dengan pengaruh acak
area ππ’2 =2 27
8 Rata-rata kuadrat tengah galat pada kajian simulasi 1 dengan pengaruh acak
area Οu2 =4 28
9 Rata-rata bias pada kajian simulasi 2 dengan pengaruh acak area Οu2 =2 29 10 Rata-rata bias pada kajian simulasi 2 dengan pengaruh acak area Οu2 =4 29 11 Rata-rata kuadrat tengah galat pada kajian simulasi 2 dengan pengaruh acak
area Οu2 =2 30
12 Rata-rata kuadrat tengah galat pada kajian simulasi 2dengan pengaruh acak
area Οu2 =4 30
13 Korelasi antara peubah penyerta terpilih dengan IHK pada setiap kelompok
pengeluaran 36
14 Rata-rata AKTGR tiga metode IHK-KP Jawa Barat 39
15 AKTG pendugaan IHK-KP kota nircontoh di Provinsi Jawa Barat 40 16 Nilai dugaan IHK-KP dan IHK-T kota contoh Januari 2019 dengan
pendekatan model SaeME Bayes Berhierarki 41
17 Nilai dugaan IHK-KP dan IHK-T kota nircontoh Januari 2019 dengan
pendekatan model SaeME Bayes Berhierarki 41
DAFTAR GAMBAR
1 Bagan alir tahapan data simulasi 1 dan simulasi 2 22
2 Bagan alir tahapan data riil 24
3 Statistik IHK Indonesia Tahun 2019 31
4 (a) Grafik statistik IHK-T Indonesia dan kota contoh IHK Provinsi Jawa Barat Tahun 2019, (b) Boxplot IHK-T Indonesia dan kota contoh IHK
Provinsi Jawa Barat Tahun 2019 32
5 Statistik IHK-T kota contoh di Provinsi Jawa Barat pada Januari 2019 33 6 Statistik IHK-KP pada masing - masing kota contoh di Provinsi Jawa Barat
Januari 2019 34
7 Boxplot statistik IHK-KP dari tujuh kota contoh di Provinsi Jawa Barat
Januari 2019 35
8 Perbandingan nilai dugaan IHK-KP beberapa metode pada ketujuh kota contoh di Provinsi Jawa Barat. (1) Kota Bogor, (2) Kota Sukabumi, (3) Kota Bandung, (4) Kota Cirebon, (5) Kota Bekasi, (6) Kota Depok, (7)
Kota Tasikmalaya 37
9 Perbandingan KTG beberapa metode menurut kelompok pengeluaran pada ketujuh kota contoh di Provinsi Jawa Barat. (1) Kota Bogor, (2) Kota Sukabumi, (3) Kota Bandung, (4) Kota Cirebon, (5) Kota Bekasi, (6) Kota
Depok, (7) Kota Tasikmalaya 38
DAFTAR LAMPIRAN
1 Sebagian syntax R untuk analisis data 48
2 Trace plot parameter model Metode SaeME Bayes Berhierarki pada kajian
simulasi 1 dengan π2 = 2 51
3 Trace plot parameter model Metode SaeME Bayes Berhierarki pada kajian
simulasi 1 dengan π2 = 4 54
4 Trace plot parameter model Metode SaeME Bayes Berhierarki pada kajian
simulasi 2 skenario 1 dengan ππ’2 =2 57
5 Trace plot parameter model Metode SaeME Bayes Berhierarki pada kajian
simulasi 2 skenario 2 dengan ππ’2 =2 58
6 Trace plot parameter model Metode SaeME Bayes Berhierarki pada kajian
simulasi 2 skenario 1 dengan ππ’2 =4 59
7 Trace plot parameter model Metode SaeME Bayes Berhierarki pada kajian
simulasi 2 skenario 2 dengan ππ’2 =4 60
8 Statistik IHK-T 82 Kota dan Indonesia Januari β Desember 2019 61 9 Korelasi antara peubah penyerta dengan IHK-KP Januari 2019 pada setiap
kelompok 64
10 AKTGR berdasarkan model EBLUP FH, SaeME Ybarra-lohr dan SaeME HB pada KP 1 tujuh kota contoh di Provinsi Jawa Barat 64 11 AKTGR berdasarkan model EBLUP FH, SaeME Ybarra-lohr dan SaeME
HB pada KP 2 tujuh kota contoh di Provinsi Jawa Barat 65 12 AKTGR berdasarkan model EBLUP FH, SaeME Ybarra-lohr dan SaeME
HB pada KP 3 tujuh kota contoh di Provinsi Jawa Barat 65 13 AKTGR berdasarkan model EBLUP FH, SaeME Ybarra-lohr dan SaeME
HB pada KP 4 tujuh kota contoh di Provinsi Jawa Barat 65 14 AKTGR berdasarkan model EBLUP FH, SaeME Ybarra-lohr dan SaeME
HB pada KP 5 tujuh kota contoh di Provinsi Jawa Barat 66 15 AKTGR berdasarkan model EBLUP FH, SaeME Ybarra-lohr dan SaeME
HB pada KP 6 tujuh kota contoh di Provinsi Jawa Barat 66 16 AKTGR berdasarkan model EBLUP FH, SaeME Ybarra-lohr dan SaeME
HB pada KP 7 tujuh kota contoh di Provinsi Jawa Barat 66
1
I PENDAHULUAN
1.1 Latar Belakang
Kebutuhan akan data terus mengalami peningkatan. Baik pemerintah, swasta, maupun individu memiliki kepentingan untuk menggunakan data sehingga tuntutan adanya ketersediaan data semakin besar. Berbagai kegiatan dilakukan untuk menghasilkan data, beberapa diantaranya yaitu sensus dan survei.
Pada sensus dilakukan pengumpulan data yang mencakup hingga wilayah terkecil dan hasil kegiatan sensus pun dapat dijadikan kerangka sampel. Akan tetapi, sensus memiliki beberapa kelemahan seperti waktu yang lama serta biaya yang besar. Oleh karena itu, survei menjadi kegiatan yang sering dilakukan dibandingkan sensus. Dengan survei maka biaya yang digunakan akan menjadi lebih hemat, penyajian hasil survei juga akan lebih cepat serta cakupan survei bisa lebih rinci dibandingkan sensus.
Dalam survei dikenal adanya dua kesalahan yaitu kesalahan karena pengambilan sampel (sampling error) dan kesalahan bukan karena pengambilan sampel (non-sampling error). Kesalahan bukan karena pengambilan sampel umumnya terjadi karena human error seperti kesalahan pencatatan. Kesalahan karena pengambilan sampel disebabkan ketidaktepatan hasil sampling.
Pengambilan sampel yang tidak tepat menjadi salah satu kelemahan dari survei.
Kecukupan ukuran sampel menjadi penting agar hasil pendugaan populasi yang diperoleh memiliki tingkat akurasi yang tinggi. akan tetapi penyajian sampai wilayah kecil (seperti kecamatan) dengan sampel yang terbatas tidak akan dapat dipenuhi. Untuk mengatasi hal tersebut perlu dilakukan penambahan ukuran sampel yang pasti akan berpengaruh terhadap biaya serta tenaga kerja yang lebih besar. Oleh karena itu, dibutuhkan metode pendugaan yang mampu mengatasi permasalahan ukuran sampel, yaitu metode pendugaan area kecil (small area estimation).
Pendugaan area kecil merupakan teknik statistika untuk menduga parameter-parameter sub populasi yang ukuran sampelnya kecil. Rao dan Molina et al. (2015) mendefinisikan area kecil untuk menunjukkan domain apa pun yang tidak dapat menghasilkan estimasi langsung dengan presisi yang memadai. Area kecil tersebut dapat berupa kota, kabupaten, kecamatan, desa/kelurahan, maupun kelompok suku. Untuk memperoleh tingkat presisi yang memadai dalam pendugaan tidak langsung dengan pendugaan area kecil ini diperlukan adanya informasi tambahan atau dikenal dengan istilah peubah penyerta (auxiliary variable). Metode ini memiliki sifat βmeminjam kekuatanβ informasi tambahan dari hubungan peubah respons dengan peubah penyerta yang digunakan.
Umumnya, informasi tambahan dalam pendugaan area kecil diperoleh dari hasil penghitungan sensus maupun catatan administrasi untuk mengurangi nilai kuadrat Tengah galat (mean square error/MSE). Peubah penyerta diasumsikan tidak mengandung galat pengukuran. Akan tetapi, saat informasi tambahan diperoleh dari hasil penghitungan survei maka diasumsikan bahwa peubah penyerta akan mengandung galat pengukuran. Dalam Carrol et al. (2006) disebutkan bahwa terdapat tiga efek galat pengukuran. Efek pertama yaitu menyebabkan bias dalam pendugaan parameter. Efek kedua menyebabkan hilangnya kekuatan untuk mendeteksi hubungan antar peubah dan menutupi fitur
2
data. Efek ketiga membuat analisis model grafis menjadi sulit. Oleh karena itu, estimasi parameter dalam pendugaan area kecil dengan variabel tambahan yang mengandung error juga akan menjadi penduga yang bias, dan kuadrat tengah galat (KTG) dari prediktor dapat ditingkatkan (Singh et al. 2015). Oleh karena itu, diperlukan suatu metode pendugaan area kecil untuk mengakomodir adanya galat pengukuran. Pengembangan model pendugaan area kecil dengan peubah penyerta yang mengandung galat pengukuran, secara umum telah dibahas oleh Hariyanto et al. (2018) dan Tanur (2020). Pada level unit, Ghosh et al. (2006) mengembangkan pertama kali pendugaan area kecil dengan peubah penyerta mengandung galat.
Penduga Empirical Bayes (EB) dan Hierarchical Bayes (HB) dikembangkan untuk pendugaan simultan ketika peubah penyerta mengandung galat pengukuran struktural. Pendugaan area kecil tingkat unit dengan peubah penyerta mengandung galat pengukuran lainnya dilakukan oleh Ghosh & Sinha (2007). Penelitian tersebut mengusulkan model regresi linear kesalahan bersarang level unit untuk pendugaan area kecil ketika peubah penyerta mengandung galat pengukuran fungsional. Datta et al. (2010), dengan metode Pseudo Bayes Empiric (PEB), menggunakan nilai peubah respons dan peubah penyerta untuk memperkirakan nilai peubah penyerta yang sebenarnya. Torabi (2011) mengusulkan penduga PEB yang bergantung pada bobot survei dan memenuhi properti konsistensi desain.
Pendugaan area kecil dengan galat pengukuran pada level unit juga dilakukan oleh Arima et al. (2012), Goo dan Kim (2012) serta Torkasvand (2016).
Pendugaan area kecil level area dengan mempertimbangkan peubah penyerta mengandung galat pengukuran dilakukan oleh Ybarra dan lohr (2008).
Model yang digunakan adalah model level area modifikasi Fay dan Herriot dengan peubah penyerta mengandung galat. Zhu dan Zou (2014) menggunakan metode EBLUP, yang mengakomodasi galat pengukuran struktural. Arima et al.
(2016) dalam Pratesi (2016) serta Polettini dan Arima (2017) juga menduga area kecil dengan adanya galat pengukuran pada area level. Di Indonesia, beberapa penelitian terkait pendugaan area kecil dengan galat pengukuran di lakukan oleh Komalasari (2019) menggunakan data SUSENAS untuk memperkirakan rata-rata lama sekolah per kecamatan di Kabupaten Kampar. Hasil penelitian menunjukkan bahwa model estimasi Ybarra-Lohr SaeME dapat memprediksi nilai MSE yang lebih kecil daripada estimasi langsung. Aziz dan Ubaidillah (2021) menggunakan dua model SAE yaitu model SAE EBLUP Fay-Herriot dengan peubah penyerta yang berasal dari data PODES dan SAE dengan galat pengukuran yang menggunakan peubah penyerta dari Big Data yaitu Twitter. Hasil kajian tersebut diperoleh bahwa estimasi dengan metode SAE lebih baik dibandingkan dengan estimasi langsung. Beberapa penelitian pendugaan area kecil lainnya yang mengakomodir galat pengukuran juga dilakukan oleh Hariyanto (2020), Novkaniza et al. (2023), serta Tanur dan Kurnia (2022).
Salah satu pendekatan Bayesian untuk melakukan pendugaan area kecil pada level area mempertimbangkan peubah penyerta yang mengandung galat pengukuran dilakukan oleh Arima et al. (2015). Kajian tersebut melakukan pengembangan metode dari metode SaeME Ybarra-Lohr dengan mengusulkan pendugaan alternatif yang dihasilkan dari model galat pengukuran Bayes Berhierarki. Pendugaan dalam kajian simulasi dilakukan dengan beberapa skenario yang mengkondisikan adanya galat pengukuran yang berbeda pada area yang dibangkitkan. Simulasi membandingkan beberapa metode SAE, yaitu
3 pendugaan langsung, EBLUP-FH, EBLUP Bayesian, SaeME Ybarra-Lohr, dan Hierarchical Bayesian SaeME. Hasil kajian simulasi menunjukkan bahwa pendugaan dengan Hierarchical Bayesian lebih stabil dan memiliki nilai KTG yang lebih kecil dibandingkan dengan pendugaan SaeME YbarraβLohr dan pendugaan lainnya.
Arima et al. (2015) hanya menggunakan satu ragam pengaruh acak dan satu peubah penyerta yang mengandung kesalahan dalam kajian simulasinya.
Berdasarkan hal tersebut, dalam penelitian ini dilakukan adaptasi simulasi yang dilakukan oleh Arima et al. (2015) dengan menambahkan skenario pada pengaruh acak area dan skenario pada peubah penyerta yang digunakan. Ada dua simulasi yang dilakukan dalam penelitian ini. Simulasi pertama dilakukan untuk melihat kondisi galat pengukuran yang berbeda pada area yang dibangkitkan. Simulasi kedua dilakukan dengan membuat skenario pada peubah penyerta. Tujuannya adalah untuk melihat kondisi ketika peubah penyerta yang digunakan adalah dua peubah penyerta, yang salah satu peubah penyerta mengandung galat pengukuran dan kondisi ketika kedua peubah penyerta yang digunakan mengandung galat pengukuran. Simulasi ini dilakukan dengan menerapkan tiga metode pendugaan area kecil ketika peubah penyerta mengandung galat pengukuran, antara lain metode SAE EBLUP-FH, metode SaeME Ybarra-Lohr, dan metode Hierarchical Bayesian SaeME.
Selanjutnya, ketiga metode pendugaan tersebut juga diterapkan pada kajian empiris. Bertujuan untuk memperoleh pendugaan Indeks Harga Konsumen Kelompok Pengeluaran (IHK-KP) dengan lokus penelitian di Provinsi Jawa Barat.
Indeks harga konsumen merupakan salah satu indikator ekonomi yang digunakan untuk mengetahui perkembangan harga barang/jasa yang dikonsumsi masyarakat.
Perubahan IHK dari waktu ke waktu menggambarkan tingkat kenaikan (inflasi) atau tingkat penurunan (deflasi) yang mencerminkan kemampuan daya beli masyarakat. Semakin tinggi inflasi maka semakin rendah nilai uang dan semakin rendah daya belinya. IHK merupakan penentu kebijakan ekonomi, baik bagi pemerintah pusat maupun daerah. Sebagai salah satu indikator ekonomi, IHK yang ada saat ini hanya mencakup beberapa kota di Indonesia. Kebutuhan akan statistik IHK ini menjadi kebutuhan di semua wilayah sebagai informasi dalam pengendalian inflasi. Akan tetapi, untuk memperoleh ukuran sampel di semua kabupaten/kota masih belum bisa terpenuhi. Oleh karena itu, pendugaan IHK Kabupaten/Kota perlu dilakukan. Metode pendugaan area kecil dapat menjadi solusi dalam melakukan pendugaan tersebut.
Beberapa kajian dilakukan untuk menduga data IHK dengan metode pendugaan area kecil. Wurz et al. (2017) menggunakan metode pendugaan area kecil untuk menghasilkan keranjang komoditas dengan akurasi yang lebih tinggi.
Dawber et al. (2019) menggunakan Metode SAE model Fay-Herriot untuk meningkatkan estimasi regional memanfaatkan penggunaan SAE untuk mengestimasi bobot pengeluaran daerah dalam IHK regional. Fengki (2020) mengestimasi IHK Kelompok Pengeluaran di Provinsi Jawa Barat dan Provinsi Maluku dengan menggunakan peubah penyerta yang berasal dari data PODES.
Pusponegoro (2022) menyusun IHK Kelompok Pengeluaran seluruh Kabupaten/Kota di Indonesia dengan menggunakan Penalti Norml1. Peubah penyerta yang digunakan juga berasal dari data PODES.
4
Berdasarkan penelitian yang telah ada, pendugaan IHK dilakukan dengan menggunakan peubah penyerta yang berasal dari data registrasi (Potensi Desa/PODES). Data PODES merupakan satu-satunya sumber data tematik berbasis wilayah yang mampu menggambarkan potensi yang dimiliki oleh suatu wilayah setingkat desa di seluruh Indonesia. Selain PODES, terdapat data survei lain yang memiliki ukuran sampel besar, salah satunya adalah SUSENAS. Akan tetapi, karena merupakan data survei, SUSENAS memungkinkan adanya galat pengukuran. Oleh karena itu, pada kajian empiris peneliti tertarik untuk menerapkan metode SAE EBLUP-FH, SaeME Ybarra Lohr dan SaeME Bayes Berhierarki dalam pendugaan IHK di Provinsi Jawa Barat dengan menggunakan peubah penyerta yang berasal dari SUSENAS yang memungkinkan adanya galat pengukuran. Pendekatan model bayes berhierarki menjadi ketertarikan peneliti pada pendugaan area kecil dengan peubah penyerta mengandung galat untuk memperoleh pendugaan yang lebih stabil.
1.2 Tujuan
Tujuan penelitian ini adalah sebagai berikut:
1. Mengkaji model pendugaan area kecil EBLUP-FH, SaeME Ybarra Lohr dan SaeME Bayes Berhierarki pada data simulasi dengan skenario pada aspek ragam pengaruh acak dan skenario pada peubah penyerta.
2. Menerapkan model pendugaan area kecil EBLUP-FH, SaeME Ybarra Lohr dan SaeME Bayes Berhierarki pada data IHK Januari 2019 Provinsi Jawa Barat.
5
II TINJAUAN PUSTAKA
2.1 Indeks Harga Konsumen
Indeks harga adalah ukuran proporsi atau persentase, perubahan harga dari waktu ke waktu. Indeks harga konsumen (IHK) mengukur perubahan dari waktu ke waktu pada tingkat umum harga barang dan jasa yang diperoleh rumah tangga untuk tujuan konsumsi (UN 2009). Indeks harga konsumen digunakan untuk mengukur perbedaan tingkat harga antara berbagai kota, wilayah, atau negara pada titik waktu yang sama. Pada awalnya IHK diperkenalkan untuk memberikan ukuran perubahan biaya hidup pekerja, sehingga kenaikan upah dapat dikaitkan dengan harga. Seiring waktu, IHK telah memperluas cakupannya, dan saat ini digunakan sebagai indikator makroekonomi, sebagai alat oleh pemerintah dan bank sentral untuk menghitung inflasi dan untuk memantau stabilitas harga, dan sebagai deflator di neraca nasional.
Terdapat tiga kegunaan utama IHK dalam UN (2009). Pertama sebagai indeksasi upah kelompok tertentu yang mewakili cakupan kelompok yang bersangkutan. Contohnya penggunaan bobot IHK yang digunakan untuk indeksasi pensiunan yang mencakup hanya pengeluaran populasi pensiun. IHK yang digunakan untuk mengindeks pensiun dapat menggunakan bobot yang berkaitan dengan rumah tangga pensiunan dan mengecualikan barang yang dianggap tidak relevan. Contoh lain, IHK digunakan untuk mengindeks pembayaran lain, seperti pembayaran bunga atau sewa, atau harga obligasi. Kegunaan kedua adalah sebagai deflator neraca nasional. Dalam penggunaannya dibutuhkan konsistensi antara data harga yang digunakan untuk IHK dan data pengeluaran yang digunakan dalam neraca nasional. Keduanya harus mencakup kumpulan barang dan jasa yang sama dan menggunakan konsep yang sama serta klasifikasi yang sama, untuk perhitungan nasional adalah Classification of Individual Consumption According to Purpose (COICOP). Kegunaan yang ketiga adalah untuk memperoleh tingkat inflasi/deflasi.
Tingkat kenaikan (inflasi) atau tingkat penurunan (deflasi) dihitung sebagai persentase perubahan IHK dan merupakan indikator ekonomi yang kualitas datanya perlu ditingkatkan dari waktu ke waktu. Perubahan IHK dari waktu ke waktu menggambarkan tingkat inflasi/deflasi dari barang/jasa kebutuhan rumah tangga sehari-hari. Kenaikan atau penurunan harga barang/jasa mempunyai kaitan yang erat sekali dengan kemampuan daya beli dari uang yang dimiliki masyarakat.
Tingkat perubahan IHK yang terjadi, dengan sendirinya mencerminkan daya beli dari uang yang dipakai masyarakat untuk memenuhi kebutuhan sehari-hari.
Semakin tinggi inflasi maka semakin rendah nilai uang dan semakin rendah daya belinya (BPS 2013). Dalam menghitung inflasi, cakupan komoditas IHK dapat disesuaikan untuk menunjukkan berapa tingkat inflasi di sektor tertentu sehingga dapat dijelaskan apakah ada pengaruh perubahan pajak atau perubahan harga yang diatur pemerintah terhadap tingkat inflasi baik daerah maupun Nasional. Dan tingkat inflasi bisa berbeda-beda di tiap daerah, sehingga langkah yang diambil selanjutnya dapat melihat inflasi di masing-masing wilayah.
IHK memiliki dua cakupan wilayah, yaitu IHK Nasional dan IHK daerah yang dalam hal ini adalah Kabupaten/Kota. IHK Nasional mencakup pengeluaran dan harga secara Nasional. Data yang dikumpulkan adalah data deret waktu harga
6
di berbagai daerah selama periode waktu tertentu. Setiap daerah perlu memiliki sampel sehingga sampel yang ada representatif untuk menggambarkan IHK Nasional. Hasil pengumpulan data harga untuk masing-masing daerah akan mungkin berbeda. Daerah yang memiliki perbedaan harga yang berbeda dan memiliki pengaruh yang signifikan terhadap IHK Nasional harus tercakup dalam IHK sehingga dapat meningkatkan keterwakilan. Dan akan menjadi tidak efisien bila mengumpulkan data harga pada daerah dengan penduduk yang sedikit jika hanya akan berdampak kecil terhadap IHK Nasional. Dalam melakukan pembobotan daerah, jika IHK daerah digunakan untuk menghitung IHK Nasional, bobot daerah perlu didasarkan oleh pengeluaran daerah dibandingkan oleh jumlah penduduk daerah.
IHK biasanya dipublikasikan setiap bulan dan terkadang setiap triwulan.
IHK menyediakan informasi yang tepat waktu, biasanya sekitar dua minggu setelah akhir bulan atau kuartal. Di Indonesia, Statistik IHK dikeluarkan oleh BPS, dengan definisi sebagai indeks yang mengukur rata-rata perubahan harga antarwaktu dari suatu paket jenis barang dan jasa yang dikonsumsi oleh penduduk/rumah tangga di daerah perkotaan dengan dasar suatu periode tertentu.
IHK dikeluarkan oleh BPS setiap bulan dan dipublikasikan setiap awal bulan.
Penghitungan IHK dibangun dari sekumpulan harga dan nilai konsumsi barang/jasa. Pemilihan jenis barang/jasa (komoditas) untuk tiap kota di Indonesia dilakukan berdasarkan dari hasil Survei Biaya Hidup (SBH). Paket komoditas tetap digunakan dalam mengolah IHK sehingga komoditas yang ada dalam paket komoditas tidak dapat diganti atau dihilangkan sampai dilaksanakannya kembali SBH berikutnya. SBH pertama kali dilakukan pada tahun 1977/1978. Dilanjutkan pada tahun 1988/1989, 1996, 2002, 2007, 2012 dan 2018. Perubahan pola konsumsi maupun biaya hidup masyarakat menjadikan paket komoditas dan diagram timbang hasil SBH yang ada sudah tidak sesuai untuk menggambarkan keadaan terkini. Oleh karena itu, perlu dilakukan SBH yang lebih terbaru.
Tabel 1 Kelompok komoditas barang dan jasa berdasarkan kelompok pengeluaran (2012=100)
No Kelompok Pengeluaran Jumlah
Subkelompok
1 Bahan makanan 11
2 Makanan jadi, minuman, rokok dan tembakau 3
3 Perumahan, air, listrik, gas dan bahan bakar 4
4 Sandang 4
5 Kesehatan 4
6 Pendidikan, rekreasi dan olahraga 5
7 Transpor, komunikasi dan jasa keuangan 4
Total 35
SBH 2012 dilakukan di 82 Kota IHK dan terdapat total 859 komoditas, setiap kota IHK memiliki 224-461 komoditas. Komoditas-komoditas tersebut terbagi dalam 7 kelompok dan 35 sub kelompok pengeluaran konsumsi (Tabel 1).
Paket komoditas dan diagram timbang hasil SBH 2012 digunakan untuk mengolah IHK tahun 2014 hingga tahun 2019. Maka statistik IHK yang dikeluarkan BPS tahun 2014 hingga tahun 2019 pada tingkat nasional dan
7 kabupaten/kota, masing-masingnya meliputi IHK total, IHK 7 kelompok pengeluaran dan IHK 35 subkelompok pengeluaran.
Kelompok pengeluaran pada IHK (2018=100) antara lain adalah kelompok makanan, minuman, dan tembakau; kelompok pakaian dan alas kaki, kelompok perumahan, air, listrik, gas dan bahan bakar lainnya; kelompok perlengkapan, peralatan, dan pemeliharaan rutin rumah tangga; kelompok kesehatan; kelompok transportasi; kelompok informasi, komunikasi dan jasa keuangan; kelompok rekreasi, olahraga, dan budaya; kelompok pendidikan; kelompok penyediaan makanan dan minuman restoran; serta kelompok perawatan pribadi dan jasa lainnya. IHK yang diolah dengan tahun dasar 2018 (2018=100) ini dipublikasikan pertama kali pada IHK Januari 2020.
Pada prinsipnya, seluruh wilayah harus tercakup dalam IHK Nasional termasuk wilayah perkotaan dan pedesaan. Akan tetapi, statistik IHK yang digunakan di Indonesia adalah IHK Perkotaan. Pemilihan sampel kota IHK berdasarkan tingkat pembangunan di bidang perekonomian yaitu Produk Domestik Regional Bruto (PDRB), pengeluaran per kapita, letak geografis, serta mempertimbangkan usulan dari BPS provinsi, BPS kabupaten/kota dan walikota/bupati setempat. Di masingβmasing kota kemudian akan dilakukan pengumpulan data IHK. Pencacahan dilakukan di pasar tradisional, modern/swalayan, dan outlet terpilih (BPS 2013). Dan yang menjadi responden dalam survei IHK adalah pedagang eceran yang menjual barang/jasa kebutuhan rumah tangga secara eceran yang umumnya berlokasi di pasar tradisiomal.
Sebagian responden tidak berlokasi di pasar, seperti di toko: bahan bangunan, emas, rumah makan, dan lainnya. Selain pedangang eceran, responden data HK juga di peroleh dari tempatβtempat yang memberikan pelayanan jasa seperti tempat praktek dokter, salon, rumah sakit, sekolah/perguruan tinggi, permbantu rumah tangga dan sebagainya.
Jenis barang/jasa yang dipilih adalah berdasarkan paket komoditas hasil SBH. Kualitas/merk dari barang/jasa yang akan diamati harganya merupakan kualitas/merk yang banyak digemari atau banyak dikonsumsi masyarakat.
Kualitas/merk yang dipilih pun dapat terus diamati harganya setiap waktu, apabila kualitas/merk tertentu sudah tidak beredar di pasaran maka digantikan dengan kualitas/merk lain dari jenis barang/jasa yang sama.
2.2 Metode Penghitungan IHK
Dalam menghitung IHK diperlukan data harga, yaitu dari kualitas/merek barang/jasa yang diperoleh dari hasil pencacahan survei HK. Berbagai rumus dapat dipakai untuk menghitung IHK, tetapi BPS menggunakan rumus Laspeyres yang dimodifikasi. Penghitungan IHK menggunakan rumus Laspeyres yang dimodifikasi (Modified Laspeyres Index) adalah sebagai berikut:
πΌπ =
β πππ
π(πβ1)ππ(πβ1)ππ0π ππ=1
βπ π0ππ0π π=1
Γ 100 (2.1)
dengan:
πΌπ = Indeks periode ke-n
πππ = Harga jenis barang i, periode ke-n
8
π(πβ1)π = Harga jenis barang i, periode ke-(n-1)
π(πβ1)ππ0π = Nilai konsumsi jenis barang i, periode ke-(n-1) π0ππ0π = Nilai konsumsi jenis barang i pada tahun dasar π = Jumlah jenis barang paket komoditas
π0ππ0π adalah nilai konsumsi jenis barang π pada tahun dasar atau dapat dituliskan sebagai ππΎ0π . Dari formula diatas dapat disederhanakan bahwa
π(πβ1)π
π(πβ1)π = 1 sehingga diperoleh πππ π0π sebagai nilai konsumsi jenis barang π pada periode ke-n (ππΎππ), sehingga rumus untuk memperoleh indeks harga konsumen dapat dituliskan sebagai berikut:
πΌπ =βππ=1ππΎππ
βππ=1ππΎ0πΓ 100 (2.2)
2.3 Pendugaan Langsung
Survei sampel umumnya digunakan untuk mendapatkan perkiraan jumlah, nilai tengah, dan parameter lain, tidak hanya untuk total populasi tetapi juga subpopulasi (domain). Pendugaan langsung dari subpopulasi didasarkan pada data sampel subpopulasi. Pendugaan langsung umumnya berdasarkan penarikan sampel (Rao dan Molina 2015). Teknik pengambilan sampel dalam pendugaan langsung berbasis desain dikembangkan oleh Cohcran (1977). Pendugaan langsung yang didasarkan oleh model juga telah dikembangkan oleh Valliant et al.
(2001). Domain dikatakan besar jika ukuran sampel domain cukup besar untuk menghasilkan pendugaan langsung dengan presisi yang memadai. Untuk mendapatkan pendugaan langsung dengan presisi yang memadai diperlukan ukuran sampel yang juga besar.
Jika suatu area i diamati suatu data amatan ke-j (π¦ππ) dengan penduganya (π¦Μππ) dan galat (πππ), maka persamaan linearnya dapat dituliskan sebagai berikut.
π¦Μππ = π¦ππ+ πππ, π = 1,2, β¦ π, π = 1,2, β¦ ππ (2.3) dengan ππ adalah ukuran populasi di area i dan ukuran populasi seluruhnya adalah π = β ππ. Dalam survei dikenal dua jenis galat atau error. Galat pada persamaan di atas dimaksudkan pada galat yang disebabkan karena kesalahan pengambilan sampel. Galat jenis kedua, galat yang bukan disebabkan pengambilan diasumsikan nol.
Pada pendugaan yang didasarkan desain sampel, maka bobot survei memiliki peranan penting dalam menduga π¦Μππ bagi π¦ππ. Pendugaan langsung desain sampel nilai tengah area ke-i dapat diperoleh dengan rumus sebagai berikut:
π¦Μ Μπ = 1
βππ π€ππ π=1
βππ=1π π€πππ¦ππ (2.4) Pembobot ini tergantung pada ππ dan elemen j. Jika peluang pengambilan sampel data amatan ke-j di area i adalah πππ = π(ππ) maka pembobot (π€ππ) adalah 1/πππ. Peluang pemilihan sampel bergantung pada desain surveinya. Pembobot (π€ππ)
9 juga akan bergantung pada desain surveinya. Terdapat berbagai macam desain pengambilan sampel. Salah satu desain pengambilan sampel yang sederhana adalah simple random sampling (SRS), yaitu mengambil sampel acak sederhana berukuran n dari nomor acak 1 hingga N. Dan dalam SRS, bobot pendugaan langsung akan sama karena peluang pengambilan sampel diperoleh dari rasio banyaknya sampel dibandingkan total populasi sehingga diperoleh peluang πππ = ππ/ππ . Maka nilai pembobot menjadi π€ππ = ππ/ππ , dengan π€ππ > 0 dan
βππ=1π π€ππ = π.
Penduga nilai tengah area ke-i dengan metode SRS dapat diperoleh dengan mengganti pembobot π€ππ menjadi ππ/ππ dan βππ=1π π€ππ = π , sehingga dapat dituliskan dengan rumus sebagai berikut
π¦Μ Μπ = 1
ππβππ=1π π¦ππ (2.5) Penduga nilai tengah area i (π¦Μ Μπ) yang dihasilkan merupakan penduga yang tak bias sehingga kuadrat tengah galat (KTG) yang dihasilkan adalah πΎππΊ(π¦Μ Μπ) = πππ(π¦Μ Μπ) + (π΅πππ (π¦Μ Μπ))2, ketika bias = 0, maka πΎππΊ(π¦Μ Μπ) = πππ(π¦Μ Μπ)
πΎππΊ(π¦Μ Μπ) =π π2
ππ [ππβππ
ππ ] (2.6) Dengan π π2 = β (π¦ππβπ¦Μ )π
ππ 2 π
ππβ1 dan jika ππ berukuran sangat kecil dibandingkan ππ, maka KTG penduga langsung SRS adalah sebagai berikut:
πΎππΊ(π¦Μ Μπ) =π π2
ππ (2.7) 2.4 Pendugaan Area Kecil
Area kecil didefinisikan sebagi domain berukuran kecil (subpopulasi) yang tidak dapat menghasilkan pendugaan langsung dengan presisi yang memadai.
Biasanya, ukuran sampel domain cenderung meningkat seiring dengan ukuran populasi domain, tetapi hal ini tidak selalu terjadi. Pendugaan area kecil dilakukan untuk menduga parameter secara tidak langsung di suatu area yang relatif kecil dalam percontohan survei (Sadik dan Notodiputro 2006). Pendugaan langsung (direct estimation) pada subpopulasi tidak memiliki presisi yang memadai karena kecilnya jumlah sampel yang digunakan untuk memperoleh dugaan tersebut.
Sebagai alternatif, pendugaan tidak langsung (indirect estimation) dalam menduga area kecil dilakukan dengan meminjam kekuatan peubah lain yang terkait sehingga dapat meningkatkan kefektifan ukuran sampel. Ketersediaan informasi tambahan dan penentuan model yang baik dan sesuai adalah penting dalam mendapatkan pendugaan tidak langsung khususnya pada area kecil (Rao dan Molina 2015)
Model pendugaan area kecil dibagi menjadi dua jenis menurut ketersediaan peubah penyerta, yaitu model tingkat area dan model tingkat unit. Model tingkat area merupakan model yang digunakan apabila peubah penyerta hanya tersedia pada tingkat area. Model tingkat unit adalah model yang digunakan apabila peubah penyerta tersedia sampai tingkat unit. Model tingkat area lebih sering digunakan karena tidak memerlukan ketersediaan peubah penyerta sampai tingkat unit.
Dalam Sadik dan Notodiputro (2006), terdapat dua ide utama yang digunakan untuk mengembangkan model pendugaan parameter area kecil yaitu
10
(1) asumsi bahwa keragaman didalam area kecil peubah respons dapat diterangkan seluruhnya oleh hubungan keragaman yang bersesuaian pada informasi tambahan, kemudian disebut model pengaruh tetap (fixed effect models), dan (2) asumsi keragaman spesifik area kecil tidak dapat diterangkan oleh informasi tambahan dan merupakan pengaruh acak area kecil (random effect).
Gabungan dari dua asumsi tersebut membentuk model pengaruh campuran (mixed models). Fay dan Herriot (1979) menggunakan model pengaruh campuran dengan pengaruh acak yang hanya mengandung intersep, dengan kata lain model hanya meliputi pengaruh acak area, untuk menduga rata-rata pendapatan sub populasi dengan menggunakan data sensus 1970 di Amerika Serikat.
Terdapat dua pendugaan parameter dalam model pengaruh campuran yaitu antara lain best linear unbiased prediction (BLUP) dan empirical best linear unbiased prediction (EBLUP). Kedua metode ini meminimumkan kuadrat tengah galat di antara penduga tidak bias linier dan tidak bergantung pada normalitas efek acak. Tetapi mereka bergantung pada varians (dan mungkin kovarian) dari efek acak, yang disebut komponen varians. Metode BLUP mengasumsikan ragam peubah acak dalam model campuran (komponen ragam) diketahui. Metode EBLUP adalah metode yang mengasumsikan komponen ragam yang tidak diketahui disubtitusi oleh penduganya (Kurnia 2009).
2.5 Model Level Area pada SAE
Pada model tingkat area, peubah penyerta ππ= (π₯π1, β¦ π₯ππΎ)π tersedia sampai level kecil dan peubah yang diamati diasumsikan merupakan fungsi dari rata-rata peubah respons ππ = π(πΜ π) untuk π(. ). Dengan π§π adalah konstanta bernilai positif yang diketahui dan π· = (π½π, β¦ , π½πΎ)π adalah koefisien regresi, π’π adalah pengaruh acak kecil (sering diasumsikan normal), maka model linear untuk area kecil adalah sebagai berikut:
ππ = πππ»π· + π§ππ’π, π = 1, β¦ , π (area kecil) (2.8)
Penduga rata-rata area kecil dengan penduga langsung πΜ Μπ diketahui yaitu:
π¦π = π(πΜ Μ) = ππ π + ππ (2.9) Dengan π’π dan ππ adalah saling bebas, ππ adalah galat pengambilan sampel (sampling error), ππ~π(0, ππ2), sehingga model tingkat area (model bentuk campuran linear atau dikenal sebagai model Fay-Herriot) dapat dituliskan pada persamaan sebagai berikut:
π¦π = πππ»π· + π§ππ’π + ππ (2.10) 2.6 EBLUP Model Level Area pada SAE
Terdapat dua pendugaan parameter dalam model pengaruh campuran yaitu antara lain best linear unbiased prediction (BLUP) merupakan pendugaan parameter dalam model pengaruh campuran, yang meminimumkan kuadrat tengah galat yang dihasilkan dengan asumsi komponen varian diketahui. Penduga BLUP untuk ππ dirumuskan sebagai berikut:
πΜππΉπ» (π΅πΏππ) = πππ»π·Μ + πΎπ(π¦π β πππ»π·Μ)
= πΎππ¦π+ (1 β πΎπ) πππ»π·Μ (2.11)
11 Diketahui π = 1, β¦ , π dan πΎπ = ππ’2π§π2/(ππ’2π§π2+ ππ2π) serta π·Μ adalah penduga BLUE untuk π· π·Μ = π·Μ(ππ’2) = [βππ=1πππππ»/(ππ’2π§π2+ ππ2π)]β1[βππ=1πππΜππ·/ (ππ’2π§π2+ ππ2π)]. Pada penduga BLUP nilai ππ’2 diasumsikan diketahui. Akan tetapi, dalam praktiknya, ragam pengaruh acak (ππ’2) tidak diketahui, sehingga harus diduga terlebih dahulu. Pendugaan ragam pengaruh acak ini dapat digunakan dengan metode momen dan juga metode Maximum Likelihood (ML). Hasil pendugaan ππ’2 kemudian akan digantikan oleh πΜπ’2 ke dalam penduga BLUP. Maka akan diperoleh penduga baru yang dikenal sebagai penduga EBLUP, yang merupakan nilai rata-rata tertimbang (dengan penimbang πΎΜπ ) dari penduga langsung (π¦π) dan model sintesisnya (πππ»π·Μ) :
πΜππΉπ» (πΈπ΅πΏππ) = πΎΜππ¦π + (1 β πΎΜπ) πππ»π·Μ (2.12) Dengan πΎΜπ = πΜπ’2π§π2/(πΜπ’2π§π2 + ππ2π)dan nilai π·Μ merupakan nilai π·Μ pada persamaan (2.13) ketika ππ’2 digantikan oleh πΜπ’2. Untuk mengukur kebaikan penduga EBLUP, maka dapat dilakukan dengan menghitung nilai kuadrat tengah galat (KTG) dengan rumus sebagai berikut:
KTG(πΜππΉπ» (πΈπ΅πΏππ)) = π1π(πΜπ’2) + π2π(πΜπ’2) + π3π(πΜπ’2) (2.13) dengan
π1π(πΜπ’2) = πΎΜπππ2π (2.14)
π2π(πΜπ’2) = (1 β πΎΜπ)2πππ»[βππ=1πππππ»/(ππ’2π§π2+ ππ2π)]β1ππ (2.15) π3π(πΜπ’2) = πΈ(πΜππΉπ» (πΈπ΅πΏππ)β πΜππΉπ» (π΅πΏππ))2 = ππ4ππ§π4(πΜπ’2π§π2+ ππ2π)β3πΜ (πΜπ’2) (2.16)
yang πΜ (πΜπ’2) = 2[βππ=1π§π4/(πΜπ’2π§π2+ ππ2π)]β1 adalah ragam asimptotik untuk πΜπ’2.
2.7 Pendugaan Area Kecil dengan Peubah Penyerta Mengandung Galat Pengukuran
Pendugaan area kecil yang dikembangkan oleh Fay dan Herriot (1979) menggunakan informasi tambahan yang bersumber dari data administratif untuk mengurangi kuadrat tengah galat dari penduga area kecil, diasumsikan bahwa informasi tambahan tersebut tersedia untuk semua area dan diukur tanpa kesalahan. Kemudian pendugaan area kecil ini dikembangkan oleh Ybarra dan Lohr (2008), menduga karakteristik kesehatan yang diukur dalam the National Health and Nutrition Examination Survey dengan peubah penyerta diperoleh dari the U.S National Health Interview Survey. Karena dalam survei memiliki kesalahan baik kesalahan akibat pengambilan sampel dan kesalahan bukan akibat pengambilan sampel, sehingga informasi tambahan atau peubah penyerta yang digunakan mengandung kesalahan. Oleh karena itu pengembangan ini dikenal sebagai Small Area Estimation with Error (SAEME) atau pendugaan area kecil dengan peubah penyerta yang mengandung galat.
Dalam pendugaan area kecil, ππ merupakan nilai dari peubah penyerta area ke-i. Jika semua komponen ππ diketahui, kita menggunakan model 2.10, akan tetapi ketika ππ adalah peubah penyerta yang diukur dengan adanya galat, maka
12
model dengan pengukuran yang mengandung galat menjadi sebagai berikut (Ybarra dan Lohr, 2008):
π¦π = πΜππ»π· + ππ(πΜπ, ππ) + ππ (2.17) Penduga πΜπ menggantikan nilai untuk ππ , dengan ππ(πΜπ, ππ) = π’π + (ππβ πΜπ)ππ½. Diasumsikan bahwa penduga untuk ππ tersedia untuk seluruh area i.
Jika beberapa komponen ππ tidak terukur, kita dapat melakukan imputasi atau mengestimasinya. Dalam model ini diasumsikan π’π dan ππ adalah saling bebas.
2.8 EBLUP Model Level Area pada SAEME
Jika parameter diketahui maka penduga BLUP untuk ππ pada model penduga area kecil dengan peubah penyerta yang mengandung galat dirumuskan sebagai berikut:
πππΉπ» (π΅πΏππ) = πΎππ¦π + (1 β πΎπ) πππ»π· (2.18)
dengan πΎπ = ππ’2/(ππ’2+ ππ2) . Akan tetapi dalam praktiknya, nilai π· dan ππ’2 tidak diketahui sehingga parameter ini perlu diestimasi. Misalkan
penduga πΜπ dengan MSE (πΜπ) = πΆπ. Karena ππ dapat diukur dengan kesalahan, maka mengganti penduga πΜπ untuk ππ, sehingga diperoleh
π¦π = πΜππ»π· + (ππβ πΜπ)π· + π’π + ππ (2.19) maka model Ybarra dan Lohr (2008) dinotasikan ππππΈ = πΎππ¦π + (1 β πΎπ) πΜππ»π· dengan πΎπ = ππ’2+ π½ππΆππ½/(ππ’2 + π½ππΆππ½ + ππ2) . Misalkan π€1, β¦ , π€π adalah himpunan dari bobot terbatas yang dibatasi dari 0. Parameter regresi yang
diestimasi didefinisikan π·Μπ = (βππ=1π€π(πΜππΜππ»β πΆπ))β1βππ=1π€ππΜππ¦π dengan π€π = 1/(ππ’2+ π½ππΆππ½ + ππ2) untuk π = 1, β¦ , π. Dan untuk mengestimasi
penduga ππ’2 dapat dihitung dengan rumus sebagai berikut:
πΜπ’2 = (π β π)β1βππ=1{(π¦π β πππ»π·Μπ)2β ππ2β π·Μππ»πΆππ·Μπ} (2.20) Ketika π· dan ππ’2 digantikan dengan pendugaannya yaitu π·Μ dan πΜπ’2, maka pendugaan area kecil dengan galat pengukuran dapat dilakukan dengan persamaan sebagai berikut:
πΜπππΈ = πΎΜππ¦π+ (1 β πΎΜπ) πΜππ»π· (2.21) dengan πΎΜπ = πΜπ’2+ π½ΜππΆππ½Μ/(πΜπ’2+ π½ΜππΆππ½Μ + ππ2). Hasil pendugaan π· yang dari model Ybarra dan Lohr adalah penduga yang konsisten dan memiliki sebaran normal asimptotik. πΜπ’2 yang dihasilkan juga merupakan penduga yang konsisten dalam kondisi keteraturan tertentu. Akan tetapi permasalahan yang ditemui dari hasil pendugaan dengan Ybarra-Lohr adalah penduga yang tidak efisien. Penduga πΜπ’2 yang terlibat dalam πΜπππΈ, memiliki ragam yang jauh lebih besar. Hal ini mengakibatkan kuadrat tengah galat yang dihasilkan relatif tinggi dan tidak stabil.
Maka kemudian, Arima et al. (2015) mengkaji model bayesian berhierarki dengan galat pengukuran. Hasil menunjukkan bahwa ketidakpastian pengukuran ragam posterior dari penduga bayesian adalah lebih stabil dari pada KTG EBLUP yang diusulkan Ybarra-Lohr (2008).
2.9 Model Bayesian pada Pendugaan Area Kecil
Teori statistik klasik mengasumsikan parameter sebagai kuantitas tetap, hanya data yang acak, dan sebaran peluang hanya dapat digunakan untuk