KAJIAN TRANSFORMASI LOGARITMA UNTUK PENDUGA
SPATIAL EMPIRICAL BEST LINEAR UNBIASED
PREDICTION
PADA PENDUGAAN AREA KECIL
HAZAN AZHARI ZAINUDDIN
SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA
Dengan ini saya menyatakan bahwa tesis berjudul “Kajian Transformasi Logaritma untuk Penduga Spatial Empirical Best Linear Unbiased Prediction pada Pendugaan Area Kecil” adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apapun kepada perguruan tinggi manapun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir tesis ini.Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor.
Bogor, April 2016
RINGKASAN
HAZAN AZHARI ZAINUDDIN. Kajian Transformasi Logaritma untuk Penduga Spatial Empirical Best Linear Unbiased Prediction pada Pendugaan Area Kecil. Dibimbing oleh KHAIRIL ANWAR NOTODIPUTRO dan KUSMAN SADIK.
Berbagai survei umumnya dirancang untuk menduga parameter populasi berskala nasional. Masalah akan timbul jika dari survei tersebut ingin diperoleh informasi untuk area yang lebih kecil, misalnya pada level propinsi,level kabupaten atau level kecematan. Ukuran contoh pada level area tersebut biasanya sangat kecil sehingga statistik yang diperoleh akan memiliki ragam yang besar. Guna mengatasi hal ini, dikembangkan sebuah metode pendugaan parameter yang dikenal metode pendugaan area kecil (small area estimation, SAE). Salah satu metode dalam pendugaan area kecil adalah Empirical Best Linear Unbiased Prediction (EBLUP). Metode Empirical Best Linear Unbiased Prediction (EBLUP) telah banyak digunakan untuk Small Area Estimation. Beberapa tahun kemudian pendekatan EBLUP dikembangkan dengan memasukkan pengaruh spasial ke dalam model. Penduga EBLUP dengan memperhatikan pengaruh acak area yang berkorelasi spasial dikenal dengan istilah penduga Spatial Empirical Best Linear Unbiased Prediction (SEBLUP). Penduga SEBLUP maupun EBLUP menggunakan model campuran linier dalam pendugaannya. Model campuran linier memiliki asumsi distribusi normal sehingga data (peubah yang menjadi perhatian) yang digunakan pada penduga SEBLUP maupun EBLUP harus memilki distribusi normal. Pada kenyataanya, data yang ditemukan dilapangan memiliki distribusi tidak normal sehingga model yang digunakan untuk pendugaan akan memberikan hasil yang kurang baik. Salah satu dari metode untuk menangani masalah tersebut adalah dengan menggunakan transformasi logaritma pada peubah yang menjadi perhatian agar distribusinya mendekati distribusi normal. Pada kenyataannya, ada juga data yang memilki distribusi tidak normal sekaligus memilki pengaruh spasial sehingga diperlukan metode pendugaan yang tepat untuk menangani masalah tersebut. Pada penelitian ini, transformasi logaritma dilakukan pada metode SEBLUP. Penduga ini diharapkan dapat menghasilkan penduga dengan presisi dan akurasi yang lebih baik. Penduga transformasi logaritma SEBLUP juga diharapkan dapat mengatasi data yang memilki distribusi tidak normal sekaligus memiliki pengaruh spasial.
Hasil dari kajian simulasi menunjukkan bahwa penduga transformasi logaritma SEBLUP memiliki nilai rata-rata BR dan nilai rata-rata AKTGR yang hampir sama jika dibandingkan dengan penduga transformasi logaritma EBLUP. Hasil simulasi ini sejalan dengan hasil studi kasus rata-rata pengeluaran per kapita tingkat kecamatan di kota atau kabupaten Bogor 2010. Sehingga dapat disimpulkan bahwa penduga transformasi logaritma SEBLUP dan penduga transformasi logaritma EBLUP sama baiknya. Kedua penduga tersebut memiliki performa yang sama dalam melakukan pendugaan area kecil.
on Spatial Empirical Best Linear Unbiased Prediction Estimator in Small Area Estimation. Supervised by KHAIRIL ANWAR NOTODIPUTRO and KUSMAN SADIK.
Various surveys have been generally designed to estimate population parameters in nationwide scale. Problems appear if any information for smaller areas from the survey needs to be obtained, for example at the provincial level, district level or sub district level. The sample size at the level of the area is usually very small the estimates have a large variances. To overcome this problem, a parameter estimation method called Small Area Estimation (SAE) has been developed. One of the methods in small area estimation is Empirical Best Linear Unbiased Prediction (EBLUP).
Empirical Best Linear Unbiased Prediction (EBLUP) method has been widely used for small area estimation. A few years later the EBLUP approach has been developed by incorporating spatial effect into the model. The estimator concerns with the random effect of the area which was spatially correlated known as Spatial Empirical Best Linear Unbiased Prediction (SEBLUP). EBLUP and SEBLUP estimators are basically obtained from linear mixed models. Linear mixed models have assume normal distribution assumption of the data. In fact, it is often that the data are not normally distributed. One of the methods to deal with the problem is to use a logarithm transformation on the variables of interest so that the distribution approaches a normal distribution. In fact, it is also often that the data is not normally distribut nor spatially independent. In this study, methods of logarithmic transformation on SEBLUP were discussed.
The results of simulation studies showed that the logarithmic transformation on SEBLUP estimator produced an average relative bias (RB) and the average relative root mean square error (RRMSE) almost the same in each scenario of simulations when compared to logarithmic transformation on EBLUP estimator. The application of this method to estimate average per capita expenditure in the sub-district of Bogor in 2010 showed similar results with the simulation results. It can be concluded that the logarithmic transformation on SEBLUP estimator and the logarithmic transformation on EBLUP estimator have the same performance in small area estimation
© Hak Cipta Milik IPB, Tahun 2016
Hak Cipta Dilindungi Undang-Undang
Tesis
sebagai salah satu syarat untuk memperoleh gelar Magister Sains pada
Program Studi Statistika
SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
HAZAN AZHARI ZAINUDDIN
KAJIAN TRANSFORMASI LOGARITMA UNTUK PENDUGA
SPATIAL EMPIRICAL BEST LINEAR UNBIASED
Judul Tesis : Kajian Transformasi Logaritma untuk Penduga Spatial Empirical Best Linear Unbiased Prediction pada Pendugaan Area Kecil Nama : Hazan Azhari Zainuddin
NIM : G151130301
Disetujui oleh
Komisi Pembimbing
Prof. Dr. Ir. Khairil Anwar Notodiputro, MS Dr. Ir. Kusman Sadik, MS Ketua Anggota
Diketahui oleh
Ketua program Studi Dekan Sekolah Pascasarjana Statistika
Dr. Ir. Kusman Sadik, MS Dr. Ir. Dahrul Syah, M.Sc.Agr
PRAKATA
Puji dan syukur penulis ucapkan kehadirat Allah subhanahu wa ta’ala atas segala karunia-Nya sehingga penulis dapat menyelesaikan karya ilmiah yang berjudul “Kajian Transformasi Logaritma untuk Penduga Spatial Empirical Best Linear Unbiased Prediction p ada Pendugaan Area Kecil.”. Keberhasilan penulisan karya ilmiah ini tidak lepas dari bantuan, bimbingan, dan petunjuk dari berbagai pihak.
Terima kasih penulis ucapkan kepada Bapak Prof. Dr. Ir. Khairil Anwar Notodiputro, MS sebagai ketua komisi pembimbing dan Bapak Dr. Ir. Kusman Sadik M,Si sebagai aggota komisi pembimbing yang telah memberikan bimbingan, arahan serta saran kepada penulis. Ungkapan terima kasih terkhusus penulis sampaikan kepada orang tua, serta seluruh keluarga atas do’a, dukungan dan pengertiannya. Terima kasih pula kepada seluruh staf Jurusan Statistika, teman teman statistika (S2 dan S3) atas bantuannya dan kebersamaannya. Terima kasih tak lupa pula penulis sampaikan kepada semua pihak yang tidak dapat penulis sebutkan satu per satu yang telah membantu dalam penyusunan karya ilmiah ini.
Penulis menyadari bahwa karya ilmiah ini masih banyak kekurangan, oleh karena itu kritik, saran, dan masukan sangat penulis harapkan demi terlaksananya penelitian yang absah dan benar. Semoga penelitian ini dapat segera terlaksana sehingga dapat menghasilkan karya ilmiah yang bermanfaat.
Bogor, April 2016
DAFTAR ISI
DAFTAR TABEL vi
DAFTAR GAMBAR vi
DAFTAR LAMPIRAN vi
1 PENDAHULUAN 1
Latar Belakang 1
Tujuan Penelitian 2
2 TINJAUAN PUSTAKA 3
Pendugaan Area Kecil (Small Area Estimation) 3
Pendugaan Langsung (Direct Estimation) 3
Pendugaan Tidak Langsung (Indirect Estimation) 3
Empirical Best Linear Unbiased Predictor (EBLUP) 4
Spatial Empirical Best Linear Unbiased Predictor (SEBLUP) 4
Matriks Contiguity 6
Transformasi Logaritma EBLUP 6 Transformasi Logaritma SEBLUP 7
3 METODE PENELITIAN 8 Kajian Simulasi 8 Penerapan 10 4 HASIL DAN PEMBAHASAN 13 Kajian Simulasi 13 Penerapan 15 5 SIMPULAN DAN SARAN 20 Simpulan 20
Saran 20
DAFTAR PUSTAKA 21
LAMPIRAN 22
DAFTAR TABEL
1 Kombinasi simulasi 10
2 Nilai rata-rata bias relatif (BR) (%) 13
3 Nilai rata- rata AKTG (%) 14
4 Hasil Uji Autokorelasi Spasial dengan Indeks Moran 16
5 Jumlah desa dengan sumber mata pencaharian utama sebagian besar penduduk adalah pertanian 16
6 Dugaan Area Kecil untuk rata-rata Pengeluaran Per Kapita Tingkat Kecamatan di Kabupaten dan Kota Bogor (Ribu Rupiah) 2010 17
7 Dugaan area kecil untuk selang kepercayaan 95% rata-rata Pengeluaran Per Kapita Tingkat Kecamatan di Kabupaten dan Kota Bogor (Ribu Rupiah) 2010 18
DAFTAR GAMBAR 1 Ilustrasi matriks Contiguity tipe rook (a) , bishop (b), queen (c) 6
2 Peta simulasi 8
3 Diagram alir tahapan kajian simulasi 11
4 Diagram alir tahapan studi kasus 12
5 Normal quantile quantile plot (a) Y, pengeluaran per kapita per bulan (Rupiah) dan (b) bentuk transformasi logaritma peubah Y 15
DAFTAR LAMPIRAN 1 Keterangan komponen komponen pada penduga MSE SEBLUP 22
2 Peubah penyerta dari data PODES 2011 23
3 penduga RMSE untuk untuk rata-rata Pengeluaran Per Kapita SUSENAS 2010 Tingkat Kecamatan di Kabupaten dan Kota Bogor 24
1
1 PENDAHULUAN
Latar Belakang
Berbagai survei umumnya dirancang untuk menduga parameter populasi berskala nasional. Masalah akan timbul jika dari survei tersebut ingin diperoleh informasi untuk area yang lebih kecil, misalnya pada level propinsi,level kabupaten atau level kecamatan. Ukuran contoh pada level area tersebut biasanya sangat kecil sehingga statistik yang diperoleh akan memiliki ragam yang besar. Guna mengatasi hal ini, dikembangkan sebuah metode pendugaan parameter yang dikenal metode pendugaan area kecil (small area estimation, SAE).
Statistik area kecil (small area statistics) saat ini telah menjadi perhatian para statistisi dunia secara sangat serius. Telah banyak penelitian yang dikembangkan baik untuk perbaikan teknik dan pengembangan metode maupun aplikasi dalam berbagai kasus dan persoalan nyata yang dihadapi. Fay dan Herriot merupakan peneliti pertama yang mengembangkan pendugaan area kecil berbasis model. Model yang dikembangkannya kemudian menjadi rujukan dalam pengembangan penelitian pendugaan area kecil lebih lanjut sampai dengan saat ini. Ada dua asumsi dasar dalam mengembangkan model SAE, yaitu keragaman di dalam sub populasi peubah respon dapat diterangkan seluruhnya oleh hubungan keragaman yang bersesuaian pada informasi tambahan yang disebut pengaruh tetap (fixed effect) dan asumsi keragaman spesifik sub populasi tidak dapat diterangkan oleh informasi tambahan dan merupakan pengaruh acak sub populasi (random effect). Gabungan dari kedua asumsi tersebut membentuk model pengaruh campuran (mixed model). Salah satu sifat menarik dari model linier campuran adalah kemampuannya dalam menduga kombinasi linear dari pengaruh tetap dan pengaruh acak. Salah satu metode penyelesaian model linier campuran yang sering digunakan adalah prediksi tak bias linier terbaik empiris (Empirical Best Linear Unbiased Prediction, EBLUP). Dalam metode ini dilakukan pendugaan komponen ragam terlebih dahulu dengan metode kemungkinan maksimum (maximum likelihood) atau kemungkinan maksimum terkendala (restricted maximum likelihood).
Penduga SEBLUP maupun EBLUP menggunakan model campuran linier dalam pendugaannya. Model campuran linier memiliki asumsi distribusi normal sehingga data (peubah yang menjadi perhatian) yang digunakan pada penduga SEBLUP maupun EBLUP harus memilki distribusi normal. Pada kenyataanya, data yang ditemukan dilapangan memiliki distribusi tidak normal sehingga model yang digunakan untuk pendugaan akan memberikan hasil yang kurang baik. Kurnia (2009) menemukan beberapa metode pendugaan area kecil ketika datanya memilki distribusi yang tidak normal. Salah satu dari metode tersebut menggunakan transformasi logaritma pada peubah yang menjadi perhatian agar distribusinya mendekati distribusi normal. Pada kenyataannya, ada juga data yang memilki distribusi tidak normal sekaligus memilki pengaruh spasial sehingga diperlukan metode pendugaan yang tepat untuk menangani masalah tersebut. Pada penelitian ini, transformasi logaritma dilakukan pada metode SEBLUP. Penduga ini diharapkan dapat menghasilkan penduga dengan presisi dan akurasi yang lebih baik. Penduga transformasi logaritma SEBLUP juga diharapkan dapat mengatasi data yang memilki distribusi tidak normal sekaligus memiliki pengaruh spasial.
Tesis ini ditulis dalam lima bab. Bab 1 menjelaskan tentang motivasi dan tujuan dari penelitian ini. Bab 2 merupakan tinjauan atas literatur terkini yang terkait erat dengan topik penelitian ini. Bab ini juga memperjelas posisi penelitian ini di antara penelitian sejenis yang sudah pernah dilakukan. Bab 3 menjelaskan data dan metodologi yang digunakan di dalam tesis ini. Selanjutnya hasil simulasi beserta penerapan metode yang dikembangkan disajikan pada Bab 4. Tesis ini ditutup dengan kesimpulan dan saran yang dicantumkan pada Bab 5.
Tujuan Penelitian
Tujuan dari penelitian ini adalah:
1. Mengembangkan metode pendugaan area kecil pada data yang memiliki distribusi tidak normal dan memilki pengaruh spasial
3
2 TINJAUAN PUSTAKA
Pendugaan Area Kecil (Small Area Estimation)
Menurut Rao (2003), suatu area dikatakan besar apabila ukuran contoh pada area tersebut mampu menghasilkan presisi pendugaan yang baik dengan penduga langsung. Sebaliknya, suatu area dikatakan “kecil” apabila ukuran contoh pada area tersebut tidak cukup untuk menunjang penduga langsung agar mampu menghasilkan presisi pendugaan yang baik. Pendekatan lain seringkali diperlukan untuk mengatasi permasalahan tersebut, salah satunya adalah penduga tak langsung. Penduga tak langsung “meminjam informasi” dengan menggunakan nilai peubah dari contoh pada area lain yang terkait dengan area yang diamati.
Pendugaan Langsung (Direct Estimation)
Pelaksanaan survei ditujukan untuk menduga parameter populasi. Pendekatan klasik untuk menduga parameter populasi didasarkan pada aplikasi model disain penarikan contoh (design based) dan penduga yang dihasilkan dari pendekatan itu disebut penduga langsung (direct estimation). Data hasil survei ini dapat digunakan untuk mendapatkan penduga yang terpercaya dari total maupun rata-rata populasi suatu area atau domain dengan jumlah contoh yang besar. Namun, jika penduga langsung tersebut digunakan untuk suatu area yang kecil maka akan menimbulkan galat baku yang besar (Gosh & Rao, 1994).
Pendugaan Tidak Langsung (Indirect estimation)
Pada pendugaan area kecil terdapat dua jenis model dasar yang digunakan, yaitu model level area dan model level unit (Rao 2003).
a) Model level area
Model level area merupakan model yang didasarkan pada ketersediaan data pendukung yang hanya ada untuk level area tertentu, misalkan =
, , … , � dengan parameter yang akan diduga adalah � yang diasumsikan mempunyai hubungan dengan . Data pendukung tersebut digunakan untuk membangun model � = �� + , dengan i= 1,2,3,....,m dan ~ � , � ,sebagai pengaruh acak yang menyebar normal. Kesimpulan mengenai � dapat diketahui dengan mengasumsikan bahwa model penduga langsung telah tersedia, yaitu = � + , dengan i= 1,2,3,...,m. dan sampling error ~� , � dengan � diketahui. Selanjutnya kedua model tersebut digabung sehingga diperoleh model gabungan : = �� + + dengan i=1,2,3,....,m. Model tersebut merupakan bentuk khusus dari model linier campuran.
b) Model level unit
Model level unit merupakan suatu model dengan data pendukung yang tersedia bersesuaian secara individu dengan data respon, misalnya =
, , … , � sehingga diperoleh suatu model regresi tersarang = �� + + dengan i= 1,2,3,...,m. dan j=1,2,3,.... , ~ � , � dan
EmpiricalBest Linear Unbiased Prediction (EBLUP)
Model berikut merupakan model tingkat area yaitu:
�̂ = �� + + untuk i= 1,2, ..., m. (1) dengan adalah peubah penyerta tingkat area dan adalah matriks rancangan. Teknik penyelesaian model tersebut untuk memperoleh BLUP bagi � = �� +
telah dikembangkan oleh Henderson (1953), dengan asumsi � diketahui. Penduga BLUP dari � berdasarkan persamaan (1) adalah
�̂ �� � = �̂ + �̂ − �̂
�̂ �� � = �̂ + − �̂ (2) dengan = � ⁄ � + � dan �̂ adalah koefisien regresi yang diduga dengan generalized least squares (GLS) yaitu, �̂ = � − − � − �̂. Metode BLUP yang dikembangkan Henderson mengasumsikan diketahuinya komponen ragam pengaruh acak dalam model campuran linier, padahal pada kenyataannya komponen ragam ini tidak diketahui sebagai akibatnya, ragam pengaruh acaknya harus diduga. Harville (1977) dalam makalahnya menulis tentang pendugaan komponen ragam dengan menggunakan metode kemungkinan maksimum (maximum likelihood, ML) dan metode kemungkinan maksimum terkendala (restricted maximum likelihood, REML). Pendugaan � baik dengan metode ML maupun REML dilakukan dengan alogaritma Fisher scoring. Penduga EBLUP dengan mengganti nilai � dengan penduganya �̂� dari penduga EBLUP (2) adalah sebagai berikut:
�̂ �� � = ̂ �̂ + − ̂ �̂. (3)
SpatialEmpiricalBest Linear Unbiased Prediction (SEBLUP)
Misalkan didefinisikan vektor �̂ = (�̂ , … , �̂ ) , = , … , dan
= , … , , dan matriks = ( �, … , ��) dan Z= diag
, … , Berdasarkan definisi vektor dan matriks tersebut, maka persamaan (4) dalam notasi matriks adalah :
5
Conditional Autoregressive (Autoregresif bersyarat, CAR). Model SAE ini kemudian dikembangkan lagi oleh beberapa peneliti, diantaranya salvati (2004), Candra, Salvati, dan Chambers (2007), Pratesi dan Salvati (2007), dengan mengasumsikan bahwa ketergantungan spatial yang dimasukkan kedalam komponen galat dari faktor acak mengikuti proses Simultaneous Autoregressive (Simultan otoregresif, SAR). Model SAR sendiri pertama kali diperkenalkan oleh Anselin (Anselin 1992) dimana vektor pengaruh acak area memenuhi :
= ρW + u (5) koefisien ρ dalam persamaan (5) adalah koefisien otoregresi spasial yang menunjukkan kekuatan dari hubungan spasial antar pengaruh acak. Nilai ρ berkisar antara -1 sampai 1. Nilai ρ > 0 menunjukkan bahwa suatu area dengan nilai parameter yang tinggi cenderung dikelilingi oleh area lain dengan nilai parameter yang tinggi pula dan sebuah area dengan nilai parameter yang rendah pula. Disisi lain, ρ < 0 menunjukkan bahwa suatu area dengan nilai parameter yang tinggi dikelilingi oleh area lain dengan nilai parameter yang rendah, atau sebaliknya (Savitz dan Raudenbush 2009). W adalah matriks pembobot spasial, adalah pengaruh acak area dan u adalah vektor galat dari pengaruh acak area dengan rata-rata sama dengan nol dan ragam � Im Persamaan (5) dapat ditulis kembali sebagai berikut : tersebut diperoleh dengan memasukkan matriks koragam pada persamaan (7) ke dalam penduga BLUP. Spasial BLUP akan sama dengan BLUP jika � = 0.
dengan menggunakan algoritma scoring. Hasil pendugaan tersebut kemudian digunakan untuk melakukan penduga terhadap SEBLUP, dengan rumus penduga EBLUP adalah :
Matriks contiguity (kedekatan) merupakan matriks pembobot spasial yang menunjukan hubungan spasial suatu lokasi dengan lokasi lainnya yang bertetangga. Pemberian nilai 1 diberikan jika lokasi-i bertetangga langsung dengan lokasi-j, sedangkan nilai 0 diberikan jika lokasi-i tidak bertetangga dengan lokasi-j. Ada beberapa jenis matriks contiguity antara lain sebagai berikut, yaitu Rook Contiguity, Bishop Contiguity dan Queen Contiguity (Dubin,2009).
Gambar 1. Ilustrasi matriks Contiguity tipe rook (a) , bishop (b), queen (c).
Matriks contiguity tipe rook mendefinisikan suatu lokasi i bertetangga dengan lokasi j jika lokasi i bersinggungan sisi dengan lokasi j (Gambar 1(a)). Matriks contiguity tipe Bishop mendefinisikan suatu lokasi i bertetangga dengan lokasi j jika lokasi i bersinggungan sudut dengan lokasi j (Gambar 1(b)). Matriks contiguity tipe queen mendefinisikan suatu lokasi i bertetangga dengan lokasi j jika lokasi i bersinggungan sisi atau bersinggungan sudut dengan lokasi j (Gambar 1(c)). Pada bentuk peta yang sebenarnya terkadang kita menemukan kesulitan dalam mengidentifikasi kedekatan suatu lokasi apakah bersinggungan secara sudut saja atau bersinggungan secara sisi saja. Matriks contiguity tipe queen merupakan matriks yang efektif jika diterapkan pada peta sebenarnya karena matriks tersebut hanya melihat apakah suatu lokasi bersinggungan atau tidak. Dengan demikian, penelitian ini menggunakan matriks contiguity tipe queen.
Transformasi Logaritma EBLUP
Didefinisikan suatu transformasi logaritma dalam model campuran linier sebagai berikut:
7
dengan �̂� = ∑ ∈� log , galat penarikan contoh ~ N(0, � ), pengaruh acak area ~ N(0, � ) tetapi jika terdapat pengaruh spasial maka =
, … , menyebar MVN(0,G). Kurnia (2009) memaparkan bahwa dengan mengikuti teori EBLUP baku untuk model (13) , yaitu EBLUP untuk nilai tengah dari log , maka penduga bagi � dapat ditulis sebagai berikut
�̂ �� �∗ = ̂ �̂�+ − ̂ �̂ (14)
dengan �̂ diperoleh berdasarkan metode kuadrat terkecil terboboti untuk parameter regresi � dari model campuran linier, dimana ̂ = �̂�⁄ �̂� + �̂ .
Karena yang diinginkan adalah suatu penduga aktual untuk nilai tengah pada setiap area ke-i, maka digunakan sifat sebaran lognormal untuk melakukan transformasi-balik dari model (14). Lebih lanjut, diasumsikan bahwa
�̂ �� �∗menyebar normal. Dengan demikian, peduga nilai aktual untuk nilai tengah atau penduga transformasi logaritma EBLUP ( �̂ � �� �) untuk area ke-i adalah
�̂ � �� � = �̂ �� �∗+ ̂ �� �∗ (15)
dengan ̂ (�̂ �� �∗) adalah penduga kuadrat tengah galat (KTG) dari �̂ �� �∗. Kemudian penduga KTG bagi penduga nilai tengah pada persamaan (15) dapat didekati sebagai berikut:
̂ (�̂ � �� �) = ̂ (�̂�����∗) ̂ (�̂�����∗)− �̂�����∗. (16)
Transformasi Logaritma SEBLUP
Dalam penelitian ini, akan diterapakan model campuran linier ke dalam metode SEBLUP yaitu SEBLUP untuk nilai tengah dari log , maka penduga bagi � dapat ditulis sebagai berikut:
�̂ �� �∗= �̂ + {�̂ � − �̂ � − �̂ − }
×{ � �̂ + �̂ [ � − �̂ � − �̂ ]− }− (�̂�− �̂) (17)
dengan, (�̂� : (�̂�, �̂�, �̂�, … . . �̂� dan �̂� = ∑ ∈� log . sama halnya dengan EBLUP, pada metode SEBLUP ini diinginkan juga penduga aktual untuk nilai tengah atau penduga transformasi logaritma EBLUP ( �̂ � �� �) pada setiap area ke-i, sehingga dperoleh:
�̂ � �� � = �̂ �� �∗+ ̂ �� �∗ (18)
3 METODE PENELITIAN
Kajian Simulasi
Simulasi dilakukan untuk mengevaluasi kebaikan model yang dikembangkan. Proses simulasi dilakukan dengan langkah langkah sebagai berikut ini.
1. Membuat peta buatan berbentuk seperti berikut:
Gambar 2. Peta simulasi
Berdasarkan Gambar 2 maka jumlah area (m) dalam simulasi ini adalah 49 2. Menentukan ukuran contoh di tiap area kecil.
3. Carilah matriks pembobot spasial contiguity Queen (W) berdasarkan peta yang telah dibuat.
4. Simulasi ini menggunakan satu peubah yang diperhatikan ( ) dan satu peubah penyerta . Model yang digunakan untuk memperoleh nilai logaritma peubah yang diperhatikan (log( )). untuk area kecil ke-i dan unit ke-j adalah sebagai berikut:
� �( ) = + + + , = , , … , 9, = , , … , (20) Dimana adalah peubah penyerta, adalah pengaruh acak area, dan adalah galat penarikan contoh.
a. Nilai dibangkitkan dengan menyebar normal N(2,1). Nilai yang diperoleh digunakan untuk seluruh skenario pada proses simulasi.
b. Menetapkan � = , sehingga persamaan (20) menjadi :
log( = + + + , = , , … , 9, = , , … , . (21) c. Membangkitkan dengan cara:
1) Membangkitkan menyebar N(0, � ) dengan � = . . Merupakan komponen error pada persamaan (6)
2) Menetapkan nilai � = .
3) Mencari nilai dengan memasukkan nilai dengan = , , … , 9 dan nilai � ke persamaan (6)
d. membangkitkan menyebar normal N(0, 0.3).
e. Menentukan nilai log( ) dengan memasukkan nilai , dan ke persamaan (21)
f. Mencari nilai aktual dengan = log � , sehingga dapat dikatakan dibangkitkan dengan sebaran log-normal
9
a. Menghitung nilai tengah peubah yang diperhatikan untuk contoh di tiap area kecil sebagai penduga langsung
�̂ = ∑ = , untuk = , , … , 9, , = , , … ,
b. Kemudian menghitung nilai tengah peubah penyerta contoh di tiap area kecil
= ∑ = , untuk = , , … , 9, , = , , … ,
c. Menghitung nilai tengah peubah yang diperhatikan berskala logaritma untuk contoh di tiap area kecil sebagai penduga langsung berskala logaritma
�̂� = ∑ log
10.Mengulangi langkah (4) sampai langkah (9) kecuali langkah (4a) sebanyak B = 1000 sehingga dapat dihitung nilai bias relatif (BR) tiap area, akar kuadrat tengah galat relatif (AKTGR), rata-rata bias relatif dan rata-rata akar kuadrat tengah galat relatif dari hasil pendugaan parameter sebagai berikut:
BR = �∑ �̂ − ��
a. � adalah parameter pada area kecil ke-i
b. �̂ adalah penduga area kecil pada area kecil ke-i dan iterasi ke-l c. B adalah banyaknya iterasi, dalam penelitian ini B=1000
e. Bias relatif (BR) adalah persentasi bias terhadap parameternya f. BR adalah bias relatif pada area kecil ke i
g. Rata-rata bias relatif (BR) adalah rata-rata bias relatif dari seluruh area h. Kuadrat tengah galat adalah nilai harapan dari kuadrat selisih antara
penduga dengan parameternya. Secara formulasi, kuadrat tengah galat mengandung dua komponen, yakni ragam penduga dan bias. Ragam penduga untuk mengukur presisi. Presisi yang dimaksudkan dalam hal ini adalah ukuran sejauh mana pengulangan suatu pendugaan akan memberikan hasil yang sama. Semakin kecil nilai dari kuadrat tengah galat maka kombinasi antara ragam penduga dan bias semakin kecil. Ragam penduga dan bias semakin kecil menunjukkan presisi dan akurasi dari suatu penduga semakin baik.
i. AKTG adalah akar kuadrat tengah galat pada area ke i
j. Rata-rata akar kuadrat tengah galat (AKTG) adalah rata-rata akar kuadrat tengah galat dari seluruh area
11. Membandingkan nilai rata-rata bias relatif BR dan rata-rata akar kuadrat tengah galat (AKTG) antara penduga EBLUP, penduga transformasi logaritma EBLUP, penduga transformasi logaritma SEBLUP.
12. Mengulangi langkah (4) sampai langkah (11) kecuali langkah (4a) dengan nilai
� = , , dan nilai �= 0.5, 0.25 sehingga banyaknya skenario dalam 0.25 Simulasi 9 Simulasi 10 Simulasi 11 Simulasi 12
Penerapan
Studi kasus pada penelitian ini menggunakan data SUSENAS tahun 2010 dan PODES tahun 2011 yang dikeluarkan oleh Badan Pusat Statistik (BPS). Peubah yang diamati pada penelitian ini adalah rata-rata pengeluaran per kapita per bulan untuk kecamatan di wilayah Kota dan Kabupaten Bogor. Data yang tersedia pada SUSENAS tidak mendukung pendugaan langsung pada tingkat kecamatan. Hal ini dikarenakan contoh pada tingkat kecamatan berukuran kecil. Model yang dikembangkan pada penelitian ini digunakan sebagai alternatif untuk mengatasi permasalahan tersebut. Pemodelan dilakukan dengan memanfaatkan informasi dari peubah yang dipilih dari data PODES sebagai peubah penyerta.
Data PODES dan SUSENAS yang diperoleh akan dianalisis dengan langkah-langkah sebagai berikut:
1. Melakukan eksplorasi data, yaitu dengan memeriksa distribusi data pada data rata-rata pengeluaran per kapita per bulan untuk kecamatan di wilayah Kota dan Kabupaten Bogor SUSENAS 2010 kemudian memeriksa pengaruh spasialnya 2. Mencari matriks pembobot spasial wilayah Kota dan Kabupaten Bogor dengan
11
3. Memilih peubah peubah penyerta dari data PODES 2011
4. Menduga rata-rata pengeluaran per kapita per bulan setiap kecamatan di wilayah Kota dan Kabupaten Bogor dengan pendugaan langsung dan teknik-teknik pendugaan yang dilakukan pada kajian simulasi
5. Mengevaluasi hasil pendugaan dengan membandingkan penduga average root mean square error (ARMSE)
Gambar 3 Diagram alir tahapan kajian simulasi
�̂ �̂
�̂ �� � �̂ �� � �̂ � �� � �̂ � �� �
m = 49 area
Menentukan ukuran contoh di tiap area
Contiguity queen (W )
log( ) dan
Mengulangi sebanyak B = 1000
BR dan AKTG
Gambar 4 Diagram alir tahapan studi kasus
�̂ �� � �̂ �� � �̂ � �� � �̂ � �� �
�̂ � �� �
Memriksa distribusi peubah y
Memriksa autokorelasi spasial peubah y
Contiguity queen (W )
Memilih peubah penyerta x
13
4 HASIL DAN PEMBAHASAN
Kajian Simulasi
Kajian simulasi ini dilakukan dengan empat penduga yaitu : (1) EBLUP dengan menggunakan �̂ (EBLUP), (2) SEBLUP dengan menggunakan �̂ (SEBLUP) , (3) transfromasi balik EBLUP dengan menggunakan �̂ (Transformasi Logaritma EBLUP), (4) transformasi balik SEBLUP dengan menggunakan
�̂ (Transformasi Logaritma SEBLUP) dan adapun hasilnya sebagai berikut:
Tabel 2 Nilai rata-rata bias relatif (BR) (%)
dan SEBLUP mengalami overestimate . Penduga transformasi logaritma EBLUP dan penduga transformasi logaritma SEBLUP menghasilkan penduga yang underestimate.
Dari Tabel 3 dapat dilihat bahwa nilai rata- rata AKTG dengan �=0.75 dan
� = . pada penduga transformasi logaritma EBLUP dan transformasi logaritma SEBLUP sekitar 6.6 dan untuk penduga EBLUP dan SEBLUP sekitar 23. Perbedaan yang cukup besar antara penduga yang ditransformasi dengan penduga yang tanpa dilakukan transformasi dimana rata- rata AKTG pada penduga yang ditransformasi jauh lebih kecil. Hal ini mengindikasikan bahwa peubah yang diperhatikan yang memiliki distribusi tidak normal akan lebih baik jika dilakukan transformasi logaritma terlebih dahulu lalu. Langkah berikutnya adalah memasukkan hasil transformasi ke metode pendugaan area kecil lalu dilakukan transformasi balik. Dampak dari melakukan transformasi logaritma yaitu galat yang dihasilkan lebih kecil jika dibandingkan dengan metode yang tanpa dilakukan transformasi . Ketika � diganti dengan 1 ,2, dan 3 , maka akan menghasilkan nilai rata- rata AKTG yang hampir sama dengan � = . .Kemudian, ketika nilai autokorelasinya (� diganti dengan 0.5 atau 0.25 maka hasilnya juga akan hampir sama dengan �=0.75 untuk nilai rata- rata AKTGR.
15
ketika � sama dengan 1 ,2, atau 3 dan nilai autokorelasinya (� sama dengan 0.5 atau 0.25. Akan tetapi khusus untuk � = dan �=0.25 nilai rata-rata AKTG antara penduga transformasi logaritma SEBLUP dan penduga transformasi logaritma EBLUP hampir sama yakni 6.66 . Meskipun nilai rata-rata AKTG pada penduga transformasi logaritma SEBLUP lebih kecil dibandingkan dengan penduga transformasi logaritma EBLUP tetapi selisihnya sangat kecil. Oleh karena itu, penduga transformasi logaritma SEBLUP dan penduga transformasi logaritma EBLUP memiliki presisi dan akurasi yang hampir sama baiknya.
Penerapan
Metode yang telah dikembangkan ini diterapkan pada Survei Sosial Ekonomi Nasional (SUSENAS) tahun 2010 dan Potensi Desa (PODES) tahun 2011 yang dikeluarkan oleh Badan Pusat Statistik (BPS). Peubah yang diamati pada penelitian ini adalah rata-rata pengeluaran per kapita per bulan untuk kecamatan di wilayah Kota dan Kabupaten Bogor.
Gambar 5 Normal quantile quantile plot (a) Y, pengeluaran per kapita per bulan (Rupiah) dan (b) bentuk transformasi logaritma peubah Y
Peubah pengeluaran per kapita pada data SUSENAS 2010 digunakan sebagai peubah yang diperhatikan (Y), yaitu rata-rata pengeluaran per kapita per bulan. Data SUSENAS 2010 mencakup 44 tersurvei kecamatan dan 111 desa/kelurahan di Kota dan Kabupaten Bogor. Berdasarkan plot, secara visual dapat terlihat pada Gambar 5(a) bahwa pada sebaran datanya banyak titik yang tidak berada pada persekitaran garis. Hal ini dapat menjadi indikator bahwa asumsi kenormalan belum terpenuhi. Setelah dilakukan transformasi logaritma pada peubah Y maka asumsi kenormalan terpenuhi dan hal tersebut dapat dilihat pada Gambar 5(b), sebaran data berada disekitar garis.
Selanjutnya pada peubah yang diperhatikan (Y) akan dilihat ketergantungan spasialnya atau dengan kata lain, apakah terdapat autokorelasi spasial atau tidak. Pengukuran autokorelasi spasial dapat dihitung menggunakan metode Moran’s Index (Indeks Moran) yaitu:
� = ∑= ∑ = − ̅ ( − ̅) (∑= ∑ = ) ∑= − ̅
Untuk mengidentifikasi adanya autokorelasi spasial atau tidak, dilakukan uji signifikansi indeks Moran.
Tabel 4 Hasil Uji Autokorelasi Spasial dengan Indeks Moran
Peubah ∗ = � �
Indeks Moran 0.28 0.44
� 3.51 5.05
Uji signifikansi indeks Moran didekati dengan distribusi normal baku sehingga menghasilkan � . Pada Tabel 4 dapat dilihat bahwa uji autokorelasi spasial dengan menggunakan Indeks Moran terhadap peubah yang diperhatikan (Y) menghasilkan nilai � = . . Nilai � = . > −� = . sehingga pada taraf 5% dapat dikatakan bahwa data tersebut memiliki autokorelasi spasial. Kemudian untuk transformasi logaritma peubah yang diperhatikan (Y) menghasilkan � = . . Nilai � = . > −� = . sehingga pada taraf 5% dapat dikatakan bahwa transformasi logaritma peubah yang diperhatikan (Y) memiliki autokorelasi spasial.
17
Setelah melalui proses eksplorasi data, pendugaan area kecil dilakukan dengan lima penduga yaitu : (1) Penduga Langsung, (2) EBLUP dengan menggunakan �̂ (EBLUP), (3) SEBLUP dengan menggunakan �̂ (SEBLUP) , (4) transfromasi balik EBLUP dengan menggunakan �̂ (Transformasi Logaritma EBLUP), (5) transformasi balik SEBLUP dengan menggunakan �̂ (Transformasi Logaritma SEBLUP) dan adapun hasilnya sebagai berikut:
Tabel 6 Dugaan Area Kecil untuk rata-rata Pengeluaran Per Kapita Tingkat Kecamatan di Kabupaten dan Kota Bogor (Ribu Rupiah) 2010
Dari Tabel 6 dapat dilihat bahwa seluruh penduga memperlihatkan kecamatan Gunung Putri memiliki rata-rata pengeluaran per kapita tertinggi dibandingkan dengan kecamatan yang lain. Sedangkan, kecamatan yang diduga memilki rata-rata pengeluaran per kapita terendah adalah kecamatan Nanggung. Hal tersebut dikarenakan oleh pengaruh jumlah desa dengan sumber mata pencaharian utama sebagian besar penduduk adalah pertanian pada kecamatan Nanggung cukup tinggi sedangkan pada kecamatan Gunung Putri jumlah desa untuk peubah tersebut adalah nol.
19
Pada tabel 7 disajikan selang kepercayaan 95% untuk rata-rata pengeluaran per kapita. Selang kepercayaan 95% untuk penduga yang tanpa transformasi logaritma didekati dengan memasukkan hasil pendugaan dan ragamnya ke selang kepercayaan sebaran normal. Selang kepercayaan 95% untuk penduga transformasi logaritma didekati dengan memasukkan hasil pendugaan dan ragam yang berskala logaritma ke selang kepercayaan sebaran normal. Setelah itu selang kepercayaan berskala logaritma dieksponenkan dengan tujuan untuk mengembalikan selang kepercayaan ke skala yang sebenarnya. Pada tabel 7 juga dapat dilihat bahwa penduga dengan transfromasi logaritma memiliki selang kepercayaan yang lebih pendek dibandingkan dengan penduga yang tidak dilakukan transformasi. Hal ini mengindikasikan bahwa penduga dengan transformasi lebih dapat dipercaya untuk pendugaan area kecil pada data SUSENAS 2010.
5 SIMPULAN DAN SARAN
Simpulan
Pendugaan area kecil yang memiliki pengaruh spasial biasanya dilakukan dengan menggunakan metode SEBLUP (Spatial Empirical Best Linear Unbiased Prediction). Sementara peubah yang menjadi perhatian biasanya memiliki distribusi yang tidak normal sehingga pola hubungan peubah yang menjadi perhatian dan peubah penyerta menjadi tidak linear. Dengan demikian dibutuhkan suatu metode pendugaan yang dapat mengatasi masalah tersebut yakni metode transformasi logaritma SEBLUP. Metode ini merupakan metode transformasi logaritma terhadap peubah yang menjadi perhatian kemudian diterapkan pada metode SEBLUP. Setelah melakukan hal terebut maka langkah selanjutnya adalah transformasi balik.
Hasil dari kajian simulasi menunjukkan bahwa penduga transformasi logaritma SEBLUP memiliki nilai rata-rata BR dan nilai rata-rata AKTG yang hampir sama jika dibandingkan dengan penduga transformasi logaritma EBLUP. Hasil simulasi ini sejalan dengan hasil studi kasus rata-rata pengeluaran per kapita tingkat kecamatan di kota atau kabupaten Bogor 2010. Sehingga dapat disimpulkan bahwa untuk data yang berdistribusi tidak normal sekaligus memiliki pengaruh spasial sebaiknya melakukan transformasi logaritma EBLUP saja. Hal ini dikarenakan hasil penduga transformasi logaritma EBLUP sama dengan hasil penduga transformasi logaritma SEBLUP. Di sisi lain teknik penduga transformasi logaritma EBLUP lebih mudah karena tak perlu mencari matriks pembobot spasial seperti pada penduga transformasi logaritma SEBLUP.
Saran
21
DAFTAR PUSTAKA
Anselin L (1992) Spatial econometrics: method and models. Kluwer, Boston Chandra H, Salvati N, Chambers R. 2007. Small Area Estiamtion for Spatially
correlated populations a comparison of direct and indirect model-based methodes. Statistics in transition 8:887-906.
Cressie N.1991.Small-area prediction of undercount using the general linear model. In: Proceedings of the statistic symposium 90: measurement and improvement of data quality. Statistics Canada, Ottawa,pp 93–105
Dubin R. 2009. Spatial Weights. Fotheringham AS, PA Rogerson, editor, Handbook of Spatial Analysis. London : Sage Publications.
Fay,R.E., & Herriot, R.A. (1979), Estimation of Income from Small Places: An Aplication of James –Stein Procedures to Census Data, Journal of American Statistical Association, 74, 269-277.
Ghosh M, Rao JNK (1994) Small area estimation: an appraisal (with discussion). Stat Sci 9(1):55–93
Harville, D.A. (1977), Maximum Likelihood Approaches to Variance Component Estimation and to Related Problems, Journal of the American Statistical Association, 72, 322-340.
Henderson, C.R. (1953), Estimation of Variance and Covariance Components, Biometrics, 9, 226-252.
Grasa, A. A. 1989. Econometric Model Selection: A New Approach, Kluwer. Rao JNK.2003. Small Area Estiamtion. London : Wiley.
Kurnia A. 2009. Prediksi Terbaik Empirik untuk Model Transformasi Logaritma di Dalam Pendugaan Area Kecil dengan Penerapan pada Data SUSENAS. Disertasi, Institut Pertanian Bogor.
Petrucci A, Salvati N. 2004a. Small area estimation using spatial information. The rathbun lake watershed case study. Dipartimento di Statistica “G.Parenti” viale morgagani, 59-50134.
Petrucci A, Salvati N. 2004a. Small area estimation considering spatially
Pratesi M, Salvati N. 2007. Small area estimation: the EBLUP estimator based on spatially correlated random area effects. Statistical methods and applications, Stat. Meth. & Appl. 17: 113-141.
Lampiran 1 Keterangan komponen komponen pada penduga MSE SEBLUP
� �̂ , �̂ = {�̂ � − �̂ � − �̂ − − �̂ � − �̂ � − �̂ −
× { � � + �̂ [ � − �̂ � − �̂ ]− }− �̂
× [ � − �̂ � − �̂ ]− }
� �̂ , �̂ = − �̂ [ � − �̂ � − �̂ ]− × { � � +
�̂ [ � − �̂ � − �̂ ]− }− × { � � +
�̂ [ � − �̂ � − �̂ ]− }− − × − �̂ [ � −
�̂ � − �̂ ]− × { � � + � [ � − �̂ � −
�̂ ]− }− �
� �̂ , �̂ = � {[ � (��− − + �̂ �− − − �− − ) � − + �̂ �− − − � − ]
× [
� �− � − + �̂ �− � − − �− � −
� � � − + �̂ �− � − − � � − ] ̅ �̂ , �̂ }
Dimana , � = �̂ [−�− �̂ − �− ]
23
Lampiran 2 Peubah penyerta dari data PODES 2011
1) Jumlah desa dengan sumber mata pencaharian utama bidang pertanian (X1) 2) Jumlah desa dengan sumber penghasilan utama sebagian besar penduduk
adalah bidang pertambangan dan penggalian (X2)
3) Jumlah desa sumber mata pencaharian utama bidang industri pengolahan (pabrik, kerajinan, dll) (X3)
4) Jumlah desa dengan sumber mata pencaharian utama bidang perdagangan besar/eceran dan rumah makan (X4)
5) Jumlah desa dengan sumber penghasilan utama sebagian besar penduduk adalah bidang angkutan, pergudangan, komunikasi (X5)
6) sumber mata pencaharian utama bidang jasa (X6) 7) Jumlah poliklinik (unit) (X7)
Lampiran 3 Penduga RMSE untuk untuk rata-rata Pengeluaran Per Kapita SUSENAS 2010 Tingkat Kecamatan di Kabupaten dan Kota Bogor
25
Lampiran 3 (Lanjutan)
No Kecamatan
Penduga
Langsung EBLUP SEBLUP TL EBLUP TL SEBLUP
39 Bogor Selatan 28.15 27.79 22.47 13.69 15.79
40 Bogor Timur 61.03 57.69 31.02 36.41 87.18
41 Bogor Utara 27.32 27.00 12.44 17.68 6.69
42 Bogor Tengah 32.76 32.22 17.89 28.07 37.42
43 Bogor Barat 12.40 12.37 7.82 9.75 11.75
44 Tanah Sereal 17.35 17.27 18.45 12.59 10.44
27
RIWAYAT HIDUP