• Tidak ada hasil yang ditemukan

(R.11) PENGGUNAAN MATRIKS PEMBOBOT SPASIAL PADA MODEL SMALL AREA ESTIMATION DENGAN METODE SPATIAL EMPIRICAL BEST LINEAR UNBIASED PREDICTION

N/A
N/A
Protected

Academic year: 2021

Membagikan "(R.11) PENGGUNAAN MATRIKS PEMBOBOT SPASIAL PADA MODEL SMALL AREA ESTIMATION DENGAN METODE SPATIAL EMPIRICAL BEST LINEAR UNBIASED PREDICTION"

Copied!
9
0
0

Teks penuh

(1)

(R.11)

PENGGUNAAN MATRIKS PEMBOBOT SPASIAL PADA MODEL SMALL

AREA ESTIMATION DENGAN METODE SPATIAL EMPIRICAL BEST LINEAR

UNBIASED PREDICTION

Dariani Matualage(1), Asep Saefuddin(2), Aji Hamim Wigena(2)

(1) Mahasiswa SPs IPB, Staf Pengajar UNIPA, (2) Staf Pengajar IPB

(1) Dep. Statistika IPB, FMIPA UNIPA, (2)Dep. Statistika IPB

(1)dariani_m@yahoo.com (2)asaefuddin@gmail.com , ajihamim@yahoo.com

Abstrak

Small Area Estimation (SAE) merupakan salah satu metode yang digunakan untuk mengatasi persoalan pendugaan parameter untuk ukuran contoh yang kecil. Penambahan informasi spasial untuk metode SAE khususnya metode Empirical Best Linear Prediction (EBLUP) akan meningkatkan ketepatan pendugaan jika terdapat otokorelasi spasial yang kuat. Penambahan informasi spasial dalam model biasanya dilakukan dengan memasukkan matriks pembobot spasial nearest neighbors. Dalam makalah ini digunakan matriks pembobot limit model dengan terlebih dahulu menentukan jarak antar area yang masih mempunyai pengaruh spasial dengan mencari lebar jendela optimum pada fungsi pembobot kernel normal. Hasil yang diperoleh bahwa metode Spasial EBLUP dengan memasukkan matriks pembobot limit model menyebabkan nilai Relative Root Mean Squared Error yang lebih kecil.

Kata Kunci : seminar, SAE, SEBLUP, continguity, proceeding

1. PENDAHULUAN

SAE dengan pendekatan Empirical Best Linear Unbiased Prediction (EBLUP) merupakan salah satu metode yang digunakan untuk menyelesaikan persoalan mengenai ragam yang besar pada pendugaan data kontinu dengan ukuran contoh yang kecil. Pendekatan EBLUP dikembangkan oleh Henderson (1953,1975) untuk menyelesaikan model pengaruh campuran, dimana dalam model pengaruh campuran terdapat informasi tambahan yang bersesuaian dengan hubungan keragaman yang menerangkan keragaman di dalam area peubah respon, tetapi tidak dapat menerangkan keragaman spesifik area kecil. Keragaman spesifik area ini disebut pengaruh acak area kecil.

EBLUP kemudian dikembangkan dengan berasumsi bahwa pengaruh acak antar area saling berkorelasi dengan merujuk pada penggunaan model spasial untuk pengaruh acak area (Cressie, 1991 dalam Petrucci dan Salvati 2004). Penduga EBLUP dengan memperhatikan pengaruh acak area yang berkorelasi spasial dikenal dengan istilah penduga spasial EBLUP (SEBLUP). Penduga ini digunakan dengan memasukkan matriks pembobot spasial ke dalam model.

(2)

Matriks pembobot spasial yang digunakan oleh Petrucci & Salvati (2004), Salvati (2004), Chandra dkk., (2007), Pratesi & Salvati (2008), dalam model pendugaan dengan pendekatan SEBLUP adalah matriks continguity nearest neighbors. Matriks ini tidak mempunyai arti jika sebagian besar respon yang terpilih sebagai contoh dalam survei terletak tidak berdekatan langsung. Oleh karena itu perlu digunakan matriks pembobot lain yang dapat meningkatkan keakuratan model pendugaan.

Ada beberapa matriks pembobot spasial yang telah digunakan oleh Fotheringham & Rogerson (2009). Salah satunya adalah matriks limit models, yang bernilai 1 atau 0 dengan memperhatikan jarak antar area yang masih mempunyai pengaruh spasial. Penentuan jarak ini dapat dilakukan dengan beberapa cara, salah satunya dengan mencari lebar jendela optimum untuk fungsi pembobot kernel normal. Matriks tersebut akan dimasukkan ke dalam model SEBLUP dan hasilnya akan dibandingkan dengan penggunan metode EBLUP dan pendugaan langsung untuk data pengeluaran perkapita desa khusus untuk pengeluaran makanan.

2. SPATIAL EMPIRICAL BEST LINEAR UNBIASED PREDICTION

Misalkan didefinisikan vektor = , … , , = ( , … , ) dan = ( , … , ) ,

dan matriks = ( , … , ) dan = diag( , … , ). Berdasarkan definisi vektor dan

matriks tersebut, maka persamaan model persamaan campuran dalam notasi matriks adalah :

= + + (1)

Model pad persamaan (1) mengasumsikan bahwa terdapat pengaruh acak area, namun pengaruh tersebut saling bebas antar area. Di lain pihak, dikenal hukum pertama tentang geografi yang dikemukakan oleh Tobler (Tobler’s first law of geography) dalam Schabenberger dan Gotway (2005) yang merupakan pilar kajian analisis data spasial, yaitu “everything is realted to everything else, but near things are more related than distant things”. Segala sesuatu saling berhubungan satu dengan yang lainnya, tetapi sesuatu yang lebih dekat akan lebih berpengaruh daripada sesuatu yang jauh. Selain itu, pembagian batas daerah menunjuk pada kriteria administrasi, oleh karena itu pembagian ini tidak membatasi adanya pengaruh spasial terhadap respon yang akan diteliti. Membahas mengenai korelasi antar area yang bertetangga, model yang digunakan mengarah pada penggunaan model spatial untuk pengaruh acak area (Cressie 1991 diacu dalam Petrucci dan Salvati 2004). Ketergantungan spatial yang dimasukkan ke dalam struktur galat dalam model regresi linear dengan asumsi

(3)

mengikuti proses Simultaneous autoregressive (SAR) (Anselin 1992, dalam Chandra, Salvati, Chambers 2007) dimana vektor pengaruh acak area = ( ) memenuhi:

= + (2)

Koefisien dalam persamaan (2) adalah koefisen otoregresif spatial yang menunjukkan kekuatan dari hubungan spasial antar pengaruh acak dan W adalah matriks pembobot spasial yang menggambarkan struktur ketetanggaan dari area kecil dalam bentuk standarisasi baris

(jumlah setiap baris pada matriks W adalah 1 dan ~ (0, ). Persamaan (2) dapat ditulis

kembali sebagai berikut :

= ( − ) (3)

Matriks koragam (G) adalah sebagai berikut :

= [( − )( − )]

Persamaan (3) dimasukkan ke dalam persamaan (1) menghasilkan :

= + ( − ) +

Matriks koragam dari dengan = diag adalah :

V= R + ZGZT = diag + [( − )( − )] (4)

Penduga Spasial BLUP untuk parameter dengan , dan diketahui adalah:

( , ) = + { [( − )( − )] }

× diag + [( − )( − )] θ −

Dimana = ( ) dan adalah vektor berukuran 1 × n (0, 0, …0, 1,

0,…0) dengan 1 menunjuk pada lokasi ke-i. Penduga ( , ) dengan terlebih dahulu

melakukan pendugaan terhadap parameter , dengan ML atau REML disebut Spatial

EBLUP, menggunakan algoritma Nelder-Mead (Nelder & Mead 1965) dan algoritma scoring yaitu :

( , ) = + { [( − )( − )] }

× diag + [( − )( − )] θ −

MSE dari Spatial BLUP dapat diperoleh seperti dalam Rao (2003), yaitu :

MSE ( , ) = ( , ) + ( , )

dengan ( , ) dan ( , ) adalah sebagai berikut :

( , ) = b [( − )( − )] − [( − )( − )]

× diag + [( − )( − )]

(4)

( , ) = − b [( − )( − )]

× diag + [( − )( − )]

× diag + [( − )( − )]

× − [( − )( − )]

× diag + [( − )( − )]

MSE ( , ) untuk model spatial EBLUP dengan pengaruh acak berdistribusi normal,

adalah :

( , ) = MSE ( , ) + ( , ) − ( , )

Bentuk ( , ) − ( , ) ditaksir dengan Taylor dan dilambangkan dengan

( , ) . Berdasarkan hasil dari Kackar dan Harville ( Kackar dan Harville 1984, dalam

Petrucci, A. dan Salvati, N. 2004), dapat ditulis sebagai berikut:

( , ) − ( , ) ≈ ( , )

( , ) (( , ) − ( , ) )

dengan asumsi kenormalan, diperoleh :

( , ) ( , ) ≈ b ( , ) θ − ( , ) ( , ) (( , ) − ( , ) ) ≈ b ( , ) θ − b ( , ) θ − ≈ b ( , ) θ − × b ( , ) θ − ( , ) = b ( , ) b ( , ) ( , ) = b + (− ) b + (− ) × b + (− ) b + (− ) ( , ) = ( , )

Penduga dari MSE ( , ) diperoleh dengan mengikuti hasil dari Harville dan Jeske

(5)

menjadi model dengan koragam terampat (generalized covariances) oleh Zimmerman dan

Cressie (Zimmerman dan Cressie 1992, dalam Pratesi dan Salvati 2008), yaitu :

mse ( , ) ≈ ( , ) + ( , ) + 2 ( , )

dimana dan adalah penduga yang diperoleh dengan menggunakan metode REML.

Jika menggunakan prosedur ML, mse ( , ) sebagai berikut :

mse ( , ) ≈ ( , ) − b ( , )∇ ( , ) + ( , ) + 2 ( , )

dengan b ( , )∇ ( , ) diperoleh dari bentuk berikut :

∇ ( , ) = b ( − [ + (− ) + ]) ( − [ + (− ) + ]) dan b ( , ) = 1 2 ( , ) [( ) (− ) ] [( ) (− ) ]

Bentuk b ( , )∇ ( , ) adalah bentuk tambahan yang merupakan bias tambahan

dari ( , ) . Jika hal ini diabaikan maka penggunaan penduga ML akan menjadi

underestimate dari penaksiran MSE.

3. MATRIKS PEMBOBOT SPASIAL

Beberapa matriks pembobot spasial yang digunakan oleh Fotheringham & Rogerson (2009) adalah matriks pembobot spasial tetangga terdekat (nearest neighbors) dan matriks pembobot model limit (limit models). Matriks pembobot tetangga terdekat bernilai 1 jika kedua area saling berbatasan langsung dan bernilai 0 jika tidak berbatasan langsung. Matriks ini juga berlaku untuk area terdekat ke- k, dimana k = 1, …, n. Berbeda dengan matriks pembobot ini, matriks pembobot model limit akan bernilai 1, jika jarak antar area lebih kecil atau sama dengan suatu jarak yang ditentukan peneliti, dan bernilai 0 jika jarak antar area lebih besar dari jarak tersebut.

4. METODE PENELITIAN

Area kecil dalam penelitian ini adalah 35 desa yang terpilih sebagai contoh dalam Survei Sosial Ekonomi Nasional (Susenas) 2008, dengan peubah respon yang digunakan adalah data pengeluaran perkapita untuk makanan yang diperoleh dari Susenas 2008. Sebagai peubah penyerta dalam metode ini adalah data persentase keluarga penerima askeskin setahun terakhir yang diambil dari data Podes 2008. Adapun matriks pembobot spasial yang digunakan adalah matriks pembobot limit model dengan batas jarak adalah 9.09 km (Rahmawati 2010).

(6)

Tahapan penelitian yang dilakukan terdiri dari persiapan data dan pengolahan data. Tahapan persiapan dilakukan dengan menghitung rata-rata pengeluaran perkapita desa khusus untuk makanan, dan ragamnya masing-masing kemudian memilih peubah penyerta untuk 35 desa yang terpilih sebagai contoh. Untuk matriks pembobot spasial, dilakukan konversi dari masing-masing jarak antar desa dengan memperhatikan batas jarak yang ditentukan menjadi bernilai 1 jika jarak antar desa lebih kecil atau sama dengan 9,09 km dan bernilai 0 jika lebih dari 9,09 km. Matriks yang diperoleh kemudian dibakukan secara baris (membuat jumlah setiap baris dari matriks tersebut bernilai 1) dan hasilnya yang akan digunakan dalam model SEBLUP.

Tahapan pengolahan data dimulai dengan menentukan titik awal dalam algoritma scoring dengan menggunakan algoritma Nelder-Mead. Algoritma scoring digunakan untuk

menduga otokorelasi spasial ( ) dan komponen ragam dari pengaruh acak ( ). Hasil

pendugaan tersebut kemudian digunakan untuk menduga koefisien regresi ( ) dengan GLS. Ketiga penduga tersebut akhirnya digunakan untuk menduga pengeluaran perkapita desa khusus untuk pengeluaran makanan dengan metode SEBLUP, dan menduga MSE serta

RRMSE, dimana rumus : = × 100%.

5. PEMBAHASAN DAN KESIMPULAN

Desa yang terpilih menjadi contoh dalam Susenas 2008 terdiri dari tiga puluh lima desa, dengan rumah tangga yang dipilih sebagai contoh pada tiap-tiap desa berkisar antara 14 hingga 16 rumah tangga.

Gambar 1 Diagram kotak garis pengeluaran perkapita desa dengan metode pendugaan langsung, EBLUP dan SEBLUP

(7)

Sebaran data dari penduga pengeluaran perkapita desa hasil pendugaan langsung dan pendugaan dengan metode EBLUP tidak jauh berbeda, tetapi ketika dibandingkan dengan hasil pendugaan SEBLUP, maka terlihat perbedaan yang cukup jauh antara metode SEBLUP dengan kedua metode pendugaan lainnya (langsung dan EBLUP) baik dalam hal jumlah pencilan maupun sebaran data (Gambar 1). Metode pendugaan langsung menghasilkan dua desa pencilan yaitu Kelurahan Sumbersari dan Karangrejo. Metode EBLUP berhasil mengurangi jumlah pencilan menjadi satu desa pencilan, yaitu kelurahan Karangrejo. sedangkan metode SEBLUP menghasilkan pendugaan pengeluaran perkapita yang tidak mempunyai pencilan. Tidak adanya pencilan pada metode SEBLUP menyebabkan hasil pendugaan ini terlihat menyebar merata dengan nilai rata-rata dan median yang hampir sama.

Tabel 1 Nilai penduga koefisien regresi, koefisien otokorelasi spasial dan ragam peubah acak untuk metode EBLUP dan SEBLUP

EBLUP SEBLUP

154078.7 129553.1

-594.339 -338.573

Nilai dugaan koefisien regresi untuk pendugaan pengeluaran perkapita dengan mentode EBLUP dan SEBLUP dapat dilihat pada Tabel 1. Nilai ini memperlihatkan bahwa hasil dugaan menggunakan metode SEBLUP memiliki nilai yang lebih rendah dibandingkan dengan hasil dugaan menggunakan metode EBLUP. Untuk penduga koefisien regresi baik dengan metode EBLUP maupun SEBLUP menghasilkan nilai yang negatif untuk persentase keluarga penerima Askeskin setahun terakhir, artinya bahwa penambahan satu persen keluarga penerima askeskin setahun terakhir di suatu desa cenderung akan menurunkan nilai pengeluaran perkapita desa untuk makanan tersebut sebesar nilai dugaan koefisien regresinya masing-masing.

Tabel 2 Nilai penduga koefisien otokorelasi spasial dan ragam peubah acak area untuk metode SEBLUP

SEBLUP 0.999992 0.005215

Nilai dugaan untuk koefisien korelasi otoregresif (spatial autoregressive coefficient, ) adalah 0.999992 (Tabel 2). Nilai ini menunjukkan bahwa terdapat korelasi spasial positif yang sangat kuat antara pengeluaran perkapita tiap desa khusus untuuk makanan di

(8)

mempunyai pengeluaran perkapita untuk makanan tinggi dikelilingi oleh desa-desa lain yang memiliki pengeluaran perkapita rendah dikelilingi oleh desa lain yang memiliki pengeluaran

perkapita yang rendah pula.

Gambar 2 Diagram kotak garis pendugaan RRMSE pengeluaran perkapita desa dengan metode pendugaan langsung, EBLUP dan SEBLUP

Kebaikan pendugaan langsung, pendugaan dengan metode EBLUP dan pendugaan dengan metode SEBLUP dapat dilihat dari nilai RRMSE (Gambar 2). Nilai RRMSE untuk penduga EBLUP lebih kecil dibandingkan dengan dengan nilai RRMSE untuk penduga langsung, walaupun perbedaannya tidak terlalu jauh. Berbeda halnya dengan nilai RRMSE untuk penduga SEBLUP yang jauh berbeda dibandingkan dengan kedua penduga lainnya (penduga langsung da EBLUP). Hal ini mengindikasikan bahwa pendugaan dengan SEBLUP dapat memperbaiki pendugaan parameter baik secara langsung maupun dengan metode EBLUP.

6. DAFTAR PUSTAKA

Chandra H, Salvati N, Chambers R. 2007. Small area estimation for spatially correlated populations a comparison of direct and indirect model-based methods. Statistics in

transition 8:887-906.

Fotheringham AS, Rogerson PA. 2009. The SAGE Handbook of Spatial Analysis. Los Angeles: SAGE.

Henderson CR. 1953. Estimation of Variance and Covariance Components. Biometrics, 9: 226-252.

Henderson CR. 1975. Best Linear Unbiased Estimation and Prediction under a Selection Model. Biometrics, 31: 423-447.

Nelder JA, Mead R. 1965. A simplex method for function minimization. Comput J, 7:308-313. Petrucci A, Salvati N. 2004. Small area estimation using spatial information. The rathbun lake

(9)

Pratesi M, Salvati N. 2008. Small area estimation: the EBLUP estimator based on spatially correlated random area effects. Statistical methods and applications, Stat. Meth. & Appl. 17:113-141.

Rahmawati R. 2010. Model regresi terboboti geografis dengan pembobot kernel normal dan kernel kuadrat ganda untuk data kemiskinan (Kasus 35 desa atau kelurahan di Kabupaten Jember. [tesis]. Bogor: Program Pascasarjana, Institut Pertanian Bogor. Rao JNK. 2003. Small area estimation. London: Wiley.

Salvati N. 2004. Small area estimation by spatial models: the spatial empirical best linear unbiased prediction (Spatial EBLUP). Dipartimento di Statistica”G. Parenti” viale

morgagni, 59-50134.

Schabenberger O, Gotway CA. 2005. Statistical Methods for Spatial Data Analysis. Chapman & Hall/CRC.

Gambar

Gambar 1 Diagram kotak garis pengeluaran perkapita desa dengan metode pendugaan  langsung, EBLUP dan SEBLUP
Gambar  2  Diagram  kotak  garis  pendugaan  RRMSE  pengeluaran  perkapita  desa  dengan  metode pendugaan langsung, EBLUP dan SEBLUP

Referensi

Dokumen terkait

Small area estimation merupakan salah satu solusi untuk memperbaiki ha1 tersebut, yaitu melakukan pendugaan dengan informasi-informasi tambahan yang bisa

Metode ini kemudian digunakan untuk menduga pengeluaran perkapita desa di Kabupaten Jember Provinsi Jawa Timur dan menghitung MSE dan RRMSE dengan menggunakan data

Penelitian ini bertujuan untuk melakukan simulasi dan membandingkan hasil estimasi metode Small Area Estimation (SAE) dengan hasil estimasi langsung pada data

Dengan demikian untuk mendapatkan ukuran kemiskinan sampai tingkat desa yang bersumber dari data survei yang dirancang untuk menghasilkan estimasi parameter hanya pada

Pada penelitian ini akan dilakukan pendugaan persentase penduduk miskin pada setiap kabupaten/kota di Provinsi Nusa Tenggara Timur menggunakan metode Small Area

Hasil dari penelitian ini SAE metode SEBLUP dengan prosedur REML menghasilkan nilai estimasi persentase wanita usia subur dengan fertilitas tinggi level desa yang lebih

Pendugaan area dengan domain yang lebih kecil secara langsung relati memiliki ketelitian yang cukup buruk bila sampel yang digunakan relatif kecil, sehingga

PENGGUNAAN METODE EMPIRICAL BEST LINEAR UNBIASED PREDICTION (EBLUP) PADA GENERAL LINEAR MIXED MODEL 3.1 Penaksiran Parameter pada General Linear Mixed Model dengan Asumsi