BAB II
TINJAUAN
PUSTAKA 2.1 Small Area EstimationSmall Area Estimation (SAE) adalah suatu teknik statistika untuk menduga parameter-parameter sub populasi yang ukuran sampelnya kecil. Sedangkan, area kecil didefinisikan sebagai himpunan bagian dari populasi (sub populasi) yang ukuran contohnya kecil dengan suatu peubah menjadi perhatian (Rao,2003). Metode SAE menjadi berperan sangat penting dalam analisis data survei karena adanya peningkatan permintaan agar menghasilkan dugaan parameter yang cukup akurat dengan ukuran sampel yang kecil.
Permasalahan pokok yang timbul dalam SAE ada dua. Pertama, bagaimana menghasilkan suatu dugaan parameter yang cukup baik dengan ukuran sampel kecil pada area kecil. Kedua, bagaimana mmenghasilkan model yang sesuai dengan domain atau area kecil. Menurut (Pfefferman, 2002) solusi untuk permasalahan tersebut adalah dengan “meminjam informasi” dari dalam area, luar area, maupun luar survei.
Terdapat dua cara pendugaan parameter pada suatu domain atau area kecil. Pertama dengan pendugaan secara langsung (direct estimation), kedua dengan cara pendugaan tak langsung (indirect estimation). Pada pendugaan tak langsung SAE merupakan suatu pendugaan dengan cara memanfaatkan informasi variabel lain yang berhubungan dengan parameter yang diamati. Pendugaan parameter dan inferensinya yang menggunakan informasi tambahan tersebut, dinamakan pendugaan tak langsung (indirect estimation). Metode dengan memanfaatkan
informasi tambahan tersebut secara statistik memiliki sifat “meminjam kekuatan” (borrowing strength) informasi dari hubungan antara variabel respon dengan informasi yang ditambahkan. Dengan demikian, pendugaan tidak langsung ini mencakup data dari domain yang lain (Kurnia, 2009).
Ada dua konsep pokok yang digunakan untuk mengembangkan model pendugaan parameter small area, yaitu:
1. Model pengaruh tetap (fixed effect model) dimana asumsi bahwa keragaman di dalam small area variabel respon dapat diterangkan seluruhnya oleh hubungan keragaman yang bersesuaian pada informasi tambahan.
2. Model pengaruh acak (random effect) dimana asumsi keragaman spesifik small area tidak dapat diterangkan oleh informasi tambahan.
Gabungan antara kedua model tersebut membentuk model campuran (mixed model). Karena variabel respon diasumsikan berdistribusi normal maka pendugaan area kecil yang dikembangkan merupakan bentuk khusus dari General Linear Mixed Model (GLMM).
Model small area biasanya menggunakan model linier campuran dalam bentuk
y= Xβ+Zu+e (2.1)
dimana X adalah matriks peubah penyerta, Z adalah vektor acak yang biasa dikenal sebagai pengaruh area kecil, dan e adalah vektor dari galat sampel (Rao, 2003). Menurut Rao (2003) ada dua model dasar pendugaan area kecil, yaitu basic area level model dan basic unit level model.
a. Basic area level model yaitu model yang didasarkan pada ketersediaan data
pendukung yang hanya ada untuk level area tertentu, misalkan xi=( ,...,x1i xpi)T
dengan x adalah suatu vektor, i i adalah banyaknya area dan p adalah banyaknya
peubah pendukung, dan parameter yang akan diduga θi, diasumsikan mempunyai
hubungan dengan x . Data pendukung tersebut digunakan untuk membangun i
model sebagai berikut:
θi=xiTβ+ui, i =1,....,m (2.2)
dengan β merupakan vektor koefisien regresi untuk data pendukung x i
dan u berdistribusi independen i N(0,σu2), sebagai pengaruh acak yang
diasumsikan normal.
estimator θi, dapat diketahui dengan mengasumsikan bahwa model penduga
langsung yi telah tersedia yaitu: i i i
y =θ +e , i=1,...,m (2.3)
dengan ei
∼
N(0,σei2) dan σ diketahui. Pada akhirnya model (2.2) dan ei2 (2.3) digabungkan dan menghasilkan model gabungan:ɵ T
i xi b ui i ei
θ = β + + , i =1,...,m (2.4)
Model persamaan (2.4) merupakan bentuk khusus dari model linier campuran (general linear mixed model).
b. Basic unit level model yaitu suatu model dimana data-data pendukung yang
tersedia bersesuaian secara individu dengan data respon, misal XIJ=(xij1,...,xijp)T, sehingga dapat dibangun suatu model regresi tersarang
T
ij ij i ij
dimana j adalah banyaknya rumah tangga pada area ke-i dengan 2
(0, )
i u
u
∼
N σ dan ei∼
N(0,σei2).Penelitian ini menggunakan model basic area level model karena data pendukungnya hanya ada untuk level area tertentu, yaitu pada level kecamatan. Untuk model berbasis area dengan satu peubah penyerta, model (2.1) bisa dinyatakan sebagai: i i i y =θ +e (2.6) ɵ T i xi b ui i ei θ = β + + (2.7)
dengan β merupakan vektor koefisien regresi untuk data pendukung x i
dan u berdistribusi independen i N(0,σu2), sebagai pengaruh acak yang
diasumsikan normal dan ei
∼
N(0,ψi) (Fay dan Herriot, 1979). 2.2 SAE dengan Pendekatan NonparametrikMukhopadhyay dan Maiti (2004) menjelaskan bahwa untuk mengurangi bias yang relatif besar dari statistik area kecil dengan peubah penjelasnya dan untuk mendapatkan penduga MSE yang lebih baik dapat dirumuskan sebagai berikut: i i i y =θ +e (2.8) ( ) i m xi ui θ = + (2.9)
dimana i=1,2,...,n menunjukkan jumlah area kecil. Fungsi m (.) adalah fungsi mulus (smoothing function) yang mendefinisikan hubungan antara x dan y
. θi adalah rataan area kecil yang tidak teramati, yi adalah penduga langsung dari rataan area kecil, u galat peubah acak yang berdistribusi independen dan identik i
dengan E u( )i =0 dan var( )ui =σu2, dan e berdistribusi independen dan identik i
dengan E e( )i =0 dan var( )ei =Di, dengan asumsi D diketahui. Persamaan 2.9 i
dan 2.10 disubstitusikan maka akan menghasilkan persamaan berikut: ( )i
y=m x + +u e (2.10)
2.3 Regresi Kernel
Regresi merupakan metode analisa yang menggambarkan pola hubungan secara umum antara variabel prediktor ( x ) dan variabel respon (y). Apabila terdapat n pengamatan yang independen yaitu ( , ), ( ,x yi i x y2 2),..., ( ,x yn n), dan
hubungan antara x dan i yi tersebut mengikuti regresi nonparametrik, dalam hal ini x adalah prediktor dan i yi adalah respon, maka dapat dimodelkan sebagai berikut:
( )
i i i
y =m x +ε , i=1,2,3,..., m (2.11)
dimana m x( )i adalah fungsi/kurva regresi yang bentuknya tidak diketahui
dan εi
∼
N(0,σ2). Fungsi regresi m x( )i pada model regresi nonparametrik dapatdiestimasi dengan pendekatan kernel yang didasarkan pada fungsi densitas kernel (Hardle, 1994).
Estimasi densitas kernel didefinisikan dengan:
1 1 ˆ ( ) ( ) n h i x m x K h = h =
∑
(2.12)dimana K(.) disebut dengan fungsi kernel dan h adalah banwidth atau
parameter pemulus yang berfungsi mengatur kemulusan dari kurva yang diestimasi.
Masalah terpenting dalam penggunaan estimasi densitas kernel adalah pemilihan bandwidth yang optimum yang bersesuaian dengan fungsi kernel yang digunakan. Jika nilai bandwidth terlalu kecil maka akan diperoleh penaksir kurva yang kurang halus, sebaliknya jika nilai bandwidth terlalu besar maka akan diperoleh penaksir kurva yang semakin halus, akibatnya kemampuan untuk memetakan data tidak terlalu baik. Dalam penelitian ini dipilih h n∞ −15 (Indahwati, Sadik, Nurmasari, 2008). Fungsi kernel yang digunakan pada penelitian ini adalah fungsi Kernel Epanechnikov.
Persamaan matematis fungsi Kernel Epanechnikov adalah sebagai berikut:
(
2)
(
)
3
( ) 1 1
4
K x = −x I x ≤ (2.13)
dimana I x
(
≤1)
merupakan fungsi indikator yang bernilai 1 jika x ≤ 1 dan bernilai 0 untuk yang lainnya.2.4 SAE Dengan Metode Kernel
Mukhopadhyay dan Maiti (2004) dalam menduga m x( )i menggunakan
pendugaan kernel Nadaraya-Watson
( )
( ) ˆ ( ) h i i i h i h i i K x x y m x K x x − = −∑
∑
(2.14)dimana Kh(.) adalah fungsi Kernel dengan bandwidth h
Berdasarkan persamaan di atas dapat diperlihatkan bahwa penduga terbaik dari nilai area kecil θi dengan σu2 tidak diketahui, adalah:
ɵi ɵi iy (1 ɵ ˆi)m xh( )i
dengan ɵ 2 2 ˆ ˆ u i i u D σ γ σ = + (2.16)
Penduga dari σu2 dirumuskan dengan:
{
}
2 2 1 1 ˆ ( ) max 0 , ( ){ ˆ( )} 1 n i i u hi i x W x y m x D n σ = = − − −∑
(2.17) dengan ( ) ( ) 1 ( ) h i hi h i i K x x W x K x x n − = −∑
(2.18)2.5 Pendugaan MSE dengan Pendekatan Bootsrap
Metode Bootsrap pertama kali diperkenalkan oleh Bradley Efron pada tahun 1979. Metode Bootsrap merupakan suatu metode teknik resampling yang bertujuan untuk memperkirakan suatu parameter θi dari suatu populasi
(Nadhia,2006). Metode Bootsrap dapat digunakan pada data yang jumlah sampelnya terlalu sedikit, sehingga dalam pengujian kenormalan data tidak akan sesuai dengan keadaan yang sebenarnya. Metode Bootsrap dapat juga digunakan untuk mengestimasi distribusi suatu statistik. Distribusi ini diperoleh dengan menggantikan distribusi populasi yang tidak diketahui dengan distribusi empiris berdasarkan data sampel, kemudian melakukan pengambilan sampel (resampling) dengan mengeluarkan sampel dari distribusi empiris yang selanjutnya digunakan untuk mencari penaksir Bootsrap. Dengan metode Bootsrap tidak perlu melakukan asumsi distribusi dan asumsi-asumsi awal untuk menduga bentuk distribusi dan pengujian-pengujian statistiknya ( Kurnia, 2006)
Penduga MSE dengan bootsrap diberikan oleh:
ɵ
(
ɵ)
* 2 *( ) *( ) 1 1 ( )i B i j i j j MSE J θ =∑
= θ −θ (2.19)dimana nilai J merupakan banyaknya populasi bootstrap, θɵ*( )i j merupakan
pendugaan rataan area kecil ke-i dari populasi bootstrap ke- j , dan *( )j i
θ merupakan nilai sebenarnya rataan area kecil ke-i dari populasi bootstrap ke- j . Efron dan Tibshirani (1993) menyatakan nilai B yang besar biasanya akan sangat baik untuk menurunkan mean square error. Penentuan besarnya nilai B sangat bervariatif, karena basar kecilnya nilai B mampu memberikan hasil yang berbeda-beda untuk setiap tahapan dalam analisis. Nilai B yang kecil, misalnya B=50 dapat menghasilkan replikasi bootstrap yang cukup baik. Sedangkan nilai B=100 juga terbilang baik karena dapat memberikan nilai yang baik dalam estimasi standar error. Jarang sekali peneliti memakai B lebih dari 200 (Darsyah, 2013). 2.6 Jumlah Penduduk Miskin
Bappenas (2004) mendefinisikan kemiskinan sebagai kondisi di mana
seseorang atau sekelompok orang, laki-laki dan perempuan, tidak mampu memenuhi hak-hak dasarnya untuk mempertahankan dan mengembangkan kehidupan yang bermartabat. Hak-hak dasar masyarakat desa antara lain, terpenuhinya kebutuhan pangan, kesehatan, pendidikan, pekerjaan, perumahan, air bersih, pertanahan, sumber daya alam dan lingkungan hidup, rasa aman dari perlakuan atau ancaman tindak kekerasan dan hak untuk berpartisipasi dalam kegiatan sosial-politik, baik bagi perempuan maupun bagi laki-laki.
Kamaluddin (2005) menyatakan bahwa faktor-faktor yang mempengaruhi kemiskinan di perkotaan antara lain Banyaknya masyarakat desa yang pindah ke kota (Urbanisasi), Tingkat pendidikan yang rendah, dan Pengangguran. Suatu angka kemiskinan pada suatu daerah dapat dilihat melalui besar kecilnya angka
jumlah penduduk miskin. Kebutuhan manusia banyak dan beragam, karena itu mereka berusaha untuk memenuhi kebutuhannya. Hal yang biasa dilakukan adalah bekerja untuk mendapatkan penghasilan atau pendapatan.
Cahyono (1998) menyatakan salah satu faktor yang mempengaruhi pendapatan adalah faktor umur. Umur produktif berkisar antara 15-64 tahun yang merupakan umur ideal bagi para pekerja. Di masa produktif, secara umum semakin bertambahnya umur maka pendapatan akan semakin meningkat, yang tergantung juga pada jenis pekerjaan yang dilakukan. Kekutan fisik seseorang dalam melakukan sesuatu sangat erat kaitannya dengan umur karena bila umur seseorang telah melewati masa produktif, maka semakin menurun kekuatan fisiknya sehingga produktivitasnya pun menurun dan pendapatan juga ikut menurun.
Apabila mereka yang diusia 65 tahun keatas bekerja atau bahkan menganggur, konsekuensinya adalah mereka tidak dapat memenuhi kebutuhannya dengan baik, kondisi ini membawa dampak bagi terciptanya dan membengkaknya jumlah penduduk miskin yang ada. Dalam penelitian ini dipilih variabel penduduk usia 65 tahun keatas, dimana bahwa semakin tinggi penduduk usia tidak produktif maka akan meningkatkan kemiskinan.