BAB II
Tinjauan Pustaka
2.1. Pendahuluan
Dalam bab ini dibahas berbagai metode terkait dengan metode pendugaan area kecil, dimulai dengan pembahasan model dasar pendugaan area kecil meliputi metode pendugaan parameter dan pendugaan Kuadrat Tengah Galat (KTG), baik menggunakan cara klasik maupun melalui pendekatan Bayes. Kajian pustaka selanjutnya adalah tentang pengembangan pendugaan SAE yang memperhitungkan proses pengambilan contoh khususnya untuk pengambilan contoh yang berpeluang tidak sama.
Karena model SAE yang dibahas dalam penelitian ini diaplikasikan untuk menghitung Indeks Pendidikan yang merupakan salah satu komponen dari Indeks Pembangunan Manusia, sehingga pada bab ini juga akan dijelaskan cara dan dasar perhitungan IPM khususnya untuk Indeks Pendidikan.
Data yang digunakan adalah data Susenas untuk Provinsi Jawa Timur tahun 2010 dan data Sensus Penduduk tahun 2010 khususnya di Kabupaten Sumenep dan Pasuruan. Oleh karena itu juga dibahas metode penarikan contoh Susenas dan cara pembobotan untuk pendugaan parameter berbasis data Susenas.
2.2. Model Dasar Pendugaan Area Kecil
Berbagai survei umumnya dirancang untuk menduga parameter populasi untuk wilayah atau area yang besar, misalnya untuk wilayah nasional/ regional (provinsi/kabupaten/kota) dan pendugaan parameternya didasarkan pada rancangan. Karena itu untuk area kecil umumnya jumlah contoh menjadi kurang mencukupi terutama jika ingin digunakan pendugaan berdasarkan rancangan. Oleh karena itu beberapa peneliti statistik telah mengembangkan Metode Pendugaan Area Kecil atau Small Area Estimation (SAE) untuk pendugaan parameter di suatu area dimana jumlah contohnya berukuran kecil.
Metode SAE ini pertama kali diperkenalkan oleh Fay & Heriot (1979), merupakan pendugaan tidak langsung atau berdasarkan model (model based
estimation). Oleh karena itu untuk membangun model SAE dibutuhkan informasi tambahan dari peubah yang memiliki hubungan dengan peubah yang sedang diamati yang disebut sebagai peubah penyerta (auxiliary variable). Peubah penyerta ini dapat diukur dari survai yang lain atau dalam catatan administrasi dan diharapkan memiliki korelasi dengan peubah yang diamati. Dengan metode SAE diharapkan adanya perbaikan efisiensi dari pendugaan parameter dalam area kecil jika peubah penyerta tersedia.
Model SAE memperkenalkan model campuran yang menyertakan pengaruh area spesifik yang memperhitungkan variasi antar area diluar yang dapat dijelaskan oleh peubah penyerta yang ada di dalam model. Ketersediaan data dari peubah penyerta akan sangat menentukan kesuksesan dalam pembuatan model SAE.
Rao (2003) menyatakan bahwa penggunaan model SAE ini memberikan beberapa keuntungan yaitu: 1) Diagnostik model dapat digunakan untuk mendeteksi kecocokan dengan data, misalkan menggunakan analisis sisaan 2) Pengukuran presisi area-spesifik dapat diasosiasikan dengan setiap pendugaan setiap area kecil, 3) Model linier campuran seperti model regresi logistik dengan pengaruh acak area–spesifik tetap dapat dilakukan, demikian juga untuk struktur data yang cukup kompleks misalkan struktur data time series atau spasial; 4) pengembangan metode untuk model pengaruh acak dapat dimanfaatkan untuk mencapai akurasi dalam area kecil.
2.2.1. Pendugaan Area Kecil Berbasis Area
Misalkan terdapat M area kecil di dalam populasi, maka untuk kepentingan pendugaan area kecil hanya diambil contoh sebanyak m area. Diasumsikan bahwa parameter yang diperhatikan dalam area kecil ke-i, misalkan θi dapat dinyatakan sebagai sebuah fungsi yang menghubungkan parameter tersebut dengan peubah pembantu yang diukur dari area kecil yaitu zi=(z1i,z2i,...,zpi)T. Rao (2003) mengatakan bahwa model linier yang menjelaskan hubungan tersebut adalah: i i b T i i
υ
θ
=z β+ i=1,2,...m, (2.1)dimana bi
(
)
T Pβ
β
β
1, 2,..., = β adalah konstanta positif yang diketahui danadalah vektor koefisien regresi berukuran p x 1. Selanjutnya υi adalah pengaruh acak area spesifik diasumsikan memiliki sebaran
υ
i ~(0,σ
υ2)Jika penduga langsung
θ
ˆidiketahui, makaθ
ˆi dapat dinyatakan sebagai :i i i =
θ
+eθ
ˆ , untuk i=1,2,...m, (2.2) dimana : i i i p i i p e V e E ( θ)=0, ( θ)=ψ . (2.3)Rao (2003) menjelaskan bahwa model SAE untuk tingkat area, terdiri dari dua komponen model yaitu komponen model pendugaan langsung dan pendugaan tak langsung. Kombinasi model pendugaan langsung (2.2) dan tak langsung (2.1) dikenal sebagai Model Campuran Linier Terampat/MCLT (Generalized Linear Mixed Model:GLMM) sebagai berikut:
i i i T i i =z
β
+bυ
+eθ
ˆ . (2.4)Model area kecil seperti yang dijelaskan pada persamaan (2.4) di atas dikenal sebagai model Fay-Heriot, dimana keragaman peubah respon di dalam area kecil diasumsikan dapat diterangkan oleh hubungan peubah respon dengan informasi tambahan yang disebut sebagai model pengaruh tetap. Selain itu terdapat komponen keragaman spesifik area kecil yang tidak dapat diterangkan oleh informasi tambahan dan disebut sebagai komponen pengaruh acak area kecil. Gabungan dari dua asumsi tersebut membentuk model pengaruh campuran.
2.2.2. Pendugaan Area Kecil Berbasis Unit
Pendugaan area kecil berbasis unit mengasumsikan bahwa data dari peubah penyerta level unit xij=(xij1,...xijp)T tersedia untuk setiap elemen ke j pada area ke-i. Peubah yang diperhatikan adalah yij yang diasumsikan memiliki hubungan dengan xij ij i T ij ij x e y = β+υ + melalui model: , j=1,...,ni Pengaruh acak area
, i=1,...m. (2.5)
i
υ
diasumsikan merupakan peubah acak yang bersifat iid sedangkan eij =kije~ij dengan kij adalah konstata dan e~ij adalah peubah acakyang bersifat iid dan bebas terhadap υ dimana i 2 0 ) ~ ( ij e m e E = dan Vem(~eij)=σe2.
Seringkali
υ
idan eij diasumsikan memiliki sebaran peluang normal.Dengan mengasumsikan bahwa percontohan si berukuran ni diambil dari populasi di area ke-i berukuran Ni
+ + = = * * * * 1 1 i i i i i i i i i i e e y y υ β X X y
(i=1,2...m) dan penarikan contoh dalam setiap area diambil secara acak sederhana, sehingga model (2.5) dapat dinyatakan dalam bentuk matriks:
(2.6)
*
i
y menyatakan unit-unit yang tidak terambil dalam percontohan. Jika Yiadalah rata-rata populasi di area ke-i, maka Yi dapat ditulis sebagai:
* ) 1 ( i i i i i f y f Y Y = + − (2.7)
dimana fi =ni/Ni dan yi adalah rata-rata dari seluruh contoh di area ke-i dan *
i
Y menyatakan rata-rata elemen populasi dari bagian yang tidak terambil sebagai contoh. Oleh karena itu untuk model SAE berbasis unit, pendugaan parameter area kecil Yi sama dengan menduga *
i
Y jika data percontohan {yi} dan {Xi} tersedia.
2.3. Pendugaan Parameter Model SAE
2.3.1. Metode Prediksi bias Linier Terbaik (PTLT) dan Prediksi Tak-bias Linier Terbaik Empirik (PTLTE)
Parameter di area kecil, misalkan rataan atau tolal, dapat dinyatakan sebagai kombinasi linier dari efek tetap dan efek acak seperti dinyatakan pada persamaan (2.1) untuk model berbasis area dan persamaan (2.5) untuk model berbasis unit.
Melalui pendekatan klasik, pendugaan parameter model SAE umumnya mengaplikasikan metode PTLT dengan meminimumkan Kuadrat Tengah Galat (KTG). Metode PTLT ini tidak tergantung pada kenormalan dari efek acak tetapi tergantung pada ragam atau koragam dari efek acak. Untuk menduga komponen ragam dan koragam umumnya digunakan metode ML atau REML dengan mengasumsikan kenormalan. Dengan cara tersebut pendugaan dilakukan melalui proses dua tahap yang dikenal sebagai PTLTE.
Misalkan data percontohan memenuhi model linier campuran terampat berikut: e Zv Xβ y= + + (2.8) dimana:
y adalah vektor data observasi berukuran n x 1
X dan Z adalah matriks berukuran n x p dan n x h yang diketahui
v dan e adalah berdistribusi saling bebas dengan rataan 0 dan ragam G dan R yang tergantung pada parameter T
q)
,... (δ1 δ =
δ , diasumsikan
bahwa δ adalah himpunan bagian dari ruang Euclidean sedemikian
hingga T
y
Var( )=V=V(δ)=R+ZGZ adalah non singular untuk semua δ yang terdapat dalam himpunan bagian tersebut, dimana Var (y) adalah matrik ragam-koragam dari y.
Parameter yang akan diduga merupakan kombinasi linier: µ=1Tβ+mTv
(Rao 2003). Penduga dari µ adalah µˆ=aTβ+b untuk a dan b diketahui dan merupakan penduga tak bias jika E(µˆ)=E(µ). Selanjutnya Kuadrat Tengah Galat (KTG) didefinisikan sebagai 2
) ( ) ˆ
(µ =E µ−µ
KTG dan jika
µ
adalah penduga tak bias dari µ, maka KTG(µˆ)=Var(µ−µ) .Pada Rao (2003), penduga PTLT µ yang meminimumkan KTG dinyatakan dalam formula:
), ~ ~ ~ ~ ~ t(δ(y) 1 β m v 1 β m GZ V (y Xβ μH = = T + T = T + T T −1 − (2.9) dimana: y V X X) V (X (δ β β= = T −1 −1 T −1 ) ~ ~ (2.10)
adalah penduga tak bias linier terbaik (Best Linear Estimator: BLUE) dari β dan
) β X (y V GZ (δ v v ~ ) T 1 ~ ~= = − − . (2.11)
Penduga PTLT tergantung pada ragam δ yang biasanya tidak diketahui. Jikaδ diduga dengan δˆ=δˆ(y), maka akan diperoleh Prediksi Tak-bias Linier Terbaik Empirik (PTLTE) yang tetap merupakan penduga tak bias bagi µ. Penduga δ diperoleh melalui metode ML atau REML.
Untuk model berbasis unit, dimana rataan area kecil ke-i dinyatakan oleh fungsi:µi =X~Tiβ+υi. Untuk model percontohan y X~ β υi eij
T ij
ij = + + , j=1,..ni; i=1,....,m dapat ditulis dalam bentuk matriks sebagai berikut:
i n i i i =Xβ+υ1i +e y . (2.12)
Model SAE yang dinyatakan oleh (2.12) merupakan bentuk khusus dari persamaan (2.8), dimana Gi =συ2, dan 1 ( 2)
2 ij n j e i diag k R i ≤ ≤ +σ sehingga: − = − T i i i i ij j e i aa a a diag V γ σ ( ) 1 2 1 . (2.13)
Dengan mengambil (συ2/σe2)/(1−γi)=γi/aidimana =∑
j ij i a a , T in i i a a i a =( 1,...., ) maka penduga PTLT dari µi
) ~ ( ~ ~ ~ β γ β µ T ia ia i T i H i = X + y −x adalah (Rao 2003): (2.14) dimana yia danxia adalah rataan terbobot:
∑ =∑
=
j ij ij i ia j ij ij i
ia a y a x a x a
y / ., / .,
β~ adalah penduga tak bias linier terbaik bagiβ
∑ − − ∑ − = i i i i T i i i T iV X X V y X ) ( ) ( ~ 1 1 1 β (2.15) ∑ − = = − − j T ia ia i i T ij ij ij e i i i T iV X A a x x a x x X 1 σ 2( γ . ) (2.16) ∑ − = − − j ij ij ij i i ia ij e i i T iV y a x y a x y X 1 σ 2( γ . ). (2.17)
Penduga tak bias linier terbaik (2.14) dapat dinyatakan sebagai rata-rata terbobot dari penduga regresi yia +(Xi−xia)Tβ~ dan penduga regresi sintetik β
~ T i X berikut:
[
( ) ~]
(1 ) ~. ~ γ β γ β µ T i i T ia i ia i H i = y + X −x + − X (2.19)Bobot γi(0≤γi ≤1) mengukur ragam model ( 2 υ
σ ), relatif terhadap ragam total
i e /a
2 2 σ
συ + . Jika ragam model relatif kecil maka γ akan kecil dan bobotnya akan i lebih besar di komponen sintetik.
2.3.2. Pendugaan Parameter Model SAE Melalui Pendekatan Bayes
Melalui pendekatan Bayes, pendugaan parameter di area kecil dapat dilakukan dengan 2 cara yaitu pendugaan Bayes Empirik/BE (Empirical Bayes: EB) dan Bayes Berhirarki /BH (Hierarchical Bayes:HB). Untuk pendekatan Bayes Empirik, pendugaan didasarkan pada sebaran posterior yang diduga dari data, sedangkan pada pendekatan Bayes berhirarki parameter model yang tidak diketahui diperlakukan sebagai komponen acak yang memiliki sebaran prior
tertentu. Model pendugaan area kecil menggunakan Bayes telah dikembangkan oleh beberapa peneliti diantaranya Gosh dan Rao (1994), You dan Rao (2000).
Pendekatan Bayes, baik Bayes Empirik maupun Bayes Berhirarki merupakan metode yang dapat diaplikasikan secara lebih umum sehingga banyak digunakan untuk data diskrit, misalkan untuk data biner dan data cacahan.
Untuk peubah respons dengan sebaran normal, model dasar area dapat dinyatakan sebagai model Bayes berhirarki dua tahap yaitu:
1) ˆ / ~ ( i, i) ind i i
θ
Nθ
ψ
θ
, i: 1,2,3,……,m (2.20) 2)θ
~ ( Tiβ
, i2σ
υ2) ind i N z b , i: 1,2,3,……,m (2.21)Dimana β adalah vektor parameter regresi berukuran p x 1. Dalam pendekatan Bayes, parameter model β dan 2
υ
σ
adalah peubah acak, dan model hirarki dua tahap disebut model hirarki bebas bersyarat (conditionally independent hierarchical model : CIHM) karena pasangan( )
θ
ˆi,θ
i adalah bebas di antara area i, untuk β danσ
υ2 tertentu.Penduga optimum dari θi merupakan nilai harapan bersyarat dari θi
β
θ
ˆi, jika diberikan danσ
υ2: β γ θ γ θ σ β θ θ υ T i i i i B i i i z E( ˆ, , 2)= ˆ = ˆ +(1− ) (2.22) dimana(
)
i i i i b b ψ σ σ γ υ υ += 2 22 2 . Nilai harapan dari θi merupakan nilai harapan dari
sebaran posterior (atau bersyarat) dari θi jika diberikan
θ
ˆi,β
dan2 υ
σ
: ) ) ( , ˆ ( ~ , , ˆ 2 1 2 i i i B i i iθ β σ N θ g σ γψ θ υ υ = . (2.23) Penduga θˆ θˆiB(β,συ2) Bi = adalah penduga Bayes dibawah squared error
loss dan merupakan nilai optimum dari KTG, dimana 2 ) ˆ ( ) ˆ ( i B i B i E KTGθ = θ −θ ,
selalu lebih kecil dibandingkan dengan θ dan linier atau non linier dalam
θ
ˆi. Jiang et al. (2002) menyatakan bahwaθ
ˆiBdisebut prediksi terbaik (Best Prediction: BP) dari penduga θi karena diperoleh dengan tanpa mengasumsikan parameter model.Penduga Bayes
θ
ˆiB tergantung pada parameter model β danσ
υ2 yang diduga dengan menggunakan metode ML atau REML dari sebaran marjinal :(
,)
. ~ ˆ 2 2 i i T i ind i N z β b σ ψ θ υ + . (2.24) Penduga parameter dinotasikan denganβ
ˆdanσ
ˆυ2, sehingga dengan menggantikanβ
ˆ untuk β danσ
ˆυ2 untukσ
υ2, maka Penduga Bayes Empirik (Empirical Bayes Prediction: EBP) untukθ
iadalah:(
ˆ, ˆ)
ˆ ˆ (1 ˆ) ˆ. ˆ ˆ θ β σ2 γθ γ β θ υ i i i iT B i EB i = = + − z (2.25)Penduga BE,
θ
ˆiEB adalah identik dengan penduga PTLTE yang dinotasikan denganθ
ˆiH juga merupakan rataan dari estimasi densitas posterior ,(
ˆ2)
, ˆ , ˆ υ σ β θ θi f dariθ
i, yaitu(
EB i i)
i Nθˆ ,γˆψ .2.4. Peluang Penarikan Contoh
Metode pengambilan contoh berbasis peluang telah banyak dibahas oleh beberapa peneliti. Metode pengambilan contoh berbasis peluang yang banyak dibahas dan sering diaplikasikan adalah metode pengambilan contoh acak sederhana (simple random sampling), metode pengambilan contoh berstrata (stratified sampling), metode pengambilan contoh bergerombol (cluster sampling) dan metode pengambilan contoh sistematik (systematic sampling). Masing-masing metode pengambilan contoh memiliki konsekuensi terhadap perhitungan pendugaan parameter. Dalam rangka mendapatkan penduga yang tak berbias maka bobot peluang tersebut harus diperhitungkan dalam pendugaan parameter. Misalkan akan diduga parameter total Y =∑Uyj atau rataan Y =Y/N, dengan menggunakan contoh s yang diambil dari populasi U dengan peluang p(s), maka dengan mengasumsikan semua elemen j ∈ s dapat diobservasi, maka Yˆadalah penduga berbasis rancangan dari Y dan dikatakan tak bias jika:
Y Y s p Y Ep(ˆ)=∑ ( )ˆs = . (2.26)
. / N n wi = . / h h i n N w =
Ragam untuk Yˆ adalah Vp(Yˆ)=Ep
[
Yˆ−Ep(Yˆ)]
2dan penduga untuk Vp(Yˆ) yang dinotasikan dengan vp(Yˆ)=s2(Yˆ) dikatakan tak berbias jika) ˆ ( )] ˆ ( [S2 Y V Y Ep = = p .
Untuk pengambilan contoh yang dirancang dengan bobot wj, dimana wj
j
π
merupakan jumlah elemen-elemen dalam populasi yang direpresentasikan oleh contoh j sehingga, jika adalah peluang terambilnya contoh ke j maka
j j
w =1/
π
. Bobot wj tergantung pada s dan elemen j (j s), sehingga ∈∑
∈=
} , {s j s(
)
jp
s
π
, j=1,2,....,N dan {s: j ∈ s} menyatakan jumlah dari semua contoh s yang memuat elemen j. Oleh karena itu penduga Y dapat ditulis sebagai:j y swj
Yˆ =∑ (2.27)
dimana Σs menyatakan jumlah j s. ∈
Besarnya bobot wj ditentukan oleh metode penarikan contoh yang diterapkan. Misalkan untuk pengambilan contoh acak sederhana setiap unit percobaan memiliki bobot yang sama untuk terambil sebagai contoh yaitu 1/N dimana N adalah jumlah unit percobaan dalam populasi yang diteliti. Sedangkan metode penarikan contoh berbasis peluang yang lain akan memiliki bobot yang berbeda tergantung kepada metode penarikan contoh yang digunakan. Pada Cochran (1977) dan Shao J (1999) telah dibahas cara perhitungan bobot untuk masing-masing metode penarikan contoh.
Metode pendugaan parameter secara langsung dengan memperhitungankan bobot percontohan dikenal sebagai Horvitz-Thompson Estimator untuk berbagai cara penarikan contoh (Shao 1999). Jika wi adalah adalah bobot untuk contoh ke-i, maka untuk berbagai metode penarikan contoh perhitungan bobot wi
1. Penarikan Contoh Acak Sederhana (PCAS) sebagai berikut:
2. Penarikan Contoh Berstrata (PCB) Jika i dalam stratum h, maka :
∑ ∑ ∑ ∈ ∈ = = = 1 1 1 ˆ S i i S i N j ij s Y k M y k M Y i 2 1 2 1 ) 1 ( ) ˆ ( ∑ = − − − = M i i s M Y Y M k M k N Y Var . 1 ˆ 1 1 1 ∑ ∑ ∑ ∈ = ∈ = = S i i i N j ij S i i pps N Y k N y N k N Y i ) /( i i i km MN w = ∑ ∑ ∈ ∈ = i S j ij S i i i s y n N k M Y 2 1 ˆ . 1 ˆ 2 1 ∑ ∑ ∈ ∈ = i S j ij S i i pps y n k N Y
Misalkan yi∈P adalah sebuah kelompok (cluster) dan
i iN i i y y y = 1,... dimana Mi . 1 ∑ = = M i i N N
adalah ukuran dari cluster ke-i, i=1,2...N. Jumlah unit dalam P adalah
Penarikan Contoh Gerombol Satu Tahap
Penarikan contoh dilakukan dengan cara memilih yi dengan meng-observasi semua yij
Oleh karena itu jika digunakan cara PCAS dengan w . i ∑ = = k i i N n 1
=k/N maka total contoh adalah dan
(2.28)
dimana ragam penduganya adalah:
(2.29)
S1 adalah penarikan contoh tahap pertama.
Jika pemilihan contoh proposional terhadap ukuran populasi (propotional to size: pps) maka wi=kNi/N. Sehingga Horvitz-Thompson estimator:
(2.30) Penarikan contoh bergerombol dua tahap
Untuk pemilihan secara acak sederhana (PCAS) pada tahap pertama dan pada tahap kedua dipilih mi contoh dari setiap cluster yi,
maka penduga Horvitz-Thompson adalah
(2.31)
dimana S2i menyatakan perontohan gerombol pada tahap ke dua. Untuk pemilihan secara pps pada tahap pertama dan ni adalah contoh dari yi
(2.32) yang dipilih pada tahap ke dua, maka:
4. Penarikan contoh Sistematik
P={y1,...yN} adalah populasi dengan ukuran N=nk. Untuk memilih contoh berukuran n maka pada pemilihan pertahap diambil contoh j secara acak dari {1,...k} sehingga contoh yang terambil adalah: { yj, yj+k,, ..,yj+(n-1)k), maka wi=k-1.
dimana
2.5. Model SAE dengan Memperhitungkan Peluang Penarikan Contoh.
Pfefferman et al (1998) memperhitungkan peluang penarikan contoh dalam pengembangan model SAE berdasarkan penarikan contoh dua tahap. Didefinisikan peubah indikator I
Penduga Horvitz-Thompson adalah
(2.33)
i dan Iij dimana Ii=1 jika area ke i terambil sebagai contoh dan Iij
s
i
∈
=1 jika unit ke j diambil sebagai contoh dari area ke i yang sudah terambil sebagai contoh atau . Dengan membagi U ke dalam M area
dengan Ni
N
N
M i i=
∑
=1adalah banyaknya unit di area ke-i, sehingga , maka penarikan contoh dua tahap pada polulasi U tersebut adalah sebagai berikut:
1) Tahap pertama memilih m area dengan peluang
π
i=
P
(
i
∈
s
)
. 2) Tahap ke dua diambil ni unit dengan peluangπ
j/i=
P
(
j
∈
s
i|
i
∈
s
)
dari area yang telah terambil sebagai contoh pada tahap pertama, maka bobot penarikan contoh tahap satu adalah
w
i=
1
/
π
i dan untuk tahap ke dua adalah wj/i =1/πj/i.Pada tahap pertama, fungsi kepadatan peluang (probablity density function: pdf) untuk pengaruh ui
s
i
∈
dibedakan atas area yang terambil dan tidak terambil sebagai contoh:
Pada area yang terambil sebagai contoh ( ):
) 1 ( ) ( ) | 1 ( ) 1 | ( ) ( = = = = = i i p i i bayes i i def i s I P u f u I P I u f u f (2.34) Pada area yang tidak terambil sebagai contoh (
i
∉
s
) :) 0 ( ) ( ) | 0 ( ) 0 | ( ) ( = = = = = i i p i i bayes i i def i c I P u f u I P I u f u f (2.35) ∑ = + −
=
n t j t k syk
y
Y
1 ( 1)ˆ
. ) ˆ (Y Y E sy =Pada tahap ke dua, fungsi kepadatan peluang percontohan (sample pdf) dan fungsi kepadatan peluang komplemen percontohan (sample-complement pdf) dari yij ) , | 1 ( ) , | ( ) , , | 1 ( ) 1 , , | ( ) , | ( i ij ij i ij ij p i ij ij ij ij i ij ij def i ij ij s u y I P u x y f u x y I P I u x y f u x y f = = = = =
didefinisikan serupa dengan (2.34) dan (2.35), yaitu : Untuk unit yang terambil sebagai contoh adalah
(2.36) Untuk unit yang tidak terambil sebagai contoh
) , | 0 ( ) , | ( ) , , | 1 ( ) 0 , , | ( ) , | ( i ij ij i ij ij p i ij ij ij ij i ij ij def i ij ij c u y I P u x y f u x y I P I u x y f u x y f = = = = = (2.37)
Jika (υ1,υ2) diukur pada elemen-elemen i∈U dan (πi,wi) menyatakan peluang contoh (sample inclusion probabilities) dan bobot percontohan (sampling weight), dengan mendefinisikan Ep adalah nilai harapan dibawah populasi, Es adalah nilai harapan dibawah percontohan dan Ec adalah nilai harapan dibawah komplemen contoh, maka fungsi kepadatan peluang dari (υ1,υ2) adalah:
Untuk area yang terambil sebagai contoh:
) | ( ) | ( ) , | ( ) , | ( ) | ( 2 2 1 2 1 2 1 2 1 i i p i i p i i i p i i i i s E f E s i f f υ π υ υ υ υ π υ υ υ υ = ∈ = (2.38) sehingga: ) | ( ) | ( ) | ( 2 2 1 2 1 i i s i i i s i i p w E w E E υ υ υ υ υ = (2.39) dimana: ) | ( 1 ) | ( 2 2 i i s i i p w E E υ υ π = (2.40)
Untuk area yang tidak terambil sebagai contoh adalah:
] | 1 [( ) | ( ] , | ) 1 [( ] | 1 [( ) | ( ] , | ) 1 [( ) , | ( ) | ( 2 2 1 2 1 2 2 1 2 1 2 1 2 1 i i s i i s i i i s i i p i i p i i i p i i i i c w E f w E E f E s i f f υ υ υ υ υ υ π υ υ υ υ π υ υ υ υ − − = − − = ∉ = (2.41)
Oleh karena itu nilai harapan dari komplemen contoh adalah: ] | 1 [( ] , | ) 1 [( ) | 1 [( ] | ) 1 [( ) | ( 2 2 1 2 2 1 2 1 i i s i i i s i i p i i i p i i c w E w E E E E υ υ υ υ π υ υ π υ υ − − = − − = (2.42)
2.6. Indeks Pembangunan Manusia (IPM)
Indeks Pembangunan Manusia (IPM) / Human Development Index (HDI) adalah pengukuran perbandingan dari tingkat pendidikan, kesehatan dan standar hidup layak untuk semua negara seluruh dunia. IPM digunakan untuk mengklasifikasikan apakah sebuah wilayah/negara adalah wilayah/negara maju, berkembang atau terbelakang dan juga untuk mengukur pengaruh dari kebijaksanaan ekonomi terhadap kualitas hidup. Indeks ini pada tahun 1990 dikembangkan oleh pemenang nobel India Amartya Sen dan Mahbub ul Haq seorang ekonom Pakistan dibantu oleh Gustav Ranis dari Yale University dan Lord Meghnad Desai dari London School of Economics dan sejak itu dipakai oleh Program pembangunan PBB dan dipublikasikan dalam laporan IPM tahunan .
Komponen pembentuk IPM yaitu komponen kesehatan, pendidikan dan standar hidup layak , masing masing diukur dengan Indeks Kesehatan, Indeks Pendidikan dan Indeks Standar Hidup Layak. Indeks Kesehatan dihitung berdasarkan jumlah anak lahir hidup dari wanita usia 15 – 49 tahun (Children even born: CEB) dan jumlah anak masih hidup dari wanita usia 15 – 49 tahun (children surviving : CS). Indeks Pendidikan diukur berdasarkan angka melek huruf dan rata – rata lama sekolah penduduk usia 10 tahun ke atas, sedangkan Indeks Standar Hidup Layak diukur dengan rata-rata pengeluaran konsumsi riil per kapita pertahun
Di Indonesia, pengukuran IPM dilakukan oleh Badan Pusat Statistik (BPS). Perhitungan dan publikasi IPM dilakukan oleh BPS tiap tahun untuk tingkat propinsi (yang membandingkan tingkat keberhasilan pembangunan antar propinsi), dan tingkat kabupaten/kota (membandingkan IPM antar kabupaten/kota).
2.6.1. Cara Perhitungan IPM
Data dasar yang digunakan dalam pendugaan IPM pada umumnya adalah data hasil survei Susenas yang diselenggarakan oleh BPS tiap tahun. BPS dan UNFPA (1998) menjelaskan tentang cara penghitungan IPM dimana komponen yang akan dihitung berdasarkan data survey adalah Indeks Kesehatan (yang diduga berdasarkan angka harapan hidup dan angka kematian bayi), Indeks Pendidikan (yang diduga dari rata-rata lama sekolah dan angka melek huruf) serta Daya Beli (rasio antara penghasilan dan harga di wilayah tertentu) seperti yang ditunjukkan oleh Tabel 2.1.
Tabel 2.1. Peubah dan sumber data dari masing-masing komponen IPM
Komponen IPM Peubah Sumber data
Pendidikan/pengetahuan*) • Angka melek huruf
• Rata-rata lama sekolah
Susenas (BPS)
Kesehatan • Jumlah anak lahir hidup dari
wanita usia 15-49 tahun (Children Even Born: CEB) • Jumlah anak masih hidup dari
wanita berusia 15-49 tahun (Children Surviving: CS)
Susenas (BPS Profil Kesehatan (Kemenkes)
Standar hidup layak • Pengeluaran konsumsi riil per
kapita per tahun
Susenas (BPS) *) Berdasarkan UNDP patokan usia penduduk 15 tahun ke atas, namun BPS
menggunakan patokan usia di atas 10 tahun
Keterangan:
a. Indeks Pendidikan diukur dengan dua indikator yaitu Angka Melek Huruf /AMH (literacy rate) dan Rata-rata Lama Sekolah/RLS (Mean Years of Schooling: MYS). Angka melek huruf diolah dari peubah kemampuan membaca dan menulis, sedangkan rata-rata lama sekolah dihitung menggunakan tiga variabel secara simultan yaitu partisipasi sekolah, tingkat/kelas yang sedang/ pernah dijalani, dan jenjang pendidikan tertinggi yang ditamatkan
b. Indeks Kesehatan dihitung berdasarkan jumlah anak lahir hidup dari wanita usia 15 – 49 tahun (Children even born: CEB) dan jumlah anak masih hidup dari wanita usia 15 – 49 tahun (children surviving: CS).Usia Hidup yang diukur dengan angka harapan hidup waktu lahir (e0). Metode
ini menggunakan dua macam data dasar yaitu rata-rata anak yang dilahirkan hidup (live - births) dan rata-rata anak yang masih hidup (still living) per wanita usia 15 – 49 tahun menurut kelompok umur lima tahunan.
c. Indeks Kesejahteraan (Standar Hidup Layak) diukur dengan rata-rata pengeluaran konsumsi riil per kapita pertahun. Standar Hidup Layak, seringkali dihitung dengan menggunakan rata-rata pengeluaran per kapita riil yang disesuaikan (adjusted real per capita expenditure).
Perhitungan indeks masing-masing komponen IPM dihitung dengan formula sebagai berikut :
Indeks (Xi) : = (Xi – Xmin)/(Xmax – Xmin) (2.43)
dimana :
Xi : Indikator komponen pembangunan manusia ke – i (i = 1,2,3). Xmin : Nilai minimum Xi (lihat Tabel 2.2)
Xmax : Nilai maksimum Xi (lihat Tabel 2.2)
Nilai minimal Indeks (Xi) adalah 0 dan maksimum 1, namun untuk mempermudah cara membaca skala dinyatakan dalam 100 (persamaan 2.43) dikalikan 100, sehingga 0 < Indeks (Xi) <100). Angka IPM adalah dihitung dengan rumus rata-rata sederhana dari masing-masing Indeks Xi
[
(1) (2) (3)]
3 / 1 X X X IPM = + + yaitu : (2.44) dimana : X(1) : Indeks Kesehatan.X(2) : Indeks Pendidikan = 2/3 (Indeks Melek Huruf) + 1/3 ( Indeks rata-rata lama sekolah).
X(3) : Indeks standar hidup layak (sering diukur dengan konsumsi per kapita yang disesuaikan.
Tabel 2.2 Nilai Maksimum dan Nilai Minimum Indikator Komponen IPM
Indikator Nilai Maksimum Nilai minimum Catatan
Angka Harapan Hidup 85 25 Standar UNDP
Angka Melek Huruf 100 0 Standar UNDP
Rata-rata lama sekolah 15 0
Konsumsi per kapita yang disesuaikan 737.720 300.000 (1996) 360.000 (1999) (a) UNDP menggunakan GNP per capita riil yang disesuaikan (b)
Keterangan
a) Proyeksi konsumsi per kapita yang disesuaikan untuk Jakarta tahun 2018 setelah disesuaikan dengan rumus Atkinson. Proyeksi ini berdasarkan asumsi pertumbuhan konsumsi per kapita 6,5 % selama periode 1993-2018.
b) Setara dengan dua kali garis kemiskinan Propinsi Sulawesi Selatan daerah pedesaan tahun 1990. Untuk tahun 1999 nilai minimum yang disesuaikan adalah 360.000 (penyesuaian adanya krisis ekonomi).
2.6.2. Indikator Pendidikan/ Pengetahuan
Indikator pendidikan dihitung berdasarkan angka melek huruf dan rata-rata lama sekolah. Angka melek huruf diduga berdasarkan proporsi jumlah penduduk umur 10 tahun keatas yang mampu membaca dan menulis baik untuk huruf latin maupun huruf lainnya. Sedangkan rata-rata lama sekolah dihitung berdasarkan data yang didapat dari pertanyaan tentang jenjang dan jenis pendidikan tertinggi yang pernah diduduki. Konversi tahun untuk tingkat pendidikan yang ditamatkan dapat dilihat pada Tabel 2.3. Rumus yang digunakan untuk menghitung Rata-rata Lama Sekolah (RLS) adalah:
(2.45)
dimana : fi = jumlah penduduk menurut jenjang pendidikan wi
No
= penimbang setiap jenjang pendidikan.
Tabel 2.3. Konversi tahun untuk tingkat/kelas pendidikan yang ditamatkan
Tingkat pendidikan Konversi
1 Tidak pernah sekolah 0
2 SD 6 3 SLTP 9 4 SLTA 12 5 D1 13 6 D2 14 7 D3/akademi 15 8 D4/Sarjana 16 9 S2 /Master 18 10 S3/Doktor 21 Sumber : UNDP dan BPS (2001) Catatan :
Bila seseorang drops out kelas dua SLTA, maka konversi tahun lama pendidikannya adalah = 9 + 2 – 1 = 10 tahun ∑ ∑ = i i i f w f RLS
2.7. Survei Sosial Ekonomi Nasional (Susenas)
Susenas adalah survai yang diselenggarakan BPS tiap tahun, ditujukan untuk memonitor perubahan tingkat kesejahteraan masyarakat Indonesia. Jumlah contoh dalam Susenas 2010 mencakup sekitar 304.369 rumahtangga di 497 kabupaten/kota seluruh Indonesia, sehingga estimasi bisa dilakukan sampai dengan tingkat kabupaten/kota (BPS 2010). Di Jawa Timur, Susenas dilaksanakan dengan mengambil jumlah contoh sekitar 29.000 responden untuk 38 Kabupaten/kota atau 639 kecamatan.
2.7.1. Kerangka Percontohan dan Metode Penarikan Contoh
Kerangka percontohan untuk Susenas tahun 2010 berdasarkan listing rumahtangga hasil listing Sensus Penduduk (SP) tahun 2010. Penarikan contoh dalam survai Susenas menggunakan rancangan percontohan dua tahap untuk daerah perkotaan dan tiga tahap untuk daerah pedesaan (BPS 2010).
Kerangka percontohan pemilihan tahap pertama adalah master sampel blok sensus (BS) biasa kondisi 5 Mei 2010. Master BS tersebut disertai dengan informasi banyaknya rumah tangga hasil listing SP2010, muatan blok sensus dominan (pemukiman biasa, pemukiman mewah, pemukiman kumuh), informasi daerah sulit/tidak sulit, dan klasifikasi desa/kelurahan (rural/urban). Kerangka percontohan pemilihan tahap kedua adalah daftar rumah tangga biasa hasil listing SP2010 dalam blok sensus.
Metode penarikan contoh yang digunakan yaitu penarikan contoh dua tahap berstrata. Tahapan dari metode ini diuraikan sebagai berikut:
• Tahap pertama, memilih blok sensus dari secara pps (Probability Proportional to Size) dengan size banyaknya rumah tangga hasil listing SP2010 (Mi
• Tahap kedua, dari setiap blok sensus terpilih dipilih sejumlah rumah tangga biasa (n=16) secara sistematik berdasarkan hasil listing SP2010.
).
Jumlah contoh blok sensus untuk penduga kabupaten/kota merupakan jumlah contoh minimum untuk pendugaan di tingkat kabupaten/kota. Contoh blok sensus dibedakan atas daerah perkotaan dan perdesaan yang diidentifikasi berdasarkan daerah sulit atau tidak sulit. Alokasi jumlah contoh menurut daerah perkotaan dan perdesaan di setiap kabupaten/kota dilakukan secara
proporsional terhadap proporsi akar jumlah rumah tangga dalam RBL1 dengan akar biaya per unit.
n c N c N m H h h h h h h × = ∑ =1 (2.46) dengan: h
m : Jumlah contoh blok sensus dalam strata h
h
N : Jumlah rumah tangga biasa dalam strata h
h
c : Biaya per unit dalam strata h m : Jumlah target contoh.
Kerangka contoh yang digunakan untuk pemilihan rumah tangga adalah daftar rumah tangga biasa hasil listing SP2010. Pemilihan contoh rumah tangga secara sistematik sampling dengan ukuran sampel rumah tangga yang harus dipilih di setiap blok sensus adalah 16 rumah tangga. Nomor urut rumah tangga yang terpilih sebagai contoh sudah ditetapkan dari BPS-RI.
2.7.2.Penentuan Bobot
Bobot penarikan contoh diperhitungkan dalam rangka mendapatkan pendugaan tak bias untuk parameter di tiap Kabupaten/Kota. Misalkan pada suatu kabupaten/kota target contoh blok sensus pada strata ke-h adalah nh
hi
M
yang dipilih secara pps dengan size banyaknya rumah tangga hasil listing SP 2010 ( ), maka peluang contoh blok sensus ke-i terpilih sebagai contoh menurut BPS (2010) adalah
(2.47)
sehingga fraksi penarikan contoh tahap pertamanya adalah
. (2.48) Bila pada setiap blok sensus ditarik sejumlah rumah tangga (fixed size: m) dengan equal probability, peluang bersyarat terpilihnya rumah tangga ke-j blok
, oh hi M i hi hi hi N N N N P h = = ∑ oh hi h M i hi hi h hi N N m N N m f h × = × = ∑
sensus ke-i dalam strata h, dan diketahui dari blok sensus ke-i adalah:
hi i hj
N
P | = 1 , maka fraksi penarikan contoh tahap kedua adalah:
hi i hj N n f | = . Oleh karena itu overall sampling fraction adalah:
f N n m N n N N m f f f oh h hi oh hi h i hj hi hij = × = × × = × = | konstan. (2.49)
Overall sampling fraction f konstan untuk setiap blok sensus terpilih, maka rancangan penarikan sampel tersebut dinamakan self-weighting design. Dengan demikian design weight dapat dirumuskan sebagai berikut:
n m N W h oh hij = × dimana: hij
W : bobot rumah tangga ke-j, blok sensus ke-i dalam strata h
oh
N : banyaknya populasi rumah tangga biasa hasil listing SP2010 dalam strata h
h
m : banyaknya contoh blok sensus dalam strata h n : banyaknya contoh rumah tangga di blok sensus ke-i.