Oleh: Adhi Kurniawan
SEKOLAH TINGGI ILMU STATISTIK
Unequal Cluster Sampling
βΊ Misalkan satu gugus sampel yang berukuran n cluster yang ditarik dari N cluster secara simple random sampling wor.
βΊ Notasi yang dipergunakan sama dengan cluster berukuran sama, hanya mengganti π dengan ππ.
ππ : banyaknya unit dalam cluster ke-i
βΊ Estimasi rata-rata unit untuk cluster ke-i dirumuskan: π¦ π. = 1
ππ π¦ππ
ππ π=1
βΊ Untuk estimasi rata-rata unit populasi terdapat 3 pendekatan:
1. Rata-rata sederhana dan tidak mempertimbangkan ukuran cluster 2. Rata-rata dengan memperhitungkan ukuran cluster dari sampel 3. Rata-rata dengan menggunakan ukuran cluster dalam populasi
Unequal Cluster Sampling
1. Rata-rata karakteristik per unit dari sebanyak n sampel cluster, yang diperhitungkan dari rata-rata cluster tanpa ditimbang dengan banyaknya elemen dalam cluster terpilih ππ . π¦ = 1 π π¦ π. π π=1 π£ π¦ = 1 β π π π π12 Keterangan: π π12 = 1 (π β 1) π¦ π. β π¦ 2 π π=1
--> Estimasi rata-rata menggunakan pendekatan ini menghasilkan nilai estimasi yang bias
Dari estimasi rata-rata di samping, dapat dilakukan estimasi total sbb:
π = ππβ²π¦ π£ π = ππβ² 2π£ π¦ Keterangan: πβ² = 1 π ππ. π π=1
Contoh Soal 1
Untuk mengetahui rata-rata jumlah jam baca pengunjung di perpustakaan, dilakukan survei dengan mengambil sampel secara SRS WOR sebanyak 5 perpustakaan dari populasi sebanyak 24 perpustakaan yang ada di suatu provinsi. Dari perpustakaan yang terpilih sampel, selanjutnya dilakukan observasi terhadap jam datang dan jam pergi dari tiap pengunjung dalam satu hari. Selisih antara jam datang dan jam pergi ini diasumsikan sebagai lamanya jam baca pengunjung di perpustakaan tsb. Data yang diperoleh:
Perkirakan rata-rata jam baca pengunjung dengan menggunakan estimasi rata-rata tidak tertimbang. Lengkapi dengan standar error, RSE-nya !
Perpustakaan Jam baca pengunjung
1 4.5 5.5 4.2 2.0 5.5 1.0 2.5
2 4.0 5.6 5.5 6.5 1.8 2.0 1.4 1.5 0.5
3 6.5 4.0 7.0 3.5 4.5
4 5.0 3.5 7.0 0.5 1.0 2.0 2.5 6.5
Contoh Soal 1
1 4.5 5.5 4.2 2.0 5.5 1.0 2.5 7 25.2 3.6 2 4.0 5.6 5.5 6.5 1.8 2.0 1.4 1.5 0.5 9 28.8 3.2 3 6.5 4.0 7.0 3.5 4.5 5 25.5 5.1 4 5.0 3.5 7.0 0.5 1.0 2.0 2.5 6.5 8 28 3.5 5 0.8 4.5 6.5 5.5 6.5 3.2 6 27 4.5 Total 35 134.5 19.9Unequal Cluster Sampling
2. Rata-rata karakteristik per unit dari sebanyak n sampel cluster, yang diperhitungkan dari karakteristik seluruh unit dalam sampel
π¦ β² = 1 π πππ¦ π. πβ² π π=1 = πππ¦ π. π π=1 ππ π π=1 = π¦ππ ππ π=1 π π=1 ππ π π=1 = π¦π. π π=1 ππ π π=1 π£ π¦ β² = 1 β π π π π1β²2 Keterangan: π π1β²2 = 1 πβ²2(π β 1) ππ 2 π¦ π. β π¦ β² 2 π π=1 πβ² = 1 π ππ. π π=1
--> Estimasi rata-rata menggunakan pendekatan ini menghasilkan nilai estimasi yang bias konsisten
Dari estimasi rata-rata di samping, dapat dilakukan estimasi total sbb:
π β² = ππβ²π¦ β² π£ π = ππβ² 2π£ π¦ β² Keterangan: πβ² = 1 π ππ. π π=1
Contoh Soal 2
Untuk mengetahui rata-rata jumlah jam baca pengunjung di perpustakaan, dilakukan survei dengan mengambil sampel secara SRS WOR sebanyak 5 perpustakaan dari populasi sebanyak 24 perpustakaan yang ada di suatu provinsi. Dari perpustakaan yang terpilih sampel, selanjutnya dilakukan observasi terhadap jam datang dan jam pergi dari tiap pengunjung dalam satu hari. Selisih antara jam datang dan jam pergi ini diasumsikan sebagai lamanya jam baca pengunjung di perpustakaan tsb. Data yang diperoleh:
Perkirakan rata-rata jam baca pengunjung dengan menggunakan estimasi rata-rata tertimbang ukuran cluster dari data sampel. Lengkapi dengan standar error, RSE-nya !
Perpustakaan Jam baca pengunjung
1 4.5 5.5 4.2 2.0 5.5 1.0 2.5
2 4.0 5.6 5.5 6.5 1.8 2.0 1.4 1.5 0.5
3 6.5 4.0 7.0 3.5 4.5
4 5.0 3.5 7.0 0.5 1.0 2.0 2.5 6.5
Contoh Soal 3
Untuk mengetahui rata-rata jumlah jam baca pengunjung di perpustakaan, dilakukan survei dengan mengambil sampel secara SRS WOR sebanyak 5 perpustakaan dari populasi sebanyak 24 perpustakaan yang ada di suatu provinsi. Diketahui jumlah pengunjung perpustakaan di provinsi tersebut dalam satu hari adalah 180 orang.
Dari perpustakaan yang terpilih sampel, selanjutnya dilakukan observasi terhadap jam datang dan jam pergi dari tiap pengunjung dalam satu hari. Selisih antara jam datang dan jam pergi ini diasumsikan sebagai lamanya jam baca pengunjung di perpustakaan tsb. Data yang diperoleh:
Perkirakan rata-rata jam baca pengunjung dengan menggunakan estimasi rata-rata tertimbang ukuran cluster dari data populasi. Lengkapi dengan standar error, RSE-nya !
Perpustakaan Jam baca pengunjung
1 4.5 5.5 4.2 2.0 5.5 1.0 2.5
2 4.0 5.6 5.5 6.5 1.8 2.0 1.4 1.5 0.5
3 6.5 4.0 7.0 3.5 4.5
4 5.0 3.5 7.0 0.5 1.0 2.0 2.5 6.5
Contoh Soal 3
1 4.5 5.5 4.2 2.0 5.5 1.0 2.5 7 25.2 3.6 3.3600 2 4.0 5.6 5.5 6.5 1.8 2.0 1.4 1.5 0.5 9 28.8 3.2 3.8400 3 6.5 4.0 7.0 3.5 4.5 5 25.5 5.1 3.4000 4 5.0 3.5 7.0 0.5 1.0 2.0 2.5 6.5 8 28 3.5 3.7333 5 0.8 4.5 6.5 5.5 6.5 3.2 6 27 4.5 3.6000 Total 35 134.5 19.9 17.9333Estimasi Proporsi pada Unequal Cluster Sampling
No estimator TipeEstimasi proporsi
populasi Variance between cluster mean
Sampling variance 1 Tidak tertimbang 2 Tertimbang dg cluster size dari sampel 3 Tertimbang dg cluster size dari populasi
Estimasi Total berdasarkan proporsi pada Unequal Cluster Sampling
No Tipe estimator Estimasi total populasi Sampling variance1 Tidak tertimbang π΄ = ππβ²π π£ π΄ = ππβ² 2π£ π
2 Tertimbang dengan dari sampel cluster size π΄ β² = ππβ²πβ² π£ π΄ β² = ππβ² 2π£ πβ² 3 Terimbang dengan dari populasi cluster size π΄ β = ππ πβ π£ π΄ β = ππ 2π£ πβ
Estimasi Proporsi pada Unequal Cluster Sampling
βΊ Contoh Soal: Suatu survei dilakukan di suatu desa dengan memilih sampel secara acak sebanyak 3 cluster dari 25 cluster yang ada di desa tersebut. Kemudian dilakukan pencacahan terhadap semua rumah tangga yang terdapat pada cluster terpilih. Perkirakan proporsi dan total rumah tangga pertanian hortikultura di desa tsb beserta standar error dan RSE-nya dengan 3 cara ! (untuk cara 3, diketahui jumlah rumah tangga di desa tsb sebanyak 105 rumah tangga)
Cluster Rumah tangga
Apakah ada ART yang memelihara/menguasai/ melakukan kegiatan pertanian tanaman hortikultura? (1=Ya, 2=Tidak) Jika kolom(3) kode 1, apakah hasilnya dijual/ditukar ? (1=Ya, 2=Tidak) (1) (2) (3) (4) 1 1 2 - 2 1 1 3 2 - 4 1 2 2 1 2 - 2 1 1 3 2 - 3 1 1 2 2 1 1 3 2 - 4 1 2 5 1 1
Estimasi Proporsi pada Unequal Cluster Sampling
βΊ Konsep dan Definisi:
Kegiatan usaha pertanian adalah kegiatan pemeliharaan, pembudidayaan, pengembangbiakan, pembesaran/penggemukan dengan tujuan sebagian atau seluruh hasilnya untuk dijual/ditukar/memperoleh keuntungan. Khusus untuk budidaya padi dan palawija, pemeliharaan sapi potong, sapi perah, dan kerbau walaupun untuk konsumsi sendiri tetap dikategorikan sebagai usaha pertanian.
Rumah tangga pertanian adalah rumah tangga yang satu atau lebih anggota rumah tangganya mengelola usaha pertanian baik usaha milik sendiri maupun milik pihak lain.
Estimasi Proporsi pada Unequal Cluster Sampling
Cluster 1 4 1 0.1111 0.2381 2 3 1 0.0000 0.2381 3 5 2 0.1111 0.4762 Total 12 4 0.2222 0.9524 Untuk penghitungan estimasi tidak tertimbangUntuk penghitungan
estimasi tertimbang dengan
cluster size dari sampel
Untuk penghitungan
estimasi tertimbang dengan cluster size dari populasi
Penghitungan Sampling Error dengan Stata
Contoh Soal 2:Suatu wilayah yang terdiri dari 10 cluster diambil sampel secara acak sebanyak 3 cluster, kemudian dilakukan pengukuran terhadap jumlah ART pada semua rumah tangga pada cluster terpilih. Jumlah rumah tangga di wilayah tersebut adalah 42 rumah tangga. Perkirakan rata-rata jumlah ART tiap rumah tangga beserta standar error-nya !
Cluster_id Household_id ART
1 1 4 1 2 5 1 3 3 1 4 6 2 1 5 2 2 4 2 3 7 3 1 3 3 2 6 3 3 5 3 4 6 3 5 2
Penghitungan Sampling Error dengan Stata (Estimasi tidak tertimbang)
use "D:Bahan Ajar MPC\unequal cluster.dtaβ
collapse (count) household_id (sum) art, by(cluster_id) ren household_id ruta
gen art_per_ruta= art/ruta gen N=10
Gen weight=10/3*4
svyset cluster_id[pweight=weight], fpc(N) vce(linearized) singleunit(missing)
pweight: <none> VCE: linearized Single unit: missing Strata 1: <one> SU 1: cluster_id FPC 1: N
svy linearized : mean art_per_ruta
(running mean on estimation sample) Survey: Mean estimation
Number of strata = 1 Number of obs = 3 Number of PSUs = 3 Population size = 3 Design df = 2
Linearized
Mean Std. Err. [95% Conf. Interval] art_per_ruta 4,744445 ,247531 3,679404 5,809485
use "D:Bahan Ajar MPC\unequal cluster.dtaβ gen N=10
gen weight=10/3
svyset cluster_id [pweight=weight], fpc(N) vce(linearized)
pweight: weight VCE: linearized Single unit: missing Strata 1: <one> SU 1: cluster_id FPC 1: N
svy linearized : mean art
(running mean on estimation sample) Survey: Mean estimation
Number of strata = 1 Number of obs = 12
Number of PSUs = 3 Population size = 40
Design df = 2
Linearized
Mean Std. Err. [95% Conf. Interval]
art 4,666667 ,2130032 3,750188 5,583146
Penghitungan Sampling Error dengan Stata
Penghitungan Sampling Error dengan Stata
(Estimasi tertimbang dengan ukuran cluster dari data populasi)
use "D:Bahan Ajar MPC\unequal cluster.dtaβ
collapse (count) household_id (sum) art, by(cluster_id) ren household_id ruta
gen art_per_ruta= art/ruta gen N=10
gen weight=10/3*4.2
gen art_per_ruta2= ruta/4.2* art_per_ruta
svyset cluster_id[pweight=weight], fpc(N) vce(linearized) singleunit(missing)
pweight: <none> VCE: linearized Single unit: missing Strata 1: <one> SU 1: cluster_id FPC 1: N
svy linearized : mean art_per_ruta2
(running mean on estimation sample) Survey: Mean estimation
Number of strata = 1 Number of obs = 3 Number of PSUs = 3 Population size = 3 Design df = 2
Linearized
Mean Std. Err. [95% Conf. Interval] art_per_ruta2 4,444444 ,3513642 2,932646 5,956243
Soal Latihan
id cluster ruta id Pengeluaran perkapita sebulan (000) 1 1 380 2 440 3 500 4 320 2 1 400 2 330 3 330 4 490 5 310 3 1 350 2 350 3 480 4 310 5 350 6 460 Berikut ini adalah data hasil survei konsumsi rumah tangga di suatukelurahan. Survei dilakukan secara cluster sampling dengan mengambil sampel sebanyak 3 cluster secara SRS WOR dari 20 cluster di kelurahan tsb. Selanjutnya, dilakukan pencacahan terhadap semua rumah tangga yang ada di cluster terpilih. Dari hasil pemutakhiran (updating) rumah tangga diketahui bahwa jumlah rumah tangga di kelurahan tsb sebanyak 102 rumah tangga.
a. Metode estimasi manakah yang sebaiknya anda gunakan ?
b. Perkirakan rata-rata pengeluaran perkapita perbulan di desa tersebut, beserta standar error, RSE, dan 95%-CI nya !
c. Dari jawaban point (b), selanjutnya dilakukan pengkategorian rumah tangga sebagai berikut:
(1) Ekonomi lemah: Pengeluaran perkapita< π¦ β β 1,96 Γ π π π¦ β (2) Ekonomi menengah: π¦ β β 1,96 Γ π π π¦ β β€Pengeluaran perkapitaβ€ π¦ β + 1,96 Γ π π π¦ β (3) Ekonomi atas: Pengeluaran perkapita> π¦ β +1,96 Γ π π π¦ β
Perkirakan proporsi dari masing-masing kategori di atas, lengkap dengan standar error, RSE, dan 95% CI-nya !