Estimasi Variansi Dalam Sampling Multi Tahap

(1)

2.1 Perkiraan Variansi Tipe SYG

Perkiraan ˆY2 tidak bias secara bersyarat untuk perkiraan tahap ˆY1 = Ps1y˙i , sebagai sampel tahap pertama s1, dimana ˙yi = _π1yi

i = d1iyi. Sebagai contoh

E( ˆY₂|s₁) = ˆY₁. Karena itu, adalah tidak bias secara tidak bersyarat untuk total

Y =P

Uyi. Variansi ˆY2 diberikan sebagai berikut:

V

ˆ

Y2

=E

j

V

ˆ

Y2|s1

k +V

j

E

ˆ

Y2|s1

k

=EjV Yˆ₂|s₁k+V Yˆ₁

(2.1)

Perkiraan variansi bersyarat V Yˆ₂|s₁ pada (2.1) dengan menggunakan perkiraan variansi SYG, di tentukan ukuran sampel tahap kedua adalah fix untuk

s1 (Rao, 1979). Perkiraan variansi SYG adalah sebagai berikut:

vYˆ2|s1

=X X i<j∈s2

π2i|siπ2j|s1

π2ij|s1

˙

yi

π2i|s1

− y˙j

π₂j|s1 2

(2.2)

Adalah tidak bias secara bersyarat untuk V Yˆ₂|s₁ dan karena itu tidak

bias secara tidak bersyarat untuk EhV Yˆ2|s1

i

Langkah kedua dalam (2.1) diperoleh :

V Yˆ1

=X X i<j∈U

(π1iπ1j−π1ij) ( ˙yi−y˙j)2 (2.3)

Dengan ukuran sampel tahap pertama adalah fix jika ukuran yi diketahui untuk semuai∈s1, kemudian perkiraan variansi SYG dariV

ˆ

Y1

adalah sebagai berikut:

vYˆ₁=X X i<j∈s1

π1iπ1j−π1ij

π₁ij

( ˙yi−y˙j)2 (2.4)

(2)

Tetapi y₁ hanya diketahui untuk i ∈ s₂ karena perkiraan (2.4) merupakan sampel tahap kedua s₂ untuk memperoleh:

v2

ˆ

Y1

=X X i<j∈s2

π1iπ1j−π1ij

π1ijπ2ij|s1

( ˙yi−y˙j)2 (2.5)

Perkiraan variansi (2.5) adalah tidak bias untuk V Yˆ₁. Oleh karena itu

dari (2.1) perkiraan bias pola SYG dari V Yˆ1

ditunjukkan oleh:

vSY G

ˆ

Y₂=vYˆ₂|s₁+v₂Yˆ₁ (2.6)

dimanavYˆ2|s1

dan v2

ˆ

Y1

ditunjukkan oleh (2.2) dan (2.5) secara berurutan.

Untuk menggambarkan analogi tahap tunggal SYG, perkiraan pola SYG adalah V Yˆ₂, tetapi rumus untuk V Yˆ₂|s₁terlihat tidak tepat karena

meng-gunakan ( ˙yi−y˙j)2 berdasarkan bentuk yang tepat

˙

y1 π2i|s1

− y˙j

π2j|s1 2

diberikan di persamaan (2.2).

Type-type dari perkiraan variansi HT, vHT

ˆ

Y2

adalah valid untuk kedua tahap variansi dan tidak fix pada pembuatan pola sampel yang tidak sejenis de-ngan type perkiraan variansi SYG (2.6). Bagaimanapun, perkiraan variansi SYG memberikan hasil yang valid untuk banyak pola dua tahap, dan analogi untuk ka-sus tahap umum dapat lebih stabil untuk perkiraan variansi HT dan memberikan hasil tidak negatif untuk beberapa pola yang dikenal dengan bentuk probability proportional to size (PPS). Rao (1973) memberikan bukti nyata bahwa perkiraan variansi SYG adalah lebih bagus dari perkiraan variansi HT untuk sampling tahap umum.

2.2 Pengaturan Umum

Di bagian ini, penulis mengevaluasi estimator variansi SYG (2.6) untuk sampling dua tahap untuk proses stratifikasi. Di tahap pertama, sebuah sampel yang be-sar s₁ dengan ukuran n₁ di buat berdasarkan desain yang ditentukan termasuk perihal batasan peluang π₁i dan peluang yang berhubungan π1ij. Menggunakan informasi yang terkumpul untuk unit i ∈ s1, sampel tahap pertama s1

(3)

di strata g,P

gm1g =n1

. Di tahap kedua, sebuah sampel peluang s₂g dengan ukuran m2g dibentuk dari s1g, bebas terhadap zg, dan sifat dari keuntungan, y,

telah tercatat. Angka dari strata tahap kedua G(s1) dan ukuran sampel m1g dan m2g tergantung pada s1, meskipun G(s1) mungkin dapat didefinisikan

ter-lebih dahulu, sebagai contoh, G(s₁)∞G. Sebagai kesederhanaan notasi, penulis menyederhanakan persamaan yang tergantung pada s₁.

Yang penting diperhatikan adalahπ₂ij|s1 =π2i|s1π2j|s1 jikai∈s1g danj ∈s1g dan j ∈s1l(g 6=l), v

ˆ

Y2|s1

dapat menjadi

V Yˆ2|s1

=

G X

g=1

X

i<j∈s2g

X

△2ij|s1g

˙

yi

π₂i|s1g

− y˙j

π₂j|s1g

2

(2.7)

dimana

△2ij|s1g =

π₂i|s1gπ2j|s1g −π2ij|s1g

π2ij|s1g

(2.8)

Persamaan (2.7) dapat digunakan untuk sampling tahap kedua tanpa strata dengan peluang yang bersifat bersyaratπ2i|s1g danπ2ij|s1g memenuhiP_s1π2i|s1g diperlukan untuk menyelesaikans₁yang diberikan. Di kasus khusus dari sampling random yang sederhana tanpa strata tahap kedua, diperoleh bahwa π₂i|s1g =

m2g

m1g

dan π2ij|s1g =

m2g(m1g−1)

⌊m1g(m1g−1)⌋ dan persamaan (3.1) disederhanakan menjadi

vYˆ2|s1

=

G X

g=1 m2₁_g

1−f₂g

m2g

1

m2g−1

X

i<j∈s2g

X

( ˙yi−y˙j)2 (2.9)

dimana f₂g = m2_m1g

g

Sekarang menggunakan identitas Langrange

m X

i<j=1

X

(zi−zj)2 =m m X

i

= 1 (zi−z¯)2 (2.10)

Persamaan (2.3) disederhanakan menjadi

vYˆ₂|s₁= G X

g=1

1−f₂g

m2g

m2₁_g

1

m2g−1

ˆ

S₂2_g_y_˙ (2.11)

dimana ˆS₂2_g_y_˙ adalah rata rata kuadrat dari sampel yang ada, dari pembobotan tahap pertama ˙yi = _πyi

(4)

HT (1.2), menggunakan sampling acak yang sederhana tanpa strata tahap kedua, menghasilkan nilai yang sejalan dengan persamaan (2.5), formula dari S¨arndal et.al,. Komponen v2

ˆ

Y1

di estimator variansi SYG (2.6) berdasarkan sampling random yang sederhana tanpa strata tahap kedua, menyederhanakan persamaan tersebut menjadi

v2

ˆ

Y1

=

G X

g=1

m1g(m1g−1)

m₂g(m2g−1) X

i<j∈s2g

X

△1ij( ˙yi−y˙j)2

+ G X

g<l=1

Xm₁_gm₁_l

m2gm2l X

i∈s2g

X

j∈s2l

△1ij( ˙yi−y˙j)2

=v₂(1)Yˆ1

+v₂(2)Yˆ1

(2.12)

dimana

△1ij =

π₁iπ1j−π1ij

π1ij

(2.13)

Untuk penyederhanaan lebih lanjut yang mungkin untuk menggeneralisasi-kan tahap pertama dengan peluang π1i dan p1ij.

Contoh: Jika sampel tahap pertama s1 dengan ukuran n1 dipilih dengan

sam-pling acak sederhana dari sebuah populasiU denganN, selanjutnyaπ1i = n1_N, π1ij = n1(n1−1)

[N(N−1)] dan △1ij = (1−f1)

(n1−1). Estimator kedua tahap ˆY2 disederhanakan menjadi

NP

gW1gy¯2g dimana ¯y2g =m

−1 2

P

s2gyi . Menggunakan identitas

Langrange dan nilaiπ1i dan π1ij, di atas, komponen pertama di persamaan (2.6) disederhanakan menjadi

v₂(1)Yˆ1

= N

2₍₁₋_f 1) n₁

G X

g=1 w1g

(m1g −1)

n₁−1 Sˆ

2

2gy (2.14)

(5)

Komponen yang kedua dari persamaan (2.6) disederhanakan menjadi

S¨arndal et.al, (1992) menyederhanakan komponen pertama dari estimator variansi HT(1.2) untuk kasus spesial dari sampling acak sederhana di tahap perta-ma (tanpa memberikan detailnya) untuk menghasilkan (2.16). Formula ini sejalan dengan persamaan v2

ˆ

Y1

yang dihasilkan oleh persamaan (2.15).

2.3 Penarikan Sampel Dua-Tahap

(6)

Subpenarikan sampel dapat diterapkan secara luas melebihi cakupan survei sampel. Kapan saja suatu proses yang mencakup pengujian secara kimia, fisika atau biologi dapat dilaksanakan dengan jumlah material yang kecil, yang lebih disukai dengan mengambilnya sebagai sebuah subsampel dari suatu jumlah yang besar yang mana jumlah itu sendiri adalah sebuah sampel.

Pertimbangan sederhana, yang setiap unit terdiri dariM subunit yang sama,

m dipilih bila setiap unit subsampel. Sebuah penyajian secara skema dari

pe-narikan sampel dua tahap, dimana M = 9 dan m = 2, ditunjukkan dalam gambar (2.1) berikut.

Gambar 2.1 Gambar secara skema dari penarikan sampel (N=81, n=5, M=9 dan m=2)

Keuntungan utama dari penarikan sampel dua tahap adalah bahwa cara ini lebih fleksibel dari penarikan sampel satu tahap. Ini mengurangi penarikan sampel satu tahap bila m = M, kecuali ini adalah pilihan terbaik dari m, kita mempun-yai kesempatan mengambil beberapa nilai yang lebih kecil yang kelihatan lebih efisien. Seperti biasa, persoalan ini mengurangi keseimbangan antara ketelitian secara statistik dan biaya. Bila subunit dalam unit yang sama sangat dekat, pertimbangan-pertimbangan ketelitian membutuhkan satu nilai m yang kecil.

(7)

Misalkan populasi U adalah populasi U adalah populasi yang distratifikasi dengan menggunakan strata H, Uh dengan Nh adalah anggota di tahap ke h−

thPH_h₌₁Nh =N

. Di dalam tahap pertama, digunakan contoh s1h sederhana dari tahap pertama strataUh dan menyelidiki sebuah variabel skalar xuntuk i∈

s1h, h = 1,· · · , H, dimana ukuran s1h adalah n1h _PH

h=1n1h =n1

. Kemudian dilakukan stratifikasi ulang sampelydengans₁ =∪H

h=1s1hke dalamGtahapan ˜s1g dengan populasi m₁g

PG

g=1m1g =n1

, menggunakan vaiabel tambahan untuk diselidiki di tahap pertama, sampel acak sederhana s2g dengan populasi m2g dan kemudian diambil secara acak dari strata kedua ˜s₁g(g = 1,· · · , G).

Untuk gambaran diatas, π1i= n1_Nh

h jikai∈s1h dengan i6=j,

π1ij =   

 

n1h(n1h−1)

Nh(Nh−1)

jikai6=j ∈s1h

n1hn1k

NhNk

jikai∈s₁h, j ∈s1k, h6=k

(2.17)

Estimator fase kedua ˆY₂ dapat disederhanakan menjadi

ˆ

Y2 =

H X

h=1 Nh

n₁h G X

g=1 m1g

m₂g X

i∈s2gh

yi (2.18)

dimana s2gh =s1hs2g, dengan catatan bahwa beberapa s,₂ghs mungkin kosong, di beberapa kasus penggunaan P

i∈s2ghyi menjadi nol di persamaan (2.2).

Beralih ke permasalahan estimasi variansi, komponenv( ˆY2|s1) diberikan oleh

(2.5) dengan ˙y₁ =y₁(Nh

n1h) jikai∈s1h. Untuk mengevaluasiv2

ˆ

Y₁diberikan oleh

persamaan (2.6), dibutuhkan nilai△1ij. Dengan menggunakan (2.3), diperoleh

△1ij =   

 

1−f1h

n₁h−1

jika ij ∈˜s2h

= 0 jikai∈ ˜s2h, j ∈s˜2k, h6=k

(2.19)

dimana ˜s2h =∪gs2gh dan f1h = n1_Nh

h.

Substiusi yang dilakukan pada batas atas △1ij di persamaan (2.6), kompo-nen pertama v(1)₂ Yˆ1

disederhanakan menjadi

v₂(1)Yˆ₁= G X

g=1

m1g(m1g−1)

m₂g(m2g−1) X

h=Ag

Nh

n₁h 2

1−f1h

n₁h−1 X

i<j∈s2gh

X

(8)

dimana Ag adalah himpunan dari strata h fase pertama dengan menggunakan paling sedikit dua unit di s₂gh, untuk sisa strata fase pertama tidak memberikan kontribusiv(1)₂ Yˆ1

, menggunakan identitas Langrange (2.4), menggunakan (2.7) mereduksi persamaan menjadi

v(1)₂ Yˆ₁=

dimana mgh adalah banyaknya unit s2gh dan ˆS₂2_ghy adalah kuadrat sampel rata-rata dari nilaiyi untuki ∈S2gh.

Dapat dituliskan bahwav(2)₂ Yˆ₁ sebagai gambaran dari

v₂(2)Yˆ1

dimana ∪2gl adalah himpunan strata h fase pertama dengan paling sedikit satu unit di kedua s₂gh dan s2gl. Untuk kesederhanaan dari persamaan (2.10) adalah

tidak mungkin sederhana tanpa memenuhi m₂gh ≥ 2 untuk semua (gh). Tipe variansi estimator SYG, vYˆ2

, sekarang diberikan oleh perpaduan persamaan (2.5), (2.15) dan (2.16), dan selalu menghasilkan angka yang tidak negatif.

Sekarang gunakan kasus spesial m2gh ≥ 2 untuk semua (gh). Di kasus

v(1)₂ Yˆ₁diberikan oleh (2.15) dengan P

Ag berubah menjadiPH_h₌₁ Untuk lebih

jauh dapat ditulis bahwa v₂(2)Yˆ₁sebagai gambaran dari

v₂(2)Yˆ1

(9)

Kombinasi dari (2.15) dengan (2.18), diperoleh

Kedalam bentuk I pada (2.17), dapat ditulis

I =

Estimator variansi vYˆ₂ sekarang diberikan dengan menjumlahkan per-samaan (2.5), (2.12) dan (2.13). Estimator variansi HT dari Binder et.al, (2000) diturunkan dari persamaan (1.2), adalah berbeda dari hasil vYˆ2

yang dihasilkan dari persamaan (2.5) adalah sejenis dengan formula yang ditemukan Binder et.al, Perumusan Binder et.al, (2000) tersebut berkores-pondensi dengan persamaan (2.19) yang diberikan

G

dimana ¯y2gh adalah rata-rata dari y untuk s2gh. Persamaan Binder et.al, (2000)

berkorespondensi dengan persamaan (2.13) di berikan

(10)

Estimasi variansi Binder et.al, (2000) sekarang diberikan dengan menjum-lahkan (2.5), (2.12) dan (2.13). Dengan catatan bahwa bentuk n1ˆ h

n1h −1

dapat menghasilkan positif atau negatif.

2.4 Penarikan Sampel Tiga-Tahap

Misalkan yiju adalah nilai yang diperoleh untuk unit ke-u tahap ketiga pada unit ke-j tahap kedua diambil dari unit utama ke-i. Rata-rata unit yang sesuai popu-lasi per-unit ketiga adalah

¯

Yij = ΣK

uyiju

K ,Y¯¯ =

ΣM

j ΣKuyiju

M K ,Y¯¯¯ =

ΣN

i ΣMj ΣKuyiju

N M K (2.30)

Varians populasi yang dibutuhkan:

S₁2 = PN

i

¯¯

Yi−Y¯¯¯ 2

N −1

S₂2 = PN

i Σ M j

¯

Yij −Y¯¯i 2

N(M −1)

S₃2 = PN

i Σ M j ΣKu

¯

Yijk−Y¯¯i 2

N M(K −1)

Jika penarikan sampel acak sederhana digunakan pada ketiga tahap, rata-rata sampel Y¯¯¯ per-unit tahap ketiga adalah suatu perkiraan yang tidak bias dari

¯¯¯

Y, dengan varians

vY¯¯¯= 1−f1

n S

2 1 +

1−f₂

nm S

2 2 +

1−f₃

nmk S

2

3 (2.31)

dimana f1 = _Nn, f2 = _Mm, f3 = _Kk adalah fraksi penarikan sampel pada tahap

ketiga. Selanjutnya :

¯¯¯

y−Y¯¯¯ =y¯¯¯−Y¯¯¯nm Y¯¯¯nm−Y¯¯¯n

+Y¯¯¯n−Y¯¯¯

(2.32)

dimanaY¯¯¯nmadalah rata-rata populasinmunit tahap kedua yang telah dipilih dan ¯¯¯

(11)

Kontribusi dari bentuk yang telah dikuadratkan akan menjadi:

Ey¯¯¯−Y¯¯¯nm 2

= 1−f3

nmk S

2 3

EY¯¯¯nm−Y¯¯¯n 2

= 1−f2

nm S

2 2

EY¯¯¯n−Y¯¯¯ 2

= 1−f1

n S

2 1

Bila ketiga bentuk tersebut dijumlahkan, teorema diatas diperoleh suatu perkiraan tidak bias pada V(Y¯¯¯) dari samplenya

vY¯¯¯= 1−f1

n S

2 1 +

f₁(1−f₂)

nm S

2 2 +

f₁f₂(1−f₃)

nmk S

2

3 (2.33)

dimana S2

1, S22, S32 adalah perkiraan varians sampel dari S12, S22, S32. Hal ini

dapat dibuktikan dengan menunjukkan

E(S₁2) =S₁2+ 1−f2

m S

2 2 +

1−f3

mk S

2 3

E(S₂2) =S₂2+ 1−f3

k S

2 3

(2.34)

dan E(S₃2) = S₂2. Untuk mendapatkan hasil yang pertama, misalkan ¯¯y_ik menya-takan rata-rata m unit tahap kedua pada unit utama ke-i, dengan syarat bahwa seluruhK elemen telah dihitung pada tahap ketiga. Misalkan ¯¯¯y_K adalah rata-rata dari n nilai ¯¯y_ik. Maka penarikan sampel dua tahap menjadi

E

"_Pn ¯¯

y_iK −y¯¯¯_K2

n−1

#

=S₁2 +1−f2

m S

2

2 (2.35)

Sekarang bila ¯¯y_i adalah rata-rata sampel untuk unit utama ke-i menjadi

¯¯

y_i −y¯¯¯= ¯¯y_iK −y¯¯¯_K+

(¯¯y_i−y¯¯_iK)− y¯¯¯−y¯¯¯_K (2.36)

Dengan diawali merata-ratakan seluruh sampel yang mana unit-unit tahap pertama dan tahap kedua tetap, dapat ditunjukkan bahwa:

1

n−1E n X

(¯¯y_i−y¯¯_iK)− y¯¯¯−y¯¯¯_K2

= (1−f3)S

2 3

mk (2.37)

(12)

Oleh karena itu,

E

v y¯¯¯

=1−f1

n

S₁2+ 1−f2

m S

2 2 +

1−f3

mk S

2 3

+ f1(1−f2)

nm

S₂2+ 1−f3

k S

2 3

+f1f2(1−f3)

nmk S

2 3

=1−f1

n S

2 1 +

1−f2

nm S

2 2 +

1−f3

nmk S

2 3

=V(y)

(2.38)

Seperti dengan penarikan sampel dua tahap, hal ini hal ini jelas dari (2.33), bahwa jika f1 diabaikan v y¯¯¯

menjadi

v y¯¯¯= S

2 1

n =

Pn

(¯¯y_i−y¯¯)2

n(n−1) (2.39)

Perkiraan ini konservatif bilaf1 tidak diabaikan. Dengan sebuah fungsi biaya dari

bentuk

C =c₁n+c₂nm+c₃nmk (2.40)

Nilaik dan m optimum adalah

kopt =

s3

q S2

2−S 2 3 K

r

c2 c3

,mopt = q

S2 2−S

2 3 K q

S2 1−S

2 3 M

c1 c2

(2.41)