Oleh: Adhi Kurniawan
Analysis Of Variance
(ANOVA) Untuk Cluster Sampling
βΊ
Anova Untuk Data Sampel
Dengan demikian,
sample variance
dapat dinyatakan dalam bentuk:
π
2=
π π β 1 π
ππ β 1
π12+ π π β 1 π
π€2 Source Degreeβs ofFreedom Sum of Square Mean Square
Between
Cluster π β 1 πππ΅ = π¦ π β π¦ 2 π
π=1 π
π=1
ππ π12 = πππ΅ π β 1
Within
Cluster π(π β 1) πππ = π¦ππ β π¦ π 2 π
π=1 π
π=1
π π€2 = π(π β 1)πππ
Total ππ β 1
πππ0 = π¦ππ β π¦ 2
π
π=1 π
π=1
Koefisien Korelasi Intraklaster
π
βΊ
Koefisien korelasi intraklaster mengukur tingkat homogenitas di dalam klaster,
sehingga juga biasa disebut
rate of homogenity (roh)
βΊ
Berdasarkan tabel Anova, ukuran koefisien korelasi intraklaster bisa diperoleh dengan
formula yang sederhana yaitu:
π = 1 β
π β 1 β
π
ππππ
πππ
βΊ
Karena
0 β€
πππππππ
β€ 1
maka nilai
π
akan berada pada interval:
β1
π β 1 β€ π β€ 1
βΊ
Jika elemen di dalam cluster homogen sempurna maka
π = 1, π
π€2= 0, π
π12= π
2βΊ
Jika elemen di dalam cluster heterogen sempurna maka
π =
β1Koefisien Korelasi Intraklaster
π
βΊ
Contoh soal 1
: Diketahui suatu akademi memiliki 24 kelas yang masing-masing kelas
terdiri dari 8 mahasiswa. Untuk memperkirakan jumlah buku statistik yang dimiliki
oleh mahasiswa, dilakukan pengambilan sampel secara SRS WOR sebanyak 4 kelas,
kemudian dilakukan wawancara terhadap semua mahasiswa yang berada pada kelas
terpilih. Data yang diperoleh:
Dari data tersebut, buatlah tabel annova dan hitung koefisien korelasi intraklasternya !
Mahasiswa
(π)
Kelas (π)
1 2 3 4
1 3 7 6 8
2 1 2 1 4
3 6 4 2 8
4 8 4 9 1
5 2 9 2 4
6 2 8 6 3
7 4 7 4 8
Koefisien Korelasi Intraklaster
π
Mahasiswa
(π)
Kelas (π)
1 2 3 4
1 3 7 6 8
2 1 2 1 4
3 6 4 2 8
4 8 4 9 1
5 2 9 2 4
6 2 8 6 3
7 4 7 4 8
8 2 4 5 8
Total ππ.
Rata-rata π π
πππ
π¦ = 1π π¦π.
π
π=1
=
π π2 = (π β 1) π¦1 π. β π¦ 2
π
π=1
=
π¦ = 1π π¦ π =
π
π=1
π π12 = π β 1 π¦ 1 π β π¦ 2 =
π
π=1
π π€2 = π π 1 π2 =
π
Koefisien Korelasi Intraklaster
π
Mahasiswa
(π)
Kelas (π)
1 2 3 4
1 3 7 6 8
2 1 2 1 4
3 6 4 2 8
4 8 4 9 1
5 2 9 2 4
6 2 8 6 3
7 4 7 4 8
8 2 4 5 8
Total ππ. 28 45 35 44
Rata-rata π π 3,5 5,625 4,375 5,5
πππ 5,71 5,98 7,125 8
π¦ = 1π π¦π.
π
π=1
= 38
π π2 = (π β 1) π¦1 π. β π¦ 2
π
π=1
= 64,667
π¦ = 1π π¦ π = 4,75
π
π=1
π π12 = π β 1 π¦ 1 π β π¦ 2 =
π
π=1
1,0104
π π€2 = 1π π π2 = 6,70375
π
π=1
Koefisien Korelasi Intraklaster
π
Source dof Sum of Square Mean Square
Between Cluster π β 1
πππ΅ = π¦ π β π¦ 2
π
π=1 π
π=1
ππ π12 = π β 1πππ΅
Within Cluster π(π β 1)
πππ = π¦ππ β π¦ π 2
π
π=1 π
π=1
π π€2 = πππ
π(π β 1)
Total ππ β 1
ππππ = π¦ππ β π¦ 2
π
π=1 π
π=1
π 2 = ππππ
ππ β 1
Koefisien Korelasi Intraklaster
π
Source dof Sum of Square Mean Square
Between Cluster π β 1
πππ΅ = π¦ π β π¦ 2
π
π=1 π
π=1
ππ π12 = π β 1πππ΅
Within Cluster π(π β 1)
πππ = π¦ππ β π¦ π 2
π
π=1 π
π=1
π π€2 = πππ
π(π β 1)
Total ππ β 1
ππππ = π¦ππ β π¦ 2
π
π=1 π
π=1
π 2 = ππππ
ππ β 1
Source dof Sum of Square Mean Square
Between Cluster 3 24,2496 8,0832
Within Cluster 28 187,7050 6,7038
Total 31 211,9546 6,8372
Hubungan
π
dengan Sampling Varians
βΊ Unbiased sampling varians:
π£ π¦ = 1 β ππ βππ β 1π β 1 β π 2 1 + (π β 1)π
π£ π¦ = π£ π¦ π2 = 1 β πππ2 βππ β 1π β 1 β π 2 1 + (π β 1)π
Untuk n besar β π£ π¦ β 1 β π
ππ β π 2 1 + (π β 1)π
Rata β rata per cluster (kelas) β π¦ = 1π π¦π. π
π=1
= 38
π£ π¦ = 1 β ππ β ππ β 1π β 1 β π 2 1 + π β 1 π = 1 β 4424 β 313 β 6,8372β 1 + 7 β β0,0121 = 13,4723
Rata β rata per elemen (mahasiswa) β π¦ = 1π π¦ π = 4,75
π
π=1
1 π£ π¦ = π£ π¦ π2 = 1 β πππ2 β ππ β 1π β 1 β π 2 1 + π β 1 π = 1 β 44 β 8242 β 313 β 6,8372β 1 + 7 β β0,0121 = 0,2105 π π π¦ = 0,2105 = 0,4588
Design Effect (Deff)
Pada
Cluster Sampling
Design Effect
Design Effect
pada
cluster sampling
merupakanperbandingan antara varians
suatu
cluster sampling
dengan varians sampel acak sederhana (SRS).
π·πππ =
π(π¦ )
π(π¦ )
πππ’π π‘ππ π ππ=
1 β π
π π
π121 β π
ππ π
2=
ππ
π
2π12=
(ππ΄ β π)
π΄(π β π) π + (π΄ β π)π
Untuk
n besar maka:
π«πππ β π + (π΄ β π)π
Nilai deff untuk contoh soal 1:
π·πππ = (ππ β 1)
π(π β 1) 1 + (π β 1)π
Estimasi Proporsi pada
Equal Cluster Sampling
Ilustrasi
Sebanyak 20 kotak yang masing-masing berisi 5 buah bola diambil sampel sebanyak 4 kotak secara acak. Bola-bola yang terdapat di dalam kotak terdiri dari 2 warna yaitu putih dan hitam. Perkirakan proporsi bola bewarna hitam beserta variansnya !
Dari keterangan di atas:
π = 20, π = 4, π = 5
ππ = π ππ = π ππ = π ππ = π Jumlah bola hitam
ππ
Proporsi bola hitam
ππ ππ =
π
π ππ = π
π ππ = π
π ππ = π π
π = π ππ π = ππ Γ ππ + ππ + ππ + ππ = π, π
π
π=π
π π = π β ππ ππππ = π(π β π) ππ β π π β π π
π
π=π
= π β ππππ Γ π, ππππ = π, ππππ
Estimasi proporsi bola hitam π
Estimasi Proporsi pada
Equal Cluster Sampling
Dalam estimasi proporsi:
ππππ = π π
πβ π
2+ π π
ππ
ππ
π=1 π
π=1
ππππ = π π β 1 π
π12+ πππ
π€2ππππ = πππ΅ + πππ
Keterangan:
βΊ
πππ = πππ
π€2βΊ
πππ΅ = π π β 1 π
π12βΊ
ππππ = ππππ
Koefisien korelasi intraklaster:
π = 1 β
π β 1 β
π
ππππ
πππ
Design effect
:
Estimasi Proporsi pada
Equal Cluster Sampling
Contoh Soal 2:
Sebanyak 384 rumah tangga dikelompokkan menjadi 48 cluster dengan muatan rumah
tangga untuk setiap cluster sama. Kemudian diambil sampel secara acak sebanyak 5
cluster dan dilakukan wawancara terhadap semua rumah tangga pada cluster terpilih.
Dari hasil wawancara, diperoleh data pendidikan tertinggi yang ditamatkan oleh KRT
sebagai berikut:
Ruta Cluster
1 2 3 4 5
1 2 2 1 2 5
2 3 4 2 3 1
3 1 5 4 4 3
4 4 4 2 5 4
5 1 3 5 3 2
6 5 2 2 2 2
7 3 1 3 3 1
8 2 5 4 1 1
Keterangan kode:
1: Tidak tamat SD/sederajat 2: Tamat SD/sederajat
3: Tamat SMP/sederajat
4: Tamat SMA/SMK/sederajat 5: Tamat Perguruan Tinggi
a. Perkirakan proporsi KRT yang pendidikannya SMP ke atas, lengkapi dengan standar error, RSE, dan 95%-CI !
Estimasi Proporsi pada
Equal Cluster Sampling
Penyelesaian
Ruta Cluster Total
1 2 3 4 5
ππ ππ ππ π π2 = ππππ
π = π π1 π =
π
π=1
π π12 = (π β 1) π1 π β π 2
π
π=1
=
π£ π = 1 β ππ π π12 = π π π =
π π€2 = π π 1 π2 =
π
π=1
πππ = πππ π€2 =
πππ΅ = π π β 1 π π12 = ππππ = πππ + πππ΅ = π = 1 β π β 1 βπ ππππ =πππ
Estimasi Proporsi pada
Equal Cluster Sampling
Penyelesaian
Ruta Cluster Total
1 2 3 4 5
ππ 4 5 4 5 3 21
ππ 4
8 5 8 4 8 5 8 3 8 21 8
ππ 4
8 3 8 4 8 3 8 5 8 19 8 π π2 = ππππ 16
64 15 64 16 64 15 64 15 64 77 64
π = π π1 π = 15 Γ 218 = 2140 = 0,525
π
π=1
π π12 = (π β 1) π1 π β π 2
π
π=1
= 0,01094
π£ π = 1 β ππ π π12 = 1 β 5548 Γ 0,01094 = 0,00196 π π π = 0,00196 = 0,04427
π π€2 = π π 1 π2 = 15 Γ 7764 = 0,240625
π
π=1
πππ = πππ π€2 = 5 Γ 8 Γ 0,240625 = 9,625
πππ΅ = π π β 1 π π12 = 8 Γ 5 β 1 Γ 0,01094 = 0,35008 ππππ = πππ + πππ΅ = 9,625 + 0,35008 = 9,97508
π = 1 β π β 1 βπ ππππ = 1 βπππ 8 β 1 Γ8 9,97508 = β0,102759,625
Penghitungan
Sampling Error
Rata-rata Elemen dengan Stata
Data Awal Lay Out data untuk Stata
id_kelas id_mahasiswa buku
1 1 3
1 2 1
1 3 6
1 4 8
1 5 2
1 6 2
1 7 4
1 8 2
2 1 7
2 2 2
2 3 4
2 4 4
dst dst dst
Mahasiswa
(π)
Kelas (π)
1 2 3 4
1 3 7 6 8
2 1 2 1 4
3 6 4 2 8
4 8 4 9 1
5 2 9 2 4
6 2 8 6 3
7 4 7 4 8
Penghitungan
Sampling Error
Rata-rata Karakteristik Elemen dengan Stata
use "A:\Bahan Ajar MPC\contoh soal 1.dtaβ
gen N=24
gen weight=24/4
svyset id_kelas [pweight=weight], fpc(N) vce(linearized)
pweight : weight
VCE : linearized
Single unit : missing Strata 1 : <one>
SU 1 : id_kelas
FPC 1 : N
svy linearized : mean buku
(running mean on estimation sample) Survey: Mean estimation
Number of strata = 1 Number of obs = 32 Number of PSUs = 4 Population size = 192
Design df = 3 Linearized
Mean Std. Err. [95% Conf. Interval]
buku 4.75 .4588066 3.289873 6.210127
estat effect
Linearized
Mean Std. Err. DEFF DEFT
buku 4.75 .4588066 1.182 .99247
nama file nama direktori
cluster
Sampling weight=N/n
jumlah populasi
Koefisien korelasi intraklaster:
π =
π(π β 1)
ππ β 1 Γ ππππ β 1 π β 1
=
8(4 β 1)
4 Γ 8 β 1 Γ 1.182 β 1 8 β 1
= β0,0121
Penghitungan
Sampling Error
Rata-rata Karakteristik Elemen dengan Stata
onewaybuku id_kelas
Analysis of Variance
Source SS df MS F Prob > F Between groups 24.25 3 8.08333333 1.21 0.3259 Within groups 187.75 28 6.70535714
Total 212 31 6.83870968
Koefisien korelasi intraklaster:
π = 1 β π β 1 Γπ πππππππ
= 1 β 8 β 1 Γ8 187,75 212 = β0,0121
Koefisien korelasi intraklaster yang
Penghitungan
Sampling Error
Total Karakteristik dengan Stata
use "A:\Bahan Ajar MPC\contoh soal 1.dtaβ
gen N=24
gen weight=24/4
svyset id_kelas [pweight=weight], fpc(N) vce(linearized)
pweight : weight
VCE : linearized
Single unit : missing
Strata 1 : <one>
SU 1 : id_kelas
FPC 1 : N
svy linearized : total buku
(running total on estimation sample) Survey: Total estimation
Number of strata = 1 Number of obs = 32 Number of PSUs = 4 Population size = 192
Design df = 3 Linearized
Total Std. Err. [95% Conf. Interval]
buku 912 88.09086 631.6556 1192.344
Estat effect
Linearized
Total Std. Err. DEFF DEFT
buku 912 88.09086 1.182 .99247
nama file nama direktori
cluster
Sampling weight=N/n
jumlah populasi
Koefisien korelasi intraklaster:
π =
π(π β 1)
ππ β 1 Γ ππππ β 1 π β 1
=
8(4 β 1)
4 Γ 8 β 1 Γ 1.182 β 1 8 β 1
= β0,0121
Penghitungan
Sampling Error
Rata-rata Cluster dengan Stata
use "A:\Bahan Ajar MPC\contoh soal 1.dtaβ
gen N=24
gen weight=24/4
collapse (sum) buku (mean) weight (mean) N (max) id_mahasiswa, by(id_kelas) svyset id_kelas [pweight=weight], fpc(N) vce(linearized)
pweight : weight
VCE : linearized
Single unit : missing
Strata 1 : <one>
SU 1 : id_kelas
FPC 1 : N
svy linearized : mean buku
(running mean on estimation sample) Survey: Mean estimation
Number of strata = 1 Number of obs = 4 Number of PSUs = 4 Population size = 24 Design df = 3
Linearized
Mean Std. Err. [95% Conf. Interval]
buku 38 3.670453 26.31898 49.68102
nama file nama direktori
cluster
Sampling weight=N/n
Penghitungan
Sampling Error
dengan Menggunakan Stata (Proporsi)
use "A:\Bahan Ajar MPC\contoh soal 2.dtaβ
gen N=48
gen weight=48/5
gen pendidikan_krt2=0
replace pendidikan_krt2=1 if pendidikan_krt>2
svyset id_cluster [pweight=weight], fpc(N) vce(linearized)
pweight : weight VCE : linearized Single unit : missing Strata 1 : <one> SU 1 : id_cluster FPC 1 : N
svy linearized : proportion pendidikan_krt2
(running proportion on estimation sample) Survey: Proportion estimation
Number of strata = 1 Number of obs = 40 Number of PSUs = 5 Population size = 384
Design df = 4
nama file nama direktori
cluster
sampling weight=N/n
Penghitungan
Sampling Error
dengan Menggunakan Stata (Proporsi)
Linearized
Proportion Std. Err. [95% Conf. Interval]
Pendidikan_krt2
0 .475 .0467707 .3451437 .6048563
1 .525 .0467707 .3951437 .6548563
estat effect
Linearized
Proportion Std. Err. DEFF DEFT
Pendidikan_krt2
0 .475 .0467707 .342105 .584898
1 .525 .0467707 .342105 .584898
Koefisien korelasi intraklaster:
π =
π(π β 1)
ππ β 1 Γ ππππ β 1
π β 1 =
8(5 β 1)
5 Γ 8 β 1 Γ 0,342105 β 1
8 β 1 = β0,10275
Latihan 1 (kerjakan secara manual dan dengan menggunakan stata)
Suatu kebun apel terdiri dari 270 petak yang masing-masing petak memuat 4 pohon apel. Suatu random sampel sebanyak 12 petak dipilih secara SRS WOR, kemudian dilakukan pengukuran terhadap berat semua buah apel (kg) yang dihasilkan oleh tiap pohon di petak terpilih.
Petak Pohon
1 2 3 4
1 5,53 4,84 0,69 15,79
2 26,11 10,93 10,08 11,18
3 11,08 0,65 4,21 7,56
4 12,66 32,52 16,92 37,02
5 0,87 3,56 4,81 27,54
6 6,40 11,68 40,05 5,12
7 54,21 34,63 52,55 37,20
8 1,24 35,97 29,54 25,28
9 37,94 47,07 19,64 28,11
10 25,52 38,10 26,24 6,77
11 45,98 5,17 24,74 1,90
12 7,13 34,35 1,17 6,53
a. Buatlah tabel annova-nya!
b. Hitung koefisien korelasi intraklaster.
c. Perkirakan rata-rata berat apel tiap pohon
beserta standar error, RSE, dan 95%CI-nya!. Hitung design effect-nya !
d. Perkirakan rata-rata berat apel tiap petak
beserta standar error, dan RSE, dan 95%CI-nya! e. Perkirakan berat total apel di kebun tersebut
beserta standar error, RSE, dan 95%CI-nya !
f. Perkirakan proporsi dan total pohon yang berat produksi apelnya lebih dari rata-rata berat produksi apel tiap pohon di kebun tersebut. Lengkapi dengan nilai standar error, dan RSE, dan 95%CI-nya!. Hitung koefisien korelasi intraklaster dan design effect-nya!