Survei
himpunan semua objek yang menjadi minat pengambilan
kesimpulan
himpunan bagian dari populasi
melakukan pengamatan terhadap seluruh populasi seringkali tidak mungkin dilakukan ketika akan membuat kesimpulan,
mengapa?
sumber daya
terbatas waktu yang tersedia terbatas
pengamatan kadang bersifat merusah
mustahil mengamati seluruh anggota populasi
1
2
3
4
bagaimana caranya dengan menggunakan data contoh kita dapat mengambil kesimpulan terhadap populasi?
data populasi olah/analisis parameter
data contoh olah/analisis statistik
Parameter tidak pernah diketahui, yang kita ketahui adalah statistik. Statistik merupakan penduga bagi parameter.
ˆ
Penduga bagi suatu parameter , dilambangkan
Sifat yang diinginkan dari suatu penduga parameter adalah: 1. Tak Bias (unbiased)
2. Ragam penduga, , kecil
ˆ
E
ˆTak bias, ragam kecil
Bias, ragam besar Tak bias, ragam besar
Unsur (element)
Populasi (population)
Satuan penarikan contoh (sampling units)
Kerangka (frame)
Contoh (sample)
An object on which a measurement is taken
A collection of elements about which we wish to make an inference
Nonoverlapping collections of element from the population that cover entire population
A list of sampling units
A collection of sampling units drawn from a frame(s)
1
2
3
4
Penarikan Contoh Berpeluang (Probability Sampling)
Penarikan Contoh Tak-Berpeluang (Non-Probability Sampling)
• simple random sampling
• cluster random sampling
• systematic random sampling
• stratified random sampling
• quota sampling
• purpossive sampling
• snowball sampling
Sampling Error : kesalahan yang ditimbulkan karena kita hanya mengamati sebagian saja (contoh), tidak semuanya (populasi). Dapat dikontrol dengan secara hati-hati mendesain penarikan contohnya.
Non-Sampling Error : kesalahan yang ditimbulkan karena sebab lain pada proses survei, dan lebih sulit dikendalikan.
Non-Response
Inaccurate response
Bias selection
Pergi!!! saya tidak mau diganggu
Iya, saya tidak ahli memasak
Anak saya tidak ada di rumah, saya saja
yang mengisi kuesioner itu
Dishonest Interviewer
Human error and resources quality
Daripada capek cari responden, aku berburu
saja. Nanti kuesioner aku isi sendiri
Memperbesar ukuran contoh
(
sample size
)
tapi cara ini dapat meningkatkan non-sampling error
non-sampling error
sampling error
Jika sebuah contoh berukuran n diambil dari suatu populasi sedemikian rupa sehingga setiap contoh berukuran n yang mungkin memiliki peluang sama untuk terambil, maka prosedur itu dinamakan penarikan contoh acak sederhana. Contoh tersebut dinamakan contoh acak sederhana.
Definisi di atas berimplikasi bahwa setiap objek memiliki peluang yang sama untuk terambil. Namun konsekuensi ini bukan definisi dari penarikan contoh acak sederhana.
Pengambilan contoh acak sederhana pada ukuran populasi yang sedikit dapat saja dilakukan seperti pengundian ‘lotere’ atau ‘arisan’. Yaitu menuliskan nomor atau identitas lain dari setiap anggota populasi di selembar kertas, kemudian mengambil dengan mata tertutup n buah kertas. objek sebanyak n dengan identitas sesuai pada kertas terpilih adalah contoh yang diperoleh.
Untuk populasi yang lebih besar, dapat digunakan bantuan bilangan acak yang bisa diperoleh dari tabel bilangan acak atau komputer.
Beri nomor setiap objek: 1, 2, …, N
Ambil bilangan acak dari tabel atau bangkitkan menggunakan komputer.
Sekat-sekat bilangan acak sesuai dengan banyaknya digit N, dan buat aturan sehingga setiap objek diwakili oleh bilangan yang sama banyak.
Misalkan populasi memiliki 4000 anggota, dan ingin diambil contoh berukuran 10. Bilangan 4 digit digunakan untuk menentukan objek yang terpilih. 0001 objek nomor 1 0002 objek nomor 2 … 4000 objek nomor 4000 4001 objek nomor 1 4002 objek nomor 2 … 8000 objek nomor 4000 8001, 8002, …, 0000 tidak digunakan
Misalkan dari tabel bilangan acak (baris 26 kolom 2, Scheaffer et al) diperoleh: 72295048399642324878826516656614778767971478013300870747966695 72529676 7229 5048 3996 4232 4878 8265 1665 6614 7787 6797 1478 3229 1048 3996 232 878 ---1665 2614 3787 2797 1478
Penduga bagi adalah
n
y
y
n i i
1
)
(
y
E
1
)
(
2N
n
N
n
y
V
jika N >>> n, maka
n
s
y
V
2)
(
ˆ
karena 2 21
)
(
N
N
s
E
maka
N
n
N
n
s
y
V
2)
(
ˆ
dengan1
)
(
1 2 2
n
y
y
s
n i i)
(
ˆ
2y
V
t
y
bound on the error estimation
Objek Jumlah Uang Y1 33.5 Y2 32.0 Y3 52.0 Y4 43.0 Y5 40.0 Y6 41.0 Y7 45.0 Y8 42.5 Y9 39.0 Dugalah μ, rata-rata jumlah uang dan hitung bound of error pada penduga tersebut
89
.
40
9
368
9
9 1
i iy
y
Untuk mencari bound of error dari penduganya, kita terlebih dahulu harus menghitung s2
67
,
35
9
368
50
,
332
.
15
8
1
8
9
1
2 2 9 1 9 1 2 9 1 2 2
i i
i i i iy
y
n
y
y
s
3
.
94
484
9
484
9
67
,
35
2
2
ˆ
2
2
N
n
N
n
s
y
V
Dugaan μ
= N
n
y
N
y
N
n i i
1ˆ
N
n
N
n
s
N
y
N
V
V
2 2)
(
)
ˆ
(
ˆ
= N=750(10.31)=7732,5
Jadi total jam kerja yang tidak efektif dalam satu minggu sebanyak 7732.5 jam
jam N n N n s N y N V V 307.4 750 50 750 50 25 . 2 750 2 2 ) ( 2 ) ˆ ( ˆ 2 2 2 2 Tentukan dulu nilai bound on the error estimation, misalkan sebesar B
B
y
V
z
ˆ
(
)
2 2 2 2 2)
1
(
z
B
N
N
n
Nilai 2 ditentukan berdasarkan informasi awal, atau melakukan survei pendahuluan terlebih dahulu
25
625
25
4
100
4
2 2
range
dan
Sebelumnya kita harus menduga ragam populasi (σ2) terlebih dahulu
56
,
217
625
2
3
)
999
(
)
625
(
1000
)
1
(
2 2 2 2 2 2
z
B
N
N
n
contoh
ukuran
Ya"
"
menjawab
yang
banyaknya
ˆ
p
Jika “Ya” dilambangkan 1, dan “tidak” dengan 0, maka
y
p
ˆ
N
n
N
n
p
p
p
V
1
)
ˆ
1
(
ˆ
)
ˆ
(
ˆ
Mahasiswa y 1 1 2 0 . . . 100 1 Total 15
proporsi mahasiswa tingkat akhir yang berencana melanjutkan studi
bound of error 15 , 0 100 15 ˆ y p 059 . 0 300 100 300 99 ) 85 , 0 ( 15 , 0 2 1 ) ˆ 1 ( ˆ 2 ) ˆ ( ˆ 2 N n N n p p p V
Contoh acak berlapis didapatkan dengan cara membagi populasi menjadi beberapa kelompok yang tidak saling tumpang tindih, dan kemudian mengambil secara acak dari setiap kelompok-kelompok itu. Kelompok tersebut dinamakan LAPISAN atau STRATA.
Karena tujuan dari penarikan contoh adalah mendapatkan contoh yang mewakili (representative) populasi, maka sifat lapisan adalah:
perbedaan objek antar lapisan tinggi, sedangkan dalam lapisan rendah.
Dengan kata lain, populasi disekat-sekat sehingga di setiap sekatan, objek memiliki karakteristik yang mirip.
Menggunakan PCAB, akan memastikan bahwa contoh yang kita dapatkan terdiri atas berbagai kelompok. Jaminan ini tidak diberikan oleh PCAS. Misalnya saja, jika kita ingin mengambil contoh dari suatu kelas mahasiswa sebanyak 10 orang. Andaikan kita pisahkan terlebih dahulu berdasarkan jenis kelamin, kemudian secara acak kita ambil 5 orang dari kelompok perempuan dan 5 orang dari yang laki-laki, maka 10 orang yang diperoleh akan mewakili kedua jenis kelamin. Dengan PCAS, ada kemungkinan yang terambil perempuan saja, atau laki-laki saja. Implikasinya, pendugaan menggunakan PCAB akan memberikan bound of error yang lebih kecil. Hal tersebut benar hanya jika kita mampu membuat strata dengan tepat.
PCAB dapat mengurangi biaya survei, jika dibandingkan PCAS. Pada lokasi survei yang luas, hasil pengacakan menggunakan PCAS dapat saja terjadi kita harus pergi menyeberang pulau hanya untuk mendapatkan data dari satu orang responden. Menggunakan PCAB hal ini bisa diminimalkan.
2
Dengan PCAB dimungkinkan untuk melakukan pendugaan parameter di setiap sub-populasi, yaitu di setiap lapisan.
Lapisan adalah kumpulan objek yang memiliki karakteristik yang sama pada variabel yang ingin diambil datanya. Variabel yang menyekat populasi menjadi beberapa lapisan adalah variabel yang memiliki pengaruh atau berhubungan dengan variabel yang diambil datanya. Misalnya kita ingin menduga rata-rata waktu yang disediakan oleh mahasiswa untuk menonton televisi dalam sehari. Jika ada justifikasi yang kuat bahwa antara laki-laki dan perempuan terdapat perbedaan dalam hal tersebut, maka jenis kelamin dapat dipilih untuk dijadikan lapisan. Jika tidak demikian, harus dicari variabel lain. Penyusunan lapisan dapat dilakukan menggunakan lebih dari satu variabel.
Lapisan 1 N1 Lapisan 2 N2 Lapisan 3 N3 Contoh acak Sederhana n1 Contoh acak Sederhana n2 Contoh acak Sederhana n3
L i i i L L stN
y
N
y
N
y
N
y
N
N
y
1 2 2 1 11
1
L i i i i i i i stn
s
N
n
N
N
N
y
V
1 2 2 21
)
(
ˆ
Selang kepercayaan bagi
)
(
ˆ
2 st stt
V
y
y
KOTA A KOTA B KOTA C 35 28 26 41 27 4 49 10 8 15 21 7 43 29 32 37 15 41 25 30 14 30 20 11 36 25 29 31 12 32 34 24 39 38 40 45 28 27 35 34
Tabel 1. waktu menonton televisi (jam/minggu)
Dugalah rata-rata jumlah menonton televisi untuk semua rumah tangga di ketiga kota tersebut dan hitung bound of errornya
Kota A Kota B Kota C n 20 8 12 33.900 25.125 19.000 35.358 232.411 87.636 N1 155 62 93 y 2 1 s
155
33900
62
25125
93
19000
27
.
7
310
1
sty
12
2.8 636 . 87 871 , 0 93 8 411 . 232 871 , 0 62 20 358 . 35 871 , 0 155 310 1 2 1 2 ) ( ˆ 2 2 2 2 2 1 2 2 2
L i i i i i i i st n s N n N N N y V B
L i i i L L stN
y
N
y
N
y
N
y
1 2 2 1 1ˆ
L i i i i i i i stn
s
N
n
N
N
V
1 2 2)
ˆ
(
ˆ
Selang kepercayaan bagi
)
ˆ
(
ˆ
ˆ
2 st stt
V
L i i i L i i i iN
z
B
N
w
N
n
1 2 2 2 2 1 2 2/
B = bound of error pendugaan rataan populasi wi = proporsi contoh masing-masing lapisan
L k k k k i i i ic
N
c
N
n
n
1/
/
wi
83
18
,
5
18
800
9
/
5
155
40
An
83
22
,
6
23
800
9
/
15
62
40
Bn
83 16,8 17 800 16 10 93 40 C n
L i i i L L stN
p
N
p
N
p
N
p
N
N
p
1 2 2 1 1ˆ
1
ˆ
ˆ
ˆ
1
ˆ
L i i i i i i i i stn
p
p
N
n
N
N
N
y
V
1 2 21
)
ˆ
1
(
ˆ
1
)
(
ˆ
Selang kepercayaan bagi p
)
ˆ
(
ˆ
ˆ
2 st stz
V
p
p
L i i i i L i i i i ip
p
N
z
B
N
w
p
p
N
n
1 2 2 2 1 2)
1
(
/
)
1
(
L k k k k k i i i i ic
p
p
N
c
p
p
N
w
1)
1
(
)
1
(
Cari informasi besarnya N
Tentukan n, menggunakan formula contoh acak sederhana
Tentukan k = N/n (bulatkan)
Acak bilangan 1, 2, …, k. Misalkan diperoleh m (1 m k)
Objek yang terpilih adalah objek ke-m, ke-(m+k), (m+2k), …, (m+(n-1)k) pada kerangka penarikan contoh
N dapat diketahui dengan pasti pada kasus tertentu, tapi
pada kasus lain tidak dapat ditentukan sehingga harus
diasumsikan (diduga). Misalnya pada kasus pengunjung
tempat belanja.
n
y
y
n i i sy
1ˆ
(
)
1
(
1
)
2
n
n
y
V
sydengan
adalah korelasi antar pasangan objek contoh
sistematik dari frame yang sama. Nilai ini tidak dapat
dihitung hanya menggunakan satu contoh sistematik,
sehingga ragam penduga didekati dengan ragam penduga
rataan contoh acak sederhana.
N
n
N
n
s
y
V
sy 2)
(
ˆ
n
y
N
y
N
n i i sy sy
1ˆ
(
ˆ
)
1
(
1
)
2 2
n
n
N
V
sydengan
adalah korelasi antar pasangan objek contoh
sistematik dari frame yang sama. Nilai ini tidak dapat
dihitung hanya menggunakan satu conth sistematik,
sehingga ragam penduga didekati dengan ragam penduga
rataan contoh acak sederhana.
N
n
N
n
s
N
V
sy 2 2)
ˆ
(
ˆ
Desa Jumlah Wanita (y) y2 1 82 6724 2 76 5776 3 83 6889 … … 210 84 7056 211 80 6400 212 79 6241 Total 17.066 1.486.800
Dugalah rata-rata jumlah penduduk wanita di propinsi tersebut serta hitung ragamnya jika diketahui jumlah populasi desa sebanyak 1484.
5
,
80
212
066
.
17
ˆ
1
n
y
y
n i i sy
16
,
2
1484
212
1484
212
483
,
535
)
(
ˆ
2
N
n
N
n
s
y
V
syn
y
y
p
n i i sy sy
1ˆ
N
n
N
n
p
p
p
V
sy sy sy1
)
ˆ
1
(
ˆ
)
ˆ
(
ˆ
Contoh Gerombol adalah suatu contoh berpeluang yang satuan contohnya berupa gerombol (kumpulan elemen)
Penarikan Contoh Gerombol (PCG) adalah penarikan contoh acak sederhana terhadap satuan contoh yang berupa gerombol
Dalam PCG semua elemen dalam gerombol yang terpilih sebagai contoh diamati semua
Masalah: Tidak tersedia daftar semua rumahtangga di kota tsb
Gunakan desa/kelurahan sebagai gerombol, ambil beberapa desa secara acak, semua rumahtangga di desa yang terpilih sebagai contoh diamati
Penduga bagi adalah
n i i n i im
y
y
1 1Penduga yang baik
bagi V(y) jika n 20
)
(
ˆ
2y
V
t
y
Selang Kepercayaanbagi
1
)
(
1 2 2
n
m
y
y
M
Nn
n
N
y
V
n i i i151 25 1
i i mJumlah total pemukiman pada 25 blok tersebut:
000 . 329 . 1 25 1
i i yJumlah total pendapatan pada 25 blok tersebut:
Gunakan data tersebut untuk menduga rata-rata pendapatan per kapita di kota tersebut, dan hitung bound of errornya.
8801
151
000
.
329
.
1
1 1
n i i n i im
y
y
1617
24
247
.
502
.
227
.
15
)
04
,
6
)(
25
(
415
25
415
2
1
2
)
(
2
2 1 2 2
n
m
y
y
M
Nn
n
N
y
V
B
n i i i
= M
n i i n i im
y
M
y
M
1 1ˆ
1
)
(
ˆ
)
ˆ
(
ˆ
1 2 2
n
m
y
y
Nn
n
N
N
y
M
V
V
n i i i
n i i ty
n
N
y
N
1ˆ
1
)
(
ˆ
)
ˆ
(
ˆ
1 2 2
n
y
y
Nn
n
N
N
y
N
V
V
n i t i t
Tentukan dulu nilai bound on the error estimation, misalkan sebesar B
B
y
V
z
(
)
2 2 2 2 2 2 c cz
M
B
N
N
n
Nilai 2 c dan M ditentukanberdasarkan informasi awal, atau melakukan survei pendahuluan terlebih dahulu dengan mengambil contoh awal berukuran n’
1
1 2 2
n
m
y
y
s
n i i i c
n i i n i im
a
p
1 1ˆ
1
ˆ
)
ˆ
(
ˆ
1 2 2
n
m
p
a
M
Nn
n
N
p
V
n i i iPenduga yang baik bagi V(p) jika n 20 Jika ai = banyaknya yang menjawab Ya dalam gerombol ke-i
mi= banyaknya elemen dalam gerombol ke-i, maka: