Sampling Process and Sampling
Distribution
Inference : Point and Interval
Estimates
CAKUPAN MATERI:
Pemahaman tentang Sampling
Sampel Acak Sederhana (Simple Random Sampling
– SRS)
Estimasi Titik (Point Estimation) Estimasi Titik (Point Estimation)
Distribusi Sampling untuk Rata-rata Distribusi Sampling untuk Proporsi Sifat Penaksir (estimator) Titik
Estimasi Interval (Interval Estimation) Menguji ketepatan sampling
PENGANTAR
Populasi adalah seluruh obyek yang diteliti
Mengumpulkan informasi dari populasi
disebut sensus, dari sini diperoleh
parameter
parameter
Sampling
mengumpulkan informasi dari
sebagian unsur populasi diperoleh statistik
Sampling digunakan untuk menduga
INFERENSIA STATISTIK
Tujuan dari inferensia statistik adalah untuk
memperoleh informasi tentang populasi
berdasarkan informasi sampel.
Hasil dari sampel adalah nilai estimasi dari
Hasil dari sampel adalah nilai estimasi dari
karakteristik populasi.
Dengan metode sampling yang sesuai/tepat,
sampel yang terpilih adakan menghasil
estimator yang “baik” mengenai karakteristik
populasi.
INFERENSIA STATISTIK (L)
Inferensi Statistik meliputi:
1. Estimasi Parameter, terdiri dari:
Estimasi Titik (Point Estimation), yaitu suatu
nilai dari sampel sebagai estimator parameter nilai dari sampel sebagai estimator parameter
Estimasi Interval (Interval Estimation), yaitu
suatu interval yang dengan tingkat
kepercayaan tertentu memuat nilai parameter.
PENGGUNAAN SAMPLING
Pengujian produk
Dalam proses pemeriksaan / audit :
Pemilihan unit yang akan diperiksa
Pemilihan transaksi yang akan diperiksa
Pemilihan transaksi yang akan diperiksa
Pemilihan karyawan yang akan diinterview dalam
pengujian internal kontrol
Pengujian perilaku konsumen
Penelitian teoritis, sampel digunakan untuk membuat
Metode Sampling
Metode yang digunakan untuk mengambil
sampel dari populasi yang ada dua yaitu :
random sampling / probability sampling
non random sampling / judgment sampling
non random sampling / judgment sampling
Tidak ada cara yang terbaik
Cara yang cocok untuk pengambilan sampel
ditentukan oleh sifat-sifat populasi dan
ketrampilan peneliti
Random Sampel
Sampel random adalah sampel yang
probabilitas pemilihan masing-masing
unsur dalam populasi diketahui sebelum
unsur dalam populasi diketahui sebelum
pemilihan dan tidak sama dengan nol.
Simple random sampling
Systematic sampling
Stratified sampling
Cluster sampling
Simple Random Sampling
Suatu metode pemilihan sampel yang sedemikian rupa sehingga :
Setiap unsur dalam populasi mempunyai kesempatan yagn sama
untuk dipilih
Setiap ukuran sample (n) mempunyai kesempatan yagn sama
untuk dipilih. untuk dipilih.
Merupakan dasar statiska inferensia adalah Simple Random Sampling
Ilustrasi ada empat anak A, B, C, dan D. Jika diambil 2 anak untuk pergi berlibur maka kombinasi yang mungkin AB, AC, AD, BC, BD, CD.
Setiap kemungkinan memiliki probabilita yang sama
Stratified Random Sampling
Populasi dibagi ke dalam kelompok (strata)
yang relatif homogen dan sampel dibentuk
dari masing-masing kelompok.
Pengelompokan dimaksudkan untuk
Pengelompokan dimaksudkan untuk
memperbaiki pendugaan ciri populasi
Contoh Auditor melakukan audit atas piutang.
Piutang dikelompokkan berdasarkan nilainya ataukolektibilitas
Cluster Random Sampling
Ada dua tahap dalam random cluster
sampling
Memilih secara random kelompok (cluster) dari populasi
Semua elemen dari masing-masing kelompok Semua elemen dari masing-masing kelompok
(atau hanya sebagian elemen dari masing-masing kelompok) diikutsertakan dalam sample
Cluster random sampling akan memberikan
ketepatan yang tinggi jika variasi dalam
kelompok lebih besar dibanding variasi antar
kelompok
Systematic Sampling
Elemen dipilih dari populasi pada satu interval
waktu atau urutan.
Persamaan denan simple random sampling
setiap elemen memiliki kemungkinan yang
setiap elemen memiliki kemungkinan yang
sama tetapi setiap ukuran sampel yang dipilih
tidak memiliki kesempatan yang sama untuk
dipilih.
Untuk menginterview pelanggan, dipilih dari
Non Random Sampling
Sampel yang didasarkan pada keahlian
seseorang tentang populasi.
Kualitas non random sample ditentukan ole
keahlian peneliti.
keahlian peneliti.
Tidak ditentukan berdasarkan teknik statistika
Sulit menduga secara obyektif karena
dipengaruhi oleh subyektifitas pengambil
sampel
SAMPEL ACAK SEDERHANA
(SIMPLE RANDOM SAMPLING – SRS)
1. Populasi Terbatas (Finite Population)
SRS untuk populasi terbatas berukuran N adalah
sampel yang dipilih sedemikian sehingga masing-masing kemungkinan sampel berukuran n
masing kemungkinan sampel berukuran n memiliki peluang yang sama untuk terpilih.
Ada 2 (dua) tipe, yaitu:
Dengan Pengembalian (with replacement
-WR)
Tanpa Pengembalian (without replacement
SAMPEL ACAK SEDERHANA
(SIMPLE RANDOM SAMPLING – SRS)
2. Populasi Tak Terbatas (Infinite Population)
SRS dari populasi tak terbatas merupakan
sampel yang dipilih sedemikian sehingga kondisi berikut terpenuhi:
berikut terpenuhi:
Masing-masing elemen dipilih dari populasi
yang sama
Setiap elemen dipilih secara bebas
Desain Penelitian
Perencanaan penelitian
Sampling hanya merupakan bagian dari keseluruhan desain penelitian
Fase-Fase dalam Desain Penelitian
Menetapkan tujuan Menetapkan tujuan
Apa yang akan diukur untuk memenuhi tujuan yang diinginkan
Seberapa besar ukuran sampel Melaksanakan penelitian
Analisis data
Seberapa keyakinan kita terhadap hasil penelitian Sesuatu dapat ditelliti dengan berbagai cara
Sampling Distribution
Sampel memiliki atribut statistik
Populasi memiliki atribut parameter
Masing-masing kombinasi sampel memiliki nilai
statistik
Statistik merupakan suatu variabel random yang
Statistik merupakan suatu variabel random yang
memiliki distribusi probabilitas atau
statistic
stochastic variable
Distribusi sampling adalah distribusi probabilita
dengan statistik sampel sebagai variabel randomnya
Distribusi rata-rata sampel adalah semua
kemungkinan rata-rata dari sampel yang mungkin
sampling distribution of the mean
Sampling Distribution
Membentuk seluruh kombinasi sampel
kemudian menghitung rata-rata dan
standar deviasi tidak mungkin,
melelahkan
melelahkan
Sampel digunakan untuk menduga
populasi
Seberapa kedekatan nilai statistik
DISTRIBUSI SAMPLING
UNTUK
Proses Inferensi Statistik
X
Population Population Population Population dg Rata dg Rata--ratarataSampel Acak sederhana Sampel Acak sederhana
berukuran n dipilih berukuran n dipilih dg Rata dg Rata--ratarata m m = ?= ? berukuran n dipilih berukuran n dipilih dari populasi. dari populasi. Data sampel Data sampel menghasilkan nilai menghasilkan nilai Nilai digunakan Nilai digunakan Untuk membuat Untuk membuat
x
DISTRIBUSI SAMPLING
µ
atau
Distribusi sampling untuk adalah distribusi
probabilita dari semua kemungkinan nilai rata-rata sampel . Expected Value E( ) =
µ
atauµ
=µ
xX
x x E( ) =µ
atauµ
x =µ
dimanaµ
= rata-rata populasiSimpangan baku dari
Populasi Terbatas Populasi Tak terbatas
merupakan faktor koreksi x x 1 N n N ) n ( x − − = σ σ n x σ σ = ) n N ( −
DISTRIBUSI SAMPLING
Dari rumus dapat disimpulkan :
akan turun jika n bertambah
lebih kecil dibandingkan dengan ,kecuali jika seluruh
unsur populasi nilainya sama besar sehingga
x
σ
X
xσ
σ
0
=
=
σ
σ
xunsur populasi nilainya sama besar sehingga
Dapat digunakan Tabel distribusi normal untuk
menghitung probabilita dari nilai sampel.
σ
µ
−
=
x
z
0
=
=
σ
σ
xDISTRIBUSI SAMPLING
Tabungan sebuah bank tersdistribusi secara normal
dengan rata-rata 2000 dan standar deviasi 600. Bank tersebut mengambil sampel. Sebuah sampel 100
tabungan nasabah bank dibentuk. Berapa probabilita rata-rata tabungan dari sampel tersebut antara 1900 dan 2050
X
rata tabungan dari sampel tersebut antara 1900 dan 2050
7492 , 0 2967 , 0 4525 , 0 2967 , 0 83 , 0 60 2000 2050 4525 , 0 67 , 1 60 2000 1900 100 600 = + = → = − = → − = − = = p z z σ
The Central Limit Theorem
Distribusi populasi berarti distribusi probabilitas dari
suatu variabel random
Populasi infinite yang memiliki distribusi normal akan
memiliki distribusi sampling rata-rata yang normal berapapun ukuran sampelnya.
memiliki distribusi sampling rata-rata yang normal berapapun ukuran sampelnya.
Jika n bertambah mendekati tak terhingga maka
distribusi sampling rata-rata akan semakin kecil
Distribusi populasi tidak normal distribusi sampling
rata-rata akan mendekati normal jika ukuran sampel cukup besar >30
The Central Limit Theorem
Rata-rata distribusi sampling rata-rata akan
sama dengan rata-rata populasi
Expected Value
E( ) =
µ
atau
µ
x=
µ
dimana
µ
= rata-rata populasi
Standard error atau Simpangan baku dari
Populasi Terbatas Populasi Tak terbatasx n N ) ( x − − = σ σ n x σ σ =
STANDARD ERROR ATAU SAMPLING
ERROR
Sampling error merupakan perbedaan absolut antara
estimator tak bias (unbiased) dengan paramemter populasi.
Contoh sampling error: Contoh sampling error:
untuk rata-rata sampel
untuk simpangan baku sampel untuk proportsi sampel
| x | −
µ
| p pˆ | − | s | −σ
CONTOH 1
Suatu perusahaan ingin menduga penjualan per
bulan berdasar rata-rata sampel yang dilakukan selama 100 bulan. Misalkan rata-rata per bulan sebenarnya 5.650 dan standar deviasi 700
sebenarnya 5.650 dan standar deviasi 700
Berapa banyak bulan dari sampel tersebut akan
CONTOH 2
Dalam sampel yang terdiri 25 observasi dari populasi yagn
terdistribusi normal dengan rata-rata 98,6 dan standar deviasi 17,2.
Hitung probabilita rata-ratanya terletak antara 92 sampai
100 100
Bagaiman jika jumlah sampelnya 36?
Andi seorang kreditor di sebuah bank. Rata-rata tagihan kredit
nasabah per bulan 112 dan standar deviasi 56. Secara acak ia memilih 50 tagihan, berapa probabilita dari sampel yang terpilih rata-ratanya:
CONTOH 3
Dari populasi 125 item dengan rata-rata 105 dan standar deviasi
17,64. Jika diambil sampel 64 ?
Berapakan standar error dari rata-rata?
Berapa probabilita rata-ratanya antara 107,5 dan 109 Intan melakukan penelitian konsumsi kopi dari rumah tangga
tiap tahun. Diketahui distribusi populasi kopi normal dengan rata-rata tidak diketahui dan standar deviasi 1,25.
Jika diambil 36 rumah tangga sebagai sampel dan dhitung
komsumsi kopinya per tahun. Berapa probabilita rata-rata sampel setengah pound dari rata-rata populasinya.
Seberapa besar sampel harus diambil untuk memastikan bahwa
98% rata-rata sampel berada pada setengah pound rata-rata populasi.
PROPORSI
Rata-rata proporsi
Standar deviasi
p
p=
µ
p
p∑
−
=
2)
(
µ
σ
Standar deviasi
Didekati dengan distribusi normal :
n
p p∑
=
σ
p p p pp
n
p
Z
σ
µ
σ
µ
±
−
=
−
=
(
1
/
2
)
BEDA RATA-RATA
Beda rata-rata
Standar deviasi
2 1 2 1 2 1 x x x x x xµ
µ
µ
µ
µ
−=
−
=
−
2 2 2 1 2 2 2 1 2 1 x x x n n xσ
σ
σ
σ
σ
− = − = +Standar deviasi
Didekati dengan distribusi normal :
2 1 2 1 2 1 x x x n n x − 2 1
)
(
)
(
1 2 1 2 x xx
x
Z
−−
−
−
=
σ
µ
µ
BEDA PROPORSI
Beda rata-rata
Standar deviasi
2 1 2 1 2 1 p p pP
P
p −=
µ
−
µ
=
−
µ
2 2 1 1 2 2 2 1 ) 1 ( ) 1 ( 2 1 n P P n P P p p p p − + − = − = − σ σ σStandar deviasi
Didekati dengan distribusi normal :
2 1 2 1 2 1 p p p n n p − 2 1
)
(
)
(
1 2 1 2 p pP
P
p
p
Z
−−
−
−
=
σ
LATIHAN
Carilah probabilita bahwa rata-rata suatu sampel
random sebanyak 25 unsur dari suatu populasi yang didistribusikan normal dengan rata-rata 90 dan standar deviasi lebih besar dari 100?
Lima persen barang dalam gudang Pekanbaru cacat, Lima persen barang dalam gudang Pekanbaru cacat,
sedangkan sepuluh persen dari gudang Dumai cacat. Bila diambil sampel random sebanyak 200 dari gudang Pekanbaru dan 300 dari gudang Dumai, berapa
probabilitas beda prosentase barang yang cacat dalam gudang Dumai 2% lebih besar dibandingkan dengan gudang Pekanbaru
Dengan menganggap probabilitas kelahiran bayi pria
ESTIMASI
Seberapa jauh parameter populasi yang tidak
diketahui berada di sekitar statistik sampel.
Estimasi merupakan suatu bagian statistik inferensia
yaitu pernyataan mengenai parameter populasi yagn yaitu pernyataan mengenai parameter populasi yagn tidak diketahui berdasarkan informasi dari sampel random sederhana yang diambil dari populasi
SIFAT PENAKSIR (ESTIMATOR)
Sebelum menggunakan suatu nilai sampel sebagai
estimator titik, perlu diperiksa apakah nilai sampel tersebut memenuhi sifat-sifat sebagai estimator yang baik, yaitu:
baik, yaitu:
a. Tak bias (Unbiased), yaitu jika nilai harapan dari
estimator sama dengan nilai parameter populasi yang diestimasi.
b. Efisien (Efficient), yaitu jika estimator tersebut
memiliki standar error (varian) yang paling kecil dibandingkan estimator tak bias yang lain.
SIFAT PENAKSIR (ESTIMATOR)
c. Konsisten (Consistent)
Suatu estimator dikatakan memiliki sifat
konsisten, apabila estimator tersebut cenderung mendekati nilai parameter populasi jika ukuran mendekati nilai parameter populasi jika ukuran sampel ditingkatkan (semakin besar).
Jika ukuran sampel ditambah tanpa batas
distribusi sampling penduga akan menjadi satu garis tegak lurus di atas paramater yang
ESTIMASI TITIK
(POINT ESTIMATION)
Dalam estimasi titik kita menggunakan data sampel
untuk menghitung suatu nilai statistik sebagai estimasi parameter populasi.
Contoh: Contoh:
sebagai estimator titik dari rata-rata populasi, µ. s sebagai estimator titik dari simpangan baku
populasi,
σ
.sebagai estimator titik dari proporsi populasi, P.
x
POINT ESTIMATION
Rata-rata
n
x
x
=
∑
Standar deviasi
1
)
(
)
(
2 2 2 2−
−
=
→
−
=
∑
∑
n
x
x
s
bias
n
x
x
s
CONTOH
Sebuah bank berusaha untuk menentukan berapa
jumlah teller yang tersedia pada saat istirahat di hari Jumat. Untuk itu dilakukan pengamatan selama tiga bulan pada tiap hari jumat. Berikut data yang
bulan pada tiap hari jumat. Berikut data yang diperoleh :
242 275 289 306
342 385 279 245
269 305 294 328
ESTIMASI INTERVAL
(INTERVAL ESTIMATION)
Interval kepercayaan untuk rata-rata populasi normal.
Varian populasi diketahui.
Misalkan variabel acak n observasi/sampel dari suatu populasi berdistribusi normal dengan rata-rata µ dan
varian σ2. Jika σ2 diketahui dan rata-rata sampel yang
varian σ2. Jika σ2 diketahui dan rata-rata sampel yang
diobservasi adalah maka interval kepercayaan 100(1 – α)% untuk rata-rata populasi adalah:
dimana memenuhi x n z x n z x − α 2σ < µ < + α 2σ 2 zα ) z Z ( P > = α
ESTIMASI INTERVAL
(INTERVAL ESTIMATION) (L)
Interval kepercayaan untuk rata-rata populasi: sampel
dengan ukuran besar
Misalnya n observasi/sampel dari suatu populasi dengan rata-rata µ. Maka jika n besar, interval
kepercayaan 100(1 – α)% untuk µ adalah:
kepercayaan 100(1 – α)% untuk µ adalah:
dimana s = simpangan baku sampel
Penafsiran ini secara khusus akan tetap sesuai walaupun distribusi populasi bukan normal.
n s z x n s z x − α 2 < µ < + α 2
DISTRIBUSI t
Kurva dari distribusi t memiliki bentuk mirip dengan
kurva normal, namun lebih runcing.
Ciri khusus: distribusi t tergantung pada suatu
parameter yang disebut derajat bebas (degrees of freedom).
freedom).
Jika derajat bebas meningkat maka perbedaan
distribusi t dengan distribusi normal baku semakin kecil.
Distribusi t dengan derajat bebas yang lebih besar
memiliki varian yang lebih kecil.
DISTRIBUSI t
Membaca Tabel Student’s t
Misalkan α = 0,05 dan n = 10, maka nilai tabel
tn-1,α/2 = t(10-1);0,025 = 2,262
Degrees Area in Upper Tail Degrees Area in Upper Tail
of Freedom .10 .05 .025 .01 .005 . . . . . . 7 1.415 1.895 2.365 2.998 3.499 8 1.397 1.860 2.306 2.896 3.355 9 1.383 1.833 2.262 2.821 3.250 10 1.372 1.812 2.228 2.764 3.169 . . . . . .
UKURAN SAMPEL UNTUK ESTIMASI
INTERVAL RATA-RATA POPULASI
Misalkan E = nilai sampling error maksimum yang
ditentukan.
E sering disebut sebagai batas kesalahan (margin of
error). maka sehingga n z E 2
σ
α = 2 2)
z
(
n
=
α2σ
ESTIMASI INTERVAL
(INTERVAL ESTIMATION) (L)
Interval kepercayaan untuk rata-rata populasi normal:
varian populasi tidak diketahui
Misalnya n observasi dari variabel acak dari populasi berdistribusi normal dengan rata-rata µ dan varian
tidak diketahui. Interval kepercayaan 100(1-α)%
tidak diketahui. Interval kepercayaan 100(1-α)%
untuk rata-rata populasi adalah
dimana tn-1,α/2 memenuhi
P(tn-1 > tn-1,α/2 ) = α/2
Variabel acak tn-1 mempunyai distribusi student’s t
n s t x n s t x − n−1,α 2 x < µ < + n−1,α 2 x
ESTIMASI INTERVAL
(INTERVAL ESTIMATION) (L)
Interval kepercayaan untuk proprosi populasi
(sampel besar)
Jika menotasikan proporsi “sukses” dalam sampel acak dari n observasi suatu populasi dengan
proporsi sukses p. Maka, jika n besar, interval
pˆ
proporsi sukses p. Maka, jika n besar, interval
kepercayaan 100(1 – α)% untuk proporsi populasi
adalah dimana zα/2 memenuhi n ) pˆ 1 ( pˆ z pˆ p n ) pˆ 1 ( pˆ z pˆ − α 2 x − x < < + α 2 x − x
UKURAN SAMPEL UNTUK
ESTIMASI INTERVAL PROPORSI
POPULASI
Misalkan E = nilai sampling error maksimum yang
ditentukan.
E sering disebut sebagai batas kesalahan (margin of
error). error). maka sehingga
n
)
p
1
(
p
z
E
2−
=
α 2 2 E ) p 1 ( p ) z ( n = α2 −CONTOH
ESTIMASI INTERVAL
1. Suatu proses memproduksi kantong-kantong gula. Berat kantong-kantong diketahui berdistribusi normal dengan simpangan baku 1,2 ons. Suatu sampel 25 kantong diambil dan memiliki rata-rata 19,8 ons. Buatlah selang kepercayaan 95% untuk rata-rata Buatlah selang kepercayaan 95% untuk rata-rata populasi berat kantong gula!
SOLUSI: α = 0,05 zα/2 = 1,96 n z x n z x − α 2σ < µ < + α 2σ ) 2 , 1 )( 96 , 1 ( 8 , 19 ) 2 , 1 )( 96 , 1 ( 8 , 19 − < µ < +
CONTOH
ESTIMASI INTERVAL (L)
2. Sampel acak berukuran 172 mahasiswa akuntansi ditanya pendapat mereka ttg pentingnya suatu
pekerjaan dengan skala 1 (tidak penting) s.d. 5
(sangat penting). Ternyata diperoleh rata-rata nilai adalah 4,38 dengan standar deviasi 0,7. Buat selang adalah 4,38 dengan standar deviasi 0,7. Buat selang kepercayaan 99% untuk rata-rata populasi.
SOLUSI: α = 0,01 zα/2 = 2,575 n s z x n s z x − α 2 < µ < + α 2 172 ) 7 , 0 )( 575 , 2 ( 38 , 4 172 ) 7 , 0 )( 575 , 2 ( 38 , 4 − < µ < + 52 , 4 24 , 4 < µ <
CONTOH
ESTIMASI INTERVAL (L)
3. Sampel acak berukuran 6 mobil dari suatu model tertentu memiliki konsumsi bahan bakar sbb (mil per galon):
18,6 18,4 19,2 20,8 19,4 20,5
Buat selang kepercayaan 90% untuk rata-rata konsumsi bahan bakar populasi.
SOLUSI: α = 0,10 tn-1,α/2 = t5;0,05 = 2,015 n s t x n s t x − n−1,α 2 < µ < + n−1,α 2 ) 98 , 0 )( 015 , 2 ( 48 , 19 ) 98 , 0 )( 015 , 2 ( 48 , 19 − < µ < +
CONTOH
ESTIMASI INTERVAL (L)
4. Sampel acak berukuran 344 pemilik perusahaan ditanya mengenai kebijakan perusahaan pada bagian pembelian barang jika diberi hadiah oleh pemasok. Ternyata, 83
menyatakan tidak ada kebijakan apapun. Buat selang
kepercayaan 90% untuk proporsi populasi yg menyatakan kepercayaan 90% untuk proporsi populasi yg menyatakan tidak ada kebijakan apapun berkenaan dg hal tersebut.
SOLUSI: α = 0,10 zα/2 = 1,645 n ) pˆ 1 ( pˆ z pˆ p n ) pˆ 1 ( pˆ z pˆ x x 2 x x 2 − + < < − − α α 344 ) 759 , 0 )( 241 , 0 ( 645 , 1 241 , 0 p 344 ) 759 , 0 )( 241 , 0 ( 645 , 1 241 , 0 − < < +
CONTOH
Suatu sampel random sebanyak 100
mahasiswa menghasilkan rata-rata berat
badan 60 kg dan standar deviasi 10. Jika
populasi 250
populasi 250
Buatlah interval keyakinan rata-rata populasi kalau digunakan tingkat keyakinan 90%
Berapa tingkat keyakinan digunakan agar rata-rata populasi terletak dalam interval 58-62