Statistika
Statistika
Inferensi
Inferensi
:
:
Estimasi
Estimasi
Estimasi
titik
titik
Estimasi adalah keseluruhan proses yang
Estimasi adalah keseluruhan proses yang
menggunakan sebuah estimator untuk
menggunakan sebuah estimator untuk
menghasilkan sebuah estimate dari suatu
menghasilkan sebuah estimate dari suatu
parameter.
parameter.
Sebuah estimasi titik dari sebuah
Sebuah estimasi titik dari sebuah
parameter
parameter
adalah sesuatu angka
adalah sesuatu angka
tunggal yang dapat dianggap sebagai nilai
tunggal yang dapat dianggap sebagai nilai
yang masuk akal dari
Contoh
Contoh
Seorang ahli sosial ekonomi ingin
Seorang ahli sosial ekonomi ingin
mengestimasi rata-rata penghasilan buruh
mengestimasi rata-rata penghasilan buruh
di suatu kota. Sebuah sampel dikumpulkan
di suatu kota. Sebuah sampel dikumpulkan
menghasilkan rata-rata Rp 2.000.000,-.
menghasilkan rata-rata Rp 2.000.000,-.
Dalam hal ini telah dilakukan estimasi titik,
Dalam hal ini telah dilakukan estimasi titik,
dengan menggunakan estimator berupa
dengan menggunakan estimator berupa
statistic mean
statistic mean
(
(
)
) untuk
untuk mengestimasi
mengestimasi
parameter mean populasi (
parameter mean populasi (
μ μ).
). Ni
Nila
laii sa
samp
mpel
el
R
Rp
p 2
2..0
00
00
0..0
00
00
0,-
,- sse
eb
baaggaaii n
niillaaii e
essttiim
maatte
e d
daarrii
mean populasi.
mean populasi.
X X
Estimasi Interval
Sebuah estimasi interval (interval
estimate) dari sebuah parameter
, adalah
suatu sebaran nilai nilai yang digunakan
untuk mengestimasi interval.
Jika dimiliki sampel X
1, X
2, …., X
ndari
distribusi normal N(
,
2) maka
)
,
(
~
2 n N X
Akibatnya interval kepercayaan (1-
)100%
untuk mean populasi
adalah
dengan Z
(1-
/2)adalah kuantil ke-(1-
/2) dari
distribusi normal baku dan jika
tidak
diketahui maka dapat diestimasi dengan
simpangan baku (standard deviation) sampel
s
yaitu
s
=
s
2.
n
Z
X
n
Z
X
/2 1 /2 1
Jadi interval kepercayaan (
confidence interval
)
adalah estimasi interval berdasarkan tingkat
kepercayaan tertentu dan batas atas serta batas
bawah interval disebut batas kepercayaan
(
confidence limits
).
Dari prakteknya tingkat kepercayaan dilakukan
sebelum estimasi dilakukan, jadi dengan
menetapkan tingkat kepercayaan interval
sebesar 90 persen (90 %).
Artinya seseorang yang melakukan tersebut
ingin agar 90 persen yakin bahwa mean dari
populasi akan termuat dalam interval yang
diperoleh.
Estimasi interval untuk beberapa
Contoh
Seorang guru ingin mengestimasi waktu
rata-rata yang digunakan untuk belajar.
Suatu sampel acak ukuran 36
menunjukan bahwa rata-rata waktu yang
digunakan siswa untuk belajar di rumah
setiap harinya adalah 100 menit.
Informasi sebelumnya menyatakan
Estimasi interval dengan tingkat kepercayaan 95 persen
dapat ditentukan berikut ini :
Unsur unsur yang diketahui :
= 100 ;
= 20;
n
=36; tingkat kepercayaan 95 %.
Dengan tingkat kepercayaan 95 % maka nilai z adalah
1,96 jadi estimasi interval dari nilai waktu rata-rata
sesungguhnya adalah :
Dengan kata lain guru mengestimasi dengan tingkat
keyakinan 95 % bahwa rata-rata waktu belajar adalah
antara 93,47 menit hingga 106,53 menit
X
53
,
106
47
,
93
)
6
/
20
(
96
,
1
100
)
6
/
20
)(
96
,
1
(
100
Jika n > 30
Dari seluruh siswa 4 kelas diambil sebagai sampel 40 siswa dan
didapatkan nilai Matematika dari 40 siswa tersebut sebagai berikut :
58
48
56
43
58
57
48
35
43
47
49
41
64
58
46
44
47
55
42
48
54
29
46
47
59
47
52
43
47
49
40
58
60
50
50
50
64
36
43
44
maka estimasi rata-rata nilai Matematika sesungguhnya dengan tingkat
kepercayaan 90 persen yaitu :
Dengan tingkat kepercayaan 90 % maka nilai z adalah 1,645 jadi
estimasi interval dari rata-rata sesungguhnya adalah :
Jika n
30
Jika dimiliki sampel X
1, X
2, …., X
ndari
distribusi normal N(
,
2) dengan
2tidak diketahui maka :
berdistribusi
t
dengan derajat bebas
n
-1.
n S X T /
Sifat-sifat distribusi
t
Distribusi ini serupa dengan distribusi Z dengan
mean nol dan simetris berbentuk lonceng /
bell
shape
terhadap mean.
Bentuk distribusi tergantung pada ukuran
sampel. Jadi distribusi adalah kumpulan keluarga
distribusi dan perbedaan satu dengan yang
lainnnya tergantung pada ukuran sampel.
Pada ukuran sampel yang kecil keruncingan
berbentuk distribusi
t
kurang dibandingkan
dengan distribusi Z dan jika meningkatnya
ukuran sampel mendekati 30 maka bentuk
distribusi semakin mendekati bentuk distribusi
Z. (Jadi jika
n
>30 maka digunakan nilai z).
Untuk
n
30, interval kepercayaan
(1-
)100% untuk mean populasi
adalah
dengan
t
n-1; (1-
/2)adalah kuantil ke-(1-
/2) dari
distribusi
t
dengan derajat bebas
n
-1 dan
s
adalah
simpangan baku (
standard deviation
) sampel dengan
s
=
s
2yaitu akar dari variansi sampel.
n
s
t
X
n
s
t
X
n n1;1 /2
1;1 /2
Contoh
Misalkan diberikan nilai Matematika 10
siswa sebagai berikut : 58, 58, 43, 64, 47,
54, 59, 47, 60, dan 64.
Estimasi rata-rata nilai Matematika
sesungguhnya (populasi). Nilai rata-rata
Matematika dengan tingkat kepercayaan
95 persen dapat diestimasi sebagai
interval kepercayaan
(rata-rata
populasi) dengan koefisien
ESTIMASI PARAMETER
SATU POPULASI
Estimasi Parameter :
Metode statistika yang berfungsi untuk
mengestimasi/menduga/memperkirakan nilai karakteristik dari populasi atau parameter populasi berdasarkan nilai karakteristik sampel atau statistik sampel.
Syarat : sampel harus dapat mewakili populasi sampling dilakukan
secara acak. Contoh :
Hasil pemilu dihitung secara cepat (Quickcount) dengan sampel untuk tiap wilayah pemilihan, valid jika pengambilan sampel dilakukan secara acak. Cara estimasi :
1. Estimasi Titik
Parameter populasi diestimasi dengan karakteristik sampel (Statistik)
Mean populasi =
=Variansi populasi =
2 = s2standar deviasi =
= s2. Estimasi Interval
Nilai parameter populasi diestimasi pada kisaran tertentu.
Misal X1,X2,X3,…Xn adalah sampel acak dari suatu populasi dengan
adalah parameter populasi maka estimasi interval untuk
adalah :P(B<
< A)=1-
Disebut dengan Interval konfidensi/kepercayaan untuk
dari B sampai A yang dihitung pada probabilitas 1-
.Bila parameter yang diestimasi adalah H dan distribusi populasi yang digunakan
(misal distribusi Z, t-student, chi-kuadrat, atau F), galat (error)=
dan statistik dari data sampel adalah k, maka kisaran parameter H pada suatu interval kepercayaan (1-
) dapat diestimasi dengan persamaan probabilitas: P(h-
< H < h
)= 1-
…….(1)Dengan :
h-
= titik minimum (limit kepercayaan bawah) h
= titik maksimum (limit kepercayaan atas) 1-
= koefisien kepercayaan(1-
) 100% = interval kepercayaanParameter yang umum diestimasi:
1. Ukuran pemusatan : mean=
, Selisih mean =
1 -
2 =
Estimasi mean dan selisih mean dapat dilakukan dengan :
a. Distribusi Z :
- Jika sampel yang diamati berasal dari populasi yang variansinya
(
2) dan standar deviasinya (
) diketahui.- Jika sampel yang berasal dari populasi yang variansinya (
2) danstandar deviasinya (
) tidak diketahui ukuran sampel besar (n
30).b. Distribusi t-student (Distribusi t)
- Jika sampel berasal dari populasi yang tidak diketahui variansinya
(
2) dan standar deviasinya (
) ukuran sampel kecil (n
30).2. Ukuran penyebaran : Variansi =
2, Rasio variansi dua populasi = FEstimasi nilai variansi dilakukan dengan distribusi chi-kuadrat (X2),
A. Estimasi Mean Populasi
1. Estimasi mean populasi sampel besar dengan distribusi Z
Misal x1,x2,x3….xn adalah sampel acak dari suatu populasi dengan mean
tidak diketahui dan variasi
2, dan = mean sampel maka :Mean ( )=
Var (( )=
2/nMenurut teorama limit pusat jika n besar variabel random mendekati distribusi normal
Maka rumus 1 akan berubah menjadi :
Jika nilai Z diganti menjadi :
Biasanya
2tidak diketahui, tetapi karena n besar maka
2dapat diasumsikan sama dengan s2. X X X n X Z / 1 2 / 2 /
1 2 / 2 / n X n X
1 / /2 2 / n XSehingga:
Contoh :
Suatu sampel produk ikan dalam kaleng sebanyak 400 buah mempunyai rata-rata umur simpan 23,4 bulan dan standar deviasi s=6,2 bulan. Berapakah kisaran umur simpan produk ikan dalam kaleng tersebut pada interval kepercayaan 95%.
Jawab :
Diketahui : n besar maka digunakan distribusi Z dengan
=s=23,4 bulan dan s=6,2
1-
=95%=0,95 = 0,05
/2 = 0,025 Z0,025 = 1,96. Maka:Kesimpulan: pada tingkat kepercayaan 95% maka umur simpas produk ikan ( /2 /2 ) 1 n s X n s X X % 95 ) 400 2 , 6 96 , 1 4 , 23 400 2 , 6 96 , 1 4 , 23 (
%
95
)
01
,
24
79
,
22
(
2. Estimasi mean populasi dengan sampel kecil.
- Digunakan untuk data sampel dengan variansinya (
2) dan standardeviasinya (
) tidak diketahui dan ukuran sampel kecil (n<30).- Jika adalah transformasi t dari sampel X1,X2,X3,…Xn. Jika
sampel diambil dari populasi berdistribusi t dengan derajat bebas (n-1)
ditulis t(n-1). Distribusi ini tidak tergantung pada µ dan
populasi.P(-tα/2 < t < t α/2)=1-α Jika nilai t diganti menjadi :
n s x t /
1 / /2 2 /t
t
n X
1 2 / 2 / n X n Xt
t
Atau
1
2 / 2 /n
s
X
n
s
X
t
t
B. Estimasi interval proporsi p suatu populasi
Jika X adalah variabel random binomial (n;p) maka variabel random X/n
mempunyai mean = p dan variasi untuk n besar harga
Mendekati distribusi normal.
Pada interval konfidensi 1-α untuk p adalah:
= 1 – α
Untuk estimasi proporsi jumlah sampel harus besar.
C. Estimasi Variansi populasi normal
Transformasi
S2 dihitung dari suatu sampel random X
1,X2,X3,…Xn yang diambil dari populasi
berdistribusi normal dengan variansi
2 berdistribusi X2 dengan derajat bebas =n-1. n p P (1 ) n n x n x ) 1 (
n p P (1 )z
z
n n x n x n n x n xn
x
p
n
x
P
(
/2 1 /2 1 )
2 2 2(
1
)
s n X Tabel V :
Untuk 0<α<1 maka :
Untuk estimasi standar deviasi
digunakan :