Estimasi
Statistical Inference
Inferensia statistik adalah proses di mana kita mendapatkan informasi dan menarik kesimpulan tentang populasi dari sampel
Parameter Population
Sample
Statistic Inference
Data
Statistics
Information
Supaya dapat
melakukan inferensia, kemampuan dan
pengetahuan descriptive statistics, distribusi
peluang, dan distribusi
Statistical Inference
Ada dua jenis inferensi: estimasi dan uji hipotesis;
estimasi diperkenalkan terlebih dahulu.
Tujuan dari estimasi adalah untuk menentukan nilai pendekatan dari parameter populasi
berdasarkan sampel statistik.
E.g., rata-rata sampel ( ) digunakan untuk mengestimasi rata-rata populasi ( μ ).
X
Estimation
Tujuan dari estimasi adalah untuk menentukan nilai pendekatan dari parameter populasi
berdasarkan sampel statistik.
Ada dua jenis estimator:
1. Estimator Titik
2. Estimator Interval
Estimasi Titik dan Interval
Estimasi titik adalah angka tunggal,
Estimasi interval (Confidence interval)
memberikan informasi tambahan tentang variabilitas
Point Estimate
Lower
Confidence Limit
Upper
Confidence Limit
Width of
confidence interval
Estimasi Titik
Kita dapat mengestimasi parameter population
Dengan statistik Sample
(Estimasi titik)
Mean
Proportion
p
μ x
p
Estimasi Titik
Suatu estimator titik menarik kesimpulan tentang populasi dengan mengestimasi nilai parameter yang tidak diketahui dengan menggunakan suatu nilai tunggal atau titik.
Telah diketahui sebelumnya bahwa peluang dari suatu titik pada distribusi kontinu adalah hampir nol. Dan juga
diharapkan bahwa suatu estimator titik akan semakin dekat dengan nilai parameter ketika ukuran sampel meningkat, tetapi estimator titik tidak mencerminkan pengaruh dari ukuran sampel yang membesar. Oleh karena itu kita akan menggunakan estimator interval untuk memperkirakan parameter populasi.
Formula Umum
Formula umum untuk semua interval kepercayaan adalah:
Point Estimate (Critical Value)(Standard Error)
Confidence Intervals
Population Mean
σ Unknown
Confidence Intervals
Population Proportion
σ Known
Confidence Interval for μ (σ Known)
Assumptions
Population standard deviation σ is known
Population is normally distributed
If population is not normal, use large sample
Confidence interval estimate
n z σ
x α/2
Finding the Critical Value
Consider a 95% confidence interval:
z.025= -1.96 z.025= 1.96 .95
1
2 .025
α .025
2 α
Point Estimate Lower
Confidence Limit
Upper
Confidence Limit
z units:
x units: Point Estimate
0
1.96 zα/2
Common Levels of Confidence
Commonly used confidence levels are 90%, 95%, and 99%
Confidence Level
Confidence
Coefficient, z value,
1.28 1.645 1.96 2.33 2.57 3.08 3.27 .80
.90 .95 .98 .99 .998 .999 80%
90%
95%
98%
99%
99.8%
99.9%
1
z
/2μ μx
Interval and Level of Confidence
Confidence Intervals
Intervals extend from
to
100(1-)%
of intervals constructed contain μ;
100% do not.
Sampling Distribution of the Mean
n z σ
x /2
n z σ
x /2
x
x1 x2
/2 1 /2
Contoh
Sampel 11 sirkuit dari populasi normal yang besar memiliki rata-rata ketahanan 2,20
ohm. Dari pengujian terakhir diketahui
bahwa standar deviasi populasi adalah 0,35 ohm
Tentukan 95% confidence interval bagi
rata-rata yang sebenarnya dari ketahanan populasi.
2.4068 ...
...
1.9932
.2068 2.20
) 11 (.35/
1.96 2.20
n z σ
x /2
Contoh
Sampel 11 sirkuit dari populasi normal yang besar memiliki rata-rata ketahanan 2,20 ohm.
Dari pengujian terakhir diketahui bahwa standar deviasi populasi adalah 0,35 ohm.
Solution:
(continued)
Interpretation
Kita 95% percaya bahwa rata-rata sebenarnya dari ketahanan adalah antara 1,9932 dan
2,4068 ohms
Confidence Intervals
Population Mean
σ Unknown
Confidence Intervals
Population Proportion
σ Known
If the population standard deviation σ is unknown, we can substitute the sample standard deviation, s
This introduces extra uncertainty, since s is variable from sample to sample
So we use the t distribution instead of the normal distribution
Confidence Interval for μ
(σ Unknown)
Assumptions
Population standard deviation is unknown
Population is normally distributed
If population is not normal, use large sample
Use Student’s t Distribution
Confidence Interval Estimate
Confidence Interval for μ (σ Unknown)
n t s
x
/2
(continued)
Student’s t Distribution
The t is a family of distributions
The t value depends on degrees of freedom (d.f.)
Number of observations that are free to vary after sample mean has been calculated
d.f. = n - 1
If the mean of these three values is 8.0,
then x3 must be 9
(i.e., x3 is not free to vary)
Degrees of Freedom (df)
Idea: Number of observations that are free to vary after sample mean has been calculated
Example: Suppose the mean of 3 numbers is 8.0 Let x1 = 7
Let x2 = 8 What is x3?
Here, n = 3, so degrees of freedom = n -1 = 3 – 1 = 2
(2 values can be any numbers, but the third is not free to vary for a given mean)
Student’s t Distribution
0
t
t (df = 5) t (df = 13)
t-distributions are bell-
shaped and symmetric, but have ‘fatter’ tails than the normal
Standard Normal (t with df = )
Note: t z as n increases
Student’s t Table
Upper Tail Area df .25 .10 .05
1 1.000 3.078 6.314
2 0.817 1.886 2.920 3 0.765 1.638 2.353
0 2.920 t
The body of the table contains t values, not probabilities
Let: n = 3 df = n - 1 = 2
= .10
/2 =.05
/2 = .05
t distribution values
With comparison to the z value
Confidence t t t z Level (10 d.f.) (20 d.f.) (30 d.f.) ____
.80 1.372 1.325 1.310 1.28 .90 1.812 1.725 1.697 1.64 .95 2.228 2.086 2.042 1.96 .99 3.169 2.845 2.750 2.57
Note: t z as n increases
Example
A random sample of n = 25 has x = 50 and s = 8. Form a 95% confidence interval for μ
d.f. = n – 1 = 24, so
The confidence interval is
2.0639 t
t/2,n1 .025,24
25 (2.0639) 8
n 50 t s
x
/2
46.698 ……….. 53.302
Approximation for Large Samples
Since t approaches z as the sample size increases, an approximation is sometimes used when n 30:
n t s
x
/2n z s
x
/2Technically correct
Approximation for large n
Determining Sample Size
The required sample size can be found to reach a desired margin of error (e) and
level of confidence (1 -
) Required sample size, σ known:
2 /2
2 /2
e
σ z
e
σ
n z
2 2 Required Sample Size Example
If = 45, what sample size is needed to be 90% confident of being correct within ± 5?
(Always round up)
219.19 5
1.645(45) e
σ n z
2 2
/2
So the required sample size is n = 220
Confidence Intervals
Population Mean
σ Unknown
Confidence Intervals
Population Proportion
σ Known
Confidence Intervals for the Population Proportion, p
An interval estimate for the population
proportion ( p ) can be calculated by
adding an allowance for uncertainty to
the sample proportion ( p )
Confidence Intervals for the Population Proportion, p
Recall that the distribution of the sample proportion is approximately normal if the
sample size is large, with standard deviation
We will estimate this with sample data:
(continued)
ˆ
ˆ ˆ
p(1 p)
s
pn
n
p) σ
pp(1
Confidence interval endpoints
Upper and lower confidence limits for the
population proportion are calculated with the formula
where
z is the standard normal value for the level of confidence desired
p is the sample proportion
n is the sample size
/2
ˆ (1 ˆ )
ˆ p p
p z
n
Contoh
Sampel acak 100 orang menunjukkan bahwa 25 diantaranya adalah kidal.
Bentuklah 95% interval kepercayaan
untuk proporsi sebenarnya dari orang
kidal.
Contoh
A random sample of 100 people shows that 25 are left-handed. Form a 95%
confidence interval for the true proportion of left-handers.
1.
2.
3.
ˆ
ˆ 25/100 0.25
ˆ ˆ
S
p(1 )/n 0.25(0.75)/n 0.0433 p
p p
0.3349 .
. . . . 0.1651
(.0433) 1.96
.25
(continued)
Interpretation
We are 95% confident that the true
percentage of left-handers in the population is between
16.51% and 33.49%.
Changing the sample size
Increases in the sample size reduce the width of the confidence interval.
Example:
If the sample size in the above example is
doubled to 200, and if 50 are left-handed in the sample, then the interval is still centered at .25, but the width shrinks to
.19 …… .31
Finding the Required Sample Size for proportion problems
n
) p (
z p
e
/2
1
Solve for n:
Define the
margin of error:
2 /2
e
) p (
p
n z
21
p can be estimated with a pilot sample, if necessary (or conservatively use p = .50)
What sample size...?
How large a sample would be necessary to estimate the true proportion defective in a large population within 3%, with 95%
confidence?
(Assume a pilot sample yields p = .12)
What sample size...?
Solution:
For 95% confidence, use Z = 1.96 e = .03
p = .12, so use this to estimate p
So use n = 451
2 2
/2
2 2
ˆ (1 ˆ ) (1.96) (.12)(1 .12)
450.74 (.03)
z p p
n e
(continued)
SOAL LATIHAN
Soal 1
Suatu perusahaan listrik yang membuat bola lampu yang panjang umurnya
berdistribusi hampir normal dengan
simpangan baku 40 jam. Bila sample 30 bola lampu berumur rata-rata 780 jam, hitunglah selang kepercayaan 96% untuk rata-rata populasi bola lampu yang
dihasilkan perusahaan tersebut
Soal 2
Berapa besarkah sampel diperlukan pada soal 1 bila diinginkan kepercayaan 96%
agar rata-rata sampel paling banyak meleset 10 jam dari rata-rata
sesungguhnya?
Soal 3
Sebuah mesin menghasilkan potongan logam yang berbentuk silinder. Sampel beberapa potongan diukur dan ternyata
diameternya 1,01 ; 0,97 ; 1,03 ; 1,04 ; 0,99 ; 0,98 ; 0,99 ; 1,01 ; dan 1,03 cm. hitunglah
selang kepercayaan 99% untuk rata-rata diameter potongan yang dihasilkan mesin tersebut bila dimisalkan distribusinya
hampir normal
Soal 4
Sampel acak 12 lulusan suatu sekolah
sekretaris mengetik rata-rata 79,3 kata per
menit dengan standar deviasi 7,8 kata per
menit. Anggap jumlah kata yang diketik per
menit berdistribusi normal. Buatlah selang
kepercayaan 95% untuk rata-rata jumlah
kata yang diketik per menit oleh semua
lulusan sekolah tadi
Soal 5
Suatu sampel acak 200 pemilih diambil dan ternyata 114 daripadanya mendukung
calon A. Hitunglah selang kepecayaan 96%
untuk proporsi populasi pemilih yang
mendukung calon A.
Soal 6
Dari suatu sampel acak 1000 rumah di
suatu kota ternyata 228 menggunakan gas elpiji. Cari selang kepercayaan 99% untuk proporsi rumah di kota tadi yang
menggunakan gas elpiji.
Soal 7
Suatu sistem peluncur roket tertentu sedang dipertimbangkan untuk dipakai meluncurkan sejumlah roket jarak pendek. Sistem yang sekarang mempunyai peluang berhasil
meluncurkan sebuat roket p=0,8. Sampel 40
peluncuran percobaan dengan system yang baru menunjukkan 34 yang berhasil.
a. Buatlah selang kepercayaan 95% untuk p.
b. Apakah kenyataannya cukup besar untuk
mendukung bahwa sistem yang baru ini lebih baik? Jelaskan.