Definisi 3.3.1. Milsakan PΘ := {f (·; θ); θ ∈ Θ} merupakan keluarga fungsi densi-tas, dimana Θ adalah suatu interval, misalkan sebagai γ < θ < δ dengan γ dan δ merupakan konstanta-konstanta yang diketahui. Misalkan fungsi densitas ini dapat dituliskan sebagai
f (x; θ) = exp{p(θ)K(x) + S(x) + q(θ)}, x ∈ A
dimana A := {x ∈ R; f (x; θ) > 0}. Maka PΘ adalah keluarga eksponensial reguler tipe kontinu, jika dipenuhi:
1. A tidak bergantung pada θ, γ < θ < δ.
2. p(θ) merupakan fungsi nontrivial dan kontinu pada γ < θ < δ. 3. dK(x)/dx 6= 0 dan kontinu pada A.
4. S(x) merupakan fungsi kontinu pada A.
Selanjutnya PΘdikatakan keluarga eksponensial reguler tipe diskrit jika dipenuhi kondisi-kondisi berikut:
1. A tidak bergantung pada θ, γ < θ < δ.
2. p(θ) merupakan fungsi nontrivial dan kontinu pada γ < θ < δ. 3. K(x) kontinu pada A.
Catatan:
Jika X1, . . . , Xnmerupakan sampel random dari populasi dengan fungsi densitas dari keluarga {f (·; θ) : γ < θ < δ} yang merupakan keluarga exsponensial reguler (kontinu atau diskrit), maka fungsi densitas bersama dari X1, . . . , Xn adalah
fX1,...,Xn(x1, . . . , xn; θ) = exp ( p(θ) n X i=1 K(xi) + n X i=1 S(xi) + nq(θ) )
Contoh 3.3.2. Keluarga {N(0, θ) : θ > 0} adalah keluarga eksponensial reguler tipe kontinu, karena fungsi densitasnya dapat dituliskan sebagai
f (x; θ) = √1 2πθexp ½ −x 2 2θ ¾ , 0 < θ < ∞ = exp ½ −x 2 2θ − 1 2ln(2πθ) ¾ .
Selanjutnya misalkan p(θ) := −1/θ, K(x) := x2, S(x) := 0 dan q(θ) := − ln(2πθ)/2. Maka kondisi 1-4 diatas dipenuhi.
Teorema 3.3.3. Jika X1, . . . , Xn merupakan sampel random dari populasi dengan fungsi densitas dari keluarga {f (·; θ) : γ < θ < δ} yang merupakan keluarga exspo-nensial reguler (kontinu atau diskrit). Maka Y1 := Pni=1K(Xi) merupakan statistik cukup untuk θ dan keluarga {fY1(·; θ) : γ < θ < δ} merupakan keluarga lengkap. Selanjutnya Y1 disebut statistik cukup dan lengkap.
Contoh 3.3.4. Pada Contoh 3.3.2, Y1 = Pni=1X2
i merupakan statistik cukup dan lengkap untuk θ. Misalkan ϕ(Y1) := Y1/n, maka E(ϕ(Y1)) = θ. Jadi Y1/n juga statistik cukup dan lengkap. Lebih jauh, Y1 merupakan estimator tak bias dengan variansi minimum dengan ϕ tunggal PY1-h.p.
Contoh 3.3.5. Misalkan X1, . . . , Xnmerupakan sampel random dari populasi P OIS(θ), θ > 0. Karena f (x; θ) = exp{ln θx + ln(x!) − θ}, jadi P OIS(θ), θ > 0 merupakan keluarga eksponensial reguler diskrit, sehingga
fX1,...,Xn(x1, . . . , xn; θ) = exp ( ln θ n X i=1 xi+ n X i=1 ln(xi!) − nθ ) .
Menurut Teorema 3.3.3, Y1 :=Pni=1Xi merupakan statistik cukup dan lengkap untuk θ. Selanjutnya Y1/n = ¯X juga merupakan statistik cukup dan lengkap untuk θ dengan E(Y1/n) = θ, ∀θ > 0. Jadi ¯X merupakan estimator tak bias terbaik untuk θ.
Estimasi interval
Pada Chapter 2 dan Chapter 3 telah dibahas beberapa metode menentukan estimasi titik untuk suatu parameter, misalnya θ, serta keriteria-keriteria untuk memilih es-timator terbaik untuk θ. Tetapi eses-timator titik tidak memberikan informasi tentang akurasi. Salah satu penyelesaian terhadap masalah ini adalah dengan merumuskan su-atu interval random, yaitu interval untuk θ yang batas-batasnya merupakan statistik. Ineterval ini dikonstruksikan dengan cara sedemikian, sehingga peluangnya sebesar mungkin.
Misalkan X1, . . . , Xnmerupakan n variabel random dengan fungsi densitas bersama fX1,...,Xn(x1, . . . , xn; θ), θ ∈ Θ ⊆ R. Misalkan θL, dan θU merupakan statistik dengan θL := `(X1, . . . , Xn) dan θU := u(X1, . . . , Xn). Jika (x1, . . . , xn) merupakan realisasi dari X1, . . . , Xn, maka `(x1, . . . , xn) dan u(x1, . . . , xn) merupakan nilai-nilai teramati dari θL dan θU.
Definisi 4.0.1. Untuk suatu γ ∈ (0, 1), jika
P {`(X1, . . . , Xn) < θ < u(X1, . . . , Xn)} = γ, ∀θ ∈ Θ,
maka interval (`(x1, . . . , xn), u(x1, . . . , xn)) disebut interval kepercayaan dua sisi 100γ% untuk θ. Selanjutnya nilai-nilai teramati `(x1, . . . , xn) disebut batas bawah, sedangkan u(x1, . . . , xn) disebut batas atas.
Catatan:
1. Batas-batas dari interval random (θL, θU) haruslah merupakan statistik, se-hingga nilai-nilainya untuk setiap pengamatan dapat ditentukan. Selanjutnya interval random (θL, θU) disebut estimator interval untuk θ. Sedangkan interval yang batas-batasnya merupakan bilangan `(x1, . . . , xn) dan u(x1, . . . , xn) dise-but estimasi interval untuk θ.
2. Bentuk interval tidak selamanya terbuka, tetapi bisa juga interval tertutup sesuai dengan jenis variabelnya apakah kontinu atau diskrit.
Definisi 4.0.2. Interval (`(x1, . . . , xn), ∞) disebut batas kepercayaan bawah 100γ% untuk θ ∈ Θ, jika P {`(X1, . . . , Xn) < θ} = γ, ∀θ ∈ Θ. Sedangkan (−∞, u(x1, . . . , xn)) disebut batas kepercayaan atas 100γ% untuk θ ∈ Θ, jika P {θ < u(X1, . . . , Xn)} = γ, ∀θ ∈ Θ.
Contoh 4.0.3. Misalkan daya tahan bola lampu yang diproduksi oleh pabrik A dia-sumsikan berdistribusi Exp(θ), θ > 0. Andaikan kita ingin mengkonstruksikan inter-val kepercayaan 95% untuk θ, θ > 0. Untuk menyelesaiakn masalah ini, kita ambil sampel random X1, . . . , Xn dari populasi Exp(θ). Jelaslah ¯X merupakan statistik cukup dan merupakan UMVUE untuk θ, ∀θ > 0. Karena 2n ¯X/θ berdistribusi χ2(2n), secara umum kita pilih konstanta α1 dan α2, 0 < α1, α2 < 1 dengan α1 + α2 = α ∈ (0, 1), sedemikian hingga P©χ2
α1(2n) < 2n ¯X/θ < χ2
1−α =: γ, dimana χ2
α(2n) adalah kuantil ke α dari distribusi chi-square dengan dera-jat bebas 2n (lihat Chapter 1). Biasanya dipilih α1 = α2 = α/2. Jika dipilih α = 0, 05 atau α/2 = 0, 025, maka P©χ2 0,025(2n) < 2n ¯X/θ < χ2 0,975(2n)ª = 0, 95. Karena © χ2 0,025(2n) < 2n ¯X/θ < χ2 0,975(2n)ªdan©2n ¯X/χ2 0,975(2n) < θ < 2n ¯X/χ2 0,025(2n)ª me-rupakan dua kejadian yang ekuivalen, maka interval¡2n¯x/χ2
0,975(2n), 2n¯x/χ2
0,025(2n)¢ merupakan interval kepercayaan dua sisi 95% untuk θ. Andaikan dari suatu penga-matan dengan n = 40 diperoleh data dengan ¯x = 93, 1, maka interval dengan batas bawah 69, 9 dan batas atas 130, 3 disebut sebagai suatu interval kepercayaan 95% un-tuk θ. Selanjutnya karena P©2n ¯X/θ < χ2
0,95(2n)ª = 0.95, maka¡2n ¯X/χ2
0,95(2n), ∞¢ adalah batas bawah 95% untuk θ. Sedangkan interval ¡−∞, 2n ¯X/χ2
0,05(2n)¢ adalah batas atas 95% untuk θ. Nilai-nilai untuk χ2
0,05(2n) maupun χ2
0,975(2n) dapat dili-hat pada tabel distribusi chi-square yang tesedia pada buku-buku teks standard, atau dihitung dengan komputer.
Terhadap interval (69, 9; 130, 3) yang diberikan pada contoh di atas tidak dapat diambil kesimpulan bahwa nilai θ yang sebenarnya terletak pada interval ini. Nilai θ yang sebenarnya mungkin tidak terletak pada interval ini. Interpretasi yang paling tepat adalah dengan frekuensi relatif. Misalkan m menyatakan banyaknya trial yang dilakukan. Jika m → ∞, persentase dari interval ¡2n¯x/χ2
0,975(2n), 2n¯x/χ2
0,025(2n)¢ memuat nilai θ yang sebenarnya akan mendekati 95%. Selanjutnya, karena popu-lasinya berdistribusi kontinu, maka interval terbuka dan tertutup keduanya meru-pakan interval kepercayaan dua sisi 95% untuk θ.
Contoh 4.0.4. Misalkan X1, . . . , Xn merupakan sampel random dari N(µ, σ2), den-gan −∞ < µ < ∞ tidak diketahui, sedangkan 0 < σ2 < ∞ diasumsikan diketahui.
Jika zα merupakan kuantil ke α ∈ (0, 1) dari distribusi N(0, 1), maka 1 − α =P©zα/2 <√n( ¯X − µ)/σ < z1−α/2ª
=P©X − z¯ 1−α/2σ/√n < µ < ¯X − zα/2σ/√nª.
Jadi interval ¡x − z¯ 1−α/2σ/√n, ¯x − zα/2σ/√n¢ adalah interval kepercayaan dua sisi 100(1 − α)% untuk µ, atau £x − z¯ 1−α/2σ/√n, ¯x − zα/2σ/√n¤.
Pada kasus ini kita mengasumsikan σ2 diketahui agar batas-batas intervalnya dapat dihitung. Jika σ2 tidak diketahui, maka ujung-ujung interval tidak dapat dihitung. Parameter seperti ini disebut juga parameter pengganggu (nuisance pa-rameter). Permasalahan yang dihadapi dalam mengkonstruksi interval kepercayaan adalah kehadiran parameter pengganggu. Masalah ini bisa diatasi dengan melakukan modofikasi seperti terangkum pada beberapa sub bab berikut.
Prinsip dasar dalam mengkonstruksikan interval kepercayaan untuk suatu param-eter θ adalah bahwa kita harus dapat menentukan suatu kuantitas yang hanya bergan-tung pada sampel dan θ, tetapi distribusi probabilitasnya tidak berganbergan-tung pada θ dan parameter-parameter lain yang tidak diketahui. Seperti pada Contoh 4.0.3, kuan-titas ¯X/θ berdistribusi GAM(1/n, n) yang tidak bergantung pada θ, tetapi karena kuantil dari GAM(1/n, n) tidak tersedia pada tabel, kita lakukan sedikit modifikasi dengan mendefinisikan quantitas 2n ¯X/θ yang diketahui berdistribusi χ2(2n) yang tidak bergantung pada θ dan kuntil-kuantilnya tersedia pada tabel.