BAB II UJI HIPOTESIS PERBEDAAN RATA-RATA
B. Distribusi Sampling
D. Hipotesis Statistik
E. Uji Hipotesis Rata-rata Satu Populasi F. Uji Hipotesis Rata-rata Dua Populasi BAB III EFFECT SIZE COHEN
A. Dari Uji Signifikansi ke Effect Size B. Jenis Effect Size
C. Selang Kepercayaan pada 𝑑 D. Meta-Analisis pada 𝑑
BAB IV PENERAPAN EFFECT SIZE PADA HASIL-HASIL PENELITIAN A. Meta-Analisis pada Data Independen
B. Meta-Analisis pada Data Berpasangan BAB V PENUTUP
A. Kesimpulan B. Saran
DAFTAR PUSTAKA LAMPIRAN
6 BAB II
UJI HIPOTESIS PERBEDAAN RATA-RATA
A. Statistika Inferensial
Berdasarkan aktivitas yang dilakukan, statistika terbagi menjadi dua yaitu statistika deskriptif dan statistika inferensial. Pada bab ini akan dibahas tentang statistika inferensial yang berperan penting pada pengujian hipotesis dan pendugaan parameter. Statistikawan menggunakan hukum dasar probabilitas dan statistika inferensial untuk menarik kesimpulan tentang sistem ilmiah. Informasi dikumpulkan dalam bentuk sampel atau koleksi pengamatan. Sampel dikumpulkan dari populasi, yang merupakan kumpulan semua individu atau masing-masing item dari jenis tertentu. Suatu konstanta yang merupakan karakteristik populasi dinamakan parameter.
Definisi 2.1.1. Ruang sampel adalah himpunan yang terdiri dari semua kemungkinan titik sampel dalam suatu proses pengamatan.
Definisi 2.1.2. Variabel acak adalah fungsi bernilai real yang domainnya adalah ruang sampel.
Fungsi tertentu dari variabel acak yang diamati dalam sampel digunakan untuk menduga atau membuat keputusan tentang parameter populasi yang tidak diketahui. Misalnya, pendugaan rata-rata populasi 𝜇 dilakukan dengan mengambil sampel acak 𝑥1, 𝑥2, … , 𝑥𝑛 dari variabel acak 𝑋1, 𝑋2, … , 𝑋𝑛 dan rata-rata sampelnya
Variabel acak 𝑥̅ adalah fungsi dari variabel acak 𝑋1, 𝑋2, … , 𝑋𝑛 dan sampel berukuran 𝑛. Dengan kata lain, rata-rata sampel, yaitu 𝑥̅ adalah contoh statistik.
Definisi 2.1.3. Statistik adalah fungsi dari variabel acak yang diamati dalam sampel.
Sebagai contoh, dalam sebuah percobaan obat, sampel pasien diambil dan masing-masing diberi obat spesifik untuk mengurangi tekanan darah. Percobaan ini difokuskan pada penarikan kesimpulan tentang populasi pasien yang menderita hipertensi. Jadi, tujuan dari statistika inferensial adalah informasi yang terdapat dalam sampel digunakan untuk membuat kesimpulan tentang populasi di mana sampel diambil.
Definisi 2.1.4. Statistika inferensial adalah teknik analisis statistik yang terdiri dari beberapa metode statistik untuk dapat membuat kesimpulan atau generalisasi tentang populasi.
Definisi 2.1.5. Fungsi 𝑓(𝑥) adalah fungsi densitas probabilitas untuk variabel acak kontinu 𝑋, jika
1) 𝑓(𝑥) ≥ 0, untuk setiap 𝑥 ∈ ℝ. 2) ∫−∞∞ 𝑓(𝑥) 𝑑𝑥 = 1.
Fungsi Pembangkit Momen
Pada subbab ini akan dijelaskan fungsi pembangkit momen yang berkaitan dengan Teorema dalam distribusi sampling.
Definisi 2.1.6. Momen ke-𝑘 variabel acak 𝑋 diberikan oleh 𝜇′𝑘= 𝐸(𝑋𝑘) = { ∑ 𝑥𝑘𝑓(𝑥) 𝑥 , jika 𝑋 diskrit, ∫ 𝑥𝑘𝑓(𝑥) 𝑑𝑥 ∞ −∞ , jika 𝑋 kontinu.
Berdasarkan definisi 2.1.5, rata-rata dan variansi variabel acak 𝑋 adalah 𝜇′1 = 𝐸(𝑋) = 𝜇 dan 𝜇′2− 𝜇2 = 𝐸(𝑋2) − 𝜇2 = 𝜎2.
Definisi 2.1.7. Fungsi pembangkit momen dari variabel 𝑋 diberikan oleh 𝐸(𝑒𝑡𝑋) dan dinotasikan oleh 𝑚𝑋(𝑡). Dengan kata lain,
𝑚𝑋(𝑡) = 𝐸(𝑒𝑡𝑋) = { ∑ 𝑒𝑡𝑥𝑓(𝑥) 𝑥 , jika 𝑋 diskrit, ∫ 𝑒𝑡𝑥𝑓(𝑥) 𝑑𝑥 ∞ −∞ , jika 𝑋 kontinu.
Teorema 2.1.1. Misalkan 𝑋 adalah variabel acak dengan fungsi pembangkit momen 𝑚𝑋(𝑡). Didefinisikan
𝑑𝑘
𝑑𝑡𝑘𝑚𝑋(𝑡)|𝑡=0 = 𝜇′𝑘. Bukti:
Misalkan 𝑚𝑋(𝑡) adalah fungsi pembangkit momen yang variabel acak 𝑋 terdiferensial 𝑘 kali. 𝑑𝑘 𝑑𝑡𝑘𝑚𝑋(𝑡) = 𝑑 𝑘 𝑑𝑡𝑘∫ 𝑒𝑡𝑥𝑓𝑋(𝑥) 𝑑𝑥 ∞ −∞ = ∫ (𝑑 𝑘 𝑑𝑡𝑘𝑒𝑡𝑥) 𝑓𝑋(𝑥) 𝑑𝑥 ∞ −∞
= ∫ (𝑥𝑘𝑒𝑡𝑥)𝑓𝑋(𝑥) 𝑑𝑥 ∞ −∞ = 𝐸(𝑋𝑘)𝑒𝑡𝑥. Dengan demikian, 𝑑𝑘 𝑑𝑡𝑘𝑚𝑋(𝑡)|𝑡=0= 𝐸(𝑋𝑘)𝑒𝑡𝑥|𝑡=0= 𝐸(𝑋𝑘) = 𝜇′𝑘. ∎
Contoh 2.1.1. Misalkan 𝑋 adalah variabel acak berdistribusi Normal dengan rata-rata 𝜇 dan variansi 𝜎2. Tentukan fungsi pembangkit momen untuk 𝑋.
Penyelesaian: Fungsi probabilitas Normal dengan rata-rata 𝜇 dan variansi 𝜎2
adalah
𝑓(𝑥) = 1
𝜎√2𝜋exp [− ( 1
2𝜎2) (𝑥 − 𝜇)2] , −∞ < 𝑥 < ∞ Fungsi pembangkit momen dari 𝑋 adalah
𝑚(𝑡) = 𝐸(𝑒𝑡𝑥) = ∫ 𝑒𝑡𝑥(exp [−(𝑥 − 𝜇) 2/2𝜎2] 𝜎√2𝜋 ) 𝑑𝑥. ∞ −∞ Misalkan 𝑢 = 𝑥 − 𝜇, 𝑑𝑢 = 𝑑𝑥, maka 𝑥 = 𝑢 + 𝜇, 𝑚(𝑡) = 1 𝜎√2𝜋∫ 𝑒 𝑡(𝑢+𝜇)𝑒−𝑢2/(2𝜎2) 𝑑𝑢 ∞ −∞ = 1 𝜎√2𝜋∫ exp [(𝑢 + 𝜇)𝑡 − 𝑢2 2𝜎2] 𝑑𝑢 ∞ −∞ = 1 𝜎√2𝜋∫ exp [ −𝑢2+ 2𝜎2(𝑢 + 𝜇)𝑡 2𝜎2 ] 𝑑𝑢 ∞ −∞
Kalikan dengan 𝑒𝑡2𝜎2/2/𝑒𝑡2𝜎2/2 dan melengkapkan kuadrat, 𝑚(𝑡) = 𝑒𝜇𝑡𝑒𝑡2𝜎2/2∫ exp [−(1/2𝜎 2)(𝑢2− 2𝜎2𝑡𝑢 + 𝜎4𝑡2)] 𝜎√2𝜋 𝑑𝑢 ∞ −∞ = 𝑒𝜇𝑡+(𝑡2𝜎2/2)∫ exp [−(𝑢 − 𝜎 2𝑡)2/2𝜎2] 𝜎√2𝜋 𝑑𝑢. ∞ −∞
Oleh karena integral tersebut adalah integral dari fungsi densitas Normal dengan rata-rata 𝜎2𝑡 dan variansi 𝜎2, maka integral tersebut bernilai 1. Jadi, fungsi pembangkit momen dari 𝑋 adalah
𝑚(𝑡) = 𝑒𝜇𝑡+(𝑡2𝜎2/2).
Definisi 2.1.8. Variabel acak 𝑋 didefinisikan berdistribusi Gamma dengan parameter 𝛼 > 0 dan 𝛽 > 0 jika dan hanya jika fungsi densitas 𝑋 adalah
𝑓(𝑥) = { 𝑥𝛼−1𝑒− 𝑥 𝛽 𝛽𝛼Γ(𝛼) , 0 ≤ 𝑥 ≤ ∞ 0, selainnya, dengan Γ(𝛼) = ∫ 𝑥𝛼−1𝑒−𝑥 ∞ 0 𝑑𝑥.
Definisi 2.1.9. Misalkan 𝑣 adalah bilangan bulat positif. Variabel acak 𝑋 dikatakan berdistribusi Chi-Square dengan derajat bebas 𝑣 jika dan hanya jika 𝑋 adalah variabel acak berdistribusi Gamma dengan parameter 𝛼 = 𝑣/2 dan 𝛽 = 2.
Contoh 2.1.2. Misalkan 𝑋 adalah variabel acak berdistribusi Chi-Square dengan rata-rata 𝑣 dan variansi 2𝑣. Tentukan fungsi pembangkit momen untuk 𝑋.
Penyelesaian:
Fungsi probabilitas Chi-Square dengan rata-rata 𝑣 dan variansi 2𝑣 adalah
𝑓(𝑥) =𝑥
(𝑣/2)−1𝑒−𝑥/2
2𝑣/2Γ(𝑣/2) , 𝑥 > 0 Fungsi pembangkit momen dari 𝑋 adalah
𝑚(𝑡) = 𝐸(𝑒𝑡𝑥) = ∫ 𝑒𝑡𝑥𝑥(𝑣/2)−1𝑒−𝑥/2 2𝑣/2Γ(𝑣/2) ∞ 0 𝑑𝑥 = 1 2𝑣/2Γ(𝑣/2)∫ 𝑒 − (1−2𝑡)𝑥2 𝑥(𝑣/2) 𝑥 ∞ 0 𝑑𝑥 Misalkan 𝑡 <1 2, 𝑢 = (1 − 2𝑡)𝑥 𝑑𝑢 = (1 − 2𝑡)𝑑𝑥 𝑚(𝑡) = 1 2𝑣/2Γ(𝑣/2)∫ 𝑒 − 𝑢2( 𝑢 1 − 2𝑡) 𝑣/2 ∞ 0 (1 𝑢) 𝑑𝑢 = (1 − 2𝑡)−𝑣/2∫ 𝑒 − 𝑢 2𝑢(𝑣/2)−1 2𝑣/2Γ(𝑣/2) ∞ 0 𝑑𝑢
Oleh karena integral tersebut adalah integral dari fungsi densitas Gamma dengan parameter 𝛼 = 𝑣/2 dan 𝛽 = 2, maka menurut definisi fungsi probabilitas (definisi 2.1.5), integral bersebut bernilai 1. Jadi, fungsi pembangkit momen dari 𝑋 adalah
Teorema 2.1.2. Teorema Ketunggalan: Misalkan 𝑚𝑋(𝑡) dan 𝑚𝑌(𝑡) adalah fungsi pembangkit momen dari variabel acak 𝑋 dan 𝑌. Jika kedua fungsi pembangkit momen ada dan 𝑚𝑋(𝑡) = 𝑚𝑌(𝑡), untuk setiap nilai 𝑡, maka 𝑋 dan 𝑌 mempunyai distribusi probabilitas yang sama.
Bukti dapat dilihat pada skripsi Julie, Hongkie (1999) yang berjudul Teorema Limit Pusat dan Terapannya.
Contoh 2.1.3. Misalkan 𝑍 adalah variabel acak berdistribusi Normal dengan rata-rata 0 dan variansi 1. Gunakan metode fungsi pembangkit momen untuk menemukan distribusi probabilitas dari 𝑍2.
Penyelesaian:
Fungsi pembangkit momen dari 𝑍2 adalah
𝑚𝑍2(𝑡) = 𝐸(𝑒𝑡𝑍2) = ∫ 𝑒𝑡𝑧2𝑓(𝑧) 𝑑𝑧 ∞ −∞ = ∫ 𝑒𝑡𝑧2𝑒 −𝑧2/2 √2𝜋 𝑑𝑧 ∞ −∞ = ∫ 1 √2𝜋𝑒 −(𝑧2/2)(1−2𝑡) 𝑑𝑧. ∞ −∞
Jika (1 − 2𝑡) > 0 (𝑡 < 1/2), integrand dari exp [− (𝑧2 2) (1 − 2𝑡)] √2𝜋 = exp [− (𝑧2 2) (1 − 2𝑡)⁄ −1] √2𝜋
identik dengan fungsi probabilitas variabel acak Normal dengan rata-rata 0 dan variansi (1 − 2𝑡)−1. Untuk membuat integralnya sama dengan 1, kalikan dengan standar deviasinya, yaitu (1 − 2𝑡)−1/2, sehingga
𝑚𝑍2(𝑡) = 1 (1 − 2𝑡)1/2∫ 1 √2𝜋(1 − 2𝑡)−1/2exp [− (𝑧 2 2) (1 − 2𝑡) −1 ⁄ ] 𝑑𝑧. ∞ −∞
𝑚𝑍2(𝑡) = 1
(1 − 2𝑡)1/2 = (1 − 2𝑡)−1/2.
Oleh karena fungsi pembangkit momen untuk 𝑍2 identik dengan fungsi pembangkit momen untuk variabel acak Chi-Square dengan derajat bebas 𝑣 = 1 (contoh 2.1.2), maka menurut Teorema Ketunggalan, 𝑍2 berdistribusi Chi-Square dengan derajat bebas 1. Dengan demikian, fungsi probabilitas untuk 𝑈 = 𝑍2 adalah
𝑓𝑈(𝑢) = {
𝑢−1/2𝑒−𝑢/2
Γ(1/2)√2 , 𝑢 ≥ 0 0, selainnya.
Contoh 2.1.4. Misalkan 𝑋 adalah variabel acak berdistribusi Normal dengan rata-rata 𝜇 dan variansi 𝜎2. Tunjukkan bahwa
𝑍 =𝑋 − 𝜇 𝜎
berdistribusi Normal Standar dengan rata-rata 0 dan variansi 1. Penyelesaian:
Dari contoh 2.1.1, fungsi pembangkit momen dari 𝑋 adalah 𝑒𝜇𝑡+(𝑡2𝜎2/2).
Dengan cara yang sama, fungsi pembangkit momen dari 𝑋 − 𝜇 adalah 𝑒𝑡2𝜎2/2, sehingga
𝑚𝑍(𝑡) = 𝐸(𝑒𝑡𝑍) = 𝐸(𝑒(𝑡/𝜎)(𝑋−𝜇)) = 𝑚𝑋−𝜇(𝑡 𝜎) = 𝑒
(𝑡/𝜎)2𝜎2/2= 𝑒𝑡2/2.
Oleh karena 𝑚𝑍(𝑡) identik dengan fungsi pembangkit momen dari variabel acak Normal Standar, maka 𝑍 berdistribusi Normal Standar dengan 𝐸(𝑍) = 0 dan 𝑉(𝑍) = 1.
Teorema 2.1.3. Misalkan 𝑋1, 𝑋2, … , 𝑋𝑛 adalah variabel acak yang saling bebas dengan fungsi pembangkit momen 𝑚𝑋1(𝑡), 𝑚𝑋2(𝑡),…, 𝑚𝑋𝑛(𝑡). Jika 𝑈 = 𝑋1+ 𝑋2+ ⋯ + 𝑋𝑛, maka
𝑚𝑈(𝑡) = 𝑚𝑋1(𝑡) x 𝑚𝑋2(𝑡) x … x 𝑚𝑋𝑛(𝑡). Bukti:
Karena variabel acak 𝑋1, 𝑋2, … , 𝑋𝑛 saling bebas, maka
𝑚𝑈(𝑡) = 𝐸(𝑒𝑡(𝑋1+𝑋2+⋯+𝑋𝑛)) = 𝐸(𝑒𝑡𝑋1𝑒𝑡𝑋2… 𝑒𝑡𝑋𝑛) = 𝐸(𝑒𝑡𝑋1) x 𝐸(𝑒𝑡𝑋2) x … x 𝐸(𝑒𝑡𝑋𝑛).
Dengan definisi fungsi pembangkit momen,
𝑚𝑈(𝑡) = 𝑚𝑋1(𝑡) x 𝑚𝑋2(𝑡) x … x 𝑚𝑋𝑛(𝑡). ∎
Teorema 2.1.4. Misalkan 𝑋1, 𝑋2, … , 𝑋𝑛 adalah variabel acak saling bebas yang berdistribusi Normal dengan 𝐸(𝑋𝑖) = 𝜇𝑖, 𝑉(𝑋𝑖) = 𝜎𝑖2, untuk 𝑖 = 1,2, … , 𝑛 dan 𝑎1, 𝑎2,…, 𝑎𝑛 adalah konstanta. Jika
𝑈 = ∑ 𝑎𝑖𝑋𝑖 =
𝑛
𝑖=1
𝑎1𝑋1+ 𝑎2𝑋2 + ⋯ + 𝑎𝑛𝑋𝑛,
maka U adalah variabel acak berdistribusi Normal dengan
𝐸(𝑈) = ∑ 𝑎𝑖𝜇𝑖 𝑛 𝑖=1 = 𝑎1𝜇1+ 𝑎2𝜇2+ ⋯ + 𝑎𝑛𝜇𝑛 dan 𝑉(𝑈) = ∑ 𝑎𝑖2𝜎𝑖2 𝑛 𝑖=1 = 𝑎12𝜎12+ 𝑎22𝜎22+ ⋯ + 𝑎𝑛2𝜎𝑛2.
Bukti:
Dari contoh 2.1.1, fungsi pembangkit momen dari 𝑋 adalah 𝑒𝜇𝑡+(𝑡2𝜎2/2).
Karena 𝑋𝑖 berdistribusi Normal dengan rata-rata 𝜇𝑖 dan variansi 𝜎𝑖2, maka fungsi pembangkit momen dari 𝑋𝑖 adalah
𝑚𝑋𝑖(𝑡) = exp (𝜇𝑖𝑡 +𝜎𝑖
2𝑡2 2 ). Fungsi pembangkit momen dari 𝑎𝑖𝑋𝑖 adalah
𝑚𝑎𝑖𝑋𝑖(𝑡) = 𝐸(𝑒𝑡𝑎𝑖𝑋𝑖) = 𝑚𝑋𝑖(𝑎𝑖𝑡) = exp (𝜇𝑖𝑎𝑖𝑡 +𝑎𝑖
2𝜎𝑖2𝑡2 2 ).
Karena variabel acak 𝑋𝑖 saling bebas dan 𝑎𝑖𝑋𝑖 saling bebas, untuk 𝑖 = 1,2, … , 𝑛, maka menurut teorema 2.1.3,
𝑚𝑈(𝑡) = 𝑚𝑎1𝑋1(𝑡) x 𝑚𝑎2𝑋2(𝑡) x … x 𝑚𝑎𝑛𝑋𝑛(𝑡) = exp (𝜇1𝑎1𝑡 +𝑎1 2𝜎12𝑡2 2 ) x … x exp (𝜇𝑛𝑎𝑛𝑡 + 𝑎𝑛2𝜎𝑛2𝑡2 2 ) = exp (𝑡 ∑ 𝑎𝑖𝜇𝑖 𝑛 𝑖=1 +𝑡 2 2 ∑ 𝑎𝑖 2𝜎𝑖2 𝑛 𝑖=1 ).
Oleh karena 𝑚𝑈(𝑡) identik dengan fungsi pembangkit momen dari distribusi Normal, maka menurut Teorema Ketunggalan, 𝑈 mempunyai distribusi Normal dengan rata-rata ∑𝑛𝑖=1𝑎𝑖𝜇𝑖 dan variansi ∑𝑛 𝑎𝑖2𝜎𝑖2
B. Distribusi Sampling
Fokus utama statistika inferensial berkaitan dengan generalisasi dan prediksi. Sebagai contoh, mesin minuman ringan dirancang untuk mengeluarkan minuman dengan rata-rata 240 mililiter per minuman. Perusahaan minuman tersebut menghitung rata-rata 40 minuman dan diperoleh rata-ratanya 𝑥̅ = 236 mililiter. Berdasarkan nilai tersebut, perusahaan memutuskan bahwa mesin masih mengeluarkan minuman dengan rata-rata 𝜇 = 240 mililiter. Empat puluh minuman mewakili sampel dari populasi tak hingga minuman yang akan dikeluarkan mesin.
Dari contoh di atas, statistik dihitung dari sampel yang dipilih dari populasi. Statistik juga menghasilkan berbagai pernyataan yang dibuat mengenai nilai-nilai parameter populasi yang mungkin atau mungkin tidak benar. Perusahaan minuman tersebut membuat keputusan bahwa minuman ringan mengeluarkan minuman dengan rata-rata 240 mililiter, meskipun rata-rata sampelnya 236 mililiter. Perusahaan tersebut membuat keputusan itu berdasarkan teori sampling.
Karena statistik adalah variabel acak yang bergantung hanya pada sampel yang diamati, maka statistik harus memiliki distribusi probabilitas. Distribusi probabilitas dari statistik inilah yang dinamakan distribusi sampling. Distribusi sampling dari statistik tergantung pada distribusi populasi, ukuran sampel dan metode pemilihan sampel. Distribusi sampling 𝑋̅ dinamakan distribusi sampling dari rata-rata. Distribusi sampling 𝑋̅ dengan ukuran sampel 𝑛 adalah distribusi yang terjadi ketika percobaan dilakukan berulang dan banyak nilai-nilai hasil 𝑋̅.
Distribusi sampling 𝑋̅ menggambarkan variabilitas rata-rata sampel sekitar rata-rata populasi 𝜇. Pada kasus mesin minuman ringan, pengetahuan tentang distribusi sampling 𝑋̅ memberikan perbedaan yang khas antara nilai 𝑥̅ yang diamati dan nilai rata-rata (𝜇) sebenarnya. Prinsip yang sama juga berlaku pada distribusi 𝑆2. Distribusi sampling ini menghasilkan nilai-nilai variabilitas variansi sampel 𝑠2 di sekitar variansi populasi 𝜎2, khususnya dalam percobaan berulang.
Teorema 2.2.1. Misalkan 𝑋1, 𝑋2, … , 𝑋𝑛 adalah sampel acak saling bebas berukuran 𝑛 dari distribusi Normal dengan rata-rata 𝜇 dan variansi 𝜎2. Statistik
𝑋̅ =1 𝑛∑ 𝑋𝑖
𝑛
𝑖=1
akan berdistribusi Normal dengan rata-rata 𝜇𝑋̅ = 𝜇 dan variansi 𝜎𝑋̅2 = 𝜎2/𝑛.
Bukti: Karena 𝑋1, 𝑋2, … , 𝑋𝑛 adalah sampel acak dari distribusi Normal dengan rata-rata 𝜇, variansi 𝜎2 dan 𝑋𝑖, 𝑖 = 1,2, … , 𝑛 juga saling bebas dengan 𝐸(𝑋𝑖) = 𝜇 dan 𝑉(𝑋𝑖) = 𝜎2, maka 𝑋̅ =1 𝑛∑ 𝑋𝑖 𝑛 𝑖=1 = 1 𝑛(𝑋1) + 1 𝑛(𝑋2) + ⋯ + 1 𝑛(𝑋𝑛) = 𝑎1𝑋1+ 𝑎2𝑋2 + ⋯ + 𝑎𝑛𝑋𝑛, di mana 𝑎𝑖 = 1 𝑛, 𝑖 = 1,2, … , 𝑛. Menurut teorema 2.1.4, karena 𝑋̅ dapat dinyatakan sebagai kombinasi linear dari 𝑋1, 𝑋2, … , 𝑋𝑛, maka 𝑋̅ berdistribusi Normal dengan
𝜇𝑋̅ = 𝐸(𝑋̅) = 𝐸[𝑎1𝑋1+ ⋯ + 𝑎𝑛𝑋𝑛] = 𝑎1𝐸(𝑋1) + ⋯ + 𝑎𝑛𝐸(𝑋𝑛) = 1 𝑛(𝜇) + ⋯ +1 𝑛(𝜇) =1 𝑛(𝑛𝜇) = 𝜇 dan 𝜎𝑋̅2 = 𝑉(𝑋̅) = 𝑉[𝑎1𝑋1+ ⋯ + 𝑎𝑛𝑋𝑛] = 𝑎1𝑉(𝑋1) + ⋯ + 𝑎𝑛𝑉(𝑋𝑛) = 1 𝑛2(𝜎2) + ⋯ + 1 𝑛2(𝜎2) = 1 𝑛2(𝑛𝜎2) =𝜎 2 𝑛 . ∎
Contoh 2.2.1. Sebuah mesin pengisi botol minuman dapat diatur sehingga debit rata-ratanya 𝜇 ons per botol. Telah diamati bahwa jumlah isian tiap botol berdistribusi Normal dengan standar deviasi 𝜎 = 1 ons. Sampel pengisian botol berukuran 𝑛 = 9 dipilih secara acak dari keluaran mesin pada hari tertentu (semua botol dengan pengaturan mesin yang sama) dan masing-masing botol diukur debitnya. Tentukan probabilitas bahwa rata-rata sampel akan berada dalam 0.3 ons rata-rata sebenarnya 𝜇 untuk pengaturan mesin yang dipilih.
Penyelesaian:
Misalkan 𝑋1, 𝑋2, … , 𝑋𝑛 adalah banyaknya botol yang akan diamati debitnya dan 𝑋𝑖, 𝑖 = 1,2, … ,9 berdistribusi Normal dengan rata-rata 𝜇 dan variansi 𝜎2 = 1. Berdasarkan teorema 2.2.1, 𝑋̅ memiliki distribusi sampling yang Normal dengan rata-rata 𝜇𝑋̅ = 𝜇 dan variansi 𝜎𝑋̅2 =𝜎2
𝑛 = 1/9. 𝑃(|𝑋̅ − 𝜇| ≤ 0.3) = 𝑃[−0.3 ≤ 𝑋̅ − 𝜇 ≤ 0.3] = 𝑃 (−0.3 𝜎/√𝑛≤ 𝑋̅−𝜇 𝜎/√𝑛≤ 0.3 𝜎/√𝑛).
Karena (𝑋̅ − 𝜇𝑋̅)/𝜎𝑋̅ = (𝑋̅ − 𝜇)/(𝜎/√𝑛) berdistribusi Normal Standar, maka
𝑃(|𝑋̅ − 𝜇| ≤ 0.3) = 𝑃 (−0.3 1/√9≤ 𝑍 ≤ 0.3 1/√9) = 𝑃(−0.9 ≤ 𝑍 ≤ 0.9) = 1 − 2𝑃(𝑍 > 0.9) = 1 − 2(0.1841) = 0.6318.
Dengan demikian, probabilitas bahwa rata-rata sampel akan berada dalam 0.3 ons dari rata-rata populasi sebenarnya hanyalah 0.6318.
Teorema 2.2.2. Misalkan 𝑋 dan 𝑋1, 𝑋2, 𝑋3,… adalah variabel acak dengan fungsi pembangkit momen 𝑚(𝑡) dan 𝑚1(𝑡), 𝑚2(𝑡), 𝑚3(𝑡),…, 𝑚𝑛(𝑡).
Jika
lim
𝑛→∞𝑚𝑛(𝑡) = 𝑚(𝑡) , ∀𝑡 ∈ ℝ
maka fungsi distribusi dari 𝑋𝑛 konvergen ke fungsi distribusi dari 𝑋.
Bukti dapat dilihat pada buku Probability with Martingales karangan Williams, David (1991) halaman 185.
Teorema 2.2.3. Teorema Limit Pusat: Jika 𝑋̅ adalah rata-rata sampel acak berukuran 𝑛 yang diambil dari populasi dengan rata-rata 𝜇 dan variansi berhingga 𝜎2, maka bentuk limit dari distribusi
𝑍 = 𝑋̅ − 𝜇 𝜎/√𝑛,
konvergen ke fungsi distribusi Normal Standar 𝑛(𝑧; 0,1), ketika 𝑛 → ∞. Bukti: Misalkan 𝑈𝑛 = 𝑋̅ − 𝜇 𝜎/√𝑛 = 1 √𝑛( ∑𝑛𝑖=1𝑋𝑖− 𝑛𝜇 𝜎 ) = 1 √𝑛∑ 𝑍𝑖 𝑛 𝑖=1 , dengan 𝑍𝑖 =𝑋𝑖 − 𝜇 𝜎 .
Karena variabel acak 𝑋𝑖 saling bebas dan berdistribusi Normal, maka menurut contoh 2.1.4, 𝑍𝑖, 𝑖 = 1,2, … , 𝑛 juga saling bebas dan berdistribusi Normal dengan rata-rata 𝐸(𝑍𝑖) = 0 dan variansi 𝑉(𝑍𝑖) = 1.
Karena fungsi pembangkit momen dari jumlahan variabel acak yang saling bebas adalah hasil kali masing-masing fungsi pembangkit momennya, maka
𝑚∑ 𝑍𝑖(𝑡) = 𝑚𝑍1(𝑡) x 𝑚𝑍2(𝑡) x … x 𝑚𝑍𝑛(𝑡) = [𝑚𝑍1(𝑡)]𝑛 dan 𝑚𝑈𝑛(𝑡) = 𝑚∑ 𝑍𝑖( 𝑡 √𝑛) = [𝑚𝑍1( 𝑡 √𝑛)] 𝑛 .
Oleh karena deret Taylor di sekitar 0 dengan suku sisa bentuk Lagrange adalah
𝑚𝑍1(𝑡) = 𝑚𝑍1(0) + 𝑚′𝑍1(0)𝑡 + 𝑚′′𝑍1(𝜉)𝑡
2
2 , 0 < 𝜉 < 𝑡 dan karena 𝑚𝑍1(0) = 𝐸(𝑒0𝑍1) = 𝐸(1) = 1 dan 𝑚′𝑍1(0) = 𝐸(𝑍1) = 0,
𝑚𝑍1(𝑡) = 1 + 𝑚′′𝑍1(𝜉)𝑡 2 2 sehingga 𝑚𝑈𝑛(𝑡) = [1 +𝑚 ′′ 𝑍1(𝜉𝑛) 2 ( 𝑡 √𝑛) 2 ] 𝑛 = [1 +𝑚′′𝑍1(𝜉𝑛)𝑡2/2 𝑛 ] 𝑛 , 0 < 𝜉𝑛 < 𝑡 √𝑛 . Ketika 𝑛 → ∞, 𝜉𝑛 → 0, maka 𝑚′′𝑍1(𝜉𝑛)𝑡2/2 → 𝑚′′𝑍1(0)𝑡2/2 = 𝐸(𝑍12)𝑡2/2 = 𝑡2/2, dengan 𝐸(𝑍12) = 𝑉(𝑍1) = 1. Dipandang lim 𝑛→∞𝑏𝑛 = 𝑏, maka lim 𝑛→∞(1 +𝑏𝑛 𝑛)𝑛 = 𝑒𝑏. (2.1)
Berdasarkan persamaan (𝟐. 𝟏) diperoleh lim 𝑛→∞𝑚𝑈𝑛(𝑡) = lim 𝑛→∞(1 +𝑚′′𝑍1(𝜉𝑛)𝑡2/2 𝑛 ) 𝑛 = 𝑒𝑡2/2.
Dari contoh 2.1.4, 𝑒𝑡2/2 identik dengan fungsi pembangkit momen untuk variabel acak Normal Standar. Jadi, menurut teorema 2.2.2, fungsi distribusi 𝑈𝑛 konvergen ke fungsi distribusi dari variabel acak Normal Standar. ∎
Pendekatan distribusi Normal untuk 𝑋̅ akan bagus secara umum untuk ukuran sampel 𝑛 ≥ 30. Jika 𝑛 < 30, pendekatan baik hanya jika populasinya tidak terlalu berbeda dari distribusi Normal. Jika populasinya diketahui Normal, maka distribusi sampling dari 𝑋̅ akan mengikuti distribusi Normal persis, tidak peduli seberapa kecil ukuran sampel. Ukuran sampel 𝑛 = 30 adalah pedoman untuk menggunakan teorema 2.2.3 (Teorema Limit Pusat).
Contoh 2.2.2. Firma listrik memproduksi bola lampu yang memiliki waktu hidupnya mendekati distribusi Normal, dengan rata-rata sebesar 800 jam dan standar deviasi 40 jam. Tentukan probabilitas bahwa sampel acak dari 16 lampu akan memiliki rata-rata hidup kurang dari 775 jam.
Penyelesaian: Misalkan 𝑋̅ adalah lamanya hidup bola lampu yang berdistribusi Normal dengan 𝜇𝑋̅ = 800 dan 𝜎𝑋̅ = 40
√16= 10.
Probabilitas bahwa sampel acak dari 16 lampu akan memiliki rata-rata hidup kurang dari 775 jam adalah
𝑃(𝑋̅ < 775) = 𝑃 (𝑋̅ − 800 40/√16 <
775 − 800
10 ) = 𝑃(𝑍 < −2.5) = 0.0062. Gagasan umum distribusi sampling dan Teorema Limit Pusat sering digunakan untuk menghasilkan bukti tentang beberapa aspek penting dari distribusi, seperti parameter dari distribusi. Pada Teorema Limit Pusat, parameter yang menarik adalah rata-rata populasi 𝜇. Selain itu, penentuan nilai wajar dari rata-rata populasi 𝜇 adalah salah satu aplikasi yang paling penting dari Teorema Limit Pusat. Topik seperti pengujian hipotesis, pendugaan selang, kualitas kontrol dan lainnya memanfaatkan Teorema Limit Pusat. Contoh berikut menggambarkan penggunaan Teorema Limit Pusat yang berkaitan dengan rata-rata populasi serta penarikan kesimpulan menggunakan distribusi sampling dari 𝑋̅.
Contoh 2.2.3. Suatu proses manufaktur menghasilkan komponen silinder suku cadang untuk industri otomotif. Dalam proses tersebut diproduksi komponen yang memiliki diameter rata-rata 5 milimeter. Insinyur menduga bahwa rata-rata populasinya adalah 5 milimeter. Sebuah percobaan dilakukan pada 100 komponen yang dihasilkan oleh proses secara acak dan masing-masing komponen diukur diameternya. Diketahui bahwa standar deviasi populasi 𝜎 = 0.1 milimeter. Hasil percobaan menunjukkan diameter rata-rata sampel 𝑥̅ = 5.027 milimeter. Apakah informasi sampel ini muncul untuk mendukung atau menyangkal dugaan insinyur?
Penyelesaian: Contoh ini merefleksikan berbagai masalah yang sering diajukan dan diselesaikan dengan pengujian hipotesis. Pengujian hipotesis sendiri akan dibahas pada subbab selanjutnya. Untuk menyelesaikan masalah ini, prinsip distribusi sampling dan logika digunakan.
Jika probabilitas data menunjukkan bahwa nilai 𝑥̅ = 5.027 berbeda jauh dari rata-rata populasi (probabilitas mendekati 1), maka dugaan insinyur tersebut
tidak terbantahkan. Sebaliknya, jika probabilitas cukup kecil, maka data tidak mendukung dugaan bahwa 𝜇 = 5. Dengan kata lain, jika rata-rata populasi 𝜇 = 5, berapa probabilitas bahwa rata-rata sampel 𝑋̅ akan menyimpang sebanyak 0.027 milimeter?
Dengan Teorema Limit Pusat, probabilitasnya adalah
𝑃(|𝑋̅ − 5| ≥ 0.027) = 𝑃(𝑋̅ − 5 ≥ 0.027) + 𝑃(𝑋̅ − 5 ≤ −0.027)
= 2𝑃 (𝑋̅−50.1 √100
≥ 2.7) = 2𝑃(𝑍 ≥ 2.7)
= 2(0.0035) = 0.007.
Oleh karena itu, percobaan tersebut dengan 𝑥̅ = 5.027 tidak memberikan bukti pendukung untuk berspekulasi bahwa 𝜇 = 5. Jadi, dugaan insinyur tersebut dapat dibantah.
Teorema 2.2.4. Misalkan 𝑋1, 𝑋2, … , 𝑋𝑛 adalah sampel acak yang berdistribusi Normal dengan rata-rata 𝜇 dan variansi 𝜎2, maka statistik
𝑊 =(𝑛 − 1)𝑆2
𝜎2 = 1
𝜎2∑(𝑋𝑖 − 𝑋̅)2
𝑛
𝑖=1
berdistribusi Chi-Square dengan derajat bebas (𝑛 − 1). Dengan demikian, 𝑋̅ dan 𝑆2 adalah variabel acak saling bebas.
Bukti: Pembuktian akan dilakukan secara khusus, yaitu untuk 𝑛 = 2. Untuk kasus 𝑛 = 2,
𝑋̅ = (1/2)(𝑋1+ 𝑋2) dan
𝑆2 = 1 2 − 1∑(𝑋𝑖 − 𝑋̅) 2 2 𝑖=1 = [𝑋1− (1 2) (𝑋1+ 𝑋2)]2+ [𝑋2− (1 2) (𝑋1+ 𝑋2)]2 = [1 2(𝑋1− 𝑋2)]2+ [1 2(𝑋2− 𝑋1)]2 = 2 [1 2(𝑋1− 𝑋2)]2 = (𝑋1−𝑋2)2 2
Dengan demikian, untuk 𝑛 = 2,
𝑊 =(𝑛 − 1)𝑆2 𝜎2 =(𝑋1− 𝑋2)2 2𝜎2 = (𝑋1− 𝑋2 √2𝜎2 ) 2 .
Menurut teorema 2.1.4, karena 𝑋1 − 𝑋2 adalah kombinasi linear yang saling bebas, maka variabel acak 𝑋1− 𝑋2 berdistribusi Normal (𝑋1 − 𝑋2 = 𝑎1𝑋1+𝑎2𝑋2, dengan 𝑎1 = 1 dan 𝑎2 = −1) dengan rata-rata
1𝜇 − 1𝜇 = 0 dan variansi (1)2𝜎2+ (−1)2𝜎2 = 2𝜎2. Oleh karena 𝑍 = 𝑋1− 𝑋2 √2𝜎2
berdistribusi Normal Standar, maka menurut Teorema Ketunggalan (lihat contoh 2.1.3), untuk 𝑛 = 2, 𝑊 =(𝑛 − 1)𝑆2 𝜎2 = (𝑋1 − 𝑋2 √2𝜎2 ) 2 = 𝑍2
Untuk membuktikan 𝑋̅ dan 𝑆2 adalah variabel acak saling bebas, maka misalkan 𝑈1 = (𝑋1+ 𝑋2)/𝜎 dan 𝑈2 = (𝑋1− 𝑋2)/𝜎 adalah variabel acak saling bebas, sehingga 𝑋̅ =𝑋1+𝑋2 2 = 𝜎𝑈1 2 dan 𝑆2 = (𝑋1−𝑋2)2 2 = (𝜎𝑈2)2 2 .
Karena 𝑋̅ adalah fungsi dari 𝑈1 dan 𝑆2 adalah fungsi dari 𝑈2, maka bebas 𝑈1 dan 𝑈2 mengakibatkan 𝑋̅ dan 𝑆2 saling bebas. ∎
Asumsi pada Teorema Limit Pusat dan distribusi Normal adalah standar deviasi (𝜎) diketahui. Asumsi ini mungkin tidak masuk akal dalam situasi praktis. Namun, dalam banyak skenario percobaan, pengetahuan 𝜎 tentu tidak lebih masuk akal dari pengetahuan tentang rata-rata populasi 𝜇. Seringkali, pada kenyataannya, pendugaan 𝜎 harus diberikan oleh informasi sampel yang sama dalam menghasilkan rata-rata sampel 𝑥̅. Akibatnya, statistik yang digunakan untuk menarik kesimpulan pada 𝜇 adalah
𝑇 = 𝑋̅ − 𝜇 𝑆/√𝑛.
Definisi 2.2.1. Misalkan 𝑍 adalah variabel acak berdistribusi Normal Standar dan 𝑊 adalah variabel acak berdistribusi Chi-Square dengan derajat bebas 𝑣. Jika 𝑍 dan 𝑊 saling bebas, maka distribusi dari variabel acak 𝑇, dengan
𝑇 = 𝑍
√𝑊/𝑣 adalah distribusi 𝑡 dengan derajat bebas 𝑣 = 𝑛 − 1.
Teorema 2.2.5. Jika 𝑋1, 𝑋2, … , 𝑋𝑛 merupakan sampel acak dari populasi berdistribusi Normal dengan rata-rata 𝜇, variansi 𝜎2 dan
𝑋̅ =1
𝑛∑𝑛𝑖=1𝑋𝑖 dan 𝑆2 = 1
𝑛−1∑𝑛𝑖=1(𝑋𝑖 − 𝑋̅)2, maka variabel acak 𝑇 = 𝑋̅−𝜇
𝑆/√𝑛 berdistribusi 𝑡 dengan derajat bebas 𝑣 = 𝑛 − 1.
Bukti: Misalkan
𝑍 = 𝑋̅ − 𝜇 𝜎/√𝑛 berdistribusi Normal Standar dan
𝑊 = (𝑛 − 1)𝑆2
𝜎2
berdistribusi Chi-Square dengan derajat bebas 1.
Karena 𝑍 dan 𝑊 saling bebas, maka menurut teorema 2.2.4, 𝑋̅ dan 𝑆2 juga saling bebas. Jadi, dengan definisi 2.2.1 diperoleh
𝑇 = 𝑍 √𝑊/𝑣= (𝑋̅ − 𝜇)/(𝜎/√𝑛) √[(𝑛 − 1)𝑆2/𝜎2]/(𝑛 − 1)= 𝑋̅ − 𝜇 𝑆/√𝑛, berdistribusi 𝑡 dengan derajat bebas n-1. ∎
Jika ukuran sampel kecil, nilai-nilai 𝑆2 berfluktuasi dari sampel ke sampel dan distribusi 𝑇 cukup menyimpang dari distribusi Normal Standar. Jika ukuran sampel cukup besar (𝑛 ≥ 30), maka distribusi 𝑇 tidak berbeda jauh dari distribusi Normal Standar. Namun, untuk 𝑛 < 30, penggunaan distribusi 𝑇 akan lebih akurat daripada distribusi Normal Standar.
Contoh 2.2.4. Seorang ahli kimia mengklaim bahwa rata-rata populasi hasil proses batch tertentu adalah 500 gram per mililiter bahan baku. Untuk memeriksa klaim ini, ahli tersebut mengambil sampel sebanyak 25 batch setiap bulan. Jika nilai 𝑡 jatuh antara −𝑡0.05 dan 𝑡0.05, ahli tersebut puas dengan klaimnya. Kesimpulan apa yang ia tarik dari sampel yang memiliki rata-rata 𝑥̅ = 518 gram per mililiter dan standar deviasi sampel 𝑠 = 40 gram? Asumsikan distribusi hasil mendekati Normal.
Penyelesaian: Dari tabel distribusi 𝑡 diperoleh 𝑡0.05= 1.711 dengan derajat bebas 24. Ahli tersebut dapat puas dengan klaimnya jika sampel 25 batch menghasilkan nilai 𝑡 antara -1.711 dan 1.711. Jika 𝜇 = 500, maka
𝑡 =518 − 500
40/√25 = 2.25,
nilai tersebut di atas 1.711. Probabilitas nilai 𝑡, dengan 𝑣 = 24, sama atau lebih besar dari 2.25 adalah sekitar 0.02. Jika 𝜇 > 500, maka nilai 𝑡 yang dihitung dari sampel akan lebih masuk akal. Oleh karena itu, ahli tersebut cenderung menyimpulkan bahwa proses batch menghasilkan produk yang lebih baik daripada klaimnya.
Distribusi Sampling Perbedaan antara Dua Rata-Rata
Pada contoh sebelumnya, distribusi sampling hanya berpusat pada rata-rata tunggal 𝜇, khususnya untuk sampel berukuran besar (𝑛 ≥ 30) maupun sampel berukuran kecil (𝑛 < 30). Lebih jauh lagi, distribusi sampling tidak hanya berpusat pada rata-rata satu populasi, tetapi melibatkan dua populasi. Peneliti akan lebih tertarik dalam membandingkan percobaan yang melibatkan dua metode perbandingan. Dasar untuk perbandingannya adalah 𝜇1− 𝜇2, perbedaan pada rata-rata populasi.
Misalkan ada dua populasi, populasi pertama dengan rata-rata 𝜇1 dan variansi 𝜎12, populasi kedua dengan rata-rata 𝜇2 dan variansi 𝜎22. Statistik 𝑋̅1 merepresentasikan rata-rata dari sampel acak berukuran 𝑛1 yang dipilih dari populasi pertama. Statistik 𝑋̅2 merepresentasikan rata-rata dari sampel acak berukuran 𝑛2 yang dipilih dari populasi kedua dan saling bebas dengan sampel dari populasi pertama. Menurut Teorema Limit Pusat, variabel 𝑋̅1 mendekati distribusi Normal dengan rata-rata 𝜇1 dan variansi 𝜎12/𝑛1 serta variabel 𝑋̅2 mendekati distribusi Normal dengan rata-rata 𝜇2 dan variansi 𝜎22/𝑛2.
Oleh karena 𝑋̅1 dan 𝑋̅2 saling bebas, maka
𝑋̅1− 𝑋̅2 = 𝑎1𝑋̅1+ 𝑎2𝑋̅2, dengan 𝑎1 = 1 dan 𝑎2 = −1 mendekati distribusi Normal dengan rata-rata
𝜇𝑋̅1−𝑋̅2 = 𝜇𝑋̅1− 𝜇𝑋̅2 = 𝜇1− 𝜇2 dan variansi 𝜎𝑋̅1−𝑋̅22 = 𝜎𝑋̅12+ 𝜎𝑋̅22 =𝜎1 2 𝑛1 + 𝜎22 𝑛2.
Teorema 2.2.6. Jika sampel berukuran 𝑛1 dan 𝑛2 yang saling bebas dan dipilih secara acak dari dua populasi dengan rata-rata 𝜇1, 𝜇2 dan variansi 𝜎12, 𝜎22, maka distribusi sampling dari perbedaan rata-rata 𝑋̅1− 𝑋̅2 mendekati distribusi Normal dengan rata-rata dan variansi diberikan oleh
𝜇𝑋̅1−𝑋̅2 = 𝜇1− 𝜇2 dan 𝜎𝑋̅1−𝑋̅22 = 𝜎12
𝑛1 +𝜎22
Dengan kata lain,
𝑍 = (𝑋̅1 − 𝑋̅2) − (𝜇1− 𝜇2) √(𝜎12/𝑛1) + (𝜎22/𝑛2) mendekati distribusi Normal Standar.
Bukti: Misalkan 𝑋11, 𝑋12,…, 𝑋1𝑛1adalah sampel acak saling bebas dari populasi dengan rata-rata 𝜇1, variansi 𝜎12 dan 𝑋21, 𝑋22,…, 𝑋2𝑛2 adalah sampel acak saling bebas dari populasi dengan rata-rata 𝜇2, variansi 𝜎22.
Dipandang rata-rata sampel
𝑋̅1 =∑𝑛1𝑖=1𝑋1𝑖
𝑛1 dan 𝑋̅2 =∑𝑛2𝑖=1𝑋2𝑖
𝑛2 . Fungsi pembangkit momen dari variabel acak 𝑋̅1 adalah
𝑚𝑋̅1(𝑡) = 𝐸 (𝑒𝑡 ∑𝑛1𝑖=1𝑋1𝑖 𝑛1 ) = 𝐸 (𝑒𝑡𝑋11𝑛1 𝑒𝑡𝑋12𝑛1 … 𝑒𝑡𝑋1𝑛1𝑛1 ), menurut teorema 2.1.3, 𝑚𝑋̅1(𝑡) = 𝑚𝑋11(𝑡 𝑛1) x 𝑚𝑋12(𝑡 𝑛1) x … x 𝑚𝑋1𝑛1(𝑡 𝑛1) = (𝑒𝜇1(𝑡 𝑛1)+ 1 2𝜎21(𝑡 𝑛1) 2 ) 𝑛1 = 𝑒𝜇1𝑡+ 1 2 𝜎12 𝑛1𝑡 2 .
Dengan cara yang sama, fungsi pembangkit momen dari variabel acak 𝑋̅2 adalah
𝑚𝑋̅2(𝑡) = 𝑒𝜇2𝑡+12𝜎22
𝑛2𝑡 2
. Dengan demikian, menurut teorema 2.1.3,
𝑚𝑋̅1−𝑋̅2(𝑡) = 𝑚𝑋̅1(𝑡)𝑚𝑋̅2(−𝑡) = 𝑒𝜇1𝑡+1 2 𝜎12 𝑛1𝑡 2 𝑒−𝜇2𝑡+1 2 𝜎22 𝑛2(−𝑡)2 = 𝑒(𝜇1−𝜇2)𝑡+ 1 2(𝜎12 𝑛1+ 𝜎22 𝑛2)𝑡 2 .
Oleh karena 𝑚𝑋̅1−𝑋̅2(𝑡) identik dengan fungsi pembangkit momen dari distribusi Normal, maka menurut Teorema Ketunggalan, 𝑋̅1− 𝑋̅2 mempunyai distribusi Normal dengan rata-rata 𝜇1−𝜇2 dan variansi 𝜎1
2
𝑛1 +𝜎22
𝑛2. ∎
Jika 𝑛1 dan 𝑛2 lebih besar/sama dengan 30, maka pendekatan distribusi Normal untuk distribusi 𝑋̅1− 𝑋̅2 adalah baik ketika distribusi yang mendasarinya tidak terlalu jauh dari Normal. Bahkan, ketika 𝑛1 dan 𝑛2 kurang dari 30, pendekatan distribusi Normal juga cukup bagus, kecuali populasinya jelas tidak Normal. Jika populasinya Normal, maka distribusi 𝑋̅1− 𝑋̅2 akan berdistribusi Normal, tidak peduli berapapun ukuran sampel 𝑛1 dan 𝑛2.
Contoh 2.2.5. Dua percobaan independen (saling bebas) dijalankan untuk membandingkan dua jenis cat. Delapan belas spesimen dicat menggunakan cat jenis A dan waktu pengeringan direkam dalam jam. Hal yang sama juga dilakukan pada cat jenis B. Standar deviasi populasi keduanya adalah 1. Asumsikan rata-rata waktu pengeringan cat adalah sama untuk kedua jenis cat.
Tentukan 𝑃(𝑋̅𝐴− 𝑋̅𝐵> 1), dengan 𝑋̅𝐴 dan 𝑋̅𝐵 adalah rata-rata waktu pengeringan untuk sampel berukuran 𝑛𝐴 = 𝑛𝐵 = 18.
Penyelesaian: Distribusi sampling 𝑋̅𝐴− 𝑋̅𝐵 mendekati Normal dengan rata-rata 𝜇𝑋̅𝐴−𝑋̅𝐵 = 𝜇𝐴 − 𝜇𝐵 = 0.
dan variansi 𝜎𝑋̅𝐴−𝑋̅𝐵2 = 𝜎𝐴 2 𝑛𝐴 + 𝜎𝐵2 𝑛𝐵 = 1 18+ 1 18= 1 9. 𝑃(𝑋̅𝐴− 𝑋̅𝐵> 1) diberikan oleh 𝑃(𝑋̅𝐴− 𝑋̅𝐵 > 1) = 𝑃 ( 𝑋̅𝐴− 𝑋̅𝐵− 0 √1 9 > 3 ) = 𝑃(𝑍 > 3) = 1 − 𝑃(𝑍 < 3) = 1 − 0.9987 = 0.0013.
Mesin dalam perhitungan di atas didasarkan pada anggapan bahwa 𝜇𝐴 = 𝜇𝐵. Percobaan sebenarnya dilakukan untuk tujuan menggambarkan kesimpulan tentang kesetaraan 𝜇𝐴 dan 𝜇𝐵, rata-rata waktu dua populasi pengeringan cat. Jika dua rata-rata berbeda sebanyak 1 jam (atau lebih), maka ini jelas merupakan bukti yang digunakan untuk menyimpulkan rata-rata populasi pengeringan cat tidak sama untuk kedua jenis cat.
Definisi 2.2.2. Distribusi non-sentral 𝑡 adalah distribusi sampling dari 𝑡 yang tidak terdistribusi di sekitar 0, tetapi di sekitar titik lain. Titik lain inilah yang dinamakan parameter non-sentral Δ. Parameter non-sentral Δ dapat dihitung sebagai
Δ =𝜇1− 𝜇 𝜎/√𝑛.
Dengan kata lain, distribusi non-sentral 𝑡 adalah distribusi sampling dari 𝑡 yang muncul ketika 𝜇1 benar dan variansi populasi (𝜎) diasumsikan tidak diketahui.