Distribusi Sampling - UJI HIPOTESIS PERBEDAAN RATA-RATA

BAB II UJI HIPOTESIS PERBEDAAN RATA-RATA

B. Distribusi Sampling

D. Hipotesis Statistik

E. Uji Hipotesis Rata-rata Satu Populasi F. Uji Hipotesis Rata-rata Dua Populasi BAB III EFFECT SIZE COHEN

A. Dari Uji Signifikansi ke Effect Size B. Jenis Effect Size

C. Selang Kepercayaan pada 𝑑 D. Meta-Analisis pada 𝑑

BAB IV PENERAPAN EFFECT SIZE PADA HASIL-HASIL PENELITIAN A. Meta-Analisis pada Data Independen

B. Meta-Analisis pada Data Berpasangan BAB V PENUTUP

A. Kesimpulan B. Saran

DAFTAR PUSTAKA LAMPIRAN

6 BAB II

UJI HIPOTESIS PERBEDAAN RATA-RATA

A. Statistika Inferensial

Berdasarkan aktivitas yang dilakukan, statistika terbagi menjadi dua yaitu statistika deskriptif dan statistika inferensial. Pada bab ini akan dibahas tentang statistika inferensial yang berperan penting pada pengujian hipotesis dan pendugaan parameter. Statistikawan menggunakan hukum dasar probabilitas dan statistika inferensial untuk menarik kesimpulan tentang sistem ilmiah. Informasi dikumpulkan dalam bentuk sampel atau koleksi pengamatan. Sampel dikumpulkan dari populasi, yang merupakan kumpulan semua individu atau masing-masing item dari jenis tertentu. Suatu konstanta yang merupakan karakteristik populasi dinamakan parameter.

Definisi 2.1.1. Ruang sampel adalah himpunan yang terdiri dari semua kemungkinan titik sampel dalam suatu proses pengamatan.

Definisi 2.1.2. Variabel acak adalah fungsi bernilai real yang domainnya adalah ruang sampel.

Fungsi tertentu dari variabel acak yang diamati dalam sampel digunakan untuk menduga atau membuat keputusan tentang parameter populasi yang tidak diketahui. Misalnya, pendugaan rata-rata populasi 𝜇 dilakukan dengan mengambil sampel acak 𝑥₁, 𝑥₂, … , 𝑥_𝑛 dari variabel acak 𝑋₁, 𝑋₂, … , 𝑋_𝑛 dan rata-rata sampelnya

Variabel acak 𝑥̅ adalah fungsi dari variabel acak 𝑋₁, 𝑋₂, … , 𝑋_𝑛 dan sampel berukuran 𝑛. Dengan kata lain, rata-rata sampel, yaitu 𝑥̅ adalah contoh statistik.

Definisi 2.1.3. Statistik adalah fungsi dari variabel acak yang diamati dalam sampel.

Sebagai contoh, dalam sebuah percobaan obat, sampel pasien diambil dan masing-masing diberi obat spesifik untuk mengurangi tekanan darah. Percobaan ini difokuskan pada penarikan kesimpulan tentang populasi pasien yang menderita hipertensi. Jadi, tujuan dari statistika inferensial adalah informasi yang terdapat dalam sampel digunakan untuk membuat kesimpulan tentang populasi di mana sampel diambil.

Definisi 2.1.4. Statistika inferensial adalah teknik analisis statistik yang terdiri dari beberapa metode statistik untuk dapat membuat kesimpulan atau generalisasi tentang populasi.

Definisi 2.1.5. Fungsi 𝑓(𝑥) adalah fungsi densitas probabilitas untuk variabel acak kontinu 𝑋, jika

1) 𝑓(𝑥) ≥ 0, untuk setiap 𝑥 ∈ ℝ. 2) ∫_−∞^∞ 𝑓(𝑥) 𝑑𝑥 = 1.

Fungsi Pembangkit Momen

Pada subbab ini akan dijelaskan fungsi pembangkit momen yang berkaitan dengan Teorema dalam distribusi sampling.

Definisi 2.1.6. Momen ke-𝑘 variabel acak 𝑋 diberikan oleh 𝜇′_𝑘= 𝐸(𝑋^𝑘) = { ∑ 𝑥^𝑘^𝑓(𝑥) 𝑥 , jika 𝑋 diskrit, ∫ 𝑥^𝑘𝑓(𝑥) 𝑑𝑥 ∞ −∞ , jika 𝑋 kontinu.

Berdasarkan definisi 2.1.5, rata-rata dan variansi variabel acak 𝑋 adalah 𝜇′₁ = 𝐸(𝑋) = 𝜇 dan 𝜇′₂− 𝜇² = 𝐸(𝑋²) − 𝜇2 = 𝜎².

Definisi 2.1.7. Fungsi pembangkit momen dari variabel 𝑋 diberikan oleh 𝐸(𝑒^𝑡𝑋) dan dinotasikan oleh 𝑚_𝑋(𝑡). Dengan kata lain,

𝑚_𝑋(𝑡) = 𝐸(𝑒𝑡𝑋) = { ∑ 𝑒^𝑡𝑥^𝑓(𝑥) 𝑥 , jika 𝑋 diskrit, ∫ 𝑒𝑡𝑥𝑓(𝑥) 𝑑𝑥 ∞ −∞ , jika 𝑋 kontinu.

Teorema 2.1.1. Misalkan 𝑋 adalah variabel acak dengan fungsi pembangkit momen 𝑚_𝑋(𝑡). Didefinisikan

𝑑^𝑘

𝑑𝑡𝑘𝑚_𝑋(𝑡)|_𝑡=0 = 𝜇′_𝑘. Bukti:

Misalkan 𝑚_𝑋(𝑡) adalah fungsi pembangkit momen yang variabel acak 𝑋 terdiferensial 𝑘 kali. 𝑑𝑘 𝑑𝑡𝑘𝑚_𝑋(𝑡) = ^𝑑 𝑘 𝑑𝑡𝑘∫ 𝑒^𝑡𝑥𝑓_𝑋(𝑥) 𝑑𝑥 ∞ −∞ = ∫ (^𝑑 𝑘 𝑑𝑡𝑘𝑒^𝑡𝑥) 𝑓_𝑋(𝑥) 𝑑𝑥 ∞ −∞

= ∫ (𝑥𝑘𝑒𝑡𝑥)𝑓_𝑋(𝑥) 𝑑𝑥 ∞ −∞ = 𝐸(𝑋^𝑘)𝑒𝑡𝑥. Dengan demikian, 𝑑^𝑘 𝑑𝑡𝑘𝑚_𝑋(𝑡)|_𝑡=0= 𝐸(𝑋^𝑘)𝑒𝑡𝑥|_𝑡=0= 𝐸(𝑋^𝑘) = 𝜇′_𝑘. ∎

Contoh 2.1.1. Misalkan 𝑋 adalah variabel acak berdistribusi Normal dengan rata-rata 𝜇 dan variansi 𝜎². Tentukan fungsi pembangkit momen untuk 𝑋.

Penyelesaian: Fungsi probabilitas Normal dengan rata-rata 𝜇 dan variansi 𝜎2

adalah

𝑓(𝑥) = ¹

𝜎√2𝜋^{exp [− (} 1

2𝜎2) (𝑥 − 𝜇)2] , −∞ < 𝑥 < ∞ Fungsi pembangkit momen dari 𝑋 adalah

𝑚(𝑡) = 𝐸(𝑒^𝑡𝑥) = ∫ 𝑒𝑡𝑥(^{exp [−(𝑥 − 𝜇)} 2/2𝜎²] 𝜎√2𝜋 ^{) 𝑑𝑥.} ∞ −∞ Misalkan 𝑢 = 𝑥 − 𝜇, 𝑑𝑢 = 𝑑𝑥, maka 𝑥 = 𝑢 + 𝜇, 𝑚(𝑡) = ¹ 𝜎√2𝜋^{∫ 𝑒} 𝑡(𝑢+𝜇)𝑒^−𝑢²^/(2𝜎²⁾ 𝑑𝑢 ∞ −∞ = ¹ 𝜎√2𝜋^{∫ exp [(𝑢 + 𝜇)𝑡 −} 𝑢² 2𝜎2] 𝑑𝑢 ∞ −∞ = ¹ 𝜎√2𝜋^{∫ exp [} −𝑢²+ 2𝜎²(𝑢 + 𝜇)𝑡 2𝜎2 ] 𝑑𝑢 ∞ −∞

Kalikan dengan 𝑒𝑡²𝜎²/2/𝑒𝑡²𝜎²/2 dan melengkapkan kuadrat, 𝑚(𝑡) = 𝑒^𝜇𝑡𝑒^𝑡²^𝜎²^/2∫ ^{exp [−(1/2𝜎} 2)(𝑢2− 2𝜎2𝑡𝑢 + 𝜎4𝑡2)] 𝜎√2𝜋 ^𝑑𝑢 ∞ −∞ = 𝑒𝜇𝑡+(𝑡²𝜎²/2)∫ ^{exp [−(𝑢 − 𝜎} 2𝑡)²/2𝜎²] 𝜎√2𝜋 ^𝑑𝑢. ∞ −∞

Oleh karena integral tersebut adalah integral dari fungsi densitas Normal dengan rata-rata 𝜎2𝑡 dan variansi 𝜎2, maka integral tersebut bernilai 1. Jadi, fungsi pembangkit momen dari 𝑋 adalah

𝑚(𝑡) = 𝑒^{𝜇𝑡+(𝑡}²^𝜎²^/2).

Definisi 2.1.8. Variabel acak 𝑋 didefinisikan berdistribusi Gamma dengan parameter 𝛼 > 0 dan 𝛽 > 0 jika dan hanya jika fungsi densitas 𝑋 adalah

𝑓(𝑥) = { 𝑥^𝛼−1𝑒⁻ 𝑥 𝛽 𝛽𝛼Γ(𝛼) ^{, 0 ≤ 𝑥 ≤ ∞} 0, selainnya, dengan Γ(𝛼) = ∫ 𝑥^𝛼−1𝑒^−𝑥 ∞ 0 𝑑𝑥.

Definisi 2.1.9. Misalkan 𝑣 adalah bilangan bulat positif. Variabel acak 𝑋 dikatakan berdistribusi Chi-Square dengan derajat bebas 𝑣 jika dan hanya jika 𝑋 adalah variabel acak berdistribusi Gamma dengan parameter 𝛼 = 𝑣/2 dan 𝛽 = 2.

Contoh 2.1.2. Misalkan 𝑋 adalah variabel acak berdistribusi Chi-Square dengan rata-rata 𝑣 dan variansi 2𝑣. Tentukan fungsi pembangkit momen untuk 𝑋.

Penyelesaian:

Fungsi probabilitas Chi-Square dengan rata-rata 𝑣 dan variansi 2𝑣 adalah

𝑓(𝑥) =^𝑥

(𝑣/2)−1𝑒^−𝑥/2

2𝑣/2Γ(𝑣/2) ^{, 𝑥 > 0} Fungsi pembangkit momen dari 𝑋 adalah

𝑚(𝑡) = 𝐸(𝑒^𝑡𝑥) = ∫ 𝑒𝑡𝑥𝑥^(𝑣/2)−1𝑒^−𝑥/2 2𝑣/2Γ(𝑣/2) ∞ 0 𝑑𝑥 = ¹ 2𝑣/2Γ(𝑣/2)^{∫ 𝑒} − ^{(1−2𝑡)𝑥}₂ 𝑥^(𝑣/2) 𝑥 ∞ 0 𝑑𝑥 Misalkan 𝑡 <¹ 2, 𝑢 = (1 − 2𝑡)𝑥 𝑑𝑢 = (1 − 2𝑡)𝑑𝑥 𝑚(𝑡) = ¹ 2𝑣/2Γ(𝑣/2)^{∫ 𝑒} − ^𝑢₂( ^𝑢 1 − 2𝑡⁾ 𝑣/2 ∞ 0 (¹ 𝑢^{) 𝑑𝑢} = (1 − 2𝑡)^−𝑣/2∫ ^𝑒 − ^𝑢 2𝑢^(𝑣/2)−1 2𝑣/2Γ(𝑣/2) ∞ 0 𝑑𝑢

Oleh karena integral tersebut adalah integral dari fungsi densitas Gamma dengan parameter 𝛼 = 𝑣/2 dan 𝛽 = 2, maka menurut definisi fungsi probabilitas (definisi 2.1.5), integral bersebut bernilai 1. Jadi, fungsi pembangkit momen dari 𝑋 adalah

Teorema 2.1.2. Teorema Ketunggalan: Misalkan 𝑚_𝑋(𝑡) dan 𝑚_𝑌(𝑡) adalah fungsi pembangkit momen dari variabel acak 𝑋 dan 𝑌. Jika kedua fungsi pembangkit momen ada dan 𝑚_𝑋(𝑡) = 𝑚_𝑌(𝑡), untuk setiap nilai 𝑡, maka 𝑋 dan 𝑌 mempunyai distribusi probabilitas yang sama.

Bukti dapat dilihat pada skripsi Julie, Hongkie (1999) yang berjudul Teorema Limit Pusat dan Terapannya.

Contoh 2.1.3. Misalkan 𝑍 adalah variabel acak berdistribusi Normal dengan rata-rata 0 dan variansi 1. Gunakan metode fungsi pembangkit momen untuk menemukan distribusi probabilitas dari 𝑍2.

Penyelesaian:

Fungsi pembangkit momen dari 𝑍2 adalah

𝑚_𝑍2(𝑡) = 𝐸(𝑒𝑡𝑍²) = ∫ 𝑒^𝑡𝑧²𝑓(𝑧) 𝑑𝑧 ∞ −∞ = ∫ 𝑒^𝑡𝑧²^𝑒 −𝑧²/2 √2𝜋 ^𝑑𝑧 ∞ −∞ = ∫ ¹ √2𝜋^𝑒 −(𝑧²/2)(1−2𝑡) 𝑑𝑧. ∞ −∞

Jika (1 − 2𝑡) > 0 (𝑡 < 1/2), integrand dari exp [− (^𝑧² 2) (1 − 2𝑡)] √2𝜋 ⁼ exp [− (^𝑧² 2) (1 − 2𝑡)⁄ ⁻¹] √2𝜋

identik dengan fungsi probabilitas variabel acak Normal dengan rata-rata 0 dan variansi (1 − 2𝑡)⁻¹. Untuk membuat integralnya sama dengan 1, kalikan dengan standar deviasinya, yaitu (1 − 2𝑡)^−1/2, sehingga

𝑚_𝑍2(𝑡) = ¹ (1 − 2𝑡)1/2∫ ¹ √2𝜋(1 − 2𝑡)−1/2exp [− (^𝑧 2 2^{) (1 − 2𝑡)} −1 ⁄ ] 𝑑𝑧. ∞ −∞

𝑚_𝑍2(𝑡) = ¹

(1 − 2𝑡)1/2 = (1 − 2𝑡)^−1/2.

Oleh karena fungsi pembangkit momen untuk 𝑍² identik dengan fungsi pembangkit momen untuk variabel acak Chi-Square dengan derajat bebas 𝑣 = 1 (contoh 2.1.2), maka menurut Teorema Ketunggalan, 𝑍² berdistribusi Chi-Square dengan derajat bebas 1. Dengan demikian, fungsi probabilitas untuk 𝑈 = 𝑍² adalah

𝑓_𝑈(𝑢) = {

𝑢^−1/2𝑒^−𝑢/2

Γ(1/2)√2 ^{, 𝑢 ≥ 0} 0, selainnya.

Contoh 2.1.4. Misalkan 𝑋 adalah variabel acak berdistribusi Normal dengan rata-rata 𝜇 dan variansi 𝜎². Tunjukkan bahwa

𝑍 =^{𝑋 − 𝜇} 𝜎

berdistribusi Normal Standar dengan rata-rata 0 dan variansi 1. Penyelesaian:

Dari contoh 2.1.1, fungsi pembangkit momen dari 𝑋 adalah 𝑒^{𝜇𝑡+(𝑡}²^𝜎²^/2).

Dengan cara yang sama, fungsi pembangkit momen dari 𝑋 − 𝜇 adalah 𝑒𝑡²𝜎²/2, sehingga

𝑚_𝑍(𝑡) = 𝐸(𝑒𝑡𝑍) = 𝐸(𝑒^{(𝑡/𝜎)(𝑋−𝜇)}) = 𝑚_𝑋−𝜇(^𝑡 𝜎^{) = 𝑒}

(𝑡/𝜎)2𝜎²/2= 𝑒^𝑡²^/2.

Oleh karena 𝑚_𝑍(𝑡) identik dengan fungsi pembangkit momen dari variabel acak Normal Standar, maka 𝑍 berdistribusi Normal Standar dengan 𝐸(𝑍) = 0 dan 𝑉(𝑍) = 1.

Teorema 2.1.3. Misalkan 𝑋₁, 𝑋₂, … , 𝑋_𝑛 adalah variabel acak yang saling bebas dengan fungsi pembangkit momen 𝑚_𝑋₁(𝑡), 𝑚_𝑋₂(𝑡),…, 𝑚_𝑋_𝑛(𝑡). Jika 𝑈 = 𝑋₁+ 𝑋₂+ ⋯ + 𝑋_𝑛, maka

𝑚_𝑈(𝑡) = 𝑚_𝑋₁(𝑡) x 𝑚_𝑋₂(𝑡) x … x 𝑚_𝑋_𝑛(𝑡). Bukti:

Karena variabel acak 𝑋₁, 𝑋₂, … , 𝑋_𝑛 saling bebas, maka

𝑚_𝑈(𝑡) = 𝐸(𝑒𝑡(𝑋₁+𝑋₂+⋯+𝑋_𝑛)) = 𝐸(𝑒^𝑡𝑋1𝑒^𝑡𝑋2… 𝑒^𝑡𝑋𝑛) = 𝐸(𝑒^𝑡𝑋1) x 𝐸(𝑒𝑡𝑋2) x … x 𝐸(𝑒𝑡𝑋𝑛).

Dengan definisi fungsi pembangkit momen,

𝑚_𝑈(𝑡) = 𝑚_𝑋₁(𝑡) x 𝑚_𝑋₂(𝑡) x … x 𝑚_𝑋_𝑛(𝑡). ∎

Teorema 2.1.4. Misalkan 𝑋₁, 𝑋₂, … , 𝑋_𝑛 adalah variabel acak saling bebas yang berdistribusi Normal dengan 𝐸(𝑋_𝑖) = 𝜇_𝑖, 𝑉(𝑋_𝑖) = 𝜎_𝑖2, untuk 𝑖 = 1,2, … , 𝑛 dan 𝑎₁, 𝑎₂,…, 𝑎_𝑛 adalah konstanta. Jika

𝑈 = ∑ 𝑎_𝑖𝑋_𝑖 =

𝑛

𝑖=1

𝑎₁𝑋₁+ 𝑎₂𝑋₂ + ⋯ + 𝑎_𝑛𝑋_𝑛,

maka U adalah variabel acak berdistribusi Normal dengan

𝐸(𝑈) = ∑ 𝑎_𝑖𝜇_𝑖 𝑛 𝑖=1 = 𝑎₁𝜇₁+ 𝑎₂𝜇₂+ ⋯ + 𝑎_𝑛𝜇_𝑛 dan 𝑉(𝑈) = ∑ 𝑎_𝑖2𝜎_𝑖2 𝑛 𝑖=1 = 𝑎₁2𝜎₁2+ 𝑎₂2𝜎₂2+ ⋯ + 𝑎_𝑛2𝜎_𝑛2.

Bukti:

Dari contoh 2.1.1, fungsi pembangkit momen dari 𝑋 adalah 𝑒^{𝜇𝑡+(𝑡}²^𝜎²^/2).

Karena 𝑋_𝑖 berdistribusi Normal dengan rata-rata 𝜇_𝑖 dan variansi 𝜎_𝑖2, maka fungsi pembangkit momen dari 𝑋_𝑖 adalah

𝑚_𝑋_𝑖(𝑡) = exp (𝜇_𝑖𝑡 +^𝜎^𝑖

2𝑡² 2 ^). Fungsi pembangkit momen dari 𝑎_𝑖𝑋_𝑖 adalah

𝑚_𝑎_𝑖_𝑋_𝑖(𝑡) = 𝐸(𝑒𝑡𝑎𝑖𝑋𝑖) = 𝑚_𝑋_𝑖(𝑎_𝑖𝑡) = exp (𝜇_𝑖𝑎_𝑖𝑡 +^𝑎^𝑖

2𝜎_𝑖²𝑡² 2 ^).

Karena variabel acak 𝑋_𝑖 saling bebas dan 𝑎_𝑖𝑋_𝑖 saling bebas, untuk 𝑖 = 1,2, … , 𝑛, maka menurut teorema 2.1.3,

𝑚_𝑈(𝑡) = 𝑚_𝑎₁_𝑋₁(𝑡) x 𝑚_𝑎₂_𝑋₂(𝑡) x … x 𝑚_𝑎_𝑛_𝑋_𝑛(𝑡) = exp (𝜇₁𝑎₁𝑡 +^𝑎¹ 2𝜎₁²𝑡2 2 ^{) x … x exp (𝜇}^𝑛^𝑎^𝑛^{𝑡 +} 𝑎_𝑛2𝜎_𝑛²𝑡2 2 ⁾ = exp (𝑡 ∑ 𝑎_𝑖𝜇_𝑖 𝑛 𝑖=1 +^𝑡 2 2 ^{∑ 𝑎}^𝑖 2𝜎_𝑖² 𝑛 𝑖=1 ).

Oleh karena 𝑚_𝑈(𝑡) identik dengan fungsi pembangkit momen dari distribusi Normal, maka menurut Teorema Ketunggalan, 𝑈 mempunyai distribusi Normal dengan rata-rata ∑^𝑛_𝑖=1𝑎_𝑖𝜇_𝑖 dan variansi ∑𝑛 𝑎_𝑖2𝜎_𝑖2

B. Distribusi Sampling

Fokus utama statistika inferensial berkaitan dengan generalisasi dan prediksi. Sebagai contoh, mesin minuman ringan dirancang untuk mengeluarkan minuman dengan rata-rata 240 mililiter per minuman. Perusahaan minuman tersebut menghitung rata-rata 40 minuman dan diperoleh rata-ratanya 𝑥̅ = 236 mililiter. Berdasarkan nilai tersebut, perusahaan memutuskan bahwa mesin masih mengeluarkan minuman dengan rata-rata 𝜇 = 240 mililiter. Empat puluh minuman mewakili sampel dari populasi tak hingga minuman yang akan dikeluarkan mesin.

Dari contoh di atas, statistik dihitung dari sampel yang dipilih dari populasi. Statistik juga menghasilkan berbagai pernyataan yang dibuat mengenai nilai-nilai parameter populasi yang mungkin atau mungkin tidak benar. Perusahaan minuman tersebut membuat keputusan bahwa minuman ringan mengeluarkan minuman dengan rata-rata 240 mililiter, meskipun rata-rata sampelnya 236 mililiter. Perusahaan tersebut membuat keputusan itu berdasarkan teori sampling.

Karena statistik adalah variabel acak yang bergantung hanya pada sampel yang diamati, maka statistik harus memiliki distribusi probabilitas. Distribusi probabilitas dari statistik inilah yang dinamakan distribusi sampling. Distribusi sampling dari statistik tergantung pada distribusi populasi, ukuran sampel dan metode pemilihan sampel. Distribusi sampling 𝑋̅ dinamakan distribusi sampling dari rata-rata. Distribusi sampling 𝑋̅ dengan ukuran sampel 𝑛 adalah distribusi yang terjadi ketika percobaan dilakukan berulang dan banyak nilai-nilai hasil 𝑋̅.

Distribusi sampling 𝑋̅ menggambarkan variabilitas rata-rata sampel sekitar rata-rata populasi 𝜇. Pada kasus mesin minuman ringan, pengetahuan tentang distribusi sampling 𝑋̅ memberikan perbedaan yang khas antara nilai 𝑥̅ yang diamati dan nilai rata-rata (𝜇) sebenarnya. Prinsip yang sama juga berlaku pada distribusi 𝑆2. Distribusi sampling ini menghasilkan nilai-nilai variabilitas variansi sampel 𝑠² di sekitar variansi populasi 𝜎², khususnya dalam percobaan berulang.

Teorema 2.2.1. Misalkan 𝑋₁, 𝑋₂, … , 𝑋_𝑛 adalah sampel acak saling bebas berukuran 𝑛 dari distribusi Normal dengan rata-rata 𝜇 dan variansi 𝜎2. Statistik

𝑋̅ =¹ 𝑛^{∑ 𝑋}^𝑖

𝑛

𝑖=1

akan berdistribusi Normal dengan rata-rata 𝜇_𝑋̅ = 𝜇 dan variansi 𝜎_𝑋̅2 = 𝜎2/𝑛.

Bukti: Karena 𝑋₁, 𝑋₂, … , 𝑋_𝑛 adalah sampel acak dari distribusi Normal dengan rata-rata 𝜇, variansi 𝜎² dan 𝑋_𝑖, 𝑖 = 1,2, … , 𝑛 juga saling bebas dengan 𝐸(𝑋_𝑖) = 𝜇 dan 𝑉(𝑋_𝑖) = 𝜎2, maka 𝑋̅ =¹ 𝑛^{∑ 𝑋}^𝑖 𝑛 𝑖=1 = ¹ 𝑛^(𝑋¹^{) +} 1 𝑛^(𝑋²^{) + ⋯ +} 1 𝑛^(𝑋^𝑛⁾ = 𝑎₁𝑋₁+ 𝑎₂𝑋₂ + ⋯ + 𝑎_𝑛𝑋_𝑛, di mana 𝑎_𝑖 = ¹ 𝑛, 𝑖 = 1,2, … , 𝑛. Menurut teorema 2.1.4, karena 𝑋̅ dapat dinyatakan sebagai kombinasi linear dari 𝑋₁, 𝑋₂, … , 𝑋_𝑛, maka 𝑋̅ berdistribusi Normal dengan

𝜇_𝑋̅ = 𝐸(𝑋̅) = 𝐸[𝑎₁𝑋₁+ ⋯ + 𝑎_𝑛𝑋_𝑛] = 𝑎₁𝐸(𝑋₁) + ⋯ + 𝑎_𝑛𝐸(𝑋_𝑛) = ¹ 𝑛(𝜇) + ⋯ +¹ 𝑛(𝜇) =¹ 𝑛(𝑛𝜇) = 𝜇 dan 𝜎_𝑋̅² = 𝑉(𝑋̅) = 𝑉[𝑎₁𝑋₁+ ⋯ + 𝑎_𝑛𝑋_𝑛] = 𝑎₁𝑉(𝑋₁) + ⋯ + 𝑎_𝑛𝑉(𝑋_𝑛) = ¹ 𝑛2(𝜎2) + ⋯ + ¹ 𝑛2(𝜎2) = ¹ 𝑛2(𝑛𝜎2) =^𝜎 2 𝑛 ^{. ∎}

Contoh 2.2.1. Sebuah mesin pengisi botol minuman dapat diatur sehingga debit rata-ratanya 𝜇 ons per botol. Telah diamati bahwa jumlah isian tiap botol berdistribusi Normal dengan standar deviasi 𝜎 = 1 ons. Sampel pengisian botol berukuran 𝑛 = 9 dipilih secara acak dari keluaran mesin pada hari tertentu (semua botol dengan pengaturan mesin yang sama) dan masing-masing botol diukur debitnya. Tentukan probabilitas bahwa rata-rata sampel akan berada dalam 0.3 ons rata-rata sebenarnya 𝜇 untuk pengaturan mesin yang dipilih.

Penyelesaian:

Misalkan 𝑋₁, 𝑋₂, … , 𝑋_𝑛 adalah banyaknya botol yang akan diamati debitnya dan 𝑋_𝑖, 𝑖 = 1,2, … ,9 berdistribusi Normal dengan rata-rata 𝜇 dan variansi 𝜎² = 1. Berdasarkan teorema 2.2.1, 𝑋̅ memiliki distribusi sampling yang Normal dengan rata-rata 𝜇_𝑋̅ = 𝜇 dan variansi 𝜎_𝑋̅² =^𝜎²

𝑛 = 1/9. 𝑃(|𝑋̅ − 𝜇| ≤ 0.3) = 𝑃[−0.3 ≤ 𝑋̅ − 𝜇 ≤ 0.3] = 𝑃 (^−0.3 𝜎/√𝑛≤ ^{𝑋̅−𝜇} 𝜎/√𝑛≤ ^0.3 𝜎/√𝑛).

Karena (𝑋̅ − 𝜇_𝑋̅)/𝜎_𝑋̅ = (𝑋̅ − 𝜇)/(𝜎/√𝑛) berdistribusi Normal Standar, maka

𝑃(|𝑋̅ − 𝜇| ≤ 0.3) = 𝑃 (^−0.3 1/√9^{≤ 𝑍 ≤} 0.3 1/√9⁾ = 𝑃(−0.9 ≤ 𝑍 ≤ 0.9) = 1 − 2𝑃(𝑍 > 0.9) = 1 − 2(0.1841) = 0.6318.

Dengan demikian, probabilitas bahwa rata-rata sampel akan berada dalam 0.3 ons dari rata-rata populasi sebenarnya hanyalah 0.6318.

Teorema 2.2.2. Misalkan 𝑋 dan 𝑋₁, 𝑋₂, 𝑋₃,… adalah variabel acak dengan fungsi pembangkit momen 𝑚(𝑡) dan 𝑚₁(𝑡), 𝑚₂(𝑡), 𝑚₃(𝑡),…, 𝑚_𝑛(𝑡).

Jika

lim

𝑛→∞𝑚_𝑛(𝑡) = 𝑚(𝑡) , ∀𝑡 ∈ ℝ

maka fungsi distribusi dari 𝑋_𝑛 konvergen ke fungsi distribusi dari 𝑋.

Bukti dapat dilihat pada buku Probability with Martingales karangan Williams, David (1991) halaman 185.

Teorema 2.2.3. Teorema Limit Pusat: Jika 𝑋̅ adalah rata-rata sampel acak berukuran 𝑛 yang diambil dari populasi dengan rata-rata 𝜇 dan variansi berhingga 𝜎², maka bentuk limit dari distribusi

𝑍 = ^{𝑋̅ − 𝜇} 𝜎/√𝑛^,

konvergen ke fungsi distribusi Normal Standar 𝑛(𝑧; 0,1), ketika 𝑛 → ∞. Bukti: Misalkan 𝑈_𝑛 = ^{𝑋̅ − 𝜇} 𝜎/√𝑛 ⁼ 1 √𝑛⁽ ∑^𝑛_𝑖=1𝑋_𝑖− 𝑛𝜇 𝜎 ^{) =} 1 √𝑛^{∑ 𝑍}^𝑖 𝑛 𝑖=1 , dengan 𝑍_𝑖 =^𝑋^𝑖 ^{− 𝜇} 𝜎 ^.

Karena variabel acak 𝑋_𝑖 saling bebas dan berdistribusi Normal, maka menurut contoh 2.1.4, 𝑍_𝑖, 𝑖 = 1,2, … , 𝑛 juga saling bebas dan berdistribusi Normal dengan rata-rata 𝐸(𝑍_𝑖) = 0 dan variansi 𝑉(𝑍_𝑖) = 1.

Karena fungsi pembangkit momen dari jumlahan variabel acak yang saling bebas adalah hasil kali masing-masing fungsi pembangkit momennya, maka

𝑚_{∑ 𝑍}_𝑖(𝑡) = 𝑚_𝑍₁(𝑡) x 𝑚_𝑍₂(𝑡) x … x 𝑚_𝑍_𝑛(𝑡) = [𝑚_𝑍₁(𝑡)]^𝑛 dan 𝑚_𝑈_𝑛(𝑡) = 𝑚_{∑ 𝑍}_𝑖( ^𝑡 √𝑛^{) = [𝑚}^𝑍¹⁽ 𝑡 √𝑛^)] 𝑛 .

Oleh karena deret Taylor di sekitar 0 dengan suku sisa bentuk Lagrange adalah

𝑚_𝑍₁(𝑡) = 𝑚_𝑍₁(0) + 𝑚′_𝑍₁(0)𝑡 + 𝑚′′_𝑍₁(𝜉)^𝑡

2 ^{, 0 < 𝜉 < 𝑡} dan karena 𝑚_𝑍₁(0) = 𝐸(𝑒0𝑍₁) = 𝐸(1) = 1 dan 𝑚′_𝑍₁(0) = 𝐸(𝑍₁) = 0,

𝑚_𝑍₁(𝑡) = 1 + 𝑚′′_𝑍₁(𝜉)^𝑡 2 2 sehingga 𝑚_𝑈_𝑛(𝑡) = [1 +^𝑚 ′′ 𝑍1(𝜉_𝑛) 2 ⁽ 𝑡 √𝑛⁾ 2 ] 𝑛 = [1 +^𝑚′′^𝑍¹(𝜉_𝑛)𝑡2/2 𝑛 ^] 𝑛 , 0 < 𝜉_𝑛 < ^𝑡 √𝑛^. Ketika 𝑛 → ∞, 𝜉_𝑛 → 0, maka 𝑚^′′_𝑍₁(𝜉_𝑛)𝑡2/2 → 𝑚^′′_𝑍₁(0)𝑡2/2 = 𝐸(𝑍₁²)𝑡2/2 = 𝑡2/2, dengan 𝐸(𝑍₁²) = 𝑉(𝑍₁) = 1. Dipandang lim 𝑛→∞𝑏_𝑛 = 𝑏, maka lim 𝑛→∞(1 +^𝑏^𝑛 𝑛)^𝑛 = 𝑒^𝑏. (2.1)

Berdasarkan persamaan (𝟐. 𝟏) diperoleh lim 𝑛→∞𝑚_𝑈_𝑛(𝑡) = lim 𝑛→∞(1 +^𝑚′′^𝑍¹(𝜉_𝑛)𝑡2/2 𝑛 ⁾ 𝑛 = 𝑒^𝑡²^/2.

Dari contoh 2.1.4, 𝑒𝑡²/2 identik dengan fungsi pembangkit momen untuk variabel acak Normal Standar. Jadi, menurut teorema 2.2.2, fungsi distribusi 𝑈_𝑛 konvergen ke fungsi distribusi dari variabel acak Normal Standar. ∎

Pendekatan distribusi Normal untuk 𝑋̅ akan bagus secara umum untuk ukuran sampel 𝑛 ≥ 30. Jika 𝑛 < 30, pendekatan baik hanya jika populasinya tidak terlalu berbeda dari distribusi Normal. Jika populasinya diketahui Normal, maka distribusi sampling dari 𝑋̅ akan mengikuti distribusi Normal persis, tidak peduli seberapa kecil ukuran sampel. Ukuran sampel 𝑛 = 30 adalah pedoman untuk menggunakan teorema 2.2.3 (Teorema Limit Pusat).

Contoh 2.2.2. Firma listrik memproduksi bola lampu yang memiliki waktu hidupnya mendekati distribusi Normal, dengan rata-rata sebesar 800 jam dan standar deviasi 40 jam. Tentukan probabilitas bahwa sampel acak dari 16 lampu akan memiliki rata-rata hidup kurang dari 775 jam.

Penyelesaian: Misalkan 𝑋̅ adalah lamanya hidup bola lampu yang berdistribusi Normal dengan 𝜇_𝑋̅ = 800 dan 𝜎_𝑋̅ = ⁴⁰

√16= 10.

Probabilitas bahwa sampel acak dari 16 lampu akan memiliki rata-rata hidup kurang dari 775 jam adalah

𝑃(𝑋̅ < 775) = 𝑃 (^{𝑋̅ − 800} 40/√16 ^<

775 − 800

10 ^{) = 𝑃(𝑍 < −2.5) = 0.0062.} Gagasan umum distribusi sampling dan Teorema Limit Pusat sering digunakan untuk menghasilkan bukti tentang beberapa aspek penting dari distribusi, seperti parameter dari distribusi. Pada Teorema Limit Pusat, parameter yang menarik adalah rata-rata populasi 𝜇. Selain itu, penentuan nilai wajar dari rata-rata populasi 𝜇 adalah salah satu aplikasi yang paling penting dari Teorema Limit Pusat. Topik seperti pengujian hipotesis, pendugaan selang, kualitas kontrol dan lainnya memanfaatkan Teorema Limit Pusat. Contoh berikut menggambarkan penggunaan Teorema Limit Pusat yang berkaitan dengan rata-rata populasi serta penarikan kesimpulan menggunakan distribusi sampling dari 𝑋̅.

Contoh 2.2.3. Suatu proses manufaktur menghasilkan komponen silinder suku cadang untuk industri otomotif. Dalam proses tersebut diproduksi komponen yang memiliki diameter rata-rata 5 milimeter. Insinyur menduga bahwa rata-rata populasinya adalah 5 milimeter. Sebuah percobaan dilakukan pada 100 komponen yang dihasilkan oleh proses secara acak dan masing-masing komponen diukur diameternya. Diketahui bahwa standar deviasi populasi 𝜎 = 0.1 milimeter. Hasil percobaan menunjukkan diameter rata-rata sampel 𝑥̅ = 5.027 milimeter. Apakah informasi sampel ini muncul untuk mendukung atau menyangkal dugaan insinyur?

Penyelesaian: Contoh ini merefleksikan berbagai masalah yang sering diajukan dan diselesaikan dengan pengujian hipotesis. Pengujian hipotesis sendiri akan dibahas pada subbab selanjutnya. Untuk menyelesaikan masalah ini, prinsip distribusi sampling dan logika digunakan.

Jika probabilitas data menunjukkan bahwa nilai 𝑥̅ = 5.027 berbeda jauh dari rata-rata populasi (probabilitas mendekati 1), maka dugaan insinyur tersebut

tidak terbantahkan. Sebaliknya, jika probabilitas cukup kecil, maka data tidak mendukung dugaan bahwa 𝜇 = 5. Dengan kata lain, jika rata-rata populasi 𝜇 = 5, berapa probabilitas bahwa rata-rata sampel 𝑋̅ akan menyimpang sebanyak 0.027 milimeter?

Dengan Teorema Limit Pusat, probabilitasnya adalah

𝑃(|𝑋̅ − 5| ≥ 0.027) = 𝑃(𝑋̅ − 5 ≥ 0.027) + 𝑃(𝑋̅ − 5 ≤ −0.027)

= 2𝑃 (^𝑋̅−50.1 √100

≥ 2.7) = 2𝑃(𝑍 ≥ 2.7)

= 2(0.0035) = 0.007.

Oleh karena itu, percobaan tersebut dengan 𝑥̅ = 5.027 tidak memberikan bukti pendukung untuk berspekulasi bahwa 𝜇 = 5. Jadi, dugaan insinyur tersebut dapat dibantah.

Teorema 2.2.4. Misalkan 𝑋₁, 𝑋₂, … , 𝑋_𝑛 adalah sampel acak yang berdistribusi Normal dengan rata-rata 𝜇 dan variansi 𝜎2, maka statistik

𝑊 =(𝑛 − 1)𝑆2

𝜎2 = ¹

𝜎2∑(𝑋_𝑖 − 𝑋̅)²

𝑛

𝑖=1

berdistribusi Chi-Square dengan derajat bebas (𝑛 − 1). Dengan demikian, 𝑋̅ dan 𝑆2 adalah variabel acak saling bebas.

Bukti: Pembuktian akan dilakukan secara khusus, yaitu untuk 𝑛 = 2. Untuk kasus 𝑛 = 2,

𝑋̅ = (1/2)(𝑋₁+ 𝑋₂) dan

𝑆² = ¹ 2 − 1^∑(𝑋^𝑖 ^{− 𝑋̅)} 2 2 𝑖=1 = [𝑋₁− (¹ 2) (𝑋₁+ 𝑋₂)]²+ [𝑋₂− (¹ 2) (𝑋₁+ 𝑋₂)]² = [¹ 2(𝑋₁− 𝑋₂)]²+ [¹ 2(𝑋₂− 𝑋₁)]² = 2 [¹ 2(𝑋₁− 𝑋₂)]² = ^(𝑋1−𝑋2)2 2

Dengan demikian, untuk 𝑛 = 2,

𝑊 =(𝑛 − 1)𝑆2 𝜎2 =(𝑋₁− 𝑋₂)2 2𝜎2 = (^𝑋¹^{− 𝑋}² √2𝜎2 ) 2 .

Menurut teorema 2.1.4, karena 𝑋₁ − 𝑋₂ adalah kombinasi linear yang saling bebas, maka variabel acak 𝑋₁− 𝑋₂ berdistribusi Normal (𝑋₁ − 𝑋₂ = 𝑎₁𝑋₁+𝑎₂𝑋₂, dengan 𝑎₁ = 1 dan 𝑎₂ = −1) dengan rata-rata

1𝜇 − 1𝜇 = 0 dan variansi (1)2𝜎2+ (−1)2𝜎2 = 2𝜎2. Oleh karena 𝑍 = ^𝑋¹^{− 𝑋}² √2𝜎2

berdistribusi Normal Standar, maka menurut Teorema Ketunggalan (lihat contoh 2.1.3), untuk 𝑛 = 2, 𝑊 =(𝑛 − 1)𝑆2 𝜎2 = (^𝑋¹ ^{− 𝑋}² √2𝜎2 ) 2 = 𝑍²

Untuk membuktikan 𝑋̅ dan 𝑆² adalah variabel acak saling bebas, maka misalkan 𝑈₁ = (𝑋₁+ 𝑋₂)/𝜎 dan 𝑈₂ = (𝑋₁− 𝑋₂)/𝜎 adalah variabel acak saling bebas, sehingga 𝑋̅ =^𝑋1+𝑋2 2 = ^𝜎𝑈1 2 dan 𝑆2 = ^(𝑋1−𝑋2)2 2 = ^(𝜎𝑈2)2 2 .

Karena 𝑋̅ adalah fungsi dari 𝑈₁ dan 𝑆² adalah fungsi dari 𝑈₂, maka bebas 𝑈₁ dan 𝑈₂ mengakibatkan 𝑋̅ dan 𝑆2 saling bebas. ∎

Asumsi pada Teorema Limit Pusat dan distribusi Normal adalah standar deviasi (𝜎) diketahui. Asumsi ini mungkin tidak masuk akal dalam situasi praktis. Namun, dalam banyak skenario percobaan, pengetahuan 𝜎 tentu tidak lebih masuk akal dari pengetahuan tentang rata-rata populasi 𝜇. Seringkali, pada kenyataannya, pendugaan 𝜎 harus diberikan oleh informasi sampel yang sama dalam menghasilkan rata-rata sampel 𝑥̅. Akibatnya, statistik yang digunakan untuk menarik kesimpulan pada 𝜇 adalah

𝑇 = ^{𝑋̅ − 𝜇} 𝑆/√𝑛^.

Definisi 2.2.1. Misalkan 𝑍 adalah variabel acak berdistribusi Normal Standar dan 𝑊 adalah variabel acak berdistribusi Chi-Square dengan derajat bebas 𝑣. Jika 𝑍 dan 𝑊 saling bebas, maka distribusi dari variabel acak 𝑇, dengan

𝑇 = ^𝑍

√𝑊/𝑣 adalah distribusi 𝑡 dengan derajat bebas 𝑣 = 𝑛 − 1.

Teorema 2.2.5. Jika 𝑋₁, 𝑋₂, … , 𝑋_𝑛 merupakan sampel acak dari populasi berdistribusi Normal dengan rata-rata 𝜇, variansi 𝜎² dan

𝑋̅ =¹

𝑛∑^𝑛_𝑖=1𝑋_𝑖 dan 𝑆² = ¹

𝑛−1∑^𝑛_𝑖=1(𝑋_𝑖 − 𝑋̅)², maka variabel acak 𝑇 = ^{𝑋̅−𝜇}

𝑆/√𝑛 berdistribusi 𝑡 dengan derajat bebas 𝑣 = 𝑛 − 1.

Bukti: Misalkan

𝑍 = ^{𝑋̅ − 𝜇} 𝜎/√𝑛 berdistribusi Normal Standar dan

𝑊 = (𝑛 − 1)𝑆2

𝜎2

berdistribusi Chi-Square dengan derajat bebas 1.

Karena 𝑍 dan 𝑊 saling bebas, maka menurut teorema 2.2.4, 𝑋̅ dan 𝑆² juga saling bebas. Jadi, dengan definisi 2.2.1 diperoleh

𝑇 = ^𝑍 √𝑊/𝑣⁼ (𝑋̅ − 𝜇)/(𝜎/√𝑛) √[(𝑛 − 1)𝑆2/𝜎2]/(𝑛 − 1)⁼ 𝑋̅ − 𝜇 𝑆/√𝑛^, berdistribusi 𝑡 dengan derajat bebas n-1. ∎

Jika ukuran sampel kecil, nilai-nilai 𝑆2 berfluktuasi dari sampel ke sampel dan distribusi 𝑇 cukup menyimpang dari distribusi Normal Standar. Jika ukuran sampel cukup besar (𝑛 ≥ 30), maka distribusi 𝑇 tidak berbeda jauh dari distribusi Normal Standar. Namun, untuk 𝑛 < 30, penggunaan distribusi 𝑇 akan lebih akurat daripada distribusi Normal Standar.

Contoh 2.2.4. Seorang ahli kimia mengklaim bahwa rata-rata populasi hasil proses batch tertentu adalah 500 gram per mililiter bahan baku. Untuk memeriksa klaim ini, ahli tersebut mengambil sampel sebanyak 25 batch setiap bulan. Jika nilai 𝑡 jatuh antara −𝑡_0.05 dan 𝑡_0.05, ahli tersebut puas dengan klaimnya. Kesimpulan apa yang ia tarik dari sampel yang memiliki rata-rata 𝑥̅ = 518 gram per mililiter dan standar deviasi sampel 𝑠 = 40 gram? Asumsikan distribusi hasil mendekati Normal.

Penyelesaian: Dari tabel distribusi 𝑡 diperoleh 𝑡_0.05= 1.711 dengan derajat bebas 24. Ahli tersebut dapat puas dengan klaimnya jika sampel 25 batch menghasilkan nilai 𝑡 antara -1.711 dan 1.711. Jika 𝜇 = 500, maka

𝑡 =^{518 − 500}

40/√25 ^{= 2.25,}

nilai tersebut di atas 1.711. Probabilitas nilai 𝑡, dengan 𝑣 = 24, sama atau lebih besar dari 2.25 adalah sekitar 0.02. Jika 𝜇 > 500, maka nilai 𝑡 yang dihitung dari sampel akan lebih masuk akal. Oleh karena itu, ahli tersebut cenderung menyimpulkan bahwa proses batch menghasilkan produk yang lebih baik daripada klaimnya.

Distribusi Sampling Perbedaan antara Dua Rata-Rata

Pada contoh sebelumnya, distribusi sampling hanya berpusat pada rata-rata tunggal 𝜇, khususnya untuk sampel berukuran besar (𝑛 ≥ 30) maupun sampel berukuran kecil (𝑛 < 30). Lebih jauh lagi, distribusi sampling tidak hanya berpusat pada rata-rata satu populasi, tetapi melibatkan dua populasi. Peneliti akan lebih tertarik dalam membandingkan percobaan yang melibatkan dua metode perbandingan. Dasar untuk perbandingannya adalah 𝜇₁− 𝜇₂, perbedaan pada rata-rata populasi.

Misalkan ada dua populasi, populasi pertama dengan rata-rata 𝜇₁ dan variansi 𝜎₁2, populasi kedua dengan rata-rata 𝜇₂ dan variansi 𝜎₂2. Statistik 𝑋̅₁ merepresentasikan rata-rata dari sampel acak berukuran 𝑛₁ yang dipilih dari populasi pertama. Statistik 𝑋̅₂ merepresentasikan rata-rata dari sampel acak berukuran 𝑛₂ yang dipilih dari populasi kedua dan saling bebas dengan sampel dari populasi pertama. Menurut Teorema Limit Pusat, variabel 𝑋̅₁ mendekati distribusi Normal dengan rata-rata 𝜇₁ dan variansi 𝜎₁²/𝑛₁ serta variabel 𝑋̅₂ mendekati distribusi Normal dengan rata-rata 𝜇₂ dan variansi 𝜎₂²/𝑛₂.

Oleh karena 𝑋̅₁ dan 𝑋̅₂ saling bebas, maka

𝑋̅₁− 𝑋̅₂ = 𝑎₁𝑋̅₁+ 𝑎₂𝑋̅₂, dengan 𝑎₁ = 1 dan 𝑎₂ = −1 mendekati distribusi Normal dengan rata-rata

𝜇_𝑋̅₁_−𝑋̅₂ = 𝜇_𝑋̅₁− 𝜇_𝑋̅₂ = 𝜇₁− 𝜇₂ dan variansi 𝜎_𝑋̅₁_−𝑋̅₂2 = 𝜎_𝑋̅₁2+ 𝜎_𝑋̅₂2 =^𝜎¹ 2 𝑛₁ ⁺ 𝜎₂² 𝑛₂^.

Teorema 2.2.6. Jika sampel berukuran 𝑛₁ dan 𝑛₂ yang saling bebas dan dipilih secara acak dari dua populasi dengan rata-rata 𝜇₁, 𝜇₂ dan variansi 𝜎₁2, 𝜎₂2, maka distribusi sampling dari perbedaan rata-rata 𝑋̅₁− 𝑋̅₂ mendekati distribusi Normal dengan rata-rata dan variansi diberikan oleh

𝜇_𝑋̅₁_−𝑋̅₂ = 𝜇₁− 𝜇₂ dan 𝜎_𝑋̅₁_−𝑋̅₂2 = ^𝜎1²

𝑛₁ +^𝜎2²

Dengan kata lain,

𝑍 = (𝑋̅₁ − 𝑋̅₂) − (𝜇₁− 𝜇₂) √(𝜎₁2/𝑛₁) + (𝜎₂2/𝑛₂) mendekati distribusi Normal Standar.

Bukti: Misalkan 𝑋₁₁, 𝑋₁₂,…, 𝑋_1𝑛₁adalah sampel acak saling bebas dari populasi dengan rata-rata 𝜇₁, variansi 𝜎₁2 dan 𝑋₂₁, 𝑋₂₂,…, 𝑋_2𝑛₂ adalah sampel acak saling bebas dari populasi dengan rata-rata 𝜇₂, variansi 𝜎₂2.

Dipandang rata-rata sampel

𝑋̅₁ =^∑^𝑛1𝑖=1^𝑋^1𝑖

𝑛₁ dan 𝑋̅₂ =^∑^𝑛2𝑖=1^𝑋^2𝑖

𝑛₂ . Fungsi pembangkit momen dari variabel acak 𝑋̅₁ adalah

𝑚_𝑋̅₁(𝑡) = 𝐸 (𝑒^𝑡 ∑^𝑛1𝑖=1𝑋1𝑖 𝑛1 ) = 𝐸 (𝑒^𝑡𝑋11𝑛1 𝑒^𝑡𝑋12𝑛1 … 𝑒^{𝑡𝑋1𝑛1}𝑛1 ), menurut teorema 2.1.3, 𝑚_𝑋̅₁(𝑡) = 𝑚_𝑋₁₁(^𝑡 𝑛₁^{) x 𝑚}^𝑋12(^𝑡 𝑛₁^{) x … x 𝑚}^𝑋1𝑛1(^𝑡 𝑛₁⁾ = (𝑒^𝜇1(^𝑡 𝑛1⁾⁺ 1 2𝜎²₁(^𝑡 𝑛1⁾ 2 ) 𝑛1 = 𝑒^𝜇¹^𝑡+ 1 2 𝜎12 𝑛1^𝑡 2 .

Dengan cara yang sama, fungsi pembangkit momen dari variabel acak 𝑋̅₂ adalah

𝑚_𝑋̅₂(𝑡) = 𝑒^𝜇2𝑡+¹₂^𝜎22

𝑛2^𝑡 2

. Dengan demikian, menurut teorema 2.1.3,

𝑚_𝑋̅₁_−𝑋̅₂(𝑡) = 𝑚_𝑋̅₁(𝑡)𝑚_𝑋̅₂(−𝑡) = 𝑒^𝜇1𝑡+¹ 2 𝜎12 𝑛1^𝑡 2 𝑒^−𝜇2𝑡+¹ 2 𝜎22 𝑛2(−𝑡)2 = 𝑒^(𝜇¹^−𝜇²^)𝑡+ 1 2(^𝜎12 𝑛1⁺ 𝜎22 𝑛2^)𝑡 2 .

Oleh karena 𝑚_𝑋̅₁_−𝑋̅₂(𝑡) identik dengan fungsi pembangkit momen dari distribusi Normal, maka menurut Teorema Ketunggalan, 𝑋̅₁− 𝑋̅₂ mempunyai distribusi Normal dengan rata-rata 𝜇₁−𝜇₂ dan variansi ^𝜎¹

𝑛1 +^𝜎2²

𝑛2. ∎

Jika 𝑛₁ dan 𝑛₂ lebih besar/sama dengan 30, maka pendekatan distribusi Normal untuk distribusi 𝑋̅₁− 𝑋̅₂ adalah baik ketika distribusi yang mendasarinya tidak terlalu jauh dari Normal. Bahkan, ketika 𝑛₁ dan 𝑛₂ kurang dari 30, pendekatan distribusi Normal juga cukup bagus, kecuali populasinya jelas tidak Normal. Jika populasinya Normal, maka distribusi 𝑋̅₁− 𝑋̅₂ akan berdistribusi Normal, tidak peduli berapapun ukuran sampel 𝑛₁ dan 𝑛₂.

Contoh 2.2.5. Dua percobaan independen (saling bebas) dijalankan untuk membandingkan dua jenis cat. Delapan belas spesimen dicat menggunakan cat jenis A dan waktu pengeringan direkam dalam jam. Hal yang sama juga dilakukan pada cat jenis B. Standar deviasi populasi keduanya adalah 1. Asumsikan rata-rata waktu pengeringan cat adalah sama untuk kedua jenis cat.

Tentukan 𝑃(𝑋̅_𝐴− 𝑋̅_𝐵> 1), dengan 𝑋̅_𝐴 dan 𝑋̅_𝐵 adalah rata-rata waktu pengeringan untuk sampel berukuran 𝑛_𝐴 = 𝑛_𝐵 = 18.

Penyelesaian: Distribusi sampling 𝑋̅_𝐴− 𝑋̅_𝐵 mendekati Normal dengan rata-rata 𝜇_𝑋̅_𝐴_−𝑋̅_𝐵 = 𝜇_𝐴 − 𝜇_𝐵 = 0.

dan variansi 𝜎_𝑋̅_𝐴_−𝑋̅_𝐵2 = ^𝜎^𝐴 2 𝑛_𝐴 ⁺ 𝜎_𝐵2 𝑛_𝐵 ⁼ 1 18⁺ 1 18⁼ 1 9^. 𝑃(𝑋̅_𝐴− 𝑋̅_𝐵> 1) diberikan oleh 𝑃(𝑋̅_𝐴− 𝑋̅_𝐵 > 1) = 𝑃 ( 𝑋̅_𝐴− 𝑋̅_𝐵− 0 √¹ 9 > 3 ) = 𝑃(𝑍 > 3) = 1 − 𝑃(𝑍 < 3) = 1 − 0.9987 = 0.0013.

Mesin dalam perhitungan di atas didasarkan pada anggapan bahwa 𝜇_𝐴 = 𝜇_𝐵. Percobaan sebenarnya dilakukan untuk tujuan menggambarkan kesimpulan tentang kesetaraan 𝜇_𝐴 dan 𝜇_𝐵, rata-rata waktu dua populasi pengeringan cat. Jika dua rata-rata berbeda sebanyak 1 jam (atau lebih), maka ini jelas merupakan bukti yang digunakan untuk menyimpulkan rata-rata populasi pengeringan cat tidak sama untuk kedua jenis cat.

Definisi 2.2.2. Distribusi non-sentral 𝑡 adalah distribusi sampling dari 𝑡 yang tidak terdistribusi di sekitar 0, tetapi di sekitar titik lain. Titik lain inilah yang dinamakan parameter non-sentral Δ. Parameter non-sentral Δ dapat dihitung sebagai

Δ =^𝜇¹^{− 𝜇} 𝜎/√𝑛^.

Dengan kata lain, distribusi non-sentral 𝑡 adalah distribusi sampling dari 𝑡 yang muncul ketika 𝜇₁ benar dan variansi populasi (𝜎) diasumsikan tidak diketahui.

Dalam dokumen EFFECT SIZE PADA PENGUJIAN HIPOTESIS. Skripsi. Diajukan untuk Memenuhi Salah Satu Syarat. Memperoleh Gelar Sarjana Sains. Program Studi Matematika (Halaman 20-47)