DISTRIBUSI PROBABILITAS NORMAL
&
DISTRIBUSI SAMPLING
Distribusi probabilitas normal:
𝑃 𝑥
=
1
𝜎
2
𝜋
𝑒
− 𝑋−𝜇 2𝜎2 2
dengan
𝜋 = 3,1416....
𝑒 = 2,7183....
𝜇 = parameter, yang merupakan rata-rata untuk distribusi
𝜎 = parameter, yang merupakan deviasi standar (simpangan baku) untuk distribusi
Karakteristik dari distribusi probabilitas normal:
berbentuk lonceng, yaitu saat mean aritmetika, median, dan modus bernilai sama dan terletak di tengah kurva distribusi; total luas daerah di bawah kurva adalah 1
mean-nya bersifat simetris, sehingga luas daerah di bawah kurva ke kiri dari mean adalah 0,5 dan luas daerah di bawah kurva ke kanan dari mean adalah 0,5
lokasi dari distribusi normal ditentukan oleh mean (𝜇), sedangkan penyebaran data ditentukan oleh deviasi standar (𝜎)
Secara grafik, karakteristik dari distribusi probabilitas normal adalah sebagai berikut.
Gambar 1. Karakteristik dari suatu distribusi probabilitas normal
Banyaknya distribusi normal tidak terbatas karena setiap sampel dari populasi bisa jadi akan memiliki mean yang berbeda dan deviasi standar yang berbeda pula.
Untuk lebih jelasnya, perhatikan contoh gambar berikut dengan: a. mean-nya sama dan deviasi standarnya berbeda,
a.
b.
c.
Gambar 2. Contoh suatu distribusi probabilitas normal dengan beragam nilai 𝝁 dan 𝝈
DISTRIBUSI PROBABILITAS NORMAL STANDAR
𝑍
=
𝑋 − 𝜇
𝜎
↔
𝑋
=
𝜇
+
𝑍𝜎
dengan 𝑋 = nilai observasi pada data𝜇 = mean populasi
𝜎 = deviasi standar populasi
Distribusi 𝑧 atau distribusi probabilitas normal standar ini memiliki keunikan, yaitu mean
𝜇= 0 dan deviasi standar 𝜎= 1.
Setelah memiliki distribusi probabilitas normal standar yang didapat dari distribusi probabilitas normal, maka daftar distribusi normal standar (tabel distribusi 𝑧) dapat digunakan. Dengan daftar ini, bagian-bagian luas dari distribusi normal standar dapat dicari. Berikut adalah sebagian kecil dari tabel distribusi 𝑧.
Gambar 3. Luas area di bawah kurva normal
Contoh 1
Pendapatan mingguan dari mandor terjadwal di industri kaca mengikuti distribusi probabilitas normal dengan rata-rata $1000 dan deviasi standar $100. Berapakah 𝑧 hitung pada pendapatan (sebut saja 𝑋) dari mandor yang menghasilkan $1100 per minggu? Bagaimana pula 𝑧 hitung dari mandor yang menghasilkan $900 per minggunya?
Jawab:
Diketahui 𝜇 = 1000 dan 𝜎= 100. Untuk 𝑋= $1100:
𝑍= 𝑋 − 𝜇
𝜎 =
1100−1000
100 = 1,00
Untuk 𝑋= $900:
𝑍= 𝑋 − 𝜇
𝜎 =
900−1000
100 = −1,00
Selanjutnya, kita akan mempelajari bagaimana cara mencari luas di bawah kurva normal (atau juga disebut probabilitas) dengan menggunakan distribusi probabilitas normal standar (distribusi 𝑧). Perhatikan contoh berikut.
Contoh 2
Tentukan 𝑃{𝑍 ≤1,63} !
Jawab:
𝑃{𝑍 ≤1,63} berarti bahwa probabilitas ini bergantung pada luas area di bawah kurva ke kiri dari titik 𝑧= 1,63.
Jadi, 𝑃{𝑍 ≤1,63} =𝑃{−∞<𝑍< 0} +𝑃{0≤ 𝑍 ≤1,63}.
Untuk 𝑃{−∞<𝑍< 0}, nilainya pasti sama dengan 0,5 (ingat kembali karakteristik
„simetris‟ dari distribusi probabilitas normal).
Sementara, untuk 𝑃{0≤ 𝑍 ≤1,63}, nilainya dapat dilihat dari tabel distribusi 𝑧 (atau perhatikan kembali Gambar 3), nilainya sama dengan 0,4484.
Maka,
𝑃{𝑍 ≤1,63} =𝑃{−∞< 𝑍< 0} +𝑃{0≤ 𝑍 ≤1,63} = 0,5 + 0,4484 = 0,9484
Gambar 4. Luas area di bawah kurva normal standar pada Contoh 2
Nilai probabilitas 𝑃{0≤ 𝑍 ≤1,63} = 0,4484 ini menunjukkan bahwa probabilitas secara acak terpilihnya suatu objek yang berada antara 𝑧= 0 hingga 𝑧= 1,63, atau antara 𝑥= 𝜇 dan 𝑥 =𝜇+ 1,63𝜎 adalah sebesar 0,4484.
Contoh 3
PT Work Electric memproduksi bola lampu yang dapat menyala dengan rata-rata selama 900 jam dan deviasi standarnya 50 jam. Hitunglah berapa probabilitas bola lampu yang diproduksi dapat menyala selama 800 – 1000 jam!
Jawab:
Diketahui 𝜇 = 900 dan 𝜎= 50.
Lalu, misalkan 𝑋1 = 800 dan 𝑋2 = 1000. Dengan menggunakan transformasi distribusi 𝑧, didapatlah nilai-nilai 𝑧-nya:
𝑍1 =
Jadi, probabilitas produksi bola lampu dapat menyala selama sekitar 800 – 1000 jam adalah:
𝑃{800 <𝑋< 1000} = 𝑃{−2 < 𝑍< 2}
PENDEKATAN NORMAL TERHADAP BINOMIAL
Ingat kembali, probability mass function (pmf) dari distribusi binomial:
( ) n x(1 )n x
Distribusi probabilitas normal dapat digunakan sebagai pengganti distribusi binomial pada nilai n yang besar, karena jika n bertambah, distribusi binomial menjadi semakin mendekati distribusi normal. Transformasi 𝑧-nya adalah sebagai berikut:
𝑍
=
𝑋 − 𝜇
“Kapan pendekatan normal terhadap binomial dapat dilakukan?”
Distribusi probabilitas normal merupakan pendekatan yang baik untuk distribusi probabilitas binomial ketika 𝑛𝑝 1− 𝑝 ≥10.
Namun, perlu diperhatikan bahwa terdapat perbedaan yang signifikan diantara kedua probabilitas tersebut. Distribusi probabilitas normal merupakan distribusi probabilitas kontinu, sementara distribusi probabilitas binomial merupakan distribusi probabilitas diskret. Oleh sebab itu, terdapat faktor koreksi kontinuitas.
Faktor koreksi kontinuitas adalah nilai 0,5 yang dikurangkan atau dijumlahkan (bergantung pada pertanyaannya) pada nilai yang terpilih ketika distribusi probabilitas diskret diperkirakan melalui distribusi probablitas kontinu.
Contoh 4
Sebuah koin dilempar 40 kali. Hitunglah probabilitas munculnya angka sebanyak 20 kali! Lalu, gunakanlah pendekatan normal untuk menghitung probabilitas munculnya angka sebanyak 20 kali!
Jawab:
Misalkan X adalah banyaknya angka yang muncul (“berhasil”) pada pelemparan suatu koin sebanyak 40 kali. X merupakan variabel acak binomial dengan n = 40 dan p = ½. Yang ditanyakan adalah P X{ 20}.
>> Dengan menggunakan distribusi probabilitas binomial:
20 20
>> Dengan menggunakan distribusi probabilitas normal:
Dalam hal ini, np20; np(1p) 10 ; X120 0,5 19,5 ; X2 20 0,5 20,5. Dengan menggunakan transformasi distribusi 𝑧, didapatlah nilai-nilai 𝑧-nya:
{ 20}
Rata-rata sampel diambil untuk mengestimasi rata-rata populasi. Namun, karena sampel adalah bagian dari populasi, maka tentunya rata-rata sampel tidak akan benar-benar sama dengan rata-rata populasi. Begitu pula dengan deviasi standar, pasti ada perbedaan atau selisih antara deviasi standar sampel dengan deviasi standar populasi.
Perbedaan/selisih dari statistik suatu sampel dengan parameter dari populasinya disebut kesalahan sampling.
Kesalahan sampling yang bernilai positif menunjukkan rata-rata sampel over-estimated untuk rata-rata populasi, sedangkan kesalahan sampling yang bernilai negatif menunjukkan rata-rata sampel under-estimated untuk rata-rata populasi.
Contoh 5
Berikut ini adalah daftar nama-nama mahasiswa yang mengambil mata kuliah Aljabar Linier beserta nilai ujian mid mereka masing-masing.
a. Tentukan rata-rata nilai Aljabar Linier dari seluruh mahasiswa tersebut!
b. Ambil 3 macam sampel yang masing-masingnya terdiri dari 6 mahasiswa, kemudian hitunglah rata-rata nilai dari masing-masing sampel! Bandingkanlah rata-rata nilai dari masing-masing sampel dengan rata-rata nilai Aljabar Linier dari seluruh mahasiswa dengan menghitung kesalahan samplingnya!
1 Rian Lie 100 16 Vivi Siddhartha 60
2 Justin Salim 100 17 Mega Velyana 100
3 Bambang Rizky 90 18 Mhd Rizal Srg 85
4 Nikko Haryanto 80 19 Luis Andy Gunawan 85
5 Riandy 85 20 Eddy Johan 100
6 Viyan Sunata 90 21 Maya 90
7 Stephen Lie 90 22 Deby Claudia Dinti 100
8 Ricky Meidianto 80 23 Steven Halim 95
9 Davin Joice Wijaya 100 24 Cinthia Amorita 85
10 Ardi Gus Dwiyono 90 25 Heri Ependy 90
11 Dani Saputra 95 26 Darmawan 75
12 Desfriyanto Taswin 100 27 M. Irvan Syahputra J 100
13 Daniel Leonardo 90 28 Willy 100
14 Rina Ambar Wisni 60 29 Luckyanto Lim 90
Jawab:
a. Rata-rata populasi: total seluruh nilai 2655 88,5 banyak mahasiswa 30
b. Berikut adalah 3 (contoh) macam sampel yang terdiri dari 6 mahasiswa beserta dengan kesalahan sampling dari masing-masing sampel:
Nama Nilai Nama Nilai Nama Nilai
Justin Salm 100 Nikko Haryanto 80 Viyan Sunata 90
Stephen Lie 90 Davin Joice Wijaya 100 Dani Saputra 95
Desfriyanto Taswin 100 Rina Ambar Wisni 60 Vivi Siddharta 60
Mega Velyana 100 Luis Andy Gunawan 85 Maya 90
Deby Claudia Dinti 100 Cinthia Amorita 85 Darmawan 75
M. Irvan Syahputra 100 Luckyanto Lim 90 Rian Life 100
RATA-RATA 98,33 RATA-RATA 83,33 RATA-RATA 85
Kes. Sampling 9,83 Kes. Sampling -5,17 Kes. Sampling -3,5
SAMPEL 1 SAMPEL 2 SAMPEL 3
Dari Contoh 5 di atas, jika sampel yang diambil terdiri dari 6 mahasiswa, maka banyaknya macam sampel yang mungkin terjadi ada sebanyak:
30
Perhatikan bahwa rata-rata sampel pada Contoh 1 berbeda-beda dari satu sampel ke sampel selanjutnya. Rata-rata sampel pertama dari 6 mahasiswa adalah 98,33; rata-rata sampel kedua adalah 83,33; rata-rata sampel ketiga adalah 85; sementara rata-rata populasinya adalah 88,5.
Jika kita menyusun rata-rata seluruh kemungkinan sampel dari 6 mahasiswa menjadi bentuk distribusi probabilitas, hasilnya disebut dengan distribusi sampling rata-rata sampel.
Distribusi sampling rata-rata sampel merupakan suatu distribusi dari seluruh kemungkinan rata-rata sampel dari ukuran sampel yang diketahui.
Contoh 6
P
a. Berapa rata-rata populasinya?
b. Buatlah distribusi sampling rata-rata sampel pada sampel berukuran 2? c. Berapa rata-rata dari distribusi sampling?
Jawab:
a. total seluruh pendapatan 54 7, 71 banyak karyawan 7
b. Banyaknya macam sampel yang dapat dibentuk jika masing-masing sampel terdiri dari 2 karyawan adalah:
Maka, distribusi sampling rata-rata sampel pada sampel berukuran 2 adalah:
Rata-Rata Sampel Nomor Rata-Rata Probabilitas
7 3 3/21
7,5 9 9/21
8 6 6/21
8,5 3 3/21
21 1
c. Rata-rata distribusi sampling rata-rata sampel
X diperoleh dengan menjumlahkan beberapa rata-rata sampel dan membagi jumlahnya dengan banyaknya sampel.7 7,5 7,5 7 ... 7,5 8 8,5 162
7, 71
21 21
X
Contoh 6 di atas mengilustrasikan hubungan erat antara distribusi populasi dengan distribusi sampling rata-rata sampel:
1) Rata-rata dari rataan sampel sama persis dengan rata-rata populasi.
2) Sebaran distribusi sampling rata-rata sampel lebih kecil daripada distribusi populasi. [Pada Contoh 6, sebaran nilai untuk distribusi populasi adalah 7 – 9, sedangkan sebaran nilai untuk distribusi sampling rata-rata sampel adalah 7 – 8,5.]
3) Distribusi sampling rata-rata sampel cenderung berbentuk lonceng dan mendekati distribusi probabilitas normal.
TEOREMA LIMIT TENGAH
Jika seluruh sampel suatu ukuran dari populasi apapun dipilih, maka distribusi sampling rata-rata sampel mendekati distribusi normal. Pendekatan ini semakin baik jika sampel yang dipilih semakin banyak.
Gambar 6. Hasil dari Teorema Limit Tengah pada beberapa populasi
Jika adalah rataan populasi dan adalah deviasi standar populasi, maka rataan dan deviasi standar dari distribusi sampling rata-rata sampel adalah sebagai berikut:
X
; X
n
L A T I H A N S O A L
1. Hitunglah:
a. P{ 1,86 Z 0} c. P{1, 4 Z 2, 65}
b. P{ 1,5 Z 1,82} d. P Z{ 1,96}
2. Keluarga Kamp memiliki anak kembar, Rob dan Rachel. Rob dan Rachel keduanya lulus dari universitas 2 tahun yang lalu, dan masing-masingnya sekarang memperoleh $50000 per tahun. Rachel bekerja di industri eceran, di mana rata-rata gaji untuk eksekutif dengan pengalaman kurang dari 5 tahun adalah $35000 dengan deviasi standar $8000. Rob adalah seorang insinyur. Rata-rata gaji insinyur dengan pengalaman kurang dari 5 tahun adalah $60000 dengan deviasi standar $5000. Hitunglah nilai 𝑧 untuk Rob dan Rachel, kemudian jelaskan maksudnya !
3. Suatu data yang berdistribusi normal memiliki rata-rata 50 dan deviasi standar 4. a. Hitunglah probabilitas dari nilai antara 44 dan 55 !
b. Hitunglah probabilitas dari nilai yang lebih besar dari 55 ! c. Hitunglah probabilitas dari nilai antara 52 dan 55 !
4. Rata-rata berat bayi yang baru lahir 3750 gram dengan deviasi standar 325 gram. Jika berat bayi diasumsikan berdistribusi normal, maka tentukan:
a. berapa probabilitas bayi yang beratnya lebih dari 4500 gram ?
b. berapa banyak bayi yang beratnya antara 3500 – 4500 gram jika total bayinya ada 10000 ?
c. berapa banyak bayi yang beratnya lebih kecil atau sama dengan 4000 gram jika total bayinya ada 10000 ?
d. berapa banyak bayi yang beratnya 4250 gram jika total bayinya ada 5000 ?
5. Studi yang diadakan oleh Taurus Health Club menyatakan bahwa 30% dari anggotanya mengalami kegemukan. Jika anggota keseluruhan berjumlah 500 orang, maka:
a. berapa probabilitas bahwa 175 anggota atau lebih mengalami kegemukan ? b. berapa probabilitas bahwa 140 anggota atau lebih mengalami kegemukan ?
6. Pada badan hukum Tybo dan Associates, terdapat enam orang partner. Berikut merupakan rekanan dan jumlah kasus yang ditangani masing-masing di pengadilan pada bulan lalu.
a. Berapa banyak kemungkinan sampel berbeda yang berukuran 3 ?
b. Tulislah seluruh kemungkinan sampel berukuran 3, dan hitung rata-rata populasi setiap sampel !