DISTRIBUSI SAMPLING
Program Studi Teknik Kimia
Fakultas Teknik Universitas Sebelas Maret 2019
Aida Nur Ramadhani, M.T. – Dr. Margono
Tika Paramitha, M.T. – Mujtahid Kaavessina, Ph.D
Pendahuluan
Tujuan :
 Mempelajari distirbusi sampling dari sebuah statistik
 Prinsip dasar distribusi sampling rata-rata
 Prinsip dasar distribusi sampling proporsi
Triola, Chapter 5-4 dan 5-5
 Distribusi sampling (sampling distribution) adalah distribusi dari rata-rata atau proporsi sampel yang diambil secara berulang-ulang (n kali) dari populasi.
 Ada sebanyak n rata-rata atau n nilai proporsi
Why sample with replacement ?
 Ketika pemilihan sampel dalam jumlah kecil dari populasi yang besar, tidak ada perbedaan signifikan antara pengembalian dan tanpa pengembalian
 Sampling dengan pengembalian merupakan kejadian independen yang tidak dipengaruhi oleh hasil sebelumnya, dan kejadian yang indipenden mudah dianalisa.
Distribusi Sampling Rata-Rata
Distribusi dari besaran rata-rata yang muncul dari sampel-sampel.
Pemilihan sampel dari populasi terbatas :
Apabila sampel-sampel random beranggota n masing-masing diambil dari suatu populasi yang mempunyai mean = µ dan standar deviasi = σ , maka distribusi sampling rata-rata akan mempunyai mean dan standar deviasi dengan pengembalian (with replacement) sebesar:
𝑀𝑒𝑎𝑛 = 𝜇 = (𝑥)
𝑁 𝑆𝑡𝑎𝑛𝑑𝑎𝑟 𝑑𝑒𝑣𝑖𝑎𝑠𝑖 = 𝜎 = 𝑥 − 𝜇 2 𝑁
Contoh 1
Diberikan sebuah populasi dengan N = 3, yakni terdiri atas 1, 2, dan 5. Perhitungan populasi tersebut memiliki µ = 2,7 dan σ = 1,7. Apabila diambil sampel sebanyak 2 (n).
Hitung mean dan standar deviasi !
Bila pengambilan sampel dilakukan dengan pengembalian (with replacement), maka akan terdapat 9 sampel dengan anggota 2 angka yang bisa diambil dari populasi tersebut. (Nn = 32= 9).
1 2 5
1 1 1
1 2 5
2 2 2
1 2 5
1 2 5 5
5 5 Populasi :
Sampel :
Perhitungan untuk populasi :
𝑀𝑒𝑎𝑛 = 𝜇 = 1 + 2 + 5
3 = 2,7
𝑆𝑡𝑎𝑛𝑑𝑎𝑟 𝑑𝑒𝑣𝑖𝑎𝑠𝑖 = 𝜎 = 𝑥 − 𝜇 2
𝑁 = (1 − 2,7)2+(2 − 2,7)2+(5 − 2,7)2
3 = 1,7
Standar deviasi mengukur bagaimana nilai-nilai data tersebar. Bisa juga didefinisikan sebagai, rata-rata jarak penyimpangan titik-titik data diukur dari nilai rata-rata data tersebut.
Perhitungan sampel, contoh untuk sampel 1,1.
𝑀𝑒𝑎𝑛 = 1 + 1 2 = 1 𝑀𝑒𝑑𝑖𝑎𝑛 = 1 + 1
2 = 1
𝑉𝑎𝑟𝑖𝑎𝑛𝑠 = 𝜎2 = 𝑥 − 𝜇 2
𝑁 = (1 − 1)2+(1 − 1)2
2 = 0
𝑆𝑡𝑎𝑛𝑑𝑎𝑟 𝑑𝑒𝑣𝑖𝑎𝑠𝑖 = 𝜎 = 𝑥 − 𝜇 2
𝑁 = 0 = 0
Perhitungan sampel diperoleh data berikut ini :
Rangkuman dari tabel sebelumnya :
𝑅𝑎𝑡𝑎 − 𝑅𝑎𝑡𝑎 𝐷𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑠𝑖 𝑆𝑎𝑚𝑝𝑙𝑖𝑛𝑔= 𝜇 = 𝑥 𝑃 𝑥 = 2,7
Mean Frekuensi Probability
1 1 1/9
1,5 2 2/9
2 1 1/9
3 2 2/9
3,5 2 2/9
5 1 1/9
Jumlah 9 1
Sample statistic dapat digunakan untuk mengestimasi parameter populasi, diantaranya yang menghasilkan nilai sesuai target parameter populasi adalah mean dan variance.
Meskipun standar deviasi tidak sama dengan parameter populasi, perbedaan tersebut masih relatif kecil jika digunakan untuk jumlah data yang besar.
Distribusi Sampling Proporsi
Distribusi sampling proporsi adalah distribusi dari proporsi (presentase) yang diperoleh dari semua sampel sama besar yang mungkin dari satu populasi.
Dapat digunakan untuk mengetahui perbandingan antara dua hal yang berkomplemen seperti % bilangan ganjil dan bilangan genap, % pemilih dan bukan pemilih dalam pemilu, dsb.
Contoh 2
Diberikan sebuah populasi dengan N = 3, yakni terdiri atas 1, 2, dan 5. Dua bilangan tersebut adalah bilangan ganjil dan satu bilangan yang lain adalah bilangan genap.
Apabila diambil sampel dua bilangan, maka tentukan distribusi sampling proporsi untuk bilangan ganjil! Tentukan mean dan bandingkan nilainya dengan parameter populasinya.
Perhitungan untuk populasi :
𝑃𝑟𝑜𝑝𝑜𝑟𝑠𝑖 𝑏𝑖𝑙𝑎𝑛𝑔𝑎𝑛 𝑔𝑎𝑛𝑗𝑖𝑙 = 𝑗𝑢𝑚𝑙𝑎ℎ 𝑏𝑖𝑙𝑎𝑛𝑔𝑎𝑛 𝑔𝑎𝑛𝑗𝑖𝑙 𝑗𝑢𝑚𝑙𝑎ℎ 𝑝𝑜𝑝𝑢𝑙𝑎𝑠𝑖 = 2
3 = 0,667
Perhitungan untuk sampel, contoh untuk sampel 1,1.
𝑃𝑟𝑜𝑝𝑜𝑟𝑠𝑖 𝑏𝑖𝑙𝑎𝑛𝑔𝑎𝑛 𝑔𝑒𝑛𝑎𝑝 (𝑠𝑎𝑚𝑝𝑒𝑙 1,1) = 𝑗𝑢𝑚𝑙𝑎ℎ 𝑏𝑖𝑙𝑎𝑛𝑔𝑎𝑛 𝑔𝑎𝑛𝑗𝑖𝑙 𝑝𝑎𝑑𝑎 𝑠𝑎𝑚𝑝𝑒𝑙 𝑗𝑢𝑚𝑙𝑎ℎ 𝑡𝑜𝑡𝑎𝑙 𝑏𝑖𝑙𝑎𝑛𝑔𝑎𝑛 𝑝𝑎𝑑𝑎 𝑠𝑎𝑚𝑝𝑒𝑙 = 2
2 = 1
Hasil perhitungan:
𝐷𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑠𝑖 𝑆𝑎𝑚𝑝𝑙𝑖𝑛𝑔Proporsi = 𝑃𝑟𝑜𝑝𝑜𝑟𝑠𝑖 𝑥 𝑃 𝑥 = 0,667
Teori Limit Sentral
Pada umumnya, normalitas dari distribusi sampling rata-rata disebut teorema limit sentral dan dinyatakan sebagai berikut :
1. Jika populasi tidak terdistribusi secara normal, untuk sampel dengan jumlah n>30, distribusi sampling dapat diasumsikan mendekati distribusi normal.
2. Jika populasi cukup besar dan berdistribusi secara normal maka distribusi samplingnya akan normal.
Berlaku rumus berikut ini:
Mean :
Standar deviasi : 𝜇𝑥− = 𝜇
𝜎𝑥− = 𝜎 𝑛
Diberikan populasi dengan N = 10, yakni terdiri atas 0, 1, 2, 3, 4, 5, 6, 7, 8, dan 9. Sampel diambil sebanyak 4 angka (n) dan data mengenai 50 sampel tercantum pada tabel di samping.
Contoh 3
50 sampel x 4 angka/(sampel) = 200 angka
Distribusi 200 angka dari 50 sampel data di atas sebagai berikut :
Jumlah angka (0-9) tidak terdistribusi secara normal, jumlah angka hampir sama dari 0-9.
Sedangkan, distribusi sampling rata-rata (x) dari 50 sampel sebagai berikut :
Rata-rata angka dari sampel tersebut terdistribusi secara normal. Pada teori limit sentral, n>30 dapat diasumsikan terdistribusi normal. Pada contoh 3 ini, dengan n = 4 memiliki distribusi normal.
Semakin besar ukuran sampel (n), distribusi sampling rata-rata mendekati distribusi normal.
Aplikasi Teori Limit Sentral
 When working with an individual value from a normally distributed population,
𝑧 =
𝑥−𝜇𝜎
 When working with a mean for some sample (or group),
𝑧 =
𝑥−𝜇𝑥−𝜎𝑥−
Contoh 4
Sistem keamanan pada Gondola yaitu kapasitas maksimum 12 orang dan berat maksimum 2400 lb. Kapasitas akan melebihi batasannya jika 12 orang tersebut memiliki berat rata-rata melebihi 2400 lb/12 = 167 lb. Dikarenakan laki-laki memiliki berat yang lebih besar dibandingkan perempuan, “kejadian buruk” jika 12 orang tersebut semuanya laki-laki. Laki-laki memiliki berat yang terdistribusi normal dengan rata-rata 172 lb dan standar deviasi 29 lb (National Health Survey).
a. Tentukan probabilitas satu orang laki-laki (naik Gondola) dan memiliki berat lebih besar dari 167 lb
b. Tentukan probabilitas 12 orang laki-laki (naik Gondola) dan memiliki berat rata- rata lebih besar dari 167 lb (sehingga berat total melebih barat maksimum gondola)
a.
𝑧 = 𝑥 − 𝜇 𝜎 𝑧 = 167 − 172
29 = −0,17
Berdasarkan Tabel A-2, z = -0,17 diperoleh nilai 0,4325 (slide berikutnya) dan grafik berikut:
Sehingga, probabilitas laki-laki (naik Gondola) memiliki berat
lebih 167 lb adalah 1-0,4325=0,5675.
b.
𝑧 = 𝑥 − 𝜇𝑥−
𝜎𝑥− = 167 − 172
8,31758 = −0,60
Berdasarkan Tabel A-2, z = -0,60 diperoleh nilai 0,2743 (slide berikutnya) dan grafik berikut:
Sehingga, probabilitas 12 laki-laki
(naik Gondola) memiliki berat lebih 167 lb adalah 1-0,2743=0,7257.
𝜇𝑥− = 𝜇 = 172 𝜎𝑥− = 𝜎
𝑛 = 29
12 = 8,31758
Contoh 5
Rata-rata temperatur badan suatu populasi sebesar 98,6°F. Standar deviasi populasi 0,62°F (University of Maryland). Jika ukuran sampel n = 106, tentukan probabilitas rata-rata diperoleh 98,2°F atau kurang.
Ukuran sampel n sebesar 106, sehingga lebih dari 30 sehingga digunakan teori limit sentral.
𝑧 = 𝑥 − 𝜇𝑥−
𝜎𝑥− = 98,2 − 98,6
0,0602197 = −6,64
Berdasarkan Tabel A-2, z = -6,64 diperoleh nilai 0,0001 (slide berikutnya) dan grafik berikut:
Sehingga, probabilitas rata-rata diperoleh 98,2°F atau kurang adalah 1-0,0001=0,9999.
𝜇𝑥− = 𝜇 = 98,6 𝜎𝑥− = 𝜎
𝑛 = 0,62
106 = 0,0602197
Koreksi untuk Populasi Terbatas
Ketika sampling tanpa pengembalian dan nilai sampel n lebih besar dari 5% dari jumlah populasi N (n > 0,05N), standar deviasi (𝜎𝑥−) dari sampling rata-rata dikalikan dengan faktor koreksi berikut:
𝑁 − 𝑛 𝑁 − 1 Rumus standar deviasi menjadi:
𝜎𝑥− = 𝜎 𝑛
𝑁 − 𝑛 𝑁 − 1