• Tidak ada hasil yang ditemukan

Handout INF107 PS Pertemuan 11

N/A
N/A
Protected

Academic year: 2017

Membagikan "Handout INF107 PS Pertemuan 11"

Copied!
11
0
0

Teks penuh

(1)

Mata Kuliah Statistika Probabilitas

Dosen Safitri Jaya

Modul 11 (sebelas)

Topik Distribusi Sampling (lanjutan) Sub Topik Konsep Distribusi Sampling

Materi

1. Konsep Distribusi Sampling

2. Dalil Batas Memusat (The Central Limit Theorem) 3. Distribusi Sampling Rata-rata

4. Faktor Koreksi untuk Populasi Terbatas 5. Distribusi Sampling Beda Rata-rata 6. Distribusi Sampling Proporsi

7. Distribusi Sampling Beda Proporsi

Tujuan

1. Memahami konsep distribusi sampling dan perhitungannya

2. Menjelaskan Dalil Batas Tengah

3. Memahami konsep faktor koreksi untuk populasi terbatas

4. Memahami konsep distribusi sampling

5. Mengoperasikan rumus-rumus distribusi sampling proporsi

DISTRIBUSI SAMPLING (Lanjutan…)

11.1 Konsep Distribusi Sampling

(2)

sampel yang mungkin jika kita mengambil sejumlah sampel dari populasi, beserta dengan probabilitas setiap rata-rata sampel. Jika kita memiliki populasi yang terdiri dari tiga orang, yaitu A, B, C, lalu mengambil sampel sebanyak 2 orang, ada 3 kombinasi sampel yang mungkin terpilih, yaitu AB, AC dan BC. Jika kita mengambil 10 sampel dari populasi sebanyak 60, maka kita mempunyai kombinasi 60 dari 10. Kita tahu bahwa ukuran populasi (N) biasanya sangat besar dan ukuran sampel (n) relatif lebih kecil. Oleh karenanya, jika kita melakukan pengambilan sampel n dan N populasi, kita akan memiliki kombinasi N terhadap n. Setiap kombinasi sampel memiliki ukuran (statistik sampel), misalnya rata-rata sampel. Maka jika kita mengambil n sampel dari N populasi, kita akan memiliki rata-rata sampel yang cukup banyak.

Telah disebutkan bahwa rata-rata sampel merupakan variabel acak sehingga mempunyai distribusi sendiri. Menurut dalil batas memusat, jika populasi terdistribusi secara normal, rata-rata sampel yang banyak tersebut juga akan terdistribusi secara normal. Distribusi rata-rata sampel adalah distribusi sampling atau tepatnya distribusi sampling rata-rata. Distribusi sampling rata-rata merupakan distribusi normal, yang berbentuk lonceng, simetris dan memiliki rata-rata dan deviasi standar.

Contoh :

PT Green Bay Packer memiliki 7 karyawan bagian produksi (dianggap sebagai populasi) dengan keterangan upah per jam setiap karyawan seperti berikut

Karyawan Upah/Jam

Seorang peneliti ingin mengetahui rata-rata upah per jam karyawan di perusahaan tersebut. Untuk melakukannya, ia dapat menggunakan dua cara, yaitu :

(3)

b. Meneliti sampel

Misalnya peneliti tersebut mengambil sampel sebanyak 4 karyawan, maka ada 35 kombinasi sampel yang mungkin terambil, yaitu dari perhitungan

C(7,4) = 7! (7 – 4)! 4!

Masing-masing kombinasi sampel memiliki statistik sampel atau rata-rata sampel. 35 sampel tersebut disajikan pada tabel berikut ini

Rata-rata sampel Frekuensi Probabilitas

Deviasi standar distribusi sampling rata-rata disebut juga galat baku mean (standard error of mean).

11.2 Dalil Batas Memusat (The Central Limit Theorem)

Dalil batas memusat adalah suatu dalil yang sangat penting peranannya dalam distribusi sampling, yang menyatakan bahwa untuk suatu populasi dengan rata-rata µ dan varian δ, distribusi sampling rata-rata dari semua kemungkinan sampel berukuran n yang diambil dari populasi akan terdistribusi secara normal dengan rata-rata µx dan deviasi standar δx, dimana nilai µx sama dengan rata-rata populasi (µ) dan

δx sama dengan deviasi standar populasi dibagi akar n atau δ / √n, dengan asumsi

(4)

distribusi probabilitas normal untuk ukuran sampel yang besar. Beberapa hal penting yang perlu diingat dari dalil tersebut adalah sebagai berikut (Atmaja, 2010)

1. Jika ukuran sampel (n) cukup besar, distribusi rata-rata sampel akan mendekati normal, tidak peduli apakah populasinya terdistribusi secara normal atau tidak.

2. µx = µdan δx = δ / √n

keterangan :

µx = rata-rata dari distribusi sampling rata-rata

µ = rata-rata populasi

δx = deviasi standar dari distribusi sampling rata-rata

δ = deviasi standar populasi n = ukuran sampel

3. Tidak ada angka yang pasti tentang “ukuran sampel yang cukup besar”, tetapi biasanya angka n > 30 dianggap cukup besar.

11.3 Distribusi Sampling Rata-rata

Pada hakikatnya, distribusi sampling rata-rata adalah distribusi probabilitas rata-rata sejumlah C sampel, N adalah ukuran populasi dan n adalah ukuran sampel yang diambil dari populasi. Distribusi ini memiliki rata-rata µx dan deviasi standar δx.

Sementara itu menurut dalil batas memusat, µx = µdan δx = δ / √n. jika disusun ke

dalam suatu distribusi, rata-rata tersebut sama seperti nilai-nilai dalam distribusi skor mentah. Distribusi semacam ini disebut distribusi sampel rata-rata (sample distribution of means). Selanjutnya dapat dihitung rata-rata dari distribusi sampel rata-rata (means of sample distribution). Rata-rata distribusi ini akan sama dengan rata-rata populasi (Partino, 2010).

Contoh :

Bank Pasti Aman menghitung tabungan seluruh nasabahnya. Setelah penghitungan, bank tersebut mendapati bahwa rata-rata tabungan setiap nasabahnya sebesar Rp2.000, dengan deviasi standar Rp600, apabila seorang peneliti mengambil sampel sebanyak 100 nasabah, berapa probabilitas jika :

(5)

b. Rata-rata sampel akan lebih kecil dari Rp2.050 c. Rata-rata sampel akan lebih kecil dari Rp1.900

Jawab :

Jika peneliti mengambil sampel 100 dari 600 populasi, akan terdapat C(600, 100) kombinasi sampel yang mungkin. Dengan kata lain, kaan terdapat sebanyak C(600, 100) rata-rata sampel. Jumlah rata-rata sampel tersebut cukup banyak sehingga distribusinya normal (hal ini konsisten dengan dalil batas memusat). Distribusi sampling rata-rata ini memiliki rata-rata dan deviasi standar sebagai berikut :

µx = µ = Rp2.000

δx = δ / √n = 600 / √100 = 60

a. Selanjutnya, untuk menyelesaikan soal tersebut, kita akan menerapkan konsep menghitung luas daerah kurva normal

Z = x - µx xx

untuk x = 1900, Z = 1900 – 2000

60 = -1.67 = 45,25% untuk x = 2050, Z = 2050 – 2000

60 = 0.83 = 29.67% Maka P(1900 < x < 2050) = 45.25% + 29.67% = 74.9%

b. P(x < 2050)

untuk x = 2050, Z = 2050 – 2000

60 = 0.83 = 29.67% Maka P(x < 2050) = 50% - 29.67% = 20.33%

c. P(x < 1900)

untuk x = 1900, Z = 1900 – 2000

60 = -1.67 = 45,25% Maka P(x < 1900) = 50% - 45.25% = 4.75%

(6)

Jika populasi sangat besar, kita asumsikan populasi tersebut tak terbatas (infinite). Bagaimana jika populasi tidak tak terbatas atau tidak sangat besar? Dalam kasus ini, kita harus melakukan beberapa penyesuaian/koreksi terhadap deviasi standar dari distribusi sampling dengan cara mengalikan δ / √n dengan suatu faktor koreksi sebesar √ (N-n) / (N-1) atau

Rumus 11.2

δx = [δ / √n] x [√ (N-n) / (N-1)]

keterangan :

N = ukuran populasi (yang terbatas/tidak besar) n = ukuran sampel

Mengapa faktor koreksi ini perlu dan apa efeknya? Jika sampel adalah suatu persentase yang cukup besar dari populasinya, kita mengharapkan ukurannya akan lebih tepat daripada ukuran suatu sampel yang lebih kecil. Perhatikan efek dari faktor koreksi, misalnya kita mengambil sampel dengan ukuran 100 dari populasi berukuran 1000, besar faktor koreksinya adalah 0.9492. Jika dikalikan dengan faktor koreksi tersebut, deviasi standar distribusi sampling rata-rata (atau galat baku mean) akan berkurang sebesar 1 – 94,92% = 5%. Semakin besar ukuran sampel, semakin besar pengurangan galat baku tersebut, demikian pula sebaliknya.

Jika n/N lebih kecil dari 5%, faktor koreksi mendekati 1 sehingga muncul aturan jika n/N lebih kecil dari 55, faktor koreksi tidak perlu digunakan, kalaupun digunakan, pengaruhnya tidak akan banyak, karena nilainya mendekati 1.

Contoh :

Ukuran sampel (n) Bagian dari Populasinya (n/N) Faktor Koreksi

10 1% 99.55%

25 2.5% 98.79%

50 5% 97.52%

100 10% 94.92%

200 20% 89.49%

(7)

Bila sampel acak dengan n=10 dipilih dari populasi sebesar 40 dengan rata-rata 5.5 dan deviasi standar 2.9155, berapa rata dan deviasi distribusi sampling rata-rata?

Jawab

Menurut dalil batas memusat dan penyesuaian terhadap koreksi, µx = µ = 5.5 dan

δx = [δ / √n] x [√ (N-n) / (N-1)] = 0.2773

11.5 Distribusi Sampling Beda Rata-rata

Misalnya, kita sedang meneliti 2 populasi, yaitu populasi 1 dan populasi 2 yang masing-masing memiliki ukuran N1 dan N2, kemudian dari masing-masing populasi tersebut kita mengambil sampel dengan ukuran n1 dan n2. Pengambilan sampel n1 dari populasi N1 menghasilkan kombinasi sampel sebanyak C(N1, n1) dan pengambilan sampel n2 dari populasi N2 menghasilkan kombinasi sampel sebanyak C(N2, n2). Dengan kata lain, kita memiliki rata sampel dari populasi 1 dan rata-rata sampel dari populasi 2 yang cukup banyak. Jika X adalah selisih X1 dan X2 (X = X1 – X2), kita akan memiliki X yang banyak sekali yang membentuk suatu distribusi normal yang disebut distribusi sampling beda rata-rata. Distribusi sampling ini memiliki rata-rata µx1 – x2 dan deviasi standar atau galat baku δx1 – x2. Jika kita mengurangi x1 dengan x2, kita akan mendapat variabel x1-x2 yang banyak sekali yang membentuk distribusi normal. Menurut dalil batas memusat,

Rumus 11.3 µx1 – x2 = µ1 - µ2

δx1 – x2 = √ δ12/n1 + δ22/n2

Contoh :

(8)

buah lampu pijar dan diteliti, berapa probabilitas bahwa selisih rata-rata daya tahan kedua lampu pijar tersebut lebih besar dari 600 jam?

Jawab

µx1 – x2 = µ1 - µ2 = 4500 – 4000 = 500 δx1 – x2 = √ δ12/n1 + δ22/n2

= √ (500)2 + (400)2

100 100 = 64

P(x1 – x2 > 600)

Untuk menghitung probabilitas tersebut, kita harus menghitung luas daerah yang diarsir dengan menggunakan konsep distribusi normal dengan tabel Z

Z = x - µ δ Karena X = x1 – x2 µ = µx1 – x2 δ = δx1 – x2

Z = (x1-x2) – (µx1 – x2) δx1 – x2

untuk x1 – x2 = 600 Z = 600 – 500 64 = 1.5 = 44.06%

P(x1 – x2 > 600) = 50% - 44.06% = 5.94%

11.6 Distribusi Sampling Proporsi

(9)

Sebagai contoh, total mahasiswa adalah 100 orang, jika 30 mahasiswa diantaranya merokok, proporsi mahasiswa yang erokok adalah 30/100 atau 30%.

Proporsi populasi ditulis sebagai P dan proporsi sampel ditulis dengan p. proses pembentukan distribusi sampling ini sama dengan distribusi sampling rata-rata yang telah dibahas sebelumnya. Jika dari populasi dengan ukuran N diambil sampel dengan ukuran n, aka nada kombinasi sampel yang mungkin sebanyak C(N, n) yang berarti kita telah memiliki p (proporsi sampel) sebanyak C(N, n) pula. P yang dimaksud berjumlah sangat besar dan membentuk distribusi normal dengan rata-rata µp dan deviasi standar δp.

Selanjutnya diketahui bahwa rata-rata distribusi sampling proporsi (µp) adalah sama dengan proporsi populasi (P) dan deviasi standar distribusi sampling proporsi (galat baku proporsi atau standard error of proportion).

δp adalah sama dengan √P(1-p) n

untuk populasi yang terbatas atau n/N < 5%, kita gunakan faktor koreksi sebesar √ N-n

N-1

Contoh :

Dari 1000 mobil yang yang diproduksi, diketahui 100 diantaranya cacat. Jika diambil sampel acak sebanyak 500 buah mobill dari populasi tersebut dan diteliti, berapa besar proporsi mobil yang cacat lebih besar dari 12%?

Jawab

P = proporsi populasi mobil yang rusak = 100/1000 = 10% µp = P10% = 0.1

δp = √P(1-p) = √0.1 (1 - 0.1) = 0.013 n 500

(10)

Z =0.12 – 0.1 = 1.54 = 43.82% 0.013

Probabilitas (P > 0.12) = 50% - 43.82% = 6.18%

11.7 Distribusi Sampling Beda Proporsi

Pada dasarnya, proses terbentuknya distribusi sampling beda proporsi ini sama dengan pembentukan distribusi sampling beda rata-rata. Misalnya terdapat 2 populasi binomial (populasi yang dibedakan menjadi 2 kelompok, seperti merokok dan tidak merokok, setuju dan tidak setuju, dsb) dengan ukuran N1 dan N2. Dari kedua populasi tersebut, masing-masing kita ambil sampel n1 dan n2. Kita akan memiliki kemungkinan kombinasi sampel sebesar C(N1, n1) dan C(N2, n2). Dengan kata lain kita memiliki proporsi sampel 1 (p1) sebanyak C(N1, n1) dan proporsi sampel 2 (p2) sebanyak C(N2, n2). Jika p adalah selisih p1 dan p2, kita akan mendapatkan p1 – p2 banyak yang membentuk distribusi normal dengan rata-rata µp1 – p2 dan deviasi standar δp1 – p2.

Rumus 11.4 µp1 – p2 = p1 – p2

δp1 – p2 = √ P1(1 -p1) + P2(1 –p2) n1 n2

atau δp1 – p2 = √ P1(1 -p1) + P2(1 –p2) x √ N-n untuk populasi terbatas n1 n2 N-1

Contoh :

Berdasarkan sebuah penelitian, 15 dari orang yang tidak merokok terkena TBC dan dari setiap 100 perokok, 5 orang diantaranya terkena TBC. Jika diambil sampel masing-masing 100 orang dari kedua kelompok, berapa probabilitas bahwa selisih populasi perokok dan populasi bukan perokok yang terkena TBC lebih besar dari 5%?

Jawab

(11)

µp1 – p2 = p1 – p2 = 5% - 1% = 4% δp1 – p2 = √ P1(1 -p1) + P2(1 –p2)

n1 n2

= √ 0.05 (1 – 0.05) + 0.01 (1 – 0.01) 100 100

= 0.024 = 2.4%

P(p1 – p2 > 5%)

Z = x - µ , untuk x = p1 - p δ

Z = (p1 – p2) – (µp1 – p2) δp1 – p2

= 5% - 4% = 0.42 = 16.28% 2.4%

Referensi

Dokumen terkait

Ukuran sampel yang diambil sebanyak 51 orang (100% dari jumlah populasi) dengan tehnik insendential sampling. Tehnik analisis data yang digunakan dalam penelitian

• Kerangka sampling adalah daftar yang berisikan setiap elemen populasi yang bisa diambil sebagai sampel...

Jika sampel di atas diambil secara SRS WOR dari populasi N=64 industri dan diketahui jumlah tenaga kerja industri kerajinan rumah tangga di kecamatan tersebut

• Pada Uji t dan Uji F untuk dua sampel atau lebih, kedua sampel diambil dari dua populasi yang mempunyai varians

Pada teknik systematic sampling, pengambilan sampel didasarkan pada urutan populasi yang telah diberi nomor urut atau anggota sampel diambil dari... populasi pada jarak interval

Bila nilai parameter θ dari populasi hanya diduga dengan memakai satu nilai statistik θ dari sampel yang diambil dari populasi tersebut, maka statistik θ

Populasi dari penelitian ini adalah Warga Kecamatan Cinere Depok dan konsumen pengguna sepeda motor honda beat dengan ukuran sampel diambil sebanyak 75 responden dengan

Sampel acak diambil dari suatu populasi terhingga berukuran N yang berdistirbusi normal mempunyai rata-rata (µ) dan simpangan baku (e), untuk ukuran sampel acak n yang