• Tidak ada hasil yang ditemukan

Bahan Ajar. Statistika. Haryadi NIDN

N/A
N/A
Protected

Academic year: 2021

Membagikan "Bahan Ajar. Statistika. Haryadi NIDN"

Copied!
94
0
0

Teks penuh

(1)

Bahan Ajar

Statistika

Haryadi

NIDN 000311640

Universitas Muhammadiyah Palangkaraya

2012

(2)

Daftar Isi

1 Populasi dan Sampel 1

1.1 Pengantar . . . 1

1.2 Sifat variabel dalam penelitian . . . 4

2 Penyajian Data 7 2.1 Distribusi Frekuensi . . . 7

2.2 Histogram . . . 9

2.3 Diagram Batang dan Daun . . . 12

3 Ringkasan Data 15 3.1 Ukuran Kecenderungan Pusat . . . 15

3.2 Varian . . . 18 3.3 Persentil . . . 19 3.4 Box Plot . . . 21 3.5 Teorema Chebyshev . . . 22 4 Peluang 23 4.1 Ruang Sampel . . . 23 4.2 Peluang . . . 25 4.3 Peluang Bersyarat . . . 28 5 Variabel Random 31 5.1 Variabel Random Diskrit . . . 31

5.2 Nilai Harapan Variabel Random Diskrit . . . 35

5.3 Variabel Random Kontinu . . . 36

5.4 Variabel Random Bersama . . . 36

6 Beberapa Distribusi Peluang 39 6.1 Distribusi binomial . . . 39

6.2 Distribusi Normal . . . 40

6.3 Distribusi yang berhubungan dengan distribusi normal . . . 43

6.3.1 Distribusi Chi-Square . . . 43

6.3.2 Distribusi t . . . 43

6.3.3 Distribusi F . . . 44

(3)

ii DAFTAR ISI

7 Teori Sampling 45

8 Estimasi 49

8.1 Interval Kepercayaan untuk µ dengan σ Diketahui . . . 50

8.2 Interval Kepercayaan untuk µ dengan σ Tidak Diketahui . . . . 52

8.3 Interval Kepercayaan untuk σ2 . . . . 53

8.4 Interval Kepercayaan Selisih Dua Mean . . . 54

9 Uji Hipotesis 57 9.1 Uji tentang mean populasi normal . . . 58

9.1.1 Uji hipotesis dengan σ2 diketahui . . . 58

9.1.2 Uji hipotesis dengan σ2 tidak diketahui . . . 61

9.2 Uji kesamaan mean dua populasi . . . 62

9.2.1 Varian populasi diketahui . . . 63

9.2.2 Varian populasi tidak diketahui . . . 64

9.2.3 Varian tidak diketahui dan tidak sama . . . 66

9.3 Uji t berpasangan . . . 66

9.4 Uji hipotesi tentang varian populasi normal . . . 67

9.5 Uji hipotesis kesamaan varian dua populasi normal . . . 68

9.6 Uji Goodness of Fit . . . 70

9.7 Uji Independen . . . 71

10 Regresi Linear Sederhana 75 10.1 Sifat Estimator ˆβ dan ˆα . . . 77

10.2 Inferensi tentang parameter β dan α . . . 78

10.3 Koefisien Determinasi . . . 79

10.4 Korelasi . . . 80

Daftar Pustaka 81

(4)

Bab 1

Populasi dan Sampel

1.1

Pengantar

Banyak kesimpulan sehari-hari didasarkan pada informasi yang tidak lengkap. Kesimpulan semacam ini tentu mengandung ketidak pastian. Di dalam statis-tika, kita akan mempelajari bagaimana menggali informasi atau membuat kes-impulan berdasarkan informasi yang tidak lengkap.

Definisi 1. Statistika merupakan studi tentang bagaimana mengumpulkan, mengorganisasi, menganalisis dan menginterpretasikan data.

Dengan demikian persyaratan untuk dapat melakukan studi dengan statis-tika adalah adanya data. Data diperoleh dengan melakukan observasi dari karakter individu-indvidu yang menjadi perhatian kita.

Sering terjadi data yang diperlukan dalam studi statistik sudah tersedia, misalnya data yang diterbitkan oleh Badan Pusat Statistik. Dapat pula terjadi data yang diperlukan dalam studi belum tersedia. Dalam hal data belum ter-desia maka perlu diadakan dengan jalan melakukan observasi atau eksperimen.

Definisi 2. Variabel adalah karakteristik yang diukur atau diobservasi dari suatu objek.

Variabel kuantitatif adalah variabel yang dinyatakan dalam bentuk bilangan atau numerik.

Variabel kualitatif adalah variabel yang dinyatakan dalam kategori atau

(5)

2 BAB 1. POPULASI DAN SAMPEL

kelompok tertentu

Jika kita ingin meneliti prestasi belajar siswa suatu kelas, maka variabelnya dapat berupa nilai hasil belajar. Penelitian tentang tingkat kemasaman air di Palangkaraya, variabelnya bisa berupa pH air. Suatu penelitian yang bertujuan untuk mengetahui jenis warna yang disukai anak TK, variabelnya dapat berupa warna.

Definisi 3. Populasi adalah kumpulan semua individu ( objek) yang menjadi perhatian studi.

Bagian dari populasi dinamakan sampel.

Banyaknya anggota populasi dinamakan ukuran populasi. Banyaknya anggota sampel dinamakan ukuran sampel. Data yang diperoleh dari sampel dinamakan data sampel.

Contoh 1. Suatu studi bertujuan untuk mengetahui berat badan rata-rata mahasiswa UM Palangkaraya. Karena keterbatasan tenaga dan waktu, maka diambil sampel 100 orang mahasiswa untuk timbang berat badannya. Dalam studi ini, populasinya adalah seluruh mahasiswa UM Palangkaraya, sampelnya adalah ke 100 mahasiswa tersebut, dan variabelnya adalah berat badan yang merupakan variabel kuantitatif. Jelas bahwa rata-rata berat badan yang diukur dari 100 mahasiswa tidak menjamin akan mencerminkan rata-rata berat badan seluruh mahasiswa UM Palangkaraya. Hal ini dikarenakan informasinya tidak lengkap. Dalam hal ini bisa saja seluruh mahasiswa UM Palangkraya ditimbang berat badanya agar diperoleh kesimpulan yang tepat, namun tentu diperlukan waktu dan biaya yang lebih besar dibanding dengan mengamati 100 mahasiswa. Dalam suatu studi umumnya kita menggunakan dapat sampel. Banyak alasan mengapa kita mengunakan data sampel, diantaranya (i) keterbatasan sumberdaya dan (ii) keterbatasan teknis.

Definisi 4. Parameter adalah suatu karateristik populasi. Statistik adalah suatu nilai yang dihitung dari data sampel.

Pada contoh 1, parameternya adalah rata-rata berat badan seluruh maha-siswa UM Palangkaraya, yang dalam hal ini nilainya tidak diketahui; sedangkan

(6)

1.1. PENGANTAR 3

statistiknya adalah rata-rata berat badan yang dihitung dari ke 100 mahasiswa tersebut.

Parameter umunya tidak diketahui nilainya. Oleh karena itu kita harus cukup puas untuk menduga nilai parametr. Statistik digunakan untuk menduga (to estimasi) parameter. Suatu statistik dikatakan representatif (mewakili) jika dapat menggambarkan keadaan parameter dengan baik.

Ada banyak kriteria mengenai statistik yang baik untuk suatu parameter. Baik tidaknya suatu statistik sangat bergantung pada bagaimana sampel tersebut diambil dari populasi. Suatu proses pengambilan sampel dinamakan sampling.

Cara pengambilan sampel Ada beberapa cara pengambilan sampel: • Random sampling

• Stratified sampling

• Sistematik sampling

• Cluster sampling

Sampel random berukuran n dari suatu populasi adalah bagian populasi yang diambil dengan cara sedemikian sehingga:

1. setiap sampel berukuran n memiliki kesempatan yang sama untuk terpilih.

2. setiap anggota populasi memiliki kesempatan yang sama untuk terpilih.

Suatu prosedur untuk memperoleh sampel random adalah dengan menggu-nakan bilangan random. Bilangan random dapat diperoleh pada tabel bilangan random, kalkulator atau program komputer.

Prosedur melakukan random sampling:

1. Beri nomor semua anggota populasi secara berurutan

2. Gunakan tabel, kalkulator atau komputer untuk memilih bilangan ran-dom.

3. Buatlah sampel dengan menggunakan anggota populasi yang nomornya berkaitan dengan bilangan random yang terpilih.

Contoh 2. Akan diambil sampel random berukuran 10 dari sebuah kelas yang memiliki 50 siswa. Langkah-langkahnya:

1. Beri nomor urut pada setiap anggota kelas mulai nomor 1 sampai dengan nomor 50.

(7)

4 BAB 1. POPULASI DAN SAMPEL

2. Gunakan tabel bilangan random, dengan cara: pertama tunjuk sebarang bilangan pada tabel, kemudian diteruskan dengan menuliskan bilangan random berikutnya secukupnya. Misal dalam contoh ini diperoleh bilan-gan random mulai baris ke-7 dan kolom ke-9:

66 94730 95761 75023 48464 65544 96583 18911 16391 99938 90704 93621 66330 33393 95261

Karena banyaknya sampel merupakan bilangan dua digit, maka bilangan random di atas dikelompokan menjadi dua digit :

66 94 73 09 57 61 75 02 34 84 64 65 54 49 65 83 18 91 11 63 91 99 93 89 07 04 93 62 16 63 30 33 39 39 52 61

3. Daftar semua anggoka kelas yang nomornya sesuai dengan nomor pada bilangan random yang telah dikelompokan tersbut. Jika ditemui bilangan yang lebih besar dari 50 maka diabaikan, dan jika diperoleh bilangan ran-dom yang sudah terpilih sebelumnya, maka diabaikan. Anggota populasi yang terpilih sebagai anggota sampel adalah yang bernomor:

09 02 34 49 18 11 07 04 16 30 33.

Stratified sampling Stratified sampling adalah cara pengambilan sam-pel dari populasi yang memiliki strata tertentu. Misalnya, pada populasi maha-siswa UM Palangkaraya, stratanya dapat berupa lulusan SMA, sudah bekerja dan mahasiswa pindahan. Pada teknik ini, populasi dibagi minimal dalam dua strata, kemudian pada setiap strata pengambilan sampel dilakukan secara ran-dom sampling.

Sistematik sampling. Pada metode ini anggota populasi disusun dengan urutan tertentu. Kemudian dilakukan pengambilan satu individu secara ran-dom, dan dilanjutkan dengan mengambil setiap anggota ke k dari sampel.

Cluster sampling . Pada metode ini, dimulai dengan membagi wilayah menjadi beberapa bagian (cluster). Kemudian diambil secara random bagian-bagian tersebut. Setiap anggota cluster menjadi anggota sampel.

1.2

Sifat variabel dalam penelitian

Didalam studi observasi, pengukuran terhadap anggota sampel dilakukan se-hingga tidak merubah respon atau variabel yang diteliti.

Di dalam eksperimen, perlakuan diberikan pada individu untuk melihat pe-rubahan respon atau variabel yang diukur.

(8)

1.2. SIFAT VARIABEL DALAM PENELITIAN 5

Untuk memperoleh data, kadang-kadang peneliti harus mengambil data dari orang-orang dengan cara memberikan pertanyaan. Proses ini dinamakan sur-vey.

Pengkategorian lain dari data adalah berdasarkan tingkat pengukuran, dalam arti berdasarkan sifat aritmetika data. Berdasarkan tingkat menguku-ran, data dikelompokan menjadi:

1. Data nominal merupakan data yang tidak dapat (tidak berkmakna) jika diurutkan secara aritmetika.

2. Data ordinal, yaitu data yang bisa diurutkan tetapi tidak dapat (tidak bermakna) jika dibandingkan.

3. Data interval, yaitu data yang dapat urutkan dan perbedaan antara nilai data ada maknanya.

4. Data rasio, yaitu data yang dapat dirutkan, perbedan antara nilai data bermakna dan rasio antar nilai data juga bermakna. Pada data rasio nilai 0 merupakan nilai sebenarnya.

Contoh 3. Suatu data berisi informasi nama hewan di suatu kebun binatang: harimau

jerapah buaya unta

Data ini termasuk data nominal. Perhatikan bahwa data tersebut hanya meny-atakan nama, jadi jika diurutkan tidak ada artinya.

Contoh 4. Suatu penelitian bertujuan untuk mengetahui tingkat kesukaan kon-sumen terhadap suatu produk. Variabel yang diamati adalah sebagai berikut:

Suka Sedang Tidak suka

Perhatikan bahwa data ini dapat diurutkan, namun selisih antar tingkat ke-sukaan tidak bermakna.

Contoh 5. Temperatur di kota Palangkaraya merupakan data interval, sebab nilai temperatur dapat diurutkan dan selisih antara nilai temperatur memiliki makna. Misalnya pada pagi hari temperaurnya 23o dan pada siang hari 30o, perbedaaanya menyatakan bahwa pada siang hari temperaturnya 7olebih panas dibanding pagi hari. Perhatikan pula bahwa temperatur 0o tidak berarti tidak

ada panas, yakni nilai ini bukan nilai sebenarnya.

Contoh 6. Data penghasil 5 orang per bulan (dalam juta rupiah) adalah se-bagai berikut:

(9)

6 BAB 1. POPULASI DAN SAMPEL

No. Urut. Penghasilan

1. 2

2. 4,5

3. 13

4. 0,5 5. 0,0

Sifat data ini adalah dapat urutkan, dapat dikurangkan antar nilai-nilainya dan nilai 0 adalah nilai yang sebenarnya, yaitu tidak punya penghasilan. Dengan demikian data ini termasuk data rasio.

(10)

Bab 2

Penyajian Data

2.1

Distribusi Frekuensi

Jika kita memiliki suatu data kuantitatif yang ukuran cukup besar, maka akan berguna jika data tersebut dikelompokan menjadi interval atau klas yang lebih kecil. Dalam penyajian data dengan tabel frekuensi, data dipartisi menjadi kelas atau interval dan menampilkan banyaknya nilai data yang termasuk pada setiap kelas.

Definisi 5. • Kelas atau interval dibentuk sehingga setiap nilai data ter-masuk kedalam tepat satu kelas.

• Kelas berupa interval bilangan; jadi memiliki batas bawah dan batas atas.

• Titik tengah kelas adalah bilangan yang posisinya di tengah kelas.

• Lebar kelas menyatakan selisih antara batas atas dan batas bawah kelas tersebut.

Lebar kelas =N ilai data terbesar − N ilai data terkecil banyaknya kelas

• Frekuensi kelas adalah banyaknya nilai yang termasuk suatu kelas.

• Frekuensi relatif adalah frekuensi dibagi banyaknya nilai data.

(11)

8 BAB 2. PENYAJIAN DATA

• Frekuensi Kumulatif suatu kelas adalah banyaknya seluruh nilai data yang lebih kecil dari batas atas kelas tersebut.

• Frekuensi kumulatif relatif adalah frekuensi kumulatif dibagi banyaknya data.

Contoh 7. Data hasil ujian mata kuliah Statistika 40 mahasiswa berikut akan disajikan dalam bentuk frekuensi distribusi dengan 6 kelas.:

78 60 45 65 80 95 40 40 46 55 60 76 65 60 55 54 75 84 48 58 68 87 95 54 67 58 87 56 43 56 67 58 78 65 89 85 76 68 64 60

Langkah-langkah membentuk tabel frekuensi:

1. Tentukan lebar kelas:

Lebarkelas = 95 − 40

6 = 9.16. dibulatkan menjadi 10.

2. Tentukan kelas (interval kelas) sebagai berikut:

• Ambil nilai data terkecil sebagai batas bawah kelas pertama, dalam hal ini adalah 40.

• Batas bawah kelas berikutnya = batas bawah nilai sebelumnya + 10. Jadi batas bawah kelas kedua adalah 40 + 10 = 50.

• Batas bawah kelas diperoleh dengan mengambil nilai tepat di bawah batas atas kelas berikutnya. Jadi batas kelas pertama adalah 59. • Proses ini dilanjutkan untuk kelas-kelas berikutnya.

3. Sekarang setiap nilai data dapat dimasukan ke dalam kelas masing-masing. Untuk menghitung frekuensi setiap kelas dapat menggunakan dengan ban-tuan tally.

(12)

2.2. HISTOGRAM 9

Frekuensi Frekuensi Frekuensi Interval Kelas Frekuensi Relatif Kumulatif Kumulatif Relatif 40-49 6 0.15 6 0.15 50-59 9 0.225 15 0.375 60-69 12 0.3 27 0.675 70-79 5 0.125 32 0.800 80-89 6 0.15 38 0.950 90-99 2 0.05 40 1.00 Jumlah 40 1

2.2

Histogram

Dari tbel frekuensi dapat disajikan bentuk visualnya. Histogram merupakan cara yang cukup efektif untuk menyajikan data dalam bentuk visual. Pada histogram:

• setiap kelas dinyatakan dengan sebuah batang

• lebar batang menyatakan lebar kelas

• tinggi batang menyatakan frekuensi kelas atau frekuensi relatif kelas

• nilai dibawah setiap batang adalah titik tengah kelas.

(13)

10 BAB 2. PENYAJIAN DATA

Bentuk histogram dari suatu sampel random menggambarkan bagaimana nilai data berdistribusi pada populasi. Bentuk histogram dapat dikelompokan menjadi:

1. Simetris, yaitu histogram yang mentuknya (hampir) simetris terhadap su-atu sumbu.

2. Seragam, yaitu histogram yang frekuensi setiap kelasnya sama atau ham-pir sama.

3. Menceng kiri atau menceng kanan, yaitu histogram yang ekornya menju-lur lebih panjang ke satu sisi. Jika ekornya lebih menjumenju-lur kekiri maka dinamakan menceng kekiri, jika ekornya lebih menjulur kekanan maka di-namakan menceng kekanan.

4. Bimodal, yaitu histogram yang memiliki dua kelas dengan frekuensi tertetinngi yang dipisahkan oleh kelas lainnya.

(14)

2.2. HISTOGRAM 11

Kadang-kadang kita ingin menyajikan histogram dengan bentuk tertentu. Diagram pareto adalah grafik batang yang disajikan secara urut berdasarkan tingginya. Sebagai contoh, diagram pareto untuk contoh 1 adalah:

Grafik runtun waktu adalah grafik yang menggambarkan bagaimana data berubah terhadap waktu.

(15)

12 BAB 2. PENYAJIAN DATA

2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 3900 4500 4200 3300 3600 3000 3100 3200 3400 3500

Grafik runtun waktu data ini adalah

2.3

Diagram Batang dan Daun

Diagram batang dan daun menyajikan data dalam bentuk susunan dan kelom-pok tertentu. Didalam tabel frekuensi dan histogram, kita kehilangan informasi tentang nilai data. Di dalam diagram batang dan daun, informasi mengenai ni-lai data asli tidak hilang.

Prosedur membuat diagram batang-daun:

1. Bagi digit tiap nilai data menjadi dua bagian. Bagian paling kiri dina-makan batang dan bagian kanan dinadina-makan daun.

2. Susun semua batang secara vertikal mulai dari nilai terkecil hingga nilai terbesar.

3. Tuliskan semua daun yang batangnya sama pada baris batang yang sama, lalu susun daun dengan urutan makin membesar.

Contoh 8. Data nilai ujian Statistika pada contoh 1 akan disajikan dalam diagram batang daun. Digit pertama sebagai batang dan digit kedua sebagai daun. Berdasarkan prosedur di atas diperoleh

(16)

2.3. DIAGRAM BATANG DAN DAUN 13

4

0 0 3 5 6 8

5

4 4 5 5 6 6 8 8

6

0 0 0 0 4 5 5 5 7 7 8 8

7

5 6 6 8 8

8

0 4 5 7 7 9

9

5 5

(17)
(18)

Bab 3

Ringkasan Data

3.1

Ukuran Kecenderungan Pusat

Dalam keseharian kita sering mendengar ungkapan seperti: • Umumnya orang Indonesia makan nasi.

• Sebagian besar siswa lulus UAN.

• Pendapatan per kapita rata-rata di Palangkaraya 4 juta rupiah per bulan. Ungkapan-ungkapan tersebut merupakan ungkapan kecenderungan suatu keadaan. Di dalam bagian ini kita akan meninjau dari sudut statistika cara menyapaikan ungkapan-ungkapan tersebut.

Modus suatu data adalah nilai data yang paling banyak frekuensinya. Contoh 9. Data banyaknya anak 10 rumah tangga adalah sebagai berikut:

2 0 2 1 2 3 4 3 2 1

Nilai data 2 memiliki frekuensi paling banyak, oleh karena itu modusnya adalah 2.

Median adalah nilai data yang posisinya ditengah setelah data diurutkan. Me-dian data dapat dicari sebagai berikut:

1. Urutkan data dari nilai terkecil hingga terbesar.

2. Jika banyaknya nilai data ganjil, maka median = nilai yang posisinya ditengah.

3. Jika banyaknya nilai data genap, maka

median =jumlah dua nilai yang ditengah

2 .

(19)

16 BAB 3. RINGKASAN DATA

Contoh 10. Hasil pengukuran tinggi badan 11 mahasiswa (dalam kg) adalah 67 60 70 55 58 76 63 76 81 65 72

Setelah diurutkan maka menjadi

55 58 60 63 65 67 70 72 76 76 81

Karena banyaknya nilai data ada 11, maka mediannya adalah nilai yang po-sisinya ditengah, yaitu nilai ke 6. Dengan demikian mediannya adalah 67. Contoh 11. Data pendapatan per bulan 10 orang adalah sebagai berikut (dalam juta rupiah)

4 4 6 3 5 3 2 5 1 3 Setelah diurutkan, maka data tersebut menjadi

1 2 3 3 3 4 4 5 5 6

Karena banyaknya observasi 10 (genap), maka mediannya adalah

median = nilai ke 5 + nilai ke 6

2 =

3 + 4 2 = 3.5.

Mean atau mean aritmetika suatu sampel adalah jumlah seluruh nilai data dibagi ukuran sampel. Mean suatu sampel berukuran n dengan nilai-nilai data x1, x2, · · · , xn, ditulis ¯x. Jadi

mean = ¯x = x1+ x2+ · · · + xn n = 1 n n X i=1 xi.

Contoh 12. Nilai rapor semua pelajaran seorang siswa adalah 7, 8, 6, 7, 6, 8, 7, 9, 6, 7. Mean nilai rapornya adalah

¯

x = 7 + 8 + 6 + 7 + 6 + 8 + 7 + 9 + 6 + 7

10 =

71 10 = 7.1.

Mean memiliki sifat sensitif terhadap nilai data ekstrim, dalam arti bahwa jika terdapat nilai data yang sangat kecil atau sangat besar, maka mean mudah berubah secara ekstrim.

Contoh 13. Data observasi tingkat penghasilan 10 orang di Palangkaraya per bulan adalah sebagai berikut (dalam juta rupiah): 1, 3, 2, 4, 3, 100, 3, 4, 2, 4. Di dalam contoh ini terdapat orang yang penghasilannya 100 juta per bulan. Mean data ini adalah

¯

x = 1 + 3 + 2 + 4 + 3 + 100 + 3 + 4 + 2 + 4

10 = 12.6,

padahal umumnya ke 10 orang berpenghasilan dibawah 5 juta. Hal ini terjadi karena ada nilai data yang ekstrim, yaitu 100.

Trimmed mean atau mean yang dipangkas relatif tidak sensitif ter-hadap nilai data ekstrim. Trimmed mean adalah mean suatu data yang telah dipangkas sebagian data, umumnya digunakan pemangkasan 5 persen.

(20)

3.1. UKURAN KECENDERUNGAN PUSAT 17

Prosedur mencari trimmed mean 5 persen 1. Urutkan data dari nilai terkecil hingga nilai terbesar.

2. Hapus 5 persen bawah dan 5 persen atas data. Jika 5 persen tersebut tidak menghasilkan bilangan bulat, bulatkan ke bilangan bulat terdekat. 3. Hitung mean 90 persen data yang tersisa.

Contoh 14. Data penghasilan per bulan 20 orang dalam juta rupiah adalah sebagai berikut

3 2 3 1 4 5 4 6 3 5 4 100 4 5 7 8 4 6 7 6 Untuk mencari trimmed mean 5 persen pertama-tama data diurutkan

1 2 3 3 3 4 4 4 4 4 5 5 5 6 6 6 7 7 8 100 Banyaknya nilai data adalah 20, sehingga 5 persen dari 20 adalah 1.

Dihilangkan 5 persen (satu nilai data) bawah dan atas data menjadi

2 3 3 3 4 4 4 4 4 5 5 5 6 6 6 7 7 8 Mean yang dipangkas adalah mean data terakhir, yaitu

¯ x = 1

18(2 + 3 + 3 + 3 + 4 + 4 + 4 + 4 + 4 + 5 + 5 + 5 + 6 + 6 + 6 + 7 + 7 + 8) = 4.78. Kadang-kadang kita memiliki data yang nilainya dapat dikelompokan men-jadi k nilai berbeda. Misalkan nilai data x1, x2, · · · , xk berturut-turut memiliki

frekuensi f1, f2, · · · , fk. Ini berarti data ini memiliki n = P k

i=1fi nilai data

dengan nilai xi terjadi fi kali. Mean data demikian dapat dihitung sebagai

berikut

¯ x = 1

n(f1x1+ f2x2+ · · · + fkxk). dengan n = fi+ f2+ · · · + fk.

Contoh 15. Berikut adalah data hasil observasi usia mahasiswa pada suatu kelas Usia Frekuensi 16 2 17 4 18 7 19 8 20 6 21 3 22 2

Banyaknya observasi adalah n = 2 + 4 + 7 + 8 + 6 + 3 + 2 = 32. Mean data tersebut adalah ¯ x = 1 32(2 · 16 + 4 · 17 + 7 · 18 + 8 · 19 + 6 · 20 + 3 · 21 + 2 · 22) = 605 32 = 18.91.

(21)

18 BAB 3. RINGKASAN DATA

Kadang-kadang nilai data yang akan dicari meannya sangat besar. Untuk mempermudah mencari mean data yang nilai-nilainya sangat besar dapat digu-nakan transformasi:

yi= xi− c

dengan c suatu konstanta.

Dengan tranfomasi tersebut, maka diperoleh ¯

x = ¯y + c.

Contoh 16. Suatu eksperimen untuk mengukur kecepatan cahaya menghasilkan hasil pengukuran sebagai berikut (dalam km/detik):

300, 009 299, 999 299, 998 300, 099 300, 008. Untuk mencari mean data tersebut dapat digunakan tranformasi

yi= xi− 300, 000,

dan diperoleh nilai-nilai yi :

9 − 1 − 2 99 8, dan

¯ y = 1

5(9 − 1 − 2 + 99 + 8) = 22.6.

Dengan demikian, mean hasil pengukuran kecepatan cahaya tersebut adalah ¯

x = ¯y + 300, 000 = 22.6 + 300, 000 = 300, 022.6.

3.2

Varian

Kita sering mendengar pernyataan seperti ”Tingkat pendapatan orang Indone-sia sangat bervariasi”, ”Hasil nilai ujian nasional cukup beragam”, ”Tinggi tana-man padi di sawah sangat seragam”, dan sebagainya. Ungkapan semacam ini merupakan suatu cara untuk menyatakan kecenderungan perbedaan antara in-dividu.

Range data x1, x2, · · · , xnadalah selisih antara nilai data terbesar dan nilai

data terkecil.

Contoh 17. Nilai ujian 10 orang siswa adalah 5, 6, 4, 7, 8, 7, 10, 6, 7, 4. Range data tersebut adalah 10 − 4 = 6.

Diketahui x1, x2, · · · , xndata sampel berukuran n dan ¯x mean data tersebut.

Deviasi nilai data xi terhadap mean ¯x adalah selisih antara xi dan ¯x, yaitu

(22)

3.3. PERSENTIL 19

Varian sampel, ditulis s2, dari data x

1, x2, · · · , xn didefinisikan s2= 1 n − 1 n X i=1 (xi− ¯x)2.

Varian sampel menggambarkan variabilitas data sampel. Jika s2adalah varian sampel, maka s dinamakan deviasi standar sampel.

Contoh 18. Hitunglah varian sampel setiap data berikut: Data A: 5, 3, 4, 6, 2.

Data B: -2, -1, 11, 4, 8.

Mean data A adalah ¯x = (5 + 3 + 4 + 6 + 2)/5 = 4; dengan demikian varian sampel data A adalah

s2 = 1

4 (5 − 4)

2+ (3 − 4)2+ (4 − 4)2+ (6 − 4)2+ (6 − 4)2+ (2 − 4)2

= 10 4 = 2.5,

dan deviasi standar data A adalah s =√2.5 = 1.58.

Mean data B adalah ¯x = (−2 − 1 + 11 + 4 + 8)/5 = 4; dengan demikian varian sampel data B adalah

s2 = 1

4 (−2 − 4)

2+ (−1 − 4)2+ (11 − 4)2+ (4 − 4)2+ (8 − 4)2

= 126 4 = 31.5

dan deviasi standar data B adalah s =√31.5 = 5.61.

Perhatikan bahwa meskipun data A dan data B memiliki mean sama, namun variannya berbeda. Varian data B lebih besar dibanding varian data A, yang berarti bahwa data B lebih bervariasi dibanding data A.

3.3

Persentil

Diketahui bilangan p dengan 1 ≤ p ≤ 99. Persentil ke p dari suatu data adalah suatu nilai sehingga p persen data berada pada atau dibawah nilai tersebut dan (100 − p) persen data berada pada atau di atas nilai tersebut.

Quartil adalah persentil yang membagi data menjadi empat.

1. Quartil pertama ditulis Q1, adalah persentil ke 25 .

(23)

20 BAB 3. RINGKASAN DATA

3. Quartil ketiga ditulis Q3adalah persentil ke 75.

Prosedur mencari quartil:

1. Urutkan data dari nilai terkecil sampai dengan nilai terbesar 2. Posisi Q1= 0.25(n + 1).

3. Posisi Q2= 0.5(n + 1)

4. Posisi Q3=0.75(n+1).

Interquartil = Q3− Q1.

Contoh 19. Data hasil ujian 40 mahasiswa

78 60 45 65 80 95 40 40 46 55 60 76 65 60 55 54 75 84 48 58 68 87 95 54 67 58 87 56 43 56 67 58 78 65 89 85 76 68 64 60

Setelah data diurutkan maka diperoleh :

Posisi Q1= 0.25(40 + 1) = 10.25.

Q1 = nilai ke 10 + 0.25( nilai ke 11 − nilai ke 10)

= 55 + 0.25 = 55.25. Posisi Q2= 0.5(40 + 1) = 20.5 Q2 = nilai ke 20 + nilai ke 21 2 = 64 + 65 2 = 64.5. Posisi Q3= 0.75(40 + 1) = 30.75

Q3 = nilai ke 30 + 0.75( nilai ke 31 − nilai ke 30)

= 76 + 0.75(78 − 76) = 77.50.

(24)

3.4. BOX PLOT 21

3.4

Box Plot

Quartil bersama dengan nilai data terbesar dan terkecil menghasilkan ringkasan limabilangan dan sebaran data. Kelima bilangan yaitu:

nilai data terkecil, Q1, median, Q3 dan nilai data terbesar.

Kelima bilangan dapat digunakan untuk membuat sketsa grafik data yang dinamakan box plot.

Prosedur membuat box plot:

1. Gambarkan sebuah skala vertikal yang dapat mencakup nilai data terkecil dan nilai data terbesar.

2. Gambarkan sebuah kotak dari Q1 ke Q3di sebelah kanan skala tersebut.

3. Berilah garis mendatar pada kotak tersebut di ketinggian median.

4. Gambarkan garis vertikal dari Q1 ke nilai data terkecil dan dari Q3 ke

nilai data terbesar.

Contoh 20. Grafik box-plot data hasil ujian 40 mahasiswa pada contoh ter-dauhulu.

(25)

22 BAB 3. RINGKASAN DATA

3.5

Teorema Chebyshev

Teorema 1. Diketahui ¯x dan s berturut-turut adalah mean sampel dan deviasi standar sampel dengan s > 0. Jika k ≥ 1 maka setidaknya 100(1 − 1/k2) persen

data berada di dalam interval ¯x − ks sampai dengan ¯x + ks.

Contoh 21. Jika k = 2 maka setidaknya ada 100(1 − 1/22) = 100 · 3/4 = 75

persen data berada di dalam interval ¯x − 2s sampai dengan ¯x + 2s.

Contoh 22. Nilai ujian 20 siswa adalah sebagai berikut:

5 7 6 8 6 5 4 8 9 9 7 8 5 4 6 7 6 8 6 7. Dari data tersebut diperoleh: ¯x = 6.55 dan s = 1.5035.

Jika k = 3/2, maka setidaknya ada

100(1 − 1/(3/2)2) = 100 · 5/9 = 55.55

persen data berada di dalam interval 6.55 − 3

2 1.5035 sampai dengan 6.55 + 3

2 1.5035.

Dengan kata lain setidaknya 55.55 persen data berada di dalam interval 4.29475 sampai dengan 8.8052.

Dapat diperiksa bahwa nilai data yang berada di dalam interval tersebut adalah 5 7 6 8 6 5 8 7 8 8 6 7 6 8 7,

yaitu ada 15 (lebih dari 55.55 persen) nilai data yang berada di dalam interval tersebut.

(26)

Bab 4

Peluang

4.1

Ruang Sampel

Suatu eksperimen dilaksanakan dengan tujuan untuk memperoleh hasil (out-come). Eksperimen random adalah suatu eksperimen yang dapat dilakukan berkali-kali pada kondisi yang sama dan hasilnya tidak dapat ditentukan den-gan pasti sebelum eksperimen tersebut selesai. Ini berarti hasil yang akan terjadi dari suatu eksperimen random menganndung suatu ketidakpastian. Meskipun hasilnya tidak dengan secara pasti dapat ditentukan, namun kita masih dapat menentukan semua hasil yang mungkin terjadi.

Definisi 6. Ruang sampel, ditulis S, dari suatu eksperimen random adalah himpunan semua hasil (outcome) yang mungkin terjadi.

Definisi 7. Pertistiwa E adalah himpunan bagian dari ruang sampel S. Peri-stiwa E dikatakan terjadi, jika E memiliki anggota.

Selanjutnya peristiwa akan dituliskan dangan huruf A, B, C, D, E, F dan se-bagainya.

Definisi 8. Peristiwa E ∩ F adalah peristiwa terjadinya E dan F . Peristiwa Ec adalah peritstiwa tidak terjadinya E.

Dua peristiwa E dan F dikatakan saling saling jika E ∩ F = ∅, yakni jika kedua peristiwa tidak memiliki anggota bersama.

(27)

24 BAB 4. PELUANG

Definisi 9. Peristiwa elementer adalah peristiwa yang memiliki tepat satu anggota.

Contoh 23. Suatu eksperimen random melontarkan dua mata uang logam satu kali. Peristiwa yang diamati adalah sisi yang menghadap ke atas.

Jika sisi angka ditulis a dan sisi gambar ditulis g, maka ruang sampelnya adalah S = {aa, ag, ga, gg}.

Jika E adalah peristiwa terjadinya sisi a tepat satu kali, maka dapat ditulis E = {ag, ga}.

Jika F peristiwa terjadinya sisi gambar setidaknya satu kali, maka dapat ditulis F = {ag, ga, gg}.

Peristiwa E ∩ F berarti peristiwa terjadi sisi angka sebanyak satu kali dan gambar satu kali, yaitu

E ∩ F = {ag, ga}.

Peristiwa Ec menyatakan peristiwa tidak terjadinya E, yaitu tidak munculnya

sisi angka sebanyak satu kali, dan dapat ditulis Ec = {gg, aa}.

Contoh 24. Sebuah dadu dilontarkan satu kali dan diamati banyaknya spot sisi yang menghadap ke atas.

Ruang sampelnya dapat ditulis

S = {1, 2, 3, 4, 5, 6}.

Peristiwa elementernya adalah {1}, {2}, {3}, {4}, {5} dan {6}.

Jika A peristiwa terjadinya sisi genap dan B peristiwa terjadinya sisi ganjil, A = {2, 4, 6}

B = {1, 3, 5}

maka A dan B merupakan peristiwa yang saling asing, karena A ∩ B = ∅. Contoh 25. Satu mata uang logam dilontarkan tiga kali.

Ruang sampelnya adalah

S = {aaa, aag, aga, gaa, agg, gag, gga, ggg}.

Jika E adalah peristiwa munculnya sisi angka paling banyak satu kali, maka dapat ditulis

(28)

4.2. PELUANG 25

Jika F adalah peristiwa munculnya sisi gambar satu kali, maka dapat ditulis

F = {aag, aga, gaa}.

Peristiwa E ∪ F adalah peristiwa munculnya sisi angka paling banyak satu kali atau peristiwa munculnya sisi gambar dua kali. Jadi

E ∪ F = {agg, gag, gga, ggg, aag, aga, gaa}.

Contoh 26. Sebuah dadu dilontarkan dua kali. Pasangan (a, b) menyatakan sisi yang muncul pada lontaran a dan pada lontaran kedua b. Ruang sampelnya adalah S = { (1, 1), (1, 2), (1, 3), (1, 4), (1, 5), (1, 6), (2, 1), (2, 2), (2, 3), (2, 4), (2, 5), (2, 6), (3, 1), (3, 2), (3, 3), (3, 4), (3, 5), (3, 6), (4, 1), (4, 2), (4, 3), (4, 4), (4, 5), (4, 6), (5, 1), (5, 2), (5, 3), (5, 4), (5, 5), (5, 6), (6, 1), (6, 2), (6, 3), (6, 4), (6, 5), (6, 6)}

Jika E peristiwa munculnya jumlah kedua lontaran 10, maka dapat ditulis

E = {(4, 6), (5, 5), (6, 4)}.

Jika F peristiwa munculnya lontaran pertama spot 4, maka dapat ditulis

F = {(4, 1), (4, 2), (4, 3), (4, 4), (4, 5), (4, 6)}.

Contoh 27. Misalkan kita ingin meramalkan ketinggian sebuah roket yang ditembakan dari permukaan bumi. Ruang sampelnya adalah semua bilangan pada interval 0 sampai dengan tak hingga,

S = {x : 0 ≤ x < takhingga}.

Jadi ruang sampel ini memiliki tak hingga anggota.

4.2

Peluang

Di dalam suatu percobaan random, akan terjadinya suatu peristiwa tidak da-pat ditentukan secara pasti. Tingkat kepastian atau ketidakpastian ini diukur dengan suatu ukuran yang dinamakan peluang (probability).

(29)

26 BAB 4. PELUANG

Definisi 10. (Pendekatan klasik peluang) Diketahui peristiwa E dapat terjadi dalam h cara berbeda dari seluruh n cara yang semuanya memiliki kemungkinan sama. Peluang peristiwa E, ditulis P (E), adalah

P (E) = h n.

Pengertian peluang secara klasik mengandung arti bahwa setiap peristiwa elementer memiliki peluang yang sama, yaitu sebesar N1.

Contoh 28. Sebuah mangkok berisi 5 bola merah dan 4 bola biru. Dari mangkok tersebut diambil tanpa pilih-pilih sebuah bola. Peluang terambilnya bola merah adalah

P (merah) =5 9, dan peluang terambilnya bola biru adalah

P (biru) = 4 9.

Definisi 11. (Pendekatan frekuensi) Jika setelah diulang n percobaan, dengan n besar, suatu peristiwa diketahui terjadi h kali, maka peluang peristiwa tersebut adalah h/n.

Contoh 29. Jika satu mata uang logam dilontarkan 1000 kali dan diperoleh sisi gambar terjadi 512 kali, maka peluang terjadinya sisi gambar adalah 512/1000 = 0.512.

Pada kenyataannya tidak semua peristiwa elementer memiliki peluang yang sama, misalnya peluang sebuah mesin jet macet tentu tidak sama dengan pelu-ang mesin tersebut tidak macet. Oleh karena itu pengertian klasik pelupelu-ang kurang tepat untuk berbagai fenomena yang terjadi sehari-hari.

Perhatikan bahwa pada pengertian klasik, banyaknya anggota ruang sampel berhingga. Pada kenyataannya ada ruang sampel yang jumlah anggotanya tak hingga. Ini berarti pengertian klasik peluang tidak dapat digunakan jika banyaknya anggota ruang sampel tak hingga.

Definisi 12. Diketahui S ruang sampel. Untuk setiap peristiwa E bagian S dihubungkan dengan suatu bilangan yang ditulis P (E) yang memenuhi sifat-sifat berikut:

(30)

4.2. PELUANG 27

1. 0 ≤ P (E) ≤ 1. 2. P (S) = 1.

3. P (E1∪E2∪E3∪· · · ) = P (E1)+P (E2)+P (E3)+· · · , dengan E1, E2, E3, · · ·

adalah peristiwa yang saling asing.

Jika P memenuhi ketiga sifat, maka P dinamakan peluang, dan P (E) dina-makan peluang terjadinya peristiwa E.

Sifat (1) menyatakan bahwa peluang suatu peristiwa adalah suatu nilai nu-merik yang besarnya dari 0 hingga 1.

Sifat (2) menyatakan bahwa perstiwa terjadinya ruang sampel adalah pasti. Sifat (3) menyatakan bahwa peluang gabungan peristiwa yang saling asing sama dengan jumlah peluang masing-masing peristiwa.

Peluang merupakan ukuran numerik kemungkinan terjadinya suatu peris-tiwa. Nilai peluang yang mendekati satu berarti semakin besar kemungkinan persistiwa tersebut terjadi. Sebaliknya jika peluang suatu peristiwa pendekati nilai nol, berarti semakinkecil kemungkinan peristiwa tersebut terjadi. Jika su-atu peristiwa memiliki peluang 1 artinya peristiwa tersebut pasti terjadi, sedan-gkan jika suatu peristiwa memiliki peluang 0 artinya peristiwa tersebut tidak mungkin terjadi.

Contoh 30. Frekuensi relatif pada contoh merupakan peluang. Pada kolom tersebut nilai frekiensi relatif berada pada interval 0 hingga 1, jumlah semua frekuensi relatif adalah 1 dan frekuensi relatif gabungan kelas interval sama dengan jumlah frekuensi relatif kelas interval.

Contoh 31. Tiga mata uang dilontarkan satu kali dan diamati sisi yang meng-hadap ke atas. Ruang sampelnya adalah

S = {aaa, aag, aga, gaa, agg, gag, gga, ggg}.

Dianggap setiap peristiwa elementer memiliki peluang sama, yaitu 18. Jika E menyatakan peristiwa terjadinya sisi angka satu kali dan F menyatakan peris-tiwa terjadinya sisi gambar paling sedikit dua kali, maka E dan F dapat dit-uliskan

E = {agg, gga, gag} dan F = {ggg, gga, gag, agg}.

P (E) = P (agg, gga, gag)

= P (agg) + P (gga) + P (gag) = 1 8+ 1 8+ 1 8 = 3 8. (4.1)

(31)

28 BAB 4. PELUANG

P (F ) = P (ggg, gga, gag, agg)

= P (ggg) + P (gga) + P (gag) + P (agg) = 1 8+ 1 8+ 1 8+ 1 8 = 1 2. (4.2)

Contoh 32. Sebuah mangkok berisi 10 kelereng merah, 30 kelereng putih, 25 kelereng biru dan 15 kelereng orange. Akan diambil satu kelereng. Berapa peluang terambilnya kelereng

(a) putih

(b) orange atau merah (c) bukan biru

(d) merah, putih atau biru (e) bukan merah dan bukan biru

Penyelesaian: Misalkan M, P, B dan O berturut-turut menyatakan kelereng warna merah, putih, biru dan orange. Banyaknya seluruh kelereng adalah 10 + 30 + 25 + 15 = 80. (a) P (P ) = 3080 = 0.375. (b) P (O ∪ M ) = 15+1080 = 0.3125. (c) P (Bc) = 1 − P (B) = 1 −20 75 = 1 − 0.3125 = 0.6875. (d) P (M ∪ P ∪ B) =10+30+2580 = 0.8125. (e) P (Mc∩ Bc) = P ((M ∪ B)c) = 1 − P (M ∪ B) = 1 −10+25 80 = 0.5625.

4.3

Peluang Bersyarat

Dalam suatu eksperimen random peluang terjadinya suatu peristiwa bisa ter-gantung terjadinya peristiwa lain. Sebagi contoh, peluang lahirnya anak kedua perempuan bisa tergantung apakah anak pertama laki-laki atau perempuan. Diketahui E dan F adalah peristiwa. Peluang terjadinya E jika diketahui peri-stiwa F telah terjadi dinamakan peluang bersyarat (conditional probability), dituliskan P (E|F ), dan didefinisikan

P (E|F ) =P (E ∩ F ) P (F ) .

Contoh 33. Sebuah mata uang logam dilontarkan dua kali, dan peluang setiap peristiwa elementer sama. Berapa peluang terjadinya sisi a pada lontaran kedua jika diketahui pada lontaran pertama sisi g telah terjadi?

(32)

4.3. PELUANG BERSYARAT 29

terjadinya sisi g pada lontaran pertama. Jadi E = {aa, ga} dan F = {gg, ga}. Peluang yang dicari adalah

P (E|F ) = P (E ∩ F ) P (F ) = P (ga) P (gg, ga) = 1/4 2/4 = 1 2.

Contoh 34. Suatu mangkok berisi tujuh bola hitam dan lima bola putih. Di-ambil dua bola dari dalam mangkok tersebut dan bola yang telah terDi-ambil tidak dikembalikan kedalam mangkok. Anggap setiap bola memiliki peluang sama un-tuk terambil. Berapa peluang bola yang terambil keduanya adalah bola hitam. Misalkan F dan E berturut-turut peristiwa bola pertama dan bola kedua adalah hitam. Karena bola pertama yang terambil hitam, maka ada enam bola hitam dan lima bola putih yang tersisa di dalam mangkok, dan dengan demikian

P (E|F ) = 6 11.

Karena P (F ) = 127, maka peluang terambilnya kedua bola hitam adalah

P (E ∩ F ) = P (F )P (E|F ) = 7 12 6 11= 42 132.

Contoh 35. Pada suatu perguruan tinggi, s25 persen mahasiswa gagal matem-atika, 15 persen mahaasiswa gagal fisika, dan 10 persen maha siswa gagal matematika dan ilmu fisika. Seorang mahasiswa dipilih secara random.

(a) Jika ia gagal fisika, berapa peluang ia gagal matematika? (b) Jika ia gagal matematika, berapa peluang ia gagal fisika?

(c) Berapa peluang ia gagal matematika atau gagal fisika?

Penyelesaian: Tuliskan M = peristiwa mahasiswa yang gagal matematika, F = persitiwa mahasiswa yang gagal fisika. Diperoleh

P (M ) = 0.25, P (F ) = 0.15, P (M ∩ F ) = 0.10 (a) Peluang ia gagal matematika, diketahui ia gagal fisikaa adalah

P (M |F ) = P (M ∩ F ) P (F ) = 0.10 0.15 = 2 3

(b) Peluang ia gagal fisika, diketahui ia gagal matematika adalah

P (F ∩ M ) = P (F ∩ M ) P (M ) = 0.10 0.25 = 2 5

(c) Peluang ia gagal matematika atau gagal fisika adalah

(33)

30 BAB 4. PELUANG

Peristiwa E dan F dikatakan independen, jika peluang terjadinya peristiwa E tidak tergantung apakah peristiwa F terjadi atau tidak terjadi. Dalam hal ini P (E|F ) = P (E) dan berlaku

P (E ∩ F ) = P (E).P (F ).

Jadi peristiwa E dan F independen jika peluang terjadinya kedua peristiwa bersamaan sama dengan hasil kali peluang terjadinya masing-masing peristiwa.

Contoh 36. Satu mata uang logam dilontarkan dua kali. Jika E peristiwa munculnya sisi a pada lontaran pertama dan F peristiwa munculnya sisi g pada lontaran kedua, yaitu

E = {aa, ag} dan F = {ag, gg}.

Jika setiap peristiwa elementer memiliki peluang sama, maka

P (E ∩ F ) = P (ag) = 1 4

P (E)P (F ) = P (aa, ag)P (ag, gg) = 1 2·

1 2 =

1 4,

sehingga P (∩F ) = P (E)P (F ), dengan kata lain E dan F adalah peristiwa yang independen.

Contoh 37. Dua dadu dilontarkan satu kali. A menyatakan peristiwa muncul-nya jumlah spot kedua sisi adalah enam dan B memuncul-nyatakan peristiwa munculmuncul-nya spot sisi dadu pertama empat. Diperoleh

P (A ∩ B) = P ({4, 2}) = 1 36 dan P (A)P (B) = 5 36· 1 6 = 5 216,

dan karena P (A ∩ B) 6= P (A)P (B), maka peristiwa A dan B tidak independen. Peristiwa E1, E2, · · · , En dikatakan independen, jika untuk setiap r ≤ n

berlaku

(34)

Bab 5

Variabel Random

Dalam suatu eksperimen random dapat terjadi peneliti tidak tertarik pada out-comenya tetapi barangkali lebih tertarik pada nilai numerik yang berkaitan den-gan outcome tersebut. Misalnya dalam percobaan melontarkan tiga mata uang sekali, mungkin peneliti lebih tertarik untuk mengamati banyaknya suatu sisi terjadi dari pada mengamati sisi apa saja yang menghadap ke atas.

Definisi 13. Variabel random adalah suatu fungsi yang domainnya ruang sam-pel dan nilainya bilangan real. Selanjutnya variabel random ditulis dengan no-tasi X. Jika c adalah peristiwa elementer, maka nilai variabel random X di c ditulis X(c). Jika nilai X(c) adalah x maka ditulis X(c) = x.

Contoh 38. Dua mata uang logam dilontarkan satu kali. Jika X menyatakan banyaknya sisi a terjadi, maka X merupakan variabel random. Nilai variabel random pada setiap anggota ruang sampel adalah sebegai berikut:

X(gg) = 0, X(ag) = 1, X(ga) = 1, X(aa) = 2.

5.1

Variabel Random Diskrit

Variabel random X dikatakan variabel random diskrit jika nilai variabel ran-dom tersebut terhitung, yakni banyaknya nilai berhingga atau dapat dituliskan sebagai

x1, x2, x3, · · · .

Pada Contoh 38, X merupakan variabel random diskrit. .

(35)

32 BAB 5. VARIABEL RANDOM

Contoh 39. Tiga mata uang dilontarkan satu kali. Jika variabel random X menyatakan banyaknya sisi angka terjadi, maka nilai-nilai X adalah

X(ggg) = 0 X(agg) = X(gag) = X(gga) = 1 X(aaa) = 3 X(aag) = X(aga) = X(gaa) = 2

Contoh 40. Dua dadu dilontarkan satu kali. Variabel random X menyatakan banyaknya jumlah bintik kedua sisi yang menghadap ke atas. Nilai-nilai variabel random X aadalah X((1, 1)) = 2 X((1, 2)) = 3 X((1, 3)) = 4 X((1, 4)) = 5 X((1, 5)) = 6 X((1, 6)) = 7 X((2, 1)) = 3 X((2, 2)) = 4 X((2, 3)) = 5 X((2, 4)) = 6 X((2, 5)) = 7 X((2, 6)) = 8 X((3, 1)) = 3 X((3, 2)) = 5 X((3, 3)) = 6 X((3, 4)) = 7 X((3, 5)) = 8 X((3, 6)) = 9 X((4, 1)) = 5 X((4, 2)) = 6 X((4, 3)) = 7 X((4, 4)) = 8 X((4, 5)) = 9 X((4, 6)) = 10 X((5, 1)) = 6 X((5, 2)) = 7 X((5, 3)) = 8 X((5, 4)) = 9 X((5, 5)) = 10 X((5, 6)) = 11 X((6, 1)) = 7 X((6, 2)) = 8 X((6, 3)) = 9 X((6, 4)) = 10 X((6, 5)) = 11 X((6, 6)) = 12

Jika X variabel random diskrit, maka peluang variabel random X bernilai x ditulis P (X = x). Pada Contoh 39 misalnya, variabel random X bernilai 2 jika dan hanya jika peristiwa {aag}, {aga} dan {gaa} terjadi. Ini berarti peluang X = 2 sama dengan peluang terjadinya peristiwa {aag, aga, gaa}, sehingga diperoleh

P (X = 2) = P ({aag, aga, gaa}) = 3 8.

Perhatikan bahwa nilai P (X = x) tergantung pada peristiwa yang dikaitkan dengan nilai variabel random x. Dengan demikian peluang variabel random X bergantung pada nilai x, dengan kata lain P (X = x) merupakan fungsi dari x. Oleh karena itu dapat dituliskan

f (x) = P (X = x).

Selanjutnya f (x) dinamakan fungsi peluang atau distribusi peluang vari-abel random X.

Contoh 41. Pada Contoh 39, distribusi peluangnya adalah

f (0) = P (X = 0) = P (ggg) = 1 8

f (1) = P (X = 1) = P (agg, gag, gga) = 3 8

f (2) = P (X = 2) = P (aag, aga, gaa) = 3 8

f (3) = P (X = 3) = P (aaa) = 1 8

(36)

5.1. VARIABEL RANDOM DISKRIT 33

Contoh 42. Pada Contoh 40, distribusi peluangnya adalah f (2) = P (X = 2) = P ((1, 1)) = 361 f (3) = P (X = 3) = P ((1, 2)(2, 1)) = 362 f (4) = P (X = 4) = P ((1, 3), (2, 2), (3, 1)) = 363 f (5) = P (X = 5) = P ((1, 4), (2, 3), (3, 2), (4, 2)) =364 f (6) = P (X = 6) = P ((1, 5), (2, 4), (3, 3), (4, 2), (5, 1)) =365 f (7) = P (X = 7) = P ((1, 6), (2, 5), (3, 4), (4, 3), (5, 2), (6, 1)) = 366 f (8) = P (X = 8) = P ((2, 6), (3, 5), (4, 4), (5, 3), (6, 2)) =365 f (9) = P (X = 9) = P ((3, 6), (4, 5), (5, 4), (6, 3)) =364 f (10) = P (X = 10) = P ((4, 6), (5, 5), (6, 4)) = 363 f (11) = P (X = 11) = P ((5, 6), (6, 5)) =362 f (12) = P (X = 12) = P ((6, 6)) =16

Fungsi distribusi kumulatif atau fungsi distribusi, ditulis F (x), adalah peluang variabel random X bernilai lebih kecil atau sama dengan x. Jadi

F (x) = P (X ≤ x).

Contoh 43. Perhatikan kembali Contoh 39. Distribusi kumulatifnya dalah F (0) = P (x ≤ 0) = P (X = 0) = 18

F (1) = P (x ≤ 1) = P (X = 0) + P (X = 1) = 12

F (2) = P (x ≤ 2) = P (X = 0) + P (X = 1) + P (X = 2) = 78

(37)

34 BAB 5. VARIABEL RANDOM

Contoh 44. Distribusi kumulatif pada Contoh 40 adalah

F (2) = P (x ≤ 2) = P (X = 2) = 361 F (3) = P (x ≤ 3) = P (X = 2) + P (X = 3) = 363 F (4) = P (x ≤ 4) = P (X = 2) + P (X = 3) + P (X = 4) = 366 F (5) = P (x ≤ 5) = P (X = 2) + P (X = 3) + P (X = 4) + P (X = 5) = 1036 F (6) = P (x ≤ 6) = P (X = 2) + P (X = 3) + P (X = 4) + P (X = 5) + P (X = 6) = 15 36 F (7) = P (x ≤ 7) = P (X = 2) + P (X = 3) + P (X = 4) + P (X = 5) + P (X = 6) +P (X = 7) = 21 36 F (8) = P (x ≤ 8) = P (X = 2) + P (X = 3) + P (X = 4) + P (X = 5) + P (X = 6) +P (X = 7) + P (X = 8) = 26 36 F (9) = P (x ≤ 9) = P (X = 2) + P (X = 3) + P (X = 4) + P (X = 5) + P (X = 6) +P (X = 7) + P (X = 8) + P (X = 9) = 3036 F (10) = P (x ≤ 10) = P (X = 2) + P (X = 3) + P (X = 4) + P (X = 5) + P (X = 6) +P (X = 7) + P (X = 8) + P (X = 9) + P (X = 10) = 3336 F (11) = P (x ≤ 11) = P (X = 2) + P (X = 3) + P (X = 4) + P (X = 5) + P (X = 6) +P (X = 7) + P (X = 8) + P (X = 9) + P (X = 10) + P (X = 11) = 3536 F (12) = P (x ≤ 12) = P (X = 2) + P (X = 3) + P (X = 4) + P (X = 5) + P (X = 6) +P (X = 7) + P (X = 8) + P (X = 9) + P (X = 10) + P (X = 11) + P (X = 12) = 3636 = 1.

(38)

5.2. NILAI HARAPAN VARIABEL RANDOM DISKRIT 35

5.2

Nilai Harapan Variabel Random Diskrit

Nilai harapan suatu variabel random menggambarkan nilai yang diharapkan akan terjadi dari suatu eksperimen random atau kecenderungan hasil yang akan terjadi.

Definisi 14. Nilai harapan suatu variabel random diskrit ditulis E(X) atau µ, didefinisikan sebagai berikut

µ = E(X) =Xxi.P (X = xi),

Contoh 45. Pada percobaan melontarkan dua mata uang logam sebanyak satu kali (Contoh 38), diperoleh

P (X = 0) = 1 4 P (X = 1) = 1 2 dan P (X = 2) = 1 4. Dengan demikian nilai harapannya adalah

µ = E(X) = 0 · P (X = 0) + 1 · P (X = 1) + 2 · P (X = 2) = 0 ·14 + 1 ·12+ 2 ·14 = 1.

Karena µ adalah nilai harapan variabel random X, maka X − µ merupakan deviasi X terhadap nilai harapannya. Ukuran yang menggambarkan variabilitas suatu variabel random didefinisikan berikut.

Definisi 15. Varian variabel random diskrit X ditulis V ar(X) atau σ2 adalah

σ2= V ar(X) = E((X − µ)2) =X(xi− µ)2.P (X = xi),

Kuantitas σ =√σ2 dinamakan deviasi standar.

Berdasarkan definisi di atas, V ar(X) merupakan nilai harapan kuadrat devi-asi X − µ; dengan demikian V ar(X) ≥ 0. Semakin besar varian suatu variabel random, semakin basar variabilitasnya. Nilai varian suatu variabel random adalah 0 jika dan hanya jika variabel random tersebut nilainya tetap. tersebut Contoh 46. Varian pada Contoh 38 di atas adalah

σ2= V ar(X) = (0 − 1)2.P (X = 0) + (1 − 1)2.P (X = 1) + (2 − 1)2.P (X = 2)

=1

4+ 0 + 2. 1 4 = 0.5.

(39)

36 BAB 5. VARIABEL RANDOM

5.3

Variabel Random Kontinu

Jika X adalah variabel random dengan peluang pada setiap titik tunggal x sama dengan nol, yakni P (X = x) = 0, maka X dinamakan variabel random kontinyu. Jika X variabel random kontinyu, maka ada fungsi f (x) sehingga peluang variabel random X berada di antara a dan b sama dengan luas daerah yang dibatasi oleh kurva f (x), sumbu x, garis x = a dan garis x = b. Selan-jutnya peluang X berada di antara a dan b ditulis P (a < X < b). Fungsi f (x) tersebut dinamakan fungsi kepadatan peluang.

Fungsi distribusi kumulatif variabel random kontinyu X, ditulis F (x), didefinisikan sebagai peluang variabel random X bernilai lebih kecil atau sama dengan x atau

F (x) = P (X < x)

Contoh 47. Diketahui variabel random kontinyu X memiliki fungsi densitas f (x) = 15 dengan 0 ≤ x ≤ 5. Peluang variabel random X berada antara 1 dan 3 adalah

P (1 ≤ X ≤ 3) = 2 5, dan distribusi kumulatif di x = 2.5 adalah

F (2.5) = 1 2.

5.4

Variabel Random Bersama

Di dalam suatu penelitian, kita sering tertarik pada dua variabel random atau lebih. Misalnya dalam meneliti tentang penyakit jantung, mungkin kita tertarik pada beberapa faktor penyebab seperti kebiasaan merokok dan konsumsi alko-hol.

Diketahui dua variabel random X dan Y . Untuk menggabungkan kedua vari-abel dapat kita gunakan fungsi distribusi kumulatif.

Definisi 16. Diketahui variabel random X dan Y . Fungsi distribusi kumu-latif bersama F (x, y) adalah

F (x, y) = P (X ≤ x, Y ≤ y).

Berdasarkan definisi di atas, fungsi distribusi kumulatif bersama adalah pelu-ang variabel random X ≤ x dan Y ≤ y terjadi bersama-sama.

Diketahui X dan Y masing-masing variabel random disktrit. Peluang vari-abel random X bernilai x dan varivari-abel random Y bernilai y ditulis P (X = x, Y = y). Variabel random X dan Y dikatakan independen jika berlaku

(40)

5.4. VARIABEL RANDOM BERSAMA 37

Dua variabel random kontinyu X dan Y dikatakan independent jika peluang terjadinya X tidak dipengaruhi apakah variabel random Y terjadi atau tidak. Jika f (x, y) fungsi densitas variabel random kontinyu X dan Y dan kedua vari-abel random independen, maka berlaku

f (x, y) = f1(x).f2(y),

(41)
(42)

Bab 6

Beberapa Distribusi

Peluang

Pada bagian ini akan disampaikan beberapa distribusi peluang variabel random diskrit dan kontinyu yang banyak digunakan didalam inferensi statistik.

6.1

Distribusi binomial

Misalkan suatu eksperimen random hanya memiliki dua hasil yang mungkin, hasil pertama dinamakan sukses dan hasil kedua dinamakan gagal. Eksper-imen tersebut diulang secara independen sebanyak n kali. Jika peluang suk-ses setiap eksperimen adalah sama sebesar p maka peluang gagal pada setiap eksperimen adalah p−1. Jika X menyatakan banyaknya sukses dari n percobaan (trial) dan peluang X = x diberikan oleh fungsi peluang berikut

P (X = x) =n x 

px(1 − p)n−x, x = 0, 1, 2, 3, · · · , n, (6.1)

maka X dinamakan berdistribusi binomial dengan parameter n dan p. Selanjutnya dapat dibuktikan bahwa nilai harapan dan varians disrtibusi bino-mial adalah

µ = np dan σ2= np(1 − p) (6.2) Di dalam fungsi peluang binomial, notasi nx menyatakan kombinasi x objek dari n objek, yaitu

n x  = n! x!(n − x)!, (6.3) dengan n! = 1 · 2 · 3 · · · (n − 1) · n dan 0! = 1.

Contoh variabel random berdistribusi binomial adalah melontarkan mata uang logam, cacat tidaknya suatu produk dan macet tidaknya suatu mesin jet.

(43)

40 BAB 6. BEBERAPA DISTRIBUSI PELUANG

Contoh 48. Diketahui suatu telur asin yang diproduksi suatu perusahaan memiliki peluang rusak 0.01 dan bersifat independen terhadap telor asin lainnya. Jika diambil secara random sampel sebanyak 5 telor asin, (a) berapa peluang telor asin yang rusak sebanyak satu? (b) berapa peluang telor asin yang rusak paling banyak satu?

Jika X menyatakan banyaknya telor asin yang rusak, maka X merupakan vari-abel random binomial dengan n = 5 dan p = 0.01. Dengan demikian

(a) Peluang telor asin yang rusak sebanyak satu adalah

P (X = 1) =5 1 

(0.01)1(1 − 0.01)4= 0.04803.

(b) Peluang telor asin yang rusak paling banyak satu adalah P (X ≤ 1) = P (X = 0) + P (X = 1) = 5 0  (0.01)0(1 − 0.01)5+5 1  (0.01)1(1 − 0.01)4 = 0.95099 + 0.04803 = 0.99902.

6.2

Distribusi Normal

Variabel random X dikatakan berdistribusi normal dengan mean µ dan varian σ2 jika fungsi densitasnya diberikan oleh

f (x) = 1 σ√2πe

−(x−µ)2/2σ2

, (6.4)

dengan π = 2, 1415... dan e = 2, 718282....

Contoh variabel random yang berdistribusi normal adalah diameter lubang yang dihasilkan mesin bor, skor suatu test, konsentrasi suatu bahan kimia pada suatu jenis obat, dan hasil panen pada suatu lahan.

Jika mean µ = 0 dan deviasi σ = 1, maka X dinamakan berdistribusi nor-mal standar. Grafik distribusi nornor-mal standar disajikan pada gambar 6.1, yakni berupa kurva yang simetris terhadap garis z = 0. Pada grafik ini sumbu horisontal z merupakan nilai variabel random dan sumbu vertikal merupakan nilai fungsi densitas f (z). Nilai maksimum grafik ini dicapai pada titik z = 0, semakin jauh dari titik z = 0 semakin kecil nilai fungsi ini dan akan mendekati nol jika nilai z mendekatai tak hingga atau mendekati minus tak hingga.

Jika variabel random X berdistribusi normal standar, maka distribusi ku-mulatifnya dituliskan dengan notasi Φ(x); jadi

(44)

6.2. DISTRIBUSI NORMAL 41 −4 −2 2 4 0.1 0.2 0.3 0.4 z

Gambar 6.1: Kurva normal standar

x

Gambar 6.2: P (X ≤ x) = Φ(x)

Secara grafik, kurva fungsi densitas normal standar simetris terhadap garis x = 0. Karena luas seluruhnya adalah 1, maka

Φ(0) = 0.5.

(45)

42 BAB 6. BEBERAPA DISTRIBUSI PELUANG

0

Gambar 6.3: Φ(0) = 0.5

yang dibatasi x = 0 dan x = −a adalah sama. Dengan demikian berlaku Φ(−x) = 1 − Φ(x).

−x x

Gambar 6.4: Φ(−x) = 1 − Φ(x)

Untuk menghitung peluang variabel random X yang berdistribusi normal standar dapat digunakan tabel normal standar. Peluang variabel random X berada di antara a dan b, dengan a < b, sama dengan luas daerah di bawah kurva normal yang dibatasi garis x = a dan x = b. Dengan demikian

P (a ≤ X ≤ b) = Φ(b) − Φ(a).

Contoh 49. Diketahui X berdistibusi normal standar. Hitunglah peluang (a) X lebih kecil 1.94, (b) X terletak antara 0.5 dan 1.4, (c) X berada antara −1.1 dan 1.5.

(46)

6.3. DISTRIBUSI YANG BERHUBUNGAN DENGAN DISTRIBUSI NORMAL43 a b Gambar 6.5: P (a ≤ X ≤ b) = Φ(b) − Φ(a) (b) P (0.5 ≤ X ≤ 1.4) = Φ(1.4) − Φ(0.5) = 0.9192 − 0.6915 = 0.2277. (c) P (−1.1 ≤ X ≤ 1.5) = Φ(1.5) − Φ(−1.1) = Φ(1.5) − (1 − Φ(1.1)) = 0.9332 − (1 − 0.8643) = 0.7975.

6.3

Distribusi yang berhubungan dengan distribusi

normal

6.3.1

Distribusi Chi-Square

Jika variabel random X1, X2, X3, · · · , Xr adalah r variabel independen yang

masing-masing berdistibusi normal standar, maka variabel random

χ2= X12+ X22+ X32+ · · · + Xr2 (6.6)

berdistibusi dengan distribusi yang dinamakan distribusi Chi-square dengan derajat bebas r.

Distribusi kumulatif χ2 dengan derajat bebas r ditulis P (χ2

r≤ x). Nilai batas

x untuk derajat bebas r dan distribusi kumulatif γ tertentu dapat dicari pada suatu tabel yang dinamakan tabel Distribusi χ2.

Contoh 50. Carilah x sehingga P (χ212≤ x) = 0.05.

Berdasarkan tabel dengan r = 12 dan γ = 0.05 diperoleh x = 5.226.

6.3.2

Distribusi t

Diketahui Y dan Z variabel random independen, dengan Y berdistribusi nor-mal standar dan Z berdistribusi chi-square dengan derajat bebas r. Dapat ditunjukan bahwa variabel random

(47)

44 BAB 6. BEBERAPA DISTRIBUSI PELUANG

T = Y

pZ/r (6.7)

memiliki distribusi yang dinamakan distribusi t dengan derajat bebas r. Nilai distribusi kumulatif variabel random berditribusi t dengan derajat bebas r ditulis P (tr ≤ x). Nilai x untuk derajat bebas r dan distribusi kumulatif γ

tertentu dapat dicari pada suatu tabel yang dinamakan tabel Distribusi t. Contoh 51. Carilah x sehingga P (t10≤ x) = 0.99.

Berdasarkan tabel dengan r = 10 dan γ = 0.99 diperoleh x = 2.7638.

6.3.3

Distribusi F

Diketahui variabel random X dan Y berdistribusi chi-square dengan derajat bebas berturut-turut r1 dan r2. Dapat dibuktikan bahwa variabel random

F = X/r1 Y /r2

(6.8)

memiliki suatu distribusi yang dinamakan distribusi F dengan derajat be-bas r1 dan r2. Dalam hal ini r1 disebut juga derajat bebas pembilang dan r2

disebut juga derajat bebas penyebut. Distribusi kumulatif F dengan derajat bebas r1 dan r2, ditulis P (Fr1,r2 ≤ x). Nilai x untuk r1 dan r2 tertentu dan

distribusi kumulatif γ tertentu telah dihitung dan ditabelkan pada suatu tabel yang dinamakan tabel F .

Contoh 52. Carilah x sehingga P (F4,10≤ x) = 0.95.

(48)

Bab 7

Teori Sampling

Di dalam aplikasi kita sering mengambil kesimpulan dari suatu kelompok indi-vidu atau populasi. Karena alasan tertentu, kita tidak mungkin untuk menga-mati seluruh anggota populasi, namun hanya mengamenga-mati bagian dari populasi yang dinamakan sampel. Inferensi statistik adalah pengambilan kesimpulan berdasarkan sampel.

Jika X variabel random dengan distribusi F dan dilakukan percobaan ran-dom sebanyak n kali, maka diperoleh variabel ranran-dom X1, X2, · · · , Xn.

Se-lanjutnya X1, X2, · · · , Xn dinamakan sampel random dari distribusi F . Suatu

sampel dikatakan berukuran n jika banyaknya anggota sampel adalah n. Jika nilai sampel random tersebut berturut-turut adalah x1, x2, · · · , xn, maka

nilai-nilai ini dinamakan nilai-nilai eksperimen atau data sampel.

Suatu kuantitas yang dihitung dari data sampel dinamakan statistik, sedan-gkan suatu kauntitas yang dimiliki oleh suatu populasi dinamakan parameter. Dapat terjadi nilai parameter suatu populasi diketahui atau tidak diketahui. Contoh 53. Misalkan variabel random X menyatakan usia bola lampu yang diproduksi suatu perusahaan yang diasumsikan berdistribusi normal dengan mean µ dan varian σ2yang tidak diketahui. Satu-satunya cara untuk

memper-oleh informasi tentang µ dan σ2adalah dengan melakukan eksperimen random.

Misalkan dilakukan eksperimen dengan mengambil secara random sebanyak n = 100 bola lampu, dan usia bola lampu yang tercatat adalah X1, X2, X3, · · · , X100.

Dalam hal ini X1, X2, X3, · · · , X100 merupakan sampel random yang berasal

dari distribusi normal tersebut. Ke 100 bola lampu tersebut dapat digunakan untuk memperoleh informasi tentang µ dan σ2. Ukuran yang diperoleh dari ke

100 bola lampu tersebut merupakan statistik, sedangkan µ dan σ2 merupakan

parameter.

Misalkan suatu populasi memiliki distribusi tertentu dengan mean popu-lasi µ dan varian popupopu-lasi σ2. Suatu sampel random X

1, X2, · · · , Xndiambil

dari populasi tersebut. Ada dua statistik yang penting, yaitu mean sampel dan

(49)

46 BAB 7. TEORI SAMPLING

varian sampel.

Definisi 17. Diketahui X1, X2, X3, · · · , Xn adalah sampel random berukuran

n.

(a) Mean sampel didefinisikan

X = X1+ X2+ · · · + Xn n = n X i=1 Xi n

(b) Varian sampel didefinisikan

S2= n X i=1 (Xi− X)2 n − 1 ,

dan S =√S2 dinamakan deviasi standar sampel.

Contoh 54. Suatu eksperimen random telah dilakukan sebanyak 5 kali dan diperoleh X1 = 3.5, X2 = 3.2, X3 = 3.4, X4 = 3.3 dan X5 = 3.6. Mean

sampelnya adalah X = 5 X i=1 Xi 5 = 3.5 + 3.2 + 3.4 + 3.3 + 3.6 5 = 3.4,

dan varian sampelnya adalah

S2 = 5 X i=1 (Xi− X)2 5 − 1 = (3.5 − 3.4) 2+ (3.2 − 3.4)2+ (3.4 − 3.4)2+ (3.3 − 3.4)2+ (3.6 − 3.4)2 4 = 0.025.

Dengan demikian deviasi standar sampel adalah S =√0.025 = 0.158.

Distribusi sampel adalah distribusi peluang suatu statistik. Misalnya dis-tribusi peluang X dinamakan disdis-tribusi sample mean.

Teorema 2. Jika X1, X2, · · · , Xn sampel random berukuran n dari suatu

dis-tribusi dengan mean µ dan varian σ2, maka nilai harapan X dan varian X

(50)

47

(a) E(X) = µ (b) V ar(X) = σ2

n.

Berdasarkan teorema di atas, nilai harapan X sama dengan mean populasi µ, sedangkan varian X semakin mengecil dengan bertambahnya ukuran sampel n.

Teorema 3 (Teorema Limit Pusat). Jika X adalah mean sampel random berukuran n dari suatu populasi dengan mean µ dan varian σ2, maka

Z = X − µ σ√n

mendekati berdistribusi normal standar jika n besar.

Umumnya Z mendekati distribusi normal untuk n ≥ 30. Teorema di atas dapat digunakan untuk mencari nilai pendekatan peluang variabel random ¯X. Contoh 55. Suatu perusahan memproduksi bola lampu yang usia hidupnya berdistribusi mendekati normal dengan mean 800 jam dan deviasi standar 40 jam. Berapa peluang suatu sampel random sebanyak 16 bola lampu akar berusia rata-rata kurang dari 775 jam?

Distribusi sampel X mendekati normal dengan µX= 800 dan σX = 40/√16 = 10. Peluang yang dicari adalah

P (X < 775) = P X − µ σ√n < 775 − 800 10  = P (Z < −2.5) = 0.0062.

Teorema 4. Jika X1, X2, · · · , Xn sampel random berukuran n dari suatu

dis-triibusi dengan mean µ dan varian σ2, maka nilai harapan S2=Pn

i=1

(Xi−X)2

n−1

adalah

E(S2) = σ2.

Teorema tersebut menyatakan bahwa nilai harapan dari varian sampel sama dengan varian populasi.

Brikutnya akan dibahas distribusi statistik suatu sampel random yang be-rasal dari populasi berdistrusi normal. Jika X1, X2, · · · , Xn adalah sampel

(51)

48 BAB 7. TEORI SAMPLING

sampel X, maka

Z = X − µ σ/√n berdistribusi normal standar.

Teorema 5. Jika X1, X2, · · · , Xn adalah sampel random dari populasi

berdis-tribusi normal dengan mean µ dan varian σ, maka (a) X dan S2 independen

(b) X berdistribusi normal dengan mean µ dan varian σ2/n

(c) (n − 1)S22 berdistribusi chi-square dengan derajat bebas n − 1.

Di dalam inferensi statistik, sering diasumsikan bahwa sampel random X1, X2, · · · , Xn

bersifat independen. Jika ukuran populai berhingga, maka tidak ada jaminan sampel random tersebut independen. Namun jika ukuran populasi relatif besar terhadap ukuran sampel, maka sampel random tersebut mendekati independen.

(52)

Bab 8

Estimasi

Jika kita telah memperoleh data sampel dari suatu populasi yang memiliki mean µ yang tidak diketahui, maka untuk memperoleh informasi tentang parameter µ dapat digunakan mean sampel ¯x. Ini berarti statistik ¯x digunakan untuk mengestimasi (meduga) parameter mean populasi µ. Dalam hal ini ¯x dinamakan estimator (penduga) untuk µ. Secara umum, jika θ parameter populasi, maka estimator untuk θ ditulis ˆθ. Jadi ˆµ = ¯x.

Estimator titik suatu parameter adalah estimator yang berupa sebuah nilai tunggal. Sebagai contoh, dalam pernyataan ”rata-rata hasil pengukuran ke-cepatan cahaya adalah 301.000 km/detik”, nilai tersebut adalah suatu estimator titik.

Definisi 18. Suatu statistik dikatakan estimator tak bias parameter θ jika ni-lai harapannya sama dengan θ. Jika tidak demikian maka statisik tersebut dikatakan bias.

Pada kuliah sebelumnya telah disampaikan bahwa statistik

X = Pn

i=1Xi

n

memiliki nilai harapan sama dengan mean populasi µ. Dengan demikian X merupakan estimator tak bias untuk parameter µ . Demikian pula varian sampel

S2= Pn

i=1(Xi− X)2

n − 1

juga merupakan estimator tak bias parameter varian σ2 .

(53)

50 BAB 8. ESTIMASI

Definisi 19. Suatu estimator θ1 dikatakan lebih efisien dari pada estimator θ2

jika varian θ1 lebih kecil dibanding varian θ2.

Suatu estimator yang berupa interval dimana parameter diduga berada di-namakan estimator interval.

Sebagai contoh, jika dikatakan kecepatan cahaya berkisar antara 299.000 km/detik sampai dengan 305.000 km/detik, maka nilai kecepatan cahaya yang sebenarnya dipercaya berada di antara kedua batas interval.

Interval kepercayaan untuk suatu parameter adalah suatu inteval dalam mana parameter dipercaya berada. Misalkan θ adalah parameter yang tidak diketahui. Untuk membentuk interval kepercayaan θ, kita perlu mencari statis-tik U dan L sehingga peluang

P (L ≤ θ ≤ U ) = 1 − α

adalah benar. Interval

L ≤ θ ≤ U (8.1)

dinamakan interval kepercayaan 100(1-α) persen untuk parameter θ.

Interval kepercayaan dapat diinterpretasikan sebagai berikut: jika kita mengam-bil sampel random berulang-ulang, maka 100(1−α) persen dari semua nilai data akan memuat nilai θ yang sebenarnya.

Di dalam persamaan 8.1, L dan U berturut-turut dinamakan batas bawah dan batas atas interval.

Jika α = 0.05 misalnya, maka persamaan 8.1 dinamakan interval kepercayaan 95 persen untuk θ. Pada bagian berikut, kita akan belajar membentuk interval kepercayaan untuk paramter mean populasi µ, varian populasi σ2 dan selisih

dua mean populasi.

8.1

Interval Kepercayaan untuk µ dengan σ

Dike-tahui

Misalkan X1, X2, · · · , Xnadalah sampel random dari populasi berdistribusi

nor-mal dengan mean µ dan varian σ2. Telah disampaikan bahwa X merupakan

estimator µ. Namun demikian kita tidak dapat memastikan bahwa X = µ, melainkan kita hanya dapat menyatakan bahwa µ berada di dalam interval ter-tentu.

Karena X berdistribusi normal dengan mean µ dan varian σ2/n, maka

X − µ σ/√n

(54)

8.1. INTERVAL KEPERCAYAAN UNTUK µ DENGAN σ DIKETAHUI 51

berdistribusi normal standar. Oleh karena itu

P  −1.96 <√n(X − µ) σ < 1.96  = 0.95

atau ekivalen dengan

P  X − 1.96√σ n < µ < X + 1.96 σ √ n  = 0.95 Interval  X − 1.96√σ n, X + 1.96 σ √ n 

dinamakan interval kepercayaan 95 persen untuk µ.

Jika x1, x2, · · · , xn adalah data sampel dari distribusi di atas, dan x adalah

rata-rata sampel, maka interval kepercayaan 95 persen untuk µ adalah  x − 1.96√σ n, x + 1.96 σ √ n  .

Contoh 56. Dari data sampel random berat badan 100 orang dewasa di Palangkaraya diperoleh x = 67.45 kg dan penelitian sebelumnya menyatakan bahwa σ2 = 8.6136 kg. Carilasolh interval kepercayaan 95 persen berat badan orang dewasa di Palangkaraya.

Penyelesaian. Berdasarkan yang diketahui, interval kepercayaan 95 persen un-tuk mean populasi adalah

 x − 1.96√σ n, x + 1.96 σ √ n  = 67.45 − 1.96√2.93 100, 67.45 + 1.96 2.93 √ 100  = (66.8748, 68.0252) .

Ini berarti 95 persen dapat dipercaya bahwa berat badan rata-rata orang dewasa di Palangkaraya berada di antara (66.8748 kg sampai dengan 68.0252 kg.

Dengan cara yang serupa, interval kepercayaan 99 persen untuk mean pop-ulasi µ adalah  X − 2.58√σ n, X + 2.58 σ √ n  .

Secara umum, interval kepercayaan (1 − α) persen untuk mean populasi µ jika σ diketahui adalah

 X − zα/2 σ √ n, X + zα/2 σ √ n  .

(55)

52 BAB 8. ESTIMASI

Tingkat 99.73 % 99 % 98 % 96 % 95.45 % 95 % 90 % kepercayaan

zα/2 3.00 2.58 2.33 2.05 2.00 1.96 1.645

Table 8.1: Tabel zα/2

8.2

Interval Kepercayaan untuk µ dengan σ Tidak

Diketahui

Misalkan X1, X2, · · · , Xn sampel random dari populasi berdistribusi normal

dengan µ dan σ2keduanya tak diketahui. Dapat dibuktikan bahwa

(X − µ)√n S berdistribusi t dengan derajat bebas n − 1.

Interval kepercayaan (1 − α) persen untuk µ dapat dibentuk sebagai berikut.

P  −tα/2,n−1< (X − µ)√n S < tα/2,n−1  = 1 − α

atau ekivalen dengan

P  X − tα/2,n−1 S √ n < µ < X + tα/2,n−1 S √ n  = 1 − α.

Jadi jika X = x dan S = s, maka kita dapat menyatakan bahwa 100(1 − α) persen percaya nilai µ berada di dalam interval

 x − tα/2,n−1 S √ n, x + tα/2,n−1 S √ n  .

Contoh 57. Berdasarkan data sampel random pengukuran 10 diameter pipa menghasilkan mean x = 2.38 cm dan deviasi standar s = 0.06 cm. Carilah interval kepercayaan 95 persen untuk diameter pipa yang sebenarnya.

Penyelesaian. Berdasarkan tabel t dengan α = 0.05 dan n = 10 diperoleh t0.025,9 = 2.262. Interval kepercayaan 95 persen untuk diameter pipa yang

sebenarnya adalah  2.38 − 2.2620.06√ 10, 2.38 + 2.262 0.06 √ 10  = (2.38 − 0.04292, 2.38 + 0.04292) = (2.3371, 2.4229)

yang berarti bahwa 95 persen dapat dipercaya diameter pipa yang sebenarnya antara 2.3371 dan2.4229.

(56)

8.3. INTERVAL KEPERCAYAAN UNTUK σ2 53

8.3

Interval Kepercayaan untuk σ

2

Diketahui X1, X2, · · · , Xn sampel random dari populasi berdistribusi normal

dengan mean µ dan varian σ2 yang tidak diketahui. Dapat dibuktikan bahwa

(n − 1)S

2

σ2

berdistribusi Chi-square dengan dejarat bebas n − 1.

Interval kepercayaan (1 − α) persen untuk σ2dapat dibentuk sebagai berikut.

P  χ21−α/2,n−1< (n − 1)S 2 σ2 < χ 2 α/2,n−1  = 1 − α

atau ekivalen dengan

P (n − 1)S 2 χ2 α/2,n−1 < σ2< (n − 1)S 2 χ2 1−α/2,n−1 ! = 1 − α.

Jadi jika S2= s2, interval kepercayaan 100(1 − α) persen untuk σ2 adalah

(n − 1)S2 χ2 α/2,n−1 , (n − 1)S 2 χ2 1−α/2,n−1 ! .

Contoh 58. Kapasitas 10 batere diukur dan hasilnya sebagai berikut (dalam ampere − jam):

140, 136, 150, 144, 148, 152, 138, 141, 143, 151. (a) Carilah estimasi untuk varian populasi σ2, dan (b) hitunglah interval

keper-cayaan 99 persen untuk σ2.

Penyelesaian. (a) Dari data tersebut diperoleh x = 144.3. Estimasi untuk varian populasi S2= 10 X i=1 (Xi− 144.4)2 10 − 1 = 32.23.

(b) Karena 1 − α = 0.99 maka α/2 = 0.01/2 = 0.005. Berdasarkan tabel Chi-square diperoleh χ2

0.005,9= 23.589 dan χ21−0.005,9 = χ20.995,9 = 1.735.

Jadi interval kepercayaan 99 persen untuk σ2 adalah

(n − 1)S2 χ2 α/2,n−1 , (n − 1)S 2 χ2 1−α/2,n−1 ! = 9 × 32.23 23.589 , 9 × 32.23 1.735  = (12.30, 167.19),

yang berarti bahwa dapat dipercaya 99 persen nilai varian populasi berada pada interval (12.30, 167.19).

Gambar

Grafik runtun waktu adalah grafik yang menggambarkan bagaimana data berubah terhadap waktu.
Diagram batang dan daun menyajikan data dalam bentuk susunan dan kelom- kelom-pok tertentu
Gambar 6.1: Kurva normal standar
Table 8.1: Tabel z α/2
+2

Referensi

Garis besar

Dokumen terkait

(2000) menjelaskan dua aksi estrogen pada pertumbuhan tulang yaitu kadar estrogen rendah dapat merangsang pertumbuhan tulang melalui stimulasi GH dan kadar estrogen tinggi

Penyusunan Perubahan RENJA Dinas Pertanian Tanaman Pangan dan Hortikultura Kabupaten Banyuasin Tahun 2019 dilaksanakan melalui serangkaian kegiatan diawali dengan

Pelaksanaan Program Gerakan Makassar Ta tidak Rantasa memiliki tujuan untuk merubah pola pikir masyarakat agar tidak rantasa dalam kehidupan sehari-hari dan selalu

Biaya Perjalanan &amp; Akomodasi Tambahan - Biaya perjalanan tambahan Tertanggung untuk kembali ke negara asal dan biaya tambahan lainnya untuk akomodasi yang dibayar oleh

bahwa dalam rangka pelaksanaan ketentuan Pasal 8 Peraturan Daerah Kota Surabaya Nomor 5 Tahun 2008 tentang Kawasan Tanpa Rokok dan Kawasan Terbatas Merokok dan

Penelitian ini bertujuan untuk mengetahui profil sel darah merah meliputi total eritrosit, kadar hemoglobin, nilai hematokrit dan indeks eritrosit pada monyet

Bistatic radar merupakan suatu jenis sistem radar yang komponennya terdiri dari pemancar sinyal (transmitter) dan penerima sinyal (receiver), di mana kedua

bandeng, kakap putih dan kerapu macan, juga telah berhasil dipijahkan dan diproduksi benihnya antara lain berbagai jenis kerapu kerapu lumpur (E. corallicola),