Bahan Ajar Statistika
Haryadi
Universitas Muhammadiyah Palangkaraya
Daftar Isi
1 Populasi dan Sampel 5
1.1 Pengantar . . . 5
1.2 Sifat variabel dalam penelitian . . . 8
2 Penyajian Data 11 2.1 Distribusi Frekuensi . . . 11
2.2 Histogram . . . 13
2.3 Diagram Batang dan Daun . . . 16
3 Ringkasan Data 19 3.1 Ukuran Kecenderungan Pusat . . . 19
3.2 Varian . . . 23
3.3 Persentil . . . 25
3.4 Box Plot . . . 26
3.5 Teorema Chebyshev . . . 27
4 Peluang 29 4.1 Ruang Sampel . . . 29
4.2 Peluang . . . 31
4.3 Peluang Bersyarat . . . 34
5 Variabel Random 37 5.1 Variabel Random Diskrit . . . 37
5.2 Nilai Harapan Variabel Random Diskrit . . . 41
5.3 Variabel Random Kontinu . . . 43
5.4 Variabel Random Bersama . . . 43
6 Beberapa Distribusi Peluang 45 6.1 Distribusi binomial . . . 45
6.2 Distribusi Normal . . . 46
6.3 Distribusi yang berhubungan dengan distribusi normal . . . 51
6.3.1 Distribusi Chi-Square . . . 51
6.3.2 Distribusi t . . . 51
6.3.3 Distribusi F . . . 52
7 Teori Sampling 53 8 Estimasi 57 8.1 Interval Kepercayaan untuk µdenganσ Diketahui . . . 58
8.2 Interval Kepercayaan untuk µdenganσ Tidak Diketahui . . . 60
8.3 Interval Kepercayaan untuk σ2 . . . . 61
8.4 Interval Kepercayaan Selisih Dua Mean . . . 62
9 Uji Hipotesis 65 9.1 Uji tentang mean populasi normal . . . 66
9.1.1 Uji hipotesis denganσ2 diketahui . . . . 66
9.1.2 Uji hipotesis denganσ2 tidak diketahui . . . . 69
9.2 Uji kesamaan mean dua populasi . . . 71
9.2.1 Varian populasi diketahui . . . 71
9.2.2 Varian populasi tidak diketahui . . . 72
9.2.3 Varian tidak diketahui dan tidak sama . . . 74
9.3 Uji t berpasangan . . . 75
9.4 Uji hipotesi tentang varian populasi normal . . . 76
9.5 Uji hipotesis kesamaan varian dua populasi normal . . . 77
9.6 Uji Goodness of Fit . . . 78
9.7 Uji Independen . . . 80
10 Regresi Linear Sederhana 83 10.1 Sifat Estimator ˆβ dan ˆα . . . 86
10.2 Inferensi tentang parameter β dan α . . . 87
10.3 Koefisien Determinasi . . . 88
Bab 1
Populasi dan Sampel
1.1
Pengantar
Banyak kesimpulan sehari-hari didasarkan pada informasi yang tidak lengkap. Kes-impulan semacam ini tentu mengandung ketidak pastian. Di dalam statistika, kita akan mempelajari bagaimana menggali informasi atau membuat kesimpulan berdasarkan informasi yang tidak lengkap.
Definisi 1.1.1. Statistika merupakan studi tentang bagaimana mengumpulkan, mengorganisasi, menganalisis dan menginterpretasikan data.
Dengan demikian persyaratan untuk dapat melakukan studi dengan statistika adalah adanya data. Data diperoleh dengan melakukan observasi dari karakter individu-indvidu yang menjadi perhatian kita.
Sering terjadi data yang diperlukan dalam studi statistik sudah tersedia, mis-alnya data yang diterbitkan oleh Badan Pusat Statistik. Dapat pula terjadi data yang diperlukan dalam studi belum tersedia. Dalam hal data belum terdesia maka perlu diadakan dengan jalan melakukan observasi atau eksperimen.
Definisi 1.1.2. Variabel adalah karakteristik yang diukur atau diobservasi dari suatu objek.
Variabel kuantitatif adalah variabel yang dinyatakan dalam bentuk bilangan atau numerik.
Variabel kualitatif adalah variabel yang dinyatakan dalam kategori atau kelom-pok tertentu
Jika kita ingin meneliti prestasi belajar siswa suatu kelas, maka variabelnya dapat berupa nilai hasil belajar. Penelitian tentang tingkat kemasaman air di Palangkaraya, variabelnya bisa berupa pH air. Suatu penelitian yang bertujuan untuk mengetahui jenis warna yang disukai anak TK, variabelnya dapat berupa warna.
Definisi 1.1.3. Populasiadalah kumpulan semua individu ( objek) yang menjadi perhatian studi.
Bagian dari populasi dinamakansampel.
Banyaknya anggota populasi dinamakanukuran populasi. Banyaknya anggota sampel dinamakan ukuran sampel. Data yang diperoleh dari sampel dinamakan data sampel.
Contoh 1. Suatu studi bertujuan untuk mengetahui berat badan rata-rata maha-siswa UM Palangkaraya. Karena keterbatasan tenaga dan waktu, maka diambil sampel 100 orang mahasiswa untuk timbang berat badannya. Dalam studi ini, populasinya adalah seluruh mahasiswa UM Palangkaraya, sampelnya adalah ke 100 mahasiswa tersebut, dan variabelnya adalah berat badan yang merupakan variabel kuantitatif. Jelas bahwa rata-rata berat badan yang diukur dari 100 mahasiswa tidak menjamin akan mencerminkan rata-rata berat badan seluruh mahasiswa UM Palangkaraya. Hal ini dikarenakan informasinya tidak lengkap. Dalam hal ini bisa saja seluruh mahasiswa UM Palangkraya ditimbang berat badanya agar diperoleh kesimpulan yang tepat, namun tentu diperlukan waktu dan biaya yang lebih besar dibanding dengan mengamati 100 mahasiswa.
Dalam suatu studi umumnya kita menggunakan dapat sampel. Banyak alasan mengapa kita mengunakan data sampel, diantaranya (i) keterbatasan sumberdaya dan (ii) keterbatasan teknis.
Definisi 1.1.4. Parameter adalah suatu karekertistik populasi.
Statistik adalah suatu nilai yang dihitung dari data sampel.
Pada contoh 1, parameternya adalah rata-rata berat badan seluruh mahasiswa UM Palangkaraya, yang dalam hal ini nilainya tidak diketahui; sedangkan statis-tiknya adalah rata-rata berat badan yang dihitung dari ke 100 mahasiswa tersebut.
1.1. PENGANTAR 7
menggambarkan keadaan parameter dengan baik.
Ada banyak kriteria mengenai statistik yang baik untuk suatu parameter. Baik tidaknya suatu statistik sangat bergantung pada bagaimana sampel tersebut di-ambil dari populasi. Suatu proses pengdi-ambilan sampel dinamakansampling.
Cara pengambilan sampel Ada beberapa cara pengambilan sampel:
• Random sampling • Stratified sampling • Sistematik sampling • Cluster sampling
Sampel randomberukuranndari suatu populasi adalah bagian populasi yang diambil dengan cara sedemikian sehingga:
1. setiap sampel berukuran n memiliki kesempatan yang sama untuk terpilih. 2. setiap anggota populasi memiliki kesempatan yang sama untuk terpilih.
Suatu prosedur untuk memperoleh sampel random adalah dengan menggunakan bilangan random. Bilangan random dapat diperoleh pada tabel bilangan random, kalkulator atau program komputer.
Prosedur melakukan random sampling:
1. Beri nomor semua anggota populasi secara berurutan
2. Gunakan tabel, kalkulator atau komputer untuk memilih bilangan random.
3. Buatlah sampel dengan menggunakan anggota populasi yang nomornya berkai-tan dengan bilangan random yang terpilih.
Contoh 2. Akan diambil sampel random berukuran 10 dari sebuah kelas yang memiliki 50 siswa. Langkah-langkahnya:
1. Beri nomor urut pada setiap anggota kelas mulai nomor 1 sampai dengan nomor 50.
mulai baris ke-7 dan kolom ke-9:
66 94730 95761 75023 48464 65544 96583 18911 16391 99938 90704 93621 66330 33393 95261
Karena banyaknya sampel merupakan bilangan dua digit, maka bilangan ran-dom di atas dikelompokan menjadi dua digit :
66 94 73 09 57 61 75 02 34 84 64 65 54 49 65 83 18 91 11 63 91 99 93 89 07 04 93 62 16 63 30 33 39 39 52 61
3. Daftar semua anggoka kelas yang nomornya sesuai dengan nomor pada bi-langan random yang telah dikelompokan tersbut. Jika ditemui bibi-langan yang lebih besar dari 50 maka diabaikan, dan jika diperoleh bilangan random yang sudah terpilih sebelumnya, maka diabaikan. Anggota populasi yang terpilih sebagai anggota sampel adalah yang bernomor:
09 02 34 49 18 11 07 04 16 30 33.
Stratified sampling Stratified sampling adalah cara pengambilan sampel dari populasi yang memiliki strata tertentu. Misalnya, pada populasi mahasiswa UM Palangkaraya, stratanya dapat berupa lulusan SMA, sudah bekerja dan ma-hasiswa pindahan. Pada teknik ini, populasi dibagi minimal dalam dua strata, kemudian pada setiap strata pengambilan sampel dilakukan secara random sam-pling.
Sistematik sampling. Pada metode ini anggota populasi disusun dengan uru-tan tertentu. Kemudian dilakukan pengambilan satu individu secara random, dan dilanjutkan dengan mengambil setiap anggota ke k dari sampel.
Cluster sampling . Pada metode ini, dimulai dengan membagi wilayah men-jadi beberapa bagian (cluster). Kemudian diambil secara random bagian-bagian tersebut. Setiap anggota cluster menjadi anggota sampel.
1.2
Sifat variabel dalam penelitian
1.2. SIFAT VARIABEL DALAM PENELITIAN 9
Di dalam eksperimen, perlakuan diberikan pada individu untuk melihat pe-rubahanrespon atau variabel yang diukur.
Untuk memperoleh data, kadang-kadang peneliti harus mengambil data dari orang-orang dengan cara memberikan pertanyaan. Proses ini dinamakansurvey.
Pengkategorianlain dari data adalah berdasarkan tingkat pengukuran, dalam arti berdasarkan sifat aritmetika data. Berdasarkan tingkat mengukuran, data dikelompokan menjadi:
1. Data nominal merupakan data yang tidak dapat (tidak berkmakna) jika diurutkan secara aritmetika.
2. Data ordinal, yaitu data yang bisa diurutkan tetapi tidak dapat (tidak bermakna) jika dibandingkan.
3. Data interval, yaitu data yang dapat urutkan dan perbedaan antara nilai data ada maknanya.
4. Data rasio, yaitu data yang dapat dirutkan, perbedan antara nilai data bermakna dan rasio antar nilai data juga bermakna. Pada data rasio nilai 0 merupakan nilai sebenarnya.
Contoh 3. Suatu data berisi informasi nama hewan di suatu kebun binatang: harimau
jerapah buaya unta
Data ini termasuk data nominal. Perhatikan bahwa data tersebut hanya meny-atakan nama, jadi jika diurutkan tidak ada artinya.
Contoh 4. Suatu penelitian bertujuan untuk mengetahui tingkat kesukaan kon-sumen terhadap suatu produk. Variabel yang diamati adalah sebagai berikut:
Suka Sedang Tidak suka
Perhatikan bahwa data ini dapat diurutkan, namun selisih antar tingkat kesukaan tidak bermakna.
menyatakan bahwa pada siang hari temperaturnya 7o lebih panas dibanding pagi
hari. Perhatikan pula bahwa temperatur 0o tidak berarti tidak ada panas, yakni
nilai ini bukan nilai sebenarnya.
Contoh 6. Data penghasil 5 orang per bulan (dalam juta rupiah) adalah sebagai berikut:
No. Urut. Penghasilan
1. 2
2. 4,5
3. 13
4. 0,5
5. 0,0
Bab 2
Penyajian Data
2.1
Distribusi Frekuensi
Jika kita memiliki suatu data kuantitatif yang ukuran cukup besar, maka akan berguna jika data tersebut dikelompokan menjadi interval atau klas yang lebih ke-cil. Tabel frekuensimempartisi data menjadi kelas atau interval dan menampilkan banyaknya nilai data yang termasuk pada setiap kelas.
Definisi 2.1.1. • Kelas atau interval dibentuk sehingga setiap nilai data ter-masuk kedalam tepat satu kelas.
• Kelas berupa interval bilangan; jadi memiliki batas bawah dan batas atas.
• Titik tengah kelas adalah bilangan yang posisinya di tengah kelas.
• Lebar kelas menyatakan selisih antara batas atas dan batas bawah kelas tersebut.
Lebar kelas = N ilai data terbesar − N ilai data terkecil
banyaknya kelas
• Frekuensi kelas adalah banyaknya nilai yang termasuk suatu kelas.
• Frekuensi relatif adalah frekuensi dibagi banyaknya nilai data.
• Frekuensi Kumulatif suatu kelas adalah banyaknya seluruh nilai data yang lebih kecil dari batas atas kelas tersebut.
• Frekuensi kumulatif relatif adalah frekuensi kumulatif dibagi banyaknya data.
Contoh 7. Data hasil ujian mata kuliah Statistika 40 mahasiswa berikut akan dis-ajikan dalam bentuk frekuensi distribusi dengan 6 kelas.:
78 60 45 65 80 95 40 40 46 55 60 76 65 60 55 54 75 84 48 58 68 87 95 54 67 58 87 56 43 56 67 58 78 65 89 85 76 68 64 60
Langkah-langkah membentuk tabel frekuensi:
1. Tentukan lebar kelas:
Lebarkelas= 95−40
6 = 9.16. dibulatkan menjadi 10.
2. Tentukan kelas (interval kelas) sebagai berikut:
• Ambil nilai data terkecil sebagai batas bawah kelas pertama, dalam hal ini adalah 40.
• Batas bawah kelas berikutnya = batas bawah nilai sebelumnya + 10. Jadi batas bawah kelas kedua adalah 40 + 10 = 50.
• Batas bawah kelas diperoleh dengan mengambil nilai tepat di bawah batas atas kelas berikutnya. Jadi batas kelas pertama adalah 59.
• Proses ini dilanjutkan untuk kelas-kelas berikutnya.
3. Sekarang setiap nilai data dapat dimasukan ke dalam kelas masing-masing. Untuk menghitung frekuensi setiap kelas dapat menggunakan dengan bantuan
2.2. HISTOGRAM 13
Diperoleh tabel frekuensi sebagai berikut:
Frekuensi Frekuensi Frekuensi Interval Kelas Frekuensi Relatif Kumulatif Kumulatif
Relatif
40-49 5 0.125 5 0.125
50-59 9 0.225 14 0.350
60-69 12 0.325 27 0.675
70-79 5 0.125 32 0.800
80-89 6 0.15 38 0.950
90-99 2 0.05 40 1.00
Jumlah 40 1
2.2
Histogram
Dari tbel frekuensi dapat disajikan bentuk visualnya. Histogram merupakan cara yang cukup efektif untuk menyajikan data dalam bentuk visual. Pada histogram:
• setiap kelas dinyatakan dengan sebuah batang
• lebar batang menyatakan lebar kelas
• tinggi batang menyatakan frekuensi kelas atau frekuensi relatif kelas
• nilai dibawah setiap batang adalah titik tengah kelas.
Bentuk histogram dari suatu sampel random menggambarkan bagaimana nilai data berdistribusi pada populasi. Bentuk histogram dapat dikelompokan menjadi:
1. Simetris, yaitu histogram yang mentuknya (hampir) simetris terhadap suatu sumbu.
2. Seragam, yaitu histogram yang frekuensi setiap kelasnya sama atau hampir sama.
3. Menceng kiri atau menceng kanan, yaitu histogram yang ekornya menjulur lebih panjang ke satu sisi. Jika ekornya lebih menjulur kekiri maka dina-makan menceng kekiri, jika ekornya lebih menjulur kekanan maka dinadina-makan menceng kekanan.
Kadang-kadang kita ingin menyajikan histogram dengan bentuk tertentu. Dia-gramparetoadalah grafik batang yang disajikan secara urut berdasarkan tingginya. Sebagai contoh, diagram pareto untuk contoh 1 adalah:
Grafik runtun waktu adalah grafik yang menggambarkan bagaimana data berubah terhadap waktu.
Misalnya data mahasiswa UM Palangkaraya 10 tahun terakhir adalah
2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 3900 4500 4200 3300 3600 3000 3100 3200 3400 3500
Grafik runtun waktu data ini adalah
2.3
Diagram Batang dan Daun
2.3. DIAGRAM BATANG DAN DAUN 17
Prosedur membuat diagram batang-daun:
1. Bagi digit tiap nilai data menjadi dua bagian. Bagian paling kiri dinamakan
batang dan bagian kanan dinamakan daun.
2. Susun semua batang secara vertikal mulai dari nilai terkecil hingga nilai terbe-sar.
3. Tuliskan semua daun yang batangnya sama pada baris batang yang sama, lalu susun daun dengan urutan makin membesar.
Contoh 8. Data nilai ujian Statistika pada contoh 1 akan disajikan dalam dia-gram batang daun. Digit pertama sebagai batang dan digit kedua sebagai daun. Berdasarkan prosedur di atas diperoleh
4 0 0 3 6 8
5 4 4 5 5 6 6 8 8
6 0 0 0 0 4 5 5 5 7 7 8 8
7 5 6 6 8 8
8 0 4 5 7 7 9
Bab 3
Ringkasan Data
3.1
Ukuran Kecenderungan Pusat
Dalam keseharian kita sering mendengar ungkapan seperti:
• Umumnya orang Indonesia makan nasi. • Sebagian besar siswa lulus UAN.
• Pendapatan per kapita rata-rata di Palangkaraya 4 juta rupiah per bulan. Ungkapan-ungkapan tersebut merupakan ungkapan kecenderungan suatu keadaan. Di dalam bagian ini kita akan meninjau dari sudut statistika cara menyapaikan ungkapan-ungkapan tersebut.
Modus suatu data adalah nilai data yang paling banyak frekuensinya.
Contoh 9. Data banyaknya anak 10 rumah tangga adalah sebagai berikut: 2 0 2 1 2 3 4 3 2 1
Nilai data 2 memiliki frekuensi paling banyak, oleh karena itu modusnya adalah 2. Medianadalah nilai data yang posisinya ditengah setelah data diurutkan. Median data dapat dicari sebagai berikut:
1. Urutkan data dari nilai terkecil hingga terbesar.
2. Jika banyaknya nilai data ganjil, maka median = nilai yang posisinya ditengah.
3. Jika banyaknya nilai data genap, maka
median= jumlah dua nilai yang ditengah
2 .
Contoh 10. Hasil pengukuran tinggi badan 11 mahasiswa (dalam kg) adalah 67 60 70 55 58 76 63 76 81 65 72
Setelah diurutkan maka menjadi
55 58 60 63 65 67 70 72 76 76 81
Karena banyaknya nilai data ada 11, maka mediannya adalah nilai yang posisinya ditengah, yaitu nilai ke 6. Dengan demikian mediannya adalah 67.
Contoh 11. Data pendapatan per bulan 10 orang adalah sebagai berikut (dalam juta rupiah)
4 4 6 3 5 3 2 5 1 3 Setelah diurutkan, maka data tersebut menjadi
1 2 3 3 3 4 4 5 5 6
Karena banyaknya observasi 10 (genap), maka mediannya adalah
median= nilai ke5 + nilai ke6
2 =
3 + 4
2 = 4.5.
Mean atau mean aritmetika suatu sampel adalah jumlah seluruh nilai data dibagi ukuran sampel. Mean suatu sampel berukuran n dengan nilai-nilai data
x1, x2,· · · , xn, ditulis ¯x. Jadi
mean= ¯x= x1+x2+· · ·+xn
n =
1
n
n
X
i=1
xi.
Contoh 12. Nilai rapor semua pelajaran seorang siswa adalah 7,8,6,7,6,8,7,9,6,7. Mean nilai rapornya adalah
¯
x= 7 + 8 + 6 + 7 + 6 + 8 + 7 + 9 + 6 + 7
10 =
71
10 = 7.1.
Mean memiliki sifat sensitif terhadap nilai data ekstrim, dalam arti bahwa jika terdapat nilai data yang sangat kecil atau sangat besar, maka mean mudah berubah secara ekstrim.
Contoh 13. Data observasi tingkat penghasilan 10 orang di Palangkaraya per bulan adalah sebagai berikut (dalam juta rupiah): 1,3,2,4,3,100,3,4,2,4. Di dalam contoh ini terdapat orang yang penghasilannya 100 juta per bulan. Mean data ini adalah
¯
x= 1 + 3 + 2 + 4 + 3 + 100 + 3 + 4 + 2 + 4
10 = 12.6,
3.1. UKURAN KECENDERUNGAN PUSAT 21
Prosedur mencari trimmed mean 5 persen 1. Urutkan data dari nilai terkecil hingga nilai terbesar.
2. Hapus 5 persen bawah dan 5 persen atas data. Jika 5 persen tersebut tidak menghasilkan bilangan bulat, bulatkan ke bilangan bulat terdekat.
3. Hitung mean 90 persen data yang tersisa.
Contoh 14. Data penghasilan per bulan 20 orang dalam juta rupiah adalah sebagai berikut
3 2 3 1 4 5 4 6 3 5 4 100 4 5 7 8 4 6 7 6 Untuk mencari trimmed mean 5 persen pertama-tama data diurutkan
1 2 3 3 3 4 4 4 4 4 5 5 5 6 6 6 7 7 8 100 Banyaknya nilai data adalah 20, sehingga 5 persen dari 20 adalah 1. Dihilangkan 5 persen (satu nilai data) bawah dan atas data menjadi
2 3 3 3 4 4 4 4 4 5 5 5 6 6 6 7 7 8 Mean yang dipangkas adalah mean data terakhir, yaitu
¯
x= 1
18(2 + 3 + 3 + 3 + 4 + 4 + 4 + 4 + 4 + 5 + 5 + 5 + 6 + 6 + 6 + 7 + 7 + 8) = 4.78. Kadang-kadang kita memiliki data yang nilainya dapat dikelompokan menjadik
nilai berbeda. Misalkan nilai datax1, x2,· · · , xk berturut-turut memiliki frekuensi
f1, f2,· · · , fk. Ini berarti data ini memiliki n =Pki=1fi nilai data dengan nilai xi
terjadi fi kali. Mean data demikian dapat dihitung sebagai berikut
¯
x= 1
n(f1x1+f2x2+· · ·+fkxk).
dengann =fi+f2 +· · ·+fk.
Contoh 15. Berikut adalah data hasil observasi usia mahasiswa pada suatu kelas Usia Frekuensi
16 2
17 4
18 7
19 8
20 6
21 3
3.2. VARIAN 23
Banyaknya observasi adalah n = 2 + 4 + 7 + 8 + 6 + 3 + 2 = 32. Mean data tersebut adalah
¯
x= 1
32(2·16 + 4·17 + 7·18 + 8·19 + 6·20 + 3·21 + 2·22) = 605
32 = 18.91. Kadang-kadang nilai data yang akan dicari meannya sangat besar. Untuk mem-permudah mencari mean data yang nilai-nilainya sangat besar dapat digunakan transformasi:
yi =xi−c
denganc suatu konstanta.
Dengan tranfomasi tersebut, maka diperoleh
¯
x= ¯y+c.
Contoh 16. Suatu eksperimen untuk mengukur kecepatan cahaya menghasilkan hasil pengukuran sebagai berikut (dalam km/detik):
300,009 299,999 299,998 300,099 300,008.
Untuk mencari mean data tersebut dapat digunakan tranformasi
yi =xi−300,000,
dan diperoleh nilai-nilai yi :
9 −1 −2 99 8,
dan
¯
y= 1
5(9−1−2 + 99 + 8) = 22.6.
Dengan demikian, mean hasil pengukuran kecepatan cahaya tersebut adalah
¯
x= ¯y+ 300,000 = 22.6 + 300,000 = 300,022.6.
3.2
Varian
Kita sering mendengar pernyataan seperti ”Tingkat pendapatan orang Indonesia sangat bervariasi”, ”Hasil nilai ujian nasional cukup beragam”, ”Tinggi tanaman padi di sawah sangat seragam”, dan sebagainya. Ungkapan semacam ini meru-pakan suatu cara untuk menyatakan kecenderungan perbedaan antara individu.
Range data x1, x2,· · · , xn adalah selisih antara nilai data terbesar dan nilai
Contoh 17. Nilai ujian 10 orang siswa adalah 5,6,4,7,8,7,10,6,7,4.
Range data tersebut adalah 10−4 = 6.
Diketahui x1, x2,· · ·, xn data sampel berukuran n dan ¯x mean data tersebut.
Deviasi nilai data xi terhadap mean ¯x adalah selisih antaraxi dan ¯x, yaitu
deviasi=xi−x.¯
Varian sampel, ditulis s2, dari data x
1, x2,· · · , xn didefinisikan
s2 = 1
n−1
n
X
i=1
(xi−x¯)2.
Varian sampel menggambarkan variabilitas data sampel. Jika s2 adalah varian sampel, maka s dinamakan deviasi standar sampel.
Contoh 18. Hitunglah varian sampel setiap data berikut: Data A: 5, 3, 4, 6, 2.
Data B: -2, -1, 11, 4, 8.
Mean data A adalah ¯x = (5 + 3 + 4 + 6 + 2)/5 = 4; dengan demikian varian sampel data A adalah
s2 = 1
4 (5−4)
2+ (3−4)2+ (4−4)2 + (6−4)2+ (6−4)2+ (2−4)2
= 10
4 = 2.5,
dan deviasi standar data A adalah s =√2.5 = 1.58.
Mean data B adalah ¯x= (−2−1 + 11 + 4 + 8)/5 = 4; dengan demikian varian sampel data B adalah
s2 = 1
4 (−2−4) 2+ (
−1−4)2+ (11−4)2+ (4−4)2+ (8−4)2
= 126
4 = 31.5
dan deviasi standar data B adalah s=√31.5 = 5.61.
3.3. PERSENTIL 25
3.3
Persentil
Diketahui bilangan p dengan 1 ≤ p ≤ 99. Persentil ke p dari suatu data adalah suatu nilai sehingga p persen data berada pada atau dibawah nilai tersebut dan (100−p) persen data berada pada atau di atas nilai tersebut.
Quartil adalah persentil yang membagi data menjadi empat.
1. Quartil pertama ditulis Q1, adalah persentil ke 25 . 2. Quartil kedua ditulis Q2, adalah median.
3. Quartil ketiga ditulis Q3 adalah persentil ke 75. Prosedur mencari quartil:
1. Urutkan data dari nilai terkecil sampai dengan nilai terbesar
2. Posisi Q1 = 0.25(n+ 1). 3. Posisi Q2 = 0.5(n+ 1) 4. Posisi Q3=0.75(n+1). Interquartil =Q3−Q1.
Contoh 19. Data hasil ujian 40 mahasiswa
78 60 45 65 80 95 40 40 46 55 60 76 65 60 55 54 75 84 48 58 68 87 95 54 67 58 87 56 43 56 67 58 78 65 89 85 76 68 64 60
Setelah data diurutkan maka diperoleh :
Posisi Q1 = 0.25(40 + 1) = 10.25.
Posisi Q2 = 0.5(40 + 1) = 20.5
Q2 =
nilai ke 20 + nilai ke 21 2
= 64 + 65
2 = 64.5.
Posisi Q3 = 0.75(40 + 1) = 30.75
Q3 = nilai ke 30 + 0.75( nilai ke 31− nilai ke 30) = 76 + 0.75(78−76) = 77.50.
Interquartil=Q3−Q1 = 77.50−55.25 = 22.5.
3.4
Box Plot
Quartil bersama dengan nilai data terbesar dan terkecil menghasilkan ringkasan
limabilangandan sebaran data. Kelima bilangan yaitu:
nilai data terkecil, Q1, median, Q3 dan nilai data terbesar.
Kelima bilangan dapat digunakan untuk membuat sketsa grafik data yang di-namakan box plot.
Prosedur membuat box plot:
1. Gambarkan sebuah skala vertikal yang dapat mencakup nilai data terkecil dan nilai data terbesar.
2. Gambarkan sebuah kotak dari Q1 keQ3 di sebelah kanan skala tersebut. 3. Berilah garis mendatar pada kotak tersebut di ketinggian median.
4. Gambarkan garis vertikal dari Q1 ke nilai data terkecil dan dari Q3 ke nilai data terbesar.
3.5. TEOREMA CHEBYSHEV 27
3.5
Teorema Chebyshev
Teorema 3.5.1. Diketahui x¯dans berturut-turut adalah mean sampel dan deviasi standar sampel dengan s > 0. Jika k ≥ 1 maka setidaknya 100(1−1/k2) persen
data berada di dalam interval x¯−ks sampai dengan x¯+ks.
Contoh 21. Jika k= 2 maka setidaknya ada 100(1−1/22) = 100·3/4 = 75 persen data berada di dalam interval ¯x−2s sampai dengan ¯x+ 2s.
Contoh 22. Nilai ujian 20 siswa adalah sebagai berikut:
5 7 6 8 6 5 4 8 9 9 7 8 5 4 6 7 6 8 6 7. Dari data tersebut diperoleh: ¯x= 6.55 dans= 1.5035.
Jika k= 3/2, maka setidaknya ada
100(1−1/(3/2)2) = 100·5/9 = 55.55 persen data berada di dalam interval 6.55− 3
2
1.5035 sampai dengan 6.55 + 3
2
1.5035.
Dengan kata lain setidaknya 55.55 persen data berada di dalam interval 4.29475 sampai dengan 8.8052.
Dapat diperiksa bahwa nilai data yang berada di dalam interval tersebut adalah
5 7 6 8 6 5 8 7 8 8 6 7 6 8 7,
Bab 4
Peluang
4.1
Ruang Sampel
Suatu eksperimen dilaksanakan dengan tujuan untuk memperoleh hasil (outcome). Eksperimen random adalah suatu eksperimen yang dapat dilakukan berkali-kali pada kondisi yang sama dan hasilnya tidak dapat ditentukan dengan pasti se-belum eksperimen tersebut selesai. Ini berarti hasil yang akan terjadi dari suatu eksperimen random menganndung suatu ketidakpastian. Meskipun hasilnya tidak dengan secara pasti dapat ditentukan, namun kita masih dapat menentukan semua hasil yang mungkin terjadi.
Definisi 4.1.1. Ruang sampel, ditulis S, dari suatu eksperimen random adalah himpunan semua hasil (outcome) yang mungkin terjadi.
Definisi 4.1.2. Pertistiwa E adalah himpunan bagian dari ruang sampelS. Peri-stiwaE dikatakan terjadi, jika E memiliki anggota.
Selanjutnya peristiwa akan dituliskan dangan huruf A, B, C, D, E, F dan seba-gainya.
Definisi 4.1.3. Peristiwa E∩F adalah peristiwa terjadinya E dan F. PeristiwaEc adalah peritstiwa tidak terjadinya E.
Dua peristiwa E dan F dikatakan saling saling jika E∩F = ∅, yakni jika kedua peristiwa tidak memiliki anggota bersama.
Definisi 4.1.4. Peristiwa elementer adalah peristiwa yang memiliki tepat satu anggota.
Contoh 23. Suatu eksperimen random melontarkan dua mata uang logam satu kali. Peristiwa yang diamati adalah sisi yang menghadap ke atas.
Jika sisi angka ditulis a dan sisi gambar ditulis g, maka ruang sampelnya adalah
S ={aa, ag, ga, gg}.
Jika E adalah peristiwa terjadinya sisi a tepat satu kali, maka dapat ditulis
E ={ag, ga}.
Jika F peristiwa terjadinya sisi gambar setidaknya satu kali, maka dapat ditulis
F ={ag, ga, gg}.
Peristiwa E ∩ F berarti peristiwa terjadi sisi angka sebanyak satu kali dan gambar satu kali, yaitu
E∩F ={ag, ga}.
PeristiwaEc menyatakan peristiwa tidak terjadinyaE, yaitu tidak munculnya sisi
angka sebanyak satu kali, dan dapat ditulis
Ec ={gg, aa}.
Contoh 24. Sebuah dadu dilontarkan satu kali dan diamati banyaknya spot sisi yang menghadap ke atas.
Ruang sampelnya dapat ditulis
S={1,2,3,4,5,6}.
Peristiwa elementernya adalah {1},{2},{3},{4},{5} dan {6}.
Jika A peristiwa terjadinya sisi genap danB peristiwa terjadinya sisi ganjil,
A={2,4,6}
B ={1,3,5}
maka A dan B merupakan peristiwa yang saling asing, karena A∩B =∅.
Contoh 25. Satu mata uang logam dilontarkan tiga kali. Ruang sampelnya adalah
S ={aaa, aag, aga, gaa, agg, gag, gga, ggg}.
JikaE adalah peristiwa munculnya sisi angka paling banyak satu kali, maka dapat ditulis
E ={agg, gag, gga, ggg}.
Jika F adalah peristiwa munculnya sisi gambar satu kali, maka dapat ditulis
4.2. PELUANG 31
Peristiwa E ∪F adalah peristiwa munculnya sisi angka paling banyak satu kali atau peristiwa munculnya sisi gambar dua kali. Jadi
E∪F ={agg, gag, gga, ggg, aag, aga, gaa}.
Contoh 26. Sebuah dadu dilontarkan dua kali. Pasangan (a, b) menyatakan sisi yang muncul pada lontaranadan pada lontaran keduab. Ruang sampelnya adalah
S ={ (1,1),(1,2),(1,3),(1,4),(1,5),(1,6),
(2,1),(2,2),(2,3),(2,4),(2,5),(2,6),
(3,1),(3,2),(3,3),(3,4),(3,5),(3,6),
(4,1),(4,2),(4,3),(4,4),(4,5),(4,6),
(5,1),(5,2),(5,3),(5,4),(5,5),(5,6),
(6,1),(6,2),(6,3),(6,4),(6,5),(6,6)}
Jika E peristiwa munculnya jumlah kedua lontaran 10, maka dapat ditulis
E ={(4,6),(5,5),(6,4)}.
Jika F peristiwa munculnya lontaran pertama spot 4, maka dapat ditulis
F ={(4,1),(4,2),(4,3),(4,4),(4,5),(4,6)}.
Contoh 27. Misalkan kita ingin meramalkan ketinggian sebuah roket yang ditem-bakan dari permukaan bumi. Ruang sampelnya adalah semua bilangan pada in-terval 0 sampai dengan tak hingga,
S ={x: 0≤x < takhingga}.
Jadi ruang sampel ini memiliki tak hingga anggota.
4.2
Peluang
Di dalam suatu percobaan random, akan terjadinya suatu peristiwa tidak dapat ditentukan secara pasti. Tingkat kepastian atau ketidakpastian ini diukur dengan suatu ukuran yang dinamakan peluang (probability).
Definisi 4.2.1. (Pendekatan klasik peluang) Diketahui peristiwa E dapat terjadi dalam h cara berbeda dari seluruh n cara yang semuanya memiliki kemungkinan sama. Peluang peristiwa E, ditulisP(E), adalah
P(E) = h
Pengertian peluang secara klasik mengandung arti bahwa setiap peristiwa ele-menter memiliki peluang yang sama, yaitu sebesar 1
N.
Contoh 28. Sebuah mangkok berisi 5 bola merah dan 4 bola biru. Dari mangkok tersebut diambil tanpa pilih-pilih sebuah bola. Peluang terambilnya bola merah adalah
P(merah) = 5 9, dan peluang terambilnya bola biru adalah
P(biru) = 4 9.
Definisi 4.2.2. (Pendekatan frekuensi) Jika setelah diulang n percobaan, dengan
n besar, suatu peristiwa diketahui terjadi h kali, maka peluang peristiwa tersebut adalahh/n.
Contoh 29. Jika satu mata uang logam dilontarkan 1000 kali dan diperoleh sisi gambar terjadi 512 kali, maka peluang terjadinya sisi gambar adalah 512/1000 = 0.512.
Pada kenyataannya tidak semua peristiwa elementer memiliki peluang yang sama, misalnya peluang sebuah mesin jet macet tentu tidak sama dengan peluang mesin tersebut tidak macet. Oleh karena itu pengertian klasik peluang kurang tepat untuk berbagai fenomena yang terjadi sehari-hari.
Perhatikan bahwa pada pengertian klasik, banyaknya anggota ruang sampel berhingga. Pada kenyataannya ada ruang sampel yang jumlah anggotanya tak hingga. Ini be-rarti pengertian klasik peluang tidak dapat digunakan jika banyaknya anggota ruang sampel tak hingga.
Definisi 4.2.3. Diketahui S ruang sampel. Untuk setiap peristiwa E bagian S
dihubungkan dengan suatu bilangan yang ditulis P(E) yang memenuhi sifat-sifat berikut:
1. 0≤P(E)≤1. 2. P(S) = 1.
3. P(E1∪E2∪E3∪ · · ·) =P(E1) +P(E2) +P(E3) +· · ·, denganE1, E2, E3,· · · adalah peristiwa yang saling asing.
4.2. PELUANG 33
Sifat (1) menyatakan bahwa peluang suatu peristiwa adalah suatu nilai numerik yang besarnya dari 0 hingga 1.
Sifat (2) menyatakan bahwa perstiwa terjadinya ruang sampel adalah pasti. Sifat (3) menyatakan bahwa peluang gabungan peristiwa yang saling asing sama dengan jumlah peluang masing-masing peristiwa.
Peluang merupakan ukuran numerik kemungkinan terjadinya suatu peristiwa. Nilai peluang yang mendekati satu berarti semakin besar kemungkinan persistiwa tersebut terjadi. Sebaliknya jika peluang suatu peristiwa pendekati nilai nol, be-rarti semakinkecil kemungkinan peristiwa tersebut terjadi. Jika suatu peristiwa memiliki peluang 1 artinya peristiwa tersebut pasti terjadi, sedangkan jika suatu peristiwa memiliki peluang 0 artinya peristiwa tersebut tidak mungkin terjadi.
Contoh 30. Frekuensi relatif pada contoh merupakan peluang. Pada kolom tersebut nilai frekiensi relatif berada pada interval 0 hingga 1, jumlah semua frekuensi relatif adalah 1 dan frekuensi relatif gabungan kelas interval sama dengan jumlah frekuensi relatif kelas interval.
Contoh 31. Tiga mata uang dilontarkan satu kali dan diamati sisi yang menghadap ke atas. Ruang sampelnya adalah
S ={aaa, aag, aga, gaa, agg, gag, gga, ggg}.
Dianggap setiap peristiwa elementer memiliki peluang sama, yaitu 1
8. JikaE meny-atakan peristiwa terjadinya sisi angka satu kali dan F menyatakan peristiwa ter-jadinya sisi gambar paling sedikit dua kali, maka E dan F dapat dituliskan
E ={agg, gga, gag} dan F ={ggg, gga, gag, agg}.
P(E) = P(agg, gga, gag)
= P(agg) +P(gga) +P(gag) = 1
8 + 1 8 +
1 8 = 3
8.
(4.1)
P(F) = P(ggg, gga, gag, agg)
= P(ggg) +P(gga) +P(gag) +P(agg) = 18 + 18 +18 + 18
= 1 2.
(4.2)
(a) putih
(b) orange atau merah
(c) bukan biru
(d) merah, putih atau biru
(e) bukan merah dan bukan biru
Penyelesaian: Misalkan M, P, B dan O berturut-turut menyatakan kelereng warna merah, putih, biru dan orange. Banyaknya seluruh kelereng adalah 10 + 30 + 25 + 15 = 80.
(a) P(P) = 3080 = 0.375.
(b) P(O∪M) = 15+10
80 = 0.3125. (c) P(Bc) = 1−P(B) = 1−20
75 = 1−0.3125 = 0.6875. (d) P(M ∪P ∪B) = 10+30+25
80 = 0.8125.
(e) P(Mc∩Bc) = P((M ∪B)c) = 1−P(M ∪B) = 1− 10+25
80 = 0.5625.
4.3
Peluang Bersyarat
Dalam suatu eksperimen random peluang terjadinya suatu peristiwa bisa tergan-tung terjadinya peristiwa lain. Sebagi contoh, peluang lahirnya anak kedua perem-puan bisa tergantung apakah anak pertama laki-laki atau peremperem-puan.
DiketahuiEdanF adalah peristiwa. Peluang terjadinyaEjika diketahui peristiwa
F telah terjadi dinamakan peluang bersyarat (conditional probability), dituliskan
P(E|F), dan didefinisikan
P(E|F) = P(E∩F)
P(F) .
Contoh 33. Sebuah mata uang logam dilontarkan dua kali, dan peluang setiap peristiwa elementer sama. Berapa peluang terjadinya sisi a pada lontaran kedua jika diketahui pada lontaran pertama sisi g telah terjadi?
Misalkan E peristiwa terjadinya sisi a pada lontaran kedua dan F peristiwa ter-jadinya sisi g pada lontaran pertama. Jadi E = {aa, ga} dan F = {gg, ga}. Peluang yang dicari adalah
P(E|F) = P(E∩F)
P(F) =
P(ga)
P(gg, ga) = 1/4 2/4 =
4.3. PELUANG BERSYARAT 35
Contoh 34. Suatu mangkok berisi tujuh bola hitam dan lima bola putih. Diam-bil dua bola dari dalam mangkok tersebut dan bola yang telah teramDiam-bil tidak dikembalikan kedalam mangkok. Anggap setiap bola memiliki peluang sama un-tuk terambil. Berapa peluang bola yang terambil keduanya adalah bola hitam. Misalkan F dan E berturut-turut peristiwa bola pertama dan bola kedua adalah hitam. Karena bola pertama yang terambil hitam, maka ada enam bola hitam dan lima bola putih yang tersisa di dalam mangkok, dan dengan demikian
P(E|F) = 6 11. KarenaP(F) = 7
12, maka peluang terambilnya kedua bola hitam adalah
P(E∩F) =P(F)P(E|F) = 7 12
6 11 =
42 132.
Contoh 35. Pada suatu perguruan tinggi, s25 persen mahasiswa gagal matematika, 15 persen mahaasiswa gagal fisika, dan 10 persen maha siswa gagal matematika dan ilmu fisika. Seorang mahasiswa dipilih secara random.
(a) Jika ia gagal fisika, berapa peluang ia gagal matematika?
(b) Jika ia gagal matematika, berapa peluang ia gagal fisika?
(c) Berapa peluang ia gagal matematika atau gagal fisika?
Penyelesaian: Tuliskan M = peristiwa mahasiswa yang gagal matematika, F= persitiwa mahasiswa yang gagal fisika. Diperoleh
P(M) = 0.25, P(F) = 0.15, P(M ∩F) = 0.10 (a) Peluang ia gagal matematika, diketahui ia gagal fisikaa adalah
P(M|F) = P(M ∩F)
P(F) = 0.10 0.15 =
2 3
(b) Peluang ia gagal fisika, diketahui ia gagal matematika adalah
P(F ∩M) = P(F ∩M)
P(M) = 0.10 0.25 =
2 5
(c) Peluang ia gagal matematika atau gagal fisika adalah
Peristiwa E dan F dikatakan independen, jika peluang terjadinya peristiwa
E tidak tergantung apakah peristiwa F terjadi atau tidak terjadi. Dalam hal ini
P(E|F) = P(E) dan berlaku
P(E∩F) = P(E).P(F).
Jadi peristiwaEdanF independen jika peluang terjadinya kedua peristiwa bersamaan sama dengan hasil kali peluang terjadinya masing-masing peristiwa.
Contoh 36. Satu mata uang logam dilontarkan dua kali. Jika E peristiwa muncul-nya sisi a pada lontaran pertama dan F peristiwa munculnya sisi g pada lontaran kedua, yaitu
E ={aa, ag} dan F ={ag, gg}.
Jika setiap peristiwa elementer memiliki peluang sama, maka
P(E∩F) =P(ag) = 1 4
P(E)P(F) =P(aa, ag)P(ag, gg) = 1 2 ·
1 2 =
1 4,
sehingga P(∩F) = P(E)P(F), dengan kata lain E dan F adalah peristiwa yang independen.
Contoh 37. Dua dadu dilontarkan satu kali. A menyatakan peristiwa munculnya jumlah spot kedua sisi adalah enam dan B menyatakan peristiwa munculnya spot sisi dadu pertama empat. Diperoleh
P(A∩B) =P({4,2}) = 1 36 dan
P(A)P(B) = 5 36·
1 6 =
5 216,
dan karena P(A∩B)6=P(A)P(B), maka peristiwa A dan B tidak independen. PeristiwaE1, E2,· · · , En dikatakan independen, jika untuk setiapr ≤nberlaku
Bab 5
Variabel Random
Dalam suatu eksperimen random dapat terjadi peneliti tidak tertarik pada out-comenya tetapi barangkali lebih tertarik pada nilai numerik yang berkaitan dengan outcome tersebut. Misalnya dalam percobaan melontarkan tiga mata uang sekali, mungkin peneliti lebih tertarik untuk mengamati banyaknya suatu sisi terjadi dari pada mengamati sisi apa saja yang menghadap ke atas.
Definisi 5.0.1. Variabel random adalah suatu fungsi yang domainnya ruang sam-pel dan nilainya bilangan real. Selanjutnya variabel random ditulis dengan notasi
X. Jika c adalah peristiwa elementer, maka nilai variabel random X di c ditulis
X(c). Jika nilai X(c) adalah x maka ditulis X(c) =x.
Contoh 38. Dua mata uang logam dilontarkan satu kali. Jika X menyatakan banyaknya sisia terjadi, maka X merupakan variabel random. Nilai variabel ran-dom pada setiap anggota ruang sampel adalah sebegai berikut:
X(gg) = 0, X(ag) = 1, X(ga) = 1, X(aa) = 2.
5.1
Variabel Random Diskrit
Variabel random X dikatakan variabel random diskrit jika nilai variabel random tersebut terhitung, yakni banyaknya nilai berhingga atau dapat dituliskan sebagai
x1, x2, x3,· · · .
Pada Contoh 38, X merupakan variabel random diskrit. .
Contoh 39. Tiga mata uang dilontarkan satu kali. Jika variabel random X meny-atakan banyaknya sisi angka terjadi, maka nilai-nilaiX adalah
X(ggg) = 0 X(agg) = X(gag) =X(gga) = 1
X(aaa) = 3 X(aag) = X(aga) =X(gaa) = 2
Contoh 40. Dua dadu dilontarkan satu kali. Variabel random X menyatakan banyaknya jumlah bintik kedua sisi yang menghadap ke atas. Nilai-nilai variabel randomX aadalah
X((1,1)) = 2 X((1,2)) = 3 X((1,3)) = 4 X((1,4)) = 5 X((1,5)) = 6 X((1,6)) = 7
X((2,1)) = 3 X((2,2)) = 4 X((2,3)) = 5 X((2,4)) = 6 X((2,5)) = 7 X((2,6)) = 8
X((3,1)) = 3 X((3,2)) = 5 X((3,3)) = 6 X((3,4)) = 7 X((3,5)) = 8 X((3,6)) = 9
X((4,1)) = 5 X((4,2)) = 6 X((4,3)) = 7 X((4,4)) = 8 X((4,5)) = 9 X((4,6)) = 10
X((5,1)) = 6 X((5,2)) = 7 X((5,3)) = 8 X((5,4)) = 9 X((5,5)) = 10 X((5,6)) = 11
X((6,1)) = 7 X((6,2)) = 8 X((6,3)) = 9 X((6,4)) = 10 X((6,5)) = 11 X((6,6)) = 12 Jika X variabel random diskrit, maka peluang variabel random X bernilai x
ditulis P(X = x). Pada Contoh 39 misalnya, variabel random X bernilai 2 jika dan hanya jika peristiwa{aag},{aga}dan{gaa}terjadi. Ini berarti peluangX = 2 sama dengan peluang terjadinya peristiwa{aag, aga, gaa}, sehingga diperoleh
P(X = 2) =P({aag, aga, gaa}) = 3 8.
Perhatikan bahwa nilai P(X = x) tergantung pada peristiwa yang dikaitkan dengan nilai variabel random x. Dengan demikian peluang variabel random X
bergantung pada nilai x, dengan kata lain P(X = x) merupakan fungsi dari x. Oleh karena itu dapat dituliskan
f(x) = P(X =x).
Selanjutnya f(x) dinamakan fungsi peluang atau distribusi peluang variabel randomX.
Contoh 41. Pada Contoh 39, distribusi peluangnya adalah
f(0) =P(X = 0) =P(ggg) = 18
f(1) =P(X = 1) =P(agg, gag, gga) = 38
f(2) =P(X = 2) =P(aag, aga, gaa) = 38
5.1. VARIABEL RANDOM DISKRIT 39
Contoh 42. Pada Contoh 40, distribusi peluangnya adalah
f(2) =P(X = 2) =P((1,1)) = 361
f(3) =P(X = 3) =P((1,2)(2,1)) = 362
f(4) =P(X = 4) =P((1,3),(2,2),(3,1)) = 363
f(5) =P(X = 5) =P((1,4),(2,3),(3,2),(4,2)) = 364
f(6) =P(X = 6) =P((1,5),(2,4),(3,3),(4,2),(5,1)) = 5 36
f(7) =P(X = 7) =P((1,6),(2,5),(3,4),(4,3),(5,2),(6,1)) = 6 36
f(8) =P(X = 8) =P((2,6),(3,5),(4,4),(5,3),(6,2)) = 5 36
f(9) =P(X = 9) =P((3,6),(4,5),(5,4),(6,3)) = 4 36
f(10) =P(X = 10) =P((4,6),(5,5),(6,4)) = 3 36
f(11) =P(X = 11) =P((5,6),(6,5)) = 2 36
f(12) =P(X = 12) =P((6,6)) = 1 6
Fungsi distribusi kumulatif atau fungsi distribusi, ditulisF(x), adalah pelu-ang variabel random X bernilai lebih kecil atau sama dengan x. Jadi
Contoh 43. Perhatikan kembali Contoh 39. Distribusi kumulatifnya dalah
F(0) =P(x≤0) =P(X = 0) = 18
F(1) =P(x≤1) =P(X = 0) +P(X = 1) = 12
F(2) =P(x≤2) =P(X = 0) +P(X = 1) +P(X = 2) = 7 8
5.2. NILAI HARAPAN VARIABEL RANDOM DISKRIT 41
Contoh 44. Distribusi kumulatif pada Contoh 40 adalah
F(2) = P(x≤2) = P(X = 2) = 361
F(3) = P(x≤3) = P(X = 2) +P(X = 3) = 363
F(4) = P(x≤4) = P(X = 2) +P(X = 3) +P(X = 4) = 366
F(5) = P(x≤5) = P(X = 2) +P(X = 3) +P(X = 4) +P(X = 5) = 1036
F(6) = P(x≤6) = P(X = 2) +P(X = 3) +P(X = 4) +P(X = 5) +P(X = 6) = 1536
F(7) = P(x≤7) = P(X = 2) +P(X = 3) +P(X = 4) +P(X = 5) +P(X = 6) +P(X = 7) = 2136
F(8) = P(x≤8) = P(X = 2) +P(X = 3) +P(X = 4) +P(X = 5) +P(X = 6) +P(X = 7) +P(X = 8) =
26 36
F(9) = P(x≤9) = P(X = 2) +P(X = 3) +P(X = 4) +P(X = 5) +P(X = 6) +P(X = 7) +P(X = 8) +P(X = 9) = 3036
F(10) = P(x≤10) =P(X = 2) +P(X = 3) +P(X = 4) +P(X = 5) +P(X = 6) +P(X = 7) +P(X = 8) +P(X = 9) +P(X = 10) = 3336
F(11) = P(x≤11) =P(X = 2) +P(X = 3) +P(X = 4) +P(X = 5) +P(X = 6) +P(X = 7) +P(X = 8) +P(X = 9) +P(X = 10) +P(X = 11) = 3536
F(12) = P(x≤12) =P(X = 2) +P(X = 3) +P(X = 4) +P(X = 5) +P(X = 6) +P(X = 7) +P(X = 8) +P(X = 9) +P(X = 10) +P(X = 11) +P(X = 12) = 3636 = 1.
5.2
Nilai Harapan Variabel Random Diskrit
Nilai harapan suatu variabel random menggambarkan nilai yang diharapkan akan terjadi dari suatu eksperimen random atau kecenderungan hasil yang akan terjadi. Definisi 5.2.1. Nilai harapan suatu variabel random diskrit ditulisE(X) atauµ, didefinisikan sebagai berikut
µ=E(X) = Xxi.P(X =xi),
Contoh 45. Pada percobaan melontarkan dua mata uang logam sebanyak satu kali (Contoh 38), diperoleh
P(X = 0) = 1
4 P(X = 1) = 1
2 dan P(X = 2) = 1 4. Dengan demikian nilai harapannya adalah
Karena µ adalah nilai harapan variabel random X, maka X −µ merupakan deviasi X terhadap nilai harapannya. Ukuran yang menggambarkan variabilitas suatu variabel random didefinisikan berikut.
Definisi 5.2.2. Varianvariabel random diskritX ditulisV ar(X) atau σ2 adalah
σ2 =V ar(X) = E((X−µ)2) =X(xi−µ)2.P(X =xi),
Kuantitasσ =√σ2 dinamakan deviasi standar.
Berdasarkan definisi di atas, V ar(X) merupakan nilai harapan kuadrat deviasi
X−µ; dengan demikianV ar(X)≥0. Semakin besar varian suatu variabel random, semakin basar variabilitasnya. Nilai varian suatu variabel random adalah 0 jika dan hanya jika variabel random tersebut nilainya tetap. tersebut
Contoh 46. Varian pada Contoh 38 di atas adalah
σ2 =V ar(X) = (0−1)2.P(X = 0) + (1−1)2.P(X = 1) + (2−1)2.P(X = 2) = 1
4 + 0 + 2. 1
4 = 0.5.
5.3. VARIABEL RANDOM KONTINU 43
5.3
Variabel Random Kontinu
Jika X adalah variabel random dengan peluang pada setiap titik tunggal x sama dengan nol, yakni P(X = x) = 0, maka X dinamakan variabel random kon-tinyu. JikaX variabel random kontinyu, maka ada fungsi f(x) sehingga peluang variabel random X berada di antara a dan b sama dengan luas daerah yang di-batasi oleh kurvaf(x), sumbux, garis x=adan garisx=b. Selanjutnya peluang
X berada di antaraadanb ditulisP(a < X < b). Fungsif(x) tersebut dinamakan fungsi kepadatan peluang.
Fungsi distribusi kumulatif variabel random kontinyuX, ditulisF(x), didefin-isikan sebagai peluang variabel random X bernilai lebih kecil atau sama dengan x
atau
F(x) = P(X < x)
Contoh 47. Diketahui variabel random kontinyuX memiliki fungsi densitasf(x) = 1
5 dengan 0≤x≤5. Peluang variabel random X berada antara 1 dan 3 adalah
P(1≤X ≤3) = 2 5, dan distribusi kumulatif dix= 2.5 adalah
F(2.5) = 1 2.
5.4
Variabel Random Bersama
Di dalam suatu penelitian, kita sering tertarik pada dua variabel random atau lebih. Misalnya dalam meneliti tentang penyakit jantung, mungkin kita tertarik pada beberapa faktor penyebab seperti kebiasaan merokok dan konsumsi alkohol. Diketahui dua variabel random X dan Y. Untuk menggabungkan kedua variabel dapat kita gunakan fungsi distribusi kumulatif.
Definisi 5.4.1. Diketahui variabel random X dan Y. Fungsi distribusi kumu-latif bersama F(x, y) adalah
F(x, y) =P(X ≤x, Y ≤y).
Diketahui X dan Y masing-masing variabel random disktrit. Peluang variabel random X bernilai x dan variabel random Y bernilai y ditulis P(X = x, Y = y). Variabel random X dan Y dikatakan independen jika berlaku
P(X=x, Y =y) =P(X =x).P(Y =y)
Dua variabel random kontinyu X dan Y dikatakan independent jika peluang terjadinyaX tidak dipengaruhi apakah variabel randomY terjadi atau tidak. Jika
f(x, y) fungsi densitas variabel random kontinyu X dan Y dan kedua variabel random independen, maka berlaku
f(x, y) =f1(x).f2(y),
Bab 6
Beberapa Distribusi Peluang
Pada bagian ini akan disampaikan beberapa distribusi peluang variabel random diskrit dan kontinyu yang banyak digunakan didalam inferensi statistik.
6.1
Distribusi binomial
Misalkan suatu eksperimen random hanya memiliki dua hasil yang mungkin, hasil pertama dinamakansuksesdan hasil kedua dinamakan gagal. Eksperimen terse-but diulang secara independen sebanyakn kali. Jika peluang sukses setiap eksper-imen adalah sama sebesar p maka peluang gagal pada setiap eksperimen adalah
p−1. Jika X menyatakan banyaknya sukses darin percobaan (trial) dan peluang
X =x diberikan oleh fungsi peluang berikut
P(X =x) =
n x
px(1−p)n−x, x= 0,1,2,3,· · · , n,
maka X dinamakan berdistribusibinomial dengan parameter n dan p.
Selanjutnya dapat dibuktikan bahwa nilai harapan dan varians disrtibusi binomial adalah
µ=np dan σ2 =np(1−p).
Di dalam fungsi peluang binomial, notasi nx
menyatakan kombinasi xobjek dari
n objek, yaitu
n x
= n!
x!(n−x)!, dengann! = 1·2·3· · ·(n−1)·n dan 0! = 1.
Contoh variabel random berdistribusi binomial adalah melontarkan mata uang logam, cacat tidaknya suatu produk dan macet tidaknya suatu mesin jet.
Contoh 48. Diketahui suatu telur asin yang diproduksi suatu perusahaan memi-liki peluang rusak 0.01 dan bersifat independen terhadap telor asin lainnya. Jika diambil secara random sampel sebanyak 5 telor asin, (a) berapa peluang telor asin yang rusak sebanyak satu? (b) berapa peluang telor asin yang rusak paling banyak satu?
JikaX menyatakan banyaknya telor asin yang rusak, maka X merupakan variabel random binomial dengan n= 5 dan p= 0.01. Dengan demikian
(a) Peluang telor asin yang rusak sebanyak satu adalah
P(X = 1) =
5 1
(0.01)1(1−0.01)4 = 0.04803.
(b) Peluang telor asin yang rusak paling banyak satu adalah
P(X≤1) = P(X = 0) +P(X = 1) =
5 0
(0.01)0(1−0.01)5+
5 1
(0.01)1(1−0.01)4 = 0.95099 + 0.04803 = 0.99902.
6.2
Distribusi Normal
Variabel randomX dikatakan berdistribusinormaldengan meanµdan varianσ2 jika fungsi densitasnya diberikan oleh
f(x) = 1
σ√2πe
−(x−µ)2
/2σ2 ,
denganπ = 2,1415... dan e= 2,718282....
Contoh variabel random yang berdistribusi normal adalah diameter lubang yang dihasilkan mesin bor, skor suatu test, konsentrasi suatu bahan kimia pada suatu jenis obat, dan hasil panen pada suatu lahan.
Jika mean µ = 0 dan deviasi σ = 1, maka X dikatakan berdistribusi normal standar.
Jika variabel randomX berdistribusi normal standar, maka distribusi kumulat-ifnya dituliskan dengan notasi Φ(x); jadi
Φ(x) = P(X ≤x).
Secara grafik, kurva fungsi densitas normal standar simetris terhadap garis x= 0. Karena luas seluruhnya adalah 1, maka
6.2. DISTRIBUSI NORMAL 47
6.2. DISTRIBUSI NORMAL 49
Luas daerah yang dibatasi oleh garis x= 0 dan x=a dengan luas daerah yang dibatasix= 0 dan x=−a adalah sama. Dengan demikian berlaku
[image:49.612.130.490.189.514.2]Φ(−x) = 1−Φ(x).
Figure 6.3: Φ(−x) = 1−Φ(x)
Untuk menghitung peluang variabel randomX yang berdistribusi normal stan-dar dapat digunakan tabel normal stanstan-dar. Peluang variabel random X berada di antara a dan b, dengan a < b, sama dengan luas daerah di bawah kurva normal yang dibatasi garisx=a dan x=b. Dengan demikian
P(a ≤X ≤b) = Φ(b)−Φ(a).
Contoh 49. Diketahui X berdistibusi normal standar. Hitunglah peluang (a) X
6.3. DISTRIBUSI YANG BERHUBUNGAN DENGAN DISTRIBUSI NORMAL 51
(a) P(X <1.94) =P(X ≤1.94) = Φ(1.94) = 0.973810.
(b) P(0.5≤X ≤1.4) = Φ(1.4)−Φ(0.5) = 0.919243−0.691462 = 0.227781.
(c) P(−1.1≤X ≤1.5) = Φ(1.5)−Φ(−1.1) = Φ(1.5)−(1−Φ(1.1)) = 0.933193− (1−0.864334) = 0.797527.
6.3
Distribusi yang berhubungan dengan distribusi normal
6.3.1 Distribusi Chi-Square
Jika variabel randomX1, X2, X3,· · · , Xradalahrvariabel independen yang
masing-masing berdistibusi normal standar, maka variabel random
χ2 =X12+X22+X32+· · ·+Xr2,
berdistibusi dengan distribusi yang dinamakan distribusi Chi-square dengan dera-jat bebas r.
Distribusi kumulatif χ2 dengan derajat bebas r ditulis P(χ2
r ≤ x). Nilai batas x
untuk derajat bebasr dan distribusi kumulatif γ tertentu dapat dicari pada suatu tabel yang dinamakan tabel Distribusi χ2.
Contoh 50. Carilahx sehingga P(χ2
12 ≤x) = 0.05.
Berdasarkan tabel dengan r= 12 dan γ = 0.05 diperolehx= 5.226.
6.3.2 Distribusi t
Diketahui Y dan Z variabel random independen, dengan Y berdistribusi normal standar danZ berdistribusi chi-square dengan derajat bebasr. Dapat ditunjukan bahwa variabel random
T = pY
Z/r
memiliki distribusi yang dinamakan distribusit dengan derajat bebasr.
Nilai distribusi kumulatif variabel random berditribusi t dengan derajat bebas r
ditulisP(tr ≤x). Nilaixuntuk derajat bebasrdan distribusi kumulatifγ tertentu
dapat dicari pada suatu tabel yang dinamakan tabel Distribusi t.
Contoh 51. Carilahx sehingga P(t10≤x) = 0.99.
6.3.3 Distribusi F
Diketahui variabel randomX danY berdistribusi chi-square dengan derajat bebas berturut-turutr1 dan r2. Dapat dibuktikan bahwa variabel random
F = X/r1
Y /r2
memiliki suatu distribusi yang dinamakan distribusi F dengan derajat bebas r1 danr2. Dalam hal inir1 disebut juga derajat bebas pembilang danr2 disebut juga derajat bebas penyebut. Distribusi kumulatif F dengan derajat bebas r1 dan r2, ditulis P(Fr1,r2 ≤ x). Nilai x untuk r1 dan r2 tertentu dan distribusi kumulatif γtertentu telah dihitung dan ditabelkan pada suatu tabel yang dinamakan tabelF.
Contoh 52. Carilahx sehingga P(F4,10 ≤x) = 0.95.
Bab 7
Teori Sampling
Di dalam aplikasi kita sering mengambil kesimpulan dari suatu kelompok individu ataupopulasi. Karena alasan tertentu, kita tidak mungkin untuk mengamati selu-ruh anggota populasi, namun hanya mengamati bagian dari populasi yang dina-makan sampel. Inferensi statistik adalah pengambilan kesimpulan berdasarkan sampel.
Jika X variabel random dengan distribusi F dan dilakukan percobaan ran-dom sebanyak n kali, maka diperoleh variabel random X1, X2,· · · , Xn.
Selanjut-nya X1, X2,· · · , Xn dinamakan sampel random dari distribusi F. Suatu sampel
dikatakan berukurann jika banyaknya anggota sampel adalahn. Jika nilai sampel random tersebut berturut-turut adalah x1, x2,· · · , xn, maka nilai-nilai ini
dina-makan nilai eksperimen atau data sampel.
Suatu kuantitas yang dihitung dari data sampel dinamakanstatistik, sedangkan suatu kauntitas yang dimiliki oleh suatu populasi dinamakan parameter. Dapat terjadi nilai parameter suatu populasi diketahui atau tidak diketahui.
Contoh 53. Misalkan variabel randomX menyatakan usia bola lampu yang dipro-duksi suatu perusahaan yang diasumsikan berdistribusi normal dengan meanµdan varian σ2 yang tidak diketahui. Satu-satunya cara untuk memperoleh informasi tentang µ dan σ2 adalah dengan melakukan eksperimen random. Misalkan di-lakukan eksperimen dengan mengambil secara random sebanyak n = 100 bola lampu, dan usia bola lampu yang tercatat adalahX1, X2, X3,· · · , X100. Dalam hal ini X1, X2, X3,· · · , X100 merupakan sampel random yang berasal dari distribusi normal tersebut. Ke 100 bola lampu tersebut dapat digunakan untuk memper-oleh informasi tentang µ dan σ2. Ukuran yang diperoleh dari ke 100 bola lampu tersebut merupakan statistik, sedangkan µdan σ2 merupakan parameter.
Misalkan suatu populasi memiliki distribusi tertentu dengan mean populasi
µ dan varian populasi σ2. Suatu sampel random X
1, X2,· · · , Xn diambil dari
populasi tersebut. Ada dua statistik yang penting, yaitu mean sampel dan varian sampel.
Definisi 7.0.1. Diketahui X1, X2, X3,· · · , Xn adalah sampel random berukuran
n.
(a) Mean sampel didefinisikan
X = X1+X2+· · ·+Xn
n = n X i=1 Xi n
(b) Varian sampel didefinisikan
S2 =
n
X
i=1
(Xi−X)2
n−1 ,
dan S =√S2 dinamakan deviasi standar sampel.
Contoh 54. Suatu eksperimen random telah dilakukan sebanyak 5 kali dan diper-oleh X1 = 3.5, X2 = 3.2, X3 = 3.4, X4 = 3.3 dan X5 = 3.6. Mean sampelnya adalah X = 5 X i=1 Xi 5 =
3.5 + 3.2 + 3.4 + 3.3 + 3.6
5 = 3.4,
dan varian sampelnya adalah
S2 = 5
X
i=1
(Xi−X)2
5−1
= (3.5−3.4)
2+ (3.2−3.4)2 + (3.4−3.4)2+ (3.3−3.4)2+ (3.6−3.4)2 4
= 0.025.
Dengan demikian deviasi standar sampel adalah S =√0.025 = 0.158.
Distribusi sampel adalah distribusi peluang suatu statistik. Misalnya distribusi peluang X dinamakan distribusi sample mean.
Teorema 7.0.1. JikaX1, X2,· · · , Xn sampel random berukuran n dari suatu
55
(a) E(X) = µ
(b) V ar(X) = σn2.
Berdasarkan teorema di atas, nilai harapan X sama dengan mean populasi µ, sedangkan varian X semakin mengecil dengan bertambahnya ukuran sampel n. Teorema 7.0.2 (Teorema Limit Pusat). Jika X adalah mean sampel random berukuran n dari suatu populasi dengan mean µ dan varian σ2, maka
Z = X−µ
σ√n
mendekati berdistribusi normal standar jika n besar.
UmumnyaZ mendekati distribusi normal untuk n≥30. Teorema di atas dapat digunakan untuk mencari nilai pendekatan peluang variabel random ¯X.
Contoh 55. Suatu perusahan memproduksi bola lampu yang usia hidupnya berdis-tribusi mendekati normal dengan mean 800 jam dan deviasi standar 40 jam. Berapa peluang suatu sampel random sebanyak 16 bola lampu akar berusia rata-rata ku-rang dari 775 jam?
Distribusi sampelX mendekati normal dengan µX = 800 dan σX = 40/√16 = 10. Peluang yang dicari adalah
P(X <775) =P
X−µ σ√n <
775−800 10
=P(Z <−2.5) = 0.0062.
Teorema 7.0.3. JikaX1, X2,· · · , Xn sampel random berukuran n dari suatu
dis-triibusi dengan mean µ dan varian σ2, maka nilai harapan S2 = Pn
i=1
(Xi−X)2
n−1
adalah
E(S2) = σ2.
Teorema tersebut menyatakan bahwa nilai harapan dari varian sampel sama dengan varian populasi.
Brikutnya akan dibahas distribusi statistik suatu sampel random yang berasal dari populasi berdistrusi normal. JikaX1, X2,· · ·, Xn adalah sampel random dari
populasi berdistribusi normal dengan mean µdan varian σ, dan mean sampel X, maka
Z = X−µ
σ/√n
Teorema 7.0.4. JikaX1, X2,· · · , Xn adalah sampel random dari populasi
berdis-tribusi normal dengan mean µ dan varian σ, maka (a) X dan S2 independen
(b) X berdistribusi normal dengan mean µ dan varian σ2/n
(c) (n−1)S2/σ2 berdistribusi chi-square dengan derajat bebas n−1.
Di dalam inferensi statistik, sering diasumsikan bahwa sampel randomX1, X2,· · · , Xn
Bab 8
Estimasi
Jika kita telah memperoleh data sampel dari suatu populasi yang memiliki mean
µ yang tidak diketahui, maka untuk memperoleh informasi tentang parameter µ
dapat digunakan mean sampel ¯x. Ini berarti statistik ¯xdigunakan untuk mengesti-masi (meduga) parameter mean populasiµ. Dalam hal ini ¯xdinamakanestimator (penduga) untuk µ. Secara umum, jika θ parameter populasi, maka estimator un-tuk θ ditulis ˆθ. Jadi ˆµ= ¯x.
Estimator titiksuatu parameter adalah estimator yang berupa sebuah nilai tung-gal. Sebagai contoh, dalam pernyataan ”rata-rata hasil pengukuran kecepatan cahaya adalah 301.000 km/detik”, nilai tersebut adalah suatu estimator titik. Definisi 8.0.2. Suatu statistik dikatakan estimator tak bias parameterθ jika nilai harapannya sama dengan θ. Jika tidak demikian maka statisik tersebut dikatakan
bias.
Pada kuliah sebelumnya telah disampaikan bahwa statistik
X =
Pn
i=1Xi
n
memiliki nilai harapan sama dengan mean populasi µ. Dengan demikian X meru-pakan estimator tak bias untuk parameter µ. Demikian pula varian sampel
S2 =
Pn
i=1(Xi−X)2
n−1
juga merupakan estimator tak bias parameter varian σ2 .
Definisi 8.0.3. Suatu estimator θ1 dikatakan lebih efisien dari pada estimator θ2 jika varian θ1 lebih kecil dibanding varian θ2.
Suatu estimator yang berupa interval dimana parameter diduga berada dina-makan estimator interval.
Sebagai contoh, jika dikatakan kecepatan cahaya berkisar antara 299.000 km/detik sampai dengan 305.000 km/detik, maka nilai kecepatan cahaya yang sebenarnya dipercaya berada di antara kedua batas interval.
Interval kepercayaan untuk suatu parameter adalah suatu inteval dalam mana parameter dipercaya berada. Misalkan θ adalah parameter yang tidak diketahui. Untuk membentuk interval kepercayaan θ, kita perlu mencari statistik U dan L
sehingga peluang
P(L≤θ≤U) = 1−α
adalah benar. Interval
L≤θ ≤U (8.1)
dinamakan interval kepercayaan 100(1-α) persen untuk parameter θ.
Interval kepercayaan dapat diinterpretasikan sebagai berikut: jika kita mengam-bil sampel random berulang-ulang, maka 100(1−α) persen dari semua nilai data akan memuat nilai θ yang sebenarnya.
Di dalam persamaan 8.1, L dan U berturut-turut dinamakan batas bawah dan batas atas interval.
Jika α = 0.05 misalnya, maka persamaan 8.1 dinamakan interval kepercayaan 95 persen untuk θ. Pada bagian berikut, kita akan belajar membentuk interval kepercayaan untuk paramter mean populasi µ, varian populasi σ2 dan selisih dua mean populasi.
8.1
Interval Kepercayaan untuk
µ
dengan
σ
Diketahui
MisalkanX1, X2,· · · , Xnadalah sampel random dari populasi berdistribusi normal
dengan mean µdan varian σ2. Telah disampaikan bahwa X merupakan estimator
µ. Namun demikian kita tidak dapat memastikan bahwa X = µ, melainkan kita hanya dapat menyatakan bahwa µberada di dalam interval tertentu.
Karena X berdistribusi normal dengan mean µdan varian σ2/n, maka
X−µ σ/√n
berdistribusi normal standar. Oleh karena itu
P
−1.96<√n(X−µ)
σ <1.96
8.1. INTERVAL KEPERCAYAAN UNTUKµDENGANσDIKETAHUI 59
atau ekivalen dengan
P
X−1.96√σ
n < µ < X + 1.96 σ
√
n
= 0.95
Interval
X−1.96√σ
n, X + 1.96 σ
√
n
dinamakan interval kepercayaan 95 persen untuk µ.
Jika x1, x2,· · · , xn adalah data sampel dari distribusi di atas, dan x adalah
rata-rata sampel, maka interval kepercayaan 95 persen untuk µadalah
x−1.96√σ
n, x+ 1.96 σ
√
n
.
Contoh 56. Dari data sampel random berat badan 100 orang dewasa di Palangkaraya diperolehx= 67.45 kg dan penelitian sebelumnya menyatakan bahwaσ2 = 8.6136 kg. Carilasolh interval kepercayaan 95 persen berat badan orang dewasa di Palangkaraya.
Penyelesaian. Berdasarkan yang diketahui, interval kepercayaan 95 persen untuk mean populasi adalah
x−1.96√σ
n, x+ 1.96 σ
√
n
= 67.45−1.96√2.93
100,67.45 + 1.96 2.93
√
100
= (66.8748,68.0252).
Ini berarti 95 persen dapat dipercaya bahwa berat badan rata-rata orang dewasa di Palangkaraya berada di antara (66.8748 kg sampai dengan 68.0252 kg.
Dengan cara yang serupa, interval kepercayaan 99 persen untuk mean populasi
µadalah
X−2.58√σ
n, X + 2.58 σ
√
n
.
Secara umum, interval kepercayaan (1−α) persen untuk mean populasi µjika
σ diketahui adalah
X−zα/2
σ
√
n, X +zα/2 σ
√
n
.
Tingkat 99.73 % 99 % 98 % 96 % 95.45 % 95 % 90 % kepercayaan
zα/2 3.00 2.58 2.33 2.05 2.00 1.96 1.645
Table 8.1: Tabelzα/2
8.2
Interval Kepercayaan untuk
µ
dengan
σ
Tidak
Dike-tahui
MisalkanX1, X2,· · · , Xnsampel random dari populasi berdistribusi normal dengan
µdan σ2 keduanya tak diketahui. Dapat dibuktikan bahwa (X−µ)√n
S
berdistribusi t dengan derajat bebas n−1.
Interval kepercayaan (1−α) persen untuk µdapat dibentuk sebagai berikut.
P
−tα/2,n−1 <
(X−µ)√n
S < tα/2,n−1
= 1−α
atau ekivalen dengan
P
X−tα/2,n−1
S
√
n < µ < X +tα/2,n−1
S
√
n
= 1−α.
Jadi jikaX =xdan S=s, maka kita dapat menyatakan bahwa 100(1−α) persen percaya nilaiµ berada di dalam interval
x−tα/2,n−1
S
√
n, x+tα/2,n−1
S
√
n
.
Contoh 57. Berdasarkan data sampel random pengukuran 10 diameter pipa meng-hasilkan mean x = 2.38 cm dan deviasi standar s = 0.06 cm. Carilah interval kepercayaan 95 persen untuk diameter pipa yang sebenarnya.
Penyelesaian. Berdasarkan tabelt denganα = 0.05 dann= 10 diperoleht0.025,9 = 2.262. Interval kepercayaan 95 persen untuk diameter pipa yang sebenarnya adalah
2.38−2.2620√.06
10,2.38 + 2.262 0.06
√
10
= (2.38−0.04292,2.38 + 0.04292) = (2.3371,2.4229)
8.3. INTERVAL KEPERCAYAAN UNTUKσ2 61
8.3
Interval Kepercayaan untuk
σ
2Diketahui X1, X2,· · · , Xn sampel random dari populasi berdistribusi normal
den-gan mean µdan varian σ2 yang tidak diketahui. Dapat dibuktikan bahwa
(n−1)S 2
σ2
berdistribusi Chi-square dengan dejarat bebas n−1.
Interval kepercayaan (1−α) persen untuk σ2 dapat dibentuk sebagai berikut.
P
χ21−α/2,n−1 <(n−1)S 2
σ2 < χ 2
α/2,n−1
= 1−α
atau ekivalen dengan
P (n−1)S
2
χ2
α/2,n−1
< σ2 < (n−1)S
2
χ2
1−α/2,n−1
!
= 1−α.
Jadi jika S2 =s2, interval kepercayaan 100(1−α) persen untuk σ2 adalah
(n−1)S2
χ2
α/2,n−1
, (n−1)S
2
χ2
1−α/2,n−1
!
.
Contoh 58. Kapasitas 10 batere diukur dan hasilnya sebagai berikut (dalamampere− jam):
140, 136, 150, 144, 148, 152, 138, 141, 143, 151.
(a) Carilah estimasi untuk varian populasi σ2, dan (b) hitunglah interval keper-cayaan 99 persen untukσ2.
Penyelesaian. (a) Dari data tersebut diperolehx= 144.3. Estimasi untuk varian populasi
S2 = 10
X
i=1
(Xi−144.4)2
10−1 = 32.23.
(b) Karena 1 −α = 0.99 maka α/2 = 0.01/2 = 0.005. Berdasarkan tabel Chi-square diperoleh χ2
0.005,9 = 23.589 dan χ21−0.005,9 = χ
2
(n−1)S2
χ2
α/2,n−1
,(n−1)S
2
χ2
1−α/2,n−1
!
=
9×32.23 23.589 ,
9×32.23 1.735
= (12.30,167.19),
yang berarti bahwa dapat dipercaya 99 persen nilai varian populasi berada pada interval (12.30,167.19).
8.4
Interval Kepercayaan Selisih Dua Mean
Dalam suatu penelitian mungkin kita ingin membentuk interval kepercayaan selisih dua mean populasi. MisalkanX1, X2,· · · , Xn adalah sampel random dari populasi
berdistribusi normal dengan mean µ1 dan varian σ12, dan Y1, Y2,· · · , Ym adalah
sampel random dari populasi berdistribusi normal dengan mean µ2 dan varian
σ2
2. Kita akan membentuk interval kepercayaan selisih kedua mean populasi, yaitu
µ1 −µ2.
Dari pembahasan sebelumnya ¯X berdistribusi normal dengan meanµ1 dan var-ian σ2
1/n; dan ¯Y berdistribusi normal dengan mean µ2 dan varian σ22/m. Oleh karena itu ¯X−Y¯ berdistribusi normal dengan meanµ1−µ2dan varianσ12/n+σ22/m.
Pembahasan akan dibagi menjadi dua,