BAB III
SIMULASI PENGGUNAAN
PERTIDAKSAMAAN PADA DISTRIBUSI
3.1 Pendahuluan
Pada bab sebelumnya telah dibahas mengenai pertidaksamaan Chernoff dengan terlebih dahulu diberi pemaparan mengenai dua pertidaksamaan yang sudah cukup sering dipergunakan yaitu pertidaksamaan Markov dan pertidaksamaan Chebyshev. Telah disebutkan bahwa pertidaksamaan Chernoff memberikan batas yang paling dekat dengan nilai sebenarnya.
Untuk membandingkan batas yang dihasilkan oleh ketiga pertidaksamaan tersebut pada suatu populasi dapat dilakukan sebuah simulasi. Simulasi dilakukan dengan mengenerate data untuk sebuah distribusi kemudian menghitung nilai peluang suatu selang tertentu dengan menggunakan frekuensi relatif yang dihitung dari data tersebut (tanpa melihat distribusinya). Hasil perhitungan secara eksak akan dibandingkan dengan hasil perhitungan dengan menggunakan ketiga bentuk pertidaksamaan.
Berikut ini hasil simulasi untuk distribusi binomial dan distribusi normal:
3.2 Simulasi untuk Distribusi Binomial
Pada simulasi pertama untuk suatu data berdistribusi binomial (10, 0.30) di-generate sebanyak 300 data, sebagai berikut
X Frekuensi
frekuensi
relatif Frekuensi relatif komulatif
hampiran peluang binomial (10, 0.3) (sumber: Walpole) 0 9 0.03 0.03 0.0282 1 29 0.097 0.127 0.1493 2 64 0.213 0.34 0.3828 3 73 0.243 0.583 0.6496 4 70 0.233 0.817 0.8497
X Frekuensi
frekuensi
relatif Frekuensi relatif komulatif
hampiran peluang binomial (10, 0.3) (sumber: Walpole) 5 33 0.11 0.927 0.9527 6 18 0.06 0.987 0.9894 7 3 0.01 0.997 0.9984 8 1 0.003 1 0.9999 Tabel 8 Data Simulasi 1
Distribusi penyebaran data simulasi 1 tersebut dapat digambarkan dalam histogram berikut:
Histogram Data Simulasi 1
0 10 20 30 40 50 60 70 80 1 2 3 4 5 6 7 8 9 x frekuensi Gambar 1
Histogram Data Simulasi 1
selain itu statistik dari data tersebut dapat disajikan sebagai berikut :
Univariate Statistics Variable 1 Count 300 Sum 958 Average 3.19 Median 3 Mode 3 Minimum 0 Maximum 8 Range 8 Standard Deviation 1.516
Variance 2.297
Skewness 0.191
Kurtosis -0.185
Tabel 9
Tabel Informasi Statistik untuk Data Simulasi 1
Dari informasi di atas dapat dilihat bahwa range data cukup besar. Hal ini juga menyebabkan data tersebar cukup luas. Titik puncak dari data berada di sekitar rataan, sehingga kemiringan dari grafik data pun cukup kecil.
Dalam melakukan simulasi penggunaan pertidaksamaan pada distribusi data ini diambil nilai peluang salah satu selang yaitu . Nilai peluang secara eksak dapat dihitung dengan menggunakan frekuensi relatifnya
) 4 (X ≥ P 417 . 0 )] 0 ( ) 1 ( ) 2 ( ) 3 ( [ 1 ) 4 ( 1 ) 4 ( = = + = + = + = − = < − = ≥ P X P X P X P X P X X P (3.2) Kemudian dengan menggunakan pertidaksamaan dapat diperoleh hasil sebagai berikut Pertidaksamaan Markov: 7975 . 0 4 19 . 3 4 ] [ ) 4 (X ≥ ≤ E X = = P (3.3) Pertidaksamaan Chebyshev: 77 . 0 ) 4 ( 6561 . 0 297 , 2 297 . 2 ) 81 . 0 19 . 3 ( ) 81 . 0 ( ) 81 . 0 19 . 3 ( 2 2 2 ≤ ≥ + ≤ ≥ − + ≤ ≥ − X P X P X P σ σ (3.4)
Dalam menghitung batas atas pertidaksamaan Chernoff terdapat sedikit kesulitan dalam mencari bentuk fungsi pembangkit momen hampirannya. Perlu bantuan komputer dalam mencari fungsi tersebut. Fungsi pembangkit momen hampirannya tersebut dihitung dengan menggunakan komputasi sehingga didapatkan hasil pertidaksamaan Chernoff sebagai berikut:
) 4 (X ≥ P 724 . 0 ) 4 (X ≥ ≤ P (3.5)
Dari simulasi data yang terdistribusi binomial (10, 0.30) ini dapat ditunjukkan bahwa pertidaksamaan Chernoff menghasilkan batas yang paling baik, mendekati nilai sebenarnya. Hal ini bisa diakibatkan karena jumlah datanya yang cukup banyak atau karena penyebaran datanya yang cukup besar. Simulasi lain dilakukan untuk beberapa nilai p, misalnya untuk p=0.5 dengan data sebagai berikut :
X Frekuensi frekuensi relative
1 3 0.006 2 22 0.044 3 64 0.128 4 109 0.218 5 135 0.27 6 96 0.192 7 47 0.094 8 17 0.034 9 6 0.012 10 1 0.002 Tabel 10
Tabel Data Simulasi Binomial (10, 0.5)
Pertidaksamaan Chernoff juga memberikan batas yang paling akurat pada simulasi ini. Simulasi lain juga dilakukan untuk distribusi dari peubah acak kontinu, yaitu distribusi normal. Hasil simulasi tersebut dapat dilihat sebagai berikut
3.3 Hasil Simulasi untuk Distribusi Normal
Pada simulasi pertama untuk distribusi normal di-generate data sebanyak 200 dengan mean (µ) = 7 dan standar deviasi
( )
σ =2Selang nilai tengah Frekuensi Frekuensi relative frekuensi relative komulatif 2.00-3.00 2.5 6 0.03 0.03 3.00-4.00 3.5 7 0.035 0.065 4.00-5.00 4.5 21 0.105 0.17 5.00-6.00 5.5 33 0.165 0.335 6.00-7.00 6.5 43 0.215 0.55 7.00-8.00 7.5 37 0.185 0.735
Selang nilai tengah Frekuensi Frekuensi relative frekuensi relative komulatif 8.00-9.00 8.5 20 0.1 0.835 9.00-10.00 9.5 19 0.095 0.93 10.00-11.00 10.5 10 0.05 0.98 11.00-12.00 11.5 4 0.02 1 Tabel 11 Data Simulasi 2
Data mentah untuk simulasi ini dapat dilihat pada lampiran C.
Distribusi penyebaran data simulasi 2 tersebut dapat digambarkan dalam histogram berikut:
Histogram Data Simulasi 2
0.0 10.0 20.0 30.0 40.0 50.0 1.7 34476 2.5 02164 3.2 69852 4.0 37541 4.8 05229 5.5 72917 6.3 40606 7.1 08294 7.8 75982 8.6 43671 9.4 11359 10.1 79047 10.9 46736 11.7 14424 12.4 82112 x frekuens i Gambar 2
Histogram Data Simulasi 2
Dengan statistik yang diperoleh dari data tersebut sebagai berikut :
Univariate Statistics Variable 1 Count 200 Sum 1,382.3916 Average 6.911958 Median 6.8740 Minimum 2.1020 Maximum 11.7450
Range 9.6430 Standard Deviation 1.9513442 Variance 3.8077442 Skewness 0.103 Kurtosis -0.150 Tabel 12
Tabel Informasi Statistik Data Simulasi 2
Dari informasi di atas dapat diketahui bahwa range data cukup besar. Hal ini juga menyebabkan data tersebar cukup luas. Titik puncak dari data berada di sekitar rataan, sehingga kemiringan dari grafik data pun cukup kecil.
Dalam melakukan simulasi penggunaan pertidaksamaan pada distribusi data kontinu ini diambil nilai peluang salah satu selang yaitu . Nilai peluang secara eksak dapat dihitung dengan menggunakan frekuensi relatifnya
) 7 (X ≥ P ( 7) 1 ( 7) 0.4 P X ≥ = −P X < = 5 5 (3.6)
atau jika kita menggunakan tabel distribusi normal [1] bisa didapatkan
( 7) 1 ( 7) 0.
P X ≥ = −P X < =
Kemudian dengan menggunakan pertidaksamaan dapat diperoleh hasil sebagai berikut Pertidaksamaan Markov : 9874 . 0 7 911958 . 6 ) 7 ( 7 ] [ ) 7 ( = ≤ ≥ ≤ ≥ X P X E X P (3.7) Pertidaksamaan Chebyshev: ) 088042 . 0 ( ) 088042 . 0 911958 . 6 ( 2 + ≤ ≥ − σ σ X P 975 . 0 0077513934 . 0 8077442 . 3 8077442 . 3 ) 7 ( = + ≤ ≥ X P (3.8)
Dalam menghitung batas atas pertidaksamaan Chernoff terdapat sedikit kesulitan dalam mencari bentuk fungsi pembangkit momen hampirannya. Perlu bantuan
) 7 (X ≥ P
komputer dalam mencari fungsi tersebut. Fungsi pembangkit momen hampirannya tersebut dihitung dengan menggunakan komputasi dan akan didapatkan hasil pertidaksamaan Chernoff sebagai berikut:
864 . 0 ) 7 (X ≥ ≤ P (3.9)
Simulasi lain dilakukan untuk beberapa distribusi normal lainnya dan menghasilkan hal yang serupa. Pertidaksamaan Chernoff menghasilkan batas yang paling akurat mendekati nilai sebenarnya.
Dari simulasi ini dapat ditunjukkan bahwa untuk beberapa kasus pada distribusi binomial dan normal, pertidaksamaan Chernoff selalu menghasilkan batas atas dari nilai peluang