• Tidak ada hasil yang ditemukan

Kajian overdispersi pada regresi Poisson dan ZIP ini ditinjau dari kajian simulasi dan kajian terapan. Kajian simulasi terdiri dari 84 kasus simulasi yang merupakan karakteristik data dari kombinasi λ, n, dan p. Simulasi dilakukan untuk mengevaluasi hasil pendugaan parameter dari regresi Poisson dan ZIP dengan menggunakan persentase ARB, RRMSE dan rataan SAPR. Nilai tersebut diperoleh dari hasil simulasi yang diulang sebanyak 500 kali. Hasil evaluasi dari data simulasi diperjelas dengan hasil eksplorasi dan pengujian terhadap peubah Y. Analisis regresi Poisson dan ZIP akan digunakan di data terapan yang memiliki p berlebih pada peubah Y.

Kajian Simulasi Eksplorasi pada peubah Y

Karakteristik data simulasi terhadap λ, n, dan p yang dicobakan menunjukkan bahwa munculnya nilai p berpengaruh terhadap λ. Nilai λ yang kecil menghasilkan nilai p yang melebihi penentuan p yang dicobakan. Ketika λ

bernilai 0.6 dengan p yang dicobakan 0.3, maka peubah Y menghasilkan kisaran p dari 0.3 sampai 0.5. Hasil ini karena nilai λ yang kecil masih memiliki p yang relatif besar dari sebaran Poisson. Nilai λ yang dicobakan untuk 0.6, 0.8, 1, 6, dan 8 masih memiliki peluang nol dari sebaran Poisson, sedangkan untuk nilai λ lain yang dicobakan yaitu 10 dan 20 sudah tidak memiliki peluang nol dari sebaran Poisson. Karakteristik data menunjukkan bahwa semakin besar nilai λ, maka semakin kecil nilai p pada peubah Y di setiap n. Kondisi ini sesuai dengan fungsi massa peluang dari sebaran Poisson.

(a) p=0.1 (b) p=0.3 (c) p=0.5 (d) p=0.7

Gambar 1 Histogram terhadap peubah Y pada =1, n=300 dengan (a) p=0.1, (b) p=0.3, (c) p=0.5, (d) p=0.7 Fre k u en si y Fre k u en si y Fre k u en si y y Fre k u en si

14

Eksplorasi terhadap peubah Y ditunjukan dengan histogram yang bertujuan mengetahui kondisi sebaran Poisson dan ZIP pada peubah Y. Nilai n yang ditentukan yaitu 300 contoh, karena nilai tersebut sebagian besar digunakan dalam data terapan pada analisis regresi Poisson dan ZIP. Nilai λ yang ditampilkan adalah λ=1 dan 10, yang mewakili nilai λ bernilai kecil dan besar. Histogram pada Gambar 1(a), 1(b), 1(c), dan 1(d) menunjukkan bahwa ketika peubah Y memiliki nilai λ=1 dengan p=0.1, 0.3, 0.5, dan 0.7, maka indikasi masih menyebar Poisson. Histogram pada λ=1 menunjukkan bahwa rataan peubah Y berada di sekitar nilai 1. Peubah Y memiliki p=0.1, maka rataan mengalami perubahan menjadi nilai λ

kurang dari 1. Kenaikan nilai p dari 0.1 sampai 0.7, mengalami perubahan nilai λ

yang signifikan artinya semakin besar nilai p, maka nilai λ menuju nol. Nilai λ=1 dan p=0.7 pada peubah Y mengindikasikan peluang nol berlebih. Kondisi ini sesuai dengan peningkatan frekuensi nilai nol di setiap p yang dicobakan.

Histogram pada Gambar 2(a), 2(b), 2(c), dan 2(d) menunjukkan bahwa peubah Y memiliki λ=10 di setiap p yang dicobakan, maka indikasi menyebar ZIP. Histogram pada λ=10 menunjukkan bahwa rataan peubah Y berada di sekitar nilai 10. Peubah Y memiliki banyak nilai nol yang berlebih pada λ=10 dengan p=0.7, sehingga bentuk sebaran data yang terjadi yaitu nilai nol terpisah dengan nilai lainnya yang berada di sekitar nilai 10. Kondisi perubahan di setiap p yang dicobakan pada λ=10 menunjukkan hasil yang sama dengan λ=1. Hasil indikasi histogram pada Gambar 1 dan 2 akan diuji dengan uji skor dan khi-kuadrat, yang menunjukkan bahwa kondisi dari penyebab overdispersi dan sebaran Poisson pada peubah Y.

(a) p=0.1 (b) p=0.3 (c) p=0.5 (d) p=0.7

Gambar 2 Histogram terhadap peubah Y pada =10, n=300 dengan (a). p=0.1, (b). p=0.3, (c). p=0.5, (d). p=0.7 Fre k u en si Fre k u en si Fre k u en si Fre k u en si y y y y

15 Pengujian terhadap peubah Y

Eksplorasi peubah Y terhadap λ, n, p yang dicobakan menunjukkan adanya indikasi peluang nol berlebih, sehingga diperlukan pengujian terhadap peubah Y. Pengujian tersebut berupa uji skor dan uji khi-kuadrat yang dapat menggeneralisasi kesimpulan secara umum terhadap hasil eksplorasi terhadap peubah Y. Kondisi berlebihnya peluang nol pada peubah Y mengakibatkan terjadinya overdispersi. Flynn dan Francis (2009) menyatakan bahwa ketika hasil uji skor menghasilkan nilai nol yang berlebih pada suatu peubah, maka kemungkinan peubah tersebut tidak menyebar Poisson melainkan memiliki sebaran ZIP.

Hasil uji skor dengan α sebesar 0.05 pada hasil bangkitan peubah Y terhadap kombinasi dari λ, n, p ditunjukan pada Tabel 2. Uji skor menunjukkan bahwa semakin besar λ, n, dan p yang dicobakan, maka akan semakin besar persentase nol berlebih pada peubah Y.

Tabel 2 Persentase uji skor terhadap kombinasi λ, n, p n λ p=0.1 p=0.3 p=0.5 p=0.7 100 0.6 6.5 23.4 45.6 88.9 0.8 9.0 39.2 66.8 88.9 1 10.0 55.0 86.2 92.8 6 100.0 100.0 100.0 100.0 8 100.0 100.0 100.0 100.0 10 100.0 100.0 100.0 100.0 20 100.0 100.0 100.0 100.0 300 0.6 13.2 55.0 89 96.2 0.8 18.2 82.6 98.8 99.8 1 24.4 96.4 100.0 100.0 6 100.0 100.0 100.0 100.0 8 100.0 100.0 100.0 100.0 10 100.0 100.0 100.0 100.0 20 100.0 100.0 100.0 100.0 500 0.6 17.6 77.0 98.0 99.6 0.8 25.0 96.2 100 100.0 1 39.0 100 100 100.0 6 100.0 100.0 100.0 100.0 8 100.0 100.0 100.0 100.0 10 100.0 100.0 100.0 100.0 20 100.0 100.0 100.0 100.0

Selanjutnya, hasil uji khi-kuadrat dengan α sebesar 0.05 untuk sebaran Poisson dan ZIP terhadap kombinasi dari λ, n, p ditunjukan pada Tabel 3. Uji khi-kuadrat untuk sebaran Poisson menunjukkan bahwa semakin besar λ, n, dan p yang dicobakan, maka akan semakin kecil persentase sebaran Poisson pada peubah Y. Hasil dari uji skor dan khi-kuadrat untuk sebaran Poisson berbanding terbalik dengan semakin besarnya λ, n, dan p yang dicobakan. Uji khi-kuadrat untuk sebaran ZIP menunjukkan bahwa regresi ZIP mampu mengatasi overdispersi yang disebabkan p berlebih pada peubah Y. Kondisi ini ditunjukkan dengan semakin

16

besar nilai λ, maka persentase sebaran Poisson mencapai 0 % sedangkan persentase sebaran ZIP mencapai kisaran 60 % sampai 80 %.

Kejadian overdispersi yang disebabkan peluang nol berlebih pada peubah Y, maka sangat berpengaruh terhadap nilai λ yang berlaku di setiap n. Hasil eksplorasi pada peubah Y memberikan indikasi yang sesuai dengan hasil uji skor dan uji khi-kuadrat untuk sebaran Poisson dan ZIP. Nilai λ=0.6 yang menghasilkan persentase nol berlebih yang paling kecil dan sebagian besar menyebar Poisson. Nilai λ yang dimulai dari 6 sampai λ=20 di setiap p dan n yang dicobakan menunjukkan bahwa peluang nol berlebih mencapai 100 % dan peubah Y tidak menyebar Poisson, melainkan menyebar ZIP.

Tabel 3 Persentase uji khi-kuadrat terhadap kombinasi λ, n, p p=0.1 p=0.3 p=0.5 p=0.7

n λ Poisson ZIP Poisson ZIP Poisson ZIP Poisson ZIP

100 0.6 91.0 83.6 75.0 85.4 54.8 85.2 33.4 80.6 0.8 89.2 80.2 62.6 82.0 32.0 81.6 18.0 85.4 1 88.2 82.2 51.0 86.0 14.2 85.0 7.8 82.8 6 0.0 84.4 0.0 83.4 0.0 82.8 0.0 82.0 8 0.0 81.6 0.0 79.6 0.0 80.4 0.0 76.8 10 0.0 79.4 0.0 78.6 0.0 78.2 0.0 75.0 20 0.0 72.6 0.0 71.2 0.0 71.6 0.0 66.8 300 0.6 82.8 81.6 51.4 82.8 13.2 86.2 4.0 86.6 0.8 82.4 85.4 25.2 86.6 1.8 86.8 0.2 83.2 1 75.0 85.4 8.2 82.6 0.2 82.6 0.0 85.8 6 0.0 85.8 0.0 84.6 0.0 86.4 0.0 84.4 8 0.0 84.0 0.0 83.4 0.0 84.6 0.0 81.6 10 0.0 82.6 0.0 83.0 0.0 80.6 0.0 79.4 20 0.0 77.8 0.0 76.8 0.0 76.0 0.0 72.6 500 0.6 81.6 87.8 28.8 86.0 1.8 83.8 0.2 86.2 0.8 76.2 81.8 7.6 85.8 0.2 86.2 0.0 87.0 1 67.4 87.0 0.2 86.4 0.0 84.6 0.0 83.2 6 0.0 86.0 0.0 86.6 0.0 85.8 0.0 86.4 8 0.0 84.6 0.0 82.6 0.0 83.4 0.0 84.6 10 0.0 81.8 0.0 82.4 0.0 81.4 0.0 80.6 20 0.0 77.4 0.0 75.6 0.0 77.0 0.0 76.0

Pengujian overdispersi pada regresi Poisson dan ZIP

Eksplorasi dan pengujian terhadap peubah Y menunjukkan bahwa adanya indikasi peluang nol berlebih, sehingga dilakukan uji skor dan uji khi-kuadrat untuk sebaran Poisson dan ZIP. Hasil simulasi terhadap kombinasi λ dan p disetiap n yang dicobakan menunjukkan bahwa ketika peubah Y memiliki λ dan p yang semakin besar, maka terjadi overdispersi. Pengujian pada peubah Y

17 menyatakan bahwa kondisi overdispersi berpengaruh terhadap perubahan sebaran Poisson menjadi sebaran ZIP. Uji khi-kuadrat untuk sebaran ZIP menunjukan bahwa regresi ZIP mampu mengatasi overdispersi yang disebabkan nilai nol berlebih pada peubah Y. Selanjutnya, regresi Poisson dan ZIP diukur kebaikan modelnya berdasarkan pengujian overdispersi di setiap kombinasi λ, n, dan p yang dicobakan

Kondisi overdipersi pada setiap kombinasi λ, n, dan p yang dicobakan di regresi Poisson dan ZIP dapat ditelusuri dari rasio τ dan uji Pearson khi-kuadrat pada taraf nyata 5%. Rasio τ menunjukkan nilai dari hasil statistik uji Pearson khi-kuadrat terhadap derajat bebas (n-k). Nilai dari derajat bebas regresi Poisson dan ZIP berbeda, karena pada regresi Poisson menggunakan k=2, yaitu penduga parameter b0 dan b1. Regresi ZIP menggunakan k=4 berdasarkan model diskret untuk λ dan model zero-inflation untuk p yaitu g0 dan g1, serta l0 dan l1.

Tabel 4 Rasio dispersi terhadap regresi Poisson dan ZIP p=0.1 p=0.3 p=0.5 p=0.7

n λ Poisson ZIP Poisson ZIP Poisson ZIP Poisson ZIP

100 0.6 0.803 0.657 0.926 0.737 1.049* 0.808 1.188* 0.863 0.8 0.749 0.595 0.911 0.686 1.069* 0.770 1.247* 0.838 1 0.697 0.547 0.897 0.650 1.097* 0.741 1.286* 0.819 6 0.628 0.383 1.847* 0.656 3.069* 0.769 4.291* 0.829 8 0.815 0.443 2.447* 0.717 4.076* 0.818 5.695* 0.871 10 1.022* 0.500 3.076* 0.764 5.102* 0.855 7.138* 0.901 20 2.034* 0.675 6.135* 0.885 10.201* 0.943 14.246* 0.969 300 0.6 0.796 0.645 0.913 0.718 1.032* 0.791 1.156* 0.857 0.8 0.733 0.581 0.897 0.669 1.060* 0.751 1.221* 0.825 1 0.684 0.532 0.883 0.633 1.086* 0.723 1.286* 0.801 6 0.622 0.377 1.827* 0.641 3.040* 0.749 4.246* 0.807 8 0.808 0.437 2.422* 0.699 4.029* 0.796 5.631* 0.847 10 1.013* 0.493 3.025* 0.745 5.036* 0.833 7.051* 0.877 20 2.012* 0.665 6.038* 0.863 10.069* 0.917 14.092* 0.943 500 0.6 0.791 0.642 0.912* 0.715 1.032* 0.786 1.151* 0.853 0.8 0.734 0.579 0.895* 0.666 1.055* 0.747 1.217* 0.821 1 0.684 0.529 0.884* 0.630 1.082* 0.719 1.281* 0.797 6 0.616 0.376 1.821* 0.637 3.030* 0.744 4.231* 0.803 8 0.805 0.436 2.415* 0.696 4.023* 0.792 5.621* 0.843 10 1.002* 0.491 3.019* 0.742 5.020* 0.828 7.034* 0.872 20 2.006* 0.663 6.024* 0.858 10.050* 0.912 14.058* 0.938 * terjadi overdispersi

Rataan rasio τ yang diperoleh dari 500 kali ulangan terhadap kombinasi λ, n, dan p yang dicobakan terdapat pada Tabel 4. Kejadian overdispersi ditunjukkan dengan rasio τ lebih besar dari satu. Rasio τ pada regresi Poisson akan

18

dibandingkan dengan regresi ZIP. Rasio τ yang paling beresiko terdapat pada p=0.7 di regresi Poisson dengan nilai λ yang semakin besar. Rasio τ terhadap regresi Poisson menunjukkan bahwa semakin besar λ dan p, maka rasio τ lebih dari satu di setiap n yang dicobakan. Regresi Poisson mengalami overdispersi dengan semakin besarnya λ, p, dan n yang dicobakan. Rasio τ pada regresi ZIP memiliki nilai kurang dari satu di setiap λ, p, dan n yang dicobakan, sehingga regresi ZIP mampu mengatasi overdispersi yang disebabkan peluang nol berlebih pada peubah Y. Nilai λ yaitu 0.6, 0.8, 1 pada p=0.1 dan 0.3 di setiap n menunjukkan bahwa tidak terjadi overdispersi, begitu pula untuk p=0.5 dan 0.7 sudah terjadi overdispersi pada regresi Poisson. Selanjutnya, nilai λ yaitu 6, 8,10, dan 20 pada setiap p dan n yang dicobakan sudah terjadi overdispersi pada regresi Poisson. Kondisi ini berdasarkan hasil pada rasio dispersi dan uji Pearson khi-kuadrat.

Tabel 5 Persentase overdispersi pada regresi Poisson dan ZIP p=0.1 p=0.3 p=0.5 p=0.7

n λ Poisson ZIP Poisson ZIP Poisson ZIP Poisson ZIP

100 0.6 0.0 0.0 0.0 0.0 7.2* 0.0 40.0* 0.0 0.8 0.0 0.0 0.0 0.0 10.2* 0.0 60.0* 0.0 1 0.0 0.0 0.0 0.0 13.6* 0.0 60.0* 0.0 6 0.0 0.0 100.0* 0.0 100.0* 0.0 100.0* 0.0 8 0.0 0.0 100.0* 0.0 100.0* 0.0 100.0* 0.0 10 1.0* 0.0 100.0* 0.0 100.0* 0.0 100.0* 0.0 20 100.0* 0.0 100.0* 0.0 100.0* 0.0 100.0* 0.0 300 0.6 0.0 0.0 0.0 0.0 9.2* 0.0 55.4* 0.0 0.8 0.0 0.0 0.0 0.0 15.2* 0.0 77.2* 0.0 1 0.0 0.0 0.0 0.0 23.8* 0.0 92.8* 0.0 6 0.0 0.0 100.0* 0.0 100.0* 0.0 100.0* 0.0 8 0.0 0.0 100.0* 0.0 100.0* 0.0 100.0* 0.0 10 2.6* 0.0 100.0* 0.0 100.0* 0.0 100.0* 0.0 20 100.0* 0.0 100.0* 0.0 100.0* 0.0 100.0* 0.0 500 0.6 0.0 0.0 0.0 0.0 9.6* 0.0 70.8* 0.0 0.8 0.0 0.0 0.0 0.0 20.0* 0.0 94.0* 0.0 1 0.0 0.0 0.0 0.0 36.0* 0.0 99.0* 0.0 6 0.0 0.0 100.0* 0.0 100.0* 0.0 100.0* 0.0 8 0.0 0.0 100.0* 0.0 100.0* 0.0 100.0* 0.0 10 1.2* 0.0 100.0* 0.0 100.0* 0.0 100.0* 0.0 20 100.0* 0.0 100.0* 0.0 100.0* 0.0 100.0* 0.0 * terjadi overdispersi

Persentase overdispersi memiliki gambaran yang sama dengan rasio τ. Uji Pearson khi-kuadrat yang signifikan menunjukkan terjadinya overdispersi. Nilai overdispersi yang terdapat pada Tabel 5 menunjukkan bahwa di setiap λ, p, dan n

19 yang dicobakan menghasilkan nilai overdispersi yang mencapai 0 % untuk regresi ZIP. Hasil ini menunjukan bahwa regresi ZIP lebih baik dalam menangani overdispersi yang disebabkan peluang nol yang berlebih pada peubah Y. Persentase overdispersi terhadap regresi Poisson menunjukkan bahwa semakin besar λ dan p, maka akan semakin besar terjadinya overdispersi di setiap n yang dicobakan yang ditunjukkan dengan nilai mencapai 100 %. Peubah Y memiliki nilai λ yang kecil dengan p mencapai lebih dari 0.5, maka cenderung ke regresi ZIP. Hasil ini sesuai dengan uji skor dan khi-kuadrat yang menunjukkan semakin besar λ, n, dan p yang dicobakan, maka semakin besar pula peluang nol yang muncul dan semakin sedikit menyebar Poisson pada peubah Y.

Evaluasi pendugaan model regresi Poisson dan ZIP

Ukuran kebaikan model pada regresi Poisson dan ZIP menunjukan bahwa semakin besar λ, n, dan p yang dicobakan, maka regresi ZIP lebih baik dibandingkan regresi Poisson. Selanjutnya, perbandingan model regresi Poisson dan ZIP dilakukan berdasarkan evaluasi penduga parameter dan y.

Tabel 6 Rataan ARB (%) terhadap pada regresi Poisson dan ZIP p=0.1 p=0.3 p=0.5 p=0.7

n λ Poisson ZIP Poisson ZIP Poisson ZIP Poisson ZIP

100 0.6 31.480* 46.865 38.782* 67.152 48.959* 97.063 59.490* 114.437 0.8 24.425* 28.741 31.382* 44.364 40.807* 66.955 57.368* 108.383 1 19.962* 20.105 26.950* 32.799 37.542* 50.018 55.409* 78.315 6 4.028 0.912* 11.688 1.395* 22.734 1.587* 39.776 1.805* 8 3.737 0.297* 11.715 0.364* 22.719 0.437* 39.280 0.462* 10 3.666 0.100* 12.233 0.131* 22.504 0.141* 39.926 0.190* 20 3.495 0.029* 11.849 0.033* 23.042 0.037* 40.007 0.050* 300 0.6 30.309* 42.009 37.707* 58.637 47.808* 79.836 67.267* 114.416 0.8 21.982* 27.615 31.638* 41.178 43.022* 58.238 59.438* 81.752 1 18.550* 19.514 26.541* 31.409 38.223* 45.673 54.581* 64.011 6 3.780 0.984* 11.961 1.437* 23.224 1.575* 40.127 1.711* 8 3.550 0.293* 11.974 0.368* 22.960 0.405* 39.770 0.425* 10 3.637 0.076* 11.950 0.089* 23.021 0.103* 40.134 0.112* 20 3.504 0.016* 11.875 0.018* 23.083 0.022* 40.088 0.030* 500 0.6 29.359* 41.633 38.482* 56.961 49.227* 77.611 65.926* 105.463 0.8 23.448* 27.034 31.891* 40.459 42.641* 57.130 60.038* 78.482 1 19.065* 19.506 27.368* 31.067 37.893* 45.044 54.747* 61.953 6 3.548 0.955* 11.874 1.434* 23.262 1.594* 40.151 1.706* 8 3.512 0.287* 11.935 0.374* 23.222 0.402* 39.944 0.413* 10 3.453 0.075* 12.065 0.089* 23.029 0.094* 40.033 0.103* 20 3.505 0.013* 11.875 0.015* 23.097 0.017* 40.104 0.022* *

20

Rataan ARB untuk setiap kombinasi λ, n, dan p yang dicobakan pada penduga dan terdapat pada Tabel 6 dan 7. Hasil pada Tabel 6 dan 7 menunjukkan bahwa rataan ARB terhadap penduga dan memiliki gambaran yang sama terhadap perbandingan regresi Poisson dan ZIP. Hasil ARB pada regresi Poisson dan ZIP pada Tabel 6 menghasilkan nilai yang semakin kecil seiring membesarnya λ, n, dan p yang dicobakan terhadap penduga . Nilai ARB memiliki nilai minimum yang terdapat pada λ=6 berdasarkan penduga terhadap regresi Poisson pada Tabel 7. Kondisi ini karena adanya kestabilan pola hubungan X dan Y membentuk eksponensial yang dapat dilihat pada Lampiran 8. Rataan ARB pada regresi ZIP menghasilkan nilai yang semakin kecil seiring dengan membesarnya λ, n, dan p yang dicobakan terhadap penduga . Nilai ARB pada regresi ZIP lebih kecil dibandingkan dengan regresi Poisson berdasarkan semakin besar λ, n, dan p yang dicobakan terhadap penduga dan . Rataan ARB terhadap penduga dan menunjukkan bahwa regresi Poisson lebih baik dibandingkan regresi ZIP pada nilai λ yaitu 0.6, 0.8, dan 1 di setiap p dan n yang dicobakan. Nilai λ yaitu 6, 8, 10 dan 20 di setiap p dan n yang dicobakan menunjukkan bahwa regresi ZIP lebih baik dibandingkan regresi Poisson.

Tabel 7 Rataan ARB (%) terhadap pada regresi Poisson dan ZIP p=0.1 p=0.3 p=0.5 p=0.7

n λ Poisson ZIP Poisson ZIP Poisson ZIP Poisson ZIP

100 0.6 19.476* 75.753 21.241* 103.494 22.586* 143.374 26.006* 166.700 0.8 15.442* 51.298 16.928* 73.799 19.136* 105.497 21.128* 160.675 1 13.883* 38.542 14.307* 57.739 17.575* 83.119 19.588* 122.616 6 6.878 3.073* 11.644 4.503* 14.651 5.066* 18.614 5.626* 8 7.786 1.229* 12.766 1.511* 17.554 1.762* 21.789 1.837* 10 8.224 0.465* 14.140 0.619* 20.226 0.648* 23.569 0.861* 20 11.106 0.425* 20.382 0.452* 24.256 0.544* 31.381 0.736* 300 0.6 10.389* 70.421 11.202* 94.119 11.825* 124.301 13.310* 171.498 0.8 8.973* 50.053 9.221* 70.143 10.868* 95.410 10.905* 129.607 1 7.996* 37.781 8.925* 56.098 9.808* 77.995 10.602* 105.616 6 3.792 3.306* 6.851 4.656* 8.561 5.055* 10.816 5.435* 8 4.291 1.263* 7.945 1.566* 9.604 1.692* 10.920 1.770* 10 4.671 0.400* 8.039 0.477* 10.186 0.540* 13.146 0.561* 20 6.389 0.286* 11.708 0.291* 15.122 0.326* 18.366 0.426* 500 0.6 8.188* 70.067 8.862* 92.178 9.113* 121.813 10.264* 161.514 0.8 6.664* 49.296 7.110* 69.294 7.991* 94.169 8.798* 125.793 1 5.481* 37.741 6.650* 55.680 6.961* 77.259 8.568* 103.199 6 2.801 3.226* 5.182 4.654* 6.397 5.121* 7.980 5.436* 8 3.482 1.255* 5.601 1.590* 7.814 1.694* 8.682 1.743* 10 3.754 0.422* 6.353 0.499* 8.395 0.517* 10.205 0.550* 20 4.805 0.251* 8.932 0.272* 11.032 0.278* 14.338 0.341* *

21 Nilai RRMSE memberikan gambaran yang sama dengan ARB terhadap penduga dan . MSE mengandung dua komponen, yaitu keragaman penduga (ketepatan) dan biasnya (keakuratan) (Casella dan Berger 2002). Penduga dengan sifat MSE yang baik merupakan penduga yang mengontrol keragaman dan bias. Nilai RRMSE yang besar menunjukkan keragaman penduga yang besar, sehingga semakin beresiko pada hasil pendugaan, yaitu ketepatan pendugaannya semakin rendah.

Tabel 8 Rataan RRMSE (%) terhadap pada regresi Poisson dan ZIP p=0.1 p=0.3 p=0.5 p=0.7

n λ Poisson ZIP Poisson ZIP Poisson ZIP Poisson ZIP

100 0.6 37.124* 49.481 44.671* 71.194 54.933* 103.255 65.153* 125.102 0.8 28.936* 30.065 36.353* 46.239 45.475* 70.731 62.000* 118.056 1 19.962* 20.105 30.938* 33.837 41.891* 51.969 59.535* 85.841 6 5.014 1.074* 13.115 1.572* 24.047 1.785* 41.007 2.129* 8 4.601 0.420* 12.810 0.467* 23.767 0.579* 40.227 0.671* 10 4.318 0.138* 13.009 0.193* 23.340 0.193* 40.610 0.266* 20 3.500 0.036* 11.854 0.042* 23.047 0.046* 40.014 0.064* 300 0.6 32.694* 42.604 40.016* 59.598 50.003* 81.664 69.147* 120.250 0.8 24.024* 28.035 33.397* 41.712 44.741* 59.250 60.820* 84.319 1 19.840* 20.396 28.294* 31.733 39.907* 46.259 55.909* 65.614 6 4.240 1.054* 12.503 1.500* 23.643 1.641* 40.538 1.809* 8 3.963 0.338* 12.387 0.407* 23.301 0.444* 40.025 0.495* 10 3.922 0.104* 12.214 0.115* 23.238 0.129* 40.346 0.146* 20 3.505 0.020* 11.876 0.023* 23.084 0.028* 40.089 0.037* 500 0.6 30.844* 41.984 39.879* 57.483 50.426* 78.677 67.108* 108.195 0.8 24.673* 27.273 32.929* 40.744 43.642* 57.737 60.947* 80.043 1 19.680* 20.032 28.380* 31.270 38.719* 45.387 55.545* 62.910 6 3.849 0.992* 12.192 1.464* 23.524 1.630* 40.372 1.769* 8 3.776 0.317* 12.151 0.399* 23.428 0.429* 40.099 0.456* 10 3.640 0.096* 12.224 0.109* 23.177 0.116* 40.160 0.128* 20 3.506 0.016* 11.876 0.019* 23.097 0.021* 40.104 0.028* *

Nilai RRMSE lebih kecil

Rataan RRMSE memiliki keputusan yang sama dengan rataan ARB terhadap penduga dan . Pada Tabel 8 dan 9 menunjukkan bahwa semakin besar λ, n, dan p yang dicobakan terhadap penduga dan , maka RRMSE pada regresi ZIP lebih baik dibandingkan dengan regresi Poisson. Nilai RRMSE juga memiliki nilai minimum yang terdapat pada λ=6 berdasarkan penduga terhadap regresi Poisson. Rataan RRMSE pada regresi ZIP menghasilkan nilai yang semakin kecil seiring dengan membesarnya λ, n, dan p yang dicobakan terhadap penduga . Nilai RRMSE pada regresi ZIP lebih kecil dibandingkan dengan regresi Poisson berdasarkan semakin besar λ, n, dan p yang dicobakan terhadap

22

penduga dan . Rataan RRMSE terhadap penduga dan menunjukkan bahwa regresi Poisson lebih baik dibandingkan regresi ZIP pada nilai λ yaitu 0.6, 0.8, dan 1 di setiap p dan n yang dicobakan. Nilai λ yaitu 6, 8, 10 dan 20 di setiap p dan n yang dicobakan menunjukkan bahwa regresi ZIP lebih baik dibandingkan regresi Poisson.

Tabel 9 Rataan RRMSE (%) terhadap pada regresi Poisson dan ZIP n

λ λ

λ

p=0.1 p=0.3 p=0.5 p=0.7 Poisson ZIP Poisson ZIP Poisson ZIP Poisson ZIP

100 0.6 23.931* 78.167 27.325* 107.113 28.948* 148.998 30.586* 177.728 0.8 19.443* 52.643 21.295* 75.578 24.684* 108.939 27.273* 169.880 1 13.883* 38.542 18.047* 58.795 22.019* 85.038 25.117* 129.679 6 8.413 3.512* 14.546 4.950* 18.534 5.566* 24.056 6.420* 8 9.725 1.681* 15.946 1.856* 21.576 2.240* 27.152 2.528* 10 10.166 0.683* 17.949 0.913* 25.113 0.915* 29.879 1.214* 20 14.009 0.535* 25.870 0.582* 31.394 0.693* 40.008 0.940* 300 0.6 13.088* 70.968 14.109* 94.960 15.152* 125.887 16.502* 176.730 0.8 11.101* 50.462 11.411* 70.635 13.491* 96.326 13.943* 131.993 1 9.856* 38.109 11.226* 56.421 12.552* 78.553 13.306* 107.173 6 4.805 3.489* 8.597 4.815* 10.538 5.221* 13.605 5.680* 8 5.474 1.420* 9.805 1.694* 12.220 1.820* 13.896 1.991* 10 5.984 0.541* 10.201 0.597* 12.824 0.655* 16.695 0.718* 20 7.940 0.354* 14.687 0.362* 18.903 0.411* 23.665 0.533* 500 0.6 10.065* 70.389 11.074* 92.632 11.480* 122.711 13.031* 163.979 0.8 8.433* 49.534 8.944* 69.564 10.004* 94.700 11.058* 127.234 1 6.853* 37.922 8.413* 55.887 8.962* 77.586 10.618* 104.121 6 3.559 3.321* 6.535 4.730* 8.271 5.212* 9.985 5.592* 8 4.297 1.355* 7.044 1.671* 9.584 1.780* 10.844 1.878* 10 4.694 0.518* 7.994 0.583* 10.545 0.608* 12.877 0.659* 20 6.023 0.306* 11.293 0.332* 13.830 0.341* 18.083 0.422* *

Nilai RRMSE lebih kecil

Rataan SAPR pada penduga y didapatkan berdasarkan model regresi Poisson dan ZIP. Penduga y pada model regresi ZIP menggunakan dua model yaitu model diskret untuk λ dan model zero-inflation untuk p. Pada Tabel 10 menunjukkan bahwa semakin besar λ, n, dan p yang dicobakan, maka akan semakin besar pula nilai SAPR. Regresi ZIP memiliki rataan SAPR yang lebih kecil dibandingkan regresi Poisson di setiap λ, n, dan p yang dicobakan.

Nilai Pearson residual didapatkan dari nilai residual terhadap standar deviasi dari penduga y. Nilai residual merupakan selisih antara amatan pada peubah respon dengan penduga y. Nilai Pearson residual di setiap λ yang dicobakan dengan n=300 dan p=0.1 pada Lampiran 9 menunjukkan bahwa setiap

23 amatan menghasilkan nilai Pearson residual yang cenderung mendekati nilai nol pada regresi ZIP dan lebih kecil dibandingkan regresi Poisson.

Tabel 10 Rataan SAPR terhadap penduga y pada regresi Poisson dan ZIP n λ p=0.1 p=0.3 p=0.5 p=0.7

Poisson ZIP Poisson ZIP Poisson ZIP Poisson ZIP

100 0.6 0.166 0.155* 0.171 0.155* 0.160 0.148* 0.145 0.096* 0.8 0.180 0.153* 0.191 0.154* 0.184 0.154* 0.163 0.135* 1 0.154 0.139* 0.185 0.158* 0.190 0.155* 0.175 0.141* 6 0.081 0.069* 0.241 0.145* 0.346 0.170* 0.366 0.163* 8 0.106 0.078* 0.281 0.151* 0.401 0.176* 0.431 0.168* 10 0.123 0.084* 0.330 0.158* 0.462 0.182* 0.502 0.171* 20 0.166 0.097* 0.459 0.169* 0.645 0.191* 0.709 0.177* 300 0.6 0.504 0.466* 0.523 0.470* 0.503 0.444* 0.425 0.374* 0.8 0.516 0.455* 0.563 0.472* 0.559 0.455* 0.496 0.393* 1 0.476 0.437* 0.571 0.475* 0.583 0.465 0.519 0.402* 6 0.272 0.216* 0.700 0.432* 1.005 0.513* 1.090 0.488* 8 0.324 0.236* 0.816 0.453* 1.162 0.529* 1.274 0.500* 10 0.371 0.252* 0.962 0.473* 1.334 0.544* 1.447 0.512* 20 0.492 0.289* 1.311 0.506* 1.881 0.571* 2.043 0.530* 500 0.6 0.861 0.779* 0.875 0.784* 0.837 0.744* 0.725 0.634* 0.8 0.839 0.747* 0.898 0.783* 0.909 0.762* 0.829 0.657* 1 0.832 0.715* 0.931 0.784* 0.947 0.780* 0.863 0.678* 6 0.459 0.361* 1.187 0.722* 1.673 0.855* 1.811 0.815* 8 0.513 0.389* 1.379 0.757* 1.973 0.884* 2.119 0.836* 10 0.586 0.418* 1.576 0.786* 2.225 0.908* 2.407 0.852* 20 0.864 0.484* 2.233 0.845* 3.166 0.950* 3.416 0.884* *

Nilai SAPR lebih kecil

Suatu penduga yang baik seharusnya memiliki bias dan ragam yang kecil. Regresi Poisson dan ZIP dibandingkan berdasarkan kemampuan dapat mengontrol bias dan ragam penduga agar menghasilkan ketepatan dugaan yang tinggi. Bias dan ragam dari penduga parameter regresi Poisson dan ZIP ditunjukan pada rataan ARB dan RRMSE. Kemudian, untuk mengetahui kemampuan memprediksi dari model regresi Poisson dan ZIP ditunjukan pada rataan SAPR pada nilai dugaan y. Nilai ARB dan RRMSE terhadap penduga dan pada regresi Poisson dan ZIP menunjukkan bahwa semakin besar λ, n, dan p yang dicobakan, maka regresi ZIP lebih baik dibandingkan regresi Poisson. Rataan SAPR terhadap penduga y dari model regresi Poisson dan ZIP menunjukkan bahwa regresi ZIP lebih baik dibandingkan regresi Poisson di setiap λ, n, dan p yang dicobakan. Regresi ZIP lebih baik dibandingkan regresi Poisson dalam menanggulangi overdispersi akibat banyaknya nilai nol yang belebih pada peubah Y. Hasil evaluasi pendugaan model

24

regresi Poisson dan ZIP sesuai dengan hasil dari pengujian overdispersi, eksplorasi dan pengujian terhadap peubah Y.

Kajian Terapan Eksplorasi terhadap peubah Y

Data terapan yang digunakan merupakan data mahasiswa pascasarjana Institut Pertanian Bogor (IPB) yang berhenti studi. Tujuan digunakan data ini untuk membandingkan analisis regresi Poisson dan ZIP berdasarkan cara mengidentifikasi adanya overdispersi akibat nilai nol yang berlebih pada peubah Y. Nilai nol pada peubah Y mengartikan bahwa jumlah mahasiswa pascasarjana IPB yang tidak berhenti studi di setiap program studi pada tiap tahunnya. Data pada mahasiswa pascasarjana IPB yang berhenti studi disebabkan oleh mahasiswa mengundurkan diri, habis masa studi, dan indeks prestasi kumulatif (IPK) kurang dari sama dengan 3.00.

Mahasiswa pascasarjana IPB berhenti studi sebagian besar disebabkan karena IPK yang kurang dari 3.00, sehingga dalam penelitian ini yang akan dikaji lebih lanjut adalah mahasiswa pascasarjana IPB yang berhenti studi karena IPK kurang dari 3.00. Kasus ini sudah diteliti oleh Jajuli (2013) dengan menggunakan sembilan peubah X untuk mengkaji faktor-faktor yang mempengaruhi mahasiswa pascasarjana IPB berhenti studi. Kajian terapan dalam penelitian ini ingin menerapkan cara analisis data untuk mengkaji overdispersi pada regresi Poisson dan ZIP. Tabel 11 menunjukkan persentase mahasiswa pascasarjana IPB yang berhenti studi dari tahun 2007–2010. Besaran persentasenya berada di atas 2% yang berarti setiap tahun ada mahasiswa pascasarjana IPB berhenti studi. Keadaan ini mengindikasikan kejadian yang jarang terjadi pada setiap tahunnya di IPB.

Tabel 11 Persentase mahasiswa pascasarjana IPB yang berhenti studi

Tahun Jumlah

mahasiswa

Jumlah berhenti studi

Persentase berhenti studi (%) 2007 721 18 2.50 2008 692 19 2.75 2009 724 19 2.62 2010 783 21 2.68

Jumlah mahasiswa pascasarjana IPB yang berhenti studi mengacu pada kejadian yang menyebar Poisson. Sebaran Poisson merupakan jumlah kejadian yang jarang terjadi pada selang waktu tertentu. Indikasi adanya sebaran Poisson pada peubah Y ditunjukan dengan histogram pada Gambar 3. Histogram menunjukkan bahwa peubah Y memiliki nilai nol yang cukup besar. Peluang munculnya nilai nol pada peubah Y sebesar 0.819 terhadap jumlah mahasiswa yang tidak berhenti studi pada semua program studi di IPB pada tahun 2007-2010. Indikasi adanya peluang munculnya nilai nol yang berlebih dan peubah Y tidak menyebar Poisson. Hasil ini diperkuat dengan nilai rataan dari peubah Y sebesar 0.261 dan nilai ragamnya adalah 0.411. Eksplorasi ini membutuhkan pengujian terhadap peubah Y untuk membuktikan adanya indikasi tersebut.

25

Pengujian terhadap peubah Y

Tahun 2007-2010 menunjukkan bahwa hanya terdapat 17% program studi yang memiliki kejadian mahasiswanya berhenti studi, sedangkan sisanya 83% program studi memiliki kejadian mahasiswa tetap melanjutkan studi sampai lulus. Hasil eksplorasi pada peubah Y menunjukkan adanya indikasi jumlah nilai nol yang berlebih pada data mahasiswa pascasarjana IPB yang berhenti studi di tahun 2007–2010. Uji skor digunakan untuk mengetahui bahwa peubah Y memiliki peluang nol berlebih atau tidak. Hipotesis yang diuji adalah

H0 μ ω = 0 dan H1μ ω > 0

Statistik uji akan mendekati sebaran dengan derajat bebas 1 di bawah kondisi H0 benar, sehingga keputusannya adalah menolak H0 pada α, jika

. Nilai dari sebesar 27.092, dengan α=0.05, serta =3.841, sehingga keputusan dari hasil uji skor adalah tolak H0. Penolakan H0 berarti bahwa peluang nol pada peubah respon berlebih, sehingga kondisi ini yang mengakibatkan adanya overdispersi pada α sebesar 0.05.

Hasil dari uji skor sesuai dengan hasil eksplorasi pada histogram pada peubah Y. Eksplorasi dari kondisi sebaran Poisson menunjukkan ada indikasi tidak menyebar Poisson. Oleh karena itu, dilakukan uji khi-kuadrat untuk sebaran Poisson dan ZIP pada peubah Y, hipotesis yang diuji adalah

H0 : = dan H1: ≠

Statistik uji untuk sebaran Poisson dan ZIP akan mendekati sebaran dengan derajat bebas (m-p-1) di bawah kondisi H0 benar, jika . Nilai dari untuk sebaran Poisson sebesar 51.745, untuk sebaran ZIP sebesar 346.035. Nilai titik kritis untuk 5 kategori dan α=0.05, naka sebesar 7.815, sehingga keputusan dari hasil uji khi-kuadrat untuk sebaran Poisson dan ZIP adalah tolak H0. Penolakan H0 menyatakan bahwa jumlah kejadian mahasiswa pascasarjana IPB yang berhenti studi pada masing-masing program studi tidak menyebar Poisson dan ZIP pada α sebesar 0.05.

Pemilihan sebaran Poisson atau ZIP dapat ditunjukkan dengan statistik uji yang bernilai lebih kecil, sehingga peubah Y mendekati sebaran Poisson. Nilai

Gambar 3 Histogram pada peubah Y

Fre k u en si y

26

p yang muncul pada peubah Y sebesar 0.8, sehingga terjadi penyimpangan pada sebaran Poisson akibat berlebihnya nilai nol. Peubah Y mendekati sebaran Poisson dengan berlebihnya nilai nol, sehingga sebaiknya menggunakan regresi ZIP. Oleh karena itu, uji khi-kuadrat terhadap kondisi sebaran peubah Y tidak hanya sebagai penentu untuk menggunakan regresi Poisson, tetapi juga perlu diperhatikan penyimpangan yang terjadi dan menggunakan regresi ZIP sebagai penaganan model. Karakteristik yang didapatkan pada data terapan berdasarkan eksplorasi terhadap peubah Y yaitu rataan atau ̂ bernilai 0.261 0.3, dengan p bernilai 0.819 0.8, dan n berjumlah 249. Selanjutnya, peubah Y dan peubah X1, X2, X3, X4, X5, X6, X7, X8 dianalisis dengan regresi Poisson dan ZIP.

Regresi Poisson

Analisis regresi Poisson digunakan untuk mengevaluasi hubungan antara peubah X dengan peubah Y yang menyebar Poisson. Pendugaan model regresi Poisson pada peubah X1, X2, X3, X4, X5, X6, X7, X8 dengan Y ditunjukan pada Tabel 12. Di bawah kondisi H0 benar, statistik uji akan mendekati sebaran dengan derajat bebas 1, sehingga keputusannya adalah menolak H0pada α sebesar 0.05, jika dengan nilai dari = 3.841. Penolakan H0 pada peubah X1 terhadap peubah Y mengartikan bahwa persentase mahasiswa yang berasal dari PTN memiliki pengaruh yang signifikan terhadap jumlah kejadian mahasiswa pascasarjana IPB yang berhenti studi pada masing-masing program studi dengan α

sebesar 0.05.

Tabel 12 Pendugaan model regresi Poisson

Peubah Derajat bebas Dugaan Keputusan

Intercept 1 -1.052 0.055 Terima H0

% Status PTN Asal 1 -0.022 8.468 Tolak H0

Rata-rata IPK S1 1 1.247 1.388 Terima H0

% Linieritas sub rumpun 1 0.003 0.340 Terima H0

% Mahasiswa menikah 1 0.003 0.182 Terima H0

% Mahasiswa beasiswa 1 -0.010 3.161 Terima H0

% Mahasiswa laki-laki 1 -0.009 3.066 Terima H0

Rata-rata usia 1 -0.052 0.624 Terima H0

% Mahasiswa bekerja 1 -0.001 0.094 Terima H0

Model regresi Poisson pada peubah X1, X2, X3, X4, X5, X6, X7, X8 dengan Y yaitu sebagai berikut

Sehingga penduga y pada regresi Poisson adalah

̂

Interpretasi dari model regresi Poisson untuk peubah status PTN asal yang signifikan terhadap peubah Y, yaitu setiap kenaikan 1% mahasiswa yang berasal

27 dari PTN, maka akan menyebabkan penurunan rataan jumlah kejadian mahasiswa pascasarjana IPB yang berhenti studi pada masing-masing program studi sebesar e(-0.022) = 0.978 ≈ 1.

Regresi Poisson memiliki kebaikan model yang ditunjukan dengan uji Pearson khi-kuadrat. Hasil dari uji Pearson khi-kuadrat terhadap karakteristik data terapan ̂ =0.3, n=249, dan p=0.8 pada peubah Y ditunjukan dengan hipotesis sebagai berikut

H0 μ τ = 1 dan H1μ τ > 1

Statistik uji akan mendekati sebaran dengan derajat bebas (n-k) yaitu 240 di bawah kondisi H0 benar, sehingga keputusannya adalah menolak H0 pada α, jika

nilai peluang dari lebih besar dari taraf nyata α= 0.05. Nilai peluang dari sebesar 0.001 sehingga keputusan dari hasil uji Pearson khi-kuadrat adalah tolak H0. Penolakan H0 berarti bahwa peubah Y terjadi overdipersi pada α sebesar 0.05. Hasil dari Pearson khi-kuadrat diperkuat dengan rasio τ sebesar 1.342.

Regresi ZIP

Analisis regresi ZIP merupakan analisis yang mengevaluasi hubungan antara peubah X dengan peubah Y yang menyebar ZIP. Sebaran ZIP diakibatkan oleh meningkatnya nilai nol pada sebaran Poisson. Model pada regresi ZIP terdiri dari dua komponen model yaitu model data diskret untuk λ dan model zero-inflation untuk p yang ditunjukan pada Tabel 13, yaitu sebagai berikut

Tabel 13 Model data diskret untuk λ dan model zero-inflation untuk p pada regresi ZIP

Peubah Derajat bebas Dugaan Keputusan

Model data diskret untuk λ

Dokumen terkait