• Tidak ada hasil yang ditemukan

Kajian Overdispersi pada Regresi Poisson dan Zero-Inflated Poisson untuk Beberapa Karakteristik Data

N/A
N/A
Protected

Academic year: 2017

Membagikan "Kajian Overdispersi pada Regresi Poisson dan Zero-Inflated Poisson untuk Beberapa Karakteristik Data"

Copied!
63
0
0

Teks penuh

(1)

KAJIAN OVERDISPERSI PADA REGRESI POISSON

DAN

ZERO-INFLATED

POISSON UNTUK BEBERAPA

KARAKTERISTIK DATA

LILI PUSPITA RAHAYU

SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR

(2)
(3)

PERNYATAAN MENGENAI TESIS DAN

SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA*

Dengan ini saya menyatakan bahwa tesis berjudul Kajian Overdispersi pada Regresi Poisson dan Zero-Inflated Poisson untuk Beberapa Karakteristik Data adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir tesis ini.

Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor.

(4)

RINGKASAN

LILI PUSPITA RAHAYU. Kajian Overdispersi pada Regresi Poisson dan Zero-Inflated Poisson untuk Beberapa Karakteristik Data. Dibimbing oleh KUSMAN SADIK dan INDAHWATI.

Analisis regresi poisson menunjukkan hubungan antara peubah penjelas (X) dengan peubah respon (Y) yang menyebar Poisson. Regresi Poisson memiliki asumsi equidispersi, yaitu kondisi dimana nilai rataan dan ragam pada peubah Y bernilai sama. Penyimpangan asumsi yang sering terjadi pada regresi Poisson yaitu overdispersi. Kondisi overdispersi yaitu nilai ragam lebih besar dari pada nilai rataan pada peubah Y. Penyebab dari overdispersi yang sering terjadi dalam regresi Poisson adalah peluang nilai nol yang berlebih pada peubah Y. Salah satu akibatnya adalah simpangan baku dari penduga parameter menjadi berbias ke bawah dan signifikansi dari peubah penjelas menjadi berbias ke atas, sehingga menghasilkan kesimpulan yang tidak valid (Ismail dan Jemain 2007). Ridout et al. (1998) menyatakan bahwa penanganan model yang dapat digunakan untuk mengatasi masalah overdispersi pada regresi Poisson adalah Regresi ZIP. Lambert (1992) mengemukakan keunggulan dari regresi ZIP adalah sangat mudah diterapkan pada beberapa bidang dan mudah diinterpretasi penduga parameternya. Penelitian yang telah dilakukan sebelumnya dimulai dengan mengembangkan model regresi ZIP sebagai solusi penanganan overdispersi dari model regresi Poisson di bidang industri pada bagian pengendalian mutu oleh Lambert (1992). Kemudian, Numna (2009) mengembangkan uji Wald untuk membandingkan model regresi Poisson dan ZIP. Pengembangan uji Wald dilakukan secara simulasi dengan penentuan peluang nol pada peubah Y yang ditetapkan berdasarkan nilai parameter dari sebaran Poisson. Perkembangan penelitian yang telah dilakukan sebelumnya membuat peneliti mengembangkan kajian overdispersi pada beberapa karakteristik data untuk regresi Poisson dan ZIP. Kajian overdispersi pada regresi Poisson dan ZIP dilakukan dengan data simulasi dan data terapan. Penelitian ini bertujuan membandingkan regresi Poisson dan ZIP berdasarkan pengujian overdispersi dan evaluasi pendugaan parameter terhadap nilai parameter dari sebaran Poisson, peluang nol, serta ukuran contoh dari data simulasi. Selanjutnya, regresi Poisson dan ZIP diterapkan untuk mengkaji overdispersi pada data terapan.

Data simulasi dibangkitkan berdasarkan karakteristik data berupa lambda (λ) yang dimulai dari λ=0.6, 0.8, 1, 6, 8, 10, dan 20, peluang munculnya nilai nol (p) yaitu p=0.1, 0.3, 0.5, dan 0.7, serta ukuran contoh (n) yaitu n=100, 300, 500. Data yang dibangkitkan berguna untuk mendapatkan penduga koefisien parameter regresi Poisson dan ZIP dengan banyanya ulangan (r) sebanyak 500 kali. Koefisien parameter regresi yang telah ditentukan yaitu 0=3, dan 1=0.01.

Peubah X yang dibangkitkan merupakan peubah acak yang menyebar normal

( ,1). Peubah X diasumsikan sebagai peubah tetap. Membangkitkan peubah X dan

Y pada kajian simulasi dilakukan dengan dua tahap.

Data terapan yang digunakan merupakan data tentang faktor-faktor yang mempengaruhi mahasiswa pascasarjana IPB berhenti studi. Peubah yang digunakan adalah peubah X1, X2, X3, X4, X5, X6, X7, X8 dengan Y pada ukuran

(5)

2007–2010. Peubah Y pada data terapan menunjukkan jumlah kejadian mahasiswa pascasarjana IPB yang berhenti studi pada masing-masing program studi dari tahun 2007–2010. Data pada peubah X1, X2, X3, X4, X5, X6, X7, X8

berupa persentase dan rata-rata pada masing-masing program studi.

Kajian overdispersi terhadap data simulasi dari kombinasi λ, n, p yang dicobakan menunjukkan bahwa semakin besar λ, n, dan p maka uji skor menghasilkan peluang nol berlebih yang semakin besar dan uji khi-kuadrat menghasilkan persentase sebaran Poisson yang semakin kecil. Hasil perbandingan menunjukan bahwa regresi ZIP lebih baik dibandingkan regresi Poisson berdasarkan rasio dispersi dan persentase overdispersi, nilai ARB, dan RRMSE terhadap dan , serta rataan SAPR terhadap penduga y seiring semakin besar λ, n, dan p yang dicobakan. Kajian overdispersi terhadap data terapan menyatakan bahwa karakteristik data ̂ =0.3, n=249, dan p=0.8 dengan menggunakan regresi ZIP lebih baik dari pada regresi Poisson. Faktor yang mempengaruhi mahasiswa pascasarjana IPB berhenti studi adalah status perguruan tinggi negeri asal, sedangkan faktor yang mempengaruhi mahasiswa pascasarjana IPB tidak berhenti studi adalah mahasiswa penerima beasiswa.

(6)

SUMMARY

LILI PUSPITA RAHAYU. Overdispersion Study of Poisson and Zero-Inflated Poisson Regression for Some Charactersitics of The Data. Supervised by KUSMAN SADIK and INDAHWATI.

Poisson regression analysis show a relationship between explanatory variables (X) with response variable (Y) that spread Poisson. Poisson regression has equidispersion assumptions, a condition in which mean and variance of response variable has equal value. Deviation of assumptions that often occurs in the Poisson regression is overdispersion. Overdispersion is variance greater than mean of variable Y. Cause of overdispersion that often occur in Poisson regression is excess zero probability value on variable Y. One result was the standard deviation of parameter estimates to be underestimate and the significance of variables X to be overstate, resulting invalid conclusions (Ismail and Jemain 2007). Ridout et al. (1998) stated that solving model that be used to overcome of overdispersion on Poisson regression is ZIP regression. Lambert (1992) suggested superiority of ZIP regression were very easy to implemented in some areas and ZIP regression models easier to interprets parameter estimates.

Research had been done previously started by developing a ZIP regression model as solving overdispersion solution of Poisson regression model in quality control of industry by Lambert (1992). Numna (2009) developed a Wald test for comparison of Poisson and ZIP regression models which conducted on simulations by determining the zero probability on variable Y based on the value of parameter Poisson distribution. The development of research previously made researchers develop overdispersion study on some characteristics of the data for Poisson and ZIP regression. Overdispersion study on Poisson and ZIP regression conducted by simulated data and applied data. This study aimed to compare Poisson and ZIP regression based on testing of overdispersion and evaluation parameter estimation of the value of parameter Poisson distribution, zero probability, and sample size of simulated data. Furthermore, the Poisson and ZIP regression apllied to study of overdispersion on applied data.

Simulated data were generated based on the characteristics of the data are lambda (λ) starting from λ=0.6, 0.8, 1, 6, 8, 10, and 20, the zero probability (p) are p=0.1, 0.3, 0.5, and 0.7, and sample size (n) are n=100, 300, 500. The data were generated useful to obtain coefficients of parameter estimation of Poisson and ZIP regression with replication (r) 500 times. The coefficient of the regression parameters have determined were 0=3, and 1=0.01. Variable X which is a

random variable spread normal ( ,1). Variable X is assumed as a fixed variable. Generating variables X and Y on simulation study carried out in two stages.

Applied data which used is the data about factors that affect IPB postgraduate students stopped study. The variables were X1, X2, X3, X4, X5, X6,

X7, X8 and Y in the sample size n=249 from 2007-2010. Thus, the variable Y in

applied data showed the number of events that IPB postgraduate students stopped study in each majors 2007-2010. Data on variables X1, X2, X3, X4, X5, X6, X7, X8

are the percentage and average on each majors.

(7)

probability are greater and the chi-squared test produces Poisson distribution percentage is getting smaller. The comparison shows that the ZIP regression is better than Poisson regression based dispersion ratio and percentage of overdispersion, ARB and RRMSE values of and , and the average of SAPR to estimation y with the greater λ, n, and p are tested. Overdispersion study of applied data shows that characteristics of data ̂= 0.3, n=249, and p=0.8 using ZIP regression would be better than Poisson regression. The factor that affect IPB postgraduate students stopped study were the percentage of college country status of origin, while the factor that affect IPB postgraduate students did not stop study were percentage of scholarship recipients students.

(8)

© Hak Cipta Milik IPB, Tahun 2014

Hak Cipta Dilindungi Undang-Undang

Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan atau menyebutkan sumbernya. Pengutipan hanya untuk kepentingan pendidikan, penelitian, penulisan karya ilmiah, penyusunan laporan, penulisan kritik, atau tinjauan suatu masalah; dan pengutipan tersebut tidak merugikan kepentingan IPB

(9)

Tesis

sebagai salah satu syarat untuk memperoleh gelar Magister Sains

pada

Program Studi Statistika

KAJIAN OVERDISPERSI PADA REGRESI POISSON

DAN

ZERO-INFLATED

POISSON UNTUK BEBERAPA

KARAKTERISTIK DATA

SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR

BOGOR 2014

(10)
(11)

Judul Tesis : Kajian Overdispersi pada Regresi Poisson dan Zero-Inflated Poisson untuk Beberapa Karakteristik Data

Nama : Lili Puspita Rahayu NIM : G151110141

Disetujui oleh Komisi Pembimbing

Dr. Ir. Kusman Sadik, M.Si Ketua

Dr. Ir. Indahwati, M.Si Anggota

Diketahui oleh

Ketua Program Studi Statistika

Dr. Ir. Anik Djuraidah, MS

Dekan Sekolah Pascasarjana

Dr. Ir. Dahrul Syah, M.Sc.Agr

(12)

PRAKATA

Puji dan syukur kehadirat Allah SWT yang telah melimpahkan rahmat dan hidayah-Nya, sehingga penulis dapat menyelesaikan tesis yang berjudul “Kajian Overdispersi pada Regresi Poisson dan Zero-Inflated Poisson untuk Beberapa Karakteristik Data”. Keberhasilan penulisan tesis ini tidak lepas dari bantuan, bimbingan, dan petunjuk dari berbagai pihak.

Terima kasih penulis sampaikan kepada Bapak Dr. Ir. Kusman Sadik, M.Si selaku pembimbing I, Ibu Dr. Ir. Indahwati, M.Si selaku pembimbing II, Ibu Dr. Ir. Anik Djuraidah, MS selaku ketua Program Studi Statistika, dan Bapak Dr. Ir. Budi Susetyo, MS selaku penguji tesis, terima kasih atas bimbingan, arahan, saran, dan waktunya. Disamping itu penulis juga mengucapkan terima kasih kepada seluruh staf Program Studi Statistika.

Ungkapkan terima kasih terkhusus penulis sampaikan kepada Bapak (Suyono, S.Pd), ibu (Emiyati, S.Pd), dan adik (Ardian Cahyadi, S.Pd dan Aji Satria) serta seluruh keluarga atas do’a, dukungan dan kasih sayangnya. Terima kasih pula kepada teman-teman Statistika (S1, S2 dan S3), Statistika Terapan (S2), dan sahabat atas bantuan serta kebersamaannya. Semoga karya ilmiah ini dapat menambah wawasan dan bermanfaat.

(13)

DAFTAR ISI

DAFTAR TABEL vi

DAFTAR GAMBAR vi

DAFTAR LAMPIRAN vi

PENDAHULUAN 1

Latar Belakang 1

Tujuan Penelitian 2

Manfaat Penelitian 2

Ruang Lingkup Penelitian 2

TINJAUAN PUSTAKA 3

Regresi Poisson 3

Regresi ZIP 4

Identifikasi terhadap Peluang Nol Berlebih pada Peubah Respon 6

Uji Wald pada Regresi Poisson dan ZIP 7

Uji Pearson Khi-Kuadrat pada Regresi Poisson dan ZIP 8 Evaluasi Penduga Parameter Regresi Poisson dan ZIP 9

METODE 10

Data 10

Metode Analisis 11

HASIL DAN PEMBAHASAN 12

Kajian Simulasi 13

Kajian Terapan 24

KESIMPULAN DAN SARAN 30

DAFTAR PUSTAKA 31

LAMPIRAN 32

(14)

DAFTAR TABEL

1 Peubah-peubah dalam data terapan 11

2 Persentase uji skor terhadap kombinasi λ, n, p 15

3 Persentase uji khi-kuadrat terhadap kombinasi λ, n, p 16

4 Rasio dispersi terhadap regresi Poisson dan ZIP 17

5 Persentase overdispersi pada regresi Poisson dan ZIP 18

6 Nilai ARB (%) terhadap pada regresi Poisson dan ZIP 19

7 Nilai ARB (%) terhadap pada regresi Poisson dan ZIP 20

8 Nilai RRMSE (%) terhadap pada regresi Poisson dan ZIP 21

9 Nilai RRMSE (%) terhadap pada regresi Poisson dan ZIP 22

10 Nilai SAPR terhadap penduga y pada regresi Poisson dan ZIP 23

11 Persentase mahasiswa pascasarjana IPB yang berhenti studi 24

12 Pendugaan model regresi Poisson 26

13 Model data diskret untuk λ dan model zero-inflation untuk p pada regresi ZIP 27

DAFTAR GAMBAR 1 Histogram terhadap peubah Y pada =1, n=300 dengan (a) p=0.1, (b) p=0.3, (c) p=0.5, (d) p=0.7 13

2 Histogram terhadap peubah Y pada =10, n=300 dengan (a) p=0.1, (b) p=0.3, (c) p=0.5, (d) p=0.7 14

3 Histogram pada peubah Y 25

4 Plot Pearson residual terhadap regresi Poisson dan ZIP 29

DAFTAR LAMPIRAN 1 Kondisi simulasi terhadap kombinasi λ, n, p 32

2 Tabulasi data terapan 33

3 Daftar nama program studi pascasarjana S2 IPB beserta sub rumpun ilmu 34

4 Diagram alur penelitian pada kajian simulasi 36

5 Diagram alur penelitian pada kajian terapan 37

6 Sintaks pemograman untuk kajian simulasi pada regresi Poisson dan ZIP 38

7 Sintaks pemograman untuk kajian terapan pada regresi Poisson dan ZIP 41

8 Grafik hubugan peubah Y dengan X pada kombinasi λ, n, dan p 44

9 Grafik Pearson residual terhadap regresi Poisson dan ZIP pada kombinasi λ, n, dan p 46

(15)

PENDAHULUAN

Latar Belakang

Sebaran Poisson merupakan salah satu dari beberapa sebaran diskret yang menyatakan jumlah kejadian yang terjadi selama suatu selang waktu atau daerah tertentu (Cameron dan Trivedi 1998). Data yang diperoleh berupa cacahan dengan bilangan bulat tak negatif. Salah satu bentuk analisis yang digunakan untuk memodelkan data cacah adalah regresi Poisson. Analisis regresi Poisson menunjukkan hubungan antara peubah penjelas dengan peubah respon yang menyebar Poisson. Karakteristik dari sebaran Poisson yaitu nilai rataan dan ragamnya bernilai sama atau equdispersi. Karakteristik tersebut jarang terjadi pada data terapan, dengan kata lain sering terjadi penyimpangan berupa overdispersi atau underdispersi. Overdispersi yaitu nilai ragam lebih besar dari pada nilai rataan, sedangkan underdispersi yaitu nilai ragam lebih kecil dari nilai rataan pada peubah respon. Penerapan regresi Poisson pada kejadian underdispersi jarang terjadi, hal ini dikarenakan pada data terapan sering terdapat keragaman yang besar dari peubah respon (Jansakul dan Hinde 2002).

Masalah yang sering dihadapi dalam regresi Poisson adalah overdispersi. Kondisi ini disebabkan peubah penjelas yang tidak dapat dijelaskan dalam model, sehingga masih dimungkinkan adanya keragaman tinggi dari peubah respon yang disebabkan oleh peubah lain. Penyebab dari overdispersi yang sering terjadi dalam regresi Poisson adalah peluang nol yang berlebih pada peubah respon. Salah satu akibatnya adalah simpangan baku dari penduga parameter menjadi berbias ke bawah dan signifikansi dari peubah penjelas menjadi berbias ke atas, sehingga menghasilkan kesimpulan yang tidak valid (Ismail dan Jemain 2007).

Ridout et al. (1998) menyatakan bahwa penanganan model yang dapat digunakan untuk mengatasi masalah overdispersi akibat peluang nol yang berlebih pada peubah respon dalam regresi Poisson antara lain model regresi hurdle Poisson dan zero-inflated Poisson (ZIP). Lambert (1992) mengemukakan keunggulan dari regresi ZIP adalah sangat mudah diterapkan pada beberapa bidang seperti pertanian, peternakan, biostatistika, dan industri. Selain itu, model regresi ZIP mudah diinterpretasi penduga parameternya, dan dapat menjelaskan alasan terjadinya overdispersi pada peubah respon, sehingga pada penelitian ini akan dikaji mengenai regresi ZIP.

(16)

2

simulasi dengan penentuan peluang nilai nol pada peubah respon yang ditetapkan berdasarkan nilai parameter dari sebaran Poisson.

Penelitian ini akan dikembangkan kajian overdispersi pada beberapa karakteristik data untuk regresi Poisson dan ZIP. Overdispersi dikaji berdasarkan eksplorasi dan pengujian terhadap peubah respon, serta perbandingan model regresi Poisson dan ZIP. Kajian overdispersi pada regresi Poisson dan ZIP dilakukan dengan data simulasi dan data terapan. Data simulasi berupa kombinasi dari nilai parameter sebaran Poisson, peluang nol, dan ukuran contoh pada peubah respon. Selanjutnya, data terapan yang digunakan adalah data mahasiswa pascasarjana Institut Pertanian Bogor (IPB) yang berhenti studi dari tahun 2007-2010.

Tujuan Penelitian Tujuan penelitian ini adalah

1. Memeriksa kondisi overdispersi dan sebaran Poisson dengan eksplorasi dan pengujian terhadap nilai parameter dari sebaran Poisson, peluang munculnya nilai nol, serta ukuran contoh pada peubah respon dari data simulasi dan data terapan.

2. Membandingkan model regresi Poisson dan Zero Inflated Poisson berdasarkan pengujian overdispersi dan evaluasi pendugaan parameter terhadap nilai parameter dari sebaran Poisson, peluang nol, serta ukuran contoh pada data simulasi.

3. Menerapkan dan membandingkan regresi Poisson dan ZIP pada data terapan berdasarkan eksplorasi dan pengujian terhadap peubah respon, pengujian overdispersi, serta evaluasi pendugaan parameter.

Manfaat Penelitian Penelitian ini bermanfaat dalam

1. Kajian simulasi untuk membuktikan regresi ZIP sebagai solusi atas terjadinya overdispersi pada regresi Poisson berdasarkan kombinasi nilai parameter dari sebaran Poisson, peluang munculnya nilai nol, dan ukuran contoh.

2. Kajian terapan untuk menerapkan regresi Poisson dan ZIP pada data terapan.

Ruang Lingkup Penelitian

(17)

3

TINJAUAN PUSTAKA

Regresi Poisson

Cameron dan Trivedi (1998) menyatakan bahwa model regresi Poisson digunakan sebagai pendekatan untuk analisis data cacah dan tergantung pada asumsi munculnya data cacah tersebut. Ada dua keadaan formulasi yang sering terjadi pada asumsi munculnya data cacah. Formulasi pertama, yaitu data cacah berasal dari pengamatan langsung dari sebuah proses titik. Formulasi kedua, yaitu data cacah berasal dari diskretisasi atau ordinalisasi pada data laten kontinu. Formulasi lainnya, yaitu data cacah berasal dari kejadian yang jarang terjadi atau pendekatan sebaran binomial terhadap Poisson.

Model regresi Poisson merupakan model regresi nonlinier yang berasal dari sebaran Poisson. Misalkan nilai yi dengan i=1,2,.., n, melambangkan jumlah

kejadian yang terjadi dalam satu periode dengan nilai parameter dari sebaran Poisson λ. Penelitian ini menganggap bahwa setiap amatan memiliki parameter dari sebaran Poisson yang sama di regresi Poisson. Peubah y merupakan peubah acak yang menyebar Poisson dengan fungsi massa peluang sebagai berikut

dengan asumsi pada regresi Poisson yaitu

Metode untuk menduga koefisien parameter regresi Poisson yaitu metode kemungkinan maksimum. Fungsi log kemungkinan yang dinotasikan dengan pada persamaan 2.1 digunakan untuk mempermudah perhitungan dalam menduga koefisien parameter regresi Poisson. Memaksimumkan fungsi log kemungkinan akan memberikan hasil yang sama dengan memaksimumkan fungsi kemungkinannya.

(2.1)

Model pada persamaan 2.2 merupakan model regresi Poisson dengan fungsi penghubung untuk sebaran Poisson adalah log. ̂ adalah penduga respon dari model regresi Poisson dengan ukuran n x 1, adalah koefisien penduga parameter regresi Poisson dengan ukuran vektor (j + 1) x 1, dan X adalah peubah penjelas dengan ukuran matriks n x (j + 1), dengan j adalah banyaknya parameter yang diduga.

( ̂)

(18)

4

Metode iterasi yang digunakan untuk menduga koefisien parameter regresi Poisson adalah iterative reweighted least square (IRWLS) dengan persamaan sebagai berikut:

(2.3)

Persamaan pada 2.3 menjelaskan bahwa adalah matriks pembobot dengan ukuran n x n dan adalah vektor peubah respon dengan ukuran n x 1.

Karakteristik dari sebaran Poisson yaitu nilai rataan dan ragam pada peubah Y bernilai sama. Namun, kondisi yang sering terjadi adalah nilai ragam lebih besar dari rataan atau overdispersi. Hardin dan Hilbe (2007) menyatakan bahwa overdispersi terjadi karena adanya sumber keragaman yang tidak teramati pada data atau adanya pengaruh peubah lain yang mengakibatkan peluang suatu kejadian bergantung pada kejadian sebelumnya. Selain itu, overdispersi dapat juga terjadi karena adanya pencilan pada data dan kesalahan spesifikasi fungsi penghubung. Penyebab lain dari overdispersi yang sering terjadi dalam regresi Poisson adalah peluang nilai nol yang berlebih pada peubah respon.

Apabila regresi Poisson digunakan untuk kondisi overdispersi, maka terjadi keragaman data yang terdapat pada peubah respon (Y). Keragaman data ditunjukan dengan adanya rasio dispersi (τ), yaitu

Dispersi adalah ukuran penyebaran suatu kelompok data terhadap nilai tengah data. Nilai dispersi kecil menunjukkan ragam yang homogen pada data, sedangkan nilai dispersi besar menunjukkan keheterogenan pada data. Overdispersi diidentifikasi dengan rasio τ bernilai lebih dari satu dan bersifat konstan. Penanganan model yang digunakan untuk mengatasi masalah overdispersi akibat peluang nilai nol yang berlebih pada peubah respon salah satunya adalah regresi ZIP.

Regresi ZIP

Jansakul dan Hinde (2002) menyatakan bahwa jika Y adalah peubah acak bebas yang memiliki sebaran ZIP, kemudian nilai nol diasumsikan muncul dari dua tahap yang bersamaan. Tahap pertama terjadi pada peluang yang hanya menghasilkan amatan bernilai nol dilambangkan dengan Tahap kedua terjadi pada peluang yang menghasilkan data cacah menyebar Poisson dengan parameter

dilambangkan . Pada umumnya, nilai nol dari tahap pertama disebut structural zeros, dan nilai nol dari tahap kedua disebut sampling zeros. Penelitian ini mengganggap setiap amatan memiliki peluang nol dan parameter dari sebaran Poisson yang sama di regresi ZIP. Proses dua tahap tersebut memberikan sebaran campuran yang sederhana dengan fungsi masa peluang sebagai berikut

{

(19)

5 dengan . Perhitungan sederhana menunjukkan bahwa

dan

(2.5)

Persamaan 2.4 mengindikasikan bahwa sebaran marginal dari Y mengalami overdispersi jika . Overdispersi akan mereduksi menjadi model regresi Poisson ketika . Nilai menjelaskan bahwa terdapat peningkatan nilai nol pada peubah respon. Regresi ZIP mampu mengatasi overdispersi, hal ini karena nilai rataan dan ragam pada sebaran ZIP tidak bernilai sama. Nilai ragam peubah respon pada sebaran ZIP lebih besar dibandingkan nilai rataan. Kondisi ini terlihat pada persamaan 2.5.

Metode untuk menduga koefisien parameter regresi ZIP yaitu metode kemungkinan maksimum. Fungsi log kemungkinan terhadap pengamatan pada model regresi ZIP digunakan untuk mempermudah perhitungan dalam mendapatkan penduga koefisien parameter.

∑{ [ ]

} (2.6)

Persamaan 2.6 menjelaskan bahwa merupakan fungsi indikator untuk kejadian tertentu, misalkan bernilai 1 jika kejadian benar dan bernilai 0 untuk lainnya. Model dari regresi ZIP dibagi menjadi dua komponen model yaitu model data diskret untuk λ dan model zero-inflation untuk p.

( ̂)

Peubah penjelas yang digunakan dalam model ln dapat bernilai sama atau berbeda dengan peubah penjelas yang digunakan dalam model logit. Jika peubah penjelas yang digunakan dalam model ln dan model logit bernilai sama, maka model regresi ZIP menjadi

( ̂) ( )

(20)

6

Poisson dan ZIP tidak dapat dilakukan secara langsung. Fungsi tidak linier dalam parameter yang ingin diduga, sehingga dibutuhkn metode numerik Newton-Raphson untuk menyelesaikannya.

Kajian overdispersi pada regresi Poisson dan ZIP dilakukan dengan beberapa tahap pengujian. Tahap pertama yaitu mengidentifikasi peluang nol pada peubah Y dengan uji skor dan uji khi-kuadrat untuk sebaran Poisson dan ZIP. Tahap kedua yaitu melakukan analisis regresi Poisson dan ZIP dengan uji Wald. Tahap ketiga yaitu melakukan kebaikan model regresi Poisson dan ZIP dengan rasio dispersi dan uji khi-kuadrat. Tahap keempat atau tahap terakhir yaitu melakukan evaluasi terhadap penduga parameter dari model regresi Poisson dan ZIP, serta penduga y berdasarkan bias, ragam, dan residual.

Identifikasi terhadap Peluang Nilai Nol pada Peubah Respon

Cameron dan Trivedi (1998) menyatakan bahwa masalah utama dari overdispersi terdapat pada model dengan peubah respon diskret. Penyebab dari overdispersi yang sering terjadi adalah peluang nilai nol yang berlebih pada peubah respon. Kajian overdispersi ini membutuhkan identifikasi dengan melakukan uji skor dan uji khi-kuadrat terhadap peluang muncunya nilai nol pada peubah respon.

Uji skor

Xie et al. (2001) serta Jansakul dan Hinde (2002) menjelaskan uji skor bertujuan untuk mengetahui berlebih atau tidaknya peluang nol pada peubah respon. Uji skor digunakan dalam mengkaji model regresi ZIP sebagai solusi penanganan overdispersi dari model regresi Poisson. Hipotesis yang akan diuji adalah

H0 μ ω = 0 dan H1μ ω > 0 (2.7)

dengan ω adalah peluang nol pada peubah respon. Hipotesis nol pada persamaan

2.7 menjelaskan bahwa peluang nol pada peubah respon tidak berlebih sehingga tidak mengakibatkan adanya overdispersi, ataupun sebaliknya untuk interpretasi pada H1. Statistik uji skor didapatkan dengan aljabar matematika berdasarkan

penurunan fungsi log kemungkinan model regresi ZIP pada persamaan 2.6, sehingga didapatkan rumus sebagai berikut

̅

(2.8)

dengan n0 adalah banyaknya nilai nol, n adalah ukuran data, ̂ dengan

̂ merupakan penduga parameter Poisson di bawah kondisi H0 atau ̅, dan ̅

adalah nilai rataan dari peubah respon. Di bawah kondisi H0 benar, statistik uji

pada persamaan 2.8 akan mendekati sebaran khi-kuadrat ( dengan derajat bebas 1, sehingga keputusannya adalah menolak H0 pada taraf nyata (α), jika

. Penolakan H0 pada α berarti bahwa peluang nol berlebih pada peubah

(21)

7 Uji khi-kuadrat

Ricci (2005) menyatakan bahwa uji khi-kuadrat digunakan untuk menguji kecocokan sekumpulan data terhadap peluang sebaran tertentu. Uji khi-kuadrat digunakan untuk menguji kecocokan sekumpulan data terhadap peluang sebaran Poisson dan ZIP. Pada uji khi-kuadrat frekukensi aktual dalam kategori dibandingkan dengan frekuensi yang secara teoritis diharapkan terjadi, jika data mengikuti peluang sebaran Poisson dan ZIP. Hipotesis dari uji khi-kuadrat yaitu

H0 : = dan H1: ≠ (2.9)

dengan adalah peluang amatan untuk setiap kategori ke-l dan adalah peluang sebaran Poisson. Hipotesis nol pada persamaan 2.9 menjelaskan bahwa terdapat kecocokan antara peluang amatan dengan peluang sebaran Poisson, ataupun sebaliknya untuk interpretasi pada H1. Kemudian, statistik uji khi-kuadrat

merupakan selisih antara frekuensi yang diamati dengan frekuensi teoritis terhadap frekuensi teoritis dari peluang sebaran Poisson dan ZIP.

(2.10)

dengan adalah fungsi massa peluang dari sebaran Poisson dan ZIP, adalah frekuensi yang diamati untuk setiap kategori ke-l, n adalah ukuran contoh, dan m adalah jumlah kategori. Di bawah kondisi H0 benar, statistik uji pada

persamaan 2.10 akan mendekati sebaran dengan derajat bebas (m-p), dan p adalah jumlah parameter diduga oleh data contoh atau ̂= ̅ sehingga penduga parameternya berjumlah 1. Dengan demikian keputusannya adalah menolak H0

pada α, jika . Penolakan H0 pada α berarti bahwa tidak terdapat

kecocokan antara peluang amatan dengan peluang sebaran Poisson atau peubah respon tidak menyebar Poisson atau tidak menyebar ZIP.

Uji Wald pada Regresi Poisson dan ZIP

Agresti A (2007) menyatakan bahwa uji Wald digunakan untuk mengetahui peubah penjelas yang berpengaruh terhadap peubah respon. Uji Wald diterapkan pada model regresi Poisson dan ZIP. Hipotesis untuk menguji signifikansi dari koefisien parameter regresi Poisson dan ZIP, misalkan  , pada persamaan 2.11 adalah

H0 :  dan H1:  (2.11)

Selang kepercayaan pada uji Wald untuk  yaitu ̂ ± 1.96 ̂ , dengan statistik uji yang digunakan pada persamaan 2.12 adalah

̂

(22)

8

Statistik uji Wald pada persamaan 2.12 mendekati sebaran normal baku ketika

. Keadaan ini setara dengan yang mendekati sebaran khi-kuadrat dengan derajat bebas 1, sehingga statistik uji Wald yang digunakan terdapat pada persamaan 2.13, yaitu

̂

̂ (2.13)

dengan ̂ adalah koefisien penduga parameter  dan ̂ adalah penduga galat baku dari penduga koefisien parameter  yang diperoleh dari matriks penduga ragam peragam ̂.

Statistik uji pada persamaan 2.13 akan mendekati sebaran dengan derajat bebas 1 di bawah kondisi H0 benar, sehingga keputusannya adalah

menolak H0 pada α, jika . Penolakan H0 pada α berarti bahwa peubah

penjelas ke-i, untuk suatu i tertentu (i=1,2,…,k), memiliki pengaruh yang signifikan terhadap peubah respon.

Uji PearsonKhi-Kuadrat pada Regresi Poisson dan ZIP

Cameron dan Trivedi (1998) menyatakan bahwa uji Pearson khi-kuadrat sering digunakan dalam mengukur kebaikan model regresi Poisson dan ZIP. Pengujian ini dilakukan dengan hipotesis pada persamaan 2.14 yaitu jika rasio τ menghasilkan nilai lebih dari satu, maka model tersebut mengalami overdispersi pada hipotesis alternatif (H1). Hipotesis pada uji Pearson khi-kuadrat adalah

H0 μ τ = 1 dan H1μ τ > 1 (2.14)

nilai statistik uji Pearson khi-kuadrat dapat didefinisikan pada persamaan 2.15 yaitu

(2.15)

dengan rasio dispersi

(2.16)

dengan adalah nilai aktual pada amatan ke-i dari peubah respon, dan Var(Y) adalah nilai dugaan rataan dan ragam dari regresi Poisson dan ZIP. n adalah banyaknya amatan pada peubah respon, dan k adalah banyaknya parameter regresi Poisson dan ZIP. Di bawah kondisi H0 benar, statistik uji pada

persamaan 2.15 akan mendekati sebaran dengan derajat bebas (n-k), sehingga keputusannya adalah menolak H0 pada α, jika . Pengidentifikasian

(23)

9

τ didapat dari nilai statisik uji Pearson khi-kuadrat pada persamaan 2.15 terhadap derajat bebas dari regresi Poisson dan ZIP.

Evaluasi Penduga Parameter Regresi Poisson dan ZIP

Akurasi nilai penduga parameter pada model regresi Poisson dan ZIP dapat dilihat dari absolute relative bias (ARB), relative root mean square error (RRMSE). Cameron dan Trivedi (1998) menyataka bahwa akurasi penduga y pada model regresi Poisson dan ZIP dapat dilihat dari Pearson residual (PR), dan sum of absolute Pearson residual (SAPR). Persamaan dari ARB, RRMSE, dan SAPR didefinisikan berturut-turut pada persamaan 2.17, 2.18, dan 2.19 adalah

∑ | ̂ | 100

00

=1 (2.17)

√∑ ̂

100

(2.18)

∑ ̂ √

sehingga

∑| |

00

=1 (2.19)

(24)

10

METODE

Data Data simulasi

Data yang digunakan dalam penelitian ini adalah data simulasi. Data simulasi dibangkitkan berdasarkan karakteristik data. Karakteristik data berupa lambda (λ), yaitu λ=0.6, 0.8, 1, 6, 8, 10, dan 20 dan peluang munculnya nilai nol (p), yaitu p=0.1, 0.3, 0.5, dan 0.7, serta ukuran contoh (n), yaitu n=100, 300, 500. Data simulasi berguna untuk mendapatkan penduga koefisien parameter regresi Poisson dan ZIP. Koefisien parameter regresi yang telah ditentukan yaitu 0=3

dan 1=0.01. Peubah yang ditentukan untuk membuat model regresi Poisson dan

ZIP yaitu peubah penjelas (X) dan peubah respon (Y).

Peubah X merupakan peubah acak yang menyebar normal ( ,1). Peubah X diasumsikan sebagai peubah tetap. Peubah X dan Y pada kajian simulasi dibangkitkan dengan tahap-tahap sebagai berikut:

1. Membangkitkan peubah Y yang menyebar Poisson (λ), sebanyak n dengan peluang nol p.

2. Membangkitkan peubah X dengan looping pertama, yaitu:

(i) Memisahkan peubah Y yaitu peubah Y yang bernilai nol dan tidak nol. (ii) Melakukan transformasi pada peubah X dengan rumus: xi= (ln (yi) - 0)/1,

dengan yi dari peubah Y tidak nol.

(iii)Memberi nama hasil transformasi peubah X untuk peubah Y yang tidak nol sebagai X tidak nol.

3. Membangkitkan peubah X pada peubah Y yang bernilai nol dan tidak nol dengan looping kedua, yaitu:

(i) Jika peubah Y bernilai nol, maka xi didapatkan dengan cara melakukan

penarikan contoh dengan pengembalian pada peubah X tidak nol.

(ii) Jika peubah Y bernilai tidak nol, maka xi dibangkitkan dari sebaran

Normal dengan nilai tengah hasil transformasi yang diperoleh dari poin 2(ii) dan ragam sebesar 1 sebanyak n=1.

Data simulasi pada peubah X dan Y dibangkitkan dengan perangkat lunak program R ver.2.15.2 dan akan diulang sebanyak r=500 kali. Secara garis besar terdapat 84 kondisi simulasi yang digunakan dalam penelitian ini terangkum pada Lampiran 1.

Data terapan

Data terapan digunakan dengan tujuan kajian simulasi yang telah dilakukan dapat diterapkan pada berbagai bidang untuk mengetahui ada atau tidaknya masalah overdispersi dalam data cacah terutama data yang menyebar Poisson. Data terapan yang digunakan merupakan data tentang faktor-faktor yang mempengaruhi mahasiswa pascasarjana IPB strata 2 (S2) berhenti studi. Peubah yang digunakan adalah peubah X1, X2, X3, X4, X5, X6, X7, X8 dan Y yang

(25)

11 studi pada masing-masing program studi dari tahun 2007–2010. Tabulasi data terapan yang digunakan dalam penelitian ini terangkum pada Lampiran 2 dan 3.

Tabel 1 Peubah-peubah dalam data terapan

Peubah Definisi

Y Jumlah kejadian mahasiswa pascasarjana IPB yang berhenti studi pada masing-masing program studi.

X1 Persentase mahasiswa yang berasal dari perguruan tinggi negeri

(PTN) pada masing masing program studi.

X2 Rata-rata IPK mahasiswa pascasarjana ketika lulus strata 1 (S1) pada

masing-masing program studi.

X3 Persentase mahasiswa memiliki linieritas sub rumpun terhadap

program studi S1 dan S2 yang sedang ditempuhya pada masing-masing program studi.

X4 Persentase mahasiswa sudah menikah pada masing-masing program

studi.

X5 Persentase mahasiswa penerima beasiswa pada masing-masing

program studi.

X6 Persentase mahasiswa laki-laki pada masing-masing program studi.

X7 Rata-rata usia mahasiswa pada masing-masing program studi.

X8 Persentase mahasiswa yang bekerja pada masing-masing program

studi.

Metode Analisis Metode simulasi

Metode penelitian pada kajian simulasi di setiap kombinasi λ, n dan p yang dicobakan akan dilakukan sesuai dengan langkah-langkah sebagai berikut dan secara garis besar diringkas pada Lampiran 4:

1. Membangkitkan peubah Y berdasarkan nilai λ, n, p, kemudian membangkitkan peubah X.

2. Melakukan eksplorasi pada peubah Y dengan membuat histogram untuk mengetahui indikasi dari kondisi sebaran Poisson.

3. Melakukan pengujian skor pada peubah Y untuk mengetahui peluang nol berlebih atau tidak.

4. Melakukan pengujian khi-kuadrat pada peubah Y untuk mengidentifikasi peubah Y menyebar Poisson atau ZIP.

5. Melakukan pengujian Pearson khi-kuadrat terhadap regresi Poisson dan ZIP untuk mengetahui kondisi overdispersi.

6. Melakukan analisis regresi Poisson dan ZIP untuk mendapatkan penduga koefisien parameter regresi.

7. Menghitung nilai ARB dan RRMSE pada setiap penduga parameter regresi Poisson dan ZIP.

(26)

12

9. Mengulangi langkah (1) sampai (8) sebanyak 500 kali. 10. Menghitung nilai SAPR di setiap ulangan.

11. Menghitung rata-rata dari 500 nilai ARB dan RRMSE terhadap masing-masing nilai penduga parameter regresi Poisson dan ZIP.

12. Menghitung rata-rata dari 500 nilai SAPR terhadap penduga y pada model regresi Poisson dan ZIP.

Metode terapan

Metode penelitian pada kajian terapan akan dilakukan sesuai dengan langkah-langkah sebagai berikut dan secara garis besar diringkas pada Lampiran 5:

1. Menghitung jumlah mahasiswa pascasarjana IPB yang berhenti studi pada setiap tahun (Y).

2. Mengidentifikasi karakteristik data pada peubah Y dengan menghitung nilai ̂, p, dan n.

3. Melakukan eksplorasi pada peubah Y dengan membuat histogram untuk mengetahui indikasi dari kondisi sebaran Poisson.

4. Melakukan pengujian skor pada peubah Y untuk mengetahui peluang nol berlebih atau tidak.

5. Melakukan pengujian khi-kuadrat pada peubah Y untuk mengidentifikasi peubah Y menyebar Poisson atau ZIP.

6. Melakukan analisis regresi Poisson dan menguji penduga koefisien parameter regresi dengan uji Wald.

7. Melakukan uji Pearson khi-kuadrat pada regresi Poisson untuk mengetahui terjadi overdispersi atau tidak.

8. Melakukan analisis regresi ZIP dan menguji penduga koefisien parameter regresi dengan uji Wald.

9. Melakukan uji Pearson khi-kuadrat pada regresi ZIP untuk mengetahui terjadi overdispersi atau tidak.

10. Menghitung nilai PR dan SAPR terhadap penduga y pada model regresi Poisson dan ZIP.

11. Membandingkan regresi Poisson dan ZIP berdasarkan hasil eksplorasi dan pengujian terhadap peubah Y, pengujian overdispersi, dan evaluasi model terhadap penduga y.

(27)

13

HASIL DAN PEMBAHASAN

Kajian overdispersi pada regresi Poisson dan ZIP ini ditinjau dari kajian simulasi dan kajian terapan. Kajian simulasi terdiri dari 84 kasus simulasi yang merupakan karakteristik data dari kombinasi λ, n, dan p. Simulasi dilakukan untuk mengevaluasi hasil pendugaan parameter dari regresi Poisson dan ZIP dengan menggunakan persentase ARB, RRMSE dan rataan SAPR. Nilai tersebut diperoleh dari hasil simulasi yang diulang sebanyak 500 kali. Hasil evaluasi dari data simulasi diperjelas dengan hasil eksplorasi dan pengujian terhadap peubah Y. Analisis regresi Poisson dan ZIP akan digunakan di data terapan yang memiliki p berlebih pada peubah Y.

Kajian Simulasi Eksplorasi pada peubah Y

Karakteristik data simulasi terhadap λ, n, dan p yang dicobakan menunjukkan bahwa munculnya nilai p berpengaruh terhadap λ. Nilai λ yang kecil menghasilkan nilai p yang melebihi penentuan p yang dicobakan. Ketika λ bernilai 0.6 dengan p yang dicobakan 0.3, maka peubah Y menghasilkan kisaran p dari 0.3 sampai 0.5. Hasil ini karena nilai λ yang kecil masih memiliki p yang relatif besar dari sebaran Poisson. Nilai λ yang dicobakan untuk 0.6, 0.8, 1, 6, dan 8 masih memiliki peluang nol dari sebaran Poisson, sedangkan untuk nilai λ lain yang dicobakan yaitu 10 dan 20 sudah tidak memiliki peluang nol dari sebaran Poisson. Karakteristik data menunjukkan bahwa semakin besar nilai λ, maka semakin kecil nilai p pada peubah Y di setiap n. Kondisi ini sesuai dengan fungsi massa peluang dari sebaran Poisson.

(28)

14

Eksplorasi terhadap peubah Y ditunjukan dengan histogram yang bertujuan mengetahui kondisi sebaran Poisson dan ZIP pada peubah Y. Nilai n yang ditentukan yaitu 300 contoh, karena nilai tersebut sebagian besar digunakan dalam data terapan pada analisis regresi Poisson dan ZIP. Nilai λ yang ditampilkan adalah λ=1 dan 10, yang mewakili nilai λ bernilai kecil dan besar. Histogram pada Gambar 1(a), 1(b), 1(c), dan 1(d) menunjukkan bahwa ketika peubah Y memiliki nilai λ=1 dengan p=0.1, 0.3, 0.5, dan 0.7, maka indikasi masih menyebar Poisson. Histogram pada λ=1 menunjukkan bahwa rataan peubah Y berada di sekitar nilai 1. Peubah Y memiliki p=0.1, maka rataan mengalami perubahan menjadi nilai λ kurang dari 1. Kenaikan nilai p dari 0.1 sampai 0.7, mengalami perubahan nilai λ yang signifikan artinya semakin besar nilai p, maka nilai λ menuju nol. Nilai λ=1 dan p=0.7 pada peubah Y mengindikasikan peluang nol berlebih. Kondisi ini sesuai dengan peningkatan frekuensi nilai nol di setiap p yang dicobakan.

(29)

15 Pengujian terhadap peubah Y

Eksplorasi peubah Y terhadap λ, n, p yang dicobakan menunjukkan adanya indikasi peluang nol berlebih, sehingga diperlukan pengujian terhadap peubah Y. Pengujian tersebut berupa uji skor dan uji khi-kuadrat yang dapat menggeneralisasi kesimpulan secara umum terhadap hasil eksplorasi terhadap peubah Y. Kondisi berlebihnya peluang nol pada peubah Y mengakibatkan terjadinya overdispersi. Flynn dan Francis (2009) menyatakan bahwa ketika hasil uji skor menghasilkan nilai nol yang berlebih pada suatu peubah, maka kemungkinan peubah tersebut tidak menyebar Poisson melainkan memiliki sebaran ZIP.

Hasil uji skor dengan α sebesar 0.05 pada hasil bangkitan peubah Y terhadap kombinasi dari λ, n, p ditunjukan pada Tabel 2. Uji skor menunjukkan bahwa semakin besar λ, n, dan p yang dicobakan, maka akan semakin besar persentase nol berlebih pada peubah Y.

(30)

16

besar nilai λ, maka persentase sebaran Poisson mencapai 0 % sedangkan persentase sebaran ZIP mencapai kisaran 60 % sampai 80 %.

Kejadian overdispersi yang disebabkan peluang nol berlebih pada peubah Y, maka sangat berpengaruh terhadap nilai λ yang berlaku di setiap n. Hasil eksplorasi pada peubah Y memberikan indikasi yang sesuai dengan hasil uji skor dan uji khi-kuadrat untuk sebaran Poisson dan ZIP. Nilai λ=0.6 yang menghasilkan persentase nol berlebih yang paling kecil dan sebagian besar menyebar Poisson. Nilai λ yang dimulai dari 6 sampai λ=20 di setiap p dan n yang dicobakan menunjukkan bahwa peluang nol berlebih mencapai 100 % dan peubah Y tidak menyebar Poisson, melainkan menyebar ZIP.

Tabel 3 Persentase uji khi-kuadrat terhadap kombinasi λ, n, p p=0.1 p=0.3 p=0.5 p=0.7

Pengujian overdispersi pada regresi Poisson dan ZIP

(31)

17 menyatakan bahwa kondisi overdispersi berpengaruh terhadap perubahan sebaran Poisson menjadi sebaran ZIP. Uji khi-kuadrat untuk sebaran ZIP menunjukan bahwa regresi ZIP mampu mengatasi overdispersi yang disebabkan nilai nol berlebih pada peubah Y. Selanjutnya, regresi Poisson dan ZIP diukur kebaikan modelnya berdasarkan pengujian overdispersi di setiap kombinasi λ, n, dan p yang dicobakan

Kondisi overdipersi pada setiap kombinasi λ, n, dan p yang dicobakan di regresi Poisson dan ZIP dapat ditelusuri dari rasio τ dan uji Pearson khi-kuadrat pada taraf nyata 5%. Rasio τ menunjukkan nilai dari hasil statistik uji Pearson khi-kuadrat terhadap derajat bebas (n-k). Nilai dari derajat bebas regresi Poisson dan ZIP berbeda, karena pada regresi Poisson menggunakan k=2, yaitu penduga parameter b0 dan b1. Regresi ZIP menggunakan k=4 berdasarkan model diskret

untuk λ dan model zero-inflation untuk p yaitu g0 dan g1, serta l0 dan l1.

Tabel 4 Rasio dispersi terhadap regresi Poisson dan ZIP p=0.1 p=0.3 p=0.5 p=0.7

(32)

18 regresi ZIP mampu mengatasi overdispersi yang disebabkan peluang nol berlebih pada peubah Y. Nilai λ yaitu 0.6, 0.8, 1 pada p=0.1 dan 0.3 di setiap n menunjukkan bahwa tidak terjadi overdispersi, begitu pula untuk p=0.5 dan 0.7 sudah terjadi overdispersi pada regresi Poisson. Selanjutnya, nilai λ yaitu 6, 8,10, dan 20 pada setiap p dan n yang dicobakan sudah terjadi overdispersi pada regresi Poisson. Kondisi ini berdasarkan hasil pada rasio dispersi dan uji Pearson khi-kuadrat.

(33)

19 yang dicobakan menghasilkan nilai overdispersi yang mencapai 0 % untuk regresi ZIP. Hasil ini menunjukan bahwa regresi ZIP lebih baik dalam menangani overdispersi yang disebabkan peluang nol yang berlebih pada peubah Y. Persentase overdispersi terhadap regresi Poisson menunjukkan bahwa semakin besar λ dan p, maka akan semakin besar terjadinya overdispersi di setiap n yang dicobakan yang ditunjukkan dengan nilai mencapai 100 %. Peubah Y memiliki nilai λ yang kecil dengan p mencapai lebih dari 0.5, maka cenderung ke regresi ZIP. Hasil ini sesuai dengan uji skor dan khi-kuadrat yang menunjukkan semakin besar λ, n, dan p yang dicobakan, maka semakin besar pula peluang nol yang muncul dan semakin sedikit menyebar Poisson pada peubah Y.

Evaluasi pendugaan model regresi Poisson dan ZIP

Ukuran kebaikan model pada regresi Poisson dan ZIP menunjukan bahwa semakin besar λ, n, dan p yang dicobakan, maka regresi ZIP lebih baik dibandingkan regresi Poisson. Selanjutnya, perbandingan model regresi Poisson dan ZIP dilakukan berdasarkan evaluasi penduga parameter dan y.

(34)

20

Rataan ARB untuk setiap kombinasi λ, n, dan p yang dicobakan pada penduga dan terdapat pada Tabel 6 dan 7. Hasil pada Tabel 6 dan 7 menunjukkan bahwa rataan ARB terhadap penduga dan memiliki gambaran yang sama terhadap perbandingan regresi Poisson dan ZIP. Hasil ARB pada regresi Poisson dan ZIP pada Tabel 6 menghasilkan nilai yang semakin kecil seiring membesarnya λ, n, dan p yang dicobakan terhadap penduga . Nilai ARB memiliki nilai minimum yang terdapat pada λ=6 berdasarkan penduga terhadap regresi Poisson pada Tabel 7. Kondisi ini karena adanya kestabilan pola hubungan X dan Y membentuk eksponensial yang dapat dilihat pada Lampiran 8. Rataan ARB pada regresi ZIP menghasilkan nilai yang semakin kecil seiring dengan membesarnya λ, n, dan p yang dicobakan terhadap penduga . Nilai ARB pada regresi ZIP lebih kecil dibandingkan dengan regresi Poisson berdasarkan semakin besar λ, n, dan p yang dicobakan terhadap penduga dan . Rataan ARB terhadap penduga dan menunjukkan bahwa regresi Poisson lebih baik dibandingkan regresi ZIP pada nilai λ yaitu 0.6, 0.8, dan 1 di setiap p dan n yang dicobakan. Nilai λ yaitu 6, 8, 10 dan 20 di setiap p dan n yang dicobakan menunjukkan bahwa regresi ZIP lebih baik dibandingkan regresi Poisson.

Tabel 7 Rataan ARB (%) terhadap pada regresi Poisson dan ZIP p=0.1 p=0.3 p=0.5 p=0.7

(35)

21 Nilai RRMSE memberikan gambaran yang sama dengan ARB terhadap penduga dan . MSE mengandung dua komponen, yaitu keragaman penduga (ketepatan) dan biasnya (keakuratan) (Casella dan Berger 2002). Penduga dengan sifat MSE yang baik merupakan penduga yang mengontrol keragaman dan bias. Nilai RRMSE yang besar menunjukkan keragaman penduga yang besar, sehingga semakin beresiko pada hasil pendugaan, yaitu ketepatan pendugaannya semakin rendah.

Tabel 8 Rataan RRMSE (%) terhadap pada regresi Poisson dan ZIP p=0.1 p=0.3 p=0.5 p=0.7

Nilai RRMSE lebih kecil

(36)

22

penduga dan . Rataan RRMSE terhadap penduga dan menunjukkan bahwa regresi Poisson lebih baik dibandingkan regresi ZIP pada nilai λ yaitu 0.6, 0.8, dan 1 di setiap p dan n yang dicobakan. Nilai λ yaitu 6, 8, 10 dan 20 di setiap p dan n yang dicobakan menunjukkan bahwa regresi ZIP lebih baik dibandingkan regresi Poisson.

Tabel 9 Rataan RRMSE (%) terhadap pada regresi Poisson dan ZIP n

Nilai RRMSE lebih kecil

Rataan SAPR pada penduga y didapatkan berdasarkan model regresi Poisson dan ZIP. Penduga y pada model regresi ZIP menggunakan dua model yaitu model diskret untuk λ dan model zero-inflation untuk p. Pada Tabel 10 menunjukkan bahwa semakin besar λ, n, dan p yang dicobakan, maka akan semakin besar pula nilai SAPR. Regresi ZIP memiliki rataan SAPR yang lebih kecil dibandingkan regresi Poisson di setiap λ, n, dan p yang dicobakan.

(37)

23 amatan menghasilkan nilai Pearson residual yang cenderung mendekati nilai nol pada regresi ZIP dan lebih kecil dibandingkan regresi Poisson.

Tabel 10 Rataan SAPR terhadap penduga y pada regresi Poisson dan ZIP n λ p=0.1 p=0.3 p=0.5 p=0.7

Nilai SAPR lebih kecil

(38)

24

regresi Poisson dan ZIP sesuai dengan hasil dari pengujian overdispersi, eksplorasi dan pengujian terhadap peubah Y.

Kajian Terapan Eksplorasi terhadap peubah Y

Data terapan yang digunakan merupakan data mahasiswa pascasarjana Institut Pertanian Bogor (IPB) yang berhenti studi. Tujuan digunakan data ini untuk membandingkan analisis regresi Poisson dan ZIP berdasarkan cara mengidentifikasi adanya overdispersi akibat nilai nol yang berlebih pada peubah Y. Nilai nol pada peubah Y mengartikan bahwa jumlah mahasiswa pascasarjana IPB yang tidak berhenti studi di setiap program studi pada tiap tahunnya. Data pada mahasiswa pascasarjana IPB yang berhenti studi disebabkan oleh mahasiswa mengundurkan diri, habis masa studi, dan indeks prestasi kumulatif (IPK) kurang dari sama dengan 3.00.

Mahasiswa pascasarjana IPB berhenti studi sebagian besar disebabkan karena IPK yang kurang dari 3.00, sehingga dalam penelitian ini yang akan dikaji lebih lanjut adalah mahasiswa pascasarjana IPB yang berhenti studi karena IPK kurang dari 3.00. Kasus ini sudah diteliti oleh Jajuli (2013) dengan menggunakan sembilan peubah X untuk mengkaji faktor-faktor yang mempengaruhi mahasiswa pascasarjana IPB berhenti studi. Kajian terapan dalam penelitian ini ingin menerapkan cara analisis data untuk mengkaji overdispersi pada regresi Poisson dan ZIP. Tabel 11 menunjukkan persentase mahasiswa pascasarjana IPB yang berhenti studi dari tahun 2007–2010. Besaran persentasenya berada di atas 2% yang berarti setiap tahun ada mahasiswa pascasarjana IPB berhenti studi. Keadaan ini mengindikasikan kejadian yang jarang terjadi pada setiap tahunnya di IPB.

Tabel 11 Persentase mahasiswa pascasarjana IPB yang berhenti studi

Tahun Jumlah

Jumlah mahasiswa pascasarjana IPB yang berhenti studi mengacu pada kejadian yang menyebar Poisson. Sebaran Poisson merupakan jumlah kejadian yang jarang terjadi pada selang waktu tertentu. Indikasi adanya sebaran Poisson pada peubah Y ditunjukan dengan histogram pada Gambar 3. Histogram sebesar 0.261 dan nilai ragamnya adalah 0.411. Eksplorasi ini membutuhkan pengujian terhadap peubah Y untuk membuktikan adanya indikasi tersebut.

(39)

25

Pengujian terhadap peubah Y

Tahun 2007-2010 menunjukkan bahwa hanya terdapat 17% program studi yang memiliki kejadian mahasiswanya berhenti studi, sedangkan sisanya 83% program studi memiliki kejadian mahasiswa tetap melanjutkan studi sampai lulus. Hasil eksplorasi pada peubah Y menunjukkan adanya indikasi jumlah nilai nol yang berlebih pada data mahasiswa pascasarjana IPB yang berhenti studi di tahun 2007–2010. Uji skor digunakan untuk mengetahui bahwa peubah Y memiliki peluang nol berlebih atau tidak. Hipotesis yang diuji adalah

H0 μ ω = 0 dan H1μ ω > 0

Statistik uji akan mendekati sebaran dengan derajat bebas 1 di bawah kondisi H0 benar, sehingga keputusannya adalah menolak H0 pada α, jika

. Nilai dari sebesar 27.092, dengan α=0.05, serta =3.841, sehingga keputusan dari hasil uji skor adalah tolak H0. Penolakan H0 berarti bahwa peluang

nol pada peubah respon berlebih, sehingga kondisi ini yang mengakibatkan adanya overdispersi pada α sebesar 0.05.

Hasil dari uji skor sesuai dengan hasil eksplorasi pada histogram pada peubah Y. Eksplorasi dari kondisi sebaran Poisson menunjukkan ada indikasi tidak menyebar Poisson. Oleh karena itu, dilakukan uji khi-kuadrat untuk sebaran Poisson dan ZIP pada peubah Y, hipotesis yang diuji adalah

H0 : = dan H1: ≠

Statistik uji untuk sebaran Poisson dan ZIP akan mendekati sebaran dengan derajat bebas (m-p-1) di bawah kondisi H0 benar, jika . Nilai dari

untuk sebaran Poisson sebesar 51.745, untuk sebaran ZIP sebesar 346.035. Nilai titik kritis untuk 5 kategori dan α=0.05, naka sebesar 7.815, sehingga keputusan dari hasil uji khi-kuadrat untuk sebaran Poisson dan ZIP adalah tolak H0. Penolakan H0 menyatakan bahwa jumlah kejadian mahasiswa pascasarjana

IPB yang berhenti studi pada masing-masing program studi tidak menyebar Poisson dan ZIP pada α sebesar 0.05.

Pemilihan sebaran Poisson atau ZIP dapat ditunjukkan dengan statistik uji yang bernilai lebih kecil, sehingga peubah Y mendekati sebaran Poisson. Nilai

Gambar 3 Histogram pada peubah Y

Fre

k

u

en

si

(40)

26

p yang muncul pada peubah Y sebesar 0.8, sehingga terjadi penyimpangan pada sebaran Poisson akibat berlebihnya nilai nol. Peubah Y mendekati sebaran Poisson dengan berlebihnya nilai nol, sehingga sebaiknya menggunakan regresi ZIP. Oleh karena itu, uji khi-kuadrat terhadap kondisi sebaran peubah Y tidak hanya sebagai penentu untuk menggunakan regresi Poisson, tetapi juga perlu diperhatikan penyimpangan yang terjadi dan menggunakan regresi ZIP sebagai penaganan model. Karakteristik yang didapatkan pada data terapan berdasarkan eksplorasi terhadap peubah Y yaitu rataan atau ̂ bernilai 0.261 0.3, dengan p bernilai 0.819 0.8, dan n berjumlah 249. Selanjutnya, peubah Y dan peubah X1,

X2, X3, X4, X5, X6, X7, X8 dianalisis dengan regresi Poisson dan ZIP.

Regresi Poisson

Analisis regresi Poisson digunakan untuk mengevaluasi hubungan antara peubah X dengan peubah Y yang menyebar Poisson. Pendugaan model regresi Poisson pada peubah X1, X2, X3, X4, X5, X6, X7, X8 dengan Y ditunjukan pada

Tabel 12. Di bawah kondisi H0 benar, statistik uji akan mendekati sebaran

dengan derajat bebas 1, sehingga keputusannya adalah menolak H0pada α sebesar

0.05, jika dengan nilai dari = 3.841. Penolakan H0 pada peubah

X1 terhadap peubah Y mengartikan bahwa persentase mahasiswa yang berasal dari

PTN memiliki pengaruh yang signifikan terhadap jumlah kejadian mahasiswa pascasarjana IPB yang berhenti studi pada masing-masing program studi dengan α sebesar 0.05.

Tabel 12 Pendugaan model regresi Poisson

Peubah Derajat bebas Dugaan Keputusan

Intercept 1 -1.052 0.055 Terima H0

Sehingga penduga y pada regresi Poisson adalah

̂

(41)

27 dari PTN, maka akan menyebabkan penurunan rataan jumlah kejadian mahasiswa pascasarjana IPB yang berhenti studi pada masing-masing program studi sebesar e(-0.022) = 0.978 ≈ 1.

Regresi Poisson memiliki kebaikan model yang ditunjukan dengan uji Pearson khi-kuadrat. Hasil dari uji Pearson khi-kuadrat terhadap karakteristik data terapan ̂ =0.3, n=249, dan p=0.8 pada peubah Y ditunjukan dengan hipotesis sebagai berikut

H0 μ τ = 1 dan H1μ τ > 1

Statistik uji akan mendekati sebaran dengan derajat bebas (n-k) yaitu 240 di bawah kondisi H0 benar, sehingga keputusannya adalah menolak H0 pada α, jika

nilai peluang dari lebih besar dari taraf nyata α= 0.05. Nilai peluang dari sebesar 0.001 sehingga keputusan dari hasil uji Pearson khi-kuadrat adalah tolak H0. Penolakan H0 berarti bahwa peubah Y terjadi overdipersi pada α sebesar 0.05.

Hasil dari Pearson khi-kuadrat diperkuat dengan rasio τ sebesar 1.342. Regresi ZIP

Analisis regresi ZIP merupakan analisis yang mengevaluasi hubungan antara peubah X dengan peubah Y yang menyebar ZIP. Sebaran ZIP diakibatkan oleh meningkatnya nilai nol pada sebaran Poisson. Model pada regresi ZIP terdiri dari dua komponen model yaitu model data diskret untuk λ dan model zero-inflation untuk p yang ditunjukan pada Tabel 13, yaitu sebagai berikut

Tabel 13 Model data diskret untuk λ dan model zero-inflation untuk p pada regresi ZIP

Peubah Derajat bebas Dugaan Keputusan

Model data diskret untuk λ

Intercept 1 1.564 0.051 Terima H0

Model yang digunakan untuk menginterpretasi hasil dari setiap peubah yaitu model data diskret untuk . Di bawah kondisi H0 benar, statistik uji akan

mendekati sebaran dengan derajat bebas 1, sehingga keputusannya adalah menolak H0 pada α sebesar 0.05, jika dengan nilai dari = 3.841.

(42)

28

mahasiswa yang berasal dari PTN memiliki pengaruh yang signifikan terhadap jumlah kejadian mahasiswa pascasarjana IPB yang berhenti studi pada masing-masing program studi pada taraf nyata 0.05. Model zero-inflation untuk p hanya menggunakan enam peubah yaitu peubah X1, X3, X4, dan X5. Empat peubah

tersebut dipilih berdasarkan pemilihan model yang terbaik untuk regresi ZIP. Model zero-inflation untuk p menunjukkan bahwa peubah mahasiswa penerima beasiswa memiliki pengaruh yang signifikan terhadap peningkatan nilai nol terhadap peubah Y pada taraf nyata 0.05.

Model regresi ZIP pada peubah X1, X2, X3, X4, X5, X6, X7, X8 dengan Y yaitu:

1. Model data diskret untuk adalah

2. Model zero-inflation untuk p adalah

sehingga penduga y pada regresi ZIP adalah ̂

Interpretasi dari model diskret untuk pada regresi ZIP yang signifikan terhadap peubah Y, yaitu setiap kenaikan 1% mahasiswa yang berasal dari PTN, maka akan menyebabkan penurunan rataan jumlah kejadian mahasiswa pascasarjana IPB yang berhenti studi pada masing-masing program studi sebesar e(-0.051) = 0.951≈ 1. Interpretasi dari model zero-inflation untuk p pada regresi ZIP yang signifikan terhadap peubah Y, yaitu setiap kenaikan 1% mahasiswa penerima beasiswa, maka resiko terjadinya kejadian mahasiswa pascasarjana IPB yang tidak berhenti studi pada program studi tertentu meningkat sebesar e(0.041)=1.042 kali. Mahasiswa yang mendapatkan beasiswa mempengaruhi menurunnya mahasiswa pascasarjana IPB berhenti studi pada masing-masing program studi pada tahun 2007-2010.

Regresi ZIP memiliki kebaikan model yang ditunjukan dengan uji Pearson khi-kuadrat. Hasil dari uji Pearson khi-kuadrat terhadap karakteristik data terapan ̂ =0.3, n=249, dan p=0.8 pada peubah Y di regresi ZIP ditunjukan dengan hipotesis sebagai berikut

H0 μ τ = 1 dan H1μ τ > 1

Statistik uji akan mendekati sebaran dengan derajat bebas (n - k) yaitu 235 di bawah kondisi H0 benar, sehingga keputusannya adalah menolak H0 pada α,

jika nilai peluang dari lebih besar dari α=0.05. Nilai peluang dari sebesar 0.898, sehingga keputusan dari hasil uji Pearson khi-kuadrat adalah terima H0.

Penerimaan H0 berarti bahwa peubah Y tidak terjadi overdipersi pada α=0.05.

(43)

29 Perbandingan regresi Poisson dan ZIP

Karakteristik data terapan ̂ =0.3, n=249, dan p=0.8 menunjukkan peubah Y memiliki peluang nol yang berlebih dan tidak menyebar Poisson pada taraf nyata 5%. Perbandingan dari hasil analisis regresi Poisson dan ZIP pada kajian terapan menunjukkan bahwa regresi Poisson mengalami overdispersi, sedangkan regresi ZIP tidak terjadi overdispersi. Pernyataan tersebut berdasarkan uji Pearson khi-kuadrat pada α=0.05 dengan rasio τ pada regresi ZIP kurang dari 1. Hasil dari uji Wald pada α=0.05 menunjukkan bahwa regresi Poisson dan ZIP memiliki keputusan yang sama yaitu peubah X1 berpengaruh nyata terhadap peubah Y.

Evaluasi terhadap penduga y pada regresi Poisson dan ZIP ditentukan berdasarkan nilai Pearson residual. Pada Gambar 4 terlihat bahwa nilai Pearson residual dari setiap amatan pada regresi ZIP cenderung mendekati nilai 0 dan lebih kecil dibandingkan regresi Poisson. Rataan dari absolute Pearson residual (APR) pada regresi Poisson adalah 0.781, sedangkan pada regresi ZIP bernilai 0.639. Dengan demikian, kajian terapan berupa eksplorasi dan pengujian terhadap peubah Y, uji kebaikan model, pengujian overdispersi, dan evaluasi terhadap penduga y menunjukkan bahwa regresi ZIP lebih baik dibandingkan regresi Poisson dalam mengatasi overdispersi akibat nilai nol yang berlebih pada peubah Y. Regresi ZIP dapat menanggulangi kasus mengenai faktor-faktor yang mempengaruhi jumlah kejadian mahasiswa pascasarjana IPB berhenti studi pada masing-masing program studi pada tahun 2007-2010.

250

(44)

30

KESIMPULAN DAN SARAN

Kesimpulan

Kajian overdispersi terhadap data simulasi dari kombinasi λ, n, p yang dicobakan menunjukkan bahwa semakin besar λ, n, dan p maka uji skor menghasilkan peluang nol berlebih yang semakin besar dan uji khi-kuadrat menghasilkan persentase sebaran Poisson yang semakin kecil. Hasil perbandingan menunjukan bahwa regresi ZIP lebih baik dibandingkan regresi Poisson berdasarkan rasio dispersi dan persentase overdispersi, nilai ARB dan RRMSE terhadap dan , serta rataan SAPR terhadap penduga y dengan semakin besar

λ, n, dan p yang dicobakan. Nilai λ yaitu 0.6, 0.8, dan 1 di setiap p dan n yang dicobakan menunjukkan bahwa regresi Poisson lebih baik dibandingkan regresi ZIP, sedangkan untuk nilai λ yaitu 6, 8, 10, dan 20 di setiap p dan n yang dicobakan menunjukkan bahwa regresi ZIP lebih baik dibandingkan regresi Poisson.

Kajian overdispersi terhadap data terapan menyatakan bahwa karakteristik data ̂ =0.3, n=249, dan p=0.8 pada kasus mengenai faktor-faktor yang mempengaruhi jumlah kejadian mahasiswa pascasarjana IPB yang berhenti studi pada masing-masing program studi dengan menggunakan regresi ZIP lebih baik dari pada regresi Poisson. Regresi ZIP lebih baik dibandingkan regresi Poisson dalam menanggulangi overdispersi akibat banyaknya nilai nol yang berlebih pada peubah Y. Faktor yang mempengaruhi mahasiswa pascasarjana IPB berhenti studi adalah persentase status perguruan tinggi negeri asal, sedangkan faktor yang mempengaruhi mahasiswa pascasarjana IPB tidak berhenti studi pada masing-masing program studi adalah persentase mahasiswa penerima beasiswa.

Saran

(45)

31

DAFTAR PUSTAKA

Agresti A. 2007. An Introduction to Categorical Data Analysis, Second Edition. New Jersey: John Wiley and Sons, Inc.

Cameron CA, Trivedi PK. 1998. Regression Analysis of Count Data. Cambridge: Cambridge University Pr.

Casella G, Berger RL. 2002. Statistical Inference. California: Duxbury.

Direktorat Jendral Pendidikan Tinggi. 2012. Nama Rumpun Ilmu, Sub Rumpun Ilmu, dan Bidang Ilmu dalam Rumpun. Jakarta: Kementrian Pendidikan Nasional.

Flynn M, Francis LA. 2009. More flexible GLM’s zero-inflated Models and Hybrid models. Virginia: Casualty Actuarial Society Forum.

Hardin JW, Hilbe JM. 2007. Generalized Linier Models and Extensions Second Edition. USA: Stata Pr.

Ismail N, Jemain AA. 2007. Handling Overdispersion with Negative Binomial and Generalized Poisson Regression Models. Virginia: Casualty Actuarial Society Forum.

Jajuli M. 2013. Identifikasi faktor-faktor berhenti studi mahasiswa pascasarjana IPB menggunakan regresi logistik dan zero-inflated Poisson [tesis]. Bogor: Institut Pertanian Bogor.

Jansakul N, Hinde JP. 2002. Score test for zero-inflated Poisson models. Computational Statistics and Data Analysis. 40:75-96.

Lambert D. 1992. Zero-inflated Poisson regression, with an application to defect in manufacturing. Technometric. 34(1):1-14.

Naya H, Urioste JI, Chang YM, Motta MR, Kremer R, Gianola D. 2008. A comparison between Poisson and zero-inflated Poisson regression models with an application to number of black spots in Corriedale sheep. Journal of Genet. Sel. Evol. 40:379-394.

Numna S. 2009. Analysis of extra zero counts using zero-inflated Poisson models [tesis]. Thailand: Universitas Kerajaan Songkla.

Ricci V. 2005. Fitting distributions with R. USA: Free Software Foundation. Ridout M, Demetrio CGB, Hinde J. 1998. Models for count data with many zeros.

International Biometric Conference. 1-12.

(46)

32

(47)

33 Lampiran 2 Tabulasi data terapan

No. Tahun Program studi X1 X2 X3 … X8 Y

1 2007 AGH 81.82 3.24 100.00 90.91 0 2 2007 AKU 73.08 3.11 96.15 92.31 0 3 2007 ARL 100.00 3.14 33.33 100.00 0 4 2007 ATT 66.67 3.11 33.33 100.00 1 5 2007 BIK 66.67 3.37 100.00 100.00 0 6 2007 BOT 60.87 3.00 26.09 100.00 0 7 2007 BRP 66.67 3.27 33.33 100.00 0 8 2007 BSH 93.55 3.03 48.39 96.77 0

… … … …

61 2008 AGH 68.75 3.16 87.50 81.25 1 62 2008 AKU 83.33 3.15 100.00 80.56 1 63 2008 APH 100.00 3.13 0.00 100.00 0 64 2008 ARL 100.00 2.95 100.00 66.67 0 65 2008 ATT 80.00 3.21 80.00 60.00 0 66 2008 BIK 100.00 3.38 50.00 50.00 0 67 2008 BOT 87.5 3.23 100.00 87.50 0 68 2008 BRP 100.00 3.21 42.86 71.43 0

… … … …

123 2009 AGH 92.86 3.19 92.86 71.43 0 124 2009 AKU 84.62 3.22 92.31 88.46 2 125 2009 APH 33.33 3.30 33.33 100.00 0 126 2009 ARL 66.67 3.12 16.67 83.33 1 127 2009 ATT 100.00 3.07 100.00 100.00 1 128 2009 BIK 100.00 3.28 100.00 75.00 0 129 2009 BOT 92.86 3.17 82.14 89.29 1 130 2009 BRP 100.00 3.49 100.00 100.00 0

… … … …

185 2010 AGB 87.10 3.29 100.00 35.48 2 186 2010 AGH 93.75 3.18 80.77 18.75 0 187 2010 AKU 84.00 3.20 0.00 8.00 2 188 2010 APH 100.00 3.34 16.67 100 0 189 2010 ARL 100.00 3.01 100.00 0.00 0 190 2010 ATT 100.00 3.47 75.00 66.67 0 191 2010 BIK 42.86 3.00 46.43 0.00 0 192 2010 BOT 93.33 3.33 0.00 6.67 1 193 2010 BRP 75.00 3.39 100.00 0.00 0

… … … …

Gambar

Tabel 1  Peubah-peubah dalam data terapan
Gambar 1  Histogram terhadap peubah Y pada =1, n=300 dengan (a) p=0.1,
Gambar 1(a), 1(b), 1(c), dan 1(d) menunjukkan bahwa ketika peubah Y memiliki
Tabel 2  Persentase uji skor terhadap kombinasi λ, n, p
+7

Referensi

Dokumen terkait

Pendekatan sistem yang lebih menekankan pada prosedur sistem adalah sebagai berikut: “Sistem adalah suatu jaringan kerja dari prosedur-prosedur yang saling berhubungan, berkumpul

Dikesrensning får utföras utan tillstånd så länge det är underhåll utav det befintliga diket för att bibehålla vattnets djup eller läge, det vill säga att rensningen inte

Sehubungan dengan Pengumuman Pemilihan Langsung dengan Pascakualifikasi pada tanggal 10 s.d 14 Juni 2013, yang dilaksanakan oleh Pokja ULP - Panitia Pengadaan

NoSQL memiliki beberapa keuntungan seperti : skala yang fleksibel, dapat menyimpan data yang besar(BIG DATA), dapat mengurangi peranan seorang Database

Kesimpulan yang didapat, Aparat penegak hukum seperti Polisi, Jaksa, dan Hakim sebagai lembaga yang fungsinya berkaitan dengan penegakan hukum dan keadilan harus

penelitian Rahmanita (2014) adalah Perbedaan Kecenderungan Narsistik Antara Laki-Laki Dan Perempuan Pengguna Jejaring Sosial Instagram dan penelitian Vervuurt

Analisis data berdasarkan metode yang dipilih Setelah menentukan metode statistik yang akan digunakan selanjutnya menerjemahkan ke dalam algoritma yang sesuai untuk mendapatkan

Hal ini menunjukkan bahwa 63.5% variabel bebas (sikap, norma subyektif,.. kendali keperilakuan, motivasi, dan latar belakang sosial ekonomi) dapat.. mempengaruhi variabel