• Tidak ada hasil yang ditemukan

BAB 2 TINJAUAN PUSTAKA

N/A
N/A
Protected

Academic year: 2021

Membagikan "BAB 2 TINJAUAN PUSTAKA"

Copied!
13
0
0

Teks penuh

(1)

6 BAB 2

TINJAUAN PUSTAKA

2.1 Regresi Poisson

Regresi Poisson merupakan model regresi non linier yang sering digunakan untuk menganalisis suatu data count. Regresi Poisson adalah salah satu regresi yang digunakan untuk memodelkan antara variabel respon dan variabel prediktor dengan mengasumsikan variabel Y berdistribusi poisson [5].

Analisis regresi merupakan metode statistika yang sering kali digunakan untuk menyatakan hubungan antara variabel respon Y dengan variabel bebas X. Apabila variabel respon Y mengikuti distribusi poisson maka model regresi yang digunakan adalah Regresi Poisson. Regresi Poisson digunakan untuk menganalisis variabel respon bertipe diskrit dan integer tidak negatif yang biasanya diterapkan pada penelitian dengan kasus yang kejadiannya jarang terjadi dalam ruang sampel yang besar. Persamaan model Regresi Poisson dapat ditulis sebagai berikut.

𝑌𝑌� = exp (𝐗𝐗iT𝛃𝛃)

𝑌𝑌� = exp (𝛽𝛽0+ 𝛽𝛽1𝑥𝑥𝑖𝑖1+ 𝛽𝛽2𝑥𝑥𝑖𝑖2+ ⋯ + 𝛽𝛽𝑝𝑝𝑥𝑥𝑖𝑖𝑝𝑝)

ln (𝑌𝑌�) = 𝛽𝛽0+ 𝛽𝛽1𝑥𝑥𝑖𝑖1+ 𝛽𝛽2𝑥𝑥𝑖𝑖2+ ⋯ + 𝛽𝛽𝑝𝑝𝑥𝑥𝑖𝑖𝑝𝑝 (2.1)

berdasarkan rumus tersebut, dapat diketahui bahwa 𝑌𝑌� adalah rata-rata jumlah

peristiwa yang terjadi pada periode waktu tertentu. Variabel 𝑥𝑥𝑖𝑖 adalah variabel prediktor ke-i, 𝛽𝛽𝑖𝑖 adalah parameter Regresi Poisson ke-I, dan 𝐗𝐗 adalah matriks

transformasi dari variabel bebasnya serta 𝛃𝛃 adalah matriks transformasi dari

parameter regresi.

A. Distribusi Poisson

Distribusi poisson merupakan distribusi yang menyatakan banyaknya sukses yang terjadi dalam suatu selang waktu atau daerah tertentu [8]. Uji Kolmogorov Smirnov dilakukan untuk mengetahui suatu data berdistribusi poisson atau tidak, dengan H0 yaitu data mengikuti distribusi poisson dan H1 yaitu data

tidak mengikuti distribusi poisson. Statistik uji pada distribusi poisson adalah sebagai berikut.

(2)

7

𝐷𝐷𝑛𝑛 = 𝑆𝑆𝑆𝑆𝑆𝑆|𝑆𝑆𝑛𝑛(𝑦𝑦) − 𝐹𝐹0(𝑦𝑦)| (2.2)

berdasarkan rumus tersebut, dapat diketahui bahwa 𝑆𝑆𝑛𝑛(𝑦𝑦) adalah suatu fungsi

peluang kumulatif data sampel. Dengan 𝐹𝐹0(𝑦𝑦) adalah suatu fungsi distribusi

kumulatif poisson. Selanjutnya 𝐷𝐷𝑛𝑛 adalah jarak tegak maksimum antara fungsi

distribusi empiris dengan fungsi distribusi poisson. H0 ditolak jika nilai statistik uji Dn > Dα [9].

Distribusi poisson adalah suatu distribusi untuk peristiwa yang probabilitas kejadiannya kecil, dimana kejadiannya tergantung pada interval waktu tertentu atau disuatu daerah tertentu dengan hasil pengamatan berupa variabel diskrit. Variabel

respon (Y) dapat dikatakan berdistribusi poisson dengan parameter λ dengan Y =

0,1,2.. dengan fungsi probabilitas dinyatakan sebagai berikut [5]. 𝑓𝑓𝑌𝑌(𝑦𝑦, 𝜇𝜇) = �𝑒𝑒

− 𝜇𝜇 𝜇𝜇𝑦𝑦

𝑦𝑦! , 𝑦𝑦 = 0,1,2, … 0 , 𝑦𝑦 yang lain

berdasarkan rumus tersebut, dapat diketahui bahwa λ adalah rata-rata variabel

respon Y yang berdistribusi poisson dan nilai rata-rata dan variansi dari Y mempunyai nilai lebih dari nol. Distribusi poisson memiliki asumsi bahwa nilai rata-rata dan variansi adalah sama. Rata-rata dan variansi pada distribusi poisson adalah 𝐸𝐸(𝑦𝑦) = 𝜇𝜇 dan 𝑉𝑉𝑉𝑉𝑉𝑉(𝑦𝑦) = 𝜇𝜇. Hal tersebut dibuktikan dengan penjabaran sebagai berikut. 𝐸𝐸(𝑦𝑦) = �∞ [𝑦𝑦. 𝑓𝑓(𝑦𝑦, 𝜇𝜇)] 𝑦𝑦=0 = �∞ �𝑦𝑦.𝑒𝑒− 𝜇𝜇𝑦𝑦! � 𝜇𝜇𝑦𝑦 𝑦𝑦=0 = �∞ �𝑦𝑦.𝑦𝑦(𝑦𝑦 − 1)!�𝑒𝑒− 𝜇𝜇 𝜇𝜇𝑦𝑦 𝑦𝑦=1 = �∞ �𝑦𝑦.𝑒𝑒− 𝜇𝜇𝑦𝑦(𝑦𝑦 − 1)! � 𝜇𝜇𝑦𝑦 𝜇𝜇𝑦𝑦−1 𝑦𝑦=1 = 𝜇𝜇 �∞ �𝑒𝑒(𝑦𝑦 − 1)! �− 𝜇𝜇 𝜇𝜇𝑦𝑦−1 𝑦𝑦=1

misal x = y-1, y = 1 maka x = 0 diperoleh persamaan: 𝐸𝐸(𝑦𝑦) = 𝜇𝜇 � 𝑒𝑒− 𝜇𝜇 𝜇𝜇𝑥𝑥

𝑥𝑥! ∞ 𝑥𝑥=0

(3)

8

karena ∑∞𝑥𝑥=0[𝑝𝑝(𝑥𝑥, 𝜇𝜇)] − 1, maka:

𝐸𝐸(𝑦𝑦) = 𝜇𝜇 × 1 = 𝜇𝜇

sehingga ragam dalam variabel acak poisson adalah sebagai berikut. 𝑉𝑉𝑉𝑉𝑉𝑉(𝑌𝑌) = 𝐸𝐸(𝑌𝑌2) − (𝐸𝐸(𝑌𝑌))2 𝐸𝐸(𝑌𝑌2) = � [𝑦𝑦∞ 2. 𝑝𝑝(𝑦𝑦)] 𝑦𝑦=0 = �∞ [(𝑦𝑦(𝑦𝑦 − 1) + 𝑦𝑦). 𝑝𝑝(𝑦𝑦)] 𝑦𝑦=0 = �∞ [𝑦𝑦(𝑦𝑦 − 1). 𝑝𝑝(𝑦𝑦)] 𝑦𝑦=0 + � 𝑦𝑦. 𝑝𝑝(𝑦𝑦) ∞ 𝑦𝑦=0 = �∞ [𝑦𝑦(𝑦𝑦 − 1). 𝑝𝑝(𝑦𝑦)] + 𝜇𝜇 𝑦𝑦=0 = ∑ �𝑦𝑦(𝑦𝑦 − 1).𝑒𝑒− 𝜇𝜇 𝜇𝜇𝑦𝑦 𝑦𝑦! � + 𝜇𝜇 ∞ 𝑦𝑦=0 = ∑ �𝑦𝑦(𝑦𝑦 − 1). 𝑒𝑒− 𝜇𝜇 𝜇𝜇𝑦𝑦 𝑦𝑦(𝑦𝑦−1)(𝑦𝑦−2)!� + 𝜇𝜇 ∞ 𝑦𝑦=0 = ∑ �𝑦𝑦(𝑦𝑦 − 1). 𝑒𝑒− 𝜇𝜇 𝜇𝜇2 𝜇𝜇𝑦𝑦−2 𝑦𝑦(𝑦𝑦−1)(𝑦𝑦−2)!� + 𝜇𝜇 ∞ 𝑦𝑦=2 = 𝜇𝜇2 𝑒𝑒− 𝜇𝜇 𝜇𝜇𝑦𝑦−2 (𝑦𝑦 − 2)! � + 𝜇𝜇 ∞ 𝑦𝑦=2

misalkan 𝑥𝑥 = 𝑦𝑦 − 2, 𝑦𝑦 = 2 maka 𝑥𝑥 = 0 diperoleh persamaan:

𝐸𝐸(𝑌𝑌2) = 𝜇𝜇2 𝑒𝑒− 𝜇𝜇 𝜇𝜇𝑥𝑥 𝑥𝑥! � + 𝜇𝜇 = 𝜇𝜇2+ 𝜇𝜇 ∞ 𝑥𝑥=0 karena ∑ �𝑒𝑒− 𝜇𝜇 𝜇𝜇𝑥𝑥 𝑥𝑥! � ∞ 𝑥𝑥=0 = 1, maka: 𝐸𝐸(𝑌𝑌2) = 𝜇𝜇2 + 𝜇𝜇

sehingga didapat variansi untuk variabel acak poisson adalah: 𝑉𝑉𝑉𝑉𝑉𝑉(𝑌𝑌) = 𝐸𝐸(𝑌𝑌2) − (𝐸𝐸(𝑌𝑌))2

= 𝜇𝜇2+ 𝜇𝜇 − 𝜇𝜇2 = 𝜇𝜇

B. Multikolinieritas

Regresi Poisson juga memiliki asumsi bahwa tidak ada multikolinieritas antar variabel prediktor. Multikolinieritas merupakan adanya korelasi yang tinggi

(4)

9

diantara variabel-variabel bebas dalam model. Pendeteksian kasus multikolinieritas dapat dilihat melalui beberapa cara yaitu sebagai berikut.

1. Koefisien Korelasi

Koefisien korelasi merupakan suatu indikator untuk mendeteksi hubungan linier antara 2 variabel [10]. Sedangkan koefisien korelasi pearson (𝑉𝑉𝑥𝑥𝑖𝑖,𝑥𝑥𝑗𝑗) dengan dengan xi dan xj adalah variabel prediktor yang berbeda didefinisikan seperti pada

persamaan berikut. �𝑉𝑉𝑥𝑥𝑖𝑖,𝑥𝑥𝑗𝑗� = ∑ (𝑥𝑥𝑖𝑖−𝑥𝑥̅)(𝑥𝑥𝑗𝑗−𝑥𝑥𝑗𝑗) 𝑛𝑛 𝑖𝑖=1 �∑𝑛𝑛𝑖𝑖=1(𝑥𝑥𝑖𝑖−𝑥𝑥̅)2∑𝑛𝑛𝑖𝑖=1(𝑥𝑥𝑗𝑗−𝑥𝑥𝑗𝑗)2 , 𝑖𝑖 ≠ 𝑗𝑗 (2.3)

pada koefisien korelasi terdapat dua hubungan, yaitu positif dan negatif. Nilai positif dan negatif ini disebabkan nilai korelasi berkisar antara -1 hingga 1. Apabila nilai korelasi mendekati 1 baik itu positif maupun negatif hal tersebut berarti kedua variabel memiliki hubungan yang erat. Nilai korelasi lebih besar dari 0,95 menunjukkan bahwa terjadi multikolinieritas. Kemudian nilai korelasi yang positif menunjukkan adanya hubungan berbanding lurus pada dua variabel tersebut, sedangkan nilai korelasi yang negatif menunjukkan hubungan yang berbanding terbalik.

2. Variance Inflation Factors (VIF)

Kasus multikolinieritas dapat juga diketahui melalui Variance Inflation

Factors (VIF) yang bernilai lebih besar dari 10, dengan nilai VIF yang dinyatakan

sebagai berikut.

𝑉𝑉𝑉𝑉𝐹𝐹𝑗𝑗 =1−𝑅𝑅1

𝑗𝑗2 (2.4)

berdasarkan rumus tersebut, dapat diketahui bahwa 𝑅𝑅𝑗𝑗2 adalah koefisien

determinasi antara 𝑥𝑥𝑗𝑗 dengan variabel prediktor lainnya. Nilai 𝑅𝑅𝑗𝑗2 akan sama dengan nol dan VIF akan bernilai satu apabila variabel prediktor tidak saling linier pada model regresi. Nilai VIF lebih lebih dari 10 mengindikasikan adanya multikolinieritas diantara variabel-variabel prediktor [11].

(5)

10 3. Tollerance

Kasus multikolinieritas dapat juga diketahui melalui nilai tollerance. Jika nilai tollerance lebih kecil dari 0,10 maka terjadi multikolinieritas, dengan nilai

tollerance dinyatakan sebagai berikut.

𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑒𝑒𝑉𝑉𝑉𝑉𝑇𝑇𝑇𝑇𝑒𝑒 =𝑉𝑉𝑉𝑉𝑉𝑉1 (1 − 𝑅𝑅𝑗𝑗2) (2.5)

multikolinieritas bisa saja terjadi, salah satu metode untuk mengatasinya adalah

Principal Component Analysis (PCA). Prosedur PCA pada dasarnya adalah

bertujuan untuk menyederhanakan variabel yang diamati dengan cara menyusutkan (mereduksi) dimensinya. Hal ini dilakukan dengan cara menghilangkan korelasi diantara variabel bebas melalui transformasi variabel bebas asal ke variabel baru yang tidak berkorelasi sama sekali atau yang biasa disebut dengan principal

component [12].

C. Penaksiran Parameter Model Regresi Poisson

Pada model Regresi Poisson harus dilakukan penaksiran pada 𝛽𝛽0, 𝛽𝛽1, … , 𝛽𝛽𝑛𝑛

dengan 𝛽𝛽0, 𝛽𝛽1, … , 𝛽𝛽𝑛𝑛 adalah parameter yang tidak diketahui. Metode yang

digunakan untuk menaksir parameter yaitu menggunakan metode Maximum

Likelihood Estimation (MLE). Metode MLE merupakan salah satu metode

penaksiran parameter yang dapat digunakan untuk menaksir parameter suatu model yang diketahui distribusinya. Bentuk umum fungsi likelihood untuk Regresi Poisson adalah sebagai berikut.

𝐿𝐿(𝑦𝑦, 𝛃𝛃) = � 𝑓𝑓(𝑦𝑦𝑖𝑖, 𝛃𝛃) 𝑛𝑛 𝑖𝑖=1 𝐿𝐿(𝑦𝑦, 𝛃𝛃) = � �𝑒𝑒−𝜇𝜇(𝑥𝑥𝑖𝑖,𝛃𝛃)[𝜇𝜇(𝑥𝑥𝑦𝑦 𝑖𝑖, 𝛃𝛃)]𝑦𝑦𝑖𝑖] 𝑖𝑖! � 𝑛𝑛 𝑖𝑖=1 𝐿𝐿(𝑦𝑦, 𝛃𝛃) =𝑒𝑒− ∑ 𝜇𝜇(𝑥𝑥𝑖𝑖,𝛃𝛃) 𝑛𝑛 𝑖𝑖=1 [∏𝑛𝑛𝑖𝑖=1𝜇𝜇(𝑥𝑥𝑖𝑖, 𝛃𝛃)𝑦𝑦𝑖𝑖] ∏𝑛𝑛𝑖𝑖=1𝑦𝑦𝑖𝑖!

(6)

11

langkah selanjutnya adalah melakukan turunan parsial fungsi ln-likelihood terhadap parameter estimasi. Fungsi ln-likelihood adalah sebagai berikut.

ln𝐿𝐿(𝛃𝛃) = � 𝑦𝑦𝑖𝑖ln𝜇𝜇(𝑥𝑥𝑖𝑖, 𝛃𝛃) − � 𝜇𝜇(𝑥𝑥𝑖𝑖, 𝛃𝛃) − � ln𝜇𝜇(𝑦𝑦𝑖𝑖!) 𝑛𝑛 𝑖𝑖=1 𝑛𝑛 𝑖𝑖=1 𝑛𝑛 𝑖𝑖=1

jika 𝜇𝜇(𝑥𝑥𝑖𝑖, 𝛃𝛃) = exp (𝐗𝐗𝑖𝑖𝑇𝑇𝛃𝛃) maka persamaannya akan menjadi persamaan berikut. ln𝐿𝐿(𝛃𝛃) = � 𝑦𝑦𝑖𝑖ln [exp�𝐗𝐗iT𝛃𝛃�] − � exp (𝐗𝐗iT𝛃𝛃) − � ln(𝑦𝑦𝑖𝑖!) 𝑛𝑛 𝑖𝑖=1 𝑛𝑛 𝑖𝑖=1 𝑛𝑛 𝑖𝑖=1 ln𝐿𝐿(𝛃𝛃) = ��𝑦𝑦𝑖𝑖�𝐗𝐗iT𝛃𝛃� − exp�𝐗𝐗iT𝛃𝛃� − ln(𝑦𝑦𝑖𝑖!)� 𝑛𝑛 𝑖𝑖=1

berdasarkan rumus tersebut, dapat diketahui bahwa 𝛽𝛽̂𝑘𝑘 adalah penyelesaian dari turunan pertama fungsi logaritma natural dari Likelihood. Selanjutnya persaman di atas diturunkan terhadap 𝛃𝛃𝑇𝑇 menjadi turunan kedua.

𝜕𝜕𝑇𝑇𝑇𝑇𝐿𝐿(𝛃𝛃)

𝜕𝜕𝛃𝛃

T

= 0

𝜕𝜕ln𝐿𝐿(𝛃𝛃)

𝜕𝜕𝛃𝛃

T

= � 𝑦𝑦

𝑖𝑖

𝑥𝑥

𝑖𝑖

− � 𝑥𝑥

𝑖𝑖

exp�𝐱𝐱

𝐣𝐣𝐓𝐓

𝛃𝛃�

𝑛𝑛 𝑖𝑖=1 𝑛𝑛 𝑖𝑖=1

alternatif lain yang dapat digunakan untuk mendapatkan penyelesaian dari

Maximum Likelihood Estimation (MLE) adalah dengan metode iterasi numerik

yaitu Newton-Raphson. Algoritma metode Newton-Raphson dapat dituliskan sebagai berikut.

1. Menentukan nilai taksiran awal 𝛽𝛽̂(0). Penentuan nilai awal dapat diperoleh dengan metode Ordinary Least Square (OLS). Yaitu sebagai berikut. 𝛃𝛃�(0) = (𝐗𝐗𝑇𝑇𝐗𝐗)−1𝐗𝐗𝑇𝑇𝐘𝐘 Dengan 𝑋𝑋𝑛𝑛𝑥𝑥(𝑘𝑘+1) = � 1 𝑋𝑋11 ⋯ ⋮ ⋮ ⋮ 1 𝑋𝑋1𝑛𝑛 ⋯ 𝑋𝑋𝑘𝑘1 ⋮ 𝑋𝑋𝑘𝑘𝑛𝑛 � dan 𝑦𝑦 = [𝑦𝑦1𝑦𝑦2… 𝑦𝑦3]𝑇𝑇 2. Membentuk vektor gradien g.

𝐠𝐠𝐓𝐓(𝛃𝛃�

(𝑚𝑚))(𝑘𝑘+1)𝑥𝑥1 = �𝜕𝜕ln𝐿𝐿(𝛃𝛃)𝜕𝜕𝛃𝛃0 ,𝜕𝜕ln𝐿𝐿(𝛃𝛃)𝜕𝜕𝛃𝛃1 , … ,𝜕𝜕ln𝐿𝐿(𝛃𝛃)∂𝛃𝛃k � 𝛽𝛽=𝛽𝛽(𝑚𝑚)

(7)

12

Dengan Var�𝛃𝛃�� = −𝐸𝐸�𝐇𝐇−1(𝛃𝛃)� �

4. Memasukkan nilai 𝛽𝛽̂(0) kedalam elemen-elemen vector g dan matriks H

hingga diperoleh vektor g(𝛽𝛽̂(𝟎𝟎)) dan matriks H(𝛽𝛽̂(0)).

5. Mulai dari m = 0 hingga mendapatkan iterasi yang konvergen. 𝛃𝛃�(𝑚𝑚+1) = 𝛃𝛃�(𝑚𝑚)− 𝐇𝐇−1�𝛃𝛃�(𝑚𝑚)�𝐠𝐠�𝛃𝛃�(𝑚𝑚)�

Nilai 𝛃𝛃�(𝑚𝑚) merupakan sekumpulan penaksir parameter yang konvergen

pada iterasi ke-m.

6. Jika belum didapat penaksiran parameter yang konvergen, maka dilanjutkan kembali langkah 5 hingga iterasi ke m = (m+1)

2.2 Overdispersion

Metode Regresi Roisson mempunyai kondisi dimana nilai rata-rata dan variansi dari variabel respon bernilai sama. Namun, ada kalanya terjadi fenomena

over/under dispersion dalam data yang dimodelkan dengan distribusi Poisson yaitu

variansi lebih besar atau lebih kecil daripada rata-rata [13]. Overdispersion merupakan nilai disperse Khi Kuadrat Pearson atau deviance yang dibagi dengan

derajat bebasnya, diperoleh nilai lebih besar dari 1. Misalkan 𝜃𝜃 merupakan

parameter dispersion, maka jika 𝜃𝜃 lebih dari satu artinya terjadi overdispersion

pada Regresi Poisson, jika 𝜃𝜃 kurang dari satu artinya terjadi underdispersion dan

jika 𝜃𝜃 = 1 berarti tidak terjadi kasus overdispersion atau underdispersion yang

disebut dengan equidispersion [6].

Pengujian overdispersion dapat dilihat melalui pengujian dengan 𝐻𝐻0 yaitu

𝜃𝜃 sama dengan nol maka tidak terjadi kasus overdispersion dan 𝐻𝐻1 yaitu 𝜃𝜃 tidak

sama dengan nol maka terjadi kasus overdispersion dengan menggunakan taraf signifikan 𝛼𝛼 maka 𝐻𝐻0 ditolak jika P-value dari estimasi 𝜃𝜃 yang dihasilkan kurang dari 𝛼𝛼.

2.3 Model Generalized Poisson Regression

Model Generalized Poisson Regression (GPR) merupakan suatu model yang sesuai untuk data count dimana terjadi pelanggaran asumsi rata-rata sampel sama dengan variansi sampel pada distribusi poisson, atau dengan kata lain jika

(8)

13

terjadi over/under dispersion. Sehingga selain 𝜇𝜇 dalam GPR terdapat θ sebagai

parameter dispersi [6].

Model Generalized Poisson Regression mirip dengan model Regresi Poisson yaitu merupakan suatu model dari Generalized Linear Model (GLM) [14].

Generalized Linear Model (GLM) merupakan perluasan dari model regresi umum

untuk peubah respon memiliki sebaran keluarga eksponensial. Distribusi

Generalized Poisson Regression diberikan sebagai berikut [6].

𝑓𝑓(𝜇𝜇𝑖𝑖, 𝜃𝜃, 𝑦𝑦𝑖𝑖) = �1+𝜃𝜃𝜇𝜇𝜇𝜇𝑖𝑖 𝑖𝑖

𝑦𝑦𝑖𝑖(1+𝜃𝜃𝑦𝑦𝑖𝑖)𝑦𝑦𝑖𝑖−1

𝑦𝑦𝑖𝑖! 𝑒𝑒𝑥𝑥𝑝𝑝 �

−𝜇𝜇𝑖𝑖(1+𝜃𝜃𝑦𝑦𝑖𝑖)

1+𝜃𝜃𝜇𝜇𝑖𝑖 �

berdasarkan rumus tersebut, dapat diketahui bahwa nilai 𝑦𝑦𝑖𝑖 adalah 0.1. Rata-rata dan variansi model Generalized Poisson Regression adalah sebagai berikut.

𝐸𝐸(𝑦𝑦𝑖𝑖|𝑥𝑥𝑖𝑖) = 𝜇𝜇𝑖𝑖 dan 𝑉𝑉𝑉𝑉𝑉𝑉(𝑦𝑦𝑖𝑖|𝑥𝑥𝑖𝑖) = 𝜇𝜇𝑖𝑖(1 + 𝜃𝜃𝜇𝜇𝑖𝑖)2

jika θ sama dengan nol maka model akan menjadi Regresi Poisson biasa. Jika θ lebih besar dari nol, maka model Generalized Poisson Regression merepresentasikan data count yang overdispersion, dan jika θ kurang dari nol maka merepresentasikan data count yang underdispersion. Model Generalized Poisson

Regression mempunyai bentuk yang sama dengan model Regresi Poisson.

ln�𝑌𝑌�� = 𝑿𝑿𝑖𝑖𝑇𝑇𝜷𝜷 = 𝛽𝛽0+ 𝛽𝛽1𝑥𝑥𝑖𝑖1+ 𝛽𝛽2𝑥𝑥𝑖𝑖2+ ⋯ + 𝛽𝛽𝑝𝑝𝑥𝑥𝑖𝑖𝑝𝑝

𝑌𝑌� = exp(𝑿𝑿𝑖𝑖𝑇𝑇𝜷𝜷) = 𝑒𝑒𝑥𝑥𝑝𝑝(𝛽𝛽0+ 𝛽𝛽1𝑥𝑥𝑖𝑖1+ 𝛽𝛽2𝑥𝑥𝑖𝑖2+ ⋯ + 𝛽𝛽𝑝𝑝𝑥𝑥𝑖𝑖𝑝𝑝) (2.6)

2.3.1 Penaksiran Parameter Generalized Poisson Regression (GPR)

Penaksiran parameter pada model Generalized Poisson Regression dengan fungsi distribusi dilakukan dengan metode Maximum Likelihood Estimator (MLE). Fungsi likelihood untuk model Generalized Poisson Regression adalah sebagai berikut. 𝐿𝐿(𝜇𝜇𝑖𝑖, 𝜃𝜃) = � 𝑓𝑓(𝜇𝜇𝑖𝑖, 𝜃𝜃) 𝑛𝑛 𝑖𝑖=1 𝐿𝐿(𝜇𝜇𝑖𝑖, 𝜃𝜃) = � ��1 + 𝜃𝜃𝜇𝜇𝜇𝜇𝑖𝑖 𝑖𝑖� 𝑦𝑦𝑖𝑖(1 + 𝜃𝜃𝑦𝑦𝑖𝑖)𝑦𝑦𝑖𝑖−1 𝑦𝑦𝑖𝑖! Δ� 𝑛𝑛 𝑖𝑖=1 𝐿𝐿(𝜇𝜇𝑖𝑖, 𝜃𝜃) = � ��1 + 𝜃𝜃𝜇𝜇𝜇𝜇𝑖𝑖 𝑖𝑖� 𝑦𝑦𝑖𝑖 �(1 + 𝜃𝜃𝑦𝑦𝑦𝑦 𝑖𝑖)𝑦𝑦𝑖𝑖−1 𝑖𝑖! 𝑛𝑛 𝑖𝑖=1 � Δ 𝑛𝑛 𝑖𝑖=1 � 𝑛𝑛 𝑖𝑖=1

(9)

14

Keterangan:

Δ = exp �−𝜇𝜇𝑖𝑖(1 + 𝜃𝜃𝑦𝑦𝑖𝑖) 1 + 𝜃𝜃𝜇𝜇𝑖𝑖 �

selanjutnya diubah dalam bentuk fungsi logaritma natural menjadi. ln 𝐿𝐿(𝜇𝜇𝑖𝑖, 𝜃𝜃) = ln �∏ �� 𝜇𝜇𝑖𝑖 1+𝜃𝜃𝜇𝜇𝑖𝑖� 𝑦𝑦𝑖𝑖 ∏ (1+𝜃𝜃𝑦𝑦𝑖𝑖)𝑦𝑦𝑖𝑖−1 𝑦𝑦𝑖𝑖! 𝑛𝑛 𝑖𝑖=1 ∏𝑛𝑛𝑖𝑖=1Δ� 𝑛𝑛 𝑖𝑖=1 � ln 𝐿𝐿(𝜇𝜇𝑖𝑖, 𝜃𝜃) = � � 𝑦𝑦𝑖𝑖ln(𝜇𝜇𝑖𝑖) − 𝑦𝑦𝑖𝑖ln(1 + 𝜃𝜃𝜇𝜇𝑖𝑖) + (𝑦𝑦𝑖𝑖 − 1) ln(1 + 𝜃𝜃𝑦𝑦𝑖𝑖) − ln(𝑦𝑦𝑖𝑖!) −𝜇𝜇𝑖𝑖1 + 𝜃𝜃𝜇𝜇(1 + 𝜃𝜃𝑦𝑦𝑖𝑖) 𝑖𝑖 � 𝑛𝑛 𝑖𝑖=1 keterangan: Δ = exp �� �−𝜇𝜇𝑖𝑖(1 + 𝜃𝜃𝑦𝑦1 + 𝜃𝜃𝜇𝜇 𝑖𝑖) 𝑖𝑖 � 𝑛𝑛 𝑖𝑖=1 �

substitusikan nilai 𝜇𝜇𝑖𝑖 = exp(𝐗𝐗𝑖𝑖𝑇𝑇𝛃𝛃) maka diperoleh sebagai berikut.

ln 𝐿𝐿(𝛃𝛃, 𝜃𝜃) = � � 𝑦𝑦𝑖𝑖ln(exp(𝐗𝐗𝑖𝑖𝑇𝑇𝛃𝛃)) − 𝑦𝑦𝑖𝑖ln(1 + 𝜃𝜃 exp(𝐗𝐗𝑖𝑖𝑇𝑇𝛃𝛃)) − ln (𝑦𝑦𝑖𝑖!) +(𝑦𝑦𝑖𝑖 − 1) ln(1 + 𝜃𝜃𝑦𝑦𝑖𝑖) −exp(𝐗𝐗𝑖𝑖 𝑇𝑇𝛃𝛃)( 1 + 𝜃𝜃𝑦𝑦 𝑖𝑖) 1 + 𝜃𝜃 exp( 𝐗𝐗𝑖𝑖𝑇𝑇𝛃𝛃) � 𝑛𝑛 𝑖𝑖=1 ln 𝐿𝐿(𝛃𝛃, 𝜃𝜃) = � � 𝑦𝑦𝑖𝑖(𝐗𝐗𝑖𝑖 𝑇𝑇𝛃𝛃) − 𝑦𝑦 𝑖𝑖ln(1 + 𝜃𝜃 𝑒𝑒𝑥𝑥𝑝𝑝(𝑿𝑿𝑖𝑖𝑇𝑇𝜷𝜷)) + (𝑦𝑦𝑖𝑖− 1) ln(1 + 𝜃𝜃𝑦𝑦𝑖𝑖) − ln(𝑦𝑦𝑖𝑖!) − exp(𝐗𝐗𝑖𝑖𝑇𝑇𝛃𝛃)( 1 + 𝜃𝜃𝑦𝑦𝑖𝑖)(1 + 𝜃𝜃 exp( 𝐗𝐗𝑖𝑖𝑇𝑇𝛃𝛃))−1 � 𝑛𝑛 𝑖𝑖=1

kemudian persamaan logaritma natural dari fungsi Likelihood diturunkan terhadap

𝛃𝛃𝑇𝑇dan disamakan dengan nol untuk mendapatkan parameter 𝛃𝛃. Berikut hasil

turunan kedua: 𝜕𝜕 ln 𝐿𝐿(𝛃𝛃, 𝜃𝜃) 𝜕𝜕𝛃𝛃𝑇𝑇 = �(𝐘𝐘𝑖𝑖𝐗𝐗𝑖𝑖𝑇𝑇− 𝑦𝑦𝑖𝑖𝜃𝜃 exp( 𝑛𝑛 𝑖𝑖=1 𝐗𝐗𝑖𝑖𝑇𝑇𝛃𝛃)(1 + 𝜃𝜃 exp( 𝐗𝐗𝑖𝑖𝑇𝑇𝛃𝛃))−1− ∆) keterangan: ∆= (1 + θ𝑦𝑦𝑖𝑖) �𝐗𝐗𝑖𝑖 𝑇𝑇exp( 𝐗𝐗 𝑖𝑖 𝑇𝑇𝛃𝛃) �1 + 𝜃𝜃(𝐗𝐗 𝑖𝑖 𝑇𝑇𝛃𝛃)�−1− 𝜃𝜃𝑥𝑥 𝑖𝑖𝑇𝑇(exp( 𝐗𝐗𝑖𝑖𝑇𝑇𝛃𝛃))2 (1 + 𝜃𝜃(𝐗𝐗𝑖𝑖𝑇𝑇𝛃𝛃))−2 �

kemudian untuk mendapatkan penaksiran parameter 𝜃𝜃 maka persamaan tersebut

diturunkan terhadap 𝜃𝜃 dan disamakan dengan nol. Bentuk turunan yang dihasilkan

sebagai berikut. 𝜕𝜕 ln 𝐿𝐿(𝛃𝛃, 𝜃𝜃) 𝜕𝜕𝜃𝜃 = � �𝑦𝑦𝑖𝑖(𝐗𝐗𝑖𝑖 𝑇𝑇𝛃𝛃)(1 + 𝜃𝜃 exp( 𝐗𝐗 𝑖𝑖 𝑇𝑇𝛃𝛃))−1+ 𝑦𝑦 𝑖𝑖 (𝑦𝑦𝑖𝑖 − 1)(1 + 𝜃𝜃𝑦𝑦𝑖𝑖)−1− ∆ � 𝑛𝑛 𝑖𝑖=1

(10)

15

keterangan:

∆= exp(𝐗𝐗𝑖𝑖𝑇𝑇𝛃𝛃) �

𝑦𝑦𝑖𝑖(1 + 𝜃𝜃 exp( 𝐗𝐗𝑖𝑖𝑇𝑇𝛃𝛃))−1− (1 + 𝜃𝜃𝑦𝑦𝑖𝑖) exp(𝐗𝐗𝑖𝑖𝑇𝑇𝛃𝛃)

�1 + 𝜃𝜃(𝐗𝐗𝑖𝑖𝑇𝑇𝛃𝛃)�−2 �

2.4 Analisis Negative Binomial Regression

Negative Binomial Regression merupakan salah satu model regresi dari Generalized Linier Model (GLM). Negative Binomial Regression merupakan suatu

model yang sesuai untuk data count dimana terjadi pelanggaran asumsi

equidispersion pada Regresi Poisson. Fungsi distribusi peluang model Negative Binomial Regression adalah sebagai berikut [7].

𝑓𝑓𝑖𝑖(𝑦𝑦𝑖𝑖, 𝜇𝜇𝑖𝑖, 𝜙𝜙) = 𝑟𝑟(𝑦𝑦𝑖𝑖+𝜙𝜙1) 𝑟𝑟�𝜙𝜙1�𝑦𝑦𝑖𝑖!� 1 1+𝜙𝜙𝜇𝜇𝑖𝑖� 1 𝜙𝜙 𝜙𝜙𝜇𝜇𝑖𝑖 1+𝜙𝜙𝜇𝜇𝑖𝑖� 𝑦𝑦𝑖𝑖 , 𝑦𝑦𝑖𝑖 = 0,1,2, …

model 𝜇𝜇𝑖𝑖 dari Negative Binomial Regression dinyatakan dalam bentuk yang sama

dengan model regresi Generalized Poisson Regression. Sebaran Negative Binomial

Regression mempunyai rata-rata dan variansi sebagai berikut.

𝐸𝐸(𝑦𝑦𝑖𝑖) = 𝜇𝜇𝑖𝑖 𝑉𝑉𝑉𝑉𝑉𝑉(𝑦𝑦𝑖𝑖) = 𝜇𝜇𝑖𝑖 + 𝜙𝜙𝜇𝜇𝑖𝑖2

2.4.1 Penaksiran Parameter Negative Binomial Regression

Penaksiran parameter Negative Binomial Regression dilakukan dengan menggunakan metode Maximum Likelihood Estimation (MLE). Fungsi likelihood dari Negative Binomial Regression adalah sebagai berikut.

𝐿𝐿(𝛽𝛽; 𝜙𝜙) = � �� � ln(𝑉𝑉 + 𝜙𝜙−1) 𝑦𝑦𝑖𝑖=1 𝑟𝑟=0 � − ln(𝑦𝑦𝑖𝑖!) + 𝑦𝑦𝑖𝑖ln(𝜙𝜙𝜇𝜇𝑖𝑖) − �𝑦𝑦𝑖𝑖+𝜙𝜙1� ln( 𝜙𝜙𝜇𝜇𝑖𝑖+ 1)� 𝑛𝑛 𝑖𝑖=1

fungsi ln likelihood didefinisikan sebagai berikut.

ln 𝑇𝑇( 𝛽𝛽; 𝜙𝜙) = � �� � ln(𝑉𝑉 + 𝜙𝜙−1) 𝑦𝑦𝑖𝑖=1 𝑟𝑟=0 � − ln(𝑦𝑦𝑖𝑖!) + 𝑦𝑦𝑖𝑖ln(𝜙𝜙𝜇𝜇𝑖𝑖) − �𝑦𝑦𝑖𝑖+𝜙𝜙� ln( 𝜙𝜙𝜇𝜇1 𝑖𝑖+ 1)� 𝑛𝑛 𝑖𝑖=1

Penaksiran parameter Negative Binomial Regression dapat dilakukan dengan langkah-langkah sebagai berikut [15].

(11)

16

2. Taksir 𝛃𝛃 dengan iterasi Fisher Scoring dengan asumsi 𝜙𝜙 = 𝜙𝜙�1. Berikut adalah rumus untuk iterasi Fisher Scoring.

𝛃𝛃�i+1 = 𝛃𝛃�i+ (𝐗𝐗𝐓𝐓𝐖𝐖𝐗𝐗)−1𝐗𝐗𝐓𝐓𝐖𝐖𝐖𝐖

dengan 𝐖𝐖 adalah matriks pembobot dengan ukuran n × n, dengan elemen

diagonal ke-1 adalah 𝑊𝑊𝑖𝑖 dan vektor kolom dengan elemen ke-1 yaitu 𝑍𝑍𝑖𝑖, dengan 𝑤𝑤𝑖𝑖 dan 𝑧𝑧𝑖𝑖 adalah sebagai berikut.

𝑤𝑤𝑖𝑖 =1 + 𝜙𝜙𝜇𝜇𝜇𝜇𝑖𝑖

𝑖𝑖 𝑑𝑑𝑉𝑉𝑇𝑇 𝑧𝑧𝑖𝑖 =

(𝑦𝑦𝑖𝑖 − 𝜇𝜇𝑖𝑖) 𝜇𝜇𝑖𝑖 Iterasi berakhir jika 𝛃𝛃�i+1= 𝛃𝛃�i

3. 𝛽𝛽̂ yang dihasilkan dan iterasi Fisher Scoring digunakan untuk menaksir

parameter 𝜙𝜙 dengan iterasi Raphson. Persamaan iterasi

Newton-Raphson adalah sebagai berikut.

𝜙𝜙�𝑖𝑖+1= 𝜙𝜙�𝑖𝑖− 𝑓𝑓 ′(𝜙𝜙) 𝑓𝑓′′(𝜙𝜙) Iterasi berakhir jika 𝜙𝜙�𝑖𝑖+1= 𝜙𝜙�𝑖𝑖

4. Jika �𝜙𝜙�𝑖𝑖+1− 𝜙𝜙�𝑖𝑖� < 𝜀𝜀 maka penaksiran selesai, jika tidak makan digunakan parameter 𝜙𝜙�𝑖𝑖 = 𝜙𝜙�𝑖𝑖+1 dan kembali ke Langkah dua.

2.5 Pengujian Parameter Model

Pengujian estimasi parameter model Generalized Poisson Regression (GPR) dan Negative Binomial Regression dapat dilakukan dengan dua cara yaitu pengujian secara serentak dan pengujian secara parsial atau individu sebagai berikut.

1. Uji Serentak

Pengujian parameter model GPR dilakukan dengan menggunakan metode

Maximum Likelihood Ratio Test (MLRT) seperti pada pengujian parameter

model Regresi Poisson, dengan 𝐻𝐻0 yaitu 𝛽𝛽1 = 𝛽𝛽2 = ⋯ = 𝛽𝛽𝑘𝑘 = 0 maka semua

parameter tidak berpengaruh signifikan terhadap model dan 𝐻𝐻1yaitu paling

sedikit ada satu 𝛽𝛽𝑗𝑗 ≠ 0 ; 𝑗𝑗 = 1,2, … , 𝑘𝑘 maka dapat dikatakan tidak ada satu parameter yang berpengaruh signifikan dalam model dengan statistik uji yang digunakan adalah sebagai berikut.

(12)

17

𝐷𝐷�𝛽𝛽̂𝑗𝑗� = −2𝑇𝑇𝑇𝑇 �𝐿𝐿(𝜔𝜔𝐿𝐿�Ω��� )� (2.7)

berdasarkan rumus tersebut, maka dapat diketahui 𝐿𝐿�Ω�� adalah nilai likelihood

untuk model lengkap dengan melibatkan variabel prediktor 𝐿𝐿(𝜔𝜔�) adalah nilai

likelihood untuk model sederhana tanpa melibatkan variabel prediktor dengan

kriteria pengujian yaitu tolak 𝐻𝐻0 apabila 𝐺𝐺 lebih besar 𝜒𝜒2𝑑𝑑𝑑𝑑,𝑎𝑎 dengan db adalah

banyaknya parameter model yang signifikan. Jika 𝐻𝐻0 ditolak berarti ada satu

𝛽𝛽𝑗𝑗 ≠ 0 yang menunjukkan bahwa 𝑥𝑥𝑗𝑗 berpengaruh secara signifikan terhadap

model.

2. Uji Parsial

Pengujian secara parsial digunakan untuk mengetahui apakah variabel prediktor berpengaruh terhadap variabel respon secara individual yang dihasilkan [16]. Statistik uji yang digunakan untuk uji parsial yaitu uji Wald yaitu 𝐻𝐻0 yaitu 𝛽𝛽𝑗𝑗 sama dengan nol untuk suatu j = 1,2,…,p maka variabel prediktor tidak berpengaruh signifikan terhadap model dan 𝐻𝐻1 yaitu 𝛽𝛽𝑗𝑗 tidak sama dengan nol untuk suatu j = 1,2,…,p maka variabel prediktor berpengaruh

signifikan terhadap model. Dengan taraf signifikansi 𝛼𝛼 = 0.05 maka rumus

statistik uji Wald sebagai berikut.

𝑡𝑡𝑗𝑗 = 𝛽𝛽�𝑗𝑗

𝑆𝑆𝑆𝑆�𝛽𝛽�𝑗𝑗� (2.8)

berdasarkan rumus tersebut, dapat diketahui bahwa 𝛽𝛽̂𝑗𝑗 adalah taksiran

parameter 𝛽𝛽𝑗𝑗 dan 𝑆𝑆𝐸𝐸�𝛽𝛽̂𝑗𝑗� adalah taksiran standar error dari 𝛽𝛽𝑖𝑖. Kriteria pengujian yaitu 𝐻𝐻0 ditolak jika |𝑍𝑍ℎ𝑖𝑖𝑖𝑖| > 𝑍𝑍∝/2 atau tolak 𝐻𝐻0 jika nilai signifikansi kurang dari 𝛼𝛼 dimana 𝛼𝛼 adalah tingkat signifikansi dan db adalah derajat bebas.

2.6 Uji Kelayakan Model

Salah satu metode yang dapat digunakan untuk menguji kelayakan model

(13)

18

yaitu model layak dan H1 yaitu model tidak layak. Rumus yang digunakan untuk

menghitung nilai Khi Kuadrat Pearson adalah sebagai berikut. 𝜒𝜒2 = ∑ (𝑦𝑦𝑖𝑖−𝜇𝜇)2

𝑉𝑉𝑎𝑎𝑟𝑟(𝑌𝑌) 𝑛𝑛

𝑖𝑖=1 (2.9)

berdasarkan rumus tersebut, dapat diketahui bahwa 𝑦𝑦𝑖𝑖 adalah nilai variabel respon ke-i dan 𝜇𝜇 adalah penduga bagi respon rata-rata ke-i. Apabila 𝜒𝜒2 < 𝜒𝜒2𝑎𝑎(𝑛𝑛−𝑝𝑝) maka

H0 diterima, hal ini menunjukan bahwa model yang diperoleh layak. Model yang

lebih baik untuk digunakan adalah model yang memiliki nilai Khi Kuadrat Pearson lebih kecil.

Pemodelan diperlukan untuk mendapatkan hubungan yang menggambarkan variabel respon dan variabel prediktor. Model terbaik Generalized Poisson

Regression adalah model yang mempunyai nilai AIC terkecil. AIC didefinisikan

sebagai berikut [18].

𝐴𝐴𝑉𝑉𝐴𝐴 = −2 ln 𝐿𝐿(𝜷𝜷) + 2𝑝𝑝 (2.10)

berdasarkan rumus tersebut, dapat diketahui bahwa 𝐿𝐿(𝜷𝜷) adalah nilai likelihood

yang terdapat pada model. Selanjutnya variabel p adalah banyaknya parameter yang digunakan pada persamaan dalam metode yang digunakan.

2.7 Kemiskinan

Kemiskinan adalah ketidakmampuan memenuhi standar minimum kebutuhan dasar yang meliputi kebutuhan makan maupun non makan, membandingkan tingkat konsumsi penduduk dengan garis kemiskinan atau jumlah rupiah untuk konsumsi orang perbulan [1]. Faktor jumlah penduduk yang besar apabila diikuti dengan kualitas yang memadai merupakan modal pembangunan yang handal, namun apabila kualitas rendah justru akan menjadi beban pembangunan. Pertumbuhan penduduk yang cepat akan berdampak negatif terhadap penduduk miskin terutama yang paling miskin [19].

Faktor lain yang mempengaruhi jumlah penduduk miskin adalah pertumbuhan ekonomi. Faktor yang juga mempengaruhi jumlah penduduk miskin adalah pendidikan dan Kesehatan [19]. Menurut Sachs di dalam bukunya The End

of Proverty salah satu mekanisme dalam penuntasan kemiskinan ialah

Referensi

Dokumen terkait

meningkatnya penderita tuberkulosis di Kabupaten Probolinggo, maka dalam penelitian ini dilakukan analisis Generalized Poisson Regression (GPR) yang digunakan untuk

Metode kriging merupakan sebuah metode yang memberikan estimasi linier terbaik dari suatu titik atau rata-rata blok, yaitu memberikan nilai variansi minimum. Metode ini dikenal

Berdasarkan meningkatnya penderita tuberkulosis di Kabupaten Probolinggo, maka dalam penelitian ini dilakukan analisis Generalized Poisson Regression (GPR) yang digunakan

Sebelum melakukan analisis dengan tiga metode, yaitu regresi poisson, Generalized Poisson Regression dan regresi binomial negatif maka perlu dilakukan

Dengan memanfaatkan UML kita dapat membuat model untuk semua jenis perangkat lunak, dimana apikasi tersebut dapat berjalan pada perangkat keras, sistem operasi dan

Metode biaya rata-rata membebankan biaya rata-rata yang sama ke setiap unit. Metode ini didasarkan pada asumsi bahwa barang yang terjual seharusnya dibebankan dengan biaya

Media padat yang digunakan umumnya adalah Plate Count Agar (PCA) atau Nutrient Agar (NA) sedangkan untuk inokulasi suspensi homogenat sampel ke dalam media,

Dalam rangka untuk asumsi model matematis ini, digunakan persamaan berikut: = + 2.12 = + 2.13 Dimana adalah nilai minimal semua variabel pada iterasi ke-t, menunjukkan vektor