PEMODELAN JUMLAH KASUS KANKER SERVIKS DI JAWA TIMUR MENGGUNAKAN ANALISIS
GENERALIZED POISSON REGRESSION (GPR)
Oleh:
RIZA INAYAH / 1309.030.042
Jurusan Statistika
Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Teknologi Sepuluh Nopember Surabaya
2012
Dosen Pembimbing:
DR. Purhadi, M.Sc
Outline
PENDAHULUAN TINJAUAN
PUSTAKA METODOLOGI
PENELITIAN ANALISIS DAN
PEMBAHASAN KESIMPULAN
PENDAHULUAN TINJAUAN
PUSTAKA METODOLOGI
PENELITIAN ANALISIS DAN
PEMBAHASAN KESIMPULAN
Data count
Regresi Poisson
Generalized Poisson
Regression (GPR)dsb.
PENELITIAN SEBELUMNYA
Analisis Regresi Poisson dan
Generalized Poisson Regression (GPR)
Listiani (2010) PEMODELAN
REGRESI POISSON PADA FAKTOR-
FAKTOR YANG MEMPENGARUHI ANGKA KEMATIAN
BAYI DI JAWA TIMUR TAHUN
2007
Kanker Serviks
Khasbiyah (2004)
BEBERAPA FAKTOR RISIKO KANKER SERVIKS UTERI (Studi Pada Penderita Kanker Serviks Uteri Di Rumah
Sakit Dokter Kariadi Semarang Pada Bulan
Agustus-September 2004)
Rumusan
Masalah Tujuan
model terbaik untuk pemodelan jumlah kasus
kanker serviks di Jawa Timur tahun 2010
menggunakan analisis Generalized Poisson
Regression (GPR) berdasarkan kriteria nilai
AIC terkecil yang dihasilkan
Data yang digunakan: jumlah kasus kanker serviks yang terjadi di 29 kabupaten dan 8 kota yang ada di provinsi Jawa Timur tahun 2010.
Kota Batu tidak diikutsertakan dalam penelitian ini karena dari pihak dinas kesehatan provinsi Jawa Timur tidak menerima laporan data kasus kanker serviks yang terjadi di kota Batu.
Untuk mendapatkan model terbaik berdasarkan kriteria nilai AIC yang paling kecil.
BATASAN MASALAH
PENDAHULUAN TINJAUAN
PUSTAKA METODOLOGI
PENELITIAN ANALISIS DAN
PEMBAHASAN KESIMPULAN
REGRESI POISSON
Regresi Poisson digunakan untuk menganalisis variabel respon bertipe diskrit dan integer tidak negatif. Metode ini biasanya diterapkan pada penelitian kesehatan masyarakat, biologi, dan teknik dimana observabel responnya (y) berupa cacahan objek yang merupakan fungsi dari sejumlah karakteristik tertentu (x). Probabilitas dari Y “banyaknya suatu kejadian” yang berdistribusi Poisson yaitu (Agresti, 2002).
y = 0,1,2,...
dengan µ adalah rata-rata jumlah kejadian yang distribusi Poisson.
( ) ; ! y y e
P µ =
−µµ
yREGRESI POISSON
Beberapa karakteristik percobaan yang mengikuti sebaran distribusi Poisson (Cameron dan Trivedi, 1998):
a. kejadian yang terjadi pada populasi yang besar dengan probabilitas yang kecil
b. Bergantung pada interval waktu tertentu
c. Kejadian yang termasuk dalam counting process
d. Perulangan dari kejadian yang mengikuti sebaran distribusi binomial
REGRESI POISSON
Asumsi pokok Equi dispersi E(Y) = Var (Y)
Penaksir parameter:
Maximum Likelyhood Estimation (MLE)
) ...
exp(
)
exp(
0 1 1i 2 2i k kii
β β x β x β x
µ = x
Tiβ = + + + +
GENERALIZED POISSON REGRESSION (GPR)
Model ini merupakan suatu model yang sesuai untuk jenis data count yang apabila dilakukan analisis regresi Poisson, ditemukan adanya ketidaksamaan antara nilai mean dan varians dari variabel respon atau terjadi over/under dispersi. Dalam GPR selain ada parameter µ juga ada θ sebagai parameter dispersi.
(Famoye dkk, 2005)
y = 0,1,2,...
) ...
exp(
)
exp(
0 1 1i 2 2i k kii
β β x β x β x
µ = x
Tiβ = + + + +
Akaike Information Criterion (AIC)
Akaike Information Criterion (AIC) merupakan salah satu kriteria dalam menentukan model terbaik regresi.
Menurut Bozdogan dalam Listiani (2010) Akaike Information Criterion (AIC) didefinisikan sebagai berikut.
adalah nilai Likelihood , dan k adalah jumlah parameter.
Model terbaik adalah model yang mempunyai nilai AIC terkecil
( ) k
L
AIC = − 2 ln β + 2
( ) β
L
Multikolinieritas
Multikolinearitas adalah kondisi terdapatnya hubungan linier atau korelasi yang tinggi antara masing-masing variabel independen dalam model regresi.
KoefisienKorelasi• Koefisien korelasi (r
ij) antara variabel prediktor lebih besar dari 0,95
Nilai VIF
Nilai Eigen
• Nilai eigen minimum untuk matriks
korelasi antar variabel prediktor kurang dari 0,05.
1 2
1 Rj
VIF = −
Over/Under Dispersi
Hipotesis:
H
0: θ = 0 (tidak terjadi kasus over dispersi) H
1: θ ≠ 0 (terjadi kasus over dispersi)
H
0ditolak jika P_value dari estimasi θ yang dihasilkan kurang dari α.
Taksiran dispersi diukur dengan nilai devians atau Pearson's Chi-Square yang dibagi derajat bebas. Data over dispersi jika taksiran dispersi lebih besar dari 1 dan under dispersi jika taksiran dispersi kurang dari 1.
Var (Y) > E (Y) : Over dispersi
Var (Y) < E (Y) :
Under dispersi
Kanker serviks
Kanker serviks adalah penyakit kanker yang terjadi pada daerah leher rahim, yaitu daerah pada organ reproduksi wanita yang merupakan pintu masuk ke arah rahim.
Kanker serviks 99,7 % disebabkan oleh
Human Papilloma Virus (HPV)onkogenik yang menyerang leher rahim.
Jenis virus HPV yang menyebabkan
kanker serviks dan paling fatal
akibatnya adalah virus HPV tipe 16 dan
18.
PENDAHULUAN TINJAUAN
PUSTAKA METODOLOGI
PENELITIAN ANALISIS DAN
PEMBAHASAN KESIMPULAN
SUMBER DATA
• Data dari Dinas Kesehatan propinsi Jawa Timur tentang jumlah kasus kanker
serviks yang terjadi di kabupaten/ kota yang ada di Jawa Timur tahun 2010
Variabel Respon
• Data hasil Survey Sosial Ekonomi Nasional (SUSENAS) BPS Jawa Timur tahun 2010
Variabel Prediktor
VARIABEL PENELITIAN
Y Jumlah kasus kanker serviks di setiap kabupaten/kota di Jawa Timur Tahun 2010 X1 Persentase sarana kesehatan di tiap kabupaten/kota di Jawa Timur
X2 Persentase tenaga medis di tiap kabupaten/kota di Jawa Timur
X3 Persentase penduduk perempuan yang umur kawin pertama ≤16 tahun di tiap kabupaten/kota di Jawa Timur
X4 Persentase penduduk dan Rumah Tangga (RT) perempuan di tiap kabupaten/kota di Jawa Timur
X5 Persentase daerah yang berstatus desa di tiap kabupaten/kota di Jawa Timur X6 Persentase penduduk yang tamat SMA di tiap kabupaten/kota di Jawa Timur X7 Persentase penduduk miskin di tiap kabupaten/kota di Jawa Timur
X8 Persentase penduduk yang menggunakan kondom di tiap kabupaten/kota di Jawa Timur
X9 Persentase perempuan yang pernah kawin dan jumlah anak yang dilahirkan lebih dari 4 di tiap kabupaten/kota di Jawa Timur
X10 Persentase penduduk perempuan yang berstatus kawin di tiap kabupaten/kota di Jawa Timur X Persentase penduduk perempuan usia 35 tahun ke atas di tiap kabupaten/kota di Jawa Timur
LANGKAH ANALISIS
Mendeskripsikan data dari setiap variabel yang digunakan
Melakukan deteksi multikolinieritas terhadap variabel- variabel bebas yang digunakan dan antisipasi
penanggulangannya jika memang ditemukan terjadi kasus multikolinieritas.
Mendapatkan model regresi Poisson dengan cara menaksir parameter model, menguji signifikansi parameter model (serentak dan parsial), serta mendapatkan nilai AIC dari model Regresi Poisson.
Melakukan pengecekan asumsi regresi Poisson yaitu equi-dispersi dari variabel respon. Jika terjadi kasus over/under dispersi, dilanjutkan analisis GPR dengan tahapan seperti analisis regresi poisson.
PENDAHULUAN TINJAUAN
PUSTAKA METODOLOGI
PENELITIAN ANALISIS DAN
PEMBAHASAN KESIMPULAN
Deskriptif Data
Variabel Rata-rata Varians Minimum Maksimum
Y 45,600 7493,5 0,00 479,00
X1 0,1135 0,0155 0,02 0,73
X2 1,4380 1,2820 0,20 7,52
X3 29,640 173,95 12,12 62,70
X4 50,669 1,1600 48,49 53,33
X5 60,830 1064,29 0,00 93,55
X6 11,292 34,805 2,50 25,58
X7 15,110 38,280 5,90 32,47
X8 0,2241 0,0975 0,00 1,35
X9 9,692 13,008 2,95 21,50
X 62,035 15,267 54,68 68,92
Deteksi Multikolinieritas
Xi Nilai VIF X1 11.3866 X2 9.10336 X3 5.94377 X4 3.48244 X5 9.05666 X6 10.6304 X7 4.92309 X8 1.38389 X9 2.58328 X10 5.67317 X11 2.50300
No. Nilai Eigen 1 4,36744 2 2,11208
3 1,43356
4 1,03309 5 0,86567 6 0,65703 7 0,17109
8 0,14837
9 0,10923 10 0,05864 11 0,04380
Koefisien korelasi Pearson antar X
i# r (X1, X2
)
= 0,900# r (X6,X5
) = 0,897
X1
dikeluarkan Dicek nilai
VIF X6
dikeluarkan Dicek nilai VIF
X1 dan X6 tidak ikut
Analisis
Regresi
Analisis Regresi Poisson
Estimasi parameter
Uji signifikansi parameter (serentak-
Parsial)
Pembentukan
model
Estimasi Parameter Regresi Poisson
Parameter Estimasi SE Z P-value
β
029,4017 2,6780 10,98 <0,0001 β
20,2563 0,0169 15,17 <0,0001 β
30,0615 0,0048 12,71 <0,0001 β
4-0,2792 0,0416 -6,71 <0,0001 β
5-0,0018 0,0020 -0,87 0,3879 β
7-0,1293 0,0102 -12,69 <0,0001 β
8-0,6100 0,0953 -6,40 <0,0001 β
90,0386 0,0134 2,89 0,0064 β
10-0,2150 0,0151 -14,28 <0,0001
β 0,0243 0,0095 2,56 0,0146
H
0: β
2= β
3= β
4= β
5= β
7= β
8= β
9= β
10= β
11= 0 H
1: paling sedikit ada satu β
j≠ 0
dengan j= 2,3,4,5,7,8,9,10,11
Uji signifikansi Parameter (serentak)
= 14,027
29;0,15)
χ
(Nilai devians :1724,6
Tolak H
0Uji signifikansi Parameter (Parsial)
H
0: β
j= 0 (pengaruh variabel ke-j tidak signifikan) H
1: β
j≠ 0 (pengaruh variabel ke-j signifikan)
Parameter Estimasi SE Z P-value
β0 29,4017 2,6780 10,98 <0,0001 β2 0,2563 0,0169 15,17 <0,0001 β3 0,0615 0,0048 12,71 <0,0001 β4 -0,2792 0,0416 -6,71 <0,0001 β5 -0,0018 0,0020 -0,87 0,3879 β7 -0,1293 0,0102 -12,69 <0,0001 β8 -0,6100 0,0953 -6,40 <0,0001
β9 0,0386 0,0134 2,89 0,0064
Model Regresi Poisson
+
− +
−
−
− +
= +
11 10
9 8
7 4
3 2
0243 ,
0 2150
, 0 0386
, 0 6100
, 0
1293 ,
0 2792
, 0 0615
, 0 2563
, 0 4017
, exp 29
ˆ X X X X
X X
X µ X
Nilai AIC :1744,6
Kriteria Nilai db Nilai/db
Pearson Chi-Square 1807,0600 28 64,5379
Analisis Generalized Poisson Regression
(GPR)
Estimasi parameter
Uji signifikansi parameter (serentak-
Parsial)
Pembentukan
model
Kemungkinan Model GPR dengan AIC Minimum
Kemungkinan Model
(Y dengan Xi ) AIC Parameter
Signifikan
X5 351,3 β0
X2, X5 351,5 β2 , β5, θ
X2, X8, X10 345,3 θ
X2, X8, X9, X10 345,2 β8, β9, θ X2, X4, X7, X8, X9 341,7 θ X2, X4, X5, X7, X10, X11 343,8 θ X2, X3, X7, X8, X9, X10, X11 338,9 θ X2, X4, X5, X7, X8, X9, X10, X11 339,6 θ
H
0: β
2= β
8= β
9= β
10= 0
H
1: paling sedikit ada satu β
j≠ 0 dengan j= 2,8,9,10
Uji signifikansi Parameter (serentak)
= 7,359 Nilai devians :333,2
Tolak H
024;0,15)
χ
(Uji signifikansi Parameter (Parsial)
H
0: β
j= 0 (pengaruh variabel ke-j tidak signifikan) H
1: β
j≠ 0 (pengaruh variabel ke-j signifikan)
Parameter Estimasi SE Z P-value
β0 15,5210 12,4912 1,24 0,2219*
β2 24,5522 17,8650 1,37 0,1776
β8 31,6841 20,6906 1,53 0,1342
β9 0,7642 0,4901 1,56 0,1274
β10 -0,7201 0,5102 -1,41 0,1665
θ 0,3467 0,0635 5,46 < 0,0001
*Tolak H0 pada taraf signifikan 23%
H
0: θ = 0 (tidak terjadi kasus over dispersi) H
1: θ ≠ 0 (terjadi kasus over dispersi)
Uji keberadaan Over dispersi
Parameter Estimasi SE Z P-value
θ 0,3467 0,0635 5,46 < 0,0001
Model GPR
Nilai AIC :345,2
− +
+
= +
10 9
8 2
7201 ,
0 7642
, 0
6841 ,
31 5522
, 24 5210
, exp 15
ˆ X X
X
µ X
10
9 8
2
7201 ,
0
7642 ,
0 6841
, 31 5522
, 24 5210
, 15 ˆ )
( ln
X
X X
X E
−
+ +
+
µ =
Pemilihan Model Terbaik
Model Nilai AIC
Regresi Poisson 1744,6
GPR 345,2
Kesimpulan
Model terbaik terjadinya kasus kanker serviks di Jawa Timur menggunakan analisis GPR karena nilai AIC minimum.
Faktor-faktor yang mempengaruhi jumlah kasus kanker serviks
yang terjadi di kabupaten/kota di Jawa Timur meliputi
persentase tenaga medis di tiap kabupaten/kota di Jawa Timur
(X
2), persentase penduduk yang menggunakan kondom (X
8),
persentase perempuan yang pernah kawin dan jumlah anak
yang dilahirkan lebih dari 4 (X
9) dan persentase penduduk
perempuan yang berstatus kawin di tiap kabupaten/kota di Jawa
Timur (X
10). Peningkatan maupun penurunan jumlah kasus
kanker serviks yang terjadi di kabupaten/ kota di Jawa Timur
tergantung dari nilai koefisien variabel-variabel yang
berpengaruh.
Saran
Selama proses analisis, peneliti menemukan beberapa hal yang
dirasa penting untuk dijadikan bahan pertimbangan dan
pemikiran dalam penelitian ini, diantaranya adalah pemilihan
variabel bebas yang diduga menjadi faktor-faktor yang mem-
pengaruhi terjadinya kasus kanker serviks di kabupaten/kota di
Jawa Timur serta metode analisis lain yang memungkinkan
untuk dibandingkan hasilnya dengan analisis regresi Poisson
dan GPR. Variabel bebas yang perlu dipertimbangkan misalnya
tentang faktor geografis suatu daerah.
Agresti, A. 2002. Categorical Data Analysis Second Edition, John Wiley & Sons, New York.
Anonim, 2011. http://chuzblog.blogspot.com/2011/03/kanker-serviks-tanda-tanda- penyebab. html. Diakses pada 4 Desember 2011 pukul 14.00.
Assriyanti, Novia. 2011. Perbandingan Analisis Regresi Poisson, Generalized Poisson Regression dan Geographically Weighted Poisson Regression (Studi Kasus:
Permodelan Jumlah Kasus AIDS di JATIM tahun 2008). Surabaya: Program Sarjana, Institut Teknologi Sepuluh Nopember.
Bozdogan, H. 2000. Akaike's Information Criterion and Recent Developments in Information Complexity, Mathematical Psychology, 44, 62-91.
Cameron, A.C. dan Trivedi, P.K. 1998. Regression Analysis of Count Data. Cambridge:
CambCambridge University Press.
Diananda, R. 2009. Panduan Lengkap Mengenai Kanker. Yogyakarta: Mirza Media Pustaka.
Daftar Pustaka (1)
Khasbiyah, 2004. Beberapa Faktor Risiko Kanker Serviks Uteri (Studi Pada Penderita Kanker Serviks Uteri Di Rumah Sakit Dokter Kariadi Semarang Pada Bulan Agustus-September 2004). Program sarjana. Universitas Diponegoro.
Listiani, Y. (2010). Pemodelan Regresi Generalized Poisson pada Faktor-Faktor yang mempengaruhi Angka Kematian Bayi di Jawa Timur Tahun 2007. Surabaya:
Program Sarjana, Institut Teknologi Sepuluh Nopember.
Rasjidi, 2007. Panduan Pelaksanaan Kanker Ginekologi. Jakarta:EGC.
Sari, Novita. 2011. Aplikasi Regresi Cox Proportional Hazard pada Analisis Kesintasan dan Identifikasi Faktor Resiko (Studi Kasus Penderita Kanker Serviks Pasien RSUP H. Adam Malik Medan tahun 2009). Medan: Program Sarjana, Universitas Sumatera
Utara.
•S. Bae, F. Famoye, J.T. Wulu, A.A. Bartolucci, K.P. Singh. 2005. A Rich Family of Generalized Poisson Regression Models With Applications. Mathematics and Computers in Simulation 69 (2005) 4–11.
Daftar Pustaka (2)
Smith, H dan Draper,N.H., 1992. Analisis Regresi Terapan. Jakarta: PT Gramedia Pustaka Utama.
Tresna, K. 2009. Deteksi Human Papiloma Virus Pada Sediaan Sitologi Papanicolau Smear Lesi Serviks: Suatu Uji Diagnostik. MOGI. Jakarta: Bina Pustaka Prawiroharjo.
Daftar Pustaka (3)