Resiko atau probabilitas kondisional subyek terkena jantung koroner jika dia tertekan karena pekerjaan adalah
ˆ πxi=1 = P (yi = 1 | xi = 1) = alogit(−1,952 + 0,800xi) = alogit(−1,952 + 0,800 × 1) = alogit(−1,152) = 0,240
denganalogit adalah fungsi invers dari logit
alogit(u) = exp(u)
1 + exp(u) (5.19)
Dengan cara yang sama dapat dihitung resiko subyek terkena jantung koroner jika dia tidak tertekan karena pekerjaan, yaitu πˆxi=0 = 0,124. Estimasi titik untuk risk ratio,
odds ratio dan risk difference dapat dihitung menggunakanπˆxi=1danπˆxi=0.
Estimasi odds ratio juga dapat dihitung menggunakan persamaan (5.8) atau secara umum (5.11). Dalam contoh ini dOR = exp(0,800) = 2,225. Interval konfidensi untuk OR dapat
dihitung menggunakanσ( ˆˆ β1) karena dalam model ini dOR = exp( ˆβ1), atau log(dOR) = ˆ
β1. Diperoleh interval konfidensi untukOR dengan batas bawah exp(0,800 − 1,96 × 0,1388) dan batas atas exp(0,800 + 1,96 × 0,1388) atau (1,696 – 2,292), yang sama
dengan hasil yang diperoleh pada contoh 3.4 di muka.
Standard error untukRR dan RD tidak mudah dihitung berdasarkan ˆπxi=1danπˆxi=0 se-hingga dalam praktek estimasi dan interval konfidensi untukRR dan RD dengan
meng-gunakan regresi logistik tidak banyak dimeng-gunakan.
5.4 Regresi Poisson
5.4.1 Model dan Estimasi Parameter
Distribusi Poisson biasanya digunakan untuk memodelkan cacah kejadian dalam suatu unit interval waktu, atau daerah tertentu. Distribusi probabilitas Poisson mempunyai fungsi probabilitas sebagai berikut
P (Y = y | µ) = θ
xe−µ
y! , y = 0, 1, 2, . . . (5.20) yang mempunyai mean dan variansi sama yaituµ.
Banyaknya pasien yang datang di unit gawat darurat per hari, banyaknya ke-matian akibat kanker per orang-tahun (person-years), banyaknya keke-matian bayi per 1000 kelahiran merupakan contoh fenomena yang dapat dimodelkan dengan
5.4. Regresi Poisson 49
distribusi Poisson. Dalam contoh tersebut ada dua komponen yang mencirikan distribusi Poisson, yaitu banyaknya sukses atau cacah kejadian (events) dan unit dimana banyaknya sukses tersebut terjadi. Meanµ dari distribusi Poisson adalah
rate banyaknya sukses dibagi total unit.
Regresi Poisson memodelkan meanµ sebagai fungsi dari variabel independen dan besarnya unit. Regresi Poisson dengan satu variabel independen dituliskan sebagai berikut:
E(Yi | Xi) = µi = siλ(xi) (5.21)
= siexp(β0+ β1xi), atau
log µi = log si+ β0+ β1xi (5.22) dengan Yi adalah banyaknya sukses pada unit i, si adalah ukuran besarnya tiap unit i, λ(xi) dinamakan resiko unit i dan xi adalah variabel independen, i = 1, 2, . . . , n. Ukuran unit si dapat berupa banyaknya anggota populasi, in-terval waktu, luasan, exposure time dan sebagainya. Dalam model regresi Poisson ini karakteristik suatu unit yang dinyatakan dengan variabel independenxi mem-pengaruhiµ melalui probabilitas resiko λ.
Dengan asumsiYi berdistribusi Poisson, diperoleh fungsi likelihood: L(β) = n Y i=1 P (Yi = yi) = n Y i=1 [siλ(xi)]yi exp[−siλ(xi)] yi! = n Y i=1 [siexp(β0+ β1xi)]yi exp[−siexp(β0+ β1xi)] yi! (5.23)
Untuk mengestimasi β dan kesalahan standarnya SE( ˆβ) dapat digunakan bebe-rapa program statistika seperti R, STATA, SPSS atau SAS.
5.4.2 Interpretasi Parameter Model
Untuk model regresi Poisson sederhanalog µi = log si+ β0+ β1xi (5.24) dengan xi = ( 0 i tdk terpapar 1 i terpapar
5.4. Regresi Poisson 50
Dapat dihitung rasio antara mean antara unit i yang terpapar dengan yang tidak terpapar sebagai berikut
RR = E(Yi | Xi = 1) E(Yi | Xi = 0) = siexp(β0+ β1) siexp(β0) = eβ1 (5.25) Dengan menggunakan pendekatan Poisson untuk Binomial, rasio di atas dapat diinterpretasikan sebagai relative risk atau risk ratio RR. Pendekatan ini akan cukup baik jika probabilitas atau resiko kejadian kecil (rare events) dengan ukuran unit yang cukup besar.
Contoh 5.2
Merujuk pada Contoh 3.3 tentang pengaruh rokok pada kematian, telah dihitung insidensi untuk kelompok perokok dan bukan perokok dalam satuan per 1000 orang, yaitu untuk perokok adalah 4,43 dan untuk bukan perokok adalah 2,58. Rasio resiko untuk meninggal antara perokok dan bukan perokok adalah RR = 4,43/2,58 = 1,72. Regresi Poisson
sederhana dapat digunakan untuk menghitung RR beserta interval konfidensinya. Dengan menggunakan paket program statistik diperoleh estimasi untukβ0danβ1beserta standard
error nya sebagai berikut ˆβ0 = −5,9618, SE( ˆβ0) = 0,0995 dan ˆβ1 = 0,5422, SE( ˆβ1) = 0,1072.
c
RR= exp( ˆβ1) = exp(0,5422) = 1,72
Interval konfidensi 95% untuk RR adalah eksponensial dari log( cRR) ± 1,96SE( ˆβ1) atau
(1,4 – 2,1).
Seperti model regresi logistik, regresi Poisson dapat diperluas untuk banyak variabel (regresi Poisson ganda) sebagai berikut:
log µi = log si+ β0+ β1xi+ . . . + βpxp (5.26) dengan x1, x2, . . . , xp adalah variabel dependen dan β1, β2, . . . , βp adalah koe-fisien regresi Poisson. Model regresi Poisson juga dapat digunakan untuk men-ganalisis interaksi seperti halnya pada model regresi logistik. Cara penghitungan
RR dan interval konfidensi pada regresi Poisson juga mengikuti prinsip
penghi-tungan OR dan interval konfidensinya pada regresi logistik.
Contoh 5.3
Merujuk kembali pada Contoh 3.3, insidensi untuk tiap kelompok umur dan status merokok pada Tabel 3.1 dapat dihitung menggunakan rumus (3.9). Misalnya untuk pe-rokok dalam kelompok umur35 − 44, estimasi insidensi kematian adalah 32/52407 =
5.4. Regresi Poisson 51
0,00061061 atau karena bilangan insidensi kecil biasanya dikalikan dengan suatu konstan
besar misalnya 100.000, jadi insidensinya adalah 61,06 kematian per seratus ribu orang.
Dengan cara yang sama dapat dihitung nilai insidensi yang lain seperti pada Tabel 5.1. Untuk membandingkan insidensi dapat dihitung RR perokok dan bukan perokok dalam kelompok umur yang sama. Misalnya RR untuk perokok dibanding bukan perokok dalam kelompok umur 35 − 44 adalah 61,06/10,64 = 5,74. Nilai RR yang lain dapat dilihat
pada Tabel. Plot insidensi menurut status merokok dan usia dapat dilihat pada Gambar 5.1. Dapat dilihat pada Tabel 5.1 dan Gambar 5.1 bahwa tingkat kematian untuk perokok lebih tinggi dibandingkan dengan tingkat kematian bukan perokok, kecuali untuk kelom-pok usia lanjut.
Tabel 5.1: Insidensi dan RR kematian akibat jantung koroner menurut umur dan status merokok
Kel. Insidensi Rasio Resiko Umur perokok bukan perokok (RR)
35 – 44 61,06 10,64 5,74 45 – 54 240,47 112,43 2,14 55 – 64 719,98 490,37 1,47 65 – 74 1468,85 1083,17 1,36 75 – 84 1918,38 2120,38 0,90 0 500 1000 1500 2000 kelompok umur k
ematian per 100.000 per tahun
35−44 45−54 55−64 65−74 75−84
Gambar 5.1: Tingkat kematian akibat penyakit jantung koroner per 100.000
5.4. Regresi Poisson 52
Tabel 5.2: Estimasi parameter model (5.27) Parameter Estimasiβ SE β0 -9,15 0,71 β1 1,75 0,73 β2 2,36 0,76 β3 3,83 0,73 β4 4,62 0,73 β5 5,29 0,73 β6 -0,99 0,79 β7 -1,36 0,76 β8 -1,44 0,76 β9 -1,85 0,76
Untuk menganalisis data ini dapat digunakan beberapa alternatif model regresi Poisson ganda. Model pertama memuat semua kombinasi tingkat faktor dari status merokok mau-pun kelompok umur. model ini disebut sebagai saturated model karena banyaknya data sama dengan banyaknya parameter. Model dibentuk dengan membuat variabel-variabel boneka (dummy) untuk kelompok umur dengan interaksi variabel-variabel tersebut de-ngan status merokok. Modelnya adalah sebagai berikut:
log µi = log(si) + β0+ β1x1i+ β2x2i+ β3x3i+ β4x4i+ β5x5i+ β6x1ix2i+ β7x1ix3i+ β8x1ix4i+ β9x1ix5i
i = 1, 2, . . . , 10 (5.27)
dengan
• µi: mean dari kematian
• si: person-years
• x1i: perokok atau bukan;
• xki, k = 2, 3, . . . , 5: kelompok umur 35 − 44, 45 − 54, . . ., 75 − 84
• x1ixki, h = 2, 3, . . . , 5: interaksi (hasil kali) antara x1idengan kelompok umurxki
Diperoleh estimasi seperti pada Tabel 5.2. Untuk mengestimasi insidensi untuk tiap-tiap kombinasi status merokok dan kelompok umur dapat digunakan nilai estimasi
(β0, . . . , β9) dan nilai variabelnya. Misalnya untuk perokok dalam kelompok umur 35
– 44 akan dihitung estimasinya menggunakan model (5.27). Dalam kelompok inix1 = 1
5.4. Regresi Poisson 53
yang lain adalah 0, jadi estimasinya adalah
µ = exp( ˆβ0+ ˆβ1xi+ . . . + ˆβ9x1x5)
= exp(−9,15 + (1,75)(1) + (2,36)(0) + (3,83)(0) + (4,62)(0) + (5,29)(0) + (−0, 99)(0) + (−1, 36)(0) + (−1, 44)(0) + (−1, 85)(0))
= exp(−7,40) = 0,0006106
atau 61,06 per 100.000 orang seperti pada Tabel 5.1. Untuk mengestimasi banyak-nya kematian, nilai estimasi ini dikalikan dengan si (person years) pada kelompok ter-sebut. Untuk perokok dalam kelompok umur 35 – 44 diketahui si = 52407, atau 0,0006106(52407) = 32 yang nilainya sama dengan data pada Tabel 3.1. Nilai
insid-ensi pada kombinasi tingkat faktor yang lain dapat dihitung dengan cara serupa.
Resiko relatif antara perokok dan bukan perokok (RR) untuk setiap kelompok dapat pula dihitung berdasarkan model regresi Poisson (5.27) dengan hasil estimasi pada Tabel 5.2. Misalnya untuk kelompok usia 45 – 54,
c
RR= estimasi insidensi untuk kelompok perokok usia 45 – 54
estimasi insidensi untuk kelompok bukan perokok usia 45 – 54 Estimasi insidensi untuk kelompok perokok usia 45 – 54 adalah
expn ˆ β0+ ˆβ1(1) + ˆβ2(1) + ˆβ3(0) + ˆβ4(0) + ˆβ5(0)+ ˆ β6(1)(1) + ˆβ7(1)(0) + ˆβ8(1)(0) + ˆβ9(1)(0)o = exp( ˆβ0+ ˆβ1+ ˆβ2+ ˆβ6)
Sedangkan untuk kelompok bukan perokok usia 45 – 54 adalah
expn ˆ β0+ ˆβ1(0) + ˆβ2(1) + ˆβ3(0) + ˆβ4(0) + ˆβ5(0)+ ˆ β6(0)(1) + ˆβ7(0)(0) + ˆβ8(0)(0) + ˆβ9(0)(0)o = exp( ˆβ0+ ˆβ2)
Menggunakan nilai estimasiβ1danβ6 diperoleh
c
RR = exp( ˆβ0+ ˆβ1+ ˆβ2+ ˆβ6) exp( ˆβ0+ ˆβ2) = exp( ˆβ1+ ˆβ6)
= exp(1,75 + (−0,99)) = exp(0,76) = 2,14.
Nilai cRR ini sama seperti pada Tabel 5.1 untuk kelompok umur 45 – 54. Interval
konfi-densinya dapat dihitung dengan terlebih dahulu menghitung standard error darilog cRR
yaitu SE(log cRR) = q Var( ˆβ1+ ˆβ6) = q
5.4. Regresi Poisson 54
Program statistik standar biasanya menghitung matriks variansi dan kovariansi dari estimator β selain nilai estimasi β nya sendiri. Diperoleh Var( ˆβ1) = 0,5313, Var( ˆβ6) = 0,6242 dan Kov( ˆβ1, ˆβ6) = −0,5313, jadi SE(log cRR) = 0,5313 + 0,6242 + 2(−0,5313) = 0,0930. Interval konfidensi 95% untuk RR pada kelompok usia 45 – 54
adalahexp(log cRR± 1,96SE(log cRR)) atau exp(log(2,14) ± 1,96(0,0930)), yaitu (1,782
– 2.566). Cara penghitungan cRR dan interval konfidensi nya untuk kelompok usia yang
lain dapat dilakukan dengan cara yang sama.
Contoh 5.4
Alternatif model regresi Poisson (5.27) adalah menganggap kelompok usia sebagai vari-abel kontinu, misalnya dengan mengambil nilai median interval masing-masing kelom-pok umur, sehingga dapat dimodelkan pula kuadrat dari umur dan interaksinya de-ngan status merokok. Asumsi ini masuk akal karena usia seperti terlihat pada Gambar 5.1 menampilkan bentuk kuadratik dan bersilangan pada usia lanjut yang menunjukkan adanya interaksi.
log µi = log(si) + β0+ β1x1i+ β2x2i+ β3x1i× x2i+ β4x21i, i = 1, . . . , 10 (5.28)
dengan
• µi: mean dari kematian
• si: person-years
• x1i: perokok atau bukan;
• x2i: usia1, 2, 3, 4, 5 ;
• x1i× x2i: interaksi (hasil kali) antarax1idenganx2i;
• x21i: kuadrat umur
Diperoleh hasil estimasi β dan standard error nya seperti pada Tabel 5.3. Model (5.28) Tabel 5.3: Estimasi parameter model (5.28)
Parameter Estimasiβ SE β0 -19,700 1,2530 β1 2,364 0,6562 β2 0,356 0,0363 β3 -0,002 0,0003 β4 -0,0308 0,0097
memiliki lebih sedikit parameter dibandingkan model (5.27) dan kecocokan yang lebih baik dilihat dari nilai AIC (Akaike Information Criterion) yaitu nilai AIC 66,70, lebih kecil dibanding model (5.27) yaitu 75.07. Namun memberi nilai numerik pada variabel
5.5. Latihan 55
kelompok umur terkadang dapat menyesatkan, karena pengubahan skala pengukuran dari interval ke rasio. Apabila umur sebenarnya dari setiap individu diketahui, lebih baik di-gunakan nilai variabel umur ini dalam model.
Resiko relatif dapat dihitung dengan cara yang sama seperti contoh 5.3. Misalkan ingin diestimasi RR antara perokok dan bukan perokok untuk usia 50 tahun, maka
c
RR = estimasi insidensi untuk kelompok perokok usia 50
estimasi insidensi untuk kelompok bukan perokok usia 50
= exp( ˆβ0+ ˆβ1(1) + ˆβ2(50) + ˆβ3(1)(50) + ˆβ450 2) exp( ˆβ0+ ˆβ1(0) + ˆβ2(50) + ˆβ3(0)(50) + ˆβ4502) = exp( ˆβ1(1) + ˆβ3(1)(50)) = exp(2,364 + (−0,002)(50)) = 9,622
Interval konfidensi untuk cRR dihitung dengan terlebih dahulu menghitung nilai
SE(log cRR), yaitu
SE(log cRR) = q
Var( ˆβ1) + 502Var( ˆβ3) + 2Kov( ˆβ1D, ˆβ3)
Batas bawah dan atas interval konfidensi 95% adalah (exp(log cRR± 1,96SE(log cRR))),
yang dapat dihitung asalkan nilai matrik variansi-kovariansiβ diketahui.
5.5 Latihan
5.1. Mengacu soal nomor 2.8, misalkan digunakan regresi logistik logit(π) = β0+ β1X, dengan X bernilai 1, jika menggunakan helm, 0 jika tidak;
(a) Hitung nilai estimasiβ0
(b) Hitung nilai estimasiβ1
5.2. Diberikan model regresi logistik logit(πi) = β0+ β1xi, dengan Xi =
(
−1 jika subyek i tidak terpapar 1 jika subyeki terpapar
Berapakah OR antara individu yang terpapar dengan yang tidak terpapar? 5.3. Respiratory Distress Syndrome (RDS) merupakan salah satu penyakit
penyebab utama kematian bayi. Gangguan fisiologis seperti kekurangan ok-sigen dan tingkat keasaman tinggi dalam darah diperkirakan menjadi penye-bab RDS. Suatu penelitian cross-sectional tentang RDS dilakukan pada 50 bayi dengan variabel respon adalahSURVIVAL(1: mati, 0: hidup) dan vari-abel penjelas TREATMNT (tipe tritmen untuk menetralisasi asam dalam
5.5. Latihan 56
darah, 1: THAM, 0: sodium carbonate); TIME (lama waktu yang diper-lukan bayi untuk bernapas kembali, dalam menit), WEIGHT (Berat lahir, kilogram),RESP(Terapi pernafasan, 1: Ya, 0:Tidak),AGE(usia gestasional atau lama bayi/janin dalam kandungan, minggu). Diperoleh output regresi logistik dari sebuah paket statistik sebagai berikut:
Variable B S.E. Wald df Sig R Exp(B) TREATMNT .94 .78 1.44 1 .22 .00 2.56 TIME .04 .10 .14 1 .70 .00 1.04 WEIGHT 3.94 1.62 5.85 1 .91 .24 51.50 RESP -1.88 .82 5.26 1 .02 -.22 .15 AGE -.35 .24 2.05 1 .15 -.02 .69 Constant 4.10 5.80 .50 1 .47
(a) Hitung estimasi probabilitas untuk bayi yang mendapatkan tritmen 1, lama waktu bernafas kembali 2 menit, berat lahir 1,05 kg, tidak men-dapat terapi pernafasan dan usia gestasional 28 minggu!
(b) Hitung interval konfidensi 95% untuk OR (odds ratio) antara tritmen (TREATMNT) 1: THAM dengan 0: sodium carbonate!
(c) Hitung estimasi RR (risk ratio) antara tritmen (TREATMNT) 1: THAM dengan 0: sodium carbonate dan nilai variabel yang lain sama un-tuk masing-masing tritmen, yaituTIME=2,WEIGHT=1,05 ,RESP=0
AGE=28!
5.4. Ingin diteliti apakah status sosial (variabel SOC, 1= kelas sosial tinggi, 0=kelas sosial rendah) berpengaruh terhadap mortalitas akibat penyakit jan-tung (variabel CVD, 1=meninggal karena penyakit janjan-tung, 0=meninggal bukan karena penyakit jantung). Variabel lain yang dipandang penting adalah status merokok (variabel SMK, 0=tidak merokok, 1=merokok) dan tekanan darah sistolik (SBP, variabel kontinu). Dari follow-up study sela-ma 12 tahun terhadap 200 pria yang berusia 50 tahun atau lebih diperoleh estimasi parameter model logistik sebagai berikut:
Model 1: Variable Estimasiβ Intersep −1,1800 SOC −0,5200 SBP 0,0400 SMK −0,5600 SOC× SBP −0,0330 SOC× SMK 0,1750 Model 2: Variable Estimasiβ Intersep −1,1900 SOC −0,5000 SBP 0,0100 SMK −0,4200
5.5. Latihan 57
(b) Hitung Risk Ratio meninggal karena CVD untuk status sosial tinggi terhadap status sosial rendah berdasarkan Model 1 dan Model 2, untuk perokok yang tekanan darah sistoliknya 150!
(c) Berapakah Odds Ratio meninggal karena CVD untuk status sosial tinggi terhadap status sosial rendah setelah diselaraskan oleh variabel yang lain (adjusted for other variables) berdasarkan Model 1 dan Mo-del 2?
5.5. Diberikan model regresi Poisson log(µi) = log si + −6,757 + 0,304xi, dengansiadalah ukuran tiap uniti, µi adalah unit ke-i dan
Xi = (
−1 jika subyek i tidak terpapar 1 jika subyeki terpapar
Hitung estimasi RR antara individu yang terpapar dengan yang tidak terpa-par!
5.6. Diperoleh data banyak kasus (N) kanker kulit untuk dua daerah A dan B dan untuk kelompok umur sebagai berikut:
Daerah A Daerah B Kel. umur N populasi N populasi 15 – 24 1 172 675 4 181 343 25 – 34 16 123 065 38 146 207 35 – 44 30 96 216 119 121 374
Lakukan analisis dengan menggunakan regresi Poisson untuk data di atas (gunakan paket statistik)!