MODEL DAN ANALISIS DATA SURVIVAL
MENGGUNAKAN SEBARAN LOG-LOGISTIK
NURMAULIDAH
G 54103025
DEPARTEMEN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2007
ABSTRACT
NURMAULIDAH. Model and Survival Data Analysis With Log-logistic Distribution. Supervised by RETNO BUDIARTI and HADI SUMARNO.
Some events happened in daily life always related with time, especially in medical studies. Data about the length of observed time to the raise an event is called survival data. The survival time of an individual is said to be censored when the end point of interest has not been observed for that individual.
Many researchers consider survival data analysis to be merely the application of two conventional statistical methods to special type of problem, parametric if the distribution of survival times is known and nonparametric if the distribution is unknown. Parametric methods for survival data with Log-logistic distribution have two models, they are Log-logistic Accelerated Failure Time (AFT) model and Log-logistic Proportional Odds (PO) model. Analysis of survival data, that use both of two models, show the ratio of one event to another and how does one independent variable accelerated the event.
3
ABSTRAK
NURMAULIDAH. Model dan Analisis Data Survival Menggunakan Sebaran Log-logisitik. Dibimbing oleh RETNO BUDIARTI dan HADI SUMARNO.
Peristiwa yang terjadi dalam kehidupan sehari-hari terutama dalam dunia kedokteran seringkali berhubungan dengan waktu. Data tentang lama waktu pengamatan terhadap munculnya suatu kejadian disebut data survival. Ciri khas data survival adalah survival time (waktu pengamatan) seringkali tidak lengkap (Censored). Survival time dikatakan tidak lengkap jika waktu akhir dari kejadian tidak dapat diamati.
Dua metode yang digunakan untuk menganalisis data survival adalah metode non parametrik dan metode parametrik. Metode parametrik dapat digunakan jika data yang diperoleh memiliki pola sebaran tertentu. Metode parametrik data survival dengan sebaran Log-logistik memiliki dua model yaitu model Accelerated Failure Time Log-logistik dan model Proportional Odds Log-logistik. Analisis data survival menggunakan kedua model,menunjukkan rasio satu kejadian terhadap kejadian yang lain dan seberapa cepat suatu variabel bebas mempercepat terjadinya sebuah peristiwa.
Data tersensor jika dianalisis dengan menggunakan regresi logistik akan memberikan hasil yang bias.
MODEL DAN ANALISIS DATA SURVIVAL
MENGGUNAKAN SEBARAN LOG-LOGISTIK
Skripsi
Sebagai salah satu syarat untuk memperoleh gelar Sarjana Sains pada Fakultas Matematika dan Ilmu Pengetahuan Alam
Institut Pertanian Bogor
Oleh :
NURMAULIDAH
G 54103025
DEPARTEMEN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2007
5
Judul : Model dan Analisis Data Survival Menggunakan Sebaran
Log-logistik
Nama :
Nurmaulidah
NRP :
G
54103025
Menyetujui:
Pembimbing I,
Ir. Retno Budiarti, M.S.
NIP 131 842 409
Pembimbing II,
Dr. Ir. Hadi Sumarno, M.S.
NIP 131 430 804
Mengetahui:
Dekan Fakultas Matematika dan Ilmu Pengetahuan Alam
Institut Pertanian Bogor
Prof. Dr. Ir. Yonny Koesmaryono, M.S.
NIP. 131473999
KATA PENGANTAR
BismillahirrohmanirrohimAlhamdulillah, segala puji bagi Allah. Robb semesta alam yang telah memberikan rahmatNya kepada penulis, sehingga karya ilmiah ini dapat penulis selesaikan tepat pada waktunya. Sholawat dan salam semoga tercurah kepada Rasulullah Muhammad SAW, keluarga, sahabat dan para pengikutnya hingga akhir zaman.
Tanpa bantuan dan dukungan dari berbagai pihak mungkin penulis tidak dapat menyelesaikan tugas akhir ini. Oleh karena itu, dalam kesempatan ini penulis ingin mengucapkan terima kasih kepada :
1. Ibu Retno Budiarti dan Bapak Hadi Sumarno selaku pembimbing yang dengan sabar membimbing penulis.
2. Bapak I Wayan Mangku, terima kasih sudah bersedia menjadi penguji dan atas masukan yang telah diberikan.
3. Mama, alm. Bapak, kedua kakakku tersayang, kakak ipar dan keponakanku terima kasih untuk semua dukungan, cinta, perhatian dan kasih sayangnya.
4. Dosen-dosen di Departemen Matematika, terima kasih atas ilmu yang telah Bapak dan Ibu berikan, serta staff Departemen Matematika : Pak Deny, Pak Yono, Pak Bono, Bu Ade, Bu Susi, Bu Marisi, terima kasih atas bantuan selama di Departemen Matematika. 5. Keluarga kecilku di Bogor, terima kasih untuk semua cinta dan kasih sayangnya.
6. TNT, terima kasih untuk semangat dan teguan-tegurannya. Kenangan indah bersama kalian tidak akan pernah terlupakan.
7. Light blue, banyak kenangan indah dalam perjuangan ini. Terima kasih untuk pelajaran kesabaran dan keistiqomahan yang diberikan. Bersama kalian aku merasakan indahnya islam.
8. Saudara-saudariku di L, terima kasih untuk semua cita dan cerita indah yang kita ukir bersama, walaupun tidak seindah yang kita harapkan. Semoga Allah berkenan menerimanya sebagai sebuah amalan.
9. BEM 2005/2006 yang sudah mengisi hari-hari ku dengan tangis dan tawa.
10. Yuda ( terima kasih sudah menjadi pendengar setia), Walidah, Mayang ( terima kasih atas semangatnya), Marlin, Iwit, Indah, Mita, Sri, Achie, Dwi ( terima kasih atas doanya), Mika, Ifni, Jaja, Elis, ‘Nchie, Ulfa, Amie, Icha, Vina, Nisa, Agatha, Meta, Herni, Jayu, Febri, Sawa, Ari , Mufti, Dimas, Ali, Mukafi, Aam, Abdillah, Yudi, Rusli, Rama, Azis, prima, Lili, Demi, Rahmat, Berri, Anton, yusuf, Putra, Manto.
11. Vamdiers: Ayiz , Ajeng, Chandutz, Mbak Hida, Mbak Vina, Mbak yofi, Mbak wiwik , Ika, Ina, Ziah, Ela, Lisma, Dewi, Ami, Ocha, Ila, Tia, Phyto .
Penulis berharap karya ilmiah ini dapat bermanfaat.
Bogor, Mei 2007
7
RIWAYAT HIDUP
Nurmaulidah, lahir di Jakarta 20 November 1985 sebagai anak ketiga dari tiga bersaudara dari pasangan Alm. Bapak H. Mansyur Asim dan Ibu Hj. Siti Asma.
Lulus dari Sekolah Menengah Umum Negeri 65 Jakarta pada tahun 2003. Pada tahun yang sama penulis diterima sebagai mahasiswi di Departemen Matematika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor melalui jalur Undangan Seleksi Masuk IPB (USMI).
Selama mengikuti perkuliahan penulis aktif menjadi Pengurus Dewan Perwakilan Mahasiswa Tingkat Persiapan Bersama (DPM TPB) IPB (2003/2004) sebagai sekretaris Komisi Pengembangan Sumberdaya Mahasiswa, Bendahara II Badan Eksekutif Mahasiswa Fakultas Matematika dan Ilmu Pengetahuan alam (BEM FMIPA) IPB (2004/2005), Bendahara umum Badan Eksekutif Mahasiswa (BEM FMIPA) IPB (2005/2006), anggota KAMMI ( Kesatuan Aksi Mahasiswa Muslim Indonesia) komisariat IPB (2003-sekarang). Selain itu penulis menjadi guru tamu di SMA N 5 Bogor dan SMA Plus YPHB Bogor sebagai pengajar matematika kelas 3 IPA.
DAFTAR ISI
Halaman PENDAHULUAN Latar Belakang...1 Permasalahan ...1 Tujuan Penulisan ...1 Sistematika Penulisan ...1 LANDASAN TEORI ...1 Survival ...1Ruang Contoh, Kejadian dan Peluang ...2
Peubah Acak dan Fungsi Sebaran ...2
Fungsi Survivor dan Fungsi Hazard ...2
Metode Parametrik dan NonParametrik ...3
Odds ...3
Uji Hipotesis ...3
MODEL...3
Regresi Logistik ...3
Contoh Data Survival ...4
Fungsi Survivor Log-logistik ...4
Fungsi Hazard Log-logistik...4
Model Accelerated Failure Time... ...5
Model Proportional Odds...6
CONTOH KASUS.. ...7
SIMPULAN... 14
DAFTAR PUSTAKA ... 14
PENDAHULUAN
Latar Belakang
Masalah yang terjadi dalam kehidupan sehari-hari terutama yang berkaitan dengan dunia kedokteran seringkali berhubungan dengan waktu. Misalnya, lama penyakit yang diderita seseorang hingga sembuh atau meninggal, respon seseorang terhadap perlakuan obat yang diberikan, dan lain-lain. Data tentang lama waktu pengamatan terhadap munculnya kejadian disebut sebagai data survival.
Ciri khas dari data survival adalah survival time (waktu bertahan hidup) seringkali tidak lengkap (tersensor). Waktu bertahan hidup dikatakan tidak lengkap jika waktu akhir dari kejadian tidak dapat diamati sehingga status akhir dari individu tidak dapat diketahui karena individu tersebut tidak diketahui kondisi selanjutnya.
Dua jenis sensor yang terdapat dalam data survival adalah sensor titik, yaitu jika waktu kejadian dapat diamati secara tepat dan sensor selang yaitu pengamatan waktu kejadian hanya dilakukan pada selang tertentu.
Metode yang digunakan untuk menganalisis data survival ada dua macam yaitu nonparametrik di antaranya dengan menggunakan life table, metode yang kedua adalah metode parametrik yakni dengan data yang diperoleh memiliki pola sebaran tertentu.
Permasalahan
Karakteristik dari data survival umumnya tidak dapat diamati secara utuh atau sampai selesai (tersensor), sehingga diperlukan sebuah analisis data survival menggunakan metode tertentu.
Tujuan Penulisan
Mempelajari model dan analisis data survival menggunakan sebaran Log-logistik untuk data tersensor dan data tidak tersensor. Metodologi dan Sistematika Penulisan
Karya ilmiah ini adalah studi pustaka dengan pustaka utama adalah Modelling Survival Data in Medical Research yang di tulis oleh Collet, 1994.
Bagian pertama dari karya ilmiah ini berisikan pendahuluan yakni menceritakan latar belakang penulisan, permasalahan yang dibahas, tujuan penulisan serta metodologi dan sistematika penulisan. Bagian kedua dari tulisan ini berisikan landasan teori yakni definisi-definisi yang mendukung pembahasan. Bagian ketiga tentang pemodelan. Bagian keempat merupakan contoh kasus. Bagian kelima merupakan simpulan. Bagian keenam berisikan daftar pustaka yang digunakan dalam penulisan karya ilmiah ini.
LANDASAN TEORI
Survival
Definisi 1 ( Data Survival )
Data survival adalah data tentang pengamatan jangka waktu dari awal pengamatan sampai dengan terjadinya suatu peristiwa, peristiwa itu dapat berupa kematian, respon, timbul gejala, dan lain-lain. Data survival dapat diamati secara lengkap ( data tidak tersensor) dan tidak lengkap (data tersensor).
( Lee, 1992) Definisi 2 ( Waktu Awal )
Waktu awal yaitu waktu pada saat terjadinya kejadian awal, seperti waktu seorang sarjana baru lulus dari universitas, waktu pemberian perlakuan, dan lain-lain.
( Lee, 1992) Definisi 3 (Waktu Kegagalan (Failure
Time))
Waktu kegagalan yaitu waktu pada saat terjadinya kejadian akhir seperti waktu seorang sarjana mendapatkan pekerjaan, respon dari perlakuan akhir, dan lain-lain.
( Lee, 1992) Definisi 4 ( Data Tersensor )
Data tersensor adalah data yang tidak dapat diamati secara utuh, karena adanya individu yang meninggal pada saat pengamatan atau adanya individu yang hilang atau alasan lain sehingga tidak dapat diamati kembali datanya.
Ruang Contoh, Kejadian dan Peluang Definisi 5 ( Ruang Contoh )
Ruang contoh adalah himpunan semua hasil yang mungkin dari suatu percobaan acak, dan dinotasikan dengan Ω .
(Grimmet dan Stirzaker, 1992) Definisi 6 (Kejadian)
Kejadian adalah suatu himpunan bagian dari ruang contoh.
(Grimmet dan Stirzaker, 1992) Definisi 7 ( Medan -
σ
)Medan -
σ
adalah suatu himpunan yang anggotanya terdiri atas himpunan bagian dari Ω yang memenuhi kondisi berikut : 1. ∅ ∈ F , 2. Jika A A1, 2,...∈ F maka 1 i i A ∞ = ∈F, 3. Jika A∈ F maka cA ∈ F .
(Grimmet dan Stirzaker, 1992) Peubah Acak dan Fungsi Sebaran Definisi 8 ( Peubah Acak )
Misalkan F adalah medan-σ dari ruang contoh Ω. Suatu peubah acak X adalah suatu fungsi X:Ω → dengan sifat R
( )
{
ω∈ Ω: X ω ≤x}
∈ F untuk setiapx∈ . R
(Grimmet dan Stirzaker, 1992) Peubah acak dinotasikan dengan huruf kapital (X, Y, Z), nilai peubah acak dituliskan dengan huruf kecil x, y, z. Setiap peubah acak pasti memiliki fungsi sebaran. Definisi 9 (Fungsi Sebaran)
Fungsi sebaran dari suatu peubah acak X adalah suatu fungsi F:R→[0,1] yang diberikan oleh FX(x)=P(X ≤x).
(Grimmet dan Stirzaker, 1992) Definisi 10 (Peubah Acak Kontinu) X dikatakan kontinu jika fungsi sebarannya
dapat dinyatakan sebagai R x du u f x F x X =
∫
∈ ∞ − , ) ( ) (dengan f :R→[0,∞)adalah fungsi yang terintegralkan. Fungsi
f
Xdikatakan fungsi kepekatan peluang dari peubah acak X.(Grimmet dan Stirzaker, 1992) Definisi 11 ( Peluang Bersyarat)
Peluang bersyarat adalah peluang timbulnya suatu kejadian dengan syarat bahwa suatu kejadian lain telah timbul terlebih dahulu.
(
)
(
( )
)
A P B A P A B P = ∩ .(Hogg dan Craig, 1995) Fungsi Survivor dan Fungsi Hazard Definisi 12 (Fungsi Survivor)
Fungsi Survivor S(t) adalah fungsi yang menyatakan peluang seseorang dapat bertahan hidup hingga atau lebih dari waktu t, yang didefinisikan sebagai berikut :
) ( )
(t PT t
S = ≥ , dengan peubah acak T
menyatakan waktu bertahan hidup dan mempunyai fungsi kepekatan peluang f(t) :
dt t dS t f( ) = − ( ) . Teorema 1
Jika fungsi Survivor S dengan
) ( )
(t PT t
S = ≥ maka fungsi kepekatan
peluang dari T adalah f dengan :
dt t dS t f( )= − ( ) Bukti : ∫ ∞ = t f x dx t S( ) ( ) karena ∫ ∞ − ∫ ∞ = + t t f x dx dx x f( ) ( ) 1 maka ∫ ∞ − = − t t S dx x f( ) 1 () [ ] dt t S d dt t dx x f d ) ( 1 ) ( − = ∫ ∞ − ⎥⎦ ⎤ ⎢⎣ ⎡
dt t dS t f()=− ()
.
Terbukti . (Collet, 1994) Definisi 13 ( Fungsi Hazard )Fungsi Hazard adalah fungsi yang menyatakan peluang seseorang meninggal pada waktu t dengan syarat bahwa seseorang itu telah bertahan hidup hingga waktu t, fungsinya diberikan sebagai berikut :
3
(
)
t t T t t T t P t t h δ δ δ→ ≤ < + ≥ =lim 0 | ) ( .Dari definisi di atas diperoleh hubungan antara fungsi Survivor dengan fungsi Hazard. Dengan menggunakan definisi peluang bersyarat, diperoleh :
(
)
(
)
) ( ) ( ) ( ) ( | t S t F t t F t T P t t T t P t T t t T t P − + = ≥ + < ≤ = ≥ + ≤ ≤ δ δ δ ) ( 1 ) ( ) ( 0 lim ) ( t S t t F t t F t t h ⎭ ⎬ ⎫ ⎩ ⎨ ⎧ + − → = δ δ δ ) ( ) ( ) ( t S t f t h = karena dt t dS t f()=− () maka ( ){
logS(t)}
dt d t h = − t H dt t h t S ) ( ) ( ) ( log = =∫
S(t)=exp(−H(t)) .
(Cox dan Oakes, 1984) Metode Parametrik dan Nonparametrik Definisi 14 ( Metode Parametrik)
Metode parametrik adalah metode analisis yang memiliki asumsi sebaran. Misalnya, data yang diamati menyebar normal, menyebar binom, menyebar log-logistik, dan lain-lain.
(Hogg dan Craig, 1995) Definisi 15 ( Metode Nonparametrik ) Metode nonparametrik adalah metode analisis yang tidak berdasarkan asumsi sebaran tertentu.
(Hogg dan Craig, 1995)
Odds
Definisi 16 (Odds)
Dalam teori peluang dan statistik, odds adalah rasio atau perbandingan antara peluang sukses (p) dengan peluang gagal (1-p).
(Collet, 1994) Uji Hipotesis
Definisi 17 ( Uji Hipotesis)
Uji hipotesis adalah suatu aturan yang digunakan untuk menerima atau menolak suatu hipotesis dari hasil amatan yang diperoleh. Hipotesis mengenai populasi yang akan kita terima kebenarannya sampai ada bukti untuk menolaknya dinamakan hipotesis nol (null hypothesis/H0). Apabila hipotesis ini ditolak kebenarannya maka ada hipotesis lain yang kita anggap benar, yaitu hipotesis tandingan (Alternative Hypothesis/H1).
Dalam perumusan hipotesis dikenal dua macam hipotesis yaitu
a. Hipotesis satu arah 1. H0 :µ ≤µ0 H1:µ > µ0 2. H0:µ ≥µ0
H1:µ <µ0 b. Hipotesis dua arah
0 : 0 µ =µ H 0 : 1 µ ≠µ H .
(Hogg dan Craig, 1995)
MODEL
Regresi Logistik
Bentuk spesifik model regresi Logistik adalah
x e x e x 1 0 1 1 0 ) ( β β β β + + + = ∏ . (1)
(Hosmer dan Stanley, 2000 )
Transformasi dari ∏(x)di sebut transformasi logit yang didefinisikan sebagai berikut
x x x x g 1 0 ) ( 1 ) ( ln ) ( =β +β ∏ − ∏ =
⎟
⎠
⎞
⎜
⎝
⎛
. (2)Contoh Data Survival
Data yang termasuk dalam data survival memenuhi empat kriteria, yaitu:
1. Waktu kejadian.
2.
n
j≥
t
, dengann
jadalah jumlah objek yang diamati.3. Banyaknya objek yang meninggal
j
d .
4. Banyaknya objek yang tersensor
c
j. Jika∑
cj = 0 maka disebut pengamatan dilakukan secara utuh, sebaliknya jika∑
cj ≠ 0 disebut dengan survival sensor. Tabel 1. Contoh Data Tidak TersensorWaktu j
n
d
j S^(t) 11 11 1 1,000 13 10 5 0,909 14 5 2 0,455 15 3 2 0,273 17 1 1 0,091 Dimana j i j N t n t S , ) ( ^ = ≥ , (3) Dengan Ni,j= jumlah individu dalam satu himpunan data.Tabel 2. Contoh Data Tersensor Periode Waktu j
d
c
jn
j 0-12 16 4 48 12-24 10 4 28 24-36 1 0 14 36-48 3 1 13 48-60 2 2 9 60-… 4 1 5Dalam mengamati suatu data yang dibutuhkan adalah populasi atau contoh yang akan dijadikan objek.
(Sanella, 2006) Sebaran Log-logistik
Definisi Sebaran Log-logistik
Peubah acak T disebut menyebar Log-logistik dengan parameterθ,k jika fungsi kepekatan peluangnya adalah
(
)
2 1 1 ) ( k k t e kt e t f θ θ + = − . (4)Fungsi sebarannya adalah
(
)
∫
+ = − t k k dy y e ky e t F 0 2 1 1 ) ( θ θ . dy k y ke du k y e u 1 1 Misal − = + = θ θ 1 = − k y ke du dy θ,
(
)
∫ = − ∫ − = ∫ + − = du k y ke du u k ky dy k y e k ky e t F t 2 -u 1 2 1 e 0 2 1 1 ) ( maka θ θ θ θ 1 1 1 0 1 ) e (1 + + − = − + − = k t e k y t θ θ 1 1 1 k t eθ + − =k t e k t e θ θ + − + = 1 1 1
.
k t e k t e t F θ θ + = 1 ) ( Jadi . (5)Fungsi Survivor sebaran Log-logistik Fungsi Survivor dari sebaran Log-logistik didefinisikan sebagai berikut
k t k t t F t S θ θ e 1 e -1 ) ( 1 ) ( + = − = k t k t k t θ θ θ e 1 e e 1 + − + = . k t e t S θ + = 1 1 ) ( . (6)
Fungsi Hazard sebaran Log-logistik
Fungsi Hazard dari sebaran Log-logistik adalah ) ( ) ( ) ( t S t f t h =
5
(
)
1 1 . 2 1 1 k t e k t e k t ke θ θ θ + + − = ) 1 ( 1 k t e k k t e θ θ + − = . (7)Model Accelerated Failure time (AFT) Log-logistik dan model Proportional Odds (PO) Log-logistik
Secara umum Odds di definisikan sebagai berikut ) ( 1 ) ( t S t S − . (8)
Dengan menggunakan persamaan ( 6 ) maka Odds dari sebaran Log-logistik adalah
(
)
(
)
1 1 1 1 1 ) ( 1 ) ( − + − − + = − e tk k t e t S t S θ θ(
)
(
k)
t e k t e θ θ + − +=
1 1 1 1 1⎟
⎠
⎞
⎜
⎝
⎛
⎟
⎠
⎞
⎜
⎝
⎛
⎟
⎠
⎞
⎜
⎝
⎛
+ + = k t e k t e k t e θ θ θ 1 . 1 1 . =e−θt−k . (9) Log Odds untuk individu yang bertahan hidup lebih dari t diperoleh dengan memberikan logaritma pada persamaan (9)) log( ) ( 1 ) ( log e t k t S t S − − = − ⎟⎠ ⎞ ⎜ ⎝ ⎛ θ =−θ −klogt. (10) Model Accelerated Failure Time (AFT) Log-logistik
Dalam analisis data survival, inti pembahasan adalah pengamatan terhadap individu atau kelompok individu yang mengalami suatu kejadian tertentu yang terhenti secara tiba-tiba karena ada faktor yang mempengaruhinya (seperti: sembuh, dan meninggal dunia) yang menyebabkan pengamatan terhadap kejadian tersebut terhenti disebut Failure Time (waktu kegagalan). Jika kejadian yang terjadi terhenti lebih cepat dari dugaan waktu sebelumnya
maka disebut Accelerated Failure Time (waktu kegagalan yang dipercepat) (AFT).
Model AFT fungsi Hazard secara umum adalah
( )
e it h i e t i h ()= η 0 η (11) ) ( 0 th =Fungsi Hazard awal . )
(t i
h = Fungsi Hazard ke-i.
pi p i i i
β
x
β
x
β
x
η
=
1 1+
2 2+
...
+
dengan i=1,2,…,ndan model Accelerated Failure Time fungsi Survivor secara umum adalah
) ( ) ( ) ( t i h t i f t i S = (12) ) (t i
S
=
Fungsi Survivor ke- i )(t i
h = Fungsi Hazard ke-i
pi p i i i
β
x
β
x
β
x
η
=
1 1+
2 2+
...
+
dengan i=1,2,…,nSehingga model AFT fungsi Hazard Log-logistik didefinisikan sebagai berikut
( )
e it h i e t i h ()= η 0 η( )
( )
⎥⎥ ⎦ ⎤ ⎢ ⎢ ⎣ ⎡ + − = k t i e e k t i e k e i e η θ η θ η 1 1 k t i k e k kt i k e η θ η θ + + − + = 1 1 (13) dan model AFT fungsi Survivor Log-logistik) ( ) ( ) ( t i h t i f t i S = k k i t e t S i η θ + + = 1 1 ) ( . (14)
Dari persamaan di atas dapat diketahui bahwa waktu bertahan hidup individu menyebar Log-logistik dengan parameter
(
θ + kηi,k)
.Bentuk Log-linear dari model Accelerated
Failure Time (AFT) Log-logistik
Untuk memudahkan dalam menganalisis data survival dalam menafsirkan pendugaan parameter dengan menggunakan software maka dibutuhkan representasi model Accelerated Failure Time Log-logistik dalam bentuk log-linear. Tafsiran log-linear adalah kumpulan dari peubah acak dengan waktu
bertahan hidup
T
ididefinisikan sebagai berikut i pi p i ix
x
T
=
µ
+
α
+
...
+
α
+
σε
log
1 1 . (15)Menggunakan definisi fungsi Survivor, maka ) log (log ) ( ) ( t T P t T P t S i i ≥ = ≥ = ( log ... )
σ
α
µ
ε
p pi i x t P ≥ − − − = . (16)Persamaan di atas adalah bentuk umum dari tafsiran log-linear. Jika diasumsikan bahwa
ε
menyebar Logistik, maka fungsi kepekatan peluang dan fungsi Survivor dariε
adalah(
)
2 1 ) ( ε ε ε e e f + = (17) εε
e S + = 1 1 ) (.
(18)Maka fungsi Survivor dari
T
iadalah1 ... 1 1 log exp 1 ) ( − − − − − + = ⎥ ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎢ ⎣ ⎡ ⎪⎭ ⎪ ⎬ ⎫ ⎪⎩ ⎪ ⎨ ⎧ σ α α µ i p x p i x t t i S (19)
Persamaan di atas adalah tafsiran log-linear dari sebaran Log-logistik. Fungsi Survivor untuk i individu yang menyebar Log-logistik dengan parameter
(
θ + kηi,k)
denganpi p i i i β x β x β x η = 1 1 + 2 2 +...+ . Fungsi Survivor dari
T
adalahk k i t e t S i η θ + + = 1 1 ) ( . (20)
Dengan membandingkan fungsi Survivor
T
dan persamaan (19), dapat dilihat bahwa σ µ θ =−(21) σ 1 = k (22) i i α β =− . (23)
Model Proportional Odds Log-logistik Secara umum model Proportional Odds untuk individu yang bertahan hidup lebih dari t didefinisikan sebagai berikut
) ( 0 1 ) ( 0 ) ( 1 ) ( t S t S i e t i S t i S − = − η , (24) dengan
η
i=
β
1x
1i+
...
+
β
px
pi,adalah kombinasi linear nilai variabel penjelas. S0 (t) adalah fungsi survivor awal,
jika nilai variabel penjelas sama dengan nol. Untuk mendapatkan model Proportional Odds Log-logistik, dapat digunakan Odds. Dari persamaan (9) diperoleh
k t e t S t S − − = −
⎟
⎠
⎞
⎜
⎝
⎛
θ ) ( 1 ) ( .Substitusikan persamaan (9) ke persamaan (24), maka diperoleh k t i e t i S t i S − − = − θ η ) ( 1 ) (
.
(25
)
Berdasarkan persamaan di atas diketahui bahwa waktu bertahan hidup merupakan sebaran Log-logistik dengan parameter(
η −i θ,k)
.Log odds untuk individu yang bertahan lebih dari t adalah
{
k}
t i e t i S t i S − − = − ⎭⎬ ⎫ ⎩ ⎨ ⎧ η θ log ) ( 1 ) ( og l =ηi −θ−klogt . (26) Karakteristik hazard rasio dari model Proportional Odds Log-logistik1 ) ( 0 1 1 ) ( 0 ) ( − − + = ⎥ ⎦ ⎤ ⎢ ⎣ ⎡ ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ t S i e t h t i h η (27) Jika diasumsikan () 1 0 t = S maka Hazard rasionya adalah
e
−ηi (lihat Lampiran 1).Persamaan di atas menunjukkan bahwa parameter β digunakan pada kedua model yaitu model Proportional Odds dan model Accelerated Failure Time.
7
CONTOH KASUS
Data 50 pasien penderita Hypernephroma Hypernephroma atau biasa disebut
dengan Renal Cell Carcinoma adalah penyakit kanker pada lapisan epitel saluran ginjal.
Hypernephroma menyerang orang dewasa dengan usia ≥ 40tahun.
Treatment (perlakuan) yang dilakukan terhadap penderita Hypernephroma bermacam-macam salah satunya adalah operasi yang disebut Nephrectomy.
Diasumsikan waktu bertahan hidup dari penderita Hypernephroma menyebar Log-logistik dengan fungsi kepekatan peluang
(
)
2 1 1 ) ( k k t e kt e t f θ θ += − dan fungsi sebaran
k t e k t e t F θ θ + = 1 ) ( . 5 10 15 20 25 30 0.02 0.04 0.06 0.08 0.1 0.12 0.14
Grafik 1. Fungsi kepekatan peluang sebaran Log-logistik 5 10 15 20 25 30 0.2 0.4 0.6 0.8 1
Grafik 2. Fungsi Sebaran Log-logistik Diketahui juga fungsi Hazard dari Log-logistik adalah ) 1 ( 1 ) ( k t e k k t e t h θ θ + − = , dan
Fungsi Survivor yang dimiliki
k t e t S θ + = 1 1 ) ( . 50 100 150 200 250 300 350 5×10- 6 0.00001 0.000015 0.00002 0.000025
Grafik 3. Fungsi Hazard sebaran Log-logistik
5 10 15 20 25 30 0.2 0.4 0.6 0.8 1
Grafik 4. Fungsi Survivor sebaran Log-logistik
Diberikan data 50 penderita Hypernephroma (lihat Lampiran 2)
Analisis data 50 penderita Hypernephroma, untuk data tersensor dan data yang tidak tersensor menggunakan SAS (Statistic Aplication Software). Diperoleh hasil sebagai berikut :
1. Data tersensor Regresi logistik
Analysis of Maximum Likelihood Estimates Standard Wald Parameter DF Estimate Error Chi-Square Pr > ChiSq Intercept 1 -9.2521 1.4099 43.0653 <.0001 Usia 1 0.0773 0.0221 12.2488 0.0005 Perlakuan 0 1 0.1939 0.2155 0.8098 0.3682 2 1939 . 0 1 0773 . 0 2521 . 9 ) (x x x g =− + + x1= Usia x2= Perlakuan
Hasil analisis menunjukkan bahwa perlakuan yang diberikan tidak mempengaruhi waktu bertahan hidup penderita. Sedangkan usia berpengaruh
terhadap waktu bertahan hidup penderita. Odds rasio estimate usia (lihat Lampiran 3) adalah 1.080, yang berarti setiap tahunnya terjadi peningkatan penderita
Hypernephroma sebanyak 1.080 kali, semakin bertambahnya usia seseorang maka peluang bertahan hidupnya semakin kecil.
Analisis Survival
Analysis of Parameter Estimates
Standard 95% Confidence Chi-
Parameter DF Estimate Error Limits Square Pr>ChiSq Intercept 1 10.1485 2.2040 5.8287 14.4683 21.20 <.0001 Perlakuan 0 1 -1.4333 0.6324 -2.6729 -0.1938 5.14 0.0234 Perlakuan 1 0 0.0000 . . . . . Usia 1 -0.0845 0.0341 -0.1512 -0.0177 6.15 0.0131 Scale 1 0.8835 0.1949 0.5734 1.3615 Intercept = µ Scale=
σ
= − = αβ koefisien dari masing-masing nilai x dimana
x1= Usia
x2= Perlakuan
1
β adalah nilai penduga untuk Usia 2
β adalah nilai penduga untuk perlakuan ( tidak dioperasi) 4333 . 1 0845 . 0 2 1 = = β β 2 4333 . 1 1 0845 . 0 x + x
=
η
13 . 1 8835 . 0 1 5 . 11 8835 . 0 1485 . 10 1 = − = = = = − = σ σ µ θ k Model AFT Variabel Perlakuan Jika t=120 Maka : k t e t S θ + = 1 1 ) ( 0 k k t e t S i η θ + + = 1 1 ) ( 1 ) ( 0 tS = Peluang bertahan hidup penderita yang mengalami operasi.
) ( 1 t
S = Peluang bertahan hidup penderita yang tidak dioperasi.
13 . 1 120 5 . 11 1 1 ) ( 0 t = +e− S = 0.998 13 . 1 120 ) 4333 . 1 * 13 . 1 ( 5 . 11 1 1 ) ( 1 t = +e− + S = 0.9 20 40 60 80 100 120survival time 0.99 0.992 0.994 0.996 0.998 estimated survivor
Grafik 5. Fungsi Survivor model AFT Log-logistik untuk penderita yang mengalami operasi dan penderita yang tidak dioperasi (data tersensor).
Peluang bertahan hidup penderita yang dioperasi lebih besar dari pada penderita yang tidak dioperasi .
) 1 ( 1 ) ( 0 k t e k k t e t h θ θ + − = k t i k e k kt i k e t h θ η η θ + + − + = 1 1 ) ( 1 ) ( 0 t
h = Peluang kematian penderita yang mengalami operasi.
) ( 1 t
h = Peluang kematian penderita yang tidak dioperasi. 13 . 1 120 5 . 11 1 ) 1 13 . 1 120 ( 13 . 1 5 . 11 ) ( 0 + − − − = e e t h = 0.000021
9
13 . 1 )) 4333 . 1 ( 13 . 1 ( 5 . 11 1 13 . 1 )) 4333 . 1 ( 13 . 1 ( 5 . 11 1 120 1 ) 120 ( 13 . 1 ) ( − + − + − + = e e t h = 0.0001 50 100 150 200 250 300 350 survival time 0.00002 0.00004 0.00006 0.00008 0.0001 0.00012 estimated hazardGrafik 6. Fungsi Hazard model AFT Log-logistik untuk penderita yang mengalami operasi dan penderita yang tidak dioperasi (data tersensor). Model AFT Variabel Usia k k t e t S i η θ + + = 1 1 ) ( 1 13 . 1 120 ) 0845 . 0 * 13 . 1 ( 5 . 11 1 1 ) ( 1 t = +e− + S = 0.9975 20 40 60 80 100 120survival time 0.9975 0.998 0.9985 0.999 0.9995 estimated survivor
Grafik 7. Fungsi Survivor model AFT Log-logistik (data tersensor).
k t i k e k kt i k e t h θ η η θ + + − + = 1 1 ) ( 1 13 . 1 )) 0845 . 0 ( 13 . 1 ( 5 . 11 1 13 . 1 )) 0845 . 0 ( 13 . 1 ( 5 . 11 1 120 1 ) 120 ( 13 . 1 ) ( − + − + − + = e e t h = 0.00000234 20 40 60 80 100 120survival time 5µ10-6 0.00001 0.000015 0.00002 estimatedhazard
Grafik 8. Fungsi Hazard model AFT Log-logistik untuk penderita (data tersensor). Model PO
k β
β* =− (Collet 1994)
Untuk variabel perlakuan ) ( 0 1 ) ( 0 ) ( 1 1 ) ( 1 t S t S i e t S t S − = − η ) ( 0 t
S = Peluang bertahan hidup penderita yang mengalami operasi.
) ( 1t
S = Peluang bertahan hidup penderita yang tidak dioperasi.
Model PO k β β* =− (Collet, 1994) = (-1.4333)(1.13) = -1.62 k t e t S t S − − = − θ ) ( 0 1 ) ( 0 = 0.997 k t e t S t S − − = − θ η 1 ) ( 1 1 ) ( 1 S1(t) = 0.988683 1 ) ( 0 ) ( 1 = e−η t h t h ) ( 0 t
h = Rasio kematian penderita yang mengalami operasi.
) ( 1 t
h = Rasio kematian penderita yang tidak dioperasi. 1 ) ( 0 ) ( 1 = e−η t h t h
=
−1
1.62e
=5.05.Rasio kematian penderita yang dioperasi terhadap penderita yang tidak dioperasi adalah 5.05.
2. Data tidak tersensor
Regresi logistik
Analysis of Maximum Likelihood Estimates Standard Wald
Parameter DF Estimate Error Chi-Square Pr > ChiSq Intercept 1 -6.6333 1.6842 15.5113 <.0001 Perlakuan 1 1.4150 0.6159 5.2784 0.0216 Usia 1 0.0561 0.0273 4.2249 0.0398 2 4150 . 1 1 0561 . 0 6333 . 6 ) (x x x g =− + + x1= Usia x2= Perlakuan
Hasil analisis menunjukkan, perlakuan mempengaruhi waktu bertahan hidup penderita. Jika penderita mengalami operasi maka nilai dari g(x) akan meningkat sebesar 1.4150 kali satuan. Berdasarkan odds rasio estimate ( lihat Lampiran 4) untuk perlakuan
adalah 4.117 maka rasio bertahan hidup penderita yang dioperasi terhadap penderita yang tidak dioperasi adalah 4:1. Sedangkan odds rasio estimate usia (lihat Lampiran 4) adalah 1.058, yang berarti penderita setiap tahunnya meningkat 1.058 kali, semakin bertambahnya usia seseorang maka peluang bertahan hidupnya semakin kecil.
Analisis Survival
Analysis of Parameter Estimates
Standard 95% Confidence Chi-
Parameter DF Estimate Error Limits Square Pr>ChiSq Intercept 1 3.4790 1.5886 0.3654 6.5926 4.80 0.0285 Perlakuan 0 1 0.9133 0.3875 0.1539 1.6727 5.56 0.0184 Perlakuan 1 0 0.0000 . . . . . Usia 1 -0.0266 0.0249 -0.0754 0.0222 1.14 0.2858 Scale 1 0.4040 0.0935 0.2566 0.6360 Intercept = µ Scale=
σ
= − = αβ koefisien dari masing-masing nilai x dimana
x1= Usia
x2= Perlakuan
1
β adalah nilai penduga untuk Usia 2
β adalah nilai penduga untuk Perlakuan Dari hasil analisis diketahui nilai untuk masing-masing parameter 0266 . 0 1 = β 9133 . 0 2 = − β 2 9133 . 0 1 0266 . 0 x − x
=
η
6 . 8 4040 . 0 4790 . 3 − = = − = σ µ θ 5 . 2 4040 . 0 1 1 = = = σ k Model AFT Variabel Perlakuan Jika t=120 Maka : k t e t S θ + = 1 1 ) ( 0 . k k t e t S i η θ + + = 1 1 ) ( 1 . ) ( 0 tS = Peluang bertahan hidup penderita yang mengalami operasi.
) ( 1t
S = Peluang bertahan hidup penderita yang tidak dioperasi.
5 . 2 120 6 . 8 1 1 ) ( 0 t = + e− S = 0.03 5 . 2 120 )) 9133 . 0 ( * 5 . 2 ( 6 . 8 1 1 ) ( 1 t = +e− + − S = 0.25
11
20 40 60 80 100 120survival time 0.2 0.4 0.6 0.8 1 estimated survivorGrafik 9. Fungsi Survivor model AFT Log-logistik untuk penderita yang mengalami operasi dan penderita yang tidak dioperasi (data tidak tersensor).
Peluang bertahan hidup penderita yang tidak dioperasi lebih besar dari pada penderita yang dioperasi . ) 1 ( 1 ) ( 0 k t e k k t e t h θ θ + − = . k t i k e k kt i k e t h θ η η θ + + − + = 1 1 ) ( 1 . ) ( 0 t
h = Rasio kematian penderita yang mengalami operasi.
) ( 1 t
h = Rasio kematian penderita yang tidak dioperasi. 5 . 2 120 6 . 8 1 ) 1 5 . 2 120 ( 5 . 2 6 . 8 ) ( 0 + − − − = e e t h = 0.02 5 . 2 )) 9133 . 0 ( 5 . 2 ( 6 . 8 1 5 . 2 )) 9133 . 0 ( 5 . 2 ( 6 . 8 1 120 1 ) 120 ( 5 . 2 ) ( − + − − − + − + = e e t h = 0.016 20 40 60 80 100 120survival time 0.01 0.02 0.03 0.04 estimated hazard
Grafik 10. Fungsi Hazard model AFT Log-logistik untuk penderita yang mengalami
operasi dan penderita yang tidak dioperasi (data tidak tersensor).
Rasio kematian penderita yang mengalami operasi lebih besar daripada rasio kematian penderita yang tidak dioperasi.
Model PO k β
β* =− (Collet, 1994) Untuk variabel perlakuan
) ( 0 1 ) ( 0 ) ( 1 1 ) ( 1 t S t S i e t S t S − = − η ) ( 0 t
S = Peluang bertahan hidup penderita yang mengalami operasi.
) ( 1t
S = Peluang bertahan hidup penderita yang tidak dioperasi.
k β β* =− = -(-0.9133)(2.5) = 2.28 k t e t S t S − − = − θ ) ( 0 1 ) ( 0 = 0.03 k t e t S t S − − = − θ η1 ) ( 1 1 ) ( 1 S1(t) = 0.25 1 ) ( 0 ) ( 1 = e−η t h t h ) ( 0 t
h = Rasio kematian penderita yang mengalami operasi.
) ( 1 t
h = Rasio kematian penderita yang tidak dioperasi. 1 ) ( 0 ) ( 1 = e−η t h t h = 2
1
.28e
= 0.1Rasio kematian penderita yang dioperasi terhadap penderita yang tidak dioperasi adalah 0.1.
3. Data tidak tersensor (0=1) Regresi logistik
Analysis of Maximum Likelihood Estimates Standard Wald
Parameter DF Estimate Error Chi-Square Pr > ChiSq Intercept 1 -5.6898 1.0163 31.3432 <.0001 Perlakuan 1 -0.5537 0.3011 3.3833 0.0659 Usia 1 0.0440 0.0166 7.0088 0.0081 2 5537 . 0 1 440 . 0 6898 . 5 ) (x x x g =− + − x1= Usia x2= Perlakuan
Hasil analisis menunjukkan variabel perlakuan tidak mempengaruhi terhadap waktu bertahan hidup penderita. Sedangkan usia mempengaruhi waktu bertahan hidup
penderita. Odds rasio estimate usia (lihat Lampiran 5) adalah 1.045, yang berarti penderita Hypernephroma setiap tahun meningkat sebesar 1.045 kali, semakin bertambahnya usia seseorang maka peluang bertahan hidupnya semakin kecil.
Analisis Survival
Analysis of Parameter Estimates
Standard 95% Confidence Chi-
Parameter DF Estimate Error Limits Square Pr>ChiSq Intercept 1 5.6061 0.7936 4.0507 7.1615 49.91 <.0001 Perlakuan 0 1 -0.6273 0.2651 -1.1469 -0.1077 5.60 0.0180 Perlakuan 1 0 0.0000 . . . . . Usia 1 -0.0376 0.0135 -0.0640 -0.0112 7.80 0.0052 Scale 1 0.4968 0.0579 0.3952 0.6243 Intercept = µ Scale=
σ
= − = αβ koefisien dari masing-masing nilai x dimana
x1= Usia
x2= Perlakuan
1
β adalah nilai penduga untuk Usia 2
β adalah nilai penduga untuk Perlakuan Dari hasil analisis diketahui nilai untuk masing-masing parameter 01 . 2 4968 . 0 1 1 3 . 11 4968 . 0
6061
.
5
= = = − = − = − = σ σ µ θ k 0376 . 0 1 = β 6273 . 0 2 = β Model AFT Variabel Perlakuan Jika t=120 Maka : k t e t S θ + = 1 1 ) ( 0 . k k t e t S i η θ + + = 1 1 ) ( 1 . ) ( 0 tS = Peluang bertahan hidup penderita yang mengalami operasi.
) ( 1 t
S = Peluang bertahan hidup penderita yang tidak dioperasi.
01 . 2 120 3 . 11 1 1 ) ( 0 t = +e− S = 0.867 01 . 2 120 ) 6273 . 0 * 01 . 2 ( 3 . 11 1 1 ) ( 1 = + − + e t S = 0.6 20 40 60 80 100 120survival time 0.6 0.7 0.8 0.9 estimated survivor
Grafik 11. Fungsi Survivor model AFT Log-logistik untuk penderita yang mengalami operasi dan penderita yang tidak dioperasi (data tidak tersensor(0=1)).
Peluang bertahan hidup penderita yang dioperasi lebih besar dari pada penderita yang tidak dioperasi . ) 1 ( 1 ) ( 0 k t e k k t e t h θ θ + − = . k t i k e k kt i k e t h θ η η θ + + − + = 1 1 ) ( 1 .
13
) ( 0 t
h = Peluang kematian penderita yang mengalami operasi.
) ( 1 t
h = Peluang kematian penderita yang tidak dioperasi. 01 . 2 120 3 . 11 1 ) 1 01 . 2 120 ( 01 . 2 3 . 11 ) ( 0 + − − − = e e t h = 0.0026 01 . 2 )) 6273 . 0 ( 01 . 2 ( 3 . 11 1 01 . 2 )) 6273 . 0 ( 13 . 1 ( 3 . 11 1 120 1 ) 120 ( 01 . 2 ) ( − + − + − + = e e t h = 0.007 20 40 60 80 100 120survival time 0.001 0.002 0.003 0.004 0.005 0.006 estimated hazard
Grafik 12. Fungsi Hazard model AFT Log-logistik untuk penderita yang mengalami operasi dan penderita yang tidak dioperasi (data tidak tersensor (0=1)).
Model AFT Variabel Usia k k t e t S i η θ + + = 1 1 ) ( 1 01 . 2 120 ) 6237 . 0 * 01 . 2 ( 3 . 11 1 1 ) ( 1 = + − + e t S = 0.6 20 40 60 80 100 120 0.6 0.7 0.8 0.9 Grafik 13. Fungsi Survivor model AFT Log-logistik (data tidak tersensor (0=1)).
k t i k e k kt i k e t h θ η η θ + + − + = 1 1 ) ( 1 01 . 2 )) 0376 . 0 ( 01 . 2 ( 3 . 11 1 01 . 2 )) 0376 . 0 ( 01 . 2 ( 3 . 11 1 120 1 ) 120 ( 01 . 2 ) ( − + − + − + = e e t h = 0.0028 20 40 60 80 100 120 0.0005 0.001 0.0015 0.002 0.0025
Grafik 14. Fungsi Hazard model AFT Log-logistik (data tidak tersensor (0=1)).
Model PO k β
β* =− (Collet, 1994)
Untuk variabel perlakuan ) ( 0 1 ) ( 0 ) ( 1 1 ) ( 1 t S t S i e t S t S − = − η ) ( 0 t
S = Peluang bertahan hidup penderita yang mengalami operasi.
) ( 1 t
S = Peluang bertahan hidup penderita yang tidak dioperasi.
k β β* =− = (-0.6237)(2.01) = -1.25 k t e t S t S − − = − θ ) ( 0 1 ) ( 0 = 0.867 k t e t S t S − − = − θ η 1 ) ( 1 1 ) ( 1 S1(t) = 0.6 1 ) ( 0 ) ( 1 = e−η t h t h ) ( 0 t
h = Rasio kematian penderita yang mengalami operasi.
) ( 1 t
h = Rasio kematian penderita yang tidak dioperasi. 1 ) ( 0 ) ( 1 = e−η t h t h = −
1
1.25e
=3.5Rasio kematian penderita yang dioperasi terhadap penderita yang tidak dioperasi adalah 3.5.
SIMPULAN
Analisis variabel perlakuan data survival dengan model sebaran Log-logistik menggunakan dua model yaitu model Accelerated Failure Time (AFT) Log-logistik dan model Proportional Odds (PO) Log-logistik.
Dalam analisis data dengan model AFT, variabel perlakuan mampu meningkatkan peluang bertahan hidup penderita yang
dioperasi sebesar 1.1 kali sementara itu analisis data menggunakan model PO mampu meningkatkan peluang hidup penderita yang dioperasi sebesar 1 kali .
Data tersensor lebih tepat dianalisis dengan menggunakan analisis survival , karena jika dianalisis menggunakan regresi logistik akan memberikan hasil yang bias ( under estimate).
DAFTAR PUSTAKA
Collet, 1994. Modelling Survival Data in Medical Research. 3th ed. London-Glasgow-Weinheim-New York-Tokyo-Melbourn-Madras:Caphman and Hall. Cox, D. R dan Oakes, 1984. Analysis of
Survival Data. Cambridge: University Press.
Grimmet, G. R and R. Strizaker. 1992. Probability and Random Process. 2nd Ed. Oxford :Clendron Press.
Hogg, V. R and Craigh, T. A. 1995. Introduction to Mathematical Statistic.5th ed. New Jersey: Prentice Hall, Englewood Cliffs Publisher .
Hosmer, D. W and Stanley L. 2000. Applied Logistic Regression. 2nd Ed. New York-
Chichester-Weinheim-Brisbane-Singapore-Toronto: A Wiley- Interscience Publication.
Lee, E. T. 1992. Statistical Methods for Survival Data Analysis. Second ed. New York: A Wiley Interscience Publication.
Sanella, E. 2006. Penyelesaian Masalah Data Survival Dengan Menggunakan Metode Nonparametrik [skripsi]. Bogor: Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor
.
Lampiran 1 Penurunan Hazard ratio
[
]
(
)
[
]
(
)
[
]
(
)
[
]
{
}
(
)
[
]
(
)
(
)
(
)
(
1)
1 0() ) ( 0 ) ( 0 ) ( 0 ) ( ) ( 0 ) ( 0 ) ( 0 ) ( 0 1 1 ) ( 0 ) ( 0 ) ( ) ( 0 ) ( 0 ) ( 0 ) ( 0 ) ( 0 ) ( ) ( 0 1 ) ( 0 1 ) ( 0 ) ( ) ( 0 1 log ) ( 0 ) ( ) ( 0 1 log ) ( 0 log ) ( ) ( log ) ( ) ( 0 1 log ) ( 0 log ) ( log ) ( 0 1 ) ( 0 ) ( 1 ) ( 0 ) ( 0 ) ( 0 ) ( 1 ) ( 0 ) ( 0 1 ) ( 0 ) ( ) ( 0 ) ( 0 ) ( 0 1 ) ( ) ( 0 ) ( ) ( 0 ) ( 0 ) ( ) ( ) ( ) ( 0 ) ( 0 ) ( 0 ) ( ) ( ) ( 0 1 ) ( ) ( 0 ) ( 0 ) ( 1 )) ( 0 1 ))( ( 1 )( ( 0 ) ( ) ( 0 1 ) ( 0 ) ( 1 ) ( t S i e t S t h t h t i h t S t h t f t S i e t f t h t i h t S t S i e i e i e t f t f t h t i h t S i e i e t f i e t h t i h t S i e i e dt d t h t i h t S i e i e t S dt d t i h t i S dt d t i h t S i e i e t S t i S t S i e i e t S t i S t S t S i e i e t S t i S t S i e t S t S i e t i S t S i e t S i e t S t i S t S i e t i S t S i e t S t i S t i S t i S t S i e t S i e t S t i S t i S t S t i S t S i e t S i e t i S t S t i S t S i e t i S t S t S i e t i S t i S + − − − = = + − − − − = + − + − − − − = − + + − − − − = − − + − + = − − + − − − = − = − − + − − = − − + − = − + − − − = − + − = = + − = + − − = − − − = − − − = − = −⎥
⎦
⎤
⎢
⎣
⎡
⎥
⎦
⎤
⎢
⎣
⎡
η η η η η η η η η η η η η η η η η η η η η η η η η η η η η η17
(
)
(
)
(
)
(
)
( )
i e t h t i h t S t S i e t h t i h t S i e t S t S i e t h t i h t S i e t S t h t i h t S i e t S t h t i h η η η η η η − = = − + = + − − − − + − − − = + − − − − = + − − − − =⎪
⎭
⎪
⎬
⎫
⎪
⎩
⎪
⎨
⎧
) ( 0 ) ( 1 ) ( 0 ) ( 0 1 1 1 ) ( 0 ) ( ) ( 0 1 1 ) ( 0 ) ( 0 1 1 ) ( 0 ) ( ) ( 0 1 1 ) ( 0 1 ) ( 0 ) ( ) ( 0 1 1 ) ( 0 1 ) ( 0 ) (Lampiran 2
Data 50 orang penderita penyakit Hypernephroma
Nomor Usia Waktu Sensor Perlakuan
1 53 77 0 1 2 69 18 1 0 3 61 8 1 0 4 52 68 0 1 5 46 35 0 1 6 55 8 1 0 7 62 26 0 1 8 53 84 0 1 9 70 17 0 1 10 48 52 0 1 11 58 26 0 1 12 61 108 0 1 13 77 18 1 0 14 56 72 0 1 15 55 38 0 1 16 50 99 1 0 17 75 9 0 1 18 43 56 0 1 19 69 36 0 1 20 59 108 0 1 21 71 10 1 0 22 56 36 0 1 23 57 6 0 0 24 69 9 1 0 25 72 12 0 1 26 67 5 1 1 27 41 104 0 1 28 77 6 1 1 29 63 115 0 1 30 42 9 0 0 31 59 21 0 1 32 62 14 0 0 33 65 52 0 1 34 53 9 1 1 35 57 48 0 0 36 60 15 0 0 37 59 5 1 1 38 75 28 0 1 39 53 25 0 0 40 67 25 0 0 41 58 40 0 1 42 62 16 0 1 43 69 8 0 0 44 44 70 0 1 45 60 6 1 1
19
46 57 8 1 0 47 45 12 0 1 48 50 20 0 1 49 58 8 0 0 50 51 99 1 0 Ellisa T. Lee, 1994 Keterangan : Sensor : 0= Tersensor 1 = Meninggal Perlakuan : 0 = Tidak operasi 1 = operasiLampiran 3. Data tersensor Regresi Logistik
The LOGISTIC Procedure Model Information Data Set WORK._TMP_ Response Variable (Events) Sensor Response Variable (Trials) Waktu Model binary logit Optimization Technique Fisher's scoring
Number of Observations Read 50
Number of Observations Used 50
Sum of Frequencies Read 1804
Sum of Frequencies Used 1804
Response Profile Ordered Binary Total Value Outcome Frequency 1 Event 14
2 Nonevent 1790 Model Fit Statistics Intercept Intercept and Criterion Only Covariates AIC 257.025 243.558 SC 262.523 265.549 -2 Log L 255.025 235.558 The LOGISTIC Procedure Testing Global Null Hypothesis: BETA=0 Test Chi-Square DF Pr > ChiSq Likelihood Ratio 19.4669 3 0.0002 Score 21.0558 3 0.0001 Wald 18.5313 3 0.0003 Type 3 Analysis of Effects Wald Effect DF Chi-Square Pr > ChiSq Usia 1 12.2488 0.0005 Perlakuan 1 0.8098 0.3682
Analysis of Maximum Likelihood Estimates Standard Wald Parameter DF Estimate Error Chi-Square Pr > ChiSq Intercept 1 -9.2521 1.4099 43.0653 <.0001 Usia 1 0.0773 0.0221 12.2488 0.0005 Perlakuan 0 1 0.1939 0.2155 0.8098 0.3682
Odds Ratio Estimates Point 95% Wald Effect Estimate Confidence Limits Usia 1.080 1.035 1.128 Perlakuan 0 vs 1 1.474 0.633 3.430
Association of Predicted Probabilities and Observed Responses Percent Concordant 75.1 Somers' D 0.574 Percent Discordant 17.6 Gamma 0.619 Percent Tied 7.3 Tau-a 0.015 Pairs 42720 c 0.787
Analisis Survival Input
proc format;
value status 1='Meninggal' 0='Tersensor'; run;
data penderita;
input Nomor Usia Waktu Sensor Perlakuan @@; datalines; 1 53 77 0 1 2 69 18 1 0 3 61 8 1 0 4 52 68 0 1 5 46 35 0 1 6 55 8 1 0 7 62 26 0 1 8 53 84 0 1 9 70 17 0 1 10 48 52 0 1 11 58 26 0 1 12 61 108 0 1 13 77 18 1 0 14 56 72 0 1 15 55 38 0 1 16 50 99 1 0 17 75 9 0 1 18 43 56 0 1 19 69 36 0 1 20 59 108 0 1 21 71 10 1 0 22 56 36 0 1 23 57 6 0 0 24 69 9 1 0 25 72 12 0 1 26 67 5 1 1 27 41 104 0 1 28 77 6 1 1 29 63 115 0 1 30 42 9 0 0 31 59 21 0 1 32 62 14 0 0 33 65 52 0 1 34 53 9 1 1 35 57 48 0 0 36 60 15 0 0
21
37 59 5 1 1 38 75 28 0 1 39 53 25 0 0 40 67 25 0 0 41 58 40 0 1 42 62 16 0 1 43 69 8 0 0 44 44 70 0 1 45 60 6 1 1 46 57 8 1 0 47 45 12 0 1 48 50 20 0 1 49 58 8 0 0 50 51 99 1 0 ; proc lifereg; class perlakuan;model Waktu*Sensor(0)= Perlakuan Usia/d=LLOGISTIC;
run;
The LIFEREG Procedure Model Information
Data Set WORK.PENDERITA Dependent Variable Log(Waktu) Censoring Variable Sensor
Censoring Value(s) 0
Number of Observations 50
Noncensored Values 14
Right Censored Values 36
Left Censored Values 0
Interval Censored Values 0
Name of Distribution LLogistic Log Likelihood -39.49608342 Number of Observations Read 50
Number of Observations Used 50 Class Level Information
Name Levels Values Perlakuan 2 0 1 Type III Analysis of Effects Wald
Effect DF Chi-Square Pr > ChiSq Perlakuan 1 5.1364 0.0234 Usia 1 6.1507 0.0131 Analysis of Parameter Estimates
Standard 95% Confidence Chi-
Parameter DF Estimate Error Limits Square Pr ChiSq Intercept 1 10.1485 2.2040 5.8287 14.4683 21.20 <.0001 Perlakuan 0 1 -1.4333 0.6324 -2.6729 -0.1938 5.14 0.0234 Perlakuan 1 0 0.0000 . . . . . Usia 1 -0.0845 0.0341 -0.1512 -0.0177 6.15 0.0131 Scale 1 0.8835 0.1949 0.5734 1.3615
Lampiran 4. Data tidak tersensor Regresi logistik
The LOGISTIC Procedure Model Information
Data Set WORK.PENDERITA Response Variable (Events) Sensor
Response Variable (Trials) Waktu Model binary logit Optimization Technique Fisher's scoring
Number of Observations Read 14
Number of Observations Used 14
Sum of Frequencies Read 308
Sum of Frequencies Used 308
Response Profile Ordered Binary Total Value Outcome Frequency 1 Event 14
2 Nonevent 294 Model Fit Statistics
Intercept Intercept and Criterion Only Covariates AIC 115.903 108.849 SC 119.633 120.040 -2 Log L 113.903 102.849 The LOGISTIC Procedure
Analysis of Maximum Likelihood Estimates Standard Wald
Parameter DF Estimate Error Chi-Square Pr > ChiSq Intercept 1 -6.6333 1.6842 15.5113 <.0001 Perlakuan 1 1.4150 0.6159 5.2784 0.0216 Usia 1 0.0561 0.0273 4.2249 0.0398 Odds Ratio Estimates
Point 95% Wald Effect Estimate Confidence Limits Perlakuan 4.117 1.231 13.766 Usia 1.058 1.003 1.116
Association of Predicted Probabilities and Observed Responses Percent Concordant 73.7 Somers' D 0.551 Percent Discordant 18.6 Gamma 0.597 Percent Tied 7.8 Tau-a 0.048 Pairs 4116 c 0.775 Analisis Survival
Input
proc format;
value status 1='Meninggal' 0='Tersensor'; run;
data penderita;
input Nomor Usia Waktu Sensor Perlakuan @@; datalines; 1 69 18 1 0 2 61 8 1 0 3 55 8 1 0 4 77 18 1 0
23
5 50 99 1 0 6 71 10 1 0 7 69 9 1 0 8 67 5 1 1 9 77 6 1 1 10 53 9 1 1 11 59 5 1 1 12 60 6 1 1 13 57 8 1 0 14 51 99 1 0 ; proc lifereg; class perlakuan;model Waktu*Sensor(0)= Perlakuan Usia/d=LLOGISTIC;
run;
The LIFEREG Procedure Model Information
Data Set WORK.PENDERITA Dependent Variable Log(Waktu) Censoring Variable Sensor
Censoring Value(s) 0
Number of Observations 14
Noncensored Values 14
Right Censored Values 0
Left Censored Values 0
Interval Censored Values 0
Name of Distribution LLogistic Log Likelihood -15.35862319 Number of Observations Read 14
Number of Observations Used 14 Class Level Information
Name Levels Values Perlakuan 2 0 1 Type III Analysis of Effects Wald
Effect DF Chi-Square Pr > ChiSq Perlakuan 1 5.5567 0.0184 Usia 1 1.1391 0.2858 Analysis of Parameter Estimates
Standard 95% Confidence Chi-
Parameter DF Estimate Error Limits Square Pr>ChiSq Intercept 1 3.4790 1.5886 0.3654 6.5926 4.80 0.0285 Perlakuan 0 1 0.9133 0.3875 0.1539 1.6727 5.56 0.0184 Perlakuan 1 0 0.0000 . . . . . Usia 1 -0.0266 0.0249 -0.0754 0.0222 1.14 0.2858 Scale 1 0.4040 0.0935 0.2566 0.6360
Lampiran 5. Data tidak tersensor (0=1) Regresi logistik
The LOGISTIC Procedure Model Information
Data Set WORK.PENDERITA Response Variable (Events) Sensor
Response Variable (Trials) Waktu Model binary logit Optimization Technique Fisher's scoring
Number of Observations Read 50
Number of Observations Used 50
Sum of Frequencies Read 1804
Sum of Frequencies Used 1804
Response Profile Ordered Binary Total Value Outcome Frequency 1 Event 50
2 Nonevent 1754 Model Fit Statistics
Intercept Intercept and Criterion Only Covariates AIC 459.175 452.647 SC 464.673 469.140 -2 Log L 457.175 446.647 The LOGISTIC Procedure
Analysis of Maximum Likelihood Estimates Standard Wald
Parameter DF Estimate Error Chi-Square Pr > ChiSq Intercept 1 -5.6898 1.0163 31.3432 <.0001 Perlakuan 1 -0.5537 0.3011 3.3833 0.0659 Usia 1 0.0440 0.0166 7.0088 0.0081 Odds Ratio Estimates
Point 95% Wald Effect Estimate Confidence Limits Perlakuan 0.575 0.319 1.037 Usia 1.045 1.011 1.080
Association of Predicted Probabilities and Observed Responses Percent Concordant 59.3 Somers' D 0.242 Percent Discordant 35.1 Gamma 0.257 Percent Tied 5.6 Tau-a 0.013 Pairs 87700 c 0.621 Analisis Survival
Input
proc format;
value status 1='Meninggal' 0='Tersensor'; run;
data penderita;
input Nomor Usia Waktu Sensor Perlakuan
@@; datalines; 1 53 77 1 1 2 69 18 1 0 3 61 8 1 0 4 52 68 1 1 5 46 35 1 1 6 55 8 1 0 7 62 26 1 1
25
8 53 84 1 1 9 70 17 1 1 10 48 52 1 1 11 58 26 1 1 12 61 108 1 1 13 77 18 1 0 14 56 72 1 1 15 55 38 1 1 16 50 99 1 0 17 75 9 1 1 18 43 56 1 1 19 69 36 1 1 20 59 108 1 1 21 71 10 1 0 22 56 36 1 1 23 57 6 1 0 24 69 9 1 0 25 72 12 1 1 26 67 5 1 1 27 41 104 1 1 28 77 6 1 1 29 63 115 1 1 30 42 9 1 0 31 59 21 1 1 32 62 14 1 0 33 65 52 1 1 34 53 9 1 1 35 57 48 1 0 36 60 15 1 0 37 59 5 1 1 38 75 28 1 1 39 53 25 1 0 40 67 25 1 0 41 58 40 1 1 42 62 16 1 1 43 69 8 1 0 44 44 70 1 1 45 60 6 1 1 46 57 8 1 0 47 45 12 1 1 48 50 20 1 1 49 58 8 1 0 50 51 99 1 0 ; proc lifereg; class perlakuan;model Waktu*Sensor(0)=Perlakuan Usia/d=LLOGISTIC;
run;
The LIFEREG Procedure Model Information
Data Set WORK.PENDERITA Dependent Variable Log(Waktu) Censoring Variable Sensor
Censoring Value(s) 0
Number of Observations 50
Noncensored Values 50
Right Censored Values 0
Left Censored Values 0
Interval Censored Values 0 Name of Distribution LLogistic
Log Likelihood -63.97913154 Number of Observations Read 50 Number of Observations Used 50 Class Level Information
Name Levels Values Perlakuan 2 0 1 Type III Analysis of Effects Wald
Effect DF Chi-Square Pr > ChiSq Perlakuan 1 5.5990 0.0180 Usia 1 7.8025 0.0052 Analysis of Parameter Estimates
Standard 95% Confidence Chi-
Parameter DF Estimate Error Limits Square Pr>ChiSq Intercept 1 5.6061 0.7936 4.0507 7.1615 49.91 <.0001 Perlakuan 0 1 -0.6273 0.2651 -1.1469 -0.1077 5.60 0.0180 Perlakuan 1 0 0.0000 . . . . . Usia 1 -0.0376 0.0135 -0.0640 -0.0112 7.80 0.0052 Scale 1 0.4968 0.0579 0.3952 0.6243