Uji-LogRank
4.1 Tujuan Pembelajaran
Setelah selesai melakukan pembelajaran pada bagian ini, mahasiswa diharapkan dapat:
4.1. Menjelaskan perbedaan metode non-parametrik dan parametrik dalam ana-lisis data survival
4.2. Melakukan estimasi Kaplan-Meier untuk fungsi survival dan menjelaskan teori yang mendasarinya
4.3. Melakukan estimasi Nelson-Aalen untuk fungsi hazard kumulatif dan men-jelaskan teori yang mendasarinya
4.4. Menggunakan Kaplan-Meier dan Nelson-Aalen dalam analisis data survival 4.5. Menjelaskan perlunya pembandingan fungsi survival dalam analisis data
survival
4.6. Melakukan dan menggunakan metode log-rank test dan teori yang menda-sarinya
4.2 Kaplan-Meier
Untuk mengestimasi S(t) dapat digunakan estimator Kaplan-Meier atau sering juga disebut sebagai Product-Limit estimator sebagai berikut:
ˆ S(t) = ( 1 jika t < t1 Q ti≤t(1 −di Yi) jika ti ≤ t (4.1) 35
4.2. Kaplan-Meier 36
dimanadi adalah banyaknya event danYi adalah banyaknya individu yang beresi-ko (number at risk) Estimator Kaplan-Meier merupakan fungsi tangga yang turun pada saat ada event.
Dasar pemikiran sstimator Kaplan-Meier dapat dijelaskan seperti pada Gam-bar 4.1. Misalkan event yang menjadi perhatian adalah meninggal (M), dengan origin mulai dari waktu 0 dan diperoleh waktu kronologis terjadinya event pada t1, t2 dant3. Pada saatt1, peluang meninggal dengan diketahui kondisi pada saat waktu 0 adalahπ1, dan peluang hidup (H) atau survive adalah1 −π1. Pada saatt2, peluang meninggal dengan diketahui kondisi pada saatt1 adalahπ2, dan peluang meninggal 1 − π2. Demikian pula dengan π3 dan1 − π3. Probabilitas mening-gal π1, π2, dan π3 dapat dipandang sebagai probabilitas binomial namun dengan probabilitas sukses yang berubah-ubah menurut waktu.
Peluang survive sampai waktut3 adalah
(1 − π1)(1 − π2)(1 − π3),
yaitu produk dari masing-masing peluang bersyarat mulai dari 0 sampai dengan t3.
Estimator Kaplan-Meier adalah non-parametrik dalam artian tidak mengasum-sikan banyaknya parameter yang berhingga. Banyaknya parameter atau kuantitas yang akan diestimasi dalam Kaplan-Meier adalah sebanyak titik waktu di mana
event terjadi.
Untuk mengestimasiπi; i = 1, 2, . . . dapat digunakan proporsi meninggal de-ngan diberikan banyaknya yang masih hidup pada saat sebelum terjadinya event, seperti halnya estimator untuk peluang sukses pada binomial. Apabila di adalah banyaknya yang meninggal pada saatti danYi adalah banyaknya yang masih hi-dup, tepat sebelum saat ti, maka estimator untuk πi adalah di/Yi dan estimator untuk 1 − πi adalah 1 − di/Yi. Estimasi untuk survivesampai waktu k tertentu menjadi
(1 − d1/Y1)(1 − d2/Y2)(1 − d3/Y3) . . . (1 − dk/Yk)
dan apabila tk ≤ t, dengan t ≥ adalah bilangan kontinu, maka estimasi untuk
survive sampait ini dapat ditulis seperti estimator Kaplan-Meier (4.1).
Untuk melakukan inferensi tentang S(t) menggunakan ˆS(t) Kaplan-Meier, perlu dihitung terlebih dahulu standard error atau variansi dariS(t). Variansi dari estimator KM ˆS(t) sering disebut sebagai Greenwood’s formula
var[ ˆS(t)] = ˆS(t)2X ti≤t
di
Yi(Yi− di) (4.2)
atau dapat digunakan rumus berikut sebagai alternatif var[ ˆS(t)] = ˆS(t)2[1 − ˆS(t)]
4.2. Kaplan-Meier 37 waktu 0 t1 t2 t3 M: meninggal H: hidup π1 1 −π 1 M H π2 1 −π 2 M H π3 1 −π 3 M H
Gambar 4.1: Ilustrasi Konstruksi Estimator Kaplan-Meier dan Nelson-Aalen Tabel 4.1: Tabel Estimasi Kaplan-Meier Contoh 4.1
t Y d S(t)ˆ se[ ˆS(t)] 6 21 3 1 − 3/21 = 0,857 0,8572 3 (21)(18) = 0,0764 7 17 1 (1 − 1/17) × 0,857 = 0,807 0,8072. . . = 0,0869 10 15 1 (1 − 1/15) × 0,807 = 0,753 0,7532. . . = 0,0963 13 12 1 (1 − 1/12) × 0,753 = 0,690 0,6902. . . = 0,1068 16 11 1 (1 − 1/11) × 0,690 = 0,627 0,6272. . . = 0,1141 22 7 1 (1 − 1/7) × 0,627 = 0,538 0,5382. . . = 0,1282 23 6 1 (1 − 1/6) × 0,538 = 0,448 0,4482. . . = 0,1346
Interval konfidensi 95% dapat disusun dengan menggunakan pendekatan normal ˆ
S(t) ± 1,96 × se[ ˆS(t)].
Contoh 4.1
Diperoleh data dari studi tentang pasien leukemia seperti pada Contoh 1.7, Bab 1. Buatlah Estimasi Kaplan-Meier untuk perawatan 6-MP saja.
Jawab:
Pertama, data waktu diurutkan dan dihitung frekuensi banyaknya individu yang beresiko (belum mendapatkan event) serta banyaknya event pada waktu tersebut. Estimasi ˆS(t)
kemudian dapat dihitung menggunakan persamaan (4.1) dan var[ ˆS(t)] dengan persamaan
(4.2). Hasilnya dapat dilihat pada Tabel 4.1. Plot untuk estimasi Kaplan-Meier yang ber-upa fungsi tangga dapat dibuat seperti Gambar 4.2. Seperti terlihat pada Gambar, tangga akan turun ketika terjadi event saja. Garis pendek tegak pada grafik menunjukkan
ob-4.3. Nelson-Aalen 38 0 5 10 15 20 25 30 35 0.0 0.2 0.4 0.6 0.8 1.0 waktu Estimasi S(t) KM
Gambar 4.2: Grafik estimasi Kaplan-Meier Contoh 4.1
servasi yang tersensor-kanan. Paket program statistika standar biasanya dapat digunakan untuk mengestimasi KM dan grafiknya.
4.3 Nelson-Aalen
Estimator Nelson-Aalen digunakan untuk mengestimasi fungsi hazard kumulatif, didefinisikan sebagai berikut:
ˆ H(t) = ( 0 jika t < t1 P ti≤t di Yi jika ti ≤ t (4.4) dengan variansi ˆ Var( ˆH(t)) =X ti≤t di Y2 i (4.5)
Interval konfidensi 95% dapat disusun dengan menggunakan pendekatan normal ˆ
H(t) ± 1,96 × se[ ˆH(t)].
Prinsip konstruksi estimator Nelson-Aalen sama seperti halnya Kaplan-Meier (lihat Gambar 4.1). Estimator ini merupakan estimator non-parametrik yang
4.3. Nelson-Aalen 39
Tabel 4.2: Tabel estimasi Nelson-Aalen untukH(t) dan S(t) Contoh 4.2
t Y d H(t)ˆ S(t) = exp(− ˆˆ H(t)) 6 21 3 3/21 = 0,143 0,867 7 17 1 1/17 + 0,143 = 0,202 0,817 10 15 1 1/15 + 0,202 = 0,269 0,764 13 12 1 1/12 + 0,269 = 0,352 0,703 16 11 1 1/11 + 0,352 = 0,443 0,642 22 7 1 1/7 + 0,443 = 0,586 0,557 23 6 1 1/6 + 0,586 = 0,753 0,471
mengestimasi kuantitasi yang tidak diketahui pada saat terjadinya event. Dalam hal ini kuantitas yang tidak diketahui adalah peluang bersyarat dengan kondisi sebelum event terjadi atau hazard nya. Apabila estimasi hazard ini dijumlahkan sampai waktutk ≤ t tertentu, maka kuantitas ini adalah estimasi hazard kumulatif yang dirumuskan sebagai estimator Nelson-Aalen 4.4.
Estimasi Nelson-Aalen dapat digunakan untuk mengestimasi S(t) dengan menggunakan hubunganH(t) dengan S(t), yaitu S(t) = exp(−H(t)).
Contoh 4.2
Menggunakan data yang sama seperti Contoh 4.1 untuk perawatan 6-MP saja (data Con-toh 1.7, Bab 1), hitung Estimasi fungsi hazard kumulatif menggunakan Nelson-Aalen dan estimasi fungsi survivalnya.
Jawab:
Disusun tabel seperti pada Tabel Kaplan-Meier contoh 4.1. Gunakan persamaan (4.4) untuk menghitung ˆH(t). Hasilnya adalah seperti pada Tabel 4.2. Plot untuk estimasi
Nelson-Aalen dapat dilihat pada Gambar 4.3.
Dapat dibandingkan nilai estimasi survival yang diperoleh dengan Nelson-Aalen se-lalu lebih besar dari nilai estimasi yang diperoleh dari Kaplan-Meier (Lihat Latihan Soal 4.2).
Estimasi Kaplan-Meier maupun Nelson-Aalen dapat juga digunakan untuk membandingkan dua atau lebih kurva survival, sehingga secara deskriptif dapat dilihat dan disimpulkan kurva mana yang lebih survive dibandingkan yang lain.
Contoh 4.3
Hitunglah estimasi Kaplan-Meier untuk data leukemia Contoh 1.7, Bab 1, untuk kelom-pok placebo. Kemudian gambarlah pada tempat yang sama dengan kelomkelom-pok 6-MP yang sudah dikerjakan pada Contoh 4.1.
Jawab:
4.3. Nelson-Aalen 40 0 5 10 15 20 25 30 35 0.0 0.2 0.4 0.6 waktu estimasi H(t)
Gambar 4.3: Grafik estimasi Nelson-Aalen Contoh 4.2
0 5 10 15 20 25 30 35 0.0 0.2 0.4 0.6 0.8 1.0 waktu estimasi S(t) 6−MP placebo
Gambar 4.4: Plot Estimasi Kaplan-Meier untuk terapi dan placebo data tersensor kanan.
4.4. Membandingkan Dua Fungsi Survival 41
Tabel 4.3: Estimasi Kaplan-Meier untuk Kelompok Placebo t Y d S(t)ˆ 1 21 2 0,9048 2 19 2 0,8095 3 17 1 0,7619 4 16 2 0,6667 5 14 2 0,5714 8 12 4 0,3810 11 8 2 0,2857 12 6 2 0,1905 15 4 1 0,1429 17 3 1 0,0952 22 2 1 0,0476 23 1 1 0,0000
4.4. Grup terapi terlihat lebih baik, atau mempunyai peluang survival yang lebih tinggi dibandingkan grup placebo.
Dalam Contoh 4.3, perbandingan hanya dilakukan secara deskriptif menggu-nakan grafik estimasi Kaplan-Meier fungsi S(t). Pengambilan kesimpulan atau inferensi statistik dapat pula dilakukan untuk membandingkan kurvaS(t) seperti yang akan dibahas pada bagian berikut.
4.4 Membandingkan Dua Fungsi Survival
Seperti halnya permasalahan inferensi statistik yang sudah dikenal, misalnya in-ferensi mean dua populasi dalam kuliah Metode Statistika, diperlukan prosedur uji yang dapat menyatakan apakah dua fungsi survival berbeda. Untuk uji dua mean, dapat digunakan misalnya t-test atau Z-test. Sedangkan untuk menguji atau membandingkan dua kurva survival atau lebih untuk data yang tidak tersen-sor dapat digunakan beberapa Metode Non-parametrik seperti metode Wilcoxon,
Mann-Whitney dan Sign test dapat digunakan. Sedangkan untuk data tersensor
prosedur yang dapat digunakan diantaranya: Gehan’s generalized Wilcoxon test,
the Cox-Mantel test, the logrank test, Peto and Peto’s generalized Wilcoxon test, Cox’s F-test, Gehan’s generalized Wilcoxon test, the Cox-Mantel test, the logrank test (1972), Peto and Peto’s generalized Wilcoxon test, dan Cox’s F-test. Satu
metode yang akan dibahas dalam bagian ini adalah Uji Logrank.
alter-4.5. Latihan Bab 4 42
natif
H1 : S1(t) > S2(t) H1 : S1(t) < S2(t) H1 : S1(t) 6= S2(t)
Uji Logrank didasarkan pada banyaknya observed dan expected event pada setiap
event-time. Untuk log-rank test dengan 2 grup yang ingin dibandingkan statistik
pengujinya adalah: W = (O1 − E1)2 E1 + (O2− E2)2 E2 (4.6)
dengan W ∼ χ2(df = 1). H0 ditolak dengan tingkat signifikasni α bila W > χ2(1 − α, df = 1).
Contoh 4.4
Merujuk ke Contoh 4.3, akan diuji apakah fungsi survival grup terapi berbeda dengan grup placebo. Disusun terlebih dahulu tabel seperti pada Tabel 4.4 untuk digunakan dalam penghitungan 4.6. Ekspektasi e1 dane2 diperoleh dengan cara mengalikan probabilitas kematian pada tiap-tiap grup (Y1/(Y1+ Y2) dan Y2/(Y1+ Y2) ) dikalikan total kejadian
(d1+ d2), untuk masing-masing waktu kejadian (masing-masing baris). Kemudian pada baris terakhir diperoleh total observasi dan total ekspektasi untuk masing-masing grup. Diperoleh statistik W = (O1− E1)2 E1 + (O2− E2)2 E2 = (9 − 19, 26)2 19, 26 + (21 − 10, 74)2 10, 74 = 15,267
yang jauh lebih besar dari nilai daerah kritik3,8414 atau mempunyai p-value yang cukup
kecil. jadi dapat disimpulkanH0ditolak atau dua kurva survival tersebut berbeda.
4.5 Latihan Bab 4
4.1. Merujuk data soal Latihan Bab 3 no. 5
(a) Hitung estimasi fungsi survival menggunakan Kaplan-Meier
(b) Gambarlah estimasi Kaplan Meier di atas grafik fungsi survival eks-ponensial yang dibuat pada soal Latihan Bab 3 no. 5
4.5. Latihan Bab 4 43
Tabel 4.4: Penghitungan untuk Uji log-rank
t d1 d2 Y1 Y2 e1 e2 1 0 2 21 21 (21/42) × 2 (21/42) × 2 2 0 2 21 19 (21/40) × 2 (19/40) × 2 3 0 1 21 17 (21/38) × 1 (17/38) × 1 4 0 2 21 16 (21/37) × 2 (16/37) × 2 5 0 2 21 14 (21/35) × 2 (14/35) × 2 6 3 0 21 12 (21/33) × 3 (12/33) × 3 7 1 0 17 12 (17/29) × 1 (12/29) × 1 8 0 4 16 12 (16/28) × 4 (12/28) × 4 10 1 0 15 8 (15/23) × 1 (8/23) × 1 11 0 2 13 8 (13/21) × 2 (8/21) × 2 12 0 2 12 6 (12/18) × 2 (6/18) × 2 13 1 0 12 4 (12/16) × 1 (4/16) × 1 15 0 1 11 4 (11/15) × 1 (4/15) × 1 16 1 0 11 3 (11/14) × 1 (3/14) × 1 17 0 1 10 3 (10/13) × 1 (3/13) × 1 22 1 1 7 2 (7/9) × 2 (2/9) × 2 23 1 1 6 1 (6/7) × 2 (1/7) × 2 Total 9 21 19,26 10,74
4.2. Estimasi fungsi survival dapat diperoleh dari estimator Nelson-Aalen ber-dasarkan hubungan antaraS(t) dengan H(t). Apabila estimasi S(t) meng-gunakan estimator Nelson-Aalen dinotasikan sebagai ˆSN A(t), dan esti-masi S(t) Kaplan-Meier dinotasikan sebagai ˆSKM(t), tunjukkan bahwa
ˆ
SKM(t) ≤ ˆSN A(t), untuk semua t.
4.3. Dalam suatu kecelakaan di pusat listrik tenaga nuklir, 10 pekerja terkena radiasi. Dengan menganggap origin (waktu 0 ) adalah saat kecelakaan, ter-dapat satu meninggal pada waktu ke-2, satu meninggal pada waktu ke-4, dan x tidak diketahui nasibnya (censored) pada saat ke-3. Jika diketahui Estimasi Kaplan-Meier ˆS(4) = 0,75. Hitung x!
4.4. Modifikasilah rumus estimasi Nelson-Aalen bila subyek semua mendapat-kan event dan tidak ada yang tersensor dan tidak ada yang mendapatmendapat-kan
event pada saat yang sama! Menggunakan rumus tersebut, jika diketahui
ada n subyek seperti disyaratkan di atas, dan diketahui pada saat kemati-an ykemati-ang ke-9 estimasi Nelson-Aalen adalah 0,511 dkemati-an pada saat kematikemati-an yang ke-10 estimasinya 0,588; Hitunglah estimasilah nilai fungsi survival pada saat kematian yang ke-3!
4.5. Dalam suatu penelitian 300 tikus diamati mulai lahir. Tambahan 20 ekor tikus mulai diamati pada saat usia 2 hari dan 30 lagi mulai diamati saat
4.5. Latihan Bab 4 44
berusia 4 hari. Ada 6 meninggal pada usia 1; 10 pada usia 3; 10 pada usia 4, a pada usia 5; b pada usia 9 dan 6 pada usia 12. Diketahui pula 45 tikus tidak diketahui nasibnya pada usia 7; 35 tidak diketahui nasibnya pada usia 10 dan 15 tidak diketahui nasibnya pada usia 13. Diperoleh hasil Kaplan-Meier sebagai berikut: ˆS(7) = 0,892 dan ˆS(13) = 0,856. Hitung a dan b!
4.6. Diketahui data survival sebagai berikut:
grup 1 : 5 1 2 2 7 6
grup 2 : 8+ 10 4+ 4 3+
dengan ”+” adalah tanda untuk data tersensor kanan.
(a) Hitunglah estimasi fungsi survival menggunakan Kaplan-Meier dan Nelson-Aalen untuk masing-masing grup
(b) Ujilah bahwa survival grup 2 lebih besar daripada grup 1 dengan menggunakan logrank test (α = 0,025)
4.7. Diperoleh studi tentang mortalitas akibat penyakit kronis di suatu klinik. Dari masing-masing grup yaitu grup yang mempunyai riwayat penyakit nis (grup 2) dan grup yang tidak mempunyai riwayat riwayat penyakit kro-nis (grup 1) diperoleh data
Grup 1 (n = 25) Grup 2 (n = 25) 12,3+, 5,4, 8,2, 12,2+, 11,7, 10,0, 5,7, 9,8, 2,6, 11,0, 9,2, 12,1+, 6,6, 2,2, 1,8, 10,2, 10,7, 11,1, 5,3, 3,5, 9,2, 2,5, 8,7, 3,8, 3,0 5,8, 2,9, 8,4, 8,3, 9,1, 4,2, 4,1, 1,8, 3,1, 11,4, 2,4, 1,4, 5,9, 1,6, 2,8, 4,9, 3,5, 6,5, 9,9, 3,6, 5,2, 8,8, 7,8, 4,7, 3,9
tanda+ menunjukkan tersensor kanan
(a) Hitunglah estimasi fungsi survival menggunakan Kaplan-Meier dan gambarlah estimasi fungsinya
(b) Ujilah bahwa survival kedua grup tersebut berbeda dengan menggu-nakan logrank test (α = 0,025)