• Tidak ada hasil yang ditemukan

Residual Cox-Snell dalam Menentukan Model Terbaik dalam Analisis Survival

N/A
N/A
Protected

Academic year: 2021

Membagikan "Residual Cox-Snell dalam Menentukan Model Terbaik dalam Analisis Survival"

Copied!
11
0
0

Teks penuh

(1)

RESIDUAL COX-SNELL DALAM MENENTUKAN MODEL

TERBAIK DALAM ANALISIS SURVIVAL

Rahmat Hidayat

Program Studi Matematika, Fakultas Sains Universitas Cokroaminoto Palopo

ABSTRAK

Masalah yang terjadi dalam kehidupan sehari-hari terutama yang berkaitan dengan dunia kedokteran seringkali berhubungan dengan waktu. Misalnya, lama penyakit yang diderita seseorang hingga sembuh atau meninggal, respon seseorang terhadap perlakuan obat yang diberikan, dan lain-lain. Data tentang lama waktu pengamatan terhadap munculnya kejadian disebut sebagai data survival. Ciri khas data survival adalah adanya data tersensor. Salah satu metode parametrik dalam data ini adalah model eksponensial, yang risiko munculnya kejadian adalah sama untuk setiap individu dan memungkinkan penyertaan kovariat dalam waktu survival. Namun demikian sangat sulit menguji sebaran data survival sebab adanya sensor terhadap data dan model parametrik juga perlu dilakukan perhitungan-perhitungan kuantitas tertentu, misalnya nilai hazard maupun survival untuk suatu observasi dengan karakteristik tertentu. Untuk menangani kesulitan tersebut, maka dikembangakn model Cox proportional hazard. Model ini juga memungkinkan penyertaan kovariat dalam waktu survival-nya. Walaupun memiliki beberapa kemudahan seperti yang disebutkan di atas, akan tetapi model Cox proportional hazard tidak selalu lebih baik daripada model parametrik. Jika distribusi dari survival time diketahui, maka model parametrik memberikan hasil yang lebih baik. Penelitian ini bertujuan untuk mengkaji seberapa baik Cox

proportional hazard dalam memodelkan suatu data survival. Hasil penelitian menunjukkan

bahwa jika distribusi diketahui maka model parametrik memberikan hasil yang lebih baik. Meskipun tidak lebih baik dari model parametrik tetapi model Cox proportional hazard tetap cocok untuk memodelkan data.

Kata kunci: survival, Cox proporsional hazard, survival time, sensor

PE N D A H U L U A N

Data tentang lama waktu pengamatan terhadap munculnya kejadian disebut sebagai data survival [1]. [2] menyatakan ciri khas dari data survival adalah survival

time (waktu bertahan hidup) seringkali

tidak lengkap (tersensor). Waktu bertahan hidup dikatakan tidak lengkap jika waktu akhir dari kejadian tidak dapat diamati sehingga status akhir dari individu tidak

dapat diketahui karena individu tersebut tidak diketahui kondisi selanjutnya, sehingga diperlukan suatu analisis survival untuk menganalisis dengan tepat.

Model Cox proportional hazard digunakan secara luas dalam analisis

survival. Model ini biasanya digunakan

untuk pendekatan multivariat dalam analisis survival [3]. Model Cox proportional hazard ini mempunyai

(2)

keuntungan lebih dari model parametrik karena tidak memerlukan spesifikasi bentuk fungsional dari fungsi baseline

hazard dan juga tidak memerlukan pengecekan asumsi-asumsi mengenai kelayakan bentuk distribusi yang diharuskan pada model parametrik. Walaupun memiliki beberapa kemudahan seperti yang disebutkan di atas, akan tetapi model Cox proportional hazard tidak selalu lebih baik daripada model parametrik. Saat sebuah model digunakan dalam penaksiran data survival adalah sangat penting untuk melakukan pengujian kelayakan apakah model yang kita gunakan sudah cocok untuk memodelkan data tersebut [4]. Ada beberapa metode yang sering digunakan dalam pengujian kelayakan model ini, salah satunya adalah metode grafik. Menaksir kelayakan suatu model (goodness of fit) dengan residual adalah salah satu metode grafik yang dapat digunakan dalam analisis survival [5]. Dalam metode regresi, residual adalah perbedaaan antara nilai observasi dan prediksi dari suatu variabel terikat.

TINJAUAN PUSTAKA

Fungsi dalam Analisis Survival

Definisi 1: Waktu survival adalah jangka waktu dari awal pengamatan sampai terjadinya suatu peristiwa yang berupa kegagalan, kematian, respon, timbulnya gejala, dan lain-lain. [6]

Definisi 2: Fungsi survival adalah fungsi yang menyatakan peluang suatu individu dapat bertahan hidup hingga atau lebih dari waktu t (mengalami kejadian sesudah waktu t) [7]. Misal T adalah peubah acak, maka fungsi survival didefinisikan sebagai,

S(t) = P(T> t). Misalkan f fungsi kepekatan

peluang, fungsi survival merupakan komplemen dari fungsi kumulatif F

dengan,

( ) = ( ) = ( > ) = 1 − ( ≤ )

= 1 − ( )[8].

Definisi 3: Fungsi kepekatan peluang didefinisikan sebagai limit dari peluang individu mengalami kejadian dalam interval t sampai .

( ) = lim ( ≤ ≤ + ) Definisi 4: Fungsi hazard yaitu fungsi yang menyatakan peluang seseorang mengalami risiko atau kejadian seperti kegagalan atau meninggal pada waktu t dengan syarat bahwa seseorang itu telah bertahan hingga waktu t, fungsinya diberikan:

ℎ( ) = lim ( | )[9] Dari definisi di atas diperoleh hubungan antara fungsi survival dengan fungsi

hazard.

Dengan menggunakan definisi peluang bersyarat, diperoleh: ℎ( ) = lim ( ≤ ≤ + | ≥ ) = lim ( ≤ ≤ + )/ ( ≥ ) = lim→ ( ) 1 − ( ) = 1 − ( ) .( ) ℎ( ) = ( )( ) =− ′( )( ) = − ( )

(3)

Persamaan di atas diintegralkan dari 0 sampai t dengan S (0) =1 yaitu

− ℎ( ) = ( )

( ) = − ( ) ( ) = exp[− ( )] (Collett 1994)

Jenis-Jenis Penyensoran pada Data

Survival

Ada tiga macam penyensoran yang sering digunakan dalam eksperimen waktu

survival, yaitu sebagai berikut:

1. Sampel lengkap (tidak tersensor), jika semua komponen yang diuji telah mati atau gagal, maka eksperimen akan dihentikan.

2. Sensor tipe I, semua objek yang diteliti (n) masuk pengujian dalam waktu yang

bersamaan, dan pengujian akan dihentikan setelah batas waktu yang ditentukan.

3. Sensor tipe II, semua objek yang diteliti (n) masuk pengujian dalam waktu yang bersamaan, dan pengujian dihentikan setelah mendapatkan objek di antaranya gagal atau mati dengan1 ≤

≤ (Marín 2007).

Selain tiga sensor di atas dikenal juga sensor kanan, yaitu penyensoran dilakukan ketika hanya diketahui bahwa survival time melebihi sebuah nilai tertentu. Selain itu juga sensor kiri. Data tersensor kiri adalah data yang mengalami penyensoran pada waktu sekarang ketika kejadian yang diamati telah terjadi pada saat seseorang masuk dalam penelitian. Karena itu hanya diketahui bahwa waktu kejadian adalah kurang dari suatu nilai tertentu [10]

Model

Dalam penelitian ini ada dua metode

survival yang akan digunakan, yakni

metode parametrik eksponensial dan Cox

proportional hazard.

Metode Parametrik Eksponensial

Peneliti biasanya memilih distribusi eksponensial untuk model data

survival karena metode statistiknya sederhana. Distribusi exponensial ditandai dengan fungsi hazard yang konstan

ℎ( ) = ≥ 0,

di mana > 0.Fungsi kepekatan peluang dan fungsi survival-nya adalah

( ) = exp(− )dan ( ) = exp(− ) [11]

Semakin besar nilai menyebabkan risiko yang tinggi dan waktu

survival yang singkat. Sebaliknya semakin

kecil nilai menyebabkan risiko yang kecil dan waktu survival-nya panjang.

Sifat-sifat distribusi eksponensial: 1. ( ) = lim → ∫ exp(− ) = . Bukti: ( ) = lim exp(− ) = lim exp(− ) = lim − exp(− ) + 1exp(− )

(4)

= lim − exp(− )

+ exp(− ) = lim − exp(− ) −1exp(− ) = lim 0 −1exp(− ) −1exp(0) = 1 2. ( ) = ( ) − ( ( )) = Bukti: ( ) = ( ) − ( ( )) = lim exp(− ) − 1 = lim exp(− ) − 1 = lim − exp(− ) + 1exp(− ) 2 − 1 = lim − exp(− ) + 2 exp(− ) − 1 = lim − exp(− ) + 2 − 1 = 0 + 2 − 1 = 1 3. ( ) = lim → ∫ exp(− ) = exp(− ) . Bukti: ( ) = lim exp(− ) = lim exp(− ) = lim −1exp(− ) = lim − exp(− )

= lim − exp(− ) + exp(− ) = exp(− ) 4. ℎ( ) = ( ) ( ) = ( ) ( ) = , nilai hazard konstan

4.2 Metode Parametrik Eksponensial dengan Penyertaan Kovarait

Menurut [6] waktu survival dapat dianalisis dengan menggunakan

accelerated failure time (AFT) model.

Dalam waktu survival model ini mengasumsikan bahwa hubungan logaritma dari waktu survival T dan kovariat adalah linear dan dapat ditulis

log = + ∑ +

dengan , j=1,2,...,p adalah kovariat, , = 0,1, … , kofisien adalah parameter skala dan adalah error. [12] menjelaskan bahwa untuk penyertaan kovariat dalam distribusi eksponensial, kita menggunakan persamaan di atas dan menggunakan = 1sehingga diperoleh

log = + ∑ + = +

dengan = + ∑ . T adalah

distribusi eksponensial dengan fungsi

hazard, fungsi kepekatan, dan fungsi survival berturut-turut

(5)

ℎ( , ) = = − + = exp(− ) ℎ( , ) = exp(− )

( , ) = exp(− ) 2.2 Cox proporsional hazard

Model Cox proporsional hazard memiliki ciri bahwa individu yang berbeda memiliki fungsi hazard yang proporsional yakni [ℎ( | )/ℎ( | )] , rasio fungsi

hazard dari dua individu dengan

penyertaan kovariat =

, , … dan =

, , … adalah konstan. Ini artinya bahwa rasio dari resiko kegagalan dari dua individu adalah sama tidak bergantung pada seberapa lama mereka bertahan. Cox (1972) menjelaskan bahwa bentuk umum dari model Cox proportional

hazard adalah:

ℎ ( ) = ℎ ( ) exp + + ⋯ +

.

dengan adalah kovariat, tetapi ia tidak membuat asumsi tentang bentuk dariℎ ( )

yang disebut dengan baseline fungsi

hazard karena itu adalah nilai dari fungsi

hazard saat = 0. 2.3 Residual Cox Snell

Residual yang paling banyak diaplikasikan secara luas dalam data analisis survival adalah residual Cox-Snell, yang didefinisikan secara khusus oleh Cox dan Snell [8]. Residual Cox-Snell untuk individu ke-i dengan waktu survival t dan kovariat didefenisikan sebagai = ( ) dengan pendugaan akumulasi fungsi hazard berdasarkan model proporsional hazard. jika tersensor maka juga tersensor. Misalkan dibentuk fungsi hazard dengan subjek i, i=1, 2,…,n

seperti di bawah ini:

ℎ ( ) = exp( )ℎ ( ) dengan

= + + ⋯ +

dengan hazard kumulatif:

( ) = ℎ ( ) = exp ℎ ( ) = exp ℎ ( )

= exp ( )

Berdasarkan persamaan di atas diperoleh residual Cox-Snell pada model Cox proportional hazard untuk subjek ke-i dan

waktu ke adalah:

= ( )

dengan ( ) adalah estimasi dari baseline fungsi hazard kumulatif pada waktu .

Pada analisis parametrik, model failure

time lebih dikenal sebagai “accelerated

model”. Accelerated model untuk adalah:

= + + + ⋯ +

+ ; = 1,2,3, … . , dengan

n= jumlah data

=peubah acak dengan distribusi probabilitas yang sama

(6)

, , =parameter tidak diketahui dengan = 1,2, … , = ( , … , ) =variabel penjelas.

Untuk model parametrik, residual

Cox-Snell didefinisikan sama dengan residual Cox-snell pada model Cox proportional hazard. Perbedaan mendasarnya adalah fungsi survival dan

fungsi hazard-nya merupakan fungsi

parametrik yang bergantung pada distribusi yang diadopsi dari waktu

survival (Collet 1994).

= ( ) = − ( ; )

Dengan

( ) = (log − ̂ − + − ⋯ − )

keterangan:

( ) = fungsi survival dari pada model parametrik

=koefisien estimasi dari ̂, =nilai estimasi dari dan

Pada model Weibull, fungsi survival adalah:

( ) = ( ) = exp(− ). Untuk model eksponensial, fungsi

survival sama seperti pada model Weibull

dengan skala parameter ditentukan sama dengan satu. Menurut [13] dalam metode grafik ini, jika model yang kita gunakan sesuai, maka grafik akan mengikuti garis 450. Keakuratan sebuah model dapat juga dilihat dari sedikitnya data yang menyimpang dari data sebenarnya [14].

Simulasi

Simulasi tahap pertama dilakukan dengan membangkitkan data survival yang berdistribusi eksponensial. Data tersebut juga disertakan status pengamatan (sensor/ lengkap) sebagai ciri khas dari analisis

survival. Data ini dianggap eksponensial

murni. Data survival hasil bangkitan beserta status pengamatan kemudian

dianalisis dengan residual Cox-Snell untuk model parametrik eksponensial dan dengan menggunakan model Cox proporsional

hazard. Hasil analisis tersebut akan

diamati model mana yang lebih cocok untuk memodelkan data.

Simulasi tahap dua dilakukan dengan tetap membangkitkan data survival yang berdistribusi eksponensial namun ditambah error, sehingga data tersebut bukan lagi eksponensial murni. Data tersebut juga disertakan status pengamatan (sensor/ lengkap) sebagai ciri khas dari analisis survival. Data survival hasil

bangkitan beserta status pengamatan kemudian dianalisis dengan metode residual Cox-Snell untuk model parametrik eksponensial dan dengan menggunakan model Cox proporsional hazard. Dari hasil analisis tersebut akan diamati model mana yang lebih cocok untuk memodelkan data. Simulasi serupa terus dilakukan sehingga diperoleh suatu pola tertentu terhadap residual dengan menggunakan model parametrik dan model Cox proporsional

(7)

HASIL DAN PEMBAHASAN Hasil Penelitian

Setelah dilakukan simulasi berulang kali, beberapa grafik ditampilkan ditampilkan sebagai berikut,

Grafik1 Grafik residual Cox-Snell untuk data survival eksponensial tanpa penambahan error dengan model analisis survival parametrik

Grafik 2 Grafik residual Cox-Snell untuk data survival eksponensial dengan penambahan error dengan model analisis survival Cox proporsional hazard.

Grafik 3 Grafik residual Cox-Snell untuk data survival eksponensial dengan penambahan error dengan model analisis survival parametrik

(8)

Grafik 4 Grafik residual Cox-Snell untuk data survival eksponensial dengan penambahan error dengan model analisis survival Cox proporsional hazard.

Pembahasan

Dari beberapa grafik yang ditampilkan di atas terlihat bahwa saat data survival berdistribusi eksponensial murni, maka baik analisis data survival model parametrik eksponensial maupun Cox proposional hazard keduanya dapat mem-fit data dengan baik. Namun jika dibandingkan, terlihat model parametrik eksponensial lebih baik dari Cox proporsional hazard. Dalam simulasi

lanjutan yaitu data bangkitan dengan penambahan error, model parametrik

eksponensial terlihat kurang cocok lagi dalam memodelkan data survival tersebut, sebaliknya model Cox proporsional hazard tetap dapat mem-fit data dengan

baik.

Untuk memastikan perbandingan model parametrik dan Cox proporsional

hazard maka juga diamati Mean Squared Error (MSE) dari setiap residual hasil

simulasi. Dalam statistik, mean squared

error adalah satu dari beberapa metode

estimasi untuk mengukur perbedaan antara nilai pendugaan dan nilai sebenarnya [14]. Perbedaan terjadi karena adanya keacakan atau karena pendugaan model tidak sesuai. Adapun rumus untuk menghitung MSE adalah

= ∑ ( − ) [15]

Hasilnya dapat ditampilkan pada grafik di bawah ini:

(9)

Grafik 5 Grafik perbandingan MSE dari model eksponensial dan Cox proporsional hazard

Grafik 6 Grafik perbandingan MSE dari model Weibull dan Cox proporsional hazard Dari grafik di atas dapat terlihat

bahwa sebelum data survival yang berdistribusi eksponensial ditambahkan

error, maka model parametrik eksponensial lebih baik dibandingkan model Cox proporsional hazard. Setelah data survival yang berdistribusi eksponensial dimanipulasi dengan penambahan error kemudian dianalisis dengan menggunakan model parametrik

eksponensial maka terlihat error-nya

semakin meningkat yang menjelaskan bahwa model tersebut kurang cocok. Sebaliknya apabila data survival dengan manipulasi tersebut dianalisis dengan model Cox proporsional hazard maka terlihat dari grafik bahwa error yang terjadi bersifat konsisten dan error-nya kecil.

Salah satu kelompok data yang dibangkitkan dengan penambahan error

(10)

yang masih bisa di tolerir (error kecil) diolah untuk melihat sejauh mana perbedaan kedua metode (parametrik dan

Cox proporsional hazard) tersebut dalam

menduga parameter terhadap kovariat. Hasilnya disajikan sebagai berikut

Tabel 1. Pendugaan parameter dengan metode parametrik eksponensial dan Cox

Proporsional Hazard

Variabel Parameter Estimation

Standard Error

Chi-Square Pr > ChiSq Hazard Ratio kov

(eksponensial)

1.4049 0.2021 48.33 <.0001 4.0751

kov (cox PH) 1.38046 0.25391 29.5599 <.0001 3.977

Dari tabel di atas terlihat bahwa perbedaan hasil pendugaan parameter antara metode parametrik dan Cox Proporsional Hazard tidak berbeda jauh

yakni 1.4049 (SE=0.2021) dan 1.38046 (SE=0.25391). Artinya metode Cox Proporsional Hazard dapat dengan baik

menduga parameter dari data dengan distribusi eksponensial.

KESIMPULAN

Jika distribusi diketahui maka model parametrik (dengan distribusi yang sesuai) memberikan hasil yang lebih baik dibandingkan model Cox proportional

hazard. Walaupun tidak lebih baik

daripada model parametrik, tetapi model

Cox proportional hazard tetap cocok untuk

memodelkan data meskipun data survival memiliki distribusi tertentu.

DAFTAR PUSTAKA

[1] Maetani S dan Gamel J. (2013) Parametric cure model versus proportional hazard model in Breast Cancer and Other Malignancies.

Advances in Breast in Breast Cancer Reserach, 119-125.

[2] Epstein B and Sobel. (1953) Life Testing. Journal of the American

Statistical Assosiation, 48(263),

486-502.

[3] Bradburn M, Clark, Love C. (2003) Multivariate data analysis, an introduction to concepts and methods.

British Journal of Cancer, 89(3),

431-436.

[4] Ortega E, Silva G, Paula GA. (2010) Residual for log-Burr XII regression models in survival analysis. Journal of

Applied Statistics, 38 (7), 1435-1445.

[5] Altman DG, Bradburn, Love C. (2003) Choosing a model and assesing its adequacy and fit. British Journal of

Cancer, 89, 605-611.

[6] Lee ET. (1992) Statistical Methods

for Survival data Analysis 2nd ed.

New York: A Wiley Interscience Publication.

[7] Banerjee T. (2007) Bayesian alalysis of generalized odds-rate hazards models for survival data. Lifetime

(11)

Data in Medical Research 2nd ed.

London: Chapman &Hall/CRC. [9] Cox DR. (1972) Regression models

and life tables (with discussion). J R

Statisc Sic B, 34,187-220.

[10] Clark, Bradburn M, Altman DG. (2003) Survival Analysis Part I: basic concepts and first analysis.

British Journal of Cancer, 89(2),

232-238.

[11] Lawless J. (2003) Statistical Model

and Methods for Lifetime Data. New

York: Wiley Series in Probability and Statistics.

[12] Love C, Altman DG, Bradburn M. (2003) Multivariate data analysis.

British Journal of Cancer, 89(3),

437-443.

[13] Pocock SJ, Clayton T, Altman. (2002) Survival Plots of Time-to-event outcomes in Clinical Trials.

Lancet, 359, 1686-1689.

[14] Terry T. (2002) Martingale-Based Residuals for Survival Models.

JSTOR Biometrika Trust, 147-160.

[15] Rady, Hussein. (2011) Reyni’s

Entropy and Mean Square Error for Improving the Convergence of Multilayer Backprobagation Neural Networks: A Comparative Study.

International Journal of Electrical & Computer Sciences IJECS-IJENS, 11 (5), 68-79.

[16] Kumar S. (2011). Determination of Exponential Smoothing Constant to Minimize Mean Square Error and Mean Absolute Deviation. Global

Journal of Research in Engineering, 11: Issue 3 Version.

Gambar

Grafik  3  Grafik  residual Cox-Snell untuk  data  survival  eksponensial  dengan penambahan error dengan model analisis survival parametrik
Grafik  4  Grafik  residual Cox-Snell untuk  data  survival  eksponensial  dengan penambahan error dengan  model  analisis  survival Cox  proporsional hazard.
Grafik 5 Grafik perbandingan MSE dari model eksponensial dan Cox proporsional hazard
Tabel  1.  Pendugaan  parameter  dengan  metode  parametrik  eksponensial  dan Cox

Referensi

Dokumen terkait

Analisis Survival Untuk Kejadian Berulang Tidak Identik Dengan Model Cos Stratifikasi PWP-Gap Time.

Jika distribusi diketahui maka model parametrik (dengan distribusi yang sesuai) memberikan hasil yang lebih baik dibandingkan model Cox proportional hazard. Walaupun tidak lebih

Pemodelan data survival time dengan peubah prediktor yang mempengaruhi fungsi hazard dilakukan dengan menggunakan regresi, tetapi jika analisis regresi biasa

Dari proses analisis survival dengan metode regresi cox proportional hazard model parametik diperoleh faktor yang signifikan mempengaruhi lama studi mahasiswa Fakultas

Salah satu metode yang sering digunakan dalam analisis ketahanan hidup ( survival ) adalah model cox proportional hazard , dimana variabel independen yang digunakan

3.7 Aplikasi Model Regresi Data Tahan Hidup Tersensor Tipe III Berdistribusi Eksponensial Pada Pasien HIV Positif..... 3.7.6 Analisis Deskriptif

Tujuan dari penelitian ini adalah menentukan estimasi parameter model survival yang berdistribusi Pareto pada data tersensor dengan metode Bayesian LINEX Loss Function

Bab ini membahas proses pembentukan model regresi Cox proportional hazard pada data survival pasien Tuberkulosis dan mendapatkan model terbaik, sehingga didapatkan