• Tidak ada hasil yang ditemukan

BAYESIAN SURVIVAL ANALYSIS UNTUK MENGESTIMASI PARAMETER MODEL KETAHANAN HIDUP PASIEN PENDERITA JANTUNG KORONER

N/A
N/A
Protected

Academic year: 2021

Membagikan "BAYESIAN SURVIVAL ANALYSIS UNTUK MENGESTIMASI PARAMETER MODEL KETAHANAN HIDUP PASIEN PENDERITA JANTUNG KORONER"

Copied!
59
0
0

Teks penuh

(1)

i

BAYESIAN SURVIVAL ANALYSIS UNTUK MENGESTIMASI PARAMETER MODEL KETAHANAN HIDUP PASIEN PENDERITA

JANTUNG KORONER

THE USE OF BAYESIAN SURVIVAL ANALYSIS TO ESTIMATE PARAMETERS OF SURVIVAL MODEL FOR CORONARY HEART

DISEASE’S PATIENTS Oleh:

A. DEWI LUKITASARI 662011009

TUGAS AKHIR

Diajukan kepada Program Studi Matematika, Fakultas Sains dan Matematika, guna memenuhi sebagian dari persyaratan untuk memperoleh Gelar Sarjana Sains

(Matematika)

PROGRAM STUDI MATEMATIKA FAKULTAS SAINS DAN MATEMATIKA UNIVERSITAS KRISTEN SATYA WACANA

SALATIGA 2015

(2)
(3)
(4)
(5)
(6)
(7)

v MOTTO

“Do your best and lets God do the rest” (Anonim)

“FULL TILT!” (James Gwee)

“It doesn’t matter how hard the obstacles are, you must finish what you started” (Vivi Adeliana)

PERSEMBAHAN Tuhan Yesus Kristus

(8)

vi

KATA PENGANTAR

Puji dan syukur penulis panjatkan kehadirat Tuhan Yang Maha Esa karena atas berkatnya yang melimpah penulis dapat menyelesaikan skripsi ini tepat waktu. Penulis menyadari, penulisan skripsi ini tidak lepas dari bantuan dan dukungan dari berbagai pihak. Oleh karena itu penulis ingin menyampaikan ucapan terima kasih kepada :

1. Dr. Adi Setiawan, M.Sc selaku pembimbing I atas bimbingan, motivasi dan kesabarannya dalam membimbing agar segera menyelesaikan skripsi ini. 2. Leopoldus Ricky Sasongko, M.Si sebagai pembimbing II untuk bimbingan

dan koreksi yang diberikan dalam penyusunan skripsi ini.

3. Dosen pengajar, Dr. Bambang Susanto,MS, Dr. Hanna Arini Parhusip, Dra. Lilik Linawati, M.Kom, Dr. Didit Budi Nugroho, dan Tundjung Mahatma, M.Kom untuk ilmu dan bimbingan yang diberikan kepada penulis selama belajar di Program Studi Matematika.

4. Staf TU dan Pak Edy untuk bantuannya saat kesulitan instal software.

5. Bapak, Ibuk, Kakak dan Adik atas segala dukungan, semangat dan doa yang diberikan.

6. Mas Restu yang selalu memberikan semangat untuk tidak pernah putus asa selama proses penyelesaian skripsi.

7. Freda, Dek Tina dan Mbak Nina yang selalu memberikan semangat dalam penyelesaian skripsi ini.

8. Rekan seperjuangan Matematika 2011 Daivi, Titis, Priska, Purwoto, Dwi, Malik dan Kevin.

Penulis menyadari bahwa skripsi ini masih banyak kekurangan. Oleh sebab itu, penulis mengharapkan kritik dan saran yang membangun dari pembaca. Semoga skripsi ini dapat bermanfaat bagi semua pihak.

Salatiga, 21 Januari 2015

(9)

vii DAFTAR ISI

Halaman

HALAMAN JUDUL……… i

PERNYATAAN KEASLIAN KARYA TULIS TUGAS AKHIR……….. ii

PERNYATAAN PERSETUJUAN PUBLIKASI TUGAS AKHIR UNTUK KEPENTINGAN AKADEMIS………. iii

HALAMAN PENGESAHAN……….…. iv

MOTTO DAN PERSEMBAHAN………..……. v

KATA PENGANTAR……….…… vi

DAFTAR ISI………..…….. vii

ABSTRAK……….……….. viii

ABSTRACT………. ix

PENDAHULUAN……… x

MAKALAH 1 : Bayesian Survival Analysis untuk mengestimasi parameter model Cox-Regression pada kasus ketahanan hidup pasien penderita jantung koroner. MAKALAH 2 : Bayesian Survival Analysis ntuk mengestimasi parameter model Weibull-Regression pada kasus ketahanan hidup pasien penderita jantung koroner. PENUTUP………...……….………. ... xiii

DAFTAR PUSTAKA……….. xiv

LAMPIRAN 1 : Data survival pasien penderita jantung koroner………..… xvi

LAMPIRAN 2 : Program WINBUGS 1.4 untuk Bayesian Survival Analysis menggunakan Cox-Regression ………... xvii

LAMPIRAN 3 : Program WINBUGS 1.4 untuk Bayesian Survival Analysis menggunakan Weibull-Regression………...…… xx

LAMPIRAN 4 : Manual penggunaan WINBUGS 1.4………... xxi

LAMPIRAN 5 : Makalah 1 Publikasi………... xxi

(10)

viii

BAYESIAN SURVIVAL ANALYSIS UNTUK MENGESTIMASI PARAMETER MODEL KETAHANAN HIDUP PASIEN PENDERITA

JANTUNG KORONER

A. Dewi Lukitasari1, Adi Setiawan2, Leopoldus Ricky Sasongko3 1,2,3

Program Sudi Matematika, Fakultas Sains dan Matematika, Universitas Kristen Satya Wacana, Jl.Diponegoro No.52-60, Salatiga.

1

adewilukitasari@yahoo.com,2adi_setia_03@yahoo.com, 3

leopoldus.sasongko@staff.uksw.edu ABSTRAK

Skripsi ini membahas mengenai analisis survival menggunakan Cox-Regression dan Weibull-Cox-Regression untuk mengestimasi parameter model ketahanan hidup pasien penderita jantung koroner dengan pendekatan Bayesian. Data yang digunakan adalah data survival pasien penderita jantung koroner dan data tersensor hasil simulasi meliputi waktu hidup pasien, status pasien (hidup/mati) dan treatment yang dikenakan pada pasien yaitu ring dan bypass, dengan jumlah pasien sebanyak 40 orang. Pendekatan Bayesian (Bayesian approach) digunakan untuk mengestimasi parameter yang belum diketahui dari model regresi yang digunakan. Metode Markov Chain Monte Carlo (MCMC) menggunakan algoritma Gibbs Sampling digunakan untuk membangkitkan Rantai Markov untuk mengestimasi distribusi posterior dari parameter, meliputi koefisien regresi () dari masing-masing model dan parameter r dari model survival Weibull. Parameter  dan r yang diperoleh digunakan untuk menghitung fungsi survival tiap pasien sesuai dengan treatment yang dikenakan. Fungsi survival menunjukkan probabilitas bertahan hidup pasien penderita jantung koroner. Berdasarkan analisis kedua model regresi, pada kasus penderita jantung koroner, Weibull-Regression kurang mampu memodelkan data survival pasien penderita jantung koroner karena diperoleh nilai probabilitas yang kurang wajar yakni bernilai 0 untuk treatment bypass.

(11)

ix

Kata Kunci : Survival Analysis, model Weibull-Regression, Bayesian, Markov Chain Monte Carlo (MCMC)

THE USE OF BAYESIAN SURVIVAL ANALYSIS TO ESTIMATE PARAMETERS OF SURVIVAL MODEL FOR CORONARY HEART

DISEASE’S PATIENTS

A. Dewi Lukitasari1, Adi Setiawan2, Leopoldus Ricky Sasongko3 1,2,3

Mathematics Department, Faculty of Science and Mathematics, Satya Wacana Christian University, Jl.Diponegoro No.52-60, Salatiga.

1

adewilukitasari@yahoo.com,2adi_setia_03@yahoo.com, 3

leopoldus.sasongko@staff.uksw.edu ABSTRACT

This study examined survival analysis using Cox and Weibull-Regression to estimate survival model for coronary heart disease’s patients. Survival and censored data simulation of coronary heart disease’s patients were used for data collection, including survival time, survival status (life or die) and custom treatment (ring and bypass). The total number of patients was 40 patients. Bayesian approach was applied to estimate unknown parameter from regression models. Markov Chain Monte Carlo (MCMC) method using Gibbs Sampling algorithm generated Markov Chain to estimate posterior distribution of parameter that included regression coefficient () from each models and r parameter from Weibull’s model. Parameter that had been found was to count survival function from each patient in each treatment. This showed life probability of coronary heart disease’s patients. Regarding the analysis from the two models, in context of coronary heart’s diseases Weibull-Regression not really good in modeling of survival data of coronary heart’s diseases patients because the result of the probability were bad.

Keywords : Survival analysis, Cox-Regression model, Weibull-Regression, Bayesian, Markov Chain Monte Carlo (MCMC)

(12)

x

PENDAHULUAN Latar Belakang

Kemajuan ilmu pengetahuan dan teknologi yang memunculkan inovasi di berbagai aspek kehidupan, membawa dampak pada perubahan pola hidup masyarakat yang cenderung serba instan. Pola hidup tersebut membawa dampak negatif. Diantaranya muncul berbagai jenis penyakit yang berbahaya dan mematikan, salah satunya adalah penyakit jantung koroner. Karena penyakit ini sangat berbahaya maka seseorang yang terkena penyakit ini mungkin melakukan investasi/ asuransi sebagai bentuk antisipasi apabila sewaktu-waktu penyakit ini kambuh dan harus menjalani perawatan ,operasi atau meninggal dunia. Perusahaan asuransi perlu untuk menentukan peluang waktu hidup pemegang polis yang menderita jantung koroner. Peluang hidupnya biasa direpresentasikan dengan tabel mortalitas.

Inovasi yang berkembang meliputi bidang aktuaria, engineering dan biostatistik yaitu munculnya survival analysis yang digunakan untuk memodelkan data survival Survival analysis bertujuan menduga probabilitas kelangsungan hidup, kematian, dan peristiwa-peristiwa lainnya sampai pada periode waktu tertentu serta menjelaskan pengaruh variabel independent terhadap waktu hidup. Teknik analisis yang biasa digunakan antara lain parametric, semi-parametric dan non-parametric. Salah satu teknik analisis parametric yang digunakan adalah Weibull-Regression sedangkan teknik analisis non-parametric sederhana yang digunakan untuk memodelkan data survival adalah model Cox-regression.

Kenyataannya, selama proses observasi dimungkinkan terdapat data yang tidak terobservasi secara penuh (not completely observed) yang disebut data tersensor. Oleh karena itu untuk mengolah data tersensor digunakan teknik analisis parametric menggunakan model Weibull. Distribusi Weibull digunakan secara efektif untuk menganalisis data waktu hidup khususnya untuk data tersensor.

Saat ini dikenal ada dua pendekatan model yaitu pendekatan klasik (classical approach) dan pendekatan Bayesian (Bayesian approach). Keunggulan pendekatan Bayesian diantaranya mampu menyelesaikan masalah yang tidak dapat diselesaikan

(13)

xi

secara analitis dan mampu menawarkan kemungkinan yang kaya dengan interferensia serta mengeksplor perbedaan-perbedaan interpretasi data terhadap kriteria kinerja prior. Pada proses pemodelannya menggunakan estimasi Bayesian dengan bantuan Markov-Chain Monte-Carlo (MCMC) berdasarkan algoritma Gibbs Sampling.

Berdasarkan uraian di atas, pada skripsi ini dibahas analisis survival untuk model dengan Cox-Regression dan Weibull-Regression menggunakan pendekatan klasik kemudian dilanjutkan dengan menggunakan pendekatan Bayesian untuk mengestimasi parameter dari model yang digunakan. Pada model Cox-Regression digunakan data pasien penderita jantung koroner yang dikenakan pengobatan dengan treatment Ring dan Bypass, sedangkan untuk model Weibull-Regression digunakan data survival simulasi pasien penderita jantung koroner. Total pasien adalah sebanyak 40 pasien. Treatment Ring adalah teknik pengobatan jantung koroner dengan cara memasangkan cincin pada jantung untuk melebarkan pembuluh darah yang menyempit atau tersumbat di bagian jantung, sedangkan treatment Bypass adalah teknik pengobatan dengan mengambil pembuluh darah vena yang diambil dari vena lengan atau kaki.

Rumusan Masalah

Berdasarkan uraian latar belakang tersebut, permasalahan yang dibahas dalam penelitian ini adalah :

1. Bagaimana mengestimasi parameter pada model Cox-Regression dengan Bayesian survival analisis pada kasus ketahanan hidup pasien penderita jantung koroner?

2. Bagaimana mengestimasi parameter pada model Weibull-Regression dengan Bayesian survival analisis pada kasus ketahanan hidup pasien penderita jantung koroner?

(14)

xii Tujuan

Tujuan dari penelitian ini adalah :

1. Memperoleh nilai parameter pada model Cox-Regression dengan menggunakan Bayesian survival analisis pada kasus ketahanan hidup pasien penderita jantung koroner.

2. Memperoleh nilai parameter pada model Weibull-Regression dengan menggunakan Bayesian survival analisis pada kasus ketahanan hidup pasien penderita jantung koroner.

Batasan Masalah

Beberapa hal yang membatasi penelitian ini adalah :

 Diasumsikan bahwa tidak ada kegagalan yang dapat terjadi secara bersamaan.  Diasumsikan data termasuk ke dalam tipe data Random Censoring.

Manfaat penelitian

Penelitian ini dapat bermanfaat untuk perusahaan asuransi jiwa kategori manfaat penyakit kritis seperti asuransi operasi dalam membuat kalkulasi asuransi (insurance calculations) seperti alat pengukur pembentuk rate premi yang akan digunakan untuk membuat perhitungan asuransi sehubungan dengan orang-orang yang dipilih untuk cakupan asuransi.

Untuk menyelesaikan rumusan masalah tersebut, maka dibuat dua makalah yaitu : 1. Bayesian Survival Analysis menggunakan Cox-Regression untuk

mengestimasi model ketahanan hidup pasien penderita jantung koroner yang telah diseminarkan di Universitas Muhammadiyah Purworejo pada tanggal 29 November 2014.

2. Bayesian Survival Analysis untuk mengetimasi parameter model Weibull-Regression pada kasus ketahanan hidup pasien penderita jantung koroner.

(15)

xiii PENUTUP Kesimpulan

Berdasarkan analisis yang dilakukan, diperoleh nilai dari setiap parameter yang diestimasi meliputi, koefisien regresi

 

 dan 0 pada model Cox-Regression. Parameter r dan koefisien regresi

 

untuk model Weibull-Regression. Didapatkan probabilitas pasien bertahan hidup untuk masing-masing treatment yakni treatment Ring dan Bypass. Diperoleh adanya kelemahan untuk model Weibull-Regression dalam memodelkan ketahanan hidup pasien penderita jatung koroner karena menghasilkan nilai probabilitas yang kurang wajar dikarenakan pada analisis dengan menggunakan Weibull-Regression diperoleh nilai probabilitas untuk treatment Bypass sebesar nol.

Saran

Penelitian ini dapat diaplikasikan untuk perusahaan asuransi jiwa kategori penyakit kritis seperti asuransi operasi dalam membuat kalkulasi asuransi (insurance calculations) seperti alat pengukur pembentuk rate premi yakni menghitung nilai probabiltas kematian pemegang polis yang akan digunakan untuk membuat perhitungan asuransi sehubungan dengan orang-orang yang dipilih untuk cakupan asuransi.

(16)

xiv

DAFTAR PUSTAKA

[1] Hendrajaya, Yani, Adi Setiawan dan Hanna Arini Parhusip.2008. Penerapan Analisis Survival untuk Menaksir Waktu Bertahan Hidup bagi Penderita Penyakit Jantung. Program Studi Matematika. Fakultas Sains dan Matematika. UKSW : Salatiga.

[2] Departemen Kesehatan Republik Indonesia.2007.Profil Kesehatan Indonesia 2005. Jakarta.

[3] World Health Organization. 2014. The top 10 causes of death. Swiss: WHO. diakses pada Senin,15 September 2014 pukul 9.41.

http://www.who.int/mediacentre/factsheets/fs310/en/.

[4] London,Dick FSA. 1997.Survival Model and Their Estimation. ACTEX Publication : USA.

[5] Reskianti,Kiki, Nuriti Sunusi dan Nasrah Sirajang.2014.Estimasi Bayesian pada Analisis Data Ketahanan Hidup Berdistribusi Eksponensial melalui Pendekatan SELF. Studi Kasus: Analisis Ketahanan Hidup Flourophores.Jurusan Matematika, Fakultas Matematika dan Ilmu Pengetahuan Alam.Universitas Harsanudin : Makassar.

[6] Subanar.2013.Statistika Matematika.Graha Ilmu: Yogyakarta.

[7] Perra, Silvia.2013. Objective Bayesian Variable Selection for Censored Data. Universitas Cagliari: Italia.

[8] Hidayah, Eny. 1994. Analisis Ketahanan Hidup dengan Metode Gehan Mantel-Haenszel dan Tarone-Ware untuk 2 Sampel Sampai K Sampel. Universitas Diponegoro : Semarang.

[9] Candra Siska, Ade. 2011. Inferensi Statistik Distribusi Binomial Dengan Metode Bayes Menggunakan Prior Konjugat. Universitas Diponegoro: Semarang.

http://eprints.undip.ac.id/29153/1/ade_candra.pdf

[10] Klein, J.P dan Moeschberger, M.L.1997. Survival Analysis : Techniques for Censored and Truncated Data. New York. Springer-Verlag New York Inc. [11] Andrew E Long. 1999. Leuk: survival analysis using Cox regression. Diakses

pada Selasa 16 September 2014 pukul 20.12.

(17)

xv

[12] Rahayu, Ninuk, Adi Setiawan, Tundjung Mahatma.2013. Analisis Regresi Cox Proporsional Hazards pada Ketahanan Hidup Pasien Diabetes Mellitus. Program Studi Matematika. Fakultas Sains dan Matematika. UKSW : Salatiga.

[13] Hidayah,Entin.2013.Model Disagregasi Data Hujan Temporal dengan Pendekatan Bayesian sebagai Input Permodelan Banjir.ITS:Surabaya.

[14] Mustafa, Ayman dan Anis Ben Ghorbal.2011. Using WinBUGS to Cox Model with Changing from the Baseline Hazard Function. Fakultas Matematika. Universitas Islam Al-Imam Muhammad Ibn Saud : Saudi Arabia.

(18)

1

BAYESIAN SURVIVAL ANALYSIS UNTUK MENGETIMASI PARAMETER MODEL COX-REGRESSION PADA KASUS KETAHANAN HIDUP

PASIEN PENDERITA JANTUNG KORONER

A. Dewi Lukitasari1, Adi Setiawan2, Leopoldus Ricky Sasongko3 1,2,3

Program Sudi Matematika, Fakultas Sains dan Matematika, Universitas Kristen Satya Wacana, Jl.Diponegoro No.52-60, Salatiga.

1

adewilukitasari@yahoo.com,2adi_setia_03@yahoo.com, 3

leopoldus.sasongko@staff.uksw.edu

ABSTRAK

Penerapan model Cox-Regression dalam konteks survival analysis dengan pendekatan Bayesian untuk memodelkan ketahanan hidup pasien penderita jantung koroner dibahas dalam paper ini. Data yang digunakan adalah waktu hidup pasien, status pasien (hidup/mati) dan treatment yang dikenakan. Diambil dua treatment yang digunakan oleh pasien penderita jantung koroner yaitu ring dan bypass. Pendekatan yang digunakan adalah pendekatan Bayesian (Bayesian approach) untuk mencari distribusi posterior parameter. Updating data menggunakan metode Markov Chain Monte Carlo (MCMC) dengan algoritma Gibbs Sampling. Software winBUGS 1.4 membantu dalam mengestimasi nilai setiap parameter yaitu koefisien regresi . Parameter yang diestimasi dari model Cox-Regression digunakan untuk menghitung probabilitas bertahan hidup pasien penderita jantung koroner.

Kata Kunci : Survival Analysis, model Cox-Regression, Bayesian, Markov Chain Monte Carlo (MCMC)

(19)

2 PENDAHULUAN

Kemajuan ilmu pengetahuan dan teknologi yang kian pesat menuntut berbagai aspek untuk menemukan inovasi guna mempermudah kehidupan manusia. Inovasi teknologi yang serba canggih membawa dampak pada perubahan pola hidup masyarakat yang cenderung serba instan. Tidak dapat dipungkiri pola hidup tersebut membawa dampak negatif. Diantaranya muncul berbagai jenis penyakit yang berbahaya dan mematikan, salah satunya adalah penyakit jantung koroner [1]. Menurut World Health Organization (WHO) atau Badan Kesehatan Dunia, penyakit jantung koroner merupakan penyakit dengan urutan pertama penyebab kematian dan tersebar di seluruh dunia. Pada tahun 2012 tercatat 7,2 juta orang di seluruh dunia meninggal setiap tahunnya akibat penyakit ini. Banyaknya orang yang meninggal akibat ini diperkirakan akan terus meningkat hingga 23,3 juta di tahun 2030 [2]. Karena penyakit ini sangat berbahaya maka seseorang yang terkena penyakit ini akan melakukan investasi sebagai bentuk antisipasi apabila sewaktu-waktu penyakit ini kambuh dan harus menjalani perawatan atau operasi. Perusahaan asuransi perlu untuk menentukan peluang waktu hidup seseorang yang akan melakukan asuransi. Peluang hidupnya biasa direpresentasikan dengan membuat tabel mortalitas.

Angka kematian yang tinggi akibat penyakit jantung koroner menimbulkan perkembangan inovasi di bidang aktuaria, engineering dan biostatistik yaitu munculnya survival analysis yang digunakan untuk memodelkan data survival [3]. Survival analysis bertujuan menduga probabilitas kelangsungan hidup, kekambuhan, kematian, dan peristiwa-peristiwa lainnya sampai pada periode waktu tertentu serta mejelaskan pengaruh variabel independent terhadap waktu survive [4]. Teknik analisis yang biasa digunakan antara lain parametric, semi-parametric dan non-parametric [5]. Salah satu teknik analisis non-non-parametric sederhana yang digunakan untuk memodelkan data survival adalah model Cox-regression. Sedangkan untuk permodelan data dikenal ada dua pendekatan yaitu pendekatan klasik (classical approach) dan pendekatan Bayesian (Bayesian approach) [6]. Pendekatan klasik

(20)

3

memandang parameter bernilai tetap, sedangkan pada pendekatan bayesian parameter dipandang sebagai variabel random yang memiliki distribusi (distribusi Prior). Keunggulan pendekatan Bayesian diantaranya mampu menyelesaikan masalah yang tidak dapat diselesaikan secara analitis dan mampu menawarkan kemungkinan yang kaya dengan interferensia serta mengeksplor perbedaan-perbedaan interpretasi data terhadap kriteria kinerja prior [7]. Estimasi parameter model menggunakan estimasi Bayesian dengan metode Markov-Chain Monte-Carlo (MCMC) berdasarkan algoritma Gibbs Sampling. Salah satu kontribusi yang dapat bermanfaat bagi perusahaan asuransi kejiwaan untuk penyakit kritis seperti asuransi operasi dalam membuat kalkulasi asuransi (insurance calculations) yang akan digunakan untuk membuat perhitungan asuransi sehubungan dengan orang-orang yang dipilih untuk cakupan asuransi.

Berdasarkan uraian di atas, pada paper ini dibahas terlebih dahulu cara mengestimasi parameter menggunakan pendekatan klasik dengan menggunakan model regresi Cox-Proporsional Hazard pada kasus ketahanan hidup pasien penderita jantung koroner, kemudian dilanjutkan dengan menggunakan pendekatan Bayesian survival analysis menggunakan Cox-regression. Tujuan dari penelitian ini untuk memperoleh model ketahanan hidup pasien penderita jantung koroner dengan Bayesian survival analysis menggunakan Cox-regression. Dalam proses estimasi diasumsikan bahwa tidak ada kegagalan yang dapat terjadi secara bersamaan. Hal tersebut berarti terdapat asumsi bahwa satu pasien hanya dapat mengalami satu kali kegagalan dan satu pasien hanya dikenakan satu treatment saja. Alat bantu perhitungan menggunakan paket program winBUGS 1.4 yang telah memuat algoritma BUGS (Bayesian Interface Using Gibbs Sampling).

(21)

4 DASAR TEORI

Fungsi Survival

Fungsi survival S(t) merupakan probabilitas dari seseorang untuk bertahan hidup setelah waktu yang ditetapkan sebut

t

. Fungsi survival merupakan merupakan komplemen dari variabel random fungsi distribusi kumulatif F(t) maka ditulis

) ( 1 ) ( ) (t P T t F t

S [8]. Fungsi distribusi kumulatif dari variabel random T

dengan fungsi kepadatan probabilitas (probability density function) f(t), diperoleh dengan cara mengintegralkan fungsi kepadatan probabilitas sehingga diperoleh

t dt t f t T P t F 0 ) ( ) ( )

( dengan T adalah variabel random yang mencerminkan

failure time atau waktu bertahan hidup sampai munculnya kejadian tertetu. Kejadian yang dimaksud adalah kematian [9].

Fungsi Hazard

Fungsi Hazard 0(t menunjukkan laju kegagalan individu untuk mampu ) bertahan hidup setelah melewati waktu yang ditetapkan,

t

. Didefinisikan sebagai berikut : ) ( ) ( ' ) ( ) ( lim ) | ( lim ) ( 0 0 0 t S t F t T P dt t T t P dt t T dt t T t P t dt dt (1)

dengan T asumsikan kontinu sehingga memiliki fungsi kepadatan probabilitas dan kejadian berlangsung untuk rentang waktu [t,t dt)[10]. Untuk fungsi Hazard

kumulatif yaitu t du u t 0 0 0( ) ( ) (2)

Proses Intensitas dan model regresi Cox

Data survival yang ada perlu dilakukan proses menghitung jumlah kegagalan yang terjadi sampai waktu

t

. Proses tersebut dinamakan proses intensitas. Proses

(22)

5

intensitas Ii(t), merepresentasikan hubungan probabilitas subjek i, i 1,2,...,n pada interval [t,t dt). Dirumuskan :

I

i

(

t

)

dt

E

(

dN

(

t

)

1

|

F

t

)

(3) )

(t

Ni menunjukkan kenaikan dari N untuk interval i [t,t dt),F menunjukkan t

data yang ada sebelum waktu

t

. Jika nilai i masuk di interval waktu maka diambil nilai dNi(t) 1dan sebaliknya jika tidak maka diambil nilai dNi(t) 0.

Jika nilai dt 0 untuk D {Ni(t),Yi(t),zi(t)}, probabilitas pada proses intensitas berubah menjadi instantaneous hazard untuk waktu t dan subjek i ditunjukkan pada persamaan di bawah ini

Ii(t) Yi(t) 0(t)exp( 'zi) (4) dengan D mencerminkan data, Yi(t) adalah indikator risiko yang ditunjukkan dari status hidup pasien terdiri dari 0 atau 1 dan zi(t) adalah vektor covariate. Model

Cox-Regression ditunjukkan dari 0(t)exp( 'zi) yang menunjukan skor risiko untuk individu ke-i. Parameter menunjukkan koefisien regresi.

Fungsi eksponensial menjamin Ii(t) bernilai positif. Probabilitas fungsi survival dirumuskan sebagai berikut :

t z du u z t S 0 ) exp( 0( ) ) ) exp(( ) , ( (5)

Parameter dan nilai

t du u t 0 0

0( ) ( ) yang akan diestimasi dengan estimasi

non-parametric yang akan digunakan untuk mengestimasi model survival [11].

Distribusi Prior

Distribusi prior mencerminkan kepercayaan subyektif parameter sebelum sampel diambil. Penentuan distribusi prior dapat ditentukan berdasarkan ruang parameternya.

(23)

6

Penentuan prior dengan mengambil konjugat Ni( ) t sehingga

) ), ( ( ~ ) ( 0* 0 t Gamma cd t c

d . d 0*(t)menunjukann perkiraan prior dari fungsi

hazard yang belum diketahui dan c menujukkan derajat konfidensi [11]. Fungsi Likelihood

Fungsi likelihood yang biasa digunakan adalah :

L(D| , 0(t))) Li(D| , 0(t)) (6) L D t I t I t dt t i n i t t dN i i 0 1 0 ) ( 0( ) ( ) exp ( ) , | ( (7)

Mengganti nilai Ii(t) dengan persamaan (4) diperoleh persamaan likelihoodsebagai berikut: dt t d z t Y t d z t Y t D L t i i n i t t dN i i i 0 0 1 0 ) ( 0

0( )) ( ( )exp( ' ) ( )) exp ( ( )exp( ' ) ( )

, | ( (8)

dengan d 0(t) mencerminkan kenaikan dari fungsi hazard,

dt t I Poisson t

dNi( )~ ( i( )) merupakan kenaikan yang sangat kecil dari Ni(t) dan

) (

0 t menunjukkan baseline hazard function terintegrasi selama interval [t,t dt)

[5].

Distribusi Posterior

Dalam estimasi Bayes, setelah informasi tentang sampel dan prior dapat ditentukan maka distribusi posteriornya dicari dengan mengalikan priornya dengan informasi sampel yang diperoleh dari likelihoodnya [7]. Dituliskan sebagai berikut:

P( , 0(t)|D) L(D| , 0(t)P( )P( 0(t)). (9)

Akan difokuskan dalam mengestimasi parameter dan 0(t . ) Karena model cukup kompleks distribusi posterior susah untuk dicari secara langsung maka perlu adanya suatu pendekatan menggunakan metode simulasi dengan MCMC (Markov Chain Monte Carlo). Pada proses MCMC dipilih menggunakan algoritma Gibbs Sampling.

(24)

7

Kemudahan yang diperoleh dari penggunaan metode MCMC pada analisis Bayesian antara lain metode MCMC dapat menyederhanakan bentuk integral yang kompleks dengan dimensi besar menjadi bentuk integral yang sederhana dengan satu dimensi. MCMC dapat mengestimasi densitas data dengan cara membangkitkan suatu rantai Markov yang berurutan sebanyak N yang cukup besar sampai diperoleh konvergen [12]. Salah satu keunggulan MCMC terletak pada performa yang tidak terlalu sensitif pada penggunaan nilai awal.

Proses penyusunan algoritma Gibbs Sampling perlu ditentukan nilai awal dari

parameter yang akan diestimasi yaitu 0

~

Normal

(

0

,

2

)

dan 0 (t . Manual ) penyusunan algoritma Gibbs Sampling mengikuti prosedur penentuan

)) , | ) ( ( )), ( , | (

(P D 0 t P 0 t D dengan langkah pada persamaan (10) dan (11) yaitu

P( |D, 0(t)) P( )P(D| , 0(t)) (10) dan

P( 0(t)|D, ) P( 0(t)). (11)

Langkah pada persamaan (10) dan (11) diulang sebanyak B yang cukup besar, dengan B merupakan banyaknya update pada penyusunan rantai Markov hingga diperoleh deret rantai Markov yang konvergen.

Gibbs Sampling termasuk ke dalam dua kategori algoritma utama dalam MCMC selain algoritma Metropolis. Gibbs Sampling adalah teknik membangkitkan variabel acak dari distribusi marginal secara tidak langsung tanpa harus menghitung densitasnya.

(25)

8 METODE PENELITIAN

Profil data

Data yang digunakan adalah data waktu bertahan hidup, status hidup pasien dan treatment yang digunakan pasien penderita jantung koroner [4]. Data ditunjukkan pada Tabel 1. Pasien sebanyak 40 pasien dan pasien yang mengalami kegagalan (meninggal) saat menjalani treatment sebanyak 8 pasien.

Langkah-langkah penelitian

Pengolahan data dengan menggunakan software winBUGS 1.4. Software winBUGS 1.4 adalah paket program yang dirancang khusus untuk memfasilitasi permodelan data Bayesian menggunakan implementasi MCMC yang bekerja dalam sistem operasi windows. Pengolahan data survival dilakukan dengan tahapan dan spesifikasi model meliputi pengecekan terhadap syntax model, loading data, compiling model, inisialisasi, menentukan iterasi MCMC sebanyak 10.000 kali guna membangkitkan Rantai-Markov. Penyusunan parameter dan node Ring serta node Bypass. Updating data parameter sebanyak 10.000. Dalam ploting masing-masing node dan parameter beta nilai Markov dilakukan burn in sebanyak 5000 data, dan diambil bangkitan rantai dari data ke 5001 sampai dengan 10.000.

Tabel 1. Data waktu bertahan hidup pasien penderita jantung koroner

No Waktu

(bulan) Status Treatment No

Waktu

(bulan) Status Treatment

1 26 0 Ring 21 32 0 Bypass 2 26 0 Ring 22 33 0 Bypass 3 38 0 Ring 23 42 0 Bypass 4 51 0 Ring 24 42 0 Bypass 5 52 0 Ring 25 56 0 Bypass 6 56 0 Ring 26 56 0 Bypass 7 57 0 Ring 27 60 1 Bypass 8 61 1 Ring 28 65 0 Bypass 9 62 0 Ring 29 78 0 Bypass 10 62 0 Ring 30 87 0 Bypass 11 66 0 Ring 31 87 0 Bypass 12 71 1 Ring 32 93 0 Bypass

(26)

9 13 71 0 Ring 33 102 0 Bypass 14 75 0 Ring 34 116 0 Bypass 15 83 0 Ring 35 116 1 Bypass 16 106 0 Ring 36 146 1 Bypass 17 123 0 Ring 37 161 0 Bypass 18 128 0 Ring 38 173 1 Bypass 19 156 0 Ring 39 178 1 Bypass 20 183 0 Ring 40 182 1 Bypass ANALISIS HASIL

Proses analisis dilakukan pada data survival yang terdiri dari n 40 dan 8

T , dengan n menyatakan total pasien dan T menunjukkan pasien yang mengalami kegagalan dalam proses treatment. Digunakan dan diselidiki terlebih dahulu dengan pendektan klasik yaitu Regresi Cox-Proporsional Hazard dengan load packages survival yang ada pada software R i386 3.0.1. Waktu hidup dan status sebagai variabel yang dependent terhadap treatment. Hal tersebut berarti treatment sebagai variabel independent dan probabilitas survival tergantung pada jenis treatment yang digunakan. Diperoleh gambaran hasil yang dinyatakan pada Tabel 2.

Tabel 2. Hasil estimasi node Ring dengan metode klasik non-parametrik

Node Waktu Survival Standard Error Batas minimum Batas Maksimum Ring [1] 61 0.923 0.0739 0.798 1 Ring [2] 71 0.821 0.1169 0.621 1

Tabel 3. Hasil estimasi node Bypass dengan metode klasik non- parametric

Node Waktu Survival Standard Error Batas minimum Batas Maksimum Bypass[1] 60 0.929 0.0688 0.8030 1 Bypass[2] 116 0.796 0.1362 0.5691 1 Bypass[3] 146 0.637 0.1793 0.3667 1 Bypass[4] 173 0.424 0.2105 0.1606 1

(27)

10

Bypass[5] 178 0.212 0.1833 0.0391 1

Bypass[6] 182 0.000 - - -

Tabel 4. Hasil estimasi parameter Beta dengan metode klasik

Node Survival Estimasi Titik Batas minimum Batas Maksimum Beta 0.408 -0.6851 0.0778 0.9053

Tabel 4. menunjukkan nilai estimasi titik yang sekaligus menunjukkan nilai koefisien regresi yakni sebesar -0.6851. Tingkat signifikansi alfa sebesar 0.5%. Estimasi interval diambil dengan mengambil exponensial dari minus lower.95 dan minus upper.95. Batas bawah dan batas atas diperoleh (0.0778, 0.9053) dengan probabilitas 0.408 yang sudah signifikan karena nilai probabilitasnya lebih besar dari 0.05. Dengan estimasi non parametrik gambaran nilai probabilitas pasien bertahan hidup untuk masing-masing treatment yang dikenakan terdapat pada Tabel 2 dan Tabel 3. Ditunjukkan bahwa nilai probabilitas tertinggi ada dalam kelompok bypass dengan nilai probabilitas sebesar 0.929 hanya selisih cukup kecil yaitu 0.005 signifikan dengan pasien dengan ring yang memiliki probabilitas tertinggi 0.923.

Gambaran grafik estimasi mean dari fungsi survival ditunjukan pada Gambar 1. Pada Gambar 1. Sumbu horizontal menunjukkan waktu bertahan hidup pasien penderita jantung koroner dalam satuan bulan , sedangkan sumbu vertical menunjukkan presentase subjek yang masih bertahan hidup. Garis putus-putus pada Gambar 1. menunjukkan garis survival untuk treatment Ring dan Bypass. Grafik memiliki kecenderungan mengalami penurunan secara bertahap, tidak dapat dipungkiri probabilitas pasien untuk bertahan hidup juga semakin kecil. Pada Gambar 1. Terlihat bahwa probabilitas bertahan hidup penderita dengan treatment ring jauh lebih besar karena penurunan probabilitas tidak sesignifikan jika dengan menggunakan bypass

(28)

11 0 50 100 150 0. 0 0. 2 0. 4 0. 6 0. 8 1. 0

survival Time in Months

S ur vi va l P ro ba bi lit y Bypass Ring

Gambar 1. Estimasi mean fungsi survival untuk treatment Ring dan Bypass

Hasil nilai estimasi dan karakteristik untuk masing-masing parameter ditunjukkan pada Tabel 5, Tabel 6, dan Tabel 7.

Tabel 5. Hasil estimasi Bayesian node Ring

Node Mean Standard

Deviasi MC error ( 10 ) 4 Batas minimum 2,5% Median Batas maksimum 97,5% Ring[1] 0.9771 0.02706 3.18 0.9025 0.9865 0.9996 Ring[2] 0.9536 0.04169 5.01 0.841 0.9659 0.9972 Ring[3] 0.9262 0.05832 7.47 0.7752 0.941 0.9931 Ring[4] 0.8781 0.09146 12.58 0.6403 0.9009 0.988 Ring[5] 0.8119 0.1333 19.61 0.4802 0.8425 0.9797 Ring[6] 0.7185 0.182 26.98 0.2892 0.7567 0.967 Ring[7] 0.613 0.2202 33.35 0.1471 0.6429 0.9479 Ring[8] 0.4868 0.2417 37.97 0.0564 0.4902 0.9169

(29)

12

Tabel 6. Hasil estimasi Bayesian node Bypass Node Mean Standard

Deviasi MC error ( 10 ) 4 Batas minimum 2,5% Median Batas maksimum 97,5% Bypass[1] 0.9532 0.04703 4.48 0.826 0.9679 0.9988 Bypass[2] 0.9067 0.06644 6.53 0.7398 0.9224 0.9887 Bypass[3] 0.855 0.08318 8.23 0.6548 0.8702 0.9701 Bypass[4] 0.7701 0.1131 10.3 0.5051 0.7862 0.9398 Bypass[5] 0.6615 0.1402 12.73 0.357 0.6743 0.8932 Bypass[6] 0.5194 0.1651 14.42 0.189 0.5257 0.8192 Bypass[7] 0.3739 0.1697 14.65 0.07959 0.366 0.7175 Bypass[8] 0.2289 0.1565 12.8 0.01491 0.2018 0.5872

Tabel 7. Hasil estimasi Bayesian parameter Beta

Node Mean Standard Deviasi MC error ( 10 ) 4 Batas Minimum 2,5% Median Batas Maksimum 97,5% Beta -0.8789 0.9409 0.01502 -2.919 -0.8126 0.7644

Mean dan Median dalam Tabel 5 dan Tabel 6 menunjukkan nilai estimasi titik. Rata-rata dari parameter dalam Tabel 5 dan Tabel 6 merepresentasikan estimasi nilai rata-rata posterior untuk pasien yang menggunakan treatment ring dan bypass yang sekaligus mencerminkan peluang pasien untuk bertahan hidup jika menggunakan treatment tersebut. Nilai mean yang tertinggi untuk pasien dengan treatment ring adalah 0.9771 sedangkan dengan bypass 0.953 menunjukkan peluang bertahan hidup seseorang bertahan dengan menggunakan treatment ring akan menghasilkan nilai peluang bertahan hidup lebih besar dibandingkan dengan menggunakan bypass yakni sebesar 0.9771. Nilai error dalam penyusunan MCMC dengan algoritma Gibbs Sampling ditunjukkan dari MC error, diperoleh nilai error yang kecil karena mendekati 0. Estimator interval untuk parameter ditunjukkan dari interval konfidensi yakni batas minimum dan maksimum dengan pengambilan nilai tingkat sifnifikansi 5%. Estimasi parameter menunjukkan bahwa semua

(30)

13

parameter terletak dalam batas interval konfidensi pada posisi antara 2,50% dan 97,50% dan nilainya signifikan yang tidak melewati nilai nol. Adanya interval konfidensi tersebut menjamin pencakupan dari parameter yang diselidiki. Nilai rata-rata posterior yaitu standar error sekaligus menunjukkan koefisien regresi, diperoleh ditunjukkan pada Tabel 7 sebesar -0.8789.

Gambar 2. Plot time series untuk MCMC Bayesian dan densitas kernel Ring[1], Bypass[1], dan beta

Plot time series untuk MCMC Bayesian dan densitas kernel ditujukkan dalam Gambar 2. Rantai Markov yang terbentuk ditunjukkan dari garis hitam untuk MCMC-Ring[1], MCMC-Bypass[1] dan MCMC-Beta. Plot dari time series menunjukkan gambaran rantai Markov yang dibangkitkan. Updating rantai Markov sebanyak 10.000 iterasi. Plot Gambar 2. menunjukkan nilai MCMC selalu positif, hasil plot nampak rapat dan dapat merespon keseluruhan variabel berarti didapati

0 1000 2000 3000 4000 5000 0. 70 0. 85 1. 00 MCMC-Ring[1] Index Ri ng 1 0.70 0.80 0.90 1.00 0 20 40

De nsita s Ke rne l-Ring[1]

N = 5000 Bandw idth = 0.00302 Ri ng 1 0 1000 2000 3000 4000 5000 0. 6 0. 8 1. 0 MCMC-Bypa ss[1] Index By pa ss 1 0.6 0.7 0.8 0.9 1.0 0 5 10

De nsita s Ke rne l-Bypa ss[1]

N = 5000 Bandw idth = 0.006248 By pa ss 1 0 1000 2000 3000 4000 5000 -4 0 2 MCMC-Be ta Index Be ta -6 -4 -2 0 2 0. 0 0. 2 0. 4

De nsita s Ke rne l-Be ta [1]

N = 5000 Bandw idth = 0.1484

Be

(31)

14

model telah konvergen. Nilai estimasi densitas posterior dapat dilihat dari plot dnsitas kernel. Estimasi densitas kernel memberikan plot yang bagus karena dihasilkan densitas yang cenderung halus. Plot dari parameter beta menunjukkan bahwa distribusi gambar yang dihasilkan berdistribusi normal. Gambaran MCMC mengindikasikan bahwa nilai yang ditunjukkan berasal dari sebaran posterior yang dibentuk oleh rantai Markov.

Gambar 3. Gambaran running quantiles dan autokorelasi

Ring[1] iteration 401 2500 5000 7500 0.9 0.95 1.0 Bypass[1] iteration 401 2500 5000 7500 0.8 0.85 0.9 0.95 1.0 Bypass[1] iteration 401 2500 5000 7500 0.8 0.85 0.9 0.95 1.0

Gambar 3. menunjukkan plot dari running quantiles yang merepresentasikan gambaran mengenai nilai dari gambaran kinerja dari sampel yang bagus karena ditunjukkan dari posisi plot garis berada di tengah dari batas atas dan bawah. Pada gambaran running quantiles sumbu horizontal menunjukkan bangkitan rantai Markov, sedangkan sumbu vertikal menunjukkan nilai estimasi titik nya. Nilai autokorelasi untuk tiap node dan parameter ditunjukkan pula pada Gambar 3. Nilai autokorelasi menunjukkan bahwa data yang dibangkitkan memenuhi sifar rantai

0 10 20 30 0.0 0.2 0.4 0.6 0.8 1.0 Lag ACF Se rie s Ring1[5001:10000] 0 10 20 30 0.0 0.2 0.4 0.6 0.8 1.0 Lag ACF Se rie s Bypa ss1[5001:10000] 0 10 20 30 0.0 0.2 0.4 0.6 0.8 1.0 Lag ACF Se rie s Be ta [5001:10000]

(32)

15

Markov. Untuk menggambar nilai autokorelasi digunakan fungsi acf pada R i386 3.0.1.

Berdasarkan analisis yang dilakukan diperoleh estimasi parameter beta dari model Cox-Regresion untuk pasien penderita jantung koroner dengan estimasi Bayesian menggunakan dua treatment yakni ring dan bypass sebesar -0.8789 sehingga model Cox-Regression dari fungsi survival 0(t)exp( 0.8789zi)) dan

) -0.8789 exp( ) 7 1.82476473 exp( ) ; (t z z S . Kesimpulan

Dalam paper ini diperoleh parameter dari model Cox-Regression untuk data ketahanan hidup pasien penderita jantung koroner dengan Bayesian survival analysis. Penelitian ini dapat dikembangkan untuk analisis survival model Weibul dengan metode Bayesian.

DAFTAR PUSTAKA

[1] Departemen Kesehatan Republik Indonesia.2007.Profil Kesehatan Indonesia 2005. Jakarta

[2] World Health Organization. 2014. The top 10 causes of death. Swiss: WHO.

diakses pada Senin 15 September 2014 pukul 9.41.

http://www.who.int/mediacentre/factsheets/fs310/en/

[3] Reskianti,Kiki, Nuriti Sunusi dan Nasrah Sirajang.2014.Estimasi Bayesian pada Analisis Data Ketahanan Hidup Berdistribusi Eksponensial melalui Pendekatan SELF. Studi Kasus: Analisis Ketahanan Hidup Flourophores.Jurusan

Matematika, Fakultas Matematika dan Ilmu Pengetahuan

Alam.UNHAS:Makassar.

[4] Hendrajaya, Yani, Adi Setiawan dan Hanna Arini Parhusip.2008. Penerapan Analisis Survival untuk Menaksir Waktu Bertahan Hidup bagi Penderita Penyakit Jantung. Program Studi Matematika. Fakultas Sains dan Matematika. UKSW : Salatiga.

(33)

16

[5] Perra, Silvia.2013. Objective Bayesian Variable Selection for Censored Data. Universitas Cagliari: Italia.

[6] Subanar,Prof.,Ph.D.2013.Statistika Matematika.Graha Ilmu: Yogyakarta

[7] Candra Siska, Ade. 2011. Inferensi Statistik Distribusi Binomial Dengan Metode Bayes Menggunakan Prior Konjugat. Universitas Diponegoro: Semarang.

http://eprints.undip.ac.id/29153/1/ade_candra.pdf

[8] Rahayu, Ninuk, Adi Setiawan, Tundjung Mahatma.2013. Analisis Regresi Cox Proporsional Hazards pada Ketahanan Hidup Pasien Diabetes Mellitus. Program Studi Matematika. Fakultas Sains dan Matematika. UKSW : Salatiga.

[9] Hidayah, Eny. 1994. Analisis Ketahanan Hidup dengan Metode Gehan Mantel-Haenszel dan Tarone-Ware untuk 2 Sampel Sampai K Sampel. Universitas Diponegoro : Semarang.

[10] Mustafa, Ayman dan Anis Ben Ghorbal.2011. Using WinBUGS to Cox Model with Changing from the Ba seline Hazard Function. Fakultas Matematika. Universitas Islam Al-Imam Muhammad Ibn Saud : Saudi Arabia.

[11] Andrew E Long. 1999. Leuk: survival analysis using Cox regression. Diakses

pada Selasa 16 September 2014 pukul 20.12 .

http://users.aims.ac.za/~mackay/BUGS/Manual05/Examples1/node29.html

[12] Hidayah,Entin. Model Disagregasi Data Hujan Temporal dengan Pendekatan Bayesian sebagai Input Permodelan Banjir.ITS:Surabaya.

[13] London,Dick FSA. 1997.Survival Model and Their Estimation. ACTEX Publication : USA.

.[14] Klein, J.P dan Moeschberger, M.L.1997. Survival Analysis : Techniques for Censored and Truncated Data. New York. Springer-Verlag New York Inc.

(34)

1

BAYESIAN SURVIVAL ANALYSIS UNTUK MENGESTIMASI PARAMETER MODEL WEIBULL-REGRESSION PADA KASUS KETAHANAN HIDUP

PASIEN PENDERITA JANTUNG KORONER

A. Dewi Lukitasari1, Adi Setiawan2, Leopoldus Ricky Sasongko3 1,2,3

Program Sudi Matematika, Fakultas Sains dan Matematika, Universitas Kristen Satya Wacana, Jl.Diponegoro No.52-60, Salatiga.

1

adewilukitasari@yahoo.com,2adi_setia_03@yahoo.com, 3

leopoldus.sasongko@staff.uksw.edu

ABSTRAK

Paper ini membahas mengenai estimasi parameter model Weibull-Regression untuk data tersensor pada kasus ketahanan hidup pasien penderita jantung koroner dengan pendekatan Bayesian survival analysis. Data yang digunakan adalah data simulasi waktu hidup pasien, status pasien (hidup/mati) dan treatment yang dikenakan yaitu ring dan bypass. Pendekatan Bayesian (Bayesian approach) digunakan untuk mencari distribusi posterior parameter. Metode Markov Chain Monte Carlo (MCMC) digunakan untuk membangkitkan Rantai Markov guna mengestimasi parameter meliputi koefisien regresi () dan parameter r dari model survival Weibull. Parameter  dan r yang diperoleh digunakan untuk menghitung fungsi survival tiap pasien untuk tiap treatment yang sekaligus menunjukkan probabilitas bertahan hidup pasien penderita jantung koroner.

Kata Kunci : Survival Analysis, model Weibull-Regression, Bayesian, Markov Chain Monte Carlo (MCMC)

(35)

2 PENDAHULUAN

Pada makalah [1] telah dibahas cara mengestimasi parameter model Cox-Regression pada kasus ketahanan hidup pasien penderita jantung koroner [1]. Permodelan data survival dengan menggunakan Bayesian survival analysis menggunakan Cox-Regression tidak memperhatikan adanya data tersensor. Kenyataannya, selama proses pengamatan berlangsung terdapat data tersensor (censored data) yaitu data yang tidak terobservasi secara penuh (not completely observable) dalam waktu pengamatan [2]. Hal ini berarti selama proses pengamatan dalam rentang waktu yang ditentukan, terdapat pasien yang belum selesai menjalani treatment dan waktu hidupnya tetap dicatat dalam pengamatan. Oleh karena itu untuk mengolah data tersensor digunakan analisis model survival parametrik. Model yang sering digunakan adalah model Weibull [2]. Distribusi Weibull digunakan secara efektif untuk menganalisis data waktu hidup khususnya untuk data tersensor [3]. Fungsi survival distribusi Weibull diestimasi dan digunakan sebagai distribusi probabilitas untuk data waktu bertahan hidup pasien penderita jantung koroner. Diasumsikan data yang digunakan termasuk ke dalam Random Censoring.

DASAR TEORI Data Tersensor

Data tersensor adalah data yang tidak teramati secara penuh (not completely observable). Biasanya data tersensor ini dijumpai untuk studi observasi dan penelitian dengan adanya batasan waktu. Terdapat 3 tipe data tersensor yaitu Tersensor tipe I, Tersensor tipe II dan Random Censoring. Data tersensor tipe I terjadi apabila subjek berhenti sebelum pemberian waktu sensor. Data tersensor tipe II terjadi apabila subjek melampaui batas waktu pengamatan dan waktu survivenya catat jika subjek telah mengalami kegagalan. Random Censoring adalah tipe data tersensor yang sering terjadi [2].

(36)

3

Distribusi Weibull Distribusi Weibull merupakan distribusi yang sering digunakan dalam analisis

parametrik untuk fungsi survival. Distibusi Weibull banyak digunakan pada aplikasi di bidang industri maupun biomedis. Realitas yang ditemui untuk bidang engineering digunakan untuk menggambarkan waktu kegagalan (time to failure) pada barang elektronik dan sistem mekanik serta untuk memodelkan ketahanan barang elektronik [3]. Secara umum fungsi kepadatan probabilitas (probability density function) dari distribusi Weibull adalah:

                 r r r t t r t f   exp ) ( 1 dengan r, 0 dan t0. (1) Dengan mensubtitusikan r        

 1 ke dalam persamaan (1) maka diperoleh : f(t)rtr1exp(tr). (2) Shape parameter dan scale parameter berurutan ditunjukkan oleh nilai r dan . Scale parameter (parameter skala) adalah jenis khusus dari parameter numerik yang menunjukkan besarnya distribusi data. Semakin kecil nilai dari scale arameter maka distribusi data akan menyebar. Scale parameter (parameter bentuk) adalah jenis khusus dari parameter numerik yang menunjukkan bentuk dari kurva. Fungsi survival untuk distribusi Weibull dapat diperoleh dengan mengintegralkan fungsi kepadatan probabilitas pada persamaan (1) sehingga

( ) ( ) exp( r). t t du u f t S

   (3)

Laju kegagalan pasien ditunjukkan oleh fungsi hazard (hazard function) dari distribusi Weibull yaitu:

ln ( ) . ) ( ) ( ) ( 1 0     r t r t S dt d t S t f t   (4)

Fungsi hazard kumulatifnya (cumulative hazard function) ditunjukkan seperti di bawah ini:

(37)

4 ( ) ( ) . 0 0 0 r t t du u t

   (5) [4]. Weibull-Regression

Model regresi Weibull untuk distribusi dari fungsi survival dapat dirumuskan sebagai berikut: ( , ) ' 1exp( ' ir) z r i z i i z re t e t t f   i    i (6) dengan mengganti zi i e ' 

  maka persamaan (6) berubah menjadi:

f(ti,i)ritir1exp(itir) (7)

dengan t menunjukkan waktu bertahan hidup untuk data pasien yang tersensor i

dengan vektor covariate z [5]. Dalam hal ini r sebagai parameter yang akan i diestimasi nilainya. Distribusi Weibull digunakan karena fleksibel meliputi bentuk dan model sederhana yang memungkinkan perubahan kenaikan r1, penurunan

1 

r dan laju kegagalan yang konstan untuk r1 [6]. Koefisien regresi dari model Weibull adalah  yang diperoleh dengan mengasumsikannya sebagai prior yang berdistribusi normal  ~ N(0,0.0001). Parameterisasinya Ti ~Weibull(ri,i).

Distribusi Prior Model Weibull

Penentuan distribusi prior model Weibull ditentukan dengan mengambil distribusi yang sering digunakan sebagai standar yaitu Normal N(0,2) dengan nilai

2

diambil nilai 0.0001 sebagai vague precision untuk model regresi Weibull. Penentuan distribusi Prior untuk penentuan shape parameter r menggunakan distribusi Gamma(1,0.0001) untuk fungsi distribusi survival yang turun perlahan pada saat nilai t0 (positive real line) [5].

(38)

5 Fungsi Likelihood Model Weibull

Fungsi likelihood yang biasa digunakan untuk menganalisis data tersensor adalah

(1 ) 1 ) ( ) ( ) , | ( i i i i n i t S t f r D L    

 . (9) Dengan mensubtitusikan f(ti) diberikan pada persamaan (2) dan S(ti) pada persamaan (3) maka diperoleh fungsi likelihood untuk Model Weibull yaitu:

(1 ) 1 ' 1 ' ) exp( ) exp( ) , | ( i i i i r n i r i z r i z t t e t re r D L        

(10)

dengan i 0 jika observasi ke-i tersensor dan i 1jika observasi ke-i tidak tersensor [2].

Aproksimasi Distribusi Posterior

Dalam estimasi Bayes, setelah informasi tentang sampel dan prior dapat ditentukan maka distribusi posteriornya dicari dengan cara mengalikan priornya dengan informasi sampel yang diperoleh dari likelihoodnya [7]. Dituliskan sebagai berikut:

P(r,

|D)  L(D|r,

)P(r)P(

). (11) Akan difokuskan dalam mengestimasi parameter

r

dan . Karena model rumit karena mengandung banyak parameter maka distribusi posterior susah untuk diestimasi secara langsung, maka perlu adanya suatu pendekatan menggunakan metode simulasi dengan MCMC (Markov Chain Monte Carlo). Pada proses MCMC dipilih menggunakan algoritma Gibbs Sampling.

Algoritma Gibbs Sampling dalam winBUGS membutuhkan nilai awal dari parameter yang akan di estimasi. Nilai awal ditentukan yaitu

~ Normal(0,0.0001)

dan r ~Gamma1,0.0001( ). Langkah manual penyusunan algoritma Gibbs Sampling dibuat dengan prosedur penentuan (P(r|D,

),P(r|D,

)) dengan langkah pada persamaan (12) dan (13) yaitu:

P(

|D,r)P(

)L(D|r,

) (12) dan

(39)

6

P(r|D,

)P(r)L(D|r,

). (13) Langkah pada persamaan (12) dan (13) diulang sebanyak bilangan B yang cukup besar, dengan B merupakan banyaknya update pada software WinBUGS 1.4 yaitu proses iterasi guna menyusun rantai Markov hingga diperoleh deret rantai Markov yang konvergen.

METODE PENELITIAN Profil data

Data yang digunakan adalah data waktu bertahan hidup, status hidup pasien dan treatment yang digunakan pasien penderita jantung koroner [4]. Kemudian dilakukan simulasi dengan menambah data yang tersensor. Data survival ditunjukkan pada Tabel 1 dengan banyaknya pasien sejumlah 40 pasien dan dua treatment yang dikenakan yaitu treatment Ring dan Bypass. Dalam hal ini tanda * menunjukkan data yang tersensor. Banyaknya data yang tersensor untuk treatment Ring sebanyak 1 pasien dan untuk treatment Bypass sebanyak 7 pasien. Status hidup pasien bernilai 0 menunjukkan pasien tetap bertahan hidup saat menjalani treatment dan bernilai 1 menunjukkan pasien meninggal saat proses treatment berlangsung

Langkah-langkah penelitian

Pengolahan data dengan menggunakan winBUGS 1.4. Sspesifikasi model meliputi pengecekan terhadap syntax model, loading data, compiling model, inisialisasi model, menentukan iterasi MCMC sebanyak 200.000 kali guna membangkitkan Rantai-Markov hingga mencapai konvergen. Parameter yang akan diestimasi meliputi treatment ring, bypass serta parameter distribusi Weibull r. Updating data parameter ditentukan sebanyak 200.000 titik sampel. Dalam ploting masing-masing node dan parameter beta nilai rantai Markov dilakukan burn in sebanyak 100.000 data, dan diambil bangkitan rantai dari data ke 100.001 sampai dengan 200.000 titik sampel.

(40)

7

Tabel 1. Data survival pasien penderita jantung koroner

No Waktu

(bulan) Status Treatment No

Waktu

(bulan) Status Treatment

1 26 0 Ring 21 32 0 Bypass 2 26 0 Ring 22 33 0 Bypass 3 38 0 Ring 23 42 0 Bypass 4 51 0 Ring 24 42 0 Bypass 5 52 0 Ring 25 56 0 Bypass 6 56 0 Ring 26 56* 0 Bypass 7 57 0 Ring 27 60* 1 Bypass 8 61 1 Ring 28 65 0 Bypass 9 62 0 Ring 29 78 0 Bypass 10 62 0 Ring 30 87 0 Bypass 11 66 0 Ring 31 87* 0 Bypass 12 71 1 Ring 32 93 0 Bypass 13 71 0 Ring 33 102* 0 Bypass 14 75 0 Ring 34 116* 0 Bypass 15 83 0 Ring 35 116* 1 Bypass 16 106 0 Ring 36 146* 1 Bypass 17 123 0 Ring 37 161 0 Bypass 18 128* 0 Ring 38 173 1 Bypass 19 156 0 Ring 39 178 1 Bypass 20 183 0 Ring 40 182 1 Bypass

HASIL DAN PEMBAHASAN

Dalam proses analisis data yang terdiri dari N40 dan M 2, dengan N menyatakan total pasien penderita penyakit jantung koroner dan M menunjukkan banyaknya treatment yang digunakan oleh pasien meliputi metode pengobatan Ring dan Bypass.

Weibull-Regresion menggunakan pendekatan Bayesian dilakukan dengan update untuk menyusun MCMC dengan iterasi sebanyak 200.000 titik sampel. Hasil nilai estimasi dan karakteristik untuk masing-masing parameter ditunjukkan pada Tabel 2 dan Tabel 3.

(41)

8

Tabel 2. Hasil estimasi Bayesian untuk parameter  node Ring dan Bypass

Node Mean Standard

Deviasi MC error Batas minimum 2,5% Median Batas maksimum 97,5% Ring -8.936 1.248 0.02904 -11.51 -8.889 -6.627 Bypass -0.7868 0.3685 0.00155 -1.524 -0.7821 -0.07581

Tabel 3. Hasil estimasi Bayesian untuk parameter r

Node Mean Standard

Deviasi MC error Batas Minimum 2,5% Median Batas Maksimum 97,5% r 1.98 0.2609 0.00612 1.493 1.972 2.515

Tabel 4. Probabilitas tiap pasien untuk masing-masing treatment

No Waktu (bulan) S(t) Treatment No Waktu (bulan) S(t) 125 10 1  Treatment 1 26 0.9200 Ring 21 32 0.5810 Bypass 2 26 0.9200 Ring 22 33 0.5810 Bypass 3 38 0.8381 Ring 23 42 0 Bypass 4 51 0.7288 Ring 24 42 0 Bypass 5 52 0.7198 Ring 25 56 0 Bypass 6 56 0.6834 Ring 26 56* 0 Bypass 7 57 0.6742 Ring 27 60* 0 Bypass 8 61 0.6370 Ring 28 65 0 Bypass 9 62 0.6277 Ring 29 78 0 Bypass 10 62 0.6277 Ring 30 87 0 Bypass 11 66 0.5904 Ring 31 87* 0 Bypass 12 71 0.5439 Ring 32 93 0 Bypass 13 71 0.5439 Ring 33 102* 0 Bypass 14 75 0.5072 Ring 34 116* 0 Bypass 15 83 0.4362 Ring 35 116* 0 Bypass 16 106 0.2601 Ring 36 146* 0 Bypass 17 123 0.1640 Ring 37 161 0 Bypass 18 128* 0.1414 Ring 38 173 0 Bypass 19 156 0.0553 Ring 39 178 0 Bypass 20 183 0.0189 Ring 40 182 0 Bypass

(42)

9

Pada [1] telah diperoleh satu nilai estimasi parameter  model Cox-Regression untuk kedua teknik pengobatan Ring dan Bypass yaitu sebesar -0.8789 [1]. Pada model Weibull-Regression didapatkan dua nilai parameter  untuk treatment Ring dan Bypass berurutan sebesar -8.936 dan -0.7868. Probabilitas tiap pasien untuk masing-masing treatment ditunjukkan pada Tabel 4. Nilai probabiitas tertinggi untuk pasien menggunakan treatment Ring adalah 0.9200 dan yang terendah adalah 0.0189. Sedangkan untuk treatment bypass diperoleh nilai probabilitas yang sangat kecil. Pebandingan nilai probabilitas ketahanan hidup pasien penderita jantung koroner untuk model Cox-Regression dan Weibull-Regression ditunjukkan pada Tabel 5. Dari Tabel 5. Terlihat nilai probabilitas bertahan hidup pasien dengan menggunakan Weibull-Regression jauh lebih kecil jika dibandingkan dengan model Cox-Regression. Nilai probabilitas fungsi survival yang bernilai 0 diduga karena model Weibull-Regression kurang sesuai untuk mengestimasi parameter ktahanan hidup pasien penderita jantung koroner.

Tabel 5. Probabilitas survival untuk model Cox-Regression dan Weibull-Regression

Pasien ke - Waktu (bulan) S(t) Cox-Regression S(t) Weibull-Regression Status Pasien 8 61 0.9771 0.6370 1 12 71 0.9536 0.5439 1 27 60 0.9262 0 1 35 116 0.8781 0 1 36 146 0.8119 0 1 38 173 0.7185 0 1 39 178 0.6130 0 1 40 182 0.4868 0 1

Mean dan Median dalam Tabel 2 menunjukkan nilai estimasi titik untuk nilai parameter . Rata-rata dari parameter dalam Tabel 2 merepresentasikan estimasi nilai rata-rata posterior untuk pasien yang menggunakan ring dan bypass menggunakan kedua treatment tersebut. Nilai mean untuk pasien dengan ring adalah -8.936 sedangkan dengan bypass -0.7868. Nilai error dalam penyusunan MCMC dengan algoritma Gibbs Sampling ditunjukkan dari MC error, diperoleh nilai error

(43)

10

yang cukup kecil karena mendekati nol. Estimator interval untuk parameter ditunjukkan dari interval konfidensi yakni batas minimum dan maksimum dengan pengambilan nilai

0,5. Estimasi parameter menunjukkan bahwa semua parameter terletak dalam batas interval konfidensi pada posisi antara 2,50% dan 97,50% dan nilainya signifikan karena tidak melewati nilai nol. Adanya interval konfidensi tersebut menjamin pencakupan dari parameter yang diselidiki. Nilai dari koefisien regresi  ditunjukkan dari nilai mean dari ring dan bypass.

Plot time series untuk MCMC Bayesian dan densitas kernel ditujukkan dalam Gambar 1. Plot dari time series menunjukkan gambaran rantai Markov yang dibangkitkan dari data dengan updating sebanyak 200.000 iterasi.

Gambar 1. Plotime series untuk MCMC Bayesian dan densitas kernel node Ring, node

Bypass, dan r

0e+00 4e+04 8e+04

-1 4 -1 0 -6 MCMC-Ring Index Ri ng -14 -12 -10 -8 -6 -4 0. 00 0. 15 0. 30

Densitas Kernel beta-Ring

N = 100000 Bandw idth = 0.1109

Ri

ng

1

0e+00 4e+04 8e+04

-2 .5 -1 .0 0. 5 MCMC-Bypass Index B yp as s -3 -2 -1 0 0. 0 0. 4 0. 8

Densitas Kernel beta-Bypass

N = 100000 Bandw idth = 0.03327

B

yp

as

s

0e+00 4e+04 8e+04

1. 0 2. 0 3. 0 MCMC-r Index r 1.0 1.5 2.0 2.5 3.0 0. 0 1. 0 Densitas Kernel-r N = 100000 Bandw idth = 0.02319 r

(44)

11

Plot Gambar 1. menunjukkan nilai MCMC tidak selalu positif, hasil plot nampak rapat dan dapat merespon keseluruhan sampel berarti didapati model telah konvergen. Nilai estimasi densitas posterior dapat dilihat dari plot densitas kernel. Estimasi densitas kernel memberikan plot yang bagus karena dihasilkan densitas yang cenderung halus. Plot dari densitas kernel untuk setiap node Ring dan Bypass mengikuti densitas prior yakni berdistribusi normal sedangkan untuk parameter r juga cenderung normal. Gambaran MCMC mengindikasikan bahwa nilai yang ditunjukkan berasal dari sebaran posterior yang dibentuk oleh rantai Markov.

Gambar 3. Gambaran running quantiles dan autokorelasi

ring iteration 8001 50000 100000 150000 -12.0 -10.0 -8.0 -6.0 bypass iteration 8001 50000 100000 150000 -1.5 -1.0 -0.5 0.0 r iteration 8001 50000 100000 150000 1.5 2.0 2.5 3.0

Gambar 3. menunjukkan plot dari running quantiles yang merepresentasikan gambaran mengenai nilai dari kinerja sampel yang cukup bagus. Hal tersebut ditunjukkan dari posisi plot garis yang masih terletak di dalam rentang interval yaitu diantara batas atas dan bawah. Gambaran nilai autokorelasi untuk tiap node dan

0 10 30 50 0. 0 0. 2 0. 4 0. 6 0. 8 1. 0 Lag A CF Series ring[100001:2e+05] 0 10 30 50 0. 0 0. 2 0. 4 0. 6 0. 8 1. 0 Lag A CF Series bypass[100001:2e+05] 0 10 30 50 0. 0 0. 2 0. 4 0. 6 0. 8 1. 0 Lag A CF Series r[100001:2e+05]

(45)

12

parameter ditunjukkan pula pada Gambar 3. Nilai autokorelasi menunjukkan bahwa data yang dibangkitkan memenuhi sifar rantai Markov [8]. Plot nilai autokorelasi dengan menggunakan fungsi acf pada R i386 3.0.1. ACF merupakan singkatan dari Auto Corelation Function. Nilai autokorelasi untuk ring dan r kuat ditunjukkan dari plot autokorelasi yang turun secra perlahanan, Sedangkan untuk node bypass tidak sekuat nilai autokorelasi untuk ring dan r. Hal tersebut terlihat dari plot autokorelasi yang turun tajam.

Berdasarkan analisis yang dilakukan diperoleh nilai estimasi parameter  dan r dari model Weibull-Regresion untuk pasien penderita jantung koroner.

Kesimpulan

Dalam paper ini diperoleh nilai parameter  dan r serta nilai probabilitas bertahan hidup pada model Weibull-Regression untuk mengolah data tersensor ketahanan hidup pasien penderita jantung koroner dengan Bayesian survival analysis.

DAFTAR PUSTAKA

[1] Lukitasari, A.Dewi, Adi Setiawan dan Leopoldus Ricky Sasongko.2014. Bayesian Survival Analysis menggunakan Cox-Regression untuk Mengestimasi Model Ketahanan Hidup Pasien Penderita Jantung Koroner. Prosiding Seminar Nasional Sains dan Pendidikan Sains. Universitas Muhammadiyah : Purworejo. [2] Perra, Silvia.2013. Objective Bayesian Variable Selection for Censored Data.

Fakultas Matematika dan Informatika. Universitas Cagliari: Italia.

[3] Klein, J.P dan Moeschberger, M.L.1997. Survival Analysis : Techniques for Censored and Truncated Data. New York. Springer-Verlag New York Inc. [4] Hendrajaya, Yani, Adi Setiawan dan Hanna Arini Parhusip.2008. Penerapan

Analisis Survival untuk Menaksir Waktu Bertahan Hidup bagi Penderita Penyakit Jantung. Program Studi Matematika. Fakultas Sains dan Matematika. UKSW : Salatiga.

[5] Andrew E Long. 1999. Weibull Regression in Censored Survival Analysis. Diakses pada Selasa, 16 Desember 2014 pukul 14:02.

Gambar

Tabel 1. Data waktu bertahan hidup pasien penderita jantung koroner  No  Waktu
Tabel 2. Hasil estimasi node Ring  dengan metode klasik non-parametrik
Tabel 4. Hasil estimasi parameter Beta dengan metode klasik
Gambar 1. Estimasi mean fungsi survival untuk treatment Ring dan Bypass
+7

Referensi

Dokumen terkait

Selain itu permasalahan mengenai keterbatasan informasi seperti tidak adanya informasi laporan produk retur, informasi rekapitulasi penjualan produk terlaris menyebabkan

Tatang Dimyati Drs... Tuti

Proses pembelajaran tari Oleg Tamulilingan gaya Peliatan yang dilakukan oleh I Gusti Ayu Raka Rasmi kepada peserta didik yang di sanggar Kori Agung seperti melakukan

1,3 zoom .1x100 Mahasiswa mencari, mengumpulkan, dan menyusun informasi (konsep,-teori) tentang Beberapa contoh karya dari beberapa filsuf Jawa dari berbagai sumber, lalu

Menyatakan fakta berserta huraian yang ringkas 2m Menyatakan fakta berserta huraian yang jelas dan lengkap serta disokong

Berdasarkan Peraturan Menteri Pendidikan dan Kebudayaan Nomor 36 Tahun 2014 tentang Pedoman Pendirian, Perubahan dan Penutupan Satuan Pendidikan Dasar dan Menengah, Surat

Sumber infeksi utama adalah tumpukan bakteri pada lesi manusia, infeksi Staphylococcus aureus lokal tampak sebagai jerawat, infeksi yang lain dapat juga berasal

[r]