ANALISIS REGRESI COX PROPORSIONAL DENGAN HAZARD DASAR WEIBULL PADA DATA TERSENSOR TIPE II
SKRIPSI
JATU HERLINA AMURWANI
PROGRAM STUDI S-1 MATEMATIKA DEPARTEMEN MATEMATIKA FAKULTAS SAINS DAN TEKNOLOGI
ANALISIS REGRESI COX PROPORSIONAL DENGAN HAZARD DASAR WEIBULL PADA DATA TERSENSOR TIPE II
SKRIPSI
Sebagai Salah Satu Syarat Untuk Memperoleh Gelar Sarjana Sains Bidang Matematika
Pada Fakultas Sains Dan Teknologi Universitas Airlangga
Disetujui oleh
Pembimbing 1
Toha Saifudin,S.Si,M.Si NIP. 19750106 199903 1 002
Pembimbing II
LEMBAR PENGESAHAN NASKAH SKRIPSI
Judul : Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II Penyusun : Jatu Herlina Amurwani
Nomor Induk : 080810555 Tanggal Ujian : 18 Juni 2012
Disetujui oleh : Pembimbing 1
Toha Saifudin,S.Si,M.Si NIP. 19750106 199903 1 002
Pembimbing II
Drs. Suliyanto, M.Si NIP. 19650907 199102 1 001
Mengetahui :
Ketua Program Studi S-1 Matematika Departemen Matematika Fakultas Sains dan Teknologi
Universitas Airlangga
Dr. Miswanto
PEDOMAN PENGGUNAAN SKRIPSI
KATA PENGANTAR
Assalamu’alaikum warahmatullahi wabarakatuh.
Alhamdulillahirobbil alamin, berkat rahmat Allah yang telah memberikan petunjuk dan bimbingan-Nya yang tiada tara, sehingga penulis dapat menyelesaikan skripsi dengan judul ”Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II ”.
Dalam penyusunannya, penulis memperoleh banyak bantuan dari berbagai pihak, karena itu penulis mengucapkan terima kasih yang sebesar-besarnya kepada :
1. Dr. Miswanto, M.Si., selaku Ketua Prodi S-1 Matematika serta dosen penguji yang telah memberikan arahan dan bimbingan kepada penulis. 2. Toha Saifudin, S.Si, M.Si selaku dosen pembimbing I yang telah
memberikan banyak arahan, masukan, perhatian, semangat, rasa sabar yang begitu besar dan pengetahuan yang tidak ternilai harganya.
3. Suliyanto, M.Si. selaku dosen pembimbing II yang telah memberikan banyak arahan, masukan, waktu, tenaga dan pikiran.
4. Ir. Elly Ana, M.Si., selaku dosen penguji yang telah memberikan banyak saran untuk kesempurnaan skripsi ini.
5. Dra. Utami Dyah P, M.Si selaku dosen wali selama menjadi mahasiswa Fakultas Sains dan Teknologi Universitas Airlangga yang telah banyak memberikan arahan dan saran demi kesuksesan menjadi mahasiswa Matematika. Serta seluruh dosen Matematika Universitas Airlangga, terima kasih untuk segala ilmu yang diberikan.
6. Untuk Kedua Orang Tuaku tercinta dan ketiga adikku yang telah memberikan dukungan, semangat, kerpercayaan serta cinta dan kasih sayang yang begitu besar. Semoga saya selalu bisa membanggakan kalian.
7. Untuk Varian Luthfan yang telah setia menjadi seorang teman, sahabat, pemberi motivasi serta semangat yang tak pernah henti. Terima kasih atas segala perhatian dan nasehat-nasehatnya selama ini.
8. Arek-arek GP++ : Ragil, Rika, Dilphi, Mita, Wewe, Dinda, Lia, Tika, Vita, dan Michelle, terima kasih atas semua dukungan, canda tawa dan kenangan manis selama ini, semuanya tidak akan pernah terlupakan sampai kapanpun. Love you All.
Arindha & Lia “Temen Seperjuangan” Semangat kawan ayo wisuda bareng, Beta “Bebeb” Jangan kebanyakan nonton drama korea sedih ya. Untuk Efinda & Daris, Mega & D’Nita, Terima kasih atas dukungan, kebersamaan dan canda tawa selama ini.
10. Rekan-rekan mahasiswa Matematika Universitas Airlangga 2008, terima kasih atas kebersamaan selama ini.
11. Serta pihak-pihak lain yang tidak dapat disebutkan satu persatu, terima kasih atas segala bantuan dalam penyelesaian skripsi ini.
Penulis menyadari bahwa skripsi ini masih banyak terdapat kekurangan-kekurangan. Oleh karena itu, penulis mengharapkan kritik dan saran yang membangun agar skripsi ini dapat lebih baik lagi.
Surabaya, Juni 2012 Penyusun
Jatu Herlina Amurwani. 2012. Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II. Skripsi ini dibawah bimbingan Toha Saifudin S.Si, M.Si dan Drs. Suliyanto, M.Si. Departemen Matematika. Fakultas Sains dan Teknologi Universitas Airlangga.
ABSTRAK
Model regresi Cox proporsional merupakan model yang menggambarkan hubungan antara waktu survival sebagai variabel dependen dengan satu set variabel independen yang bisa kontinue ataupun kategorik. Secara umum bentuk model regresi Cox Proporsional dengan hazard dasar weibull adalah :
( ) ( )
dengan merupakan vektor dari variabel independen, merupakan vektor
dari koefisien regresi, dan merupakan hazard dasar dari distribusi Weibull. Tujuan tulisan ini adalah mendapatkan estimator parameter regresi Cox dengan hazard dasar weibull pada data tersensor tipe II. Metode yang digunakan untuk mengestimasi parameter model adalah Maximum Likelihood. Estimator parameter regresi Cox dengan hazard dasar weibull pada data tersensor tipe II masih dalam bentuk implisit, sehingga diperlukan metode numerik untuk menyelesaikannya. Model selanjutnya diterapkan pada studi kasus pasien penderita Cardiovascular Diseases. Persamaan model regresi Cox proporsional dengan hazard dasar weibull pada data tersensor tipe II, hasil penerapan pada pasien penderita Cardiovascular Diseases adalah sebagai berikut :
̂ ( ) ( )( ) (
)
dengan adalah Sistolic Blood Pressure dan adalah Logaritm of Urinary Albumin and Creatin. Nilai residual Cox-snell dari model tersebut berdistribusi eksponensial, sehingga dapat dikatakan model yang didapat sesuai atau tepat. Berdasarkan persamaan tersebut, diketahui bahwa resiko kematian pasien akan bertambah sebesar untuk setiap kenaikan SBP sebesar 10 satuan. Sedangkan untuk variabel LACR, resiko kematian pasien akan bertambah sebesar 0,256563 untuk setiap kenaikan LACR sebesar 2 satuan.
Jatu Herlina Amurwani. 2012. Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II. This skripsi in under the guidance by Toha Saifudin S.Si, M.Si and Drs. Suliyanto, M.Si. Mathematics departement of Scince and Technology Faculty. Airlangga University.
ABSTRACT
Cox proportional regression model is a model that describes the relationship between survival times as the dependent variable with a set of independent variables, which can be continuous or categorical. In general, the form of Cox proportional regression model with the baseline hazard Weibull is
( ) ( )
where is a vector of independent variables, is vector of regression coefficients, and are the baseline hazard of the Weibull distribution. The
purpose of this paper is to obtain estimators Cox regression parameter with Weibull as the baseline hazard for type II censored.The method used to estimate the model is the Maximum Likelihood Estimator. The model was applied to case studies of patients with Cardiovascular Diseases. The equation of Cox proportional hazard in patients with Cardiovascular Diseases are as follows :
̂( ) ( )( ) (
)
where is Sistolic Blood Pressure and is Logaritm of Urinary Albumin and Creatine. Cox-Snell residual value of this model is distributed exponentially, so that it can be said that the model fit or just gained. Based on the results, it is known that the risk of dying patients would increase by 0.751572 for each increase in SBP of 10 units. While for the variable LACR, the risk of dying patients would increase by 0.256563 for each increase by 2 units LACR.
DAFTAR ISI
Halaman
LEMBAR JUDUL ... i
LEMBAR PERNYATAAN ... ii
LEMBAR PENGESAHAN ... iii
LEMBAR PEDOMAN PENGGUNAAN SKRIPSI ... iv
KATA PENGANTAR ... v
ABSTRAK ... vii
DAFTAR ISI ... ix
DAFTAR GAMBAR ... xii
DAFTAR TABEL ... xiii
DAFTAR LAMPIRAN ... xiv
BAB I PENDAHULUAN ... 1
1.1 Latar Belakang Permasalahan ... 1
1.2 Rumusan Masalah ... 4
1.3 Tujuan ... 4
1.4 Manfaat ... 5
1.5 Batasan Masalah ... 5
BAB II TINJAUAN PUSTAKA ... 6
2.1 Analisis Regresi ... 6
2.2 Analisis Data Uji Hidup ... 7
2.3 Tipe Penyensoran ... 8
2.4 Fungsi Survival dan Fungsi Hazard ... 9
2.5 Distribusi Weibull ... 13
2.6 Model Regresi Dalam Analisis Data Uji Hidup ... 14
2.8 Fungsi Likelihood ... 17
2.9 Maximum Likelihood Estimator ... 18
2.10 Estimasi Fungsi Survival ... 18
2.11 Residual Cox – Snell ... 19
2.12 Metode Newton Rapshon ... 21
2.13 Titik Maksimum ... 22
2.14 Matrik Definit Negatif ... 23
2.15 S-Plus ... 23
2.16 Cardiovascular Diseases ... 25
2.17 Interpretasi Model Proporsional Hazard ... 30
BAB III METODE PENELITIAN ... 32
BAB IV PEMBAHASAN ... 34
4.1 Model Regresi Cox dengan Hazard Dasar Weibull ... 34
4.1.1 Menentukan Fungsi Hazard Dasar Weibull ... 35
4.1.2 Mendapatkan Model Regresi Cox dengan Hazard Dasar Weibull ... 35
4.1.3 Menetukan Fungsi Survival dan PDF yang berhubungan dengan Hazard Dasar Weibull ... 35
4.2 Estimasi Parameter dalam Model Regresi Cox ... 36
4.2.1 Menentukan Fungsi Likelihood dari Model Regresi Cox dengan Hazard Dasar Weibull... 36
4.2.2 Menentukan Fungsi Log-Likelihood ... 37
4.2.3 Menentukan Turunan Pertama Fungsi Log Likelihood Terhadap Parameter ... 38
4.2.4 Mendapatkan Estimator Parameter ... 39
4.2.5 Menentukan Turunan Kedua Fungsi Log Likelihood ... 40
4.3 Estimasi Residual Cox – Snell ... 45
4.5 Algoritma untuk Estimasi Residual Cox – Snell ... 49
4.6 Program Estimasi Parameter Model Regresi Cox dengan Hazard Dasar Weibull... 49
4.7 Penerapan Pada Kasus Data Uji Hidup ... 50
4.7.1 Uji Kesesuaian Distribusi Weibull pada data waktu Tahan Hidup pasien Cardiovascular Disease ... 50
4.7.2 Asumsi Hazard Proporsional ... 51
4.7.3 Estimasi Parameter ... 65
4.7.4 Model Regresi Cox Proporsional untuk Data CVD ... 67
4.7.5 Uji Residual Cox – Snell ... 68
4.7.6 Resiko Kematian Pasien Cardiovascular Disease ... 69
BAB V KESIMPULAN ... 71
DAFTAR GAMBAR
Nomor Judul Gambar Halaman
2.1 Kurva Fungsi Survival ... 10
2.2 Kurva Distribusi Kumulatif Weibull ... 13
4.1 Plot Asumsi Hazard Proporsional Variabel DG ... 52
4.2 Plot Asumsi Hazard Proporsional Variabel AGE ... 54
4.3 Plot Asumsi Hazard Proporsional Variabel SEX ... 55
4.4 Plot Asumsi Hazard Proporsional Variabel SMOKE ... 56
4.5 Plot Asumsi Hazard Proporsional Variabel BMI ... 58
4.6 Plot Asumsi Hazard Proporsional Variabel SBP ... 59
4.7 Plot Asumsi Hazard Proporsional Variabel LACR ... 60
4.8 Plot Asumsi Hazard Proporsional Variabel LTG ... 62
4.9 Plot Asumsi Hazard Proporsional Variabel HTN ... 63
DAFTAR TABEL
Nomor Judul Tabel Halaman
4.1 Nilai-nilai penduga Kaplan Meier dari fungsi Survival
variabel Jenis penyakit (DG) ... 52 4.2 Nilai-nilai penduga Kaplan Meier dari fungsi Survival
variabel Usia (AGE) ... 53 4.3 Nilai-nilai penduga Kaplan Meier dari fungsi Survival
variabel Jenis kelamin (SEX) ... 54 4.4 Nilai-nilai penduga Kaplan Meier dari fungsi Survival
variabel intensitas merokok (SMOKE) ... 56 4.5 Nilai-nilai penduga Kaplan Meier dari fungsi Survival
variabel indeks masa tubuh (BMI) ... 57 4.6 Nilai-nilai penduga Kaplan Meier dari fungsi Survival
variabel tekanan darah sistole (SBP)... 58 4.7 Nilai-nilai penduga Kaplan Meier dari fungsi Survival
variabel Algoritma Albumin dan kreatin (LACR) ... 60 4.8 Nilai-nilai penduga Kaplan Meier dari fungsi Survival
variabel Algoritma Trigliserin (LTG) ... 61 4.9 Nilai-nilai penduga Kaplan Meier dari fungsi Survival
variabel status hipertensi (HTN) ... 62 4.10 Nilai-nilai penduga Kaplan Meier dari fungsi Survival
variabel status diabetes (DM)... 64 4.11 Nilai Estimator Awal Dari Data Tahan Hidup Pasien
Penderita Penyakit Kardiovaskuler. ... 66
4.12 Nilai Estimator Parameter ̂ Dari Data Tahan Hidup Pasien
Penderita Penyakit Kardiovaskuler ... 66 4.13 Nilai Residual Pada Data Tahan Hidup Pasien Penderita Penyakit
DAFTAR LAMPIRAN
Nomor Judul Lampiran
1. Data Pasien Penderita Cardiovascular Disease (CVD).
2. Uji Kesesuaian Distribusi Weibull pada Kasus Data Tahan Hidup Pasien Penderita Cardiovascular Disease (CVD).
3. Program Untuk Menentukan Estimator Parameter Model Regresi Cox Proporsional Hazard.
a. Subprogram Untuk Mendapatkan Turunan Pertama. b. Subprogram Untuk Mendapatkan Matrik Jacobian. c. Subprogram Untuk Mendapatkan Estimator Parameter.
.
4. Program Untuk Mendapatkan Nilai Residual Cox – Snell. 5. Output Program Untuk Menentukan Parameter Model
Regresi Cox Proporsional dengan Hazard Dasar Weibull. a. Nilai estimator parameter regresi Cox
BAB I
PENDAHULUAN
1.1 Latar belakang
Statistika merupakan suatu alat yang memegang peranan penting dalam pengambilan keputusan. Banyak sekali peranan ilmu statistika dalam pengambilan keputusan, salah satunya adalah di dunia medis atau kesehatan.
Analisis data uji hidup merupakan salah satu teknik statistika yang banyak digunakan dalam bidang kesehatan. Di dunia kesehatan, sulit sekali untuk mengetahui lamanya tahan hidup seorang pasien dalam pengobatan suatu penyakit, apalagi untuk menentukan waktu kesembuhan atau kambuhnya suatu penyakit. Namun, hal yang bisa kita lakukan adalah mengetahui sifat karakteristik dari penyakit tersebut, antara lain : menganalisis peluang ketahanan, resiko kematian, memodelkan sifat karakteristik penyakit, menentukan estimasi interval kepercayaan dan mengambil kesimpulan yang berhubungan dengan penyakit tersebut.
digunakan yaitu : model proporsional hazard untuk T dan model lokasi skala untuk log T.
Model tersebut selanjutnya diperluas pada situasi dimana resiko kematian pada waktu tertentu tergantung pada nilai dari variabel bebas
. Himpunan nilai variabel bebas dari model proporsi hazard dapat
dinyatakan dengan vektor , yaitu = . Model regresi Cox proporsional hazard untuk pengamatan ke- dari individu dapat dituliskan sebagai berikut :
Model regresi Cox merupakan model hazard proporsional dasar yaitu rasio
hazardnya sama sepanjang waktu atau rasio hazardnya independen dengan waktu (Fahrmer dan Tutz,1994). Model ini dikemukakan oleh Cox dan lebih dikenal dengan regresi Cox, dimana merupakan vektor dari variabel bebas, dan merupakan koefisien regresi yang membentuk vektor , sedangkan
merupakan fungsi hazard untuk individu dengan semua nilai variabel bebasnya yang memuat vektor x sama dengan nol, dinamakan hazard dasar (baseline hazard function) (Collet, 1994).
Fungsi hazard untuk setiap individu adalah yang diasumsikan berdistribusi Weibull dengan λ adalah parameter skala dan γ adalah parameter bentuk, maka Model Cox dapat dituliskan sebagai berikut (Collet, 1994) :
Distribusi weibull yang digunakan sebagai hazard dasar merupakan salah satu distribusi yang banyak digunakan untuk menganalisis data uji hidup. Distribusi weibull memiliki berbagai kelebihan yang tidak dimiliki oleh distribusi lain seperti : memiliki 2 parameter yaitu parameter bentuk dan parameter skala, parameter bentuk yang dimiliki oleh distribusi weibull menjadikan distribusi ini lebih fleksibel atau bisa menyerupai distribusi lain.
Model regresi Cox proporsional hazard merupakan regresi survival, dengan respon merupakan data waktu survival sampai suatu titik kejadian yang ditentukan. Karakteristik utama model regresi Cox ini adalah mengakomodasikan adanya data sensor. Di dalam analisis data uji hidup dikenal beberapa tipe penyensoran, diantaranya adalah sampel tersensor tipe II. Sampel tersensor tipe II ini memiliki kelebihan yaitu lebih efisien waktu, karena percobaan akan dihentikan ketika sudah mencapai kegagalan yang diinginkan, dengan ketentuan
.
Karakteristik analisis survival yang mengakomodasi adanya sensoring inilah yang membuat estimasi parameter pemodelan data survival dengan fungsi likelihood semakin komplek (Fox,2002). Pada kasus dimana satu atau lebih data tersensor tipe II, maka fungsi likelihood-nya dapat ditulis sebagai berikut
| {∏
}
Berdasarkan uraian diatas, penulis tertarik untuk mengambil judul “Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II” dan selanjutnya menerapkan hasilnya pada data riil.
1.2 Rumusan Masalah
Berdasarkan latar belakang yang telah diuraikan, dapat dirumuskan permasalahan :
1 Bagaimana bentuk model regresi Cox proporsional dengan hazard dasar weibull ?
2 Bagaimana memperoleh estimator parameter model regresi Cox dengan hazard dasar Weibull pada data tersensor tipe II ?
3 Bagaimana menerapkan model regresi Cox melalui studi kasus pada data riil ?
1.3 Tujuan
Berdasarkan rumusan masalah diatas, tujuan yang ingin dicapai adalah untuk :
1 Mendapatkan bentuk model regresi Cox proporsional dengan hazard dasar weibull
2 Mendapatkan estimator parameter model regresi Cox dengan hazard dasar Weibull pada data tersensor tipe II
1.4 Manfaat
Manfaat dari penulisan skripsi ini adalah sebagai berikut :
1 Memperluas wawasan tentang metode analisis regresi yang biasa digunakan untuk menganalisa data survival
2 Dapat memodelkan regresi data survival secara umum dan metode Cox secara khusus.
3 Mampu menerapkan dan mengaplikasikan model regresi tersebut ke dalam data riil.
1.5 Batasan masalah
BAB II
TINJAUAN PUSTAKA
2.1 Analisis Regresi
Sir Francis Galton (1822-1911), seorang antropolog dan ahli meteorologi terkenal dari Inggris yang memperkenalkan istilah regresi dalam pidato di depan
Section H of the British Association di Aberdem, 1885, yang dimuat dalam majalah Nature, dan juga dalam sebuah makalah “Regression Towards Mediocrity in Hereditary Stature”, yang dimuat dalam journal of the Antropolgical Institute, 1985.
(Drapper dan Smith,1992)
Analisis regresi merupakan salah satu teknik yang ada dalam statistika, secara umum ada beberapa definisi yang menjelaskan tentang analisis regresi yaitu :
Definisi 2.1
Analisis regresi merupakan teknik statistik untuk menyelidiki dan membuat model hubungan diantara variabel-variabel.
(Montgomery dan Peck,1992) Definisi 2.2
bebas/variabel dependen) dan variabel prediktor (variabel bebas/variabel independen) .
(Hosmer dan Lemeshow, 1989) Definisi 2.3
Variabel prediktor ialah variabel yang nilainya dapat ditentukan atau yang nilainya dapat diamati namun tidak dapat dikendalikan. Variabel respon ialah variabel yang nilainya dipengaruhi oleh perubahan-perubahan variabel-variabel prediktor.
(Drapper dan Smith,1992)
Di dalam kehidupan nyata banyak sekali teknik statistika yang dapat digunakan untuk menganalisis masalah. Salah satu teknik analisis statistika yang digunakan untuk menganalisis data yang berhubungan dengan waktu tahan hidup adalah analisis data uji hidup.
2.2 Analisis Data Uji Hidup
Analisis data uji hidup (Survival analysis) adalah suatu metode untuk menganalisis data yang berhubungan dengan waktu, mulai dari time origin atau
start-point sampai dengan terjadinya suatu kejadian khusus atau end point. Di dalam riset medis, time origin sering digunakan sebagai awal perekrutan suatu individu dalam suatu studi yang bersifat percobaan sedangkan end-point merupakan kematian suatu individu atau pasien, sehingga data yang dihasilkan secara harfiah dinamakan waktu survival.
Untuk mendapatkan data uji hidup biasanya dilakukan eksperimen. Dalam melakukan eksperimen ada beberapa metode yang dilakukan sehingga data yang dihasilkan juga berbeda dari satu metode ke metode lain. Yang membedakan analisis uji hidup dengan bidang-bidang yang lain pada statistika adalah penyensoran.
2.3 Tipe Penyensoran
Di dalam analisis data uji hidup terdapat beberapa tipe penyensoran yaitu sampel lengkap, sampel tersensor tipe I, dan sampel tersensor tipe II. Penjelasan lengkapnya adalah sebagai berikut :
2.3.1 Sampel Lengkap
Pada uji sampel lengkap, eksperimen akan dihentikan jika semua benda atau individu yang telah diuji mati atau gagal. Langkah seperti ini mempunyai suatu keuntungan yaitu dihasilkannya observasi terurut dari semua benda atau individu yang diuji.
(Lawless,1982) 2.3.2 Sampel Tersensor Tipe I
Dalam sampel tersensor tipe I, eksperimen akan dihentikan jika telah dicapai waktu tertentu (waktu penyensoran). Misalkan adalah sampel
{
dimana adalah nilai sensor pada pengamatan ke-i
(Lawless, 1982) 2.3.3 Sampel Tersensor Tipe II
Pada pengujian sampel tersensor tipe II, eksperimen akan dihentikan setelah kematian ke- dari komponen yang dioperasikan tercapai. Misalkan adalah sampel random dari distribusi tahan hidup dengan fungsi kepadatan peluang dan fungsi survival . Eksperimen dikatakan telah selesai jika kegagalan ke- telah dicapai ( .
(Lawless, 1982)
Dalam analisis data survival ada dua macam fungsi yang dapat memberikan informasi tentang data survival, yaitu fungsi survival dan fungsi
hazard.
2.4 Fungsi Survival dan Fungsi Hazard
Fungsi survival merupakan dasar dari analisis survival, karena meliputi probabilitas survival dari waktu yang berbeda-beda yang memberikan informasi penting tentang data survival. Dalam analisis data uji hidup fungsi survival dapat didefinisikan :
Definisi 2.4
Jika diketahui fungsi distribusi kumulatif , yaitu :
∫ , (2.1)
maka bisa diperoleh fungsi survival sebagai berikut :
∫
∫
(2.2) (Kleinbaum dan Klein, 2005) Secara teori, fungsi survival dapat digambarkan dengan kurva mulus dan memiliki karakteristik sebagai berikut:
1. Tidak meningkat, kurva cenderung turun ketika meningkat.
2. Untuk , adalah awal dari penelitian, karena tidak ada objek yang mengalami peristiwa, probabilitas waktu survival 0 adalah 1.
3. Untuk secara teori, jika periode penelitian meningkat sampai tak berhingga maka tidak ada satu pun yang bertahan, sehingga kurva survival mendekati nol.
Berbeda dengan fungsi survival yang fokus pada tidak terjadinya peristiwa, fungsi hazard fokus pada terjadinya peristiwa. Oleh karena itu, fungsi hazard dapat dipandang sebagai pemberi informasi yang berlawanan dengan fungsi survival.
(Kleinbaum dan Klein, 2005) Kurva fungsi hazard juga memiliki karakteristik, yaitu:
1. Selalu non negatif, yaitu sama atau lebih besar dari nol. 2. Tidak memiliki batas atas.
Selain itu fungsi hazard juga digunakan untuk alasan : 1. Memberikan gambaran tentang failur rate. 2. Mengidentifikasi bentuk model yang spesifik.
3. Membuat model matematik untuk analisis survival biasa.
Misalkan melambangkan waktu survival dari waktu awal sampai terjadinya peristiwa yang merupakan variabel acak yang memiliki karakteristik fungsi survival dan fungsi hazard, maka fungsi hazard didefinisikan :
Definisi 2.5
Fungsi hazard didefinisikan sebagai tingkat kematian sesaat suatu individu pada waktu .
(Kleinbaum dan Klein, 2005) Misal, probabilitas variabel random berada antara dan , dengan syarat
lebih besar atau sama dengan , ditulis sebagai berikut :
Maka fungsi hazard yang didapat adalah
{ | }
{ }
{ }
atau dapat juga ditulis sebagai berikut :
{ }
(2.3) karena sehingga diperoleh
{
}
{
}
{
}
* ∫ + (2.4)
dengan ∫ disebut fungsi hazard kumulatif
(Collet, 1994).
2.5 Distribusi Weibull
Fungsi kepadatan peluang (fkp) dari distribusi Weibull dua parameter, diformulasikan sebagai :
, ( ) - (2.5) dengan :
(Lawless, 2003) Jika maka fungsi kepadatan peluang (fkp) dari waktu survival
yang berdistribusi weibull dengan dua parameter adalah
(2.6)
dengan :
Berdasarkan fkp dalam persamaan (2.6), diperoleh fungsi distribusi kumulatif weibull adalah sebagai berikut :
Sehingga persamaan (2.2) fungsi survivalnya dapat dituliskan sebagai berikut :
maka diperoleh fungsi hazard weibull :
(2.7)
(Collet, 1994)
Dalam kehidupan nyata khususnya di dunia medis, banyak situasi yang melibatkan populasi heterogen, sehingga penting untuk mempertimbangkan hubungan waktu tahan hidup dengan faktor lain. Satu-satunya jalan untuk menguji hubungan dari variabel bebas yang sesuai dengan waktu tahan hidup yaitu menggunakan model regresi, dimana ketergantungan waktu tahan hidup pada variabel yang sesuai dengan tegas dikenali.
2.6 Model Regresi dalam Analisi Data Uji Hidup
Dalam analisis data uji hidup terdapat dua model regresi yang sering digunakan untuk menganalisis data survival yaitu :
2.6.1 Model Proporsional Hazard untuk T
Model proporsional hazard merupakan model yang mengasumsikan bahwa perbedaan antar individu dalam sekelompok data yang hendak dianalisis mempunyai fungsi hazard yang proporsional satu sama lain. Hal ini berarti bahwa rasio ⁄ merupakan fungsi hazard dari dua individu dengan vektor regresi tidak tergantung pada Dengan kata lain fungsi hazard untuk , dengan
(2.8) dengan merupakan fungsi hazard dasar (baseline hazard functio) dan merupakan fungsi yang menyatakan pengaruh terhadap hazard.
(Lawless, 1982)
2.6.2 Model Lokasi Skala untuk Log T.
Bagian terpenting kedua dari model regresi dalam analisis data uji hidup adalah log waktu tahan hidup , diberikan , mempunyai suatu distribusi dengan parameter lokasi dan parameter skala tetap dapat ditulis sebagai berikut :
, (2.9)
dimana dan galat model mempunyai distribusi yang independen terhadap . Biasanya memiliki distribusi normal standart.
(Lawless, 1982)
Kedua model diatas merupakan model yang digunakan untuk menganalisis data survival secara umum, namun bila ada variabel-variabel bebas yang ingin dikontrol atau bila menggunakan beberapa variabel penjelas untuk menjelaskan hubungan antara waktu survival, maka regresi Cox lah yang digunakan.
2.6 Model Regresi Cox Proporsional Hazard
digunakan untuk menganalisis kematian atau harapan hidup seseorang. Namun seiring perkembangan zaman pemodelan ini banyak dimanfaatkan diberbagai bidang. Diantaranya bidang akademik, kedokteran, sosial, science, teknik, pertanian dan sebagainya.
Ketika menyelidiki suatu kasus dibidang kedokteran contohnya kasus pasien penderita penyakit tertentu, dibutuhkan hubungan waktu survival pasien dengan karakteristik-karakteristik klinis lainnya yang didapat dari data medis pasien.
Formula model Cox merupakan perkalian dari dua besaran yaitu fungsi
baseline hazard dan bentuk eksponensial untuk penjumlahan linier dari yaitu penjumlahan dari variabel independen (Kleinbaum dan Klein, 2005).
Model regresi Cox ini berlaku pada situasi dimana resiko kematian pada waktu tertentu tergantung pada nilai-nilai dari variabel bebas
Himpunan nilai variabel bebas dari model proporsional hazard dapat dinyatakan dengan x, sehingga )’. Model proporsional hazard untuk pengamatan ke- dari individu secara umum :
(2.10)
dengan merupakan vektor dari variabel bebas, dan
merupakan vektor dari koefisien regresi. Sedangkan merupakan fungsi
hazard untuk individu yang mana semua nilai variabel bebasnya memmuat vektor x sama dengan nol, dinamakan hazard dasar (baseline hazard function).
Metode estimasi yang digunakan dalam skripsi ini adalah metode estimasi
maximum likelihood. Ketika menggunakan metode ini, hal yang harus diketahui adalah tentang fungsi likelihood.
2.8 Fungsi Likelihood
Definisi 2.6
Misalkan adalah variabel random yang identik dan independen dari suatu distribusi dengan fungsi kepadatan peluang (fkp) untuk dan adalah ruang parameter. Fkp bersama antara adalah . Jika fkp bersama tersebut dinyatakan sebagai fungsi terhadap maka dinamakan fungsi
likelihood (L)yang dinyatakan sebagai :
(Hogg dan Craig, 1978) Definisi 2.7
Pada kasus dimana terdapat satu atau lebih data survival yang tersensor tipe II, maka fungsi likelihood-nya dapat dituliskan sebagai :
| ∏
dengan menyatakan data waktu survival, menyatakan jumlah kematian / kerusakan yang diinginkan dalam pengujian dan menyatakan banyaknya data yang sedang diuji.
Setelah mendapatkan fungsi likelihood, langkah selanjutnya dalam estimasi parameter menggunakan MLE adalah mendapatkan nilai maksimum
likelihood.
2.9 Maksimum Likelihood Estimator (MLE)
Definisi 2.8
Jika statistik ̂ memaksimumkan fungsi likelihood maka statistik ̂ dinamakan
maksimum likelihood estimator (MLE) dari .
(Hogg and Craig, 1978)
Karena fungsi survival merupakan dasar dari analisis data tahan hidup. Maka ketika menggunakan model regresi Cox proporsional dengan hazard dasar Weibull sebagai asumsi, maka hal yang harus dilakukan adalah mengestimasi fungsi survival.
2.10 Estimasi Fungsi Survival
Estimasi fungsi survival dasar dari model regresi Cox dengan hazard dasar weibull dapat diperoleh dengan persamaan berikut :
̂ ̂ ̂ (2.12)
Estimasi fungsi hazard dasar kumulatif dari model regresi Cox dengan hazard dasar weibull dapat diperoleh dengan persamaan sebagai berikut :
Dari estimasi fungsi survival dasar dan fungsi hazard dasar kumulatif diatas maka dapat diperoleh estimasi fungsi survival pengamatan ke- dan fungsi
hazard kumulatif pengamatan ke- , yaitu :
̂ ̂ ̂ , (2.14)
dan
̂ [ ̂ ] ̂ (2.15)
(Collet, 1994)
Setelah fungsi survival didapat, maka model secara langsung juga akan didapatkan. Untuk menguji kesesuaian model dilakukan pengujian terhadap residual dari setiap pengamatan menggunakan residual Cox Snell.
2.11 Residual Cox – Snell
Setelah suatu model didapat, perlu dilakukan pemeriksaan terhadap kesesuaian dari model tersebut. Banyak prosedur pemeriksaan model yang digunakan, salah satunya residual Cox snell. Residual Cox snell untuk individu ke- dengan diberikan berikut :
̂ ( ̂ ) (2.16)
hazard kumulatif dan fungsi survival untuk individu ke- pada waktu Model dikatakan layak jika nilai residual Cox-Snell berdistribusi eksponensial.
(Collet, 1994) Teorema 2.1 :
Jika T merupakan variabel random dari waktu survival setiap pengamatan dan merupakan fungsi survival, maka varabel random berdistribusi eksponensial (Collet, 1994).
Bukti teorema 2.1 :
{ }
Fungsi densitas probabilitas dari variabel random diberikan sebagai berikut :
{ } { }
Terbukti bahwa variabel random berdistribusi eksponensial.
Ketika mengestimasi parameter, terdapat kemungkinan bahwa estimasi tersebut tidak diperoleh secara langsung seperti adanya fungsi implisit, oleh karena itu diperlukan suatu metode numerik untuk mendapatkan nilai estimator. Salah satu metode yang digunakan untuk mendapatkan nilai estimator adalah metode Newton Raphson.
2.12 Metode Newton – Raphson
Misalkan terdapat bentuk implisit dari dengan maka iterasi Newton Raphson adalah sebagai berikut :
(2.17)
dengan ( ) maka
( ) dan
[ ]
dengan :
adalah vektor berukuran pada iterasi ke . matrik jacobian pada saat .
Adapun langkah-langkah dalam metode Newton Raphson adalah sebagai berikut : 1. Menentukan nilai awal estimator untuk
2. Menentukan .
3. Menghitung estimator berikutnya menggunakan (2.17).
4. Mengulangi iterasi sampai diperoleh nilai max | |
dengan adalah konstanta positif yang ditentukan.
(Lee dan Wang, 2003)
Nilai estimator parameter yang di dapatkan merupakan nilai yang dapat memaksimumkan fungsi likelihood, untuk memperoleh hal itu banyak ketentuan yang harus dipenuhi salah satunya mengenai titik maksimum. Selain itu, ketika menggunakan metode numerik, ketentuan yang harus dipenuhi adalah mendapatkan nilai eigen matrik hessian.
2.13 Titik Maksimum
Jika fungsi mempunyai titik maksimum di
maka
(Bacon, 1985) Matrik hessian adalah matrik simetri A yang berisi persilangan turunan
maksimum dari fungsi adalah jika matrik hessian merupakan matrik definit negatif.
(Jong dan Heller, 2008)
Ketentuan tentang matrik definit negatif adalah sebagaimana teorema dibawah ini :
2.14 Matrik Definite Negatif Teorema 2.2
Sebuah matrik simetri A disebut definit negatif jika dan hanya jika semua nilai eigen dari matrik A bernilai negatif.
Bukti Teorema 2.2 ( Lihat hal 709)
(Anton dan Rorres, 2005)
Untuk menerapkan semua algorima dalam pengestimasian program, diperlukan suatu software khusus yang memungkinkan membuat program sendiri. Salah satu software yang mampu membuat program sendiri adalah S-Plus.
2.15 S-PLUS
a.function(...)
function digunakan untuk menunjukkan fungsi yang akan digunakan dalam program.
bentuknya adalah : function(...) b. length(....)
length(...) merupakan perintah untuk menunjukkan banyaknya data. c. matrix(....)
untuk membentuk sebuah matrik yang anggotanya a dengan jumlah baris sebanyak b dan jumlah kolom sebanyak c.
d. for(....)
untuk melakukan pengulangan sebanyak n kali. Bentuknya adalah ; for(...)
e. abs(....)
untuk membuat harga mutlak dari suatu bilangan. Bentuknya adalah : abs(...)
f. sum(...)
untuk menjumlahkan semua bilangan anggota dari suatu vektor. Bentuknya adalah : sum(...)
(Everitt , 1944)
2.16 Cardiovascular Diseases (CVD)
2.16.1 Pengertian
CVD atau Cardiovascular Diseases merupakan permasalahan yang sangat menarik untuk diteliti. Fakta dari WHO menyebutkan bahwa CVD merupakan penyebab utama kematian diseluruh dunia, yang mengakibatkan 17,5 juta kematian setiap tahunnya. Sebanyak 7,6 juta orang meninggal karena serangan jantung dan 5,7 juta meninggal karena stroke setiap tahunnya. Kematian global akibat penyakit kardiovaskular diperkirakan mencapai sekitar 25 juta orang pada tahun 2020.
Cardiovascular Diseases adalah istilah bagi serangkaian gangguan yang menyerang jantung (kardio) dan pembuluh darah (vaskular), termasuk penyakit jantung koroner, penyakit serebravaskular, dan penyakit vaskular porifer. Penyakit kardiovaskular juga mencakup penyakit lain seperti kerusakan jantung. Penyakit kardiovaskular berhubungan dengan kondisi serangan jantung , angina dan stroke.
(Medicastore, 2008)
2.16.2 Faktor Resiko
Faktor resiko adalah faktor yang meningkatkan terjadinya sesuatu. Didalam suatu studi medis, mengamati faktor resiko untuk mengurangi akibat negatif dari suatu penyakit adalah yang paling efektif untuk dilakukan. Faktor risiko ini dibagi menjadi dua kelompok, yang dapat dikendalikan dan yang tidak dapat dikendalikan.
hidup (kurang gerak, merokok, konsumsi alkohol berlebihan). Sementara faktor risiko yang tidak dapat dikendalikan meliputi usia, jenis kelamin, dan riwayat penyakit kardiovaskular dalam keluarga.
(Mediastore, 2008) Adapun beberapa faktor resiko yang dapat meningkatkan resiko kematian pada penderita CVD adalah :
a. Tipe Penyakit Kardiovaskular
Konsekuensi langsung dari penyakit kardiovaskular adalah serangan stroke. Badan Kesehatan Dunia (WHO), memperkirakan penyakit kardiovaskular menjadi penyebab kematian nomor satu di seluruh dunia. Ada berbagai jenis penyakit kardiovaskular yang harus diwaspadai yaitu : serangan jantung, angina (nyeri dada), dan stroke.
b. Usia
c. Jenis kelamin
Pada umumnya lelaki memiliki resiko kematian akibat CVD lebih besar dari pada wanita sebelum menopausal, namun resiko kematian pada wanita yang sudah menopaus sama seperti pada lelaki. Sebuah penelitian yang dilakukan oleh WHO menyatakan bahwa perbedaan resiko kematian akibat CVD terhadap pria dan wanita disebabkan oleh perbedaan hormon. Untuk kebanyakan kasus, resiko kematian akibat CVD banyak menyerang para lelaki dibanding wanita. Karena pada wanita, hormon estrogen adalah hormon yang sangat dominan. Estrogen mampu melindungi tubuh seorang wanita dari efek dari metabolisme glukosa yang berlebihan, namun hormon estrogen yang dimiliki wanita ini menurun setelah terjadi menopause sehingga resiko kematian akibat CVD jadi semakin besar.
d. Smoke
e. BMI (Body Mass Indeks)
BMI dihitung sebagai berat badan dalam kilogram (kg) dibagi tinggi badan dalam meter dikuadratkan ( ) dan tidak terkait pada jenis kelamin. BMI secara signifikan berhubungan dengan kadar lemak tubuh. Saat ini, BMI secara internasional diterima sebagai alat untuk mengidentifikasikan kelebihan berat badan dan besitas. Orang-orang dengan BMI lebih yaitu kelebihan berat badan dan obesitas pada hakekatnya meningkatkan morbiditas dan mortalitas akibat hipertensi, stroke, penyakit jantung koroner, dyslipidemia dan diabetes mellitus tipe 2 (Hill,2005).
f. SBP (Sistole Blood Pressure)
Tekanan darah merujuk kepada tekanan yang dialami darah pada pembuluh arteri darah ketika darah di pompa oleh jantung ke seluruh anggota tubuh. Tekanan darah dibuat dengan mengambil dua ukuran dan biasa diukur seperti berikut - 120 /80 mmHg. Nomor atas (120) menunjukkan tekanan ke atas pembuluh arteri akibat denyut jantung, dan disebut tekanan sistole. Tekanan darah sistole digunakan untuk mendeteksi penyakit kardiovaskular sejak dini. Semakin tinggi tekanan darah sistole, maka resiko kematian akan semakin besar. Karena tekanan darah sistole yang tinggi bisa memicu hipertensi.
g. LACR (Logaritm of Albumin and Creatin)
h. LTG (Logaritm of Trigliserin)
Trigliserin merupakan penyusun utama minyak nabati dan lemak hewani. Jadi dengan mengetahui kandungan trigliserin dalam tubuh , maka dapat digunakan untuk mengontrol kelebihan kolesterol untuk mengurangi resiko terkena CVD. Semakin tinggi level trigliserin dalam darah dapat meningkatkan resiko penyakit CVD.
i. HTN (Hipertensi Status)
Tekanan darah tinggi atau Hipertensi adalah kondisi medis dimana terjadi peningkatan tekanan darah secara kronis (dalam jangka waktu lama). Penderita yang mempunyai sekurang – kurangnya tiga bacaan tekanan darah yang melebihi 140/90 mmHg saat istirahat diperkirakan mempunyai tekanan darah tinggi. Menurut WHO, Tekanan darah yang selalu tinggi adalah salah satu faktor untuk stroke, serangan jantung, gagal jantung, dan aneurisma arterial, dan merupakan penyebab utama gagal ginjal kronis.
j. DM (Diabetes Status)
2.17 Interpretasi Model Proporsional Hazard
Diketahui fungsi hazard model proporsional hazard adalah :
jika kita notasikan log natural dari fungsi hazard sebagai . Maka kita akan memperoleh bentuk log natural fungsi hazard sebagai berikut :
[ ]
Perbedaan fungsi log-hazard untuk perubahan dari suatu bentuk menjadi adalah :
[ ] [ ] { [ ] } { [ ] }
Log hazard adalah bentuk fungsi yang cocok digunakan untuk mengetahui efek perubahan pada variabel prediktor. Untuk mempermudah perhitungan, kita bisa menggunakan Hazard Ratio (HR) seperti bentuk dibawah ini :
[ ]
Interpretasi koefisien untuk variabel kontinu adalah mengubah fungsi log-hazard dengan mengubah unit dari variabel kontinu menggunakan persamaan (2.19) . Dengan dan , sehingga diperoleh perubahan fungsi log-hazard sebagai berikut :
dengan menggunakan persamaan (2.20), maka diperoleh estimator hazard ratio sebagai berikut :
̂
Interpretasi dari nilai estimator diatas adalah resiko kematian variabel akan
bertambah sebesar untuk setiap pertambahan unit variabel.
BAB III
METODE PENELITIAN
Metode penelitian yang digunakan dalam penyusunan skripsi ini adalah sebagai berikut :
1. Menyajikan definisi-definisi yang berhubungan dengan model regresi Cox 2. Menentukan bentuk model regresi Cox proporsional dengan hazard dasar
weibull dengan langkah sebagai berikut : a. Menentukan fungsi hazard weibull.
b. Mendapatkan bentuk model regresi Cox proporsional dengan hazard dasar weibull.
c. Menentukan fungsi survival dan Probability Density Function model regresi Cox yang berhubungan dengan fungsi hazard weibull.
3. Menentukan estimator parameter dari model regresi cox dengan hazard dasar weibull menggunakan metode maksimum likelihood dengan langkah sebagai berikut :
a. Menentukan fungsi likelihood dari model regersi cox dengan hazard dasar weibull pada data tersensor tipe II.
b. Menentukan fungsi log-likelihood dari model regersi cox dengan hazard dasar weibull pada data tersensor tipe II.
c. Menentukan turunan pertama fungsi log-likelihood terhadap parameter dan .
e. Jika persamaan pada langkah c merupakan fungsi implisit, maka persamaan diselesaikan dengan menggunakan metode Newton Raphson.
4. Menyusun algoritma untuk mengestimasi parameter model regresi Cox dengan langakah sebagai berikut :
a. Menyusun algoritma untuk mendapatkan estimator parameter
pada model regresi Cox berdasarkan langkah-langkah yang
telah dibuat.
b. Menyusun algoritma untuk mendapatkan estimator residual Cox-Snell. 5. Menerapkan model regresi Cox pada data tahan hidup pasien
Cardiovaskular Diseases (CVD) dengan langkah-langkah sebagai berikut : a. Membuat program berdasarkan algoritma yang telah dibuat dalam
bahasa pemprograman yang ditulis dalah software S-Plus.
b. Inputkan data tahan hidup pasien penderita Cardiovascular Disease (CVD).
c. Menguji distribusi data tahan hidup pasien Cardiovascular Disease (CVD).
d. Estimasi parameter regresi dengan menggunakan program yang telah dibuat dalam software S-Plus.
e. Estimasi residual Cox-Snell dengan menggunakan program yang telah dibuat dalam software S-Plus.
BAB IV
PEMBAHASAN
Model regresi Cox merupakan model yang menggambarkan hubungan antara waktu survival sebagai variabel dependen dengan satu set variabel independen. Variabel independen ini bisa kontinu ataupun kategorik
Model Regresi Cox proporsional hazard untuk pengamatan ke- dari individu secara umum :
(4.1)
dengan merupakan vektor dari variabel bebas, dan merupakan vektor dari koefisien regresi. Sedangkan merupakan fungsi
hazard untuk individu yang mana semua nilai variabel bebasnya membuat vektor sama dengan nol, dinamakan hazard dasar (baseline hazard function).
4.1 Model Regresi Cox Dengan Hazard Dasar Weibull
4.1.1 Menentukan Fungsi Hazard Weibull
Sebelum membuat model regresi Cox proporsional dengan hazard dasar Weibull, terlebih dahulu harus mengetahui fungsi hazard Weibull. Menurut persamaan (2.6) Fungsi hazard dasar Weibull adalah sebagai berikut :
(4.2)
4.1.2 Mendapatkan Model Regresi Cox dengan Hazard Dasar Weibull
Sesuai dengan persamaan (2.10) maka model regresi Cox proporsional
hazard untuk pengamatan ke- dari individu secara umum adalah :
dengan merupakan baseline hazard dari distribusi tertentu. Jika baseline hazard yang digunakan adalah fungsi hazard dari distribusi Weibull, sesuai dengan persamaan (4.2), maka akan diperoleh model regresi Cox dengan hazard dasar Weibull sebagai berikut :
(4.3)
4.1.3 Menentukan Fungsi Survival dan Probability Density Function Model
Regresi Cox yang Berhubungan dengan Fungsi Hazard Weibull
Setelah diperoleh fungsi hazard yang berhubungan dengan hazard dasar Weibull, langkah berikutnya adalah menentukan fungsi survival model regresi Cox yang berhubungan dengan hazard dasar Weibull. Dengan menggunakan persamaan (2.4) maka diperoleh fungsi survival yang berhubungan dengan hazard dasar Weibull sebagai berikut :
Setelah diketahui fungsi hazard dan fungsi survival yang berhubungan dengan distribusi Weibull. Selanjutnya dapat diperoleh Probability Density Function (PDF) yang berhubungan dengan hazard dasar Weibull. Dengan menggunakan persamaan (2.3) diperoleh model regresi Cox proporsional dengan
hazard dasar Weibull sebagai berikut :
(4.5)
4.2 Estimasi Parameter dalam Model Regresi Cox
Untuk menentukan estimasi parameter dari model regresi Cox dengan
hazard dasar Weibull, metode yang digunakan adalah Maximum Likelihood Estimator (MLE), dengan langkah-langkahnya sebagai berikut :
4.2.1 Menentukan Fungsi Likelihood dari Model Regresi Cox dengan
Hazard Dasar Weibull pada Data Tersensor Tipe II.
Fungsi likelihood pada kasus data tersensor tipe II adalah sebagai berikut :
| ∏
dimana menyatakan waktu tahan hidup pasien yang diamati, menyatakan jumlah kematian atau kerusakan yang diinginkan dan menyatakan banyaknya data yang diamati. Fungsi likelihood untuk data tersensor tipe II dengan menggunakan hazard dasar Weibull.
Diketahui fungsi survival yang berhubungan dengan hazard dasar Weibull adalah
dan diketahui Probability Density Function (PDF) Weibull proporsional hazard adalah
. Sehingga diperoleh fungsi likelihoodnya adalah sebagai berikut : |
{∏ }
(4.7)
{ (∏
) ( (∑ )) (∑ ) }
(4.8) Setelah mendapatkan fungsi likelihood, langkah selanjutnya dalam estimasi parameter menggunakan metode maksimum likelihood adalah menentukan fungsi log likelihood. Alasan penggunaan fungsi log likelihood adalah karena perhitungan menggunakan fungsi log likelihood lebih sederhana sehingga memudahkan dalam perhitungan, selain itu hasil yang diperoleh melalui fungsi log likelihood tidak berbeda dengan hasil dari fungsi likelihood.
4.2.2 Menentukan Fungsi Log-Likelihood
( )
(∏
) ( ( (∑ [ ])))
( (∑ ))
( ) ( )
( ∑
) ( ∑ [ ])
(∑ )
(4.9) Setelah fungsi Log likelihood didapatkan, selanjutnya dapat dicari turunan pertama fungsi Likelihood sebagai syarat perlu memaksimumkan fungsi
likelihood.
4.2.3 Menentukan Turunan Pertama Fungsi Log-Likelihood terhadap
Parameter
Langkah pertama dalam estimasi parameter menggunakan MLE adalah menemukan turunan pertama fungsi log likelihood sebagai berikut :
1. Turunan pertama terhadap .
Misalkan merupakan parameter yang berupa matrik berukuran , maka fungsi log-likelihoodnya harus diturunkan terhadap semua elemen vektor parameter . Misalkan , maka turunan pertama log
( ) ∑
( ∑ [ ]
)
( ) ∑
( ∑ [ ]
)
( ) ∑
(∑ [ ]
)
( ) ( ) ∑
(∑ [ ]
)
Secara umum, turunan pertama log-likelihood terhadap , adalah :
( ) ∑
(∑ [ ]
)
2. Turunan pertama terhadap parameter
( )
(∑ [ ]
3. Turunan pertama terhadap parameter .
( ) ( ) ∑
(∑ [ ]
)
4.2.4 Mendapatkan estimator parameter .
Estimator MLE untuk parameter , untuk , diperoleh dengan cara menyamakan nol persamaan – persamaan dibawah sebagai syarat perlu untuk memaksimumkan fungsi log – likelihood-nya.
( ) ∑
(∑ [ ]
)
( ) (∑ [ ]
)
( ) ( ) ∑
(∑ [ ]
)
Ketiga persamaan diatas tidak dapat diselesaikan secara analistis, karena masih dalam bentuk implisit sehingga diperlukan metode lain untuk menyelesaikannya. Pada kesempatan ini digunakan metode Newton Raphson untuk mendapatkan nilai estimasi parameter .
( ) ( ) ( ) ( ) ( ) ( )
4.2.5 Menentukan Turunan Kedua Fungsi Log-Likelihood terhadap
Parameter .
1. Persamaan (4.17) diturunkan terhadap . Untuk
( ) [ ] [ ∑[ ]
]
(4.20)
(
) [ ] [ ∑[ ]]
(4.21)
( ) [ ] [ ∑[ ]
]
(4.22) Untuk
( ) [ ] [ ∑[ ]
]
(4.23)
( ) [ ] [ ∑[ ]
(4.24)
( ) [ ] [ ∑[ ]
]
(4.25) Untuk
( ) [ ] [ ∑[ ]
]
(4.26)
( ) [ ] [ ∑[ ]
]
(4.27)
( ) [ ] [ ∑[ ]
]
(4.28) Untuk
( ) [ ] [ ∑[ ]
]
(4.29)
( ) [ ] [ ∑[ ]
]
(
) [ ] [ ∑[ ]]
(4.31) Dari semua persamaan diatas diperoleh bentuk umum turunan kedua terhadap sebagai berikut :
( ) [ ] [ ∑[ ]
]
(4.32) 2. Turunan persamaan (4.18) terhadap parameter
( )
( )
∑[ ]
3. Turunan persamaan (4.19) terhadap parameter
( )
∑[ ]
( )
4. Persamaan (4.17) diturunkan terhadap parameter
( ) ∑[ ]
( ) ∑[ ]
(
) ∑[ ]
( ) ∑ [ ] (4.40)
Sehingga diperoleh bentuk umumnya
(
) ∑[ ]
5. Persamaan (4.17) diturunkan terhadap parameter
( )
∑[ ]
( )
∑[ ]
( )
∑[ ]
( )
∑[ ]
Sehingga diperoleh bentuk umumnya
( )
∑[ ]
4.3 Estimasi Residual Cox Snell
Log Cumulatif survival dari model regresi Cox dengan hazard dasar Weibull dapat diperoleh dengan persamaan sebagai berikut :
̂ ( ̂ ̂)
Log Cumulatif hazard dari model regresi Cox dengan hazard dasar Weibull dapat diperoleh dengan persamaan berikut :
Dari log Cumulatif survival dan fungsi hazard komulatif diatas maka dapat diperoleh log Cumulatif survival pengamatan ke-i dan fungsi hazard komulatif pengamatan ke-i, yaitu :
̂ ̂
atau
̂ ̂ ̂ ̂
dan
̂ [ ̂ ] ( )
Setelah model regresi Cox diperoleh, kelayakan dari model yang didapat perlu ditaksir dengan menggunakan residual Cox snell sebagai berikut :
̂ ̂ , (4.41) dengan ̂ merupakan log Cumulatif hazard pada waktu , dapat dicari dengan menggunakan persamaan (4.48). Selanjutnya model dikatakan layak apabila nilai residual Cox-snell berdistribusi eksponensial. Algoritma untuk memdapatkan estimator parameter diuraikan dibawah .
4.4 Algoritma untuk Mendapatkan Estimator Parameter Terdapat beberapa langkah yang digunakan untuk mendapatkan nilai estimator parameter dari model regresi Cox dan estimasi residual Cox snell, sebagai berikut :
b. Mendapatkan nilai estimator dengan menggunakan algoritma
newton raphson sebagai berikut :
1. Memasukkan data sekunder (data tahan hidup)
2. Ambil sebagai iterasi ke-0. Memasukkan nilai awal parameter , dalam bentuk persamaan sebagai berikut :
( )
3. Hitung fungsi sebagai berikut :
( ) ( )
( ) ( )
( ) ( )
( ) ( )
( ) ( )
maka dilanjutkan ke langkah (7), namun jika tidak maka proses diulang ke langkah (3) dengan mengambil .
7. Dapatkan nilai estimator ̂ .
4.5 Algoritma untuk Mendapatkan Estimator Residual Cox Snell Terdapat beberapa langkah yang digunakan untuk mendapatkan nilai estimator residual Cox snell, sebagai berikut :
a. Masukkan data sekunder (data tahan hidup)
b. Hitung nilai Estimasi residual Cox snell dengan persamaan (4.41) c. Jika nilai estimasi residual Cox snell berdistribusi eksponensial, maka
model regresi Cox dapat dikatakan layak.
Algoritma yang telah dibuat diatas, selanjutnya diterapkan pada program S-Plus sebagai berikut :
4.6 Program Estimasi Parameter Model Regresi Cox dengan Hazard
Dasar Weibull.
Penerapan algoritma pada program komputer dengan menggunakan paket program S-PLUS.
1. Program untuk turunan pertama.
2. Program untuk mendapatkan matrik jacobian. 3. Program untuk mendapatkan parameter . Dengan menggunakan program Newton Raphson
4. Memperoleh program untuk mendapatkan nilai residual Cox Snell.
4.7 Penerapan pada Kasus Data Tahan Hidup
Data yang akan diterapkan pada program adalah data sekunder hasil penelitian tentang waktu tahan hidup pasien penderita cardiovascular disease (CVD) (Lee.T, 2003), data ini terlampir dalam bentuk tabel pada Lampiran 1.
Permasalahan yang akan diselesaikan adalah membuat suatu model regresi Cox dari data pasien CVD. Adapun variabel dari penelitian ini adalah variabel T yaitu waktu tahan hidup 21 orang pasien CVD mulai dari terdiaknosa sampai dia meninggal dengan hanya mengambil 10 kematian pertama penderita CVD. Sedangkan variabel bebasnya adalah jenis CVD (DG), umur pasien (AGE) , jenis kelamin pasien (SEX), intensitas merokok (SMOKE), indeks massa tubuh (BMI), tekanan darah sistole (SBP), logaritme albumin dan kreatin (LACR), logaritme trigliserin (LTG), status hipertensi (HTN), dan status diabetes (DM).
Setelah data diperoleh, langkah selanjutnya adalah menguji kesesuaian distribusi pada data. Pengujian dilakukan dengan menggunakan software StatGraphic Centurion.
4.7.1 Uji Kesesuaian Distribusi Weibull pada Data Waktu Tahan hidup Pasien Cardiovascular Disease (CVD)
Uji yang dilakukan untuk mengetahui apakah distribusi dari waktu tahan hidup pasien penderita penyakit kardiovaskuler berdistribusi Weibull atau tidak adalah dengan menggunakan software dengan taraf kepercayaan 95%. Hipotesisnya adalah sebagai berikut :
Distribusi waktu tahan hidup pasien penderita penyakit kardiovaskular bukan Weibull
dengan ketentuan
 Jika p-value (nilai probabilitas) data tersebut (tingkat kesalahan 5%), maka distribusi waktu tahan hidup pasien penyakit kardiovaskuler adalah Weibull.
 Jika p-value data tersebut < 0,05, maka distribusi waktu tahan hidup pasien penyakit kardiovaskuler bukan Weibull.
Pada lampiran 2, dapat dilihat bahwa p-value untuk data tersebut adalah sebesar 0,875969. Dengan tingkat kesalahan 5% dapat dikatakan bahwa distribusi waktu tahan hidup pasien penyakit kardiovaskuler adalah Weibull.
Setelah data berdistribusi weibull didapatkan, langkah yang harus dilewati sebelum menggunakan model hazard proporsional adalah pemeriksaan asumsi proporsional hazard. Asumsi proporsional hazard menyatakan bahwa fungsi
hazard untuk kategori yang berbeda pada variabel bebas harus proporsional pada setiap waktu.
4.7.2 Asumsi Hazard Proporsional
Jenis penyakit CVD yang diderita pasien terbagi menjadi dua kategori yaitu kategori 1 untuk pasien yang menderita penyakit stroke, dan kategori 2 untuk pasien yang menderita penyakit coronari heart diseases. Adapun tabel pengkategorian dapat dilihat pada tabel 4.1.
Tabel 4.1 Nilai-nilai penduga Kaplan Meier dari fungsi Survival
variabel Jenis penyakit (DG)
Gambar 4.1 Plot Asumsi Hazard Proporsional Variabel DG
Plot pada gambar 4.1 menunjukkan bahwa plot antara log Cumulatif hazard terhadap log (waktu tahan hidup) tidak menghasilkan garis paralel (sejajar kasar) untuk setiap kategori pada variabel DG. Oleh karena itu pemodelan dengan menggunakan model regresi Cox tidak dapat dilakukan.
b. Umur Pasien
Umur pasien terbagi menjadi 2 kategori yaitu kategori 1 untuk pasien yang berumur < 70 tahun dan kategori 2 untuk pasien yang berumur diatasnya. Adapun tabel pengkategorian dapat dilihat pada tabel 4.2
Tabel 4.2 Nilai-nilai penduga Kaplan Meier dari fungsi Survival
variabel Usia (AGE) AGE = 1
( ) ̂ ̂ 1,1 0,041
1,3 0,114
2,9 0,462 3 0,477
3,2 0,505
AGE = 0
( ) ̂ ̂ 2 0,301
2,1 0,322
2,6 0,415 2,7 0,431
3,3 0,519
Berikut merupakan plot kaplan-meier antara log dan log Cumulatif
Gambar 4.2 Plot Asumsi Hazard Proporsional Variabel AGE
Plot pada gambar 4.2 menunjukkan bahwa plot antara fungsi hazard terhadap t (waktu tahan hidup) tidak menghasilkan garis paralel (sejajar kasar) untuk setiap kategori pada variabel AGE. Oleh karena itu pemodelan dengan menggunakan model regresi Cox tidak dapat dilakukan.
c. Jenis Kelamin (SEX)
Jenis Kelamin Pasien terbagi menjadi dua kategori yaitu kategori 1 untuk pasien berjenis kelamin laki-laki dan kategori 0 untuk pasien berjenis kelamin perempuan. Adapun tabel pengkategorian dapat dilihat pada tabel 4.3
Tabel 4.3 Nilai-nilai penduga Kaplan Meier dari fungsi Survival
variabel Jenis kelamin (SEX)
( ) ̂ ̂
Gambar 4.3 Plot Asumsi Hazard Proporsional Variabel SEX
Plot pada gambar 4.3 menunjukkan bahwa plot antara fungsi hazard terhadap log (waktu tahan hidup) tidak menghasilkan garis paralel (sejajar kasar) untuk setiap kategori pada variabel SEX. Oleh karena itu pemodelan dengan menggunakan model regresi Cox tidak dapat dilakukan.
d. Intensitas Merokok (SMOKE)
Intensitas merokok terbagi juga kedalam dua kategori yaitu kategori 1 untuk pasien yang merokok dan kategori 0 untuk pasien yang tidak merokok. Adapun tabel pengkategorian dapat dilihat pada tabel 4.4
log t
Tabel 4.4 Nilai-nilai penduga Kaplan Meier dari fungsi Survival
Gambar 4.4 Plot Asumsi Hazard Proporsional Variabel SMOKE