• Tidak ada hasil yang ditemukan

ANALISIS REGRESI COX PROPORSIONAL DENGAN HAZARD DASAR WEIBULL PADA DATA TERSENSOR TIPE II SKRIPSI

N/A
N/A
Protected

Academic year: 2019

Membagikan "ANALISIS REGRESI COX PROPORSIONAL DENGAN HAZARD DASAR WEIBULL PADA DATA TERSENSOR TIPE II SKRIPSI"

Copied!
135
0
0

Teks penuh

(1)

ANALISIS REGRESI COX PROPORSIONAL DENGAN HAZARD DASAR WEIBULL PADA DATA TERSENSOR TIPE II

SKRIPSI

JATU HERLINA AMURWANI

PROGRAM STUDI S-1 MATEMATIKA DEPARTEMEN MATEMATIKA FAKULTAS SAINS DAN TEKNOLOGI

(2)

ANALISIS REGRESI COX PROPORSIONAL DENGAN HAZARD DASAR WEIBULL PADA DATA TERSENSOR TIPE II

SKRIPSI

Sebagai Salah Satu Syarat Untuk Memperoleh Gelar Sarjana Sains Bidang Matematika

Pada Fakultas Sains Dan Teknologi Universitas Airlangga

Disetujui oleh

Pembimbing 1

Toha Saifudin,S.Si,M.Si NIP. 19750106 199903 1 002

Pembimbing II

(3)

LEMBAR PENGESAHAN NASKAH SKRIPSI

Judul : Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II Penyusun : Jatu Herlina Amurwani

Nomor Induk : 080810555 Tanggal Ujian : 18 Juni 2012

Disetujui oleh : Pembimbing 1

Toha Saifudin,S.Si,M.Si NIP. 19750106 199903 1 002

Pembimbing II

Drs. Suliyanto, M.Si NIP. 19650907 199102 1 001

Mengetahui :

Ketua Program Studi S-1 Matematika Departemen Matematika Fakultas Sains dan Teknologi

Universitas Airlangga

Dr. Miswanto

(4)

PEDOMAN PENGGUNAAN SKRIPSI

(5)

KATA PENGANTAR

Assalamu’alaikum warahmatullahi wabarakatuh.

Alhamdulillahirobbil alamin, berkat rahmat Allah yang telah memberikan petunjuk dan bimbingan-Nya yang tiada tara, sehingga penulis dapat menyelesaikan skripsi dengan judul ”Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II ”.

Dalam penyusunannya, penulis memperoleh banyak bantuan dari berbagai pihak, karena itu penulis mengucapkan terima kasih yang sebesar-besarnya kepada :

1. Dr. Miswanto, M.Si., selaku Ketua Prodi S-1 Matematika serta dosen penguji yang telah memberikan arahan dan bimbingan kepada penulis. 2. Toha Saifudin, S.Si, M.Si selaku dosen pembimbing I yang telah

memberikan banyak arahan, masukan, perhatian, semangat, rasa sabar yang begitu besar dan pengetahuan yang tidak ternilai harganya.

3. Suliyanto, M.Si. selaku dosen pembimbing II yang telah memberikan banyak arahan, masukan, waktu, tenaga dan pikiran.

4. Ir. Elly Ana, M.Si., selaku dosen penguji yang telah memberikan banyak saran untuk kesempurnaan skripsi ini.

5. Dra. Utami Dyah P, M.Si selaku dosen wali selama menjadi mahasiswa Fakultas Sains dan Teknologi Universitas Airlangga yang telah banyak memberikan arahan dan saran demi kesuksesan menjadi mahasiswa Matematika. Serta seluruh dosen Matematika Universitas Airlangga, terima kasih untuk segala ilmu yang diberikan.

6. Untuk Kedua Orang Tuaku tercinta dan ketiga adikku yang telah memberikan dukungan, semangat, kerpercayaan serta cinta dan kasih sayang yang begitu besar. Semoga saya selalu bisa membanggakan kalian.

7. Untuk Varian Luthfan yang telah setia menjadi seorang teman, sahabat, pemberi motivasi serta semangat yang tak pernah henti. Terima kasih atas segala perhatian dan nasehat-nasehatnya selama ini.

8. Arek-arek GP++ : Ragil, Rika, Dilphi, Mita, Wewe, Dinda, Lia, Tika, Vita, dan Michelle, terima kasih atas semua dukungan, canda tawa dan kenangan manis selama ini, semuanya tidak akan pernah terlupakan sampai kapanpun. Love you All.

(6)

Arindha & Lia “Temen Seperjuangan” Semangat kawan ayo wisuda bareng, Beta “Bebeb” Jangan kebanyakan nonton drama korea sedih ya. Untuk Efinda & Daris, Mega & D’Nita, Terima kasih atas dukungan, kebersamaan dan canda tawa selama ini.

10. Rekan-rekan mahasiswa Matematika Universitas Airlangga 2008, terima kasih atas kebersamaan selama ini.

11. Serta pihak-pihak lain yang tidak dapat disebutkan satu persatu, terima kasih atas segala bantuan dalam penyelesaian skripsi ini.

Penulis menyadari bahwa skripsi ini masih banyak terdapat kekurangan-kekurangan. Oleh karena itu, penulis mengharapkan kritik dan saran yang membangun agar skripsi ini dapat lebih baik lagi.

Surabaya, Juni 2012 Penyusun

(7)

Jatu Herlina Amurwani. 2012. Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II. Skripsi ini dibawah bimbingan Toha Saifudin S.Si, M.Si dan Drs. Suliyanto, M.Si. Departemen Matematika. Fakultas Sains dan Teknologi Universitas Airlangga.

ABSTRAK

Model regresi Cox proporsional merupakan model yang menggambarkan hubungan antara waktu survival sebagai variabel dependen dengan satu set variabel independen yang bisa kontinue ataupun kategorik. Secara umum bentuk model regresi Cox Proporsional dengan hazard dasar weibull adalah :

( ) ( )

dengan merupakan vektor dari variabel independen, merupakan vektor

dari koefisien regresi, dan merupakan hazard dasar dari distribusi Weibull. Tujuan tulisan ini adalah mendapatkan estimator parameter regresi Cox dengan hazard dasar weibull pada data tersensor tipe II. Metode yang digunakan untuk mengestimasi parameter model adalah Maximum Likelihood. Estimator parameter regresi Cox dengan hazard dasar weibull pada data tersensor tipe II masih dalam bentuk implisit, sehingga diperlukan metode numerik untuk menyelesaikannya. Model selanjutnya diterapkan pada studi kasus pasien penderita Cardiovascular Diseases. Persamaan model regresi Cox proporsional dengan hazard dasar weibull pada data tersensor tipe II, hasil penerapan pada pasien penderita Cardiovascular Diseases adalah sebagai berikut :

̂ ( ) ( )( ) (

)

dengan adalah Sistolic Blood Pressure dan adalah Logaritm of Urinary Albumin and Creatin. Nilai residual Cox-snell dari model tersebut berdistribusi eksponensial, sehingga dapat dikatakan model yang didapat sesuai atau tepat. Berdasarkan persamaan tersebut, diketahui bahwa resiko kematian pasien akan bertambah sebesar untuk setiap kenaikan SBP sebesar 10 satuan. Sedangkan untuk variabel LACR, resiko kematian pasien akan bertambah sebesar 0,256563 untuk setiap kenaikan LACR sebesar 2 satuan.

(8)

Jatu Herlina Amurwani. 2012. Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II. This skripsi in under the guidance by Toha Saifudin S.Si, M.Si and Drs. Suliyanto, M.Si. Mathematics departement of Scince and Technology Faculty. Airlangga University.

ABSTRACT

Cox proportional regression model is a model that describes the relationship between survival times as the dependent variable with a set of independent variables, which can be continuous or categorical. In general, the form of Cox proportional regression model with the baseline hazard Weibull is

( ) ( )

where is a vector of independent variables, is vector of regression coefficients, and are the baseline hazard of the Weibull distribution. The

purpose of this paper is to obtain estimators Cox regression parameter with Weibull as the baseline hazard for type II censored.The method used to estimate the model is the Maximum Likelihood Estimator. The model was applied to case studies of patients with Cardiovascular Diseases. The equation of Cox proportional hazard in patients with Cardiovascular Diseases are as follows :

̂( ) ( )( ) (

)

where is Sistolic Blood Pressure and is Logaritm of Urinary Albumin and Creatine. Cox-Snell residual value of this model is distributed exponentially, so that it can be said that the model fit or just gained. Based on the results, it is known that the risk of dying patients would increase by 0.751572 for each increase in SBP of 10 units. While for the variable LACR, the risk of dying patients would increase by 0.256563 for each increase by 2 units LACR.

(9)

DAFTAR ISI

Halaman

LEMBAR JUDUL ... i

LEMBAR PERNYATAAN ... ii

LEMBAR PENGESAHAN ... iii

LEMBAR PEDOMAN PENGGUNAAN SKRIPSI ... iv

KATA PENGANTAR ... v

ABSTRAK ... vii

DAFTAR ISI ... ix

DAFTAR GAMBAR ... xii

DAFTAR TABEL ... xiii

DAFTAR LAMPIRAN ... xiv

BAB I PENDAHULUAN ... 1

1.1 Latar Belakang Permasalahan ... 1

1.2 Rumusan Masalah ... 4

1.3 Tujuan ... 4

1.4 Manfaat ... 5

1.5 Batasan Masalah ... 5

BAB II TINJAUAN PUSTAKA ... 6

2.1 Analisis Regresi ... 6

2.2 Analisis Data Uji Hidup ... 7

2.3 Tipe Penyensoran ... 8

2.4 Fungsi Survival dan Fungsi Hazard ... 9

2.5 Distribusi Weibull ... 13

2.6 Model Regresi Dalam Analisis Data Uji Hidup ... 14

(10)

2.8 Fungsi Likelihood ... 17

2.9 Maximum Likelihood Estimator ... 18

2.10 Estimasi Fungsi Survival ... 18

2.11 Residual Cox – Snell ... 19

2.12 Metode Newton Rapshon ... 21

2.13 Titik Maksimum ... 22

2.14 Matrik Definit Negatif ... 23

2.15 S-Plus ... 23

2.16 Cardiovascular Diseases ... 25

2.17 Interpretasi Model Proporsional Hazard ... 30

BAB III METODE PENELITIAN ... 32

BAB IV PEMBAHASAN ... 34

4.1 Model Regresi Cox dengan Hazard Dasar Weibull ... 34

4.1.1 Menentukan Fungsi Hazard Dasar Weibull ... 35

4.1.2 Mendapatkan Model Regresi Cox dengan Hazard Dasar Weibull ... 35

4.1.3 Menetukan Fungsi Survival dan PDF yang berhubungan dengan Hazard Dasar Weibull ... 35

4.2 Estimasi Parameter dalam Model Regresi Cox ... 36

4.2.1 Menentukan Fungsi Likelihood dari Model Regresi Cox dengan Hazard Dasar Weibull... 36

4.2.2 Menentukan Fungsi Log-Likelihood ... 37

4.2.3 Menentukan Turunan Pertama Fungsi Log Likelihood Terhadap Parameter ... 38

4.2.4 Mendapatkan Estimator Parameter ... 39

4.2.5 Menentukan Turunan Kedua Fungsi Log Likelihood ... 40

4.3 Estimasi Residual Cox – Snell ... 45

(11)

4.5 Algoritma untuk Estimasi Residual Cox – Snell ... 49

4.6 Program Estimasi Parameter Model Regresi Cox dengan Hazard Dasar Weibull... 49

4.7 Penerapan Pada Kasus Data Uji Hidup ... 50

4.7.1 Uji Kesesuaian Distribusi Weibull pada data waktu Tahan Hidup pasien Cardiovascular Disease ... 50

4.7.2 Asumsi Hazard Proporsional ... 51

4.7.3 Estimasi Parameter ... 65

4.7.4 Model Regresi Cox Proporsional untuk Data CVD ... 67

4.7.5 Uji Residual Cox – Snell ... 68

4.7.6 Resiko Kematian Pasien Cardiovascular Disease ... 69

BAB V KESIMPULAN ... 71

(12)

DAFTAR GAMBAR

Nomor Judul Gambar Halaman

2.1 Kurva Fungsi Survival ... 10

2.2 Kurva Distribusi Kumulatif Weibull ... 13

4.1 Plot Asumsi Hazard Proporsional Variabel DG ... 52

4.2 Plot Asumsi Hazard Proporsional Variabel AGE ... 54

4.3 Plot Asumsi Hazard Proporsional Variabel SEX ... 55

4.4 Plot Asumsi Hazard Proporsional Variabel SMOKE ... 56

4.5 Plot Asumsi Hazard Proporsional Variabel BMI ... 58

4.6 Plot Asumsi Hazard Proporsional Variabel SBP ... 59

4.7 Plot Asumsi Hazard Proporsional Variabel LACR ... 60

4.8 Plot Asumsi Hazard Proporsional Variabel LTG ... 62

4.9 Plot Asumsi Hazard Proporsional Variabel HTN ... 63

(13)

DAFTAR TABEL

Nomor Judul Tabel Halaman

4.1 Nilai-nilai penduga Kaplan Meier dari fungsi Survival

variabel Jenis penyakit (DG) ... 52 4.2 Nilai-nilai penduga Kaplan Meier dari fungsi Survival

variabel Usia (AGE) ... 53 4.3 Nilai-nilai penduga Kaplan Meier dari fungsi Survival

variabel Jenis kelamin (SEX) ... 54 4.4 Nilai-nilai penduga Kaplan Meier dari fungsi Survival

variabel intensitas merokok (SMOKE) ... 56 4.5 Nilai-nilai penduga Kaplan Meier dari fungsi Survival

variabel indeks masa tubuh (BMI) ... 57 4.6 Nilai-nilai penduga Kaplan Meier dari fungsi Survival

variabel tekanan darah sistole (SBP)... 58 4.7 Nilai-nilai penduga Kaplan Meier dari fungsi Survival

variabel Algoritma Albumin dan kreatin (LACR) ... 60 4.8 Nilai-nilai penduga Kaplan Meier dari fungsi Survival

variabel Algoritma Trigliserin (LTG) ... 61 4.9 Nilai-nilai penduga Kaplan Meier dari fungsi Survival

variabel status hipertensi (HTN) ... 62 4.10 Nilai-nilai penduga Kaplan Meier dari fungsi Survival

variabel status diabetes (DM)... 64 4.11 Nilai Estimator Awal Dari Data Tahan Hidup Pasien

Penderita Penyakit Kardiovaskuler. ... 66

4.12 Nilai Estimator Parameter ̂ Dari Data Tahan Hidup Pasien

Penderita Penyakit Kardiovaskuler ... 66 4.13 Nilai Residual Pada Data Tahan Hidup Pasien Penderita Penyakit

(14)

DAFTAR LAMPIRAN

Nomor Judul Lampiran

1. Data Pasien Penderita Cardiovascular Disease (CVD).

2. Uji Kesesuaian Distribusi Weibull pada Kasus Data Tahan Hidup Pasien Penderita Cardiovascular Disease (CVD).

3. Program Untuk Menentukan Estimator Parameter Model Regresi Cox Proporsional Hazard.

a. Subprogram Untuk Mendapatkan Turunan Pertama. b. Subprogram Untuk Mendapatkan Matrik Jacobian. c. Subprogram Untuk Mendapatkan Estimator Parameter.

.

4. Program Untuk Mendapatkan Nilai Residual Cox – Snell. 5. Output Program Untuk Menentukan Parameter Model

Regresi Cox Proporsional dengan Hazard Dasar Weibull. a. Nilai estimator parameter regresi Cox

(15)

BAB I

PENDAHULUAN

1.1 Latar belakang

Statistika merupakan suatu alat yang memegang peranan penting dalam pengambilan keputusan. Banyak sekali peranan ilmu statistika dalam pengambilan keputusan, salah satunya adalah di dunia medis atau kesehatan.

Analisis data uji hidup merupakan salah satu teknik statistika yang banyak digunakan dalam bidang kesehatan. Di dunia kesehatan, sulit sekali untuk mengetahui lamanya tahan hidup seorang pasien dalam pengobatan suatu penyakit, apalagi untuk menentukan waktu kesembuhan atau kambuhnya suatu penyakit. Namun, hal yang bisa kita lakukan adalah mengetahui sifat karakteristik dari penyakit tersebut, antara lain : menganalisis peluang ketahanan, resiko kematian, memodelkan sifat karakteristik penyakit, menentukan estimasi interval kepercayaan dan mengambil kesimpulan yang berhubungan dengan penyakit tersebut.

(16)

digunakan yaitu : model proporsional hazard untuk T dan model lokasi skala untuk log T.

Model tersebut selanjutnya diperluas pada situasi dimana resiko kematian pada waktu tertentu tergantung pada nilai dari variabel bebas

. Himpunan nilai variabel bebas dari model proporsi hazard dapat

dinyatakan dengan vektor , yaitu = . Model regresi Cox proporsional hazard untuk pengamatan ke- dari individu dapat dituliskan sebagai berikut :

Model regresi Cox merupakan model hazard proporsional dasar yaitu rasio

hazardnya sama sepanjang waktu atau rasio hazardnya independen dengan waktu (Fahrmer dan Tutz,1994). Model ini dikemukakan oleh Cox dan lebih dikenal dengan regresi Cox, dimana merupakan vektor dari variabel bebas, dan merupakan koefisien regresi yang membentuk vektor , sedangkan

merupakan fungsi hazard untuk individu dengan semua nilai variabel bebasnya yang memuat vektor x sama dengan nol, dinamakan hazard dasar (baseline hazard function) (Collet, 1994).

Fungsi hazard untuk setiap individu adalah yang diasumsikan berdistribusi Weibull dengan λ adalah parameter skala dan γ adalah parameter bentuk, maka Model Cox dapat dituliskan sebagai berikut (Collet, 1994) :

(17)

Distribusi weibull yang digunakan sebagai hazard dasar merupakan salah satu distribusi yang banyak digunakan untuk menganalisis data uji hidup. Distribusi weibull memiliki berbagai kelebihan yang tidak dimiliki oleh distribusi lain seperti : memiliki 2 parameter yaitu parameter bentuk dan parameter skala, parameter bentuk yang dimiliki oleh distribusi weibull menjadikan distribusi ini lebih fleksibel atau bisa menyerupai distribusi lain.

Model regresi Cox proporsional hazard merupakan regresi survival, dengan respon merupakan data waktu survival sampai suatu titik kejadian yang ditentukan. Karakteristik utama model regresi Cox ini adalah mengakomodasikan adanya data sensor. Di dalam analisis data uji hidup dikenal beberapa tipe penyensoran, diantaranya adalah sampel tersensor tipe II. Sampel tersensor tipe II ini memiliki kelebihan yaitu lebih efisien waktu, karena percobaan akan dihentikan ketika sudah mencapai kegagalan yang diinginkan, dengan ketentuan

.

Karakteristik analisis survival yang mengakomodasi adanya sensoring inilah yang membuat estimasi parameter pemodelan data survival dengan fungsi likelihood semakin komplek (Fox,2002). Pada kasus dimana satu atau lebih data tersensor tipe II, maka fungsi likelihood-nya dapat ditulis sebagai berikut

| {∏

}

(18)

Berdasarkan uraian diatas, penulis tertarik untuk mengambil judul “Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II” dan selanjutnya menerapkan hasilnya pada data riil.

1.2 Rumusan Masalah

Berdasarkan latar belakang yang telah diuraikan, dapat dirumuskan permasalahan :

1 Bagaimana bentuk model regresi Cox proporsional dengan hazard dasar weibull ?

2 Bagaimana memperoleh estimator parameter model regresi Cox dengan hazard dasar Weibull pada data tersensor tipe II ?

3 Bagaimana menerapkan model regresi Cox melalui studi kasus pada data riil ?

1.3 Tujuan

Berdasarkan rumusan masalah diatas, tujuan yang ingin dicapai adalah untuk :

1 Mendapatkan bentuk model regresi Cox proporsional dengan hazard dasar weibull

2 Mendapatkan estimator parameter model regresi Cox dengan hazard dasar Weibull pada data tersensor tipe II

(19)

1.4 Manfaat

Manfaat dari penulisan skripsi ini adalah sebagai berikut :

1 Memperluas wawasan tentang metode analisis regresi yang biasa digunakan untuk menganalisa data survival

2 Dapat memodelkan regresi data survival secara umum dan metode Cox secara khusus.

3 Mampu menerapkan dan mengaplikasikan model regresi tersebut ke dalam data riil.

1.5 Batasan masalah

(20)

BAB II

TINJAUAN PUSTAKA

2.1 Analisis Regresi

Sir Francis Galton (1822-1911), seorang antropolog dan ahli meteorologi terkenal dari Inggris yang memperkenalkan istilah regresi dalam pidato di depan

Section H of the British Association di Aberdem, 1885, yang dimuat dalam majalah Nature, dan juga dalam sebuah makalah “Regression Towards Mediocrity in Hereditary Stature”, yang dimuat dalam journal of the Antropolgical Institute, 1985.

(Drapper dan Smith,1992)

Analisis regresi merupakan salah satu teknik yang ada dalam statistika, secara umum ada beberapa definisi yang menjelaskan tentang analisis regresi yaitu :

Definisi 2.1

Analisis regresi merupakan teknik statistik untuk menyelidiki dan membuat model hubungan diantara variabel-variabel.

(Montgomery dan Peck,1992) Definisi 2.2

(21)

bebas/variabel dependen) dan variabel prediktor (variabel bebas/variabel independen) .

(Hosmer dan Lemeshow, 1989) Definisi 2.3

Variabel prediktor ialah variabel yang nilainya dapat ditentukan atau yang nilainya dapat diamati namun tidak dapat dikendalikan. Variabel respon ialah variabel yang nilainya dipengaruhi oleh perubahan-perubahan variabel-variabel prediktor.

(Drapper dan Smith,1992)

Di dalam kehidupan nyata banyak sekali teknik statistika yang dapat digunakan untuk menganalisis masalah. Salah satu teknik analisis statistika yang digunakan untuk menganalisis data yang berhubungan dengan waktu tahan hidup adalah analisis data uji hidup.

2.2 Analisis Data Uji Hidup

Analisis data uji hidup (Survival analysis) adalah suatu metode untuk menganalisis data yang berhubungan dengan waktu, mulai dari time origin atau

start-point sampai dengan terjadinya suatu kejadian khusus atau end point. Di dalam riset medis, time origin sering digunakan sebagai awal perekrutan suatu individu dalam suatu studi yang bersifat percobaan sedangkan end-point merupakan kematian suatu individu atau pasien, sehingga data yang dihasilkan secara harfiah dinamakan waktu survival.

(22)

Untuk mendapatkan data uji hidup biasanya dilakukan eksperimen. Dalam melakukan eksperimen ada beberapa metode yang dilakukan sehingga data yang dihasilkan juga berbeda dari satu metode ke metode lain. Yang membedakan analisis uji hidup dengan bidang-bidang yang lain pada statistika adalah penyensoran.

2.3 Tipe Penyensoran

Di dalam analisis data uji hidup terdapat beberapa tipe penyensoran yaitu sampel lengkap, sampel tersensor tipe I, dan sampel tersensor tipe II. Penjelasan lengkapnya adalah sebagai berikut :

2.3.1 Sampel Lengkap

Pada uji sampel lengkap, eksperimen akan dihentikan jika semua benda atau individu yang telah diuji mati atau gagal. Langkah seperti ini mempunyai suatu keuntungan yaitu dihasilkannya observasi terurut dari semua benda atau individu yang diuji.

(Lawless,1982) 2.3.2 Sampel Tersensor Tipe I

Dalam sampel tersensor tipe I, eksperimen akan dihentikan jika telah dicapai waktu tertentu (waktu penyensoran). Misalkan adalah sampel

(23)

{

dimana adalah nilai sensor pada pengamatan ke-i

(Lawless, 1982) 2.3.3 Sampel Tersensor Tipe II

Pada pengujian sampel tersensor tipe II, eksperimen akan dihentikan setelah kematian ke- dari komponen yang dioperasikan tercapai. Misalkan adalah sampel random dari distribusi tahan hidup dengan fungsi kepadatan peluang dan fungsi survival . Eksperimen dikatakan telah selesai jika kegagalan ke- telah dicapai ( .

(Lawless, 1982)

Dalam analisis data survival ada dua macam fungsi yang dapat memberikan informasi tentang data survival, yaitu fungsi survival dan fungsi

hazard.

2.4 Fungsi Survival dan Fungsi Hazard

Fungsi survival merupakan dasar dari analisis survival, karena meliputi probabilitas survival dari waktu yang berbeda-beda yang memberikan informasi penting tentang data survival. Dalam analisis data uji hidup fungsi survival dapat didefinisikan :

Definisi 2.4

(24)

Jika diketahui fungsi distribusi kumulatif , yaitu :

∫ , (2.1)

maka bisa diperoleh fungsi survival sebagai berikut :

(2.2) (Kleinbaum dan Klein, 2005) Secara teori, fungsi survival dapat digambarkan dengan kurva mulus dan memiliki karakteristik sebagai berikut:

1. Tidak meningkat, kurva cenderung turun ketika meningkat.

2. Untuk , adalah awal dari penelitian, karena tidak ada objek yang mengalami peristiwa, probabilitas waktu survival 0 adalah 1.

3. Untuk secara teori, jika periode penelitian meningkat sampai tak berhingga maka tidak ada satu pun yang bertahan, sehingga kurva survival mendekati nol.

(25)

Berbeda dengan fungsi survival yang fokus pada tidak terjadinya peristiwa, fungsi hazard fokus pada terjadinya peristiwa. Oleh karena itu, fungsi hazard dapat dipandang sebagai pemberi informasi yang berlawanan dengan fungsi survival.

(Kleinbaum dan Klein, 2005) Kurva fungsi hazard juga memiliki karakteristik, yaitu:

1. Selalu non negatif, yaitu sama atau lebih besar dari nol. 2. Tidak memiliki batas atas.

Selain itu fungsi hazard juga digunakan untuk alasan : 1. Memberikan gambaran tentang failur rate. 2. Mengidentifikasi bentuk model yang spesifik.

3. Membuat model matematik untuk analisis survival biasa.

Misalkan melambangkan waktu survival dari waktu awal sampai terjadinya peristiwa yang merupakan variabel acak yang memiliki karakteristik fungsi survival dan fungsi hazard, maka fungsi hazard didefinisikan :

Definisi 2.5

Fungsi hazard didefinisikan sebagai tingkat kematian sesaat suatu individu pada waktu .

(Kleinbaum dan Klein, 2005) Misal, probabilitas variabel random berada antara dan , dengan syarat

lebih besar atau sama dengan , ditulis sebagai berikut :

(26)

Maka fungsi hazard yang didapat adalah

{ | }

{ }

{ }

atau dapat juga ditulis sebagai berikut :

{ }

(2.3) karena sehingga diperoleh

{

}

{

}

{

}

* ∫ + (2.4)

dengan ∫ disebut fungsi hazard kumulatif

(Collet, 1994).

(27)

2.5 Distribusi Weibull

Fungsi kepadatan peluang (fkp) dari distribusi Weibull dua parameter, diformulasikan sebagai :

, ( ) - (2.5) dengan :

(Lawless, 2003) Jika maka fungsi kepadatan peluang (fkp) dari waktu survival

yang berdistribusi weibull dengan dua parameter adalah

(2.6)

dengan :

Berdasarkan fkp dalam persamaan (2.6), diperoleh fungsi distribusi kumulatif weibull adalah sebagai berikut :

(28)

Sehingga persamaan (2.2) fungsi survivalnya dapat dituliskan sebagai berikut :

maka diperoleh fungsi hazard weibull :

(2.7)

(Collet, 1994)

Dalam kehidupan nyata khususnya di dunia medis, banyak situasi yang melibatkan populasi heterogen, sehingga penting untuk mempertimbangkan hubungan waktu tahan hidup dengan faktor lain. Satu-satunya jalan untuk menguji hubungan dari variabel bebas yang sesuai dengan waktu tahan hidup yaitu menggunakan model regresi, dimana ketergantungan waktu tahan hidup pada variabel yang sesuai dengan tegas dikenali.

2.6 Model Regresi dalam Analisi Data Uji Hidup

Dalam analisis data uji hidup terdapat dua model regresi yang sering digunakan untuk menganalisis data survival yaitu :

2.6.1 Model Proporsional Hazard untuk T

Model proporsional hazard merupakan model yang mengasumsikan bahwa perbedaan antar individu dalam sekelompok data yang hendak dianalisis mempunyai fungsi hazard yang proporsional satu sama lain. Hal ini berarti bahwa rasio ⁄ merupakan fungsi hazard dari dua individu dengan vektor regresi tidak tergantung pada Dengan kata lain fungsi hazard untuk , dengan

(29)

(2.8) dengan merupakan fungsi hazard dasar (baseline hazard functio) dan merupakan fungsi yang menyatakan pengaruh terhadap hazard.

(Lawless, 1982)

2.6.2 Model Lokasi Skala untuk Log T.

Bagian terpenting kedua dari model regresi dalam analisis data uji hidup adalah log waktu tahan hidup , diberikan , mempunyai suatu distribusi dengan parameter lokasi dan parameter skala tetap dapat ditulis sebagai berikut :

, (2.9)

dimana dan galat model mempunyai distribusi yang independen terhadap . Biasanya memiliki distribusi normal standart.

(Lawless, 1982)

Kedua model diatas merupakan model yang digunakan untuk menganalisis data survival secara umum, namun bila ada variabel-variabel bebas yang ingin dikontrol atau bila menggunakan beberapa variabel penjelas untuk menjelaskan hubungan antara waktu survival, maka regresi Cox lah yang digunakan.

2.6 Model Regresi Cox Proporsional Hazard

(30)

digunakan untuk menganalisis kematian atau harapan hidup seseorang. Namun seiring perkembangan zaman pemodelan ini banyak dimanfaatkan diberbagai bidang. Diantaranya bidang akademik, kedokteran, sosial, science, teknik, pertanian dan sebagainya.

Ketika menyelidiki suatu kasus dibidang kedokteran contohnya kasus pasien penderita penyakit tertentu, dibutuhkan hubungan waktu survival pasien dengan karakteristik-karakteristik klinis lainnya yang didapat dari data medis pasien.

Formula model Cox merupakan perkalian dari dua besaran yaitu fungsi

baseline hazard dan bentuk eksponensial untuk penjumlahan linier dari yaitu penjumlahan dari variabel independen (Kleinbaum dan Klein, 2005).

Model regresi Cox ini berlaku pada situasi dimana resiko kematian pada waktu tertentu tergantung pada nilai-nilai dari variabel bebas

Himpunan nilai variabel bebas dari model proporsional hazard dapat dinyatakan dengan x, sehingga )’. Model proporsional hazard untuk pengamatan ke- dari individu secara umum :

(2.10)

dengan merupakan vektor dari variabel bebas, dan

merupakan vektor dari koefisien regresi. Sedangkan merupakan fungsi

hazard untuk individu yang mana semua nilai variabel bebasnya memmuat vektor x sama dengan nol, dinamakan hazard dasar (baseline hazard function).

(31)

Metode estimasi yang digunakan dalam skripsi ini adalah metode estimasi

maximum likelihood. Ketika menggunakan metode ini, hal yang harus diketahui adalah tentang fungsi likelihood.

2.8 Fungsi Likelihood

Definisi 2.6

Misalkan adalah variabel random yang identik dan independen dari suatu distribusi dengan fungsi kepadatan peluang (fkp) untuk dan adalah ruang parameter. Fkp bersama antara adalah . Jika fkp bersama tersebut dinyatakan sebagai fungsi terhadap maka dinamakan fungsi

likelihood (L)yang dinyatakan sebagai :

(Hogg dan Craig, 1978) Definisi 2.7

Pada kasus dimana terdapat satu atau lebih data survival yang tersensor tipe II, maka fungsi likelihood-nya dapat dituliskan sebagai :

|

dengan menyatakan data waktu survival, menyatakan jumlah kematian / kerusakan yang diinginkan dalam pengujian dan menyatakan banyaknya data yang sedang diuji.

(32)

Setelah mendapatkan fungsi likelihood, langkah selanjutnya dalam estimasi parameter menggunakan MLE adalah mendapatkan nilai maksimum

likelihood.

2.9 Maksimum Likelihood Estimator (MLE)

Definisi 2.8

Jika statistik ̂ memaksimumkan fungsi likelihood maka statistik ̂ dinamakan

maksimum likelihood estimator (MLE) dari .

(Hogg and Craig, 1978)

Karena fungsi survival merupakan dasar dari analisis data tahan hidup. Maka ketika menggunakan model regresi Cox proporsional dengan hazard dasar Weibull sebagai asumsi, maka hal yang harus dilakukan adalah mengestimasi fungsi survival.

2.10 Estimasi Fungsi Survival

Estimasi fungsi survival dasar dari model regresi Cox dengan hazard dasar weibull dapat diperoleh dengan persamaan berikut :

̂ ̂ ̂ (2.12)

Estimasi fungsi hazard dasar kumulatif dari model regresi Cox dengan hazard dasar weibull dapat diperoleh dengan persamaan sebagai berikut :

(33)

Dari estimasi fungsi survival dasar dan fungsi hazard dasar kumulatif diatas maka dapat diperoleh estimasi fungsi survival pengamatan ke- dan fungsi

hazard kumulatif pengamatan ke- , yaitu :

̂ ̂ ̂ , (2.14)

dan

̂ [ ̂ ] ̂ (2.15)

(Collet, 1994)

Setelah fungsi survival didapat, maka model secara langsung juga akan didapatkan. Untuk menguji kesesuaian model dilakukan pengujian terhadap residual dari setiap pengamatan menggunakan residual Cox Snell.

2.11 Residual Cox – Snell

Setelah suatu model didapat, perlu dilakukan pemeriksaan terhadap kesesuaian dari model tersebut. Banyak prosedur pemeriksaan model yang digunakan, salah satunya residual Cox snell. Residual Cox snell untuk individu ke- dengan diberikan berikut :

̂ ( ̂ ) (2.16)

(34)

hazard kumulatif dan fungsi survival untuk individu ke- pada waktu Model dikatakan layak jika nilai residual Cox-Snell berdistribusi eksponensial.

(Collet, 1994) Teorema 2.1 :

Jika T merupakan variabel random dari waktu survival setiap pengamatan dan merupakan fungsi survival, maka varabel random berdistribusi eksponensial (Collet, 1994).

Bukti teorema 2.1 :

{ }

Fungsi densitas probabilitas dari variabel random diberikan sebagai berikut :

(35)

{ } { }

Terbukti bahwa variabel random berdistribusi eksponensial.

Ketika mengestimasi parameter, terdapat kemungkinan bahwa estimasi tersebut tidak diperoleh secara langsung seperti adanya fungsi implisit, oleh karena itu diperlukan suatu metode numerik untuk mendapatkan nilai estimator. Salah satu metode yang digunakan untuk mendapatkan nilai estimator adalah metode Newton Raphson.

2.12 Metode Newton – Raphson

Misalkan terdapat bentuk implisit dari dengan maka iterasi Newton Raphson adalah sebagai berikut :

(2.17)

dengan ( ) maka

( ) dan

[ ]

dengan :

adalah vektor berukuran pada iterasi ke . matrik jacobian pada saat .

(36)

Adapun langkah-langkah dalam metode Newton Raphson adalah sebagai berikut : 1. Menentukan nilai awal estimator untuk

2. Menentukan .

3. Menghitung estimator berikutnya menggunakan (2.17).

4. Mengulangi iterasi sampai diperoleh nilai max | |

dengan adalah konstanta positif yang ditentukan.

(Lee dan Wang, 2003)

Nilai estimator parameter yang di dapatkan merupakan nilai yang dapat memaksimumkan fungsi likelihood, untuk memperoleh hal itu banyak ketentuan yang harus dipenuhi salah satunya mengenai titik maksimum. Selain itu, ketika menggunakan metode numerik, ketentuan yang harus dipenuhi adalah mendapatkan nilai eigen matrik hessian.

2.13 Titik Maksimum

Jika fungsi mempunyai titik maksimum di

maka

(Bacon, 1985) Matrik hessian adalah matrik simetri A yang berisi persilangan turunan

(37)

maksimum dari fungsi adalah jika matrik hessian merupakan matrik definit negatif.

(Jong dan Heller, 2008)

Ketentuan tentang matrik definit negatif adalah sebagaimana teorema dibawah ini :

2.14 Matrik Definite Negatif Teorema 2.2

Sebuah matrik simetri A disebut definit negatif jika dan hanya jika semua nilai eigen dari matrik A bernilai negatif.

Bukti Teorema 2.2 ( Lihat hal 709)

(Anton dan Rorres, 2005)

Untuk menerapkan semua algorima dalam pengestimasian program, diperlukan suatu software khusus yang memungkinkan membuat program sendiri. Salah satu software yang mampu membuat program sendiri adalah S-Plus.

2.15 S-PLUS

(38)

a.function(...)

function digunakan untuk menunjukkan fungsi yang akan digunakan dalam program.

bentuknya adalah : function(...) b. length(....)

length(...) merupakan perintah untuk menunjukkan banyaknya data. c. matrix(....)

untuk membentuk sebuah matrik yang anggotanya a dengan jumlah baris sebanyak b dan jumlah kolom sebanyak c.

d. for(....)

untuk melakukan pengulangan sebanyak n kali. Bentuknya adalah ; for(...)

e. abs(....)

untuk membuat harga mutlak dari suatu bilangan. Bentuknya adalah : abs(...)

f. sum(...)

untuk menjumlahkan semua bilangan anggota dari suatu vektor. Bentuknya adalah : sum(...)

(Everitt , 1944)

(39)

2.16 Cardiovascular Diseases (CVD)

2.16.1 Pengertian

CVD atau Cardiovascular Diseases merupakan permasalahan yang sangat menarik untuk diteliti. Fakta dari WHO menyebutkan bahwa CVD merupakan penyebab utama kematian diseluruh dunia, yang mengakibatkan 17,5 juta kematian setiap tahunnya. Sebanyak 7,6 juta orang meninggal karena serangan jantung dan 5,7 juta meninggal karena stroke setiap tahunnya. Kematian global akibat penyakit kardiovaskular diperkirakan mencapai sekitar 25 juta orang pada tahun 2020.

Cardiovascular Diseases adalah istilah bagi serangkaian gangguan yang menyerang jantung (kardio) dan pembuluh darah (vaskular), termasuk penyakit jantung koroner, penyakit serebravaskular, dan penyakit vaskular porifer. Penyakit kardiovaskular juga mencakup penyakit lain seperti kerusakan jantung. Penyakit kardiovaskular berhubungan dengan kondisi serangan jantung , angina dan stroke.

(Medicastore, 2008)

2.16.2 Faktor Resiko

Faktor resiko adalah faktor yang meningkatkan terjadinya sesuatu. Didalam suatu studi medis, mengamati faktor resiko untuk mengurangi akibat negatif dari suatu penyakit adalah yang paling efektif untuk dilakukan. Faktor risiko ini dibagi menjadi dua kelompok, yang dapat dikendalikan dan yang tidak dapat dikendalikan.

(40)

hidup (kurang gerak, merokok, konsumsi alkohol berlebihan). Sementara faktor risiko yang tidak dapat dikendalikan meliputi usia, jenis kelamin, dan riwayat penyakit kardiovaskular dalam keluarga.

(Mediastore, 2008) Adapun beberapa faktor resiko yang dapat meningkatkan resiko kematian pada penderita CVD adalah :

a. Tipe Penyakit Kardiovaskular

Konsekuensi langsung dari penyakit kardiovaskular adalah serangan stroke. Badan Kesehatan Dunia (WHO), memperkirakan penyakit kardiovaskular menjadi penyebab kematian nomor satu di seluruh dunia. Ada berbagai jenis penyakit kardiovaskular yang harus diwaspadai yaitu : serangan jantung, angina (nyeri dada), dan stroke.

b. Usia

(41)

c. Jenis kelamin

Pada umumnya lelaki memiliki resiko kematian akibat CVD lebih besar dari pada wanita sebelum menopausal, namun resiko kematian pada wanita yang sudah menopaus sama seperti pada lelaki. Sebuah penelitian yang dilakukan oleh WHO menyatakan bahwa perbedaan resiko kematian akibat CVD terhadap pria dan wanita disebabkan oleh perbedaan hormon. Untuk kebanyakan kasus, resiko kematian akibat CVD banyak menyerang para lelaki dibanding wanita. Karena pada wanita, hormon estrogen adalah hormon yang sangat dominan. Estrogen mampu melindungi tubuh seorang wanita dari efek dari metabolisme glukosa yang berlebihan, namun hormon estrogen yang dimiliki wanita ini menurun setelah terjadi menopause sehingga resiko kematian akibat CVD jadi semakin besar.

d. Smoke

(42)

e. BMI (Body Mass Indeks)

BMI dihitung sebagai berat badan dalam kilogram (kg) dibagi tinggi badan dalam meter dikuadratkan ( ) dan tidak terkait pada jenis kelamin. BMI secara signifikan berhubungan dengan kadar lemak tubuh. Saat ini, BMI secara internasional diterima sebagai alat untuk mengidentifikasikan kelebihan berat badan dan besitas. Orang-orang dengan BMI lebih yaitu kelebihan berat badan dan obesitas pada hakekatnya meningkatkan morbiditas dan mortalitas akibat hipertensi, stroke, penyakit jantung koroner, dyslipidemia dan diabetes mellitus tipe 2 (Hill,2005).

f. SBP (Sistole Blood Pressure)

Tekanan darah merujuk kepada tekanan yang dialami darah pada pembuluh arteri darah ketika darah di pompa oleh jantung ke seluruh anggota tubuh. Tekanan darah dibuat dengan mengambil dua ukuran dan biasa diukur seperti berikut - 120 /80 mmHg. Nomor atas (120) menunjukkan tekanan ke atas pembuluh arteri akibat denyut jantung, dan disebut tekanan sistole. Tekanan darah sistole digunakan untuk mendeteksi penyakit kardiovaskular sejak dini. Semakin tinggi tekanan darah sistole, maka resiko kematian akan semakin besar. Karena tekanan darah sistole yang tinggi bisa memicu hipertensi.

g. LACR (Logaritm of Albumin and Creatin)

(43)

h. LTG (Logaritm of Trigliserin)

Trigliserin merupakan penyusun utama minyak nabati dan lemak hewani. Jadi dengan mengetahui kandungan trigliserin dalam tubuh , maka dapat digunakan untuk mengontrol kelebihan kolesterol untuk mengurangi resiko terkena CVD. Semakin tinggi level trigliserin dalam darah dapat meningkatkan resiko penyakit CVD.

i. HTN (Hipertensi Status)

Tekanan darah tinggi atau Hipertensi adalah kondisi medis dimana terjadi peningkatan tekanan darah secara kronis (dalam jangka waktu lama). Penderita yang mempunyai sekurang – kurangnya tiga bacaan tekanan darah yang melebihi 140/90 mmHg saat istirahat diperkirakan mempunyai tekanan darah tinggi. Menurut WHO, Tekanan darah yang selalu tinggi adalah salah satu faktor untuk stroke, serangan jantung, gagal jantung, dan aneurisma arterial, dan merupakan penyebab utama gagal ginjal kronis.

j. DM (Diabetes Status)

(44)

2.17 Interpretasi Model Proporsional Hazard

Diketahui fungsi hazard model proporsional hazard adalah :

jika kita notasikan log natural dari fungsi hazard sebagai . Maka kita akan memperoleh bentuk log natural fungsi hazard sebagai berikut :

[ ]

Perbedaan fungsi log-hazard untuk perubahan dari suatu bentuk menjadi adalah :

[ ] [ ] { [ ] } { [ ] }

Log hazard adalah bentuk fungsi yang cocok digunakan untuk mengetahui efek perubahan pada variabel prediktor. Untuk mempermudah perhitungan, kita bisa menggunakan Hazard Ratio (HR) seperti bentuk dibawah ini :

[ ]

Interpretasi koefisien untuk variabel kontinu adalah mengubah fungsi log-hazard dengan mengubah unit dari variabel kontinu menggunakan persamaan (2.19) . Dengan dan , sehingga diperoleh perubahan fungsi log-hazard sebagai berikut :

(45)

dengan menggunakan persamaan (2.20), maka diperoleh estimator hazard ratio sebagai berikut :

̂

Interpretasi dari nilai estimator diatas adalah resiko kematian variabel akan

bertambah sebesar untuk setiap pertambahan unit variabel.

(46)

BAB III

METODE PENELITIAN

Metode penelitian yang digunakan dalam penyusunan skripsi ini adalah sebagai berikut :

1. Menyajikan definisi-definisi yang berhubungan dengan model regresi Cox 2. Menentukan bentuk model regresi Cox proporsional dengan hazard dasar

weibull dengan langkah sebagai berikut : a. Menentukan fungsi hazard weibull.

b. Mendapatkan bentuk model regresi Cox proporsional dengan hazard dasar weibull.

c. Menentukan fungsi survival dan Probability Density Function model regresi Cox yang berhubungan dengan fungsi hazard weibull.

3. Menentukan estimator parameter dari model regresi cox dengan hazard dasar weibull menggunakan metode maksimum likelihood dengan langkah sebagai berikut :

a. Menentukan fungsi likelihood dari model regersi cox dengan hazard dasar weibull pada data tersensor tipe II.

b. Menentukan fungsi log-likelihood dari model regersi cox dengan hazard dasar weibull pada data tersensor tipe II.

c. Menentukan turunan pertama fungsi log-likelihood terhadap parameter dan .

(47)

e. Jika persamaan pada langkah c merupakan fungsi implisit, maka persamaan diselesaikan dengan menggunakan metode Newton Raphson.

4. Menyusun algoritma untuk mengestimasi parameter model regresi Cox dengan langakah sebagai berikut :

a. Menyusun algoritma untuk mendapatkan estimator parameter

pada model regresi Cox berdasarkan langkah-langkah yang

telah dibuat.

b. Menyusun algoritma untuk mendapatkan estimator residual Cox-Snell. 5. Menerapkan model regresi Cox pada data tahan hidup pasien

Cardiovaskular Diseases (CVD) dengan langkah-langkah sebagai berikut : a. Membuat program berdasarkan algoritma yang telah dibuat dalam

bahasa pemprograman yang ditulis dalah software S-Plus.

b. Inputkan data tahan hidup pasien penderita Cardiovascular Disease (CVD).

c. Menguji distribusi data tahan hidup pasien Cardiovascular Disease (CVD).

d. Estimasi parameter regresi dengan menggunakan program yang telah dibuat dalam software S-Plus.

e. Estimasi residual Cox-Snell dengan menggunakan program yang telah dibuat dalam software S-Plus.

(48)

BAB IV

PEMBAHASAN

Model regresi Cox merupakan model yang menggambarkan hubungan antara waktu survival sebagai variabel dependen dengan satu set variabel independen. Variabel independen ini bisa kontinu ataupun kategorik

Model Regresi Cox proporsional hazard untuk pengamatan ke- dari individu secara umum :

(4.1)

dengan merupakan vektor dari variabel bebas, dan merupakan vektor dari koefisien regresi. Sedangkan merupakan fungsi

hazard untuk individu yang mana semua nilai variabel bebasnya membuat vektor sama dengan nol, dinamakan hazard dasar (baseline hazard function).

4.1 Model Regresi Cox Dengan Hazard Dasar Weibull

(49)

4.1.1 Menentukan Fungsi Hazard Weibull

Sebelum membuat model regresi Cox proporsional dengan hazard dasar Weibull, terlebih dahulu harus mengetahui fungsi hazard Weibull. Menurut persamaan (2.6) Fungsi hazard dasar Weibull adalah sebagai berikut :

(4.2)

4.1.2 Mendapatkan Model Regresi Cox dengan Hazard Dasar Weibull

Sesuai dengan persamaan (2.10) maka model regresi Cox proporsional

hazard untuk pengamatan ke- dari individu secara umum adalah :

dengan merupakan baseline hazard dari distribusi tertentu. Jika baseline hazard yang digunakan adalah fungsi hazard dari distribusi Weibull, sesuai dengan persamaan (4.2), maka akan diperoleh model regresi Cox dengan hazard dasar Weibull sebagai berikut :

(4.3)

4.1.3 Menentukan Fungsi Survival dan Probability Density Function Model

Regresi Cox yang Berhubungan dengan Fungsi Hazard Weibull

Setelah diperoleh fungsi hazard yang berhubungan dengan hazard dasar Weibull, langkah berikutnya adalah menentukan fungsi survival model regresi Cox yang berhubungan dengan hazard dasar Weibull. Dengan menggunakan persamaan (2.4) maka diperoleh fungsi survival yang berhubungan dengan hazard dasar Weibull sebagai berikut :

(50)

Setelah diketahui fungsi hazard dan fungsi survival yang berhubungan dengan distribusi Weibull. Selanjutnya dapat diperoleh Probability Density Function (PDF) yang berhubungan dengan hazard dasar Weibull. Dengan menggunakan persamaan (2.3) diperoleh model regresi Cox proporsional dengan

hazard dasar Weibull sebagai berikut :

(4.5)

4.2 Estimasi Parameter dalam Model Regresi Cox

Untuk menentukan estimasi parameter dari model regresi Cox dengan

hazard dasar Weibull, metode yang digunakan adalah Maximum Likelihood Estimator (MLE), dengan langkah-langkahnya sebagai berikut :

4.2.1 Menentukan Fungsi Likelihood dari Model Regresi Cox dengan

Hazard Dasar Weibull pada Data Tersensor Tipe II.

Fungsi likelihood pada kasus data tersensor tipe II adalah sebagai berikut :

|

dimana menyatakan waktu tahan hidup pasien yang diamati, menyatakan jumlah kematian atau kerusakan yang diinginkan dan menyatakan banyaknya data yang diamati. Fungsi likelihood untuk data tersensor tipe II dengan menggunakan hazard dasar Weibull.

Diketahui fungsi survival yang berhubungan dengan hazard dasar Weibull adalah

(51)

dan diketahui Probability Density Function (PDF) Weibull proporsional hazard adalah

. Sehingga diperoleh fungsi likelihoodnya adalah sebagai berikut : |

{∏ }

(4.7)

{ (∏

) ( (∑ )) (∑ ) }

(4.8) Setelah mendapatkan fungsi likelihood, langkah selanjutnya dalam estimasi parameter menggunakan metode maksimum likelihood adalah menentukan fungsi log likelihood. Alasan penggunaan fungsi log likelihood adalah karena perhitungan menggunakan fungsi log likelihood lebih sederhana sehingga memudahkan dalam perhitungan, selain itu hasil yang diperoleh melalui fungsi log likelihood tidak berbeda dengan hasil dari fungsi likelihood.

4.2.2 Menentukan Fungsi Log-Likelihood

(52)

( )

(∏

) ( ( (∑ [ ])))

( (∑ ))

( ) ( )

( ∑

) ( ∑ [ ])

(∑ )

(4.9) Setelah fungsi Log likelihood didapatkan, selanjutnya dapat dicari turunan pertama fungsi Likelihood sebagai syarat perlu memaksimumkan fungsi

likelihood.

4.2.3 Menentukan Turunan Pertama Fungsi Log-Likelihood terhadap

Parameter

Langkah pertama dalam estimasi parameter menggunakan MLE adalah menemukan turunan pertama fungsi log likelihood sebagai berikut :

1. Turunan pertama terhadap .

Misalkan merupakan parameter yang berupa matrik berukuran , maka fungsi log-likelihoodnya harus diturunkan terhadap semua elemen vektor parameter . Misalkan , maka turunan pertama log

(53)

( ) ∑

( ∑ [ ]

)

( ) ∑

( ∑ [ ]

)

( ) ∑

(∑ [ ]

)

( ) ( ) ∑

(∑ [ ]

)

Secara umum, turunan pertama log-likelihood terhadap , adalah :

( ) ∑

(∑ [ ]

)

2. Turunan pertama terhadap parameter

( )

(∑ [ ]

(54)

3. Turunan pertama terhadap parameter .

( ) ( )

(∑ [ ]

)

4.2.4 Mendapatkan estimator parameter .

Estimator MLE untuk parameter , untuk , diperoleh dengan cara menyamakan nol persamaan – persamaan dibawah sebagai syarat perlu untuk memaksimumkan fungsi log – likelihood-nya.

( ) ∑

(∑ [ ]

)

( ) (∑ [ ]

)

( ) ( )

(∑ [ ]

)

Ketiga persamaan diatas tidak dapat diselesaikan secara analistis, karena masih dalam bentuk implisit sehingga diperlukan metode lain untuk menyelesaikannya. Pada kesempatan ini digunakan metode Newton Raphson untuk mendapatkan nilai estimasi parameter .

(55)

( ) ( ) ( ) ( ) ( ) ( )

4.2.5 Menentukan Turunan Kedua Fungsi Log-Likelihood terhadap

Parameter .

1. Persamaan (4.17) diturunkan terhadap . Untuk

( ) [ ] [ ∑[ ]

]

(4.20)

(

) [ ] [ ∑[ ]]

(4.21)

( ) [ ] [ ∑[ ]

]

(4.22) Untuk

( ) [ ] [ ∑[ ]

]

(4.23)

( ) [ ] [ ∑[ ]

(56)

(4.24)

( ) [ ] [ ∑[ ]

]

(4.25) Untuk

( ) [ ] [ ∑[ ]

]

(4.26)

( ) [ ] [ ∑[ ]

]

(4.27)

( ) [ ] [ ∑[ ]

]

(4.28) Untuk

( ) [ ] [ ∑[ ]

]

(4.29)

( ) [ ] [ ∑[ ]

]

(57)

(

) [ ] [ ∑[ ]]

(4.31) Dari semua persamaan diatas diperoleh bentuk umum turunan kedua terhadap sebagai berikut :

( ) [ ] [ ∑[ ]

]

(4.32) 2. Turunan persamaan (4.18) terhadap parameter

( )

( )

∑[ ]

3. Turunan persamaan (4.19) terhadap parameter

( )

∑[ ]

( )

(58)

4. Persamaan (4.17) diturunkan terhadap parameter

( ) ∑[ ]

( ) ∑[ ]

(

) ∑[ ]

( ) ∑ [ ] (4.40)

Sehingga diperoleh bentuk umumnya

(

) ∑[ ]

5. Persamaan (4.17) diturunkan terhadap parameter

( )

∑[ ]

( )

∑[ ]

(59)

( )

∑[ ]

( )

∑[ ]

Sehingga diperoleh bentuk umumnya

( )

∑[ ]

4.3 Estimasi Residual Cox Snell

Log Cumulatif survival dari model regresi Cox dengan hazard dasar Weibull dapat diperoleh dengan persamaan sebagai berikut :

̂ ( ̂ ̂)

Log Cumulatif hazard dari model regresi Cox dengan hazard dasar Weibull dapat diperoleh dengan persamaan berikut :

(60)

Dari log Cumulatif survival dan fungsi hazard komulatif diatas maka dapat diperoleh log Cumulatif survival pengamatan ke-i dan fungsi hazard komulatif pengamatan ke-i, yaitu :

̂ ̂

atau

̂ ̂ ̂ ̂

dan

̂ [ ̂ ] ( )

Setelah model regresi Cox diperoleh, kelayakan dari model yang didapat perlu ditaksir dengan menggunakan residual Cox snell sebagai berikut :

̂ ̂ , (4.41) dengan ̂ merupakan log Cumulatif hazard pada waktu , dapat dicari dengan menggunakan persamaan (4.48). Selanjutnya model dikatakan layak apabila nilai residual Cox-snell berdistribusi eksponensial. Algoritma untuk memdapatkan estimator parameter diuraikan dibawah .

4.4 Algoritma untuk Mendapatkan Estimator Parameter Terdapat beberapa langkah yang digunakan untuk mendapatkan nilai estimator parameter dari model regresi Cox dan estimasi residual Cox snell, sebagai berikut :

(61)

b. Mendapatkan nilai estimator dengan menggunakan algoritma

newton raphson sebagai berikut :

1. Memasukkan data sekunder (data tahan hidup)

2. Ambil sebagai iterasi ke-0. Memasukkan nilai awal parameter , dalam bentuk persamaan sebagai berikut :

( )

3. Hitung fungsi sebagai berikut :

( ) ( )

( ) ( )

( ) ( )

( ) ( )

( ) ( )

(62)

maka dilanjutkan ke langkah (7), namun jika tidak maka proses diulang ke langkah (3) dengan mengambil .

7. Dapatkan nilai estimator ̂ .

(63)

4.5 Algoritma untuk Mendapatkan Estimator Residual Cox Snell Terdapat beberapa langkah yang digunakan untuk mendapatkan nilai estimator residual Cox snell, sebagai berikut :

a. Masukkan data sekunder (data tahan hidup)

b. Hitung nilai Estimasi residual Cox snell dengan persamaan (4.41) c. Jika nilai estimasi residual Cox snell berdistribusi eksponensial, maka

model regresi Cox dapat dikatakan layak.

Algoritma yang telah dibuat diatas, selanjutnya diterapkan pada program S-Plus sebagai berikut :

4.6 Program Estimasi Parameter Model Regresi Cox dengan Hazard

Dasar Weibull.

Penerapan algoritma pada program komputer dengan menggunakan paket program S-PLUS.

1. Program untuk turunan pertama.

2. Program untuk mendapatkan matrik jacobian. 3. Program untuk mendapatkan parameter . Dengan menggunakan program Newton Raphson

4. Memperoleh program untuk mendapatkan nilai residual Cox Snell.

(64)

4.7 Penerapan pada Kasus Data Tahan Hidup

Data yang akan diterapkan pada program adalah data sekunder hasil penelitian tentang waktu tahan hidup pasien penderita cardiovascular disease (CVD) (Lee.T, 2003), data ini terlampir dalam bentuk tabel pada Lampiran 1.

Permasalahan yang akan diselesaikan adalah membuat suatu model regresi Cox dari data pasien CVD. Adapun variabel dari penelitian ini adalah variabel T yaitu waktu tahan hidup 21 orang pasien CVD mulai dari terdiaknosa sampai dia meninggal dengan hanya mengambil 10 kematian pertama penderita CVD. Sedangkan variabel bebasnya adalah jenis CVD (DG), umur pasien (AGE) , jenis kelamin pasien (SEX), intensitas merokok (SMOKE), indeks massa tubuh (BMI), tekanan darah sistole (SBP), logaritme albumin dan kreatin (LACR), logaritme trigliserin (LTG), status hipertensi (HTN), dan status diabetes (DM).

Setelah data diperoleh, langkah selanjutnya adalah menguji kesesuaian distribusi pada data. Pengujian dilakukan dengan menggunakan software StatGraphic Centurion.

4.7.1 Uji Kesesuaian Distribusi Weibull pada Data Waktu Tahan hidup Pasien Cardiovascular Disease (CVD)

Uji yang dilakukan untuk mengetahui apakah distribusi dari waktu tahan hidup pasien penderita penyakit kardiovaskuler berdistribusi Weibull atau tidak adalah dengan menggunakan software dengan taraf kepercayaan 95%. Hipotesisnya adalah sebagai berikut :

(65)

Distribusi waktu tahan hidup pasien penderita penyakit kardiovaskular bukan Weibull

dengan ketentuan

 Jika p-value (nilai probabilitas) data tersebut (tingkat kesalahan 5%), maka distribusi waktu tahan hidup pasien penyakit kardiovaskuler adalah Weibull.

 Jika p-value data tersebut < 0,05, maka distribusi waktu tahan hidup pasien penyakit kardiovaskuler bukan Weibull.

Pada lampiran 2, dapat dilihat bahwa p-value untuk data tersebut adalah sebesar 0,875969. Dengan tingkat kesalahan 5% dapat dikatakan bahwa distribusi waktu tahan hidup pasien penyakit kardiovaskuler adalah Weibull.

Setelah data berdistribusi weibull didapatkan, langkah yang harus dilewati sebelum menggunakan model hazard proporsional adalah pemeriksaan asumsi proporsional hazard. Asumsi proporsional hazard menyatakan bahwa fungsi

hazard untuk kategori yang berbeda pada variabel bebas harus proporsional pada setiap waktu.

4.7.2 Asumsi Hazard Proporsional

(66)

Jenis penyakit CVD yang diderita pasien terbagi menjadi dua kategori yaitu kategori 1 untuk pasien yang menderita penyakit stroke, dan kategori 2 untuk pasien yang menderita penyakit coronari heart diseases. Adapun tabel pengkategorian dapat dilihat pada tabel 4.1.

Tabel 4.1 Nilai-nilai penduga Kaplan Meier dari fungsi Survival

variabel Jenis penyakit (DG)

(67)

Gambar 4.1 Plot Asumsi Hazard Proporsional Variabel DG

Plot pada gambar 4.1 menunjukkan bahwa plot antara log Cumulatif hazard terhadap log (waktu tahan hidup) tidak menghasilkan garis paralel (sejajar kasar) untuk setiap kategori pada variabel DG. Oleh karena itu pemodelan dengan menggunakan model regresi Cox tidak dapat dilakukan.

b. Umur Pasien

Umur pasien terbagi menjadi 2 kategori yaitu kategori 1 untuk pasien yang berumur < 70 tahun dan kategori 2 untuk pasien yang berumur diatasnya. Adapun tabel pengkategorian dapat dilihat pada tabel 4.2

Tabel 4.2 Nilai-nilai penduga Kaplan Meier dari fungsi Survival

variabel Usia (AGE) AGE = 1

( ) ̂ ̂ 1,1 0,041

1,3 0,114

2,9 0,462 3 0,477

3,2 0,505

AGE = 0

( ) ̂ ̂ 2 0,301

2,1 0,322

2,6 0,415 2,7 0,431

3,3 0,519

Berikut merupakan plot kaplan-meier antara log dan log Cumulatif

(68)

Gambar 4.2 Plot Asumsi Hazard Proporsional Variabel AGE

Plot pada gambar 4.2 menunjukkan bahwa plot antara fungsi hazard terhadap t (waktu tahan hidup) tidak menghasilkan garis paralel (sejajar kasar) untuk setiap kategori pada variabel AGE. Oleh karena itu pemodelan dengan menggunakan model regresi Cox tidak dapat dilakukan.

c. Jenis Kelamin (SEX)

Jenis Kelamin Pasien terbagi menjadi dua kategori yaitu kategori 1 untuk pasien berjenis kelamin laki-laki dan kategori 0 untuk pasien berjenis kelamin perempuan. Adapun tabel pengkategorian dapat dilihat pada tabel 4.3

Tabel 4.3 Nilai-nilai penduga Kaplan Meier dari fungsi Survival

variabel Jenis kelamin (SEX)

(69)

( ) ̂ ̂

Gambar 4.3 Plot Asumsi Hazard Proporsional Variabel SEX

Plot pada gambar 4.3 menunjukkan bahwa plot antara fungsi hazard terhadap log (waktu tahan hidup) tidak menghasilkan garis paralel (sejajar kasar) untuk setiap kategori pada variabel SEX. Oleh karena itu pemodelan dengan menggunakan model regresi Cox tidak dapat dilakukan.

d. Intensitas Merokok (SMOKE)

Intensitas merokok terbagi juga kedalam dua kategori yaitu kategori 1 untuk pasien yang merokok dan kategori 0 untuk pasien yang tidak merokok. Adapun tabel pengkategorian dapat dilihat pada tabel 4.4

log t

(70)

Tabel 4.4 Nilai-nilai penduga Kaplan Meier dari fungsi Survival

Gambar 4.4 Plot Asumsi Hazard Proporsional Variabel SMOKE

Gambar

Gambar 2.2 Kurva Fungsi Distribusi Kumulatif Weibull
Tabel 4.1 Nilai-nilai penduga Kaplan Meier dari fungsi Survival
tabel pengkategorian dapat dilihat pada tabel 4.2
Gambar 4.2 Plot Asumsi Hazard Proporsional Variabel AGE
+7

Referensi

Dokumen terkait

Misalkan dan memenuhi matriks invers Monge maka nilai eigen dari yang dinotasikan dengan merupakan nilai maksimum dari elemen-elemen pada baris ke kolom ke ,

Seperti yang terjadi di desa girisekar / panggang / gunung kidul // dalam rangka mengucapkan puji syukur kepada sang pencipta / mereka melakukan sedekah lalaban // selain itu /

mutu dan tingkat kepuasan pasien terhadap pelayanan kefarmasian di puskesmas. kota Sibolga.Peneliti tertarik memilih tempat penelitian

Demikian Surat Kuasa ini kami buat dengan sebenar-benarnya agar dapat dipergunakan sebagaimana mestinya. Bondowoso, 18

Direktorat Jenderal Pendidikan Islam, Kementerian Agama R.I, menyatakan bahwa lembaga di bawah ini telah melakukan updating data Pendidikan Islam (EMIS) Periode Semester GENAP

Hasil elektroforesis pada gambar C dan E memiliki ketebalan pita yang terbentuk sangat tipis, hal ini menunjukkan bahwa suhu annealing yang kurang sesuai dengan

Sifat yang diharapkan dalam sediaan gel topikal yaitu memiliki aliran tiksotropik, tidak lengket, tidak berkendir, daya sebar baik, tidak berminyak, mudah dicuci, sebagai emolien,

[r]