• Tidak ada hasil yang ditemukan

ANALISIS REGRESI COX PROPORSIONAL DENGAN HAZARD DASAR WEIBULL PADA DATA TERSENSOR TIPE II SKRIPSI

N/A
N/A
Protected

Academic year: 2021

Membagikan "ANALISIS REGRESI COX PROPORSIONAL DENGAN HAZARD DASAR WEIBULL PADA DATA TERSENSOR TIPE II SKRIPSI"

Copied!
135
0
0

Teks penuh

(1)

ANALISIS REGRESI COX PROPORSIONAL DENGAN HAZARD DASAR WEIBULL PADA DATA TERSENSOR TIPE II

SKRIPSI

JATU HERLINA AMURWANI

PROGRAM STUDI S-1 MATEMATIKA DEPARTEMEN MATEMATIKA FAKULTAS SAINS DAN TEKNOLOGI

UNIVERSITAS AIRLANGGA 2012

(2)

ANALISIS REGRESI COX PROPORSIONAL DENGAN HAZARD DASAR WEIBULL PADA DATA TERSENSOR TIPE II

SKRIPSI

Sebagai Salah Satu Syarat Untuk Memperoleh Gelar Sarjana Sains Bidang Matematika

Pada Fakultas Sains Dan Teknologi Universitas Airlangga Disetujui oleh Pembimbing 1 Toha Saifudin,S.Si,M.Si NIP. 19750106 199903 1 002 Pembimbing II Drs. Suliyanto, M.Si NIP. 19650907 199102 1 001

(3)

LEMBAR PENGESAHAN NASKAH SKRIPSI

Judul : Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II Penyusun : Jatu Herlina Amurwani

Nomor Induk : 080810555 Tanggal Ujian : 18 Juni 2012

Disetujui oleh : Pembimbing 1 Toha Saifudin,S.Si,M.Si NIP. 19750106 199903 1 002 Pembimbing II Drs. Suliyanto, M.Si NIP. 19650907 199102 1 001 Mengetahui :

Ketua Program Studi S-1 Matematika Departemen Matematika Fakultas Sains dan Teknologi

Universitas Airlangga

Dr. Miswanto

(4)

PEDOMAN PENGGUNAAN SKRIPSI

Skripsi ini tidak dipublikasikan, namun tersedia di perpustakaan dalam lingkungan Universitas Airlangga, diperkenankan untuk dipakai sebagai referensi kepustakaan, tetapi pengutipan harus seizin penyusun dan harus menyebutkan sumbernya sesuai kebiasaan ilmiah. Dokumen skripsi ini merupakan milik Universitas Airlangga.

(5)

KATA PENGANTAR

Assalamu’alaikum warahmatullahi wabarakatuh.

Alhamdulillahirobbil alamin, berkat rahmat Allah yang telah memberikan petunjuk dan bimbingan-Nya yang tiada tara, sehingga penulis dapat menyelesaikan skripsi dengan judul ”Analisis Regresi Cox Proporsional dengan

Hazard Dasar Weibull pada Data Tersensor Tipe II ”.

Dalam penyusunannya, penulis memperoleh banyak bantuan dari berbagai pihak, karena itu penulis mengucapkan terima kasih yang sebesar-besarnya kepada :

1. Dr. Miswanto, M.Si., selaku Ketua Prodi S-1 Matematika serta dosen penguji yang telah memberikan arahan dan bimbingan kepada penulis. 2. Toha Saifudin, S.Si, M.Si selaku dosen pembimbing I yang telah

memberikan banyak arahan, masukan, perhatian, semangat, rasa sabar yang begitu besar dan pengetahuan yang tidak ternilai harganya.

3. Suliyanto, M.Si. selaku dosen pembimbing II yang telah memberikan banyak arahan, masukan, waktu, tenaga dan pikiran.

4. Ir. Elly Ana, M.Si., selaku dosen penguji yang telah memberikan banyak saran untuk kesempurnaan skripsi ini.

5. Dra. Utami Dyah P, M.Si selaku dosen wali selama menjadi mahasiswa Fakultas Sains dan Teknologi Universitas Airlangga yang telah banyak memberikan arahan dan saran demi kesuksesan menjadi mahasiswa Matematika. Serta seluruh dosen Matematika Universitas Airlangga, terima kasih untuk segala ilmu yang diberikan.

6. Untuk Kedua Orang Tuaku tercinta dan ketiga adikku yang telah memberikan dukungan, semangat, kerpercayaan serta cinta dan kasih sayang yang begitu besar. Semoga saya selalu bisa membanggakan kalian.

7. Untuk Varian Luthfan yang telah setia menjadi seorang teman, sahabat, pemberi motivasi serta semangat yang tak pernah henti. Terima kasih atas segala perhatian dan nasehat-nasehatnya selama ini.

8. Arek-arek GP++ : Ragil, Rika, Dilphi, Mita, Wewe, Dinda, Lia, Tika, Vita, dan Michelle, terima kasih atas semua dukungan, canda tawa dan kenangan manis selama ini, semuanya tidak akan pernah terlupakan sampai kapanpun.

Love you All.

9. Anak-anak kos dodol penghuni koz Ungu : Lely “Mon” terima kasih telah menjadi temen kamar yang menyenangkan dan selalu memberi dukungan,

(6)

Arindha & Lia “Temen Seperjuangan” Semangat kawan ayo wisuda bareng, Beta “Bebeb” Jangan kebanyakan nonton drama korea sedih ya. Untuk Efinda & Daris, Mega & D’Nita, Terima kasih atas dukungan, kebersamaan dan canda tawa selama ini.

10. Rekan-rekan mahasiswa Matematika Universitas Airlangga 2008, terima kasih atas kebersamaan selama ini.

11. Serta pihak-pihak lain yang tidak dapat disebutkan satu persatu, terima kasih atas segala bantuan dalam penyelesaian skripsi ini.

Penulis menyadari bahwa skripsi ini masih banyak terdapat kekurangan-kekurangan. Oleh karena itu, penulis mengharapkan kritik dan saran yang membangun agar skripsi ini dapat lebih baik lagi.

Surabaya, Juni 2012 Penyusun

(7)

Jatu Herlina Amurwani. 2012. Analisis Regresi Cox Proporsional dengan

Hazard Dasar Weibull pada Data Tersensor Tipe II. Skripsi ini dibawah

bimbingan Toha Saifudin S.Si, M.Si dan Drs. Suliyanto, M.Si. Departemen Matematika. Fakultas Sains dan Teknologi Universitas Airlangga.

ABSTRAK

Model regresi Cox proporsional merupakan model yang menggambarkan hubungan antara waktu survival sebagai variabel dependen dengan satu set variabel independen yang bisa kontinue ataupun kategorik. Secara umum bentuk model regresi Cox Proporsional dengan hazard dasar weibull adalah :

( ) ( )

dengan merupakan vektor dari variabel independen, merupakan vektor dari koefisien regresi, dan merupakan hazard dasar dari distribusi Weibull. Tujuan tulisan ini adalah mendapatkan estimator parameter regresi Cox dengan hazard dasar weibull pada data tersensor tipe II. Metode yang digunakan untuk mengestimasi parameter model adalah Maximum Likelihood. Estimator parameter regresi Cox dengan hazard dasar weibull pada data tersensor tipe II masih dalam bentuk implisit, sehingga diperlukan metode numerik untuk menyelesaikannya. Model selanjutnya diterapkan pada studi kasus pasien penderita Cardiovascular Diseases. Persamaan model regresi Cox proporsional dengan hazard dasar weibull pada data tersensor tipe II, hasil penerapan pada pasien penderita Cardiovascular Diseases adalah sebagai berikut :

̂ ( ) ( )( ) ( )

dengan adalah Sistolic Blood Pressure dan adalah Logaritm of Urinary Albumin and Creatin. Nilai residual Cox-snell dari model tersebut berdistribusi

eksponensial, sehingga dapat dikatakan model yang didapat sesuai atau tepat. Berdasarkan persamaan tersebut, diketahui bahwa resiko kematian pasien akan bertambah sebesar untuk setiap kenaikan SBP sebesar 10 satuan.

Sedangkan untuk variabel LACR, resiko kematian pasien akan bertambah sebesar 0,256563 untuk setiap kenaikan LACR sebesar 2 satuan.

Kata Kunci : Model Regresi Cox Proporsional dengan Hazard Dasar Weibull,

Regresi Cox, Proporsional Hazard, Data Tersensor Tipe II,

(8)

Jatu Herlina Amurwani. 2012. Analisis Regresi Cox Proporsional dengan

Hazard Dasar Weibull pada Data Tersensor Tipe II. This skripsi in under the

guidance by Toha Saifudin S.Si, M.Si and Drs. Suliyanto, M.Si. Mathematics departement of Scince and Technology Faculty. Airlangga University.

ABSTRACT

Cox proportional regression model is a model that describes the relationship between survival times as the dependent variable with a set of independent variables, which can be continuous or categorical. In general, the form of Cox proportional regression model with the baseline hazard Weibull is

( ) ( )

where is a vector of independent variables, is vector of regression coefficients, and are the baseline hazard of the Weibull distribution. The purpose of this paper is to obtain estimators Cox regression parameter with Weibull as the baseline hazard for type II censored.The method used to estimate the model is the Maximum Likelihood Estimator. The model was applied to case studies of patients with Cardiovascular Diseases. The equation of Cox proportional hazard in patients with Cardiovascular Diseases are as follows :

̂( ) ( )( ) ( )

where is Sistolic Blood Pressure and is Logaritm of Urinary Albumin and Creatine. Cox-Snell residual value of this model is distributed exponentially, so that it can be said that the model fit or just gained. Based on the results, it is known that the risk of dying patients would increase by 0.751572 for each increase in SBP of 10 units. While for the variable LACR, the risk of dying patients would increase by 0.256563 for each increase by 2 units LACR.

Keyword : Cox Proportional Regression Model with Baseline Hazard Weibull,

Cox Regression, Proportional Hazard, Type II censored data, Maximum Likelihood Estimator (MLE)

(9)

DAFTAR ISI

Halaman

LEMBAR JUDUL ... i

LEMBAR PERNYATAAN ... ii

LEMBAR PENGESAHAN ... iii

LEMBAR PEDOMAN PENGGUNAAN SKRIPSI ... iv

KATA PENGANTAR ... v

ABSTRAK ... vii

DAFTAR ISI ... ix

DAFTAR GAMBAR ... xii

DAFTAR TABEL ... xiii

DAFTAR LAMPIRAN ... xiv

BAB I PENDAHULUAN ... 1

1.1 Latar Belakang Permasalahan ... 1

1.2 Rumusan Masalah ... 4

1.3 Tujuan ... 4

1.4 Manfaat ... 5

1.5 Batasan Masalah ... 5

BAB II TINJAUAN PUSTAKA ... 6

2.1 Analisis Regresi ... 6

2.2 Analisis Data Uji Hidup ... 7

2.3 Tipe Penyensoran ... 8

2.4 Fungsi Survival dan Fungsi Hazard ... 9

2.5 Distribusi Weibull ... 13

2.6 Model Regresi Dalam Analisis Data Uji Hidup ... 14

(10)

2.8 Fungsi Likelihood ... 17

2.9 Maximum Likelihood Estimator ... 18

2.10 Estimasi Fungsi Survival ... 18

2.11 Residual Cox – Snell ... 19

2.12 Metode Newton Rapshon ... 21

2.13 Titik Maksimum ... 22

2.14 Matrik Definit Negatif ... 23

2.15 S-Plus ... 23

2.16 Cardiovascular Diseases ... 25

2.17 Interpretasi Model Proporsional Hazard ... 30

BAB III METODE PENELITIAN ... 32

BAB IV PEMBAHASAN ... 34

4.1 Model Regresi Cox dengan Hazard Dasar Weibull ... 34

4.1.1 Menentukan Fungsi Hazard Dasar Weibull ... 35

4.1.2 Mendapatkan Model Regresi Cox dengan Hazard Dasar Weibull ... 35

4.1.3 Menetukan Fungsi Survival dan PDF yang berhubungan dengan Hazard Dasar Weibull ... 35

4.2 Estimasi Parameter dalam Model Regresi Cox ... 36

4.2.1 Menentukan Fungsi Likelihood dari Model Regresi Cox dengan Hazard Dasar Weibull... 36

4.2.2 Menentukan Fungsi Log-Likelihood ... 37

4.2.3 Menentukan Turunan Pertama Fungsi Log Likelihood Terhadap Parameter ... 38

4.2.4 Mendapatkan Estimator Parameter ... 39

4.2.5 Menentukan Turunan Kedua Fungsi Log Likelihood ... 40

4.3 Estimasi Residual Cox – Snell ... 45

(11)

4.5 Algoritma untuk Estimasi Residual Cox – Snell ... 49

4.6 Program Estimasi Parameter Model Regresi Cox dengan Hazard Dasar Weibull... 49

4.7 Penerapan Pada Kasus Data Uji Hidup ... 50

4.7.1 Uji Kesesuaian Distribusi Weibull pada data waktu Tahan Hidup pasien Cardiovascular Disease ... 50

4.7.2 Asumsi Hazard Proporsional ... 51

4.7.3 Estimasi Parameter ... 65

4.7.4 Model Regresi Cox Proporsional untuk Data CVD ... 67

4.7.5 Uji Residual Cox – Snell ... 68

4.7.6 Resiko Kematian Pasien Cardiovascular Disease ... 69

BAB V KESIMPULAN ... 71

DAFTAR PUSTAKA ... 73 LAMPIRAN

(12)

DAFTAR GAMBAR

Nomor Judul Gambar Halaman

2.1 Kurva Fungsi Survival ... 10

2.2 Kurva Distribusi Kumulatif Weibull ... 13

4.1 Plot Asumsi Hazard Proporsional Variabel DG ... 52

4.2 Plot Asumsi Hazard Proporsional Variabel AGE ... 54

4.3 Plot Asumsi Hazard Proporsional Variabel SEX ... 55

4.4 Plot Asumsi Hazard Proporsional Variabel SMOKE ... 56

4.5 Plot Asumsi Hazard Proporsional Variabel BMI ... 58

4.6 Plot Asumsi Hazard Proporsional Variabel SBP ... 59

4.7 Plot Asumsi Hazard Proporsional Variabel LACR ... 60

4.8 Plot Asumsi Hazard Proporsional Variabel LTG ... 62

4.9 Plot Asumsi Hazard Proporsional Variabel HTN ... 63

(13)

DAFTAR TABEL

Nomor Judul Tabel Halaman

4.1 Nilai-nilai penduga Kaplan Meier dari fungsi Survival

variabel Jenis penyakit (DG) ... 52 4.2 Nilai-nilai penduga Kaplan Meier dari fungsi Survival

variabel Usia (AGE) ... 53 4.3 Nilai-nilai penduga Kaplan Meier dari fungsi Survival

variabel Jenis kelamin (SEX) ... 54 4.4 Nilai-nilai penduga Kaplan Meier dari fungsi Survival

variabel intensitas merokok (SMOKE) ... 56 4.5 Nilai-nilai penduga Kaplan Meier dari fungsi Survival

variabel indeks masa tubuh (BMI) ... 57 4.6 Nilai-nilai penduga Kaplan Meier dari fungsi Survival

variabel tekanan darah sistole (SBP)... 58 4.7 Nilai-nilai penduga Kaplan Meier dari fungsi Survival

variabel Algoritma Albumin dan kreatin (LACR) ... 60 4.8 Nilai-nilai penduga Kaplan Meier dari fungsi Survival

variabel Algoritma Trigliserin (LTG) ... 61 4.9 Nilai-nilai penduga Kaplan Meier dari fungsi Survival

variabel status hipertensi (HTN) ... 62 4.10 Nilai-nilai penduga Kaplan Meier dari fungsi Survival

variabel status diabetes (DM)... 64 4.11 Nilai Estimator Awal Dari Data Tahan Hidup Pasien

Penderita Penyakit Kardiovaskuler. ... 66 4.12 Nilai Estimator Parameter ̂ Dari Data Tahan Hidup Pasien

Penderita Penyakit Kardiovaskuler ... 66 4.13 Nilai Residual Pada Data Tahan Hidup Pasien Penderita Penyakit

(14)

DAFTAR LAMPIRAN

Nomor Judul Lampiran

1. Data Pasien Penderita Cardiovascular Disease (CVD).

2. Uji Kesesuaian Distribusi Weibull pada Kasus Data Tahan Hidup Pasien Penderita Cardiovascular Disease (CVD).

3. Program Untuk Menentukan Estimator Parameter Model Regresi Cox Proporsional Hazard.

a. Subprogram Untuk Mendapatkan Turunan Pertama. b. Subprogram Untuk Mendapatkan Matrik Jacobian. c. Subprogram Untuk Mendapatkan Estimator Parameter.

.

4. Program Untuk Mendapatkan Nilai Residual Cox – Snell.

5. Output Program Untuk Menentukan Parameter Model

Regresi Cox Proporsional dengan Hazard Dasar Weibull. a. Nilai estimator parameter regresi Cox

b. Nilai Eigen matriks Hessian c. Uji residual Cox Snell

(15)

BAB I

PENDAHULUAN

1.1 Latar belakang

Statistika merupakan suatu alat yang memegang peranan penting dalam pengambilan keputusan. Banyak sekali peranan ilmu statistika dalam pengambilan keputusan, salah satunya adalah di dunia medis atau kesehatan.

Analisis data uji hidup merupakan salah satu teknik statistika yang banyak digunakan dalam bidang kesehatan. Di dunia kesehatan, sulit sekali untuk mengetahui lamanya tahan hidup seorang pasien dalam pengobatan suatu penyakit, apalagi untuk menentukan waktu kesembuhan atau kambuhnya suatu penyakit. Namun, hal yang bisa kita lakukan adalah mengetahui sifat karakteristik dari penyakit tersebut, antara lain : menganalisis peluang ketahanan, resiko kematian, memodelkan sifat karakteristik penyakit, menentukan estimasi interval kepercayaan dan mengambil kesimpulan yang berhubungan dengan penyakit tersebut.

Dalam kehidupan nyata khususnya di dunia kesehatan, banyak sekali situasi yang melibatkan populasi heterogen, sehingga penting untuk mempertimbangkan hubungan waktu tahan hidup seseorang dengan faktor lain. Satu-satunya jalan untuk menguji hubungan dari variabel bebas yang sesuai dengan waktu tahan hidup seseorang adalah dengan menggunakan model regresi, dengan ketergantungan waktu tahan hidup pada variabel yang sesuai dengan tegas dikenali. Dalam analisis data uji hidup terdapat dua model regresi yang sering

(16)

digunakan yaitu : model proporsional hazard untuk T dan model lokasi skala untuk log T.

Model tersebut selanjutnya diperluas pada situasi dimana resiko kematian pada waktu tertentu tergantung pada nilai dari variabel bebas . Himpunan nilai variabel bebas dari model proporsi hazard dapat dinyatakan dengan vektor , yaitu = . Model regresi Cox proporsional hazard untuk pengamatan ke- dari individu dapat dituliskan sebagai berikut :

Model regresi Cox merupakan model hazard proporsional dasar yaitu rasio

hazardnya sama sepanjang waktu atau rasio hazardnya independen dengan waktu

(Fahrmer dan Tutz,1994). Model ini dikemukakan oleh Cox dan lebih dikenal

dengan regresi Cox, dimana merupakan vektor dari variabel bebas, dan merupakan koefisien regresi yang membentuk vektor , sedangkan merupakan fungsi hazard untuk individu dengan semua nilai variabel bebasnya yang memuat vektor x sama dengan nol, dinamakan hazard dasar (baseline

hazard function) (Collet, 1994).

Fungsi hazard untuk setiap individu adalah yang diasumsikan berdistribusi Weibull dengan λ adalah parameter skala dan γ adalah parameter bentuk, maka Model Cox dapat dituliskan sebagai berikut (Collet, 1994) :

(17)

Distribusi weibull yang digunakan sebagai hazard dasar merupakan salah satu distribusi yang banyak digunakan untuk menganalisis data uji hidup. Distribusi weibull memiliki berbagai kelebihan yang tidak dimiliki oleh distribusi lain seperti : memiliki 2 parameter yaitu parameter bentuk dan parameter skala, parameter bentuk yang dimiliki oleh distribusi weibull menjadikan distribusi ini lebih fleksibel atau bisa menyerupai distribusi lain.

Model regresi Cox proporsional hazard merupakan regresi survival, dengan respon merupakan data waktu survival sampai suatu titik kejadian yang ditentukan. Karakteristik utama model regresi Cox ini adalah mengakomodasikan adanya data sensor. Di dalam analisis data uji hidup dikenal beberapa tipe penyensoran, diantaranya adalah sampel tersensor tipe II. Sampel tersensor tipe II ini memiliki kelebihan yaitu lebih efisien waktu, karena percobaan akan dihentikan ketika sudah mencapai kegagalan yang diinginkan, dengan ketentuan .

Karakteristik analisis survival yang mengakomodasi adanya sensoring inilah yang membuat estimasi parameter pemodelan data survival dengan fungsi

likelihood semakin komplek (Fox,2002). Pada kasus dimana satu atau lebih data

tersensor tipe II, maka fungsi likelihood-nya dapat ditulis sebagai berikut |

{∏

}

dengan menyatakan data waktu survival, menyatakan banyak data survival, dan menyatakan banyak kematian / kegagalan pertama yang diinginkan untuk diuji.

(18)

Berdasarkan uraian diatas, penulis tertarik untuk mengambil judul “Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II” dan selanjutnya menerapkan hasilnya pada data riil.

1.2 Rumusan Masalah

Berdasarkan latar belakang yang telah diuraikan, dapat dirumuskan permasalahan :

1 Bagaimana bentuk model regresi Cox proporsional dengan hazard dasar weibull ?

2 Bagaimana memperoleh estimator parameter model regresi Cox dengan hazard dasar Weibull pada data tersensor tipe II ?

3 Bagaimana menerapkan model regresi Cox melalui studi kasus pada data riil ?

1.3 Tujuan

Berdasarkan rumusan masalah diatas, tujuan yang ingin dicapai adalah untuk :

1 Mendapatkan bentuk model regresi Cox proporsional dengan hazard dasar weibull

2 Mendapatkan estimator parameter model regresi Cox dengan hazard dasar Weibull pada data tersensor tipe II

(19)

1.4 Manfaat

Manfaat dari penulisan skripsi ini adalah sebagai berikut :

1 Memperluas wawasan tentang metode analisis regresi yang biasa digunakan untuk menganalisa data survival

2 Dapat memodelkan regresi data survival secara umum dan metode

Cox secara khusus.

3 Mampu menerapkan dan mengaplikasikan model regresi tersebut ke dalam data riil.

1.5 Batasan masalah

Mengacu pada rumusan masalah yang telah disebutkan, maka ruang lingkup dalam penulisan skripsi ini dibatasi pada estimasi titik parameter regresi dengan metode maksimum likelihood pada data tersensor tipe II.

(20)

BAB II

TINJAUAN PUSTAKA

2.1 Analisis Regresi

Sir Francis Galton (1822-1911), seorang antropolog dan ahli meteorologi

terkenal dari Inggris yang memperkenalkan istilah regresi dalam pidato di depan

Section H of the British Association di Aberdem, 1885, yang dimuat dalam

majalah Nature, dan juga dalam sebuah makalah “Regression Towards Mediocrity

in Hereditary Stature”, yang dimuat dalam journal of the Antropolgical Institute,

1985.

(Drapper dan Smith,1992)

Analisis regresi merupakan salah satu teknik yang ada dalam statistika, secara umum ada beberapa definisi yang menjelaskan tentang analisis regresi yaitu :

Definisi 2.1

Analisis regresi merupakan teknik statistik untuk menyelidiki dan membuat model hubungan diantara variabel-variabel.

(Montgomery dan Peck,1992) Definisi 2.2

Tujuan dari analisis regresi yaitu untuk mendapatkan model terbaik yang menggambarkan hubungan antara variabel respon (variabel tak

(21)

bebas/variabel dependen) dan variabel prediktor (variabel bebas/variabel independen) .

(Hosmer dan Lemeshow, 1989) Definisi 2.3

Variabel prediktor ialah variabel yang nilainya dapat ditentukan atau yang nilainya dapat diamati namun tidak dapat dikendalikan. Variabel respon ialah variabel yang nilainya dipengaruhi oleh perubahan-perubahan variabel-variabel prediktor.

(Drapper dan Smith,1992)

Di dalam kehidupan nyata banyak sekali teknik statistika yang dapat digunakan untuk menganalisis masalah. Salah satu teknik analisis statistika yang digunakan untuk menganalisis data yang berhubungan dengan waktu tahan hidup adalah analisis data uji hidup.

2.2 Analisis Data Uji Hidup

Analisis data uji hidup (Survival analysis) adalah suatu metode untuk menganalisis data yang berhubungan dengan waktu, mulai dari time origin atau

start-point sampai dengan terjadinya suatu kejadian khusus atau end point. Di

dalam riset medis, time origin sering digunakan sebagai awal perekrutan suatu individu dalam suatu studi yang bersifat percobaan sedangkan end-point merupakan kematian suatu individu atau pasien, sehingga data yang dihasilkan secara harfiah dinamakan waktu survival.

(22)

Untuk mendapatkan data uji hidup biasanya dilakukan eksperimen. Dalam melakukan eksperimen ada beberapa metode yang dilakukan sehingga data yang dihasilkan juga berbeda dari satu metode ke metode lain. Yang membedakan analisis uji hidup dengan bidang-bidang yang lain pada statistika adalah penyensoran.

2.3 Tipe Penyensoran

Di dalam analisis data uji hidup terdapat beberapa tipe penyensoran yaitu sampel lengkap, sampel tersensor tipe I, dan sampel tersensor tipe II. Penjelasan lengkapnya adalah sebagai berikut :

2.3.1 Sampel Lengkap

Pada uji sampel lengkap, eksperimen akan dihentikan jika semua benda atau individu yang telah diuji mati atau gagal. Langkah seperti ini mempunyai suatu keuntungan yaitu dihasilkannya observasi terurut dari semua benda atau individu yang diuji.

(Lawless,1982) 2.3.2 Sampel Tersensor Tipe I

Dalam sampel tersensor tipe I, eksperimen akan dihentikan jika telah dicapai waktu tertentu (waktu penyensoran). Misalkan adalah sampel

random dari distribusi tahan hidup dengan fungsi kepadatan peluang , fungsi survival dan waktu tersensor untuk semua yaitu dengan .

Suatu komponen dikatakan terobservasi jika dan tersensor jika . Selanjutnya data sampel uji hidup dicatat sebagai dan :

(23)

{ dimana adalah nilai sensor pada pengamatan ke-i

(Lawless, 1982) 2.3.3 Sampel Tersensor Tipe II

Pada pengujian sampel tersensor tipe II, eksperimen akan dihentikan setelah kematian ke- dari komponen yang dioperasikan tercapai. Misalkan adalah sampel random dari distribusi tahan hidup dengan fungsi kepadatan peluang dan fungsi survival . Eksperimen dikatakan telah selesai jika kegagalan ke- telah dicapai ( .

(Lawless, 1982)

Dalam analisis data survival ada dua macam fungsi yang dapat memberikan informasi tentang data survival, yaitu fungsi survival dan fungsi

hazard.

2.4 Fungsi Survival dan Fungsi Hazard

Fungsi survival merupakan dasar dari analisis survival, karena meliputi probabilitas survival dari waktu yang berbeda-beda yang memberikan informasi penting tentang data survival. Dalam analisis data uji hidup fungsi survival dapat didefinisikan :

Definisi 2.4

Fungsi survival disefinisikan sebagai probabilitas waktu yang bertahan lebih besar atau sama dengan waktu.

(24)

Jika diketahui fungsi distribusi kumulatif , yaitu :

∫ , (2.1) maka bisa diperoleh fungsi survival sebagai berikut :

(2.2)

(Kleinbaum dan Klein, 2005)

Secara teori, fungsi survival dapat digambarkan dengan kurva mulus dan memiliki karakteristik sebagai berikut:

1. Tidak meningkat, kurva cenderung turun ketika meningkat.

2. Untuk , adalah awal dari penelitian, karena tidak ada objek yang mengalami peristiwa, probabilitas waktu survival 0 adalah 1.

3. Untuk secara teori, jika periode penelitian meningkat sampai tak berhingga maka tidak ada satu pun yang bertahan, sehingga kurva survival mendekati nol.

(25)

Berbeda dengan fungsi survival yang fokus pada tidak terjadinya peristiwa, fungsi hazard fokus pada terjadinya peristiwa. Oleh karena itu, fungsi

hazard dapat dipandang sebagai pemberi informasi yang berlawanan dengan

fungsi survival.

(Kleinbaum dan Klein, 2005)

Kurva fungsi hazard juga memiliki karakteristik, yaitu:

1. Selalu non negatif, yaitu sama atau lebih besar dari nol. 2. Tidak memiliki batas atas.

Selain itu fungsi hazard juga digunakan untuk alasan : 1. Memberikan gambaran tentang failur rate. 2. Mengidentifikasi bentuk model yang spesifik.

3. Membuat model matematik untuk analisis survival biasa.

Misalkan melambangkan waktu survival dari waktu awal sampai terjadinya peristiwa yang merupakan variabel acak yang memiliki karakteristik fungsi survival dan fungsi hazard, maka fungsi hazard didefinisikan :

Definisi 2.5

Fungsi hazard didefinisikan sebagai tingkat kematian sesaat suatu individu pada waktu .

(Kleinbaum dan Klein, 2005)

Misal, probabilitas variabel random berada antara dan , dengan syarat lebih besar atau sama dengan , ditulis sebagai berikut :

(26)

Maka fungsi hazard yang didapat adalah { | } { } { }

atau dapat juga ditulis sebagai berikut : { } (2.3) karena sehingga diperoleh

{

} {

} {

} * ∫ + (2.4) dengan ∫ disebut fungsi hazard kumulatif

(Collet, 1994).

Di dalam analisis data uji hidup terdapat beberapa distribusi yang dapat digunakan sebagai asumsi, salah satunya adalah distribusi Weibull.

(27)

2.5 Distribusi Weibull

Fungsi kepadatan peluang (fkp) dari distribusi Weibull dua parameter, diformulasikan sebagai : , ( ) - (2.5) dengan : (Lawless, 2003)

Jika maka fungsi kepadatan peluang (fkp) dari waktu survival yang berdistribusi weibull dengan dua parameter adalah

(2.6) dengan :

Berdasarkan fkp dalam persamaan (2.6), diperoleh fungsi distribusi kumulatif weibull adalah sebagai berikut :

(28)

Sehingga persamaan (2.2) fungsi survivalnya dapat dituliskan sebagai berikut :

maka diperoleh fungsi hazard weibull :

(2.7)

(Collet, 1994)

Dalam kehidupan nyata khususnya di dunia medis, banyak situasi yang melibatkan populasi heterogen, sehingga penting untuk mempertimbangkan hubungan waktu tahan hidup dengan faktor lain. Satu-satunya jalan untuk menguji hubungan dari variabel bebas yang sesuai dengan waktu tahan hidup yaitu menggunakan model regresi, dimana ketergantungan waktu tahan hidup pada variabel yang sesuai dengan tegas dikenali.

2.6 Model Regresi dalam Analisi Data Uji Hidup

Dalam analisis data uji hidup terdapat dua model regresi yang sering digunakan untuk menganalisis data survival yaitu :

2.6.1 Model Proporsional Hazard untuk T

Model proporsional hazard merupakan model yang mengasumsikan bahwa perbedaan antar individu dalam sekelompok data yang hendak dianalisis mempunyai fungsi hazard yang proporsional satu sama lain. Hal ini berarti bahwa rasio ⁄ merupakan fungsi hazard dari dua individu dengan vektor regresi tidak tergantung pada Dengan kata lain fungsi hazard untuk , dengan

(29)

(2.8) dengan merupakan fungsi hazard dasar (baseline hazard functio) dan merupakan fungsi yang menyatakan pengaruh terhadap hazard.

(Lawless, 1982)

2.6.2 Model Lokasi Skala untuk Log T.

Bagian terpenting kedua dari model regresi dalam analisis data uji hidup adalah log waktu tahan hidup , diberikan , mempunyai suatu distribusi dengan parameter lokasi dan parameter skala tetap dapat ditulis sebagai berikut :

, (2.9) dimana dan galat model mempunyai distribusi yang independen terhadap . Biasanya memiliki distribusi normal standart.

(Lawless, 1982)

Kedua model diatas merupakan model yang digunakan untuk menganalisis data survival secara umum, namun bila ada variabel-variabel bebas yang ingin dikontrol atau bila menggunakan beberapa variabel penjelas untuk menjelaskan hubungan antara waktu survival, maka regresi Cox lah yang digunakan.

2.6 Model Regresi Cox Proporsional Hazard

Regresi Cox proporsional hazard digunakan bila respon yang diobservasi adalah data waktu survival (Kleinbaum dan Klein, 2005). Pada mulanya pemodelan ini digunakan pada cabang statistika khususnya biostatistika yaitu

(30)

digunakan untuk menganalisis kematian atau harapan hidup seseorang. Namun seiring perkembangan zaman pemodelan ini banyak dimanfaatkan diberbagai bidang. Diantaranya bidang akademik, kedokteran, sosial, science, teknik, pertanian dan sebagainya.

Ketika menyelidiki suatu kasus dibidang kedokteran contohnya kasus pasien penderita penyakit tertentu, dibutuhkan hubungan waktu survival pasien dengan karakteristik-karakteristik klinis lainnya yang didapat dari data medis pasien.

Formula model Cox merupakan perkalian dari dua besaran yaitu fungsi

baseline hazard dan bentuk eksponensial untuk penjumlahan linier dari yaitu

penjumlahan dari variabel independen (Kleinbaum dan Klein, 2005).

Model regresi Cox ini berlaku pada situasi dimana resiko kematian pada waktu tertentu tergantung pada nilai-nilai dari variabel bebas Himpunan nilai variabel bebas dari model proporsional hazard dapat dinyatakan dengan x, sehingga )’. Model proporsional

hazard untuk pengamatan ke- dari individu secara umum :

(2.10)

dengan merupakan vektor dari variabel bebas, dan merupakan vektor dari koefisien regresi. Sedangkan merupakan fungsi

hazard untuk individu yang mana semua nilai variabel bebasnya memmuat vektor

x sama dengan nol, dinamakan hazard dasar (baseline hazard function).

(31)

Metode estimasi yang digunakan dalam skripsi ini adalah metode estimasi

maximum likelihood. Ketika menggunakan metode ini, hal yang harus diketahui

adalah tentang fungsi likelihood.

2.8 Fungsi Likelihood Definisi 2.6

Misalkan adalah variabel random yang identik dan independen dari suatu distribusi dengan fungsi kepadatan peluang (fkp) untuk dan adalah ruang parameter. Fkp bersama antara adalah . Jika fkp bersama tersebut dinyatakan sebagai fungsi terhadap maka dinamakan fungsi

likelihood (L) yang dinyatakan sebagai :

(Hogg dan Craig, 1978) Definisi 2.7

Pada kasus dimana terdapat satu atau lebih data survival yang tersensor tipe II, maka fungsi likelihood-nya dapat dituliskan sebagai :

|

dengan menyatakan data waktu survival, menyatakan jumlah kematian / kerusakan yang diinginkan dalam pengujian dan menyatakan banyaknya data yang sedang diuji.

(32)

Setelah mendapatkan fungsi likelihood, langkah selanjutnya dalam estimasi parameter menggunakan MLE adalah mendapatkan nilai maksimum

likelihood.

2.9 Maksimum Likelihood Estimator (MLE) Definisi 2.8

Jika statistik ̂ memaksimumkan fungsi likelihood maka statistik ̂ dinamakan

maksimum likelihood estimator (MLE) dari .

(Hogg and Craig, 1978)

Karena fungsi survival merupakan dasar dari analisis data tahan hidup. Maka ketika menggunakan model regresi Cox proporsional dengan hazard dasar Weibull sebagai asumsi, maka hal yang harus dilakukan adalah mengestimasi fungsi survival.

2.10 Estimasi Fungsi Survival

Estimasi fungsi survival dasar dari model regresi Cox dengan hazard dasar weibull dapat diperoleh dengan persamaan berikut :

̂ ̂ ̂ (2.12) Estimasi fungsi hazard dasar kumulatif dari model regresi Cox dengan

hazard dasar weibull dapat diperoleh dengan persamaan sebagai berikut :

(33)

Dari estimasi fungsi survival dasar dan fungsi hazard dasar kumulatif diatas maka dapat diperoleh estimasi fungsi survival pengamatan ke- dan fungsi

hazard kumulatif pengamatan ke- , yaitu :

̂ ̂ ̂ , (2.14) dan

̂ [ ̂ ] ̂ (2.15)

(Collet, 1994)

Setelah fungsi survival didapat, maka model secara langsung juga akan didapatkan. Untuk menguji kesesuaian model dilakukan pengujian terhadap residual dari setiap pengamatan menggunakan residual Cox Snell.

2.11 Residual Cox – Snell

Setelah suatu model didapat, perlu dilakukan pemeriksaan terhadap kesesuaian dari model tersebut. Banyak prosedur pemeriksaan model yang digunakan, salah satunya residual Cox snell. Residual Cox snell untuk individu ke- dengan diberikan berikut :

̂ ( ̂ ) (2.16) dengan ̂ merupakan estimasi fungsi hazard dasar kumulatif pada waktu , fungsi tersebut dapat diselesaikan menggunakan persamaan (2.13). dari persamaan (2.14) residual Cox snell merupakan nilai dari ̂ ̂ dimana ̂ dan ̂ merupakan nilai estimasi dari fungsi

(34)

hazard kumulatif dan fungsi survival untuk individu ke- pada waktu Model

dikatakan layak jika nilai residual Cox-Snell berdistribusi eksponensial.

(Collet, 1994) Teorema 2.1 :

Jika T merupakan variabel random dari waktu survival setiap pengamatan dan merupakan fungsi survival, maka varabel random berdistribusi eksponensial (Collet, 1994).

Bukti teorema 2.1 : { }

Fungsi densitas probabilitas dari variabel random diberikan sebagai berikut :

{ } | |

(35)

{ } { }

Terbukti bahwa variabel random berdistribusi eksponensial. Ketika mengestimasi parameter, terdapat kemungkinan bahwa estimasi tersebut tidak diperoleh secara langsung seperti adanya fungsi implisit, oleh karena itu diperlukan suatu metode numerik untuk mendapatkan nilai estimator. Salah satu metode yang digunakan untuk mendapatkan nilai estimator adalah metode Newton Raphson.

2.12 Metode Newton – Raphson

Misalkan terdapat bentuk implisit dari dengan maka iterasi Newton Raphson adalah sebagai berikut :

(2.17) dengan ( ) maka ( ) dan [ ] dengan :

adalah vektor berukuran pada iterasi ke . matrik jacobian pada saat .

(36)

Adapun langkah-langkah dalam metode Newton Raphson adalah sebagai berikut : 1. Menentukan nilai awal estimator untuk

2. Menentukan .

3. Menghitung estimator berikutnya menggunakan (2.17).

4. Mengulangi iterasi sampai diperoleh nilai max | | dengan adalah konstanta positif yang ditentukan.

(Lee dan Wang, 2003)

Nilai estimator parameter yang di dapatkan merupakan nilai yang dapat memaksimumkan fungsi likelihood, untuk memperoleh hal itu banyak ketentuan yang harus dipenuhi salah satunya mengenai titik maksimum. Selain itu, ketika menggunakan metode numerik, ketentuan yang harus dipenuhi adalah mendapatkan nilai eigen matrik hessian.

2.13 Titik Maksimum

Jika fungsi mempunyai titik maksimum di maka

(Bacon, 1985)

Matrik hessian adalah matrik simetri A yang berisi persilangan turunan parsial dari dengan Syarat untuk

(37)

maksimum dari fungsi adalah jika matrik hessian merupakan matrik definit negatif.

(Jong dan Heller, 2008)

Ketentuan tentang matrik definit negatif adalah sebagaimana teorema dibawah ini :

2.14 Matrik Definite Negatif Teorema 2.2

Sebuah matrik simetri A disebut definit negatif jika dan hanya jika semua nilai eigen dari matrik A bernilai negatif.

Bukti Teorema 2.2 ( Lihat hal 709)

(Anton dan Rorres, 2005)

Untuk menerapkan semua algorima dalam pengestimasian program, diperlukan suatu software khusus yang memungkinkan membuat program sendiri. Salah satu software yang mampu membuat program sendiri adalah S-Plus.

2.15 S-PLUS

S-PLUS adalah suatu paket program yang memungkinkan membuat program sendiri walaupun didalamnya sudah tersedia banyak program internal yang siap digunakan. Kelebihan dari paket program ini adalah baik program internal maupun program yang pernah dibuat digunakan sebagai sub program yang akan dibuat. Beberapa perintah internal yang digunakan dalam S-Plus antara lain :

(38)

a. function(...)

function digunakan untuk menunjukkan fungsi yang akan digunakan dalam program.

bentuknya adalah : function(...) b. length(....)

length(...) merupakan perintah untuk menunjukkan banyaknya data. c. matrix(....)

untuk membentuk sebuah matrik yang anggotanya a dengan jumlah baris sebanyak b dan jumlah kolom sebanyak c.

d. for(....)

untuk melakukan pengulangan sebanyak n kali. Bentuknya adalah ; for(...)

e. abs(....)

untuk membuat harga mutlak dari suatu bilangan. Bentuknya adalah : abs(...)

f. sum(...)

untuk menjumlahkan semua bilangan anggota dari suatu vektor. Bentuknya adalah : sum(...)

(Everitt , 1944) Program yang udah didapat selanjutnya ditetapkan pada data tahan hidup pasien. Dalam skripsi ini dugunakan data tahan hidup pasien penderita penyakit Cardiovascular Disease .

(39)

2.16 Cardiovascular Diseases (CVD) 2.16.1 Pengertian

CVD atau Cardiovascular Diseases merupakan permasalahan yang sangat menarik untuk diteliti. Fakta dari WHO menyebutkan bahwa CVD merupakan penyebab utama kematian diseluruh dunia, yang mengakibatkan 17,5 juta kematian setiap tahunnya. Sebanyak 7,6 juta orang meninggal karena serangan jantung dan 5,7 juta meninggal karena stroke setiap tahunnya. Kematian global akibat penyakit kardiovaskular diperkirakan mencapai sekitar 25 juta orang pada tahun 2020.

Cardiovascular Diseases adalah istilah bagi serangkaian gangguan yang

menyerang jantung (kardio) dan pembuluh darah (vaskular), termasuk penyakit jantung koroner, penyakit serebravaskular, dan penyakit vaskular porifer. Penyakit kardiovaskular juga mencakup penyakit lain seperti kerusakan jantung. Penyakit kardiovaskular berhubungan dengan kondisi serangan jantung , angina dan stroke.

(Medicastore, 2008)

2.16.2 Faktor Resiko

Faktor resiko adalah faktor yang meningkatkan terjadinya sesuatu. Didalam suatu studi medis, mengamati faktor resiko untuk mengurangi akibat negatif dari suatu penyakit adalah yang paling efektif untuk dilakukan. Faktor risiko ini dibagi menjadi dua kelompok, yang dapat dikendalikan dan yang tidak dapat dikendalikan.

Faktor risiko yang dapat dikendalikan meliputi kadar kolesterol darah yang tinggi (hiperkolesterolemia), hipertensi, diabetes mellitus, obesitas, dan gaya

(40)

hidup (kurang gerak, merokok, konsumsi alkohol berlebihan). Sementara faktor risiko yang tidak dapat dikendalikan meliputi usia, jenis kelamin, dan riwayat penyakit kardiovaskular dalam keluarga.

(Mediastore, 2008)

Adapun beberapa faktor resiko yang dapat meningkatkan resiko kematian pada penderita CVD adalah :

a. Tipe Penyakit Kardiovaskular

Konsekuensi langsung dari penyakit kardiovaskular adalah serangan stroke. Badan Kesehatan Dunia (WHO), memperkirakan penyakit kardiovaskular menjadi penyebab kematian nomor satu di seluruh dunia. Ada berbagai jenis penyakit kardiovaskular yang harus diwaspadai yaitu : serangan jantung, angina (nyeri dada), dan stroke.

b. Usia

Usia adalah faktor resiko terpenting dalam kasus penyakit kardiovaskular. Di duga 87% kematian akibat penyakit CVD dialami oleh orang yang berusia 60 tahun keatas. Selain itu, resiko kematian akan penyakit stroke semakin meningkat setiap tahunnya pada usia 55 tahun keatas. Banyak penelitian dilakukan untuk mengungkap hubungan meningkatnya tingkat kematian akibat CVD dengan usia penderita, salah satu temuan para peneliti berhubungan dengan level kolesterol seseorang. Kebanyakan level kolesterol meningkat seiring dengan meningkatnya usia seseorang.

(41)

c. Jenis kelamin

Pada umumnya lelaki memiliki resiko kematian akibat CVD lebih besar dari pada wanita sebelum menopausal, namun resiko kematian pada wanita yang sudah menopaus sama seperti pada lelaki. Sebuah penelitian yang dilakukan oleh WHO menyatakan bahwa perbedaan resiko kematian akibat CVD terhadap pria dan wanita disebabkan oleh perbedaan hormon. Untuk kebanyakan kasus, resiko kematian akibat CVD banyak menyerang para lelaki dibanding wanita. Karena pada wanita, hormon estrogen adalah hormon yang sangat dominan. Estrogen mampu melindungi tubuh seorang wanita dari efek dari metabolisme glukosa yang berlebihan, namun hormon estrogen yang dimiliki wanita ini menurun setelah terjadi menopause sehingga resiko kematian akibat CVD jadi semakin besar.

d. Smoke

Merokok juga merupakan salah satu faktor resiko pada penyakit CVD karena beberapa alasan yaitu : perokok memiliki peluang 2-4 kali lebih tinggi untuk mengidap penyakit jantung koroner dibanding bukan perokok, perokok memiliki resiko terkena stroke dua kali lebih besar dan merokok menurangi sirkulasi darah karena menyempitnya pembuluh darah dan arteri. Oleh karena itu, perokok 10 kali lebih berpeluang terkena penyakit pembuluh darah, termasuk disfungsi ereksi / impotensi. Selain itu merokok menyebabkan anurisma aorta abdomen (pelebaran lokal pembuluh darah aorta di perut). Resiko kematian akibat penyakit ini tinggi di kalangan perokok ketika pembuluh darah tersebut pecah.

(42)

e. BMI (Body Mass Indeks)

BMI dihitung sebagai berat badan dalam kilogram (kg) dibagi tinggi badan dalam meter dikuadratkan ( ) dan tidak terkait pada jenis kelamin. BMI secara signifikan berhubungan dengan kadar lemak tubuh. Saat ini, BMI secara internasional diterima sebagai alat untuk mengidentifikasikan kelebihan berat badan dan besitas. Orang-orang dengan BMI lebih yaitu kelebihan berat badan dan obesitas pada hakekatnya meningkatkan morbiditas dan mortalitas akibat hipertensi, stroke, penyakit jantung koroner, dyslipidemia dan diabetes mellitus tipe 2 (Hill,2005).

f. SBP (Sistole Blood Pressure)

Tekanan darah merujuk kepada tekanan yang dialami darah pada pembuluh arteri darah ketika darah di pompa oleh jantung ke seluruh anggota tubuh. Tekanan darah dibuat dengan mengambil dua ukuran dan biasa diukur seperti berikut - 120 /80 mmHg. Nomor atas (120) menunjukkan tekanan ke atas pembuluh arteri akibat denyut jantung, dan disebut tekanan sistole. Tekanan darah sistole digunakan untuk mendeteksi penyakit kardiovaskular sejak dini. Semakin tinggi tekanan darah sistole, maka resiko kematian akan semakin besar. Karena tekanan darah sistole yang tinggi bisa memicu hipertensi.

g. LACR (Logaritm of Albumin and Creatin)

Fungsi utama albumin dan kreatin adalah sebagai larutan penyangga dan memelihara tekanan onkotik. Tekanan onkotik yang ditimbulkan oleh albumin akan memelihara fungsi ginjal dan mengurangi edema pada saluran pencernaan dan dimanafaatkan dengan metode hemodilusi untuk mangani penderita stroke.

(43)

h. LTG (Logaritm of Trigliserin)

Trigliserin merupakan penyusun utama minyak nabati dan lemak hewani. Jadi dengan mengetahui kandungan trigliserin dalam tubuh , maka dapat digunakan untuk mengontrol kelebihan kolesterol untuk mengurangi resiko terkena CVD. Semakin tinggi level trigliserin dalam darah dapat meningkatkan resiko penyakit CVD.

i. HTN (Hipertensi Status)

Tekanan darah tinggi atau Hipertensi adalah kondisi medis dimana terjadi peningkatan tekanan darah secara kronis (dalam jangka waktu lama). Penderita yang mempunyai sekurang – kurangnya tiga bacaan tekanan darah yang melebihi 140/90 mmHg saat istirahat diperkirakan mempunyai tekanan darah tinggi. Menurut WHO, Tekanan darah yang selalu tinggi adalah salah satu faktor untuk stroke, serangan jantung, gagal jantung, dan aneurisma arterial, dan merupakan penyebab utama gagal ginjal kronis.

j. DM (Diabetes Status)

Menurut penelitian WHO, penderita diabetes memiliki resiko paling tinggi terkena penyakit CVD. Penyakit diabetes terjadi akibat adanya penimbunan gula dalam darah. Diabetes dapat menyebabkan komplikasi jangka panjang sepert serangan jantung koroner, stroke, kebutaan akibat glukoma, penyakit ginjal, dan luka yang tidak bisa sembuh akibat infeksi dan harus diamputasi.

(44)

2.17 Interpretasi Model Proporsional Hazard

Diketahui fungsi hazard model proporsional hazard adalah :

jika kita notasikan log natural dari fungsi hazard sebagai . Maka kita akan memperoleh bentuk log natural fungsi hazard sebagai berikut :

[ ] Perbedaan fungsi log-hazard untuk perubahan dari suatu bentuk menjadi adalah :

[ ] [ ] { [ ] } { [ ] }

Log hazard adalah bentuk fungsi yang cocok digunakan untuk mengetahui efek perubahan pada variabel prediktor. Untuk mempermudah perhitungan, kita bisa menggunakan Hazard Ratio (HR) seperti bentuk dibawah ini :

[ ]

Interpretasi koefisien untuk variabel kontinu adalah mengubah fungsi log-hazard dengan mengubah unit dari variabel kontinu menggunakan persamaan (2.19) . Dengan dan , sehingga diperoleh perubahan fungsi log-hazard sebagai berikut :

(45)

dengan menggunakan persamaan (2.20), maka diperoleh estimator hazard ratio sebagai berikut :

̂ Interpretasi dari nilai estimator diatas adalah resiko kematian variabel akan bertambah sebesar untuk setiap pertambahan unit variabel.

(46)

BAB III

METODE PENELITIAN

Metode penelitian yang digunakan dalam penyusunan skripsi ini adalah sebagai berikut :

1. Menyajikan definisi-definisi yang berhubungan dengan model regresi Cox 2. Menentukan bentuk model regresi Cox proporsional dengan hazard dasar

weibull dengan langkah sebagai berikut : a. Menentukan fungsi hazard weibull.

b. Mendapatkan bentuk model regresi Cox proporsional dengan hazard dasar weibull.

c. Menentukan fungsi survival dan Probability Density Function model regresi Cox yang berhubungan dengan fungsi hazard weibull.

3. Menentukan estimator parameter dari model regresi cox dengan hazard dasar weibull menggunakan metode maksimum likelihood dengan langkah sebagai berikut :

a. Menentukan fungsi likelihood dari model regersi cox dengan hazard

dasar weibull pada data tersensor tipe II.

b. Menentukan fungsi log-likelihood dari model regersi cox dengan

hazard dasar weibull pada data tersensor tipe II.

c. Menentukan turunan pertama fungsi log-likelihood terhadap parameter dan .

(47)

e. Jika persamaan pada langkah c merupakan fungsi implisit, maka persamaan diselesaikan dengan menggunakan metode Newton

Raphson.

4. Menyusun algoritma untuk mengestimasi parameter model regresi Cox dengan langakah sebagai berikut :

a. Menyusun algoritma untuk mendapatkan estimator parameter pada model regresi Cox berdasarkan langkah-langkah yang telah dibuat.

b. Menyusun algoritma untuk mendapatkan estimator residual Cox-Snell. 5. Menerapkan model regresi Cox pada data tahan hidup pasien

Cardiovaskular Diseases (CVD) dengan langkah-langkah sebagai berikut :

a. Membuat program berdasarkan algoritma yang telah dibuat dalam bahasa pemprograman yang ditulis dalah software S-Plus.

b. Inputkan data tahan hidup pasien penderita Cardiovascular Disease (CVD).

c. Menguji distribusi data tahan hidup pasien Cardiovascular Disease (CVD).

d. Estimasi parameter regresi dengan menggunakan program yang telah dibuat dalam software S-Plus.

e. Estimasi residual Cox-Snell dengan menggunakan program yang telah dibuat dalam software S-Plus.

f. Menguji residual Cox-Snell model yang telah didapat dari langkah e. g. Menginterpretasikan model proporsional hazard

(48)

BAB IV

PEMBAHASAN

Model regresi Cox merupakan model yang menggambarkan hubungan antara waktu survival sebagai variabel dependen dengan satu set variabel independen. Variabel independen ini bisa kontinu ataupun kategorik

Model Regresi Cox proporsional hazard untuk pengamatan ke- dari individu secara umum :

(4.1)

dengan merupakan vektor dari variabel bebas, dan merupakan vektor dari koefisien regresi. Sedangkan merupakan fungsi

hazard untuk individu yang mana semua nilai variabel bebasnya membuat vektor

sama dengan nol, dinamakan hazard dasar (baseline hazard function).

4.1 Model Regresi Cox Dengan Hazard Dasar Weibull

Formula model Cox merupakan perkalian dari dua besaran yaitu fungsi

baseline hazard dan bentuk eksponensial untuk penjumlahan linier dari yaitu

penjumlahan dari variabel independen . Jika baseline hazardnya digunakan distribusi Weibull maka kita akan menemukan bentuk model regresi Cox proporsional dengan hazard dasar Weibull dengan langkah-langkah sebagai berikut :

(49)

4.1.1 Menentukan Fungsi Hazard Weibull

Sebelum membuat model regresi Cox proporsional dengan hazard dasar Weibull, terlebih dahulu harus mengetahui fungsi hazard Weibull. Menurut persamaan (2.6) Fungsi hazard dasar Weibull adalah sebagai berikut :

(4.2)

4.1.2 Mendapatkan Model Regresi Cox dengan Hazard Dasar Weibull

Sesuai dengan persamaan (2.10) maka model regresi Cox proporsional

hazard untuk pengamatan ke- dari individu secara umum adalah :

dengan merupakan baseline hazard dari distribusi tertentu. Jika baseline

hazard yang digunakan adalah fungsi hazard dari distribusi Weibull, sesuai

dengan persamaan (4.2), maka akan diperoleh model regresi Cox dengan hazard dasar Weibull sebagai berikut :

(4.3)

4.1.3 Menentukan Fungsi Survival dan Probability Density Function Model Regresi Cox yang Berhubungan dengan Fungsi Hazard Weibull

Setelah diperoleh fungsi hazard yang berhubungan dengan hazard dasar Weibull, langkah berikutnya adalah menentukan fungsi survival model regresi Cox yang berhubungan dengan hazard dasar Weibull. Dengan menggunakan persamaan (2.4) maka diperoleh fungsi survival yang berhubungan dengan hazard dasar Weibull sebagai berikut :

(50)

Setelah diketahui fungsi hazard dan fungsi survival yang berhubungan dengan distribusi Weibull. Selanjutnya dapat diperoleh Probability Density

Function (PDF) yang berhubungan dengan hazard dasar Weibull. Dengan

menggunakan persamaan (2.3) diperoleh model regresi Cox proporsional dengan

hazard dasar Weibull sebagai berikut :

(4.5)

4.2 Estimasi Parameter dalam Model Regresi Cox

Untuk menentukan estimasi parameter dari model regresi Cox dengan

hazard dasar Weibull, metode yang digunakan adalah Maximum Likelihood

Estimator (MLE), dengan langkah-langkahnya sebagai berikut :

4.2.1 Menentukan Fungsi Likelihood dari Model Regresi Cox dengan

Hazard Dasar Weibull pada Data Tersensor Tipe II.

Fungsi likelihood pada kasus data tersensor tipe II adalah sebagai berikut : |

dimana menyatakan waktu tahan hidup pasien yang diamati,

menyatakan jumlah kematian atau kerusakan yang diinginkan dan menyatakan banyaknya data yang diamati. Fungsi likelihood untuk data tersensor tipe II dengan menggunakan hazard dasar Weibull.

Diketahui fungsi survival yang berhubungan dengan hazard dasar Weibull adalah

(51)

dan diketahui Probability Density Function (PDF) Weibull proporsional hazard adalah

. Sehingga diperoleh fungsi likelihoodnya adalah sebagai berikut : | {∏ } (4.7) { (∏ ) ( (∑ )) (∑ ) } (4.8) Setelah mendapatkan fungsi likelihood, langkah selanjutnya dalam estimasi parameter menggunakan metode maksimum likelihood adalah menentukan fungsi log likelihood. Alasan penggunaan fungsi log likelihood adalah karena perhitungan menggunakan fungsi log likelihood lebih sederhana sehingga memudahkan dalam perhitungan, selain itu hasil yang diperoleh melalui fungsi log likelihood tidak berbeda dengan hasil dari fungsi likelihood.

4.2.2 Menentukan Fungsi Log-Likelihood

Berdasarkan fungsi likelihood yang telah diperoleh sebelumnya, dihasilkan fungsi log likelihood sebagai berikut :

(52)

( ) (∏ ) ( ( (∑ [ ]))) ( (∑ )) ( ) ( ) ( ∑ ) ( ∑ [ ]) (∑ ) (4.9) Setelah fungsi Log likelihood didapatkan, selanjutnya dapat dicari turunan pertama fungsi Likelihood sebagai syarat perlu memaksimumkan fungsi

likelihood.

4.2.3 Menentukan Turunan Pertama Fungsi Log-Likelihood terhadap Parameter

Langkah pertama dalam estimasi parameter menggunakan MLE adalah menemukan turunan pertama fungsi log likelihood sebagai berikut :

1. Turunan pertama terhadap .

Misalkan merupakan parameter yang berupa matrik berukuran , maka fungsi log-likelihoodnya harus diturunkan terhadap semua elemen vektor parameter . Misalkan , maka turunan pertama log

(53)

( ) ∑ ( ∑ [ ] ) ( ) ∑ ( ∑ [ ] ) ( ) ∑ (∑ [ ] ) ( ) ( ) ∑ (∑ [ ] ) Secara umum, turunan pertama log-likelihood terhadap , adalah : (

) ∑ (∑ [ ]

)

2. Turunan pertama terhadap parameter

(

) (∑ [ ]

(54)

3. Turunan pertama terhadap parameter .

(

) ( ) ∑ (∑ [ ]

)

4.2.4 Mendapatkan estimator parameter .

Estimator MLE untuk parameter , untuk , diperoleh dengan cara menyamakan nol persamaan – persamaan dibawah sebagai syarat perlu untuk memaksimumkan fungsi log – likelihood-nya.

( ) ∑ (∑ [ ] ) ( ) (∑ [ ]) ( ) ( ) ∑ (∑ [ ] ) Ketiga persamaan diatas tidak dapat diselesaikan secara analistis, karena masih dalam bentuk implisit sehingga diperlukan metode lain untuk menyelesaikannya. Pada kesempatan ini digunakan metode Newton Raphson untuk mendapatkan nilai estimasi parameter .

Berdasarkan metode Newton Raphson, maka hal yang pertama perlu dilakukan adalah mendapatkan turunan kedua dari fungsi log likelihood.

(55)

( ) ( ) ( ) ( ) ( ) ( )

4.2.5 Menentukan Turunan Kedua Fungsi Log-Likelihood terhadap Parameter .

1. Persamaan (4.17) diturunkan terhadap . Untuk ( ) [ ] [ ∑[ ] ] (4.20) ( ) [ ] [ ∑[ ] ] (4.21) ( ) [ ] [ ∑[ ] ] (4.22) Untuk ( ) [ ] [ ∑[ ] ] (4.23) ( ) [ ] [ ∑[ ] ]

(56)

(4.24) ( ) [ ] [ ∑[ ] ] (4.25) Untuk ( ) [ ] [ ∑[ ] ] (4.26) ( ) [ ] [ ∑[ ] ] (4.27) ( ) [ ] [ ∑[ ] ] (4.28) Untuk ( ) [ ] [ ∑[ ] ] (4.29) ( ) [ ] [ ∑[ ] ] (4.30)

(57)

(

) [ ] [ ∑[ ]

] (4.31) Dari semua persamaan diatas diperoleh bentuk umum turunan kedua terhadap sebagai berikut :

(

) [ ] [ ∑[ ]

] (4.32)

2. Turunan persamaan (4.18) terhadap parameter

( ) ( ) ∑[ ]

3. Turunan persamaan (4.19) terhadap parameter

( ) ∑[ ] ( ) ∑[ ]

(58)

4. Persamaan (4.17) diturunkan terhadap parameter ( ) ∑[ ] ( ) ∑[ ] ( ) ∑[ ] ( ) ∑ [ ] (4.40) Sehingga diperoleh bentuk umumnya

(

) ∑[ ]

5. Persamaan (4.17) diturunkan terhadap parameter

( ) ∑[ ] ( ) ∑[ ]

(59)

( ) ∑[ ] ( ) ∑[ ] Sehingga diperoleh bentuk umumnya

(

)

∑[ ]

4.3 Estimasi Residual Cox Snell

Log Cumulatif survival dari model regresi Cox dengan hazard dasar Weibull dapat diperoleh dengan persamaan sebagai berikut :

̂ ( ̂ ̂) Log Cumulatif hazard dari model regresi Cox dengan hazard dasar Weibull dapat diperoleh dengan persamaan berikut :

(60)

Dari log Cumulatif survival dan fungsi hazard komulatif diatas maka dapat diperoleh log Cumulatif survival pengamatan ke-i dan fungsi hazard komulatif pengamatan ke-i, yaitu :

̂ ̂ atau

̂ ̂ ̂ ̂ dan

̂ [ ̂ ] ( ) Setelah model regresi Cox diperoleh, kelayakan dari model yang didapat perlu ditaksir dengan menggunakan residual Cox snell sebagai berikut :

̂ ̂ , (4.41) dengan ̂ merupakan log Cumulatif hazard pada waktu , dapat dicari dengan menggunakan persamaan (4.48). Selanjutnya model dikatakan layak apabila nilai residual Cox-snell berdistribusi eksponensial. Algoritma untuk memdapatkan estimator parameter diuraikan dibawah .

4.4 Algoritma untuk Mendapatkan Estimator Parameter

Terdapat beberapa langkah yang digunakan untuk mendapatkan nilai estimator parameter dari model regresi Cox dan estimasi residual Cox snell, sebagai berikut :

a. Mendapatkan nilai awal , untuk model regresi Cox dengan hazard

dasar Weibull dapat diambil (Collet, 1994) dan mendapatkan nilai awal dan dengan menggunakan statgraphic.

(61)

b. Mendapatkan nilai estimator dengan menggunakan algoritma

newton raphson sebagai berikut :

1. Memasukkan data sekunder (data tahan hidup)

2. Ambil sebagai iterasi ke-0. Memasukkan nilai awal parameter

, dalam bentuk persamaan sebagai berikut :

( )

3. Hitung fungsi sebagai berikut : ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )

(62)

( ( ) ( ) ( ) ( ) ( )) (4.43)

4. Tentukan persamaan jacobian :

( ) [ ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ] dengan , dan 5. Hitung nilai dengan rumus :

( ) ( ) 6. Jika diperoleh nilai max| | (dengan yang ditentukan),

maka dilanjutkan ke langkah (7), namun jika tidak maka proses diulang ke langkah (3) dengan mengambil .

7. Dapatkan nilai estimator ̂ .

Setelah mendapatkan algoritma untuk memperoleh estimator parameter, selanjutnya adalah membuat alagoritma untuk menguji kesesuaian model menggunakan residual Cox Snell sebagai berikut :

(63)

4.5 Algoritma untuk Mendapatkan Estimator Residual Cox Snell

Terdapat beberapa langkah yang digunakan untuk mendapatkan nilai estimator residual Cox snell, sebagai berikut :

a. Masukkan data sekunder (data tahan hidup)

b. Hitung nilai Estimasi residual Cox snell dengan persamaan (4.41) c. Jika nilai estimasi residual Cox snell berdistribusi eksponensial, maka

model regresi Cox dapat dikatakan layak.

Algoritma yang telah dibuat diatas, selanjutnya diterapkan pada program S-Plus sebagai berikut :

4.6 Program Estimasi Parameter Model Regresi Cox dengan Hazard Dasar Weibull.

Penerapan algoritma pada program komputer dengan menggunakan paket program S-PLUS.

1. Program untuk turunan pertama.

2. Program untuk mendapatkan matrik jacobian. 3. Program untuk mendapatkan parameter . Dengan menggunakan program Newton Raphson

4. Memperoleh program untuk mendapatkan nilai residual Cox Snell.

Program-program yang telah dibuat dalam software Splus, selanjutnya diterapkan pada data tahan hidup pasien penderita Cardiovascular Diseases.

Referensi

Dokumen terkait

Seperti yang terjadi di desa girisekar / panggang / gunung kidul // dalam rangka mengucapkan puji syukur kepada sang pencipta / mereka melakukan sedekah lalaban // selain itu /

mutu dan tingkat kepuasan pasien terhadap pelayanan kefarmasian di puskesmas. kota Sibolga.Peneliti tertarik memilih tempat penelitian

Demikian Surat Kuasa ini kami buat dengan sebenar-benarnya agar dapat dipergunakan sebagaimana mestinya. Bondowoso, 18

Direktorat Jenderal Pendidikan Islam, Kementerian Agama R.I, menyatakan bahwa lembaga di bawah ini telah melakukan updating data Pendidikan Islam (EMIS) Periode Semester GENAP

Hasil elektroforesis pada gambar C dan E memiliki ketebalan pita yang terbentuk sangat tipis, hal ini menunjukkan bahwa suhu annealing yang kurang sesuai dengan

Sifat yang diharapkan dalam sediaan gel topikal yaitu memiliki aliran tiksotropik, tidak lengket, tidak berkendir, daya sebar baik, tidak berminyak, mudah dicuci, sebagai emolien,

• Thermal conditions at walls, flow boundaries and fluid properties required for energy equation. • Chemical reactions, such as combustion, can lead to source terms to be included

[r]