• Tidak ada hasil yang ditemukan

ANALISIS REGRESI COX PROPORTIONAL HAZARD

N/A
N/A
Protected

Academic year: 2022

Membagikan "ANALISIS REGRESI COX PROPORTIONAL HAZARD"

Copied!
121
0
0

Teks penuh

(1)

(Aplikasi: Data Kecelakaan Lalu Lintas Kota Medan Periode Januari 2016- Juni 2016)

SKRIPSI

TIYA MAULINDRIANTI 130803004

DEPARTEMEN MATEMATIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SUMATERA UTARA

2017

(2)

(Aplikasi: Data Kecelakaan Lalu Lintas Kota Medan Periode Januari 2016- Juni 2016)

SKRIPSI

Diajukan untuk melengkapi tugas dan memenuhi syarat mencapai gelar Sarjana Sains

TIYA MAULINDRIANTI 130803004

DEPARTEMEN MATEMATIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SUMATERA UTARA

(3)

Judul : Analisis Cox Proportional Hazard pada Kejadian Ties menggunakan Pendekatan Breslow dan Pendekatan Efron (Aplikasi : Data Kecelakaan Lalu Lintas Kota Medan Periode Januari 2016 – Juni 2016)

Kategori : Skripsi

Nama : Tiya Maulindrianti

Nomor Induk Mahasiswa : 130803004

Program Studi : Sarjana (S1) Matematika Departemen : Matematika

Fakultas : Matematika Dan Ilmu Pengetahuan Alam Universitas Sumatera Utara

Disetujui di Medan, Oktober 2017

Disetujui Oleh

Departemen Matematika FMIPA USU Pembimbing, Ketua,

Dr. Suyanto, M.Kom Dr. Sutarman, M.Sc

NIP. 19590813 198601 1 002 NIP. 19631026 199103 1 001

(4)

ANALISIS REGRESI COX PROPORTIONAL HAZARD PADA KEJADIAN TIES MENGGUNAKAN PENDEKATAN BRESLOW DAN

PENDEKATAN EFRON

(Aplikasi: Data Kecelakaan Lalu Lintas Kota Medan Periode Januari 2016- Juni 2016)

SKRIPSI

Saya mengakui bahwa skripsi ini adalah hasil kerja saya sendiri, kecuali beberapa kutipan dan ringkasan yang masing-masing disebutkan sumbernya.

Medan, Oktober 2017

TIYA MAULINDRIANTI 130803004

(5)

Puji syukur kepada Allah SWT, karena berkat limpahan rahmat dan hidayah-Nya penulis dapat menyelesaikan skripsi yang berjudul “ANALISIS REGRESI COX PROPORTIONAL HAZARD PADA KEJADIAN TIES MENGGUNAKAN PENDEKATAN BRESLOW DAN PENDEKATAN EFRON (Aplikasi: Data Kecelakaan Lalu Lintas Kota Medan Periode Januari 2016- Juni 2016)” ini dengan baik.

Dalam kesempatan ini, penulis ingin mengucapkan terimakasih yang sebesar-besarnya kepada semua pihak yang telah membantu dan memberi dukungan penulis dalam menyelesaikan skripsi ini. Teristimewa penulis ucapkan terimakasih kepada Ayahanda tercinta Suwanto dan Ibunda Sumiati yang sayangi dan saya cintai yang telah memberikan doa, motivasi, dukungan moril maupun materil selama ini, serta saudara kandung saya Muhammad Rafiq dan Muhammad Ridho Erlangga yang terus memberikan saya dukungan dan motivasi. Terimakasih juga penulis sampaikan kepada:

1. Bapak Dr. Krista Sebayang, M.Si selaku dekan Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Sumatera Utara

2. Bapak Dr. Sutarman, M.Sc, selaku dosen pembimbing saya yang telah memberikan panduan, dukungan moral, motivasi, ilmu pengetahuan dan kepercayaan kepada penulis dalam menyelesaikan penelitian ini

3. Ibu Dr. Elly Rosmaini, M.Si dan Bapak Dr. Pasukat Sembiring, M.Si, selaku komisi penguji yang telah memberi masukan dan saran untuk perbaikan skripsi ini

4. Bapak Prof. Dr. Tulus, M.Si, selaku dosen penasehat akademik yang selalu memberikan arahan dan motivasi kepada penulis selama menjalani studi di strata satu Matematika ini

5. Bapak Dr. Suyanto, M.Kom dan Bapak Drs. Rosman Siregar, M.Si selaku Ketua dan Sekretaris Departemen Matematika di FMIPA USU

(6)

Penulis juga berterimakasih kepada rekan-rekan kuliah matematika stambuk 2013 yang telah memberikan dukungan dan bantuannya baik dalam penyusunan skripsi maupun dalam perkuliahan sehari-hari. Terimakasih pula kepada sahabat terbaik penulis Mawar Riza yang selalu setia mendukung dalam kehidupan penulis dan selalu bersama-sama dalam penyusunan skripsi ini.

Terimakasih juga kepada Yogi Pratama yang terus mendukung dan memberikan motivasi untuk menyelesaikan penelitian ini. Tak lupa penulis mengucapkan terimakasih kepada murid-murid penulis Rifda Amaliya Ma’ruf, M. Luthfi Ikbar, Nuratika Aina dan Nurfadilla Aini yang selalu mendoakan dan memberikan dukungan kepada penulis.

Penulis menyadari terdapat banyak kekurangan dalam penulisan ini. Oleh karena itu, penulis meminta kritik dan saran dari pembaca demi penyempurnaan tulisan ini. Demikianlah yang dapat penulis sampaikan, atas perhatian dan kerjasamanya penulis ucapkan terimakasih. Semoga tulisan ini bermanfaat bagi siapapun yang membutuhkan.

Medan, Oktober 2017 Penulis,

Tiya Maulindrianti

(7)

(Aplikasi: Data Kecelakaan Lalu Lintas Kota Medan Periode Januari 2016- Juni 2016)

ABSTRAK

Penelitian ini bertujuan untuk mengaplikasikan model regresi Cox proportional hazard pada kejadian ties menggunakan dua metode pendekatan, yaitu pendekatan Breslow dan pendekatan Efron dan mengetahui aplikasinya dalam kasus kecelakaan lalu lintas di kota Medan. Data kecelakaan diambil dari kantor Satlantas Polrestabes kota Medan. Terdapat lima variabel yang diperhatikan dalam penelitian ini, yaitu umur, jenis kelamin, kepemilikan Surat Ijin Mengemudi (SIM), kendaraan yang terlibat dalam kecelakaan, serta penggunaan helm. Setelah dilakukan pengujian model terbaik Cox, kedua pendekatan yang digunakan memberikan hasil yang sama dimana terdapat empat variabel yang signifikan yaitu jenis kelamin, kepemilikan SIM, kendaraan yang terlibat dalam kecelakaan, serta penggunaan helm. Selanjutnya dilakukan pengujian asumsi proportional hazard, variabel kendaraan tidak memenuhi asumsi proportional hazard dan dikeluarkan dari model. Sehingga didapatkan tiga variabel yang signifikan yaitu, jenis kelamin, kepemilikan SIM serta penggunaan helm.

Kata Kunci: Kecelakaan Lalu Lintas, Model Cox Proportional Hazard, Pendekatan Breslow, Pendekatan Efron

(8)

2016)

ABSTRACT

This study aims to apply the Cox proportional hazard regression model on the ties event using two approaching methods, Breslow method and Efron method and its application in the case of traffic accidents in Medan city. The accident data was taken from Satlantas Polrestabes Medan. There are five variables to be considered in this study, ie age, sex, ownership of Driver's License, vehicles which involved in accidents, and the use of helmets. After testing Cox's best model, the two methods used gave the same result where there were four significant variables:

sex, ownership of Driver's License, vehicle involved in accidents, and use of helmets. Further testing of proportional hazard assumptions, vehicle variable do not meet proportional hazard assumptions and are excluded from the model. So get three significant variables, gender, ownership of Driver's License and the use of helmets.

Keywords: Traffic accidents, Cox proportional hazard regression, Breslow method, Efron method.

(9)

Halaman

PERSETUJUAN i

PERNYATAAN ii

PENGHARGAAN iii

ABSTRAK v

ABSTRACT vi

DAFTAR ISI vii

DAFTAR TABEL DAFTAR GAMBAR DAFTAR LAMPIRAN

x xi xii BAB 1 PENDAHULUAN

1.1 Latar Belakang 1

1.2 Rumusan Masalah 3

1.3 Tujuan Penelitian 4

1.4 Batasan Masalah 4

1.5 Manfaat Penelitian 4

BAB 2 LANDASAN TEORI

2.1 Analisis Survival 5

2.1.1 Data Tersensor 6

2.1.2 Fungsi Kepadatan Peluang 8

2.1.3 Fungsi Survival 8

2.1.4 Fungsi Hazard 9

2.1.5 Hazard Kumulatif 10

2.2 Model Cox Proportional Hazard 11

2.2.1 Estimasi Parameter Tanpa Kejadian Ties 13 2.2.2 Estimasi Parameter Dengan Kejadian Ties

2.2.2.1 Metode Breslow 2.2.2.2 Metode Efron

17 18 18 2.2.3 Pengujian Parameter

2.2.3.1 Uji Partial Likelihood Ratio 2.2.3.2 Uji Wald

2.2.3.3 Uji Score

19 19 20 21

2.2.4 Pemilihan Model Cox Terbaik 21

2.2.5 Residual Model Cox Proportional Hazard 23 2.2.6 Interpretasi Model Cox Proportional Hazard 25

2.3 Kecelakaan Lalu Lintas 27

(10)

BAB 3 METODOLOGI PENELITIAN

3.1 Jenis dan Rancangan Penelitian 29

3.2 Lokasi Penelitian dan Waktu Penelitian 29

3.3 Populasi dan Sampel 29

3.3.1 3.3.2

Populasi Sampel

29 30

3.4 Variabel dan Definisi Operasional 30

3.4.1 3.4.2

Variabel

Definisi Operasional

30 30

3.5 Pengumpulan Data 33

3.6 Pengolahan Data 33

3.7 Analisis Data 33

BAB 4 HASIL DAN PEMBAHASAN

4.1 Analisis Univariat 36

4.1.1 Waktu Survival Korban Kecelakaan Lalu

Lintas 36

4.1.2 Usia 36

4.1.3 Jenis Kelamin 37

4.1.4 Kepemilikan SIM 38

4.1.5 Kendaraan yang Terlibat Kecelakaan dengan

Korban 38

4.1.6 Penggunaan Helm 39

4.2 Pemodelan Cox Proportional Hazard dengan

Pendekatan Breslow 40

4.2.1 Estimasi Parameter 40

4.2.2 Pengujian Parameter 40

4.2.3 Pemilihan Model Cox Terbaik 41

4.2.4 Pengujian Parameter yang Signifikan 48 4.2.5 Penyusunan Model Cox Proportional

Hazard 50

4.2.6 Pengujian Asumsi Proportional Hazard 51 4.2.7 Interpretasi Model Cox Proportional Hazard 53 4.3 Pemodelan Cox Proportional Hazard dengan

Pendekatan Efron 54

4.3.1 Estimasi Parameter 54

4.3.2 Pengujian Parameter 55

(11)

4.3.6 Pengujian Asumsi Proportional Hazard 65 4.3.7 Interpretasi Model Cox Proportional Hazard 68 4.4 Perbandingan Metode Breslow dan Metode Efron 68

4.4.1 Estimasi Parameter 68

4.4.2 Pemilihan Model Cox Terbaik 69

BAB 5 KESIMPULAN DAN SARAN

5.1 Kesimpulan 72

5.2 Saran 73

DAFTAR PUSTAKA 75

(12)

Nomor Judul Halaman Tabel

4.1 Ukuran Statistika Waktu Survival Korban Kecelakaan Lalu Lintas 36 4.2 Estimasi Parameter Model Cox dengan Metode Breslow 40 4.3 Prosedur Seleksi Forward dalam Pemilihan Model Terbaik 42 4.4 Estimasi Parameter Model Cox Terbaik dengan Metode Breslow 48 4.5 Hasil Pengujian Parameter Secara Parsial dengan Uji Wald 49 4.6 Estimasi Parameter Variabel yang signifikan dengan Metode Breslow 50 4.7 Estimasi Parameter Model Cox dengan Metode Efron 54 4.8 Prosedur Seleksi Forward dalam Pemilihan Model Terbaik 56 4.9 Estimasi Parameter Model Cox Terbaik dengan Metode Efron 62 4.10 Hasil Pengujian Parameter Secara Parsial dengan Uji Wald 63 4.11 Estimasi Parameter Variabel yang signifikan dengan Metode Efron 64 4.12 Estimasi Parameter Menggunaan Metode Breslow dan Metode Efron 69 4.13 Pemilihan Model Terbaik Pada Metode Breslow 70 4.14 Pemilihan Model Terbaik Pada Metode Efron 70 4.15 Estimasi Parameter Model Cox Terbaik Menggunakan Metode 70

Breslow dan Metode Efron

(13)

Nomor

Gambar Judul Halaman

4.1 4.2

4.3 4.4 4.5 4.6 4.7 4.8 4.9 4.10 4.11 4.12 4.13

Distribusi Frekuensi Usia Korban Kecelakaan Lalu Lintas di Kota Medan

Distribusi Frekuensi Jenis Kelamin Korban Kecelakaan Lalu Lintas di Kota Medan

Distribusi Frekuensi Kepemilikan SIM Korban Kecelakaan Lalu Lintas di Kota Medan

Distribusi Frekuensi Kendaraan yang terlibat kecelakaan dengan Korban Kecelakaan Lalu Lintas di Kota Medan Distribusi Frekuensi Penggunaan Helm Korban Kecelakaan Lalu Lintas di Kota Medan

Plot Residual Schoenfeld untuk variabel Jenis Kelamin (Breslow)

Plot Residual Schoenfeld untuk variabel SIM (Breslow) Plot Residual Schoenfeld untuk variabel Kendaraan (Breslow)

Plot Residual Schoenfeld untuk variabel Helm (Breslow) Plot Residual Schoenfeld untuk variabel Jenis Kelamin (Efron)

Plot Residual Schoenfeld untuk variabel SIM (Efron) Plot Residual Schoenfeld untuk variabel Kendaraan (Efron) Plot Residual Schoenfeld untuk variabel Helm (Efron)

37 37 38 39 39 51 52 52 53 66 66

67 67

(14)

Nomor

Lampiran Judul Halaman

1 2

3

Data pengendara sepeda motor yang mengalami

kecelakaan lalu lintas di Kota Medan pada periode Januari 2016 sampai Juni 2016

Output R Model Cox dengan Metode Breslow Output R Model Cox dengan Metode Efron

77

88 98

(15)

BAB 1 PENDAHULUAN

1.1 Latar Belakang

Analisis survival merupakan analisis statistika yang membantu menganalisis suatu kasus yang tidak dapat diselesaikan dengan analisis statistika standar. Analisis ini digunakan ketika kasus berkaitan dengan waktu atau lama waktu hingga terjadi kejadian tertentu, dan kemungkinan adanya data tersensor yang merupakan karakteristik khas yang membedakannya dengan analisis data yang lain. Analisis survival telah menjadi alat yang penting untuk menganalisis data waktu antar kejadian (time to event) atau analisis data yang berhubungan dengan waktu mulai dari time origin sampai terjadinya suatu kejadian khusus. Kejadian khusus (failure time) tersebut dapat berupa kegagalan, kematian, kambuhnya suatu penyakit, respon dari suatu percobaan, atau peristiwa lain yang dipilih sesuai dengan kepentingan peneliti. Kejadian khusus tersebut dapat berupa kejadian positif seperti kelahiran, kelulusan sekolah, kesembuhan dari suatu penyakit (Kleinbaum

& Klein, 2005).

Dalam menganalisis data survival tidak dapat digunakan regresi linear biasa karena regresi linear biasa tidak mampu menangani adanya data yang tersensor. Data tersensor adalah data yang tidak teramati secara utuh, karena adanya individu yang hilang ataupun dengan alasan lain, hingga tidak dapat diambil datanya sampai akhir pengamatan individu tersebut dalam mengalami peristiwa tertentu. Jika berada dalam keadaan sebaliknya maka data tersebut data tidak tersensor (Lee dan Wang, 2003).

Secara umum, metode yang digunakan untuk mengestimasi waktu survival dalam analasis survival adalah metode tabel hidup (Life Table), Actuarial (Cutler- Ederer), metode Product Limit (Kaplan-Meier) dan Model Cox Proportional Hazard. Model Cox Proportional Hazard lebih sering digunakan daripada metode yang lainnya karena dapat mengestimasi hazard ratio tanpa perlu mengetahui

(16)

fungsi baseline hazardnya. Waktu survival dalam analisis survival terbagi menjadi 2 macam yaitu waktu kejadian tanpa ties dan waktu kejadian dengan ties.

Ties adalah kejadian bersama yaitu keadaan yang terdapat dua individu atau lebih yang mengalami kejadian pada waktu yang bersamaan.

Pendekatan untuk mengatasi kejadian ties dalam analisis survival terdapat 3 pendekatan yaitu pendekatan Efron, pendekatan Breslow dan pendekatan Exact.

Pendekatan Breslow merupakan metode yang sangat sederhana sehingga sering digunakan dalam mengatasi kejadian ties. Metode Breslow mengasumsikan bahwa ukuran dari himpunan resiko untuk kejadian ties adalah sama, dan selanjutnya kesederhanaan metode Breslow ini terdapat pada awal analisis yaitu tidak harus mengurutkan data atau kejadian mana yang terlebih dahulu terjadi (Breslow, 1974). Selain metode Breslow, pendekatan yang juga sering digunakan adalah pendekatan Efron. Metode Efron ini memiliki perhitungan yang cepat serta akan memberikan hasil yang lebih baik bahkan untuk kejadian yang sampelnya sangat besar (Efron, 1977).

Beberapa penelitian terdahulu mengenai analisis regresi Cox Proprtional Hazard dalam bentuk jurnal adalah jurnal yang berjudul “Use Proportinal Hazards Regression Methods To Analyze Survival of Patient with Cancer Stomach At A Hiwa Hospital/ Sulaimaniyah” yang ditulis oleh Hussain pada tahun 2014. Dalam penelitiannya tersebut, Hussain membentuk model Cox Proportional Hazard dengan data yang terdapat kejadian ties dan melakukan estimasi parameter dengan menggunakan 2 pendekatan yaitu pendekatan Breslow dan pendekatan Efron. Data yang digunakan dalam penelitiannya adalah data kanker perut yang diambil dari rumah sakit Hiwa di Sulaimaniyah dalam periode 3 tahun dengan variabel-variabel umur, jenis kelamin, berat badan, minum alkohol, tempat tinggal, pekerjaann dan golongan darah. Pada tahun yang sama Borucka yang merupakan mahasiswa Warsaw School of Economics, Institute of Statistics and Demography menulis sebuah jurnal yang berjudul “Methods for Handling Tied Events in The Cox Proportional Hazard Model”. Penelitian ini membahas metode-metode yang dapat menyelesaikan kasus kejadian ties seperti

(17)

aplikasinya. Selanjutnya Susetyo dkk juga membuat penelitian dalam jurnal yang berjudul “Analisis Survival Data Kejadian Ties Dengan Exact Partial Likelihood pada Cox Regression”. Pada penelitian ini Susetyo membandingkan hasil yang didapatkan dengan menggunakan Exact Partial Likelihood dengan Efron Partial Likelihood, dimana hasil yang diperoleh menyimpulkan bahwa Exact Partial Likelihood lebih baik dalam mengestimasi nilai parameter regresi dibandingkan Efron Partial Likelihood. Studi kasus yang digunakan dalam penelitian ini adalah siswa yang putus sekolah tingkat menengah pertama dan dibantu dengan software R.

Studi kasus dalam penelitian ini adalah korban kecelakaan lalu lintas di kota Medan pada periode Januari 2016 hingga Juni 2016. Kecelakaan lalu lintas merupakan salah satu peristiwa yang banyak memakan korban jiwa. Kota Medan sebagai ibukota Provinsi Sumatera Utara yang juga sekaligus kota terbesar ketiga di Indonesia, pada tahun 2015 tercatat 220 pengguna jalan meninggal dunia akibat kecelakaan lalu lintas. Bila dibandingkan dengan tahun sebelumnya, terjadi peningkatan angka kecelakaan. Tahun 2015, angka laka lantas berjumlah 1.407 kasus, 220 orang meninggal dunia. Sedangkan pada tahun 2014, angka kecelakaan di Kota Medan hanya 1.167 kasus dan 200 korban jiwa melayang. Peningkatan itu juga terjadi pada jumlah korban luka berat dan luka ringan. Untuk 2014, terdapat 571 orang luka berat akibat laka lantas. Sementara 2015 meningkat jumlahnya menjadi 825 orang. Begitu juga dengan korban luka ringan, 2014 sebanyak 656 orang sedangkan 2015 bertambah menjadi 780 orang.

1.2 Rumusan Masalah

Berdasarkan latar belakang yang telah diuraikan, maka rumusan masalah dalam penelitian ini adalah:

1. Bagaimana Model Cox Proportional Hazard pada kejadian ties menggunakan pendekatan Breslow?

2. Bagaimana Model Cox Proportional Hazard pada kejadian ties menggunakan pendekatan Efron?

(18)

1.3 Tujuan Penelitian

Berdasarkan rumusan masalah yang telah dipaparkan, maka tujuan dari penelitian ini adalah:

1. Untuk mendapatkan Model Cox Proportional Hazard pada kejadian ties menggunakan pendekatan Breslow dan pendekatan Efron.

2. Membandingkan hasil Model Cox Proportional Hazard pada kejadian ties menggunakan pendekatan Breslow dan pendekatan Efron.

1.4 Batasan Masalah

Dalam penelitian ini, diambil pembatasan masalah pada data yang digunakan yaitu korban kecelakaan lalu lintas yang merupakan pegendara sepeda motor dengan faktor-faktor yang menyebabkan terjadinya kecelakaan lalu lintas digunakan variabel jenis kelamin (𝑥1), usia (𝑥2), kepemilikan Surat Izin Mengemudi (𝑥3), kendaraan yang terlibat kecelakaan (𝑥4) dan penggunaan helm(𝑥5) .

Pembahasan model regresi yang digunakan adalah regresi cox proportional hazard dengan kejadian ties dengan mengambil 2 metode pendekatan, yaitu pendekatan Breslow dan pendekatan Efron.

1.5 Manfaat Penelitian

Manfaat dari penelitian ini adalah:

1. Menambah wawasan dan memperkaya pengetahuan dalam bidang statistika yang berhubungan dengan Analisis Regresi Cox Proportional Hazard dengan pendekatan Breslow dan pendekatan Efron.

2. Sebagai bahan referensi untuk penelitian selanjutnya.

(19)

BAB 2

LANDASAN TEORI

Pada bab ini akan dipaparkan teori-teori yang menjadi dasar dalam penelitian ini.

Teori tersebut meliputi analisis survival, data tersensor, fungsi survival, fungsi hazard, model Cox proportional hazard, estimasi parameter tanpa kejadian ties, estimasi parameter dengan kejadian ties, pengujian parameter, pemilihan model Cox terbaik, pengujian asumsi proportional hazard menggunakan Residual Schoenfeld dan tentang kecelakaan lalu lintas yang meliputi pengertian, faktor penyebab serta faktor resikonya.

2.1 Analisis Survival

Menurut Kleinbaum dan Klein (2005) analisis survival adalah kumpulan prosedur statistika untuk menganalisis data yang variabel hasilnya merupakan waktu hingga muncul suatu peristiwa. Waktu survival dapat didefinisikan sebagai waktu awal penelitian hingga waktu terjadinya suatu peristiwa, dapat dalam hari, bulan, maupun tahun. Peristiwa yang terjadi dapat berupa peristiwa meninggal, peristiwa sakit, peristiwa sakit yang terulang kembali setelah pengobatan atau munculnya suatu penyakit baru, peristiwa kecelakaan, respon dari suatu percobaan, atau peristiwa lain yang dipilih sesuai dengan kepentingan peneliti. Menurut Collect (2004) analisis survival banyak diterapkan dalam bidang biologi, kedokteran, kesehatan umum seperti daya hidup pasien kanker paru-paru, sosiologi, teknik, seperti menganalisis masa hidup lampu pijar, ekonomi, demografi, dan epidemologi.

Menurut Lee (2003) dalam menentukan waktu survival T, terdapat 3 elemen dasar yang diperlukan yaitu :

1. Waktu awal (time origin) harus didefinisikan secara tepat pada setiap individu, misalkan awal mula pengamatan berupa tanggal pengobatan seorang pasien.

(20)

2. Peristiwa akhir atau waktu akhir (failure event) didefinisikan jelas untuk mengetahui status tersensor atau tidak tersensor, meninggal atau sembuh seorang pasien.

3. Skala pengukuran sebagai batas dari waktu terjadinya peristiwa sampai berakhirnya peristiwa tersebut, misalnya skala tahunan, bulanan, mingguan, harian.

2.1.1 Data Tersensor

Data tersensor merupakan data yang tidak bisa diamati secara utuh, karena adanya individu yang hilang ataupun dengan alasan lain, sehingga tidak dapat diambil datanya sampai akhir pengamatan. Dengan kata lain, pada akhir pengamatan individu tersebut belum mengalami peristiwa tertentu. Jika berada dalam keadaan sebaliknya maka data tersebut disebut data tidak tersensor (Lee & Wang, 2003).

Menurut Klein & Moeschberger (2003) dalam analisis survival terdapat empat jenis penyensoran antara lain :

1. Penyensoran kanan (right censoring)

Penyensoran terjadi jika objek pengamatan atau individu yang diamati masih tetap hidup pada saat waktu yang telah ditentuukan. Dengan kata lain, individu tersebut belum mengalami kejadian sampai akhir periode pengamatan, sedangkan waktu awal dari objek penelitian dapat diamati secara penuh.

Sebagai contoh, seorang pasien kanker diamati dari awal perawatan sampai akhir perawatan ternyata pasien tersebut masih tetap hidup. Kemudian pasien melanjutkan perawatan di luar negeri sehingga tidak bisa diamati lagi. Pasien ini memiliki waktu survival setidaknya beberapa waktu. Sehingga waktu pengamatan individu tersebut dikatakan penyensoran kanan.

2. Penyensoran kiri (left censoring)

Penyensoran kiri terjadi jika semua informasi yang diinginkan diketahui dari seorang individu telah diperoleh pada awal pengamatan. Dengan kata lain, pada saat waktu awal pengamatan individu tidak teramati pada awal

(21)

pengamatan sementara peristiwa tersebut dapat diamati secara penuh sebelum penelitian berakhir.

3. Penyensoran selang (interval censoring)

Penyensoran selang terjadi jika informasi yang dibutuhkan telah dapat diketahui pada peristiwa di dalam selang pengamatan atau penyensoran yang waktu survival-nya berada dalam satu selang tertentu. Sebagai contoh, beberapa tikus diberikan zat karsinogen pada makanannya, dilakukan studi selama 10 bulan kepada 10 tikus dan penelitian dilakukan setiap akhir tahun, jika 2 dari 8 tikus tewas karena kanker pada bulan ke-5 dan ke-7, maka dua tikus tersebut mengalami penyensoran selang.

4. Penyesoran acak (random censoring)

Penyensoran acak terjadi jika individu yang diamati meninggal atau mengalami peristiwa karena sebab yang lain, bukan disebabkan dari tujuan utama penelitian. Sebagai contoh, 10 tikus yang diberikan zat karsinogen pada makanannya. Pada saat pengamatan ada 1 dari 10 tikus tersebut meninggal karena terjepit (tewas bukan karena penlitian utama) bukan karena terkena kanker, maka tikus tersebut mengalami penyensoran acak.

Menurut Lee (2003) penyebab terjadinya data tersensor antara lain :

1. Loss to follow up, terjadinya bila objek pindah, meninggal atau menolak untuk berpartisipasi

2. Drop out, terjadi bila perlakuan dihentikan karena alasan tertentu

3. Termination of study, terjadi bila masa penelitian berakhir sementara objek yang diamati belum mencapai waktu akhir (failure time)

4. Death, jika penyebab kematian bukan di bawah penyelidikan (misalna bunuh diri)

Sedangkan menurut Kleinbaum & Klein (2005) ada 3 alasan terjadinya penyensoran, yaitu :

1. Objek tidak mengalami peristiwa sebelum masa penelitian berakhir 2. Objek hilang selama masa follow-up ketika masa penelitian

(22)

3. Objek ditarik dari penelitian karena kematian (jika kematian bukan peristiwa yang diobservasi) atau disebabkan alasan lain.

2.1.2 Fungsi Kepadatan Peluang

Fungsi kepadatan peluang adalah peluang suatu individu mati atau gagal dalam interval waktu 𝑡 sampai 𝑡 + Δ𝑡. Fungsi kepadatan peluang dinotasikan dengan 𝑓(𝑡) dan dirumuskan dengan

𝑓(𝑡) = lim

Δ𝑡→0[𝑃(𝑡 < 𝑇(𝑡 + Δ𝑡))

Δ𝑡 ] = lim

Δ𝑡→0[𝑃(𝐹(𝑡 + Δ𝑡) − 𝐹(𝑡))

Δ𝑡 ] . (2.1) Misalkan 𝑇 adalah variabel random bukan negatif pada interval [0, ∞) yang menunjukkan waktu hidup pada suatu populasi dan 𝑓(𝑡) merupakan fungsi kepadatan peluang dari 𝑠 maka fungsi distribusi kumulatif 𝐹(𝑡) adalah (Lawless, 1982:8)

𝐹(𝑡) = 𝑃(𝑇 ≤ 𝑡)

= ∫ 𝑓(𝑥)𝑑𝑥

𝑡

0

. (2.2)

Dari persamaan (2.2), diperoleh

𝑓(𝑡) =𝑑(𝐹(𝑡))

𝑑𝑡 = 𝐹(𝑡) (2.3)

2.1.3 Fungsi Survival

Jika 𝑇 merupakan variabel random tak negatif pada interval [0, ∞) yang menunjukkan waktu individu sampai mengalami kejadian pada populasi, 𝑓(𝑡) merupakan fungsi kepadatan peluang dari 𝑡 maka peluang suatu individu tidak mengalami kejadian sampai waktu 𝑡 dinyatakan dengan fungsi survival 𝑆(𝑡)

(23)

𝑆(𝑡) = 𝑃(𝑇 ≥ 𝑡)

= ∫ 𝑓(𝑥)𝑑𝑥

𝑡

0

. (2.4)

Dari definisi fungsi distribusi kumulatif 𝑇, fungsi survival dapat dinyatakan sebagai berikut.

𝑆(𝑡) = 𝑃(𝑇 ≥ 𝑡)

= 1 − 𝑃(𝑇 ≤ 𝑡)

= 1 − 𝐹(𝑡) 𝐹(𝑡) = 1 − 𝑆(𝑡) 𝑑(𝐹(𝑡))

𝑑𝑡 =𝑑(1 − 𝑆(𝑡)) 𝑑𝑡

𝑓(𝑡) = −𝑑(𝑆(𝑡))

𝑑𝑡 = −𝑆(𝑡). (2.5) Hubungan kepadatan peluang, fungsi distribusi kumulatif dari 𝑇 dengan fungsi survival yaitu

𝑓(𝑡) = 𝐹(𝑡) = −𝑆(𝑡). (2.6)

2.1.4 Fungsi Hazard

Misalkan 𝑇 variabel random non negatif pada interval [0, ∞) yang menunjukkan waktu individu sampai mengalami kejadian pada suatu populasi, maka peluang bahwa individu mengalami kejaddian pada interval (𝑡, 𝑡 + ∆𝑡) dinyatakan dengan fungsi hazard ℎ(𝑡) (Lawless, 2003).

ℎ(𝑡) = lim

∆𝑡→0

𝑃(𝑡 ≤ 𝑇 < 𝑡 + ∆𝑡|𝑇 ≥ 𝑡)

∆𝑡

(24)

= lim

∆𝑡→0

𝑃(𝑡 ≤ 𝑇 < 𝑡 + ∆𝑡, 𝑇 ≥ 𝑡)

∆𝑡. 𝑃(𝑇 ≥ 𝑡)

= lim

∆𝑡→0

𝑃(𝑡 ≤ 𝑇 < 𝑡 + ∆𝑡)

∆𝑡. 𝑆(𝑡)

= lim

∆𝑡→0

𝐹(𝑡 + ∆𝑡) − 𝐹(𝑡)

∆𝑡. 𝑆(𝑡)

= 1 𝑆(𝑡) lim

∆𝑡→0

𝐹(𝑡 + ∆𝑡) − 𝐹(𝑡)

∆𝑡

=𝐹′(𝑡)

𝑆(𝑡)

=𝑓(𝑡)

𝑆(𝑡) (2.7)

2.1.5 Hazard Kumulatif

Dari hasil substitusi persamaan (2.5) dan (2.7) diperoleh sebagai berikut (Lawless, 2003)

ℎ(𝑡) =𝑆′(𝑡) 𝑆(𝑡) = 𝑑

𝑑𝑡log 𝑆(𝑡). (2.8) Berdasarkan persamaan (2.8) diperoleh (Lawless, 2003)

log(𝑆(𝑡)) |0𝑡 = − ∫ ℎ(𝑥)𝑑𝑥

𝑡

0

(2.9)

karena 𝑆(0) = 1 sehingga (Lawless, 2003) 𝑆(𝑡) = 𝑒[− ∫ ℎ(𝑥)𝑑𝑥0𝑡 ]

. (2.10) Dari persamaan (2.10) didapatkan fungsi hazard maka fungsi hazard kumulatif dinyatakan dengan 𝐻(𝑡) (Lawless, 2003).

(25)

𝐻(𝑡) = ∫ ℎ(𝑥)𝑑𝑥.

𝑡

0

(2.11)

Selain itu persamaan (2.10) dapat dituliskan (Lawless, 2003)

𝑆(𝑡) = 𝑒[−𝐻(𝑡)]. (2.12)

2.2 Model Cox Proportional Hazard

Model Cox proportional hazard disebut dengan model Cox karena asumsi proportional hazard-nya yaitu fungsi hazard dari individu yang berbeda adalah proportional atau rasio dari fungsi hazard dua individu yang berbeda adalah konstan (Lee & Wang, 2003). Model Cox merupakan model berdistribusi semiparametrik karena dalam model Cox tidak memperlukan informasi tentang distribusi yang mendasari waktu survival dan untuk mengestimasi parameter regresi dari model Cox harus menentukan fungsi hazard dasar (Guo, 2009).

Melalui model Cox dapat dilihat hubungan antara variabel bebas (variabel independen) terhadap variabel terikat (variabel dependen) melalui fungsi hazard- nya. Risiko kematian individu pada waktu tertentu bergantung pada nilai 𝑥1, 𝑥2, … , 𝑥𝑝 dari 𝑝 variabel bebas 𝑋1, 𝑋2, … , 𝑋𝑝. Himpunan nilai variabel bebas pada model Cox dipresentasikan oleh vektor 𝒙, sehingga 𝒙 = (𝑥1, 𝑥2, … , 𝑥𝑝).

Diasumsikan X merupakan variabel bebas yang independen terhadap waktu.

Model Cox dapat dituliskan sebagai berikut.

ℎ(𝑡, 𝑥) = ℎ0(𝑡)𝑒(𝛽1𝑥1+𝛽2𝑥2+⋯+𝛽𝑝𝑥𝑝) (2.13) dengan memisalkan,

0(𝑡) = fungsi dasar hazard, 𝛽1, 𝛽2, … , 𝛽𝑝 = parameter regresi,

𝑥1, 𝑥2, … , 𝑥𝑝 = nilai dari variabel bebas 𝑋1, 𝑋2, … , 𝑋𝑝.

Rumus model Cox pada persamaan (2.13) memiliki sifat bahwa jika semua X sama dengan nol, maka rumus tereduksi menjadi fungsi hazard dasar 0(𝑡).

(26)

Dengan demikian ℎ0(𝑡) dianggap sebagai awal atau dasar dari fungsi hazard.

Dapat dituliskan sebagai berikut.

ℎ(𝑡, 𝑥) = ℎ0(𝑡)𝑒 (𝛽1𝑥1+𝛽2𝑥2+⋯+𝛽𝑝𝑥𝑝)

= ℎ0(𝑡)𝑒(𝛽1×0+𝛽2×0+⋯+𝛽𝑝×0)

= ℎ0(𝑡)𝑒0

= ℎ0(𝑡)(1)

ℎ(𝑡, 𝑥) = ℎ0(𝑡) (2.14) Persamaan (2.14) dapat dituliskan dalam bentuk sebagai berikut.

log ℎ(𝑡, 𝑥) = log [ ℎ0(𝑡)] + 𝛽1𝑥1+ 𝛽2𝑥2+ ⋯ + 𝛽𝑝𝑥𝑝 logℎ(𝑡, 𝑥)

0(𝑡) = (𝛽1𝑥1+ 𝛽2𝑥2+ ⋯ + 𝛽𝑝𝑥𝑝). (2.15) Model Cox mengestimasi parameter regresi (𝛽1𝑥1+ 𝛽2𝑥2+ ⋯ + 𝛽𝑝𝑥𝑝) dilakukan tanpa mengestimasi fungsi hazard dasar. Model pada persamaan (2.15) merupakan model dari log hazard rasio. Rasio hazard didefinisikan sebagai hazard dari satu individu dibagi dengan hazard individu yang berbeda (Kleinbaum & Klein, 2005). Persamaan (2.15) dapat dinyatakan sebagai berikut.

log[𝐻𝑅(𝑥)] = (𝛽1𝑥1+ 𝛽2𝑥2+ ⋯ + 𝛽𝑝𝑥𝑝). (2.16)

Persamaan (2.16) mengimplikasikan bahwa dalam model dengan variabel bebas 𝑥1, 𝑥2, … , 𝑥𝑝 dan koefisien 𝛽𝑗 yaitu peningkatan pada log rasio hazard umtuk peningkat satu satuan variabel bebas 𝑥𝑗, dengan asumsi bahwa nilai dari variabel bebas yang lain konstan. Dengan kata lain 𝑒(𝛽𝑗) adalah rasio hazard untuk peningkatan satu satuan dalam 𝑥𝑗. Ketika variabel bebas dengan rasio hazard kurang dari 1(𝛽 < 0), peningkatan nilai variabel bebas berhubungan dengan lebih menurunnya risiko dan lebih panjangnya waktu bertahan hidup.

Ketika rasio hazard lebih besar dari 1(𝛽 > 0), peningkatan nilai variabel bebas berhubungan dengan peningkatan risiko dan lebih pendeknya waktu bertahan

(27)

2.2.1 Estimasi Parameter Tanpa Kejadian Ties

Parameter 𝛽𝑗 pada model Cox proportional hazard akan diestimasi dengan menggunakan metode Maximum Partial Likelihood Estimastion (MPLE).

Pendugaan 𝛽𝑗 dengan metode MPLE adalah nilai ketika fungsi partial likelihood maksimum. Misal data untuk 𝑛 individu yang terdiri dari 𝑟 waktu kejadian yang tidak tersensor dan 𝑛 − 𝑟 individu tersensor kanan diurutkan menjadi 𝑡1 < 𝑡2 <

⋯ < 𝑡𝑗 < ⋯ < 𝑡𝑛 dengan 𝑡𝑗 merupakan waktu urutan kejadian ke-j.

Diasumsikan hanya terdapat satu individu yang mengalami kematian pada tiap waktu kegagalan, jadi tidak terjadi ties pada data. Ties adalah keadaan dimana terdapat dua individu atau lebih yang mengalami kejadian gagal pada waktu yang sama. Hal lain yang perlu dipertimbangkan adalah peluang kematian suatu individu yang mati pada waktu kegagalan 𝑡𝑗, dengan syarat 𝑡𝑗 menjadi salah satu yang diamati dari 𝑟 waktu kegagalan 𝑡1, 𝑡2, … , 𝑡𝑟. Jika vektor variabel bebas dari individu yang mati pada waktu 𝑡𝑗, dinotasikan dengan 𝑥𝑗, maka peluangnya adalah sebagai berikut.

P[individu dengan variabel 𝑥𝑗 mati pada 𝑡𝑗| satu kematian pada 𝑡𝑗].

Misalkan kejadian A adalah individu dengan variabel 𝑥𝑗 meninggal pada saat 𝑡𝑗 dan kejadian B adalah semua kematian pada saat 𝑡𝑗, maka

𝑃(𝐴|𝐵) =𝑃(𝐴 ∩ 𝐵)

𝑃(𝐵) = 𝑃(𝐴)

𝑃(𝐵)

=𝑃[individu dengan variabel 𝑥𝑗 mati pada 𝑡𝑗]

𝑃[semua kematian pada 𝑡𝑗] (2.17)

Pembilang pada persamaan (2.17) adalah bentuk sederhana dari resiko kematian pada waktu 𝑡𝑗 untuk individu dengan variabel 𝑥𝑗. Jikan pembilang tersebut adalah individu ke-i yang meninggal pada saat 𝑡𝑗, fungsi hazard ini dapat ditulis menjadi ℎ𝑖(𝑡𝑗). Penyebutnya adalah penjumlah dari peluang kematian pada waktu 𝑡𝑗 (dinotasikan ℎ𝑖(𝑡𝑗)) dari semua individu yang mempunyai resiko kematian pada waktu 𝑡𝑗. Dengan 𝑅(𝑡𝑗) adalah himpunan individu yang beresiko

(28)

pada waktu 𝑡𝑗 yang terdiri dari individu-individu yang bertahan hidup hingga 𝑡𝑗. Sehingga peluang dalam persamaan (2.17) menjadi 𝑖(𝑡𝑗)

𝑖∈𝑅(𝑡𝑗)𝑖(𝑡𝑗) , menggunakan persamaan (2.13), maka fungsi hazard dasar adalah

𝑃(𝐴|𝐵) = ℎ𝑖(𝑡𝑗)

𝑖∈𝑅(𝑡𝑗)𝑖(𝑡𝑗)

= ℎ0(𝑡)𝑒(∑𝑝𝑗=1𝛽𝑗𝑥𝑖𝑗)

𝑖∈𝑅(𝑡𝑗)0(𝑡)𝑒(∑𝑝𝑗=1𝛽𝑗𝑥𝑖𝑗)

= ℎ0(𝑡)𝑒(∑𝑝𝑗=1𝛽𝑗𝑥𝑖𝑗)0(𝑡) ∑ 𝑒(∑ 𝛽𝑗𝑥𝑖𝑗)

𝑝 𝑖∈𝑅(𝑡𝑗) 𝑗=1

= 𝑒(∑𝑝𝑗=1𝛽𝑗𝑥𝑖𝑗)

𝑖∈𝑅(𝑡𝑗)𝑒(∑𝑝𝑗=1𝛽𝑗𝑥𝑖𝑗)

(2.18) Dengan mengambil hasil peluang bersyarat di atas, memberikan fungsi partial likelihood sebagai berikut

𝐿(𝛽) = ∏ 𝑒(∑𝑝𝑗=1𝛽𝑗𝑥𝑖𝑗)

∑ 𝑒(∑ 𝛽𝑗𝑥𝑖𝑗)

𝑝 𝑖∈𝑅(𝑡𝑗) 𝑗=1 𝑟

𝑖=1

. (2.19)

Dari persamaan (2.19) diperoleh fungsi log partial likelihood yaitu sebagai berikut.

ln 𝐿(𝛽) = ln ∏ 𝑒(∑𝑝𝑗=1𝛽𝑗𝑥𝑖𝑗)

∑ 𝑒(∑ 𝛽𝑗𝑥𝑖𝑗)

𝑝 𝑖∈𝑅(𝑡𝑗) 𝑗=1 𝑟

𝑖=1

= ∑ [ln (𝑒(∑𝑝𝑗=1𝛽𝑗𝑥𝑖𝑗) ) − ln ( ∑ 𝑒(∑𝑝𝑗=1𝛽𝑗𝑥𝑖𝑗)

𝑖∈𝑅(𝑡𝑗)

)]

𝑟

𝑖=1

= ∑ [(∑ 𝛽𝑗𝑥𝑖𝑗

𝑝

𝑗=1

) − ln ( ∑ 𝑒(∑𝑝𝑗=1𝛽𝑗𝑥𝑖𝑗)

𝑖∈𝑅(𝑡𝑗)

)]

𝑟

𝑖=1

(2.20)

Turunan pertama dari ln 𝐿(𝛽) terhadap 𝛽𝑗 yaitu sebagai berikut

(29)

𝜕 ln 𝐿(𝛽)

𝜕 𝛽𝑗 = 𝜕 (∑𝑟𝑖=1[(∑𝑝𝑗=1𝛽𝑗𝑥𝑖𝑗) − ln (∑𝑖∈𝑅(𝑡𝑗)𝑒(∑𝑝𝑗=1𝛽𝑗𝑥𝑖𝑗))])

𝜕 𝛽𝑗

= ∑ [∑ 𝑥𝑖𝑗 −∑𝑖∈𝑅(𝑡𝑗)𝑒(∑𝑝𝑗=1𝛽𝑗𝑥𝑖𝑗)𝑝𝑗=1𝑥𝑖𝑗

∑ 𝑒(∑ 𝛽𝑗𝑥𝑖𝑗)

𝑝 𝑖∈𝑅(𝑡𝑗) 𝑗=1 𝑝

𝑗=1

]

𝑟

𝑖=1

. (2.21)

Pendugaan 𝛽𝑗 dapat diperoleh dengan memaksimumkan turunan pertama fungsi log partial likelihood yaitu dengan mencari solusi dari:

𝜕 ln 𝐿(𝛽)

𝜕 𝛽𝑗 = 0

∑ [∑ 𝑥𝑖𝑗

𝑖∈𝑅(𝑡𝑗)𝑒(∑𝑝𝑗=1𝛽𝑗𝑥𝑖𝑗)𝑝𝑗=1𝑥𝑖𝑗

∑ 𝑒(∑ 𝛽𝑗𝑥𝑖𝑗)

𝑝 𝑖∈𝑅(𝑡𝑗) 𝑗=1 𝑝

𝑗=1

]

𝑛

𝑖=1

= 0. (2.22)

Persamaan di atas dapat diselesaikan secara numerik yaitu dengan iterasi menggunakan metode Netwon-Raphson dengan bantuan komputasi.

Turunan kedua dari ln 𝐿(𝛽) terhadap 𝛽𝑗 yaitu sebagai berikut

𝜕2ln 𝐿(𝛽)

𝜕2𝛽𝑗 = 𝜕𝑦

𝜕𝛽𝑗(𝜕 ln 𝐿(𝛽)

𝜕 𝛽𝑗 )

= 𝜕𝑦

𝜕𝛽𝑗[∑ [∑ 𝑥𝑖𝑗

𝑖∈𝑅(𝑡 𝑒(∑𝑝𝑗=1𝛽𝑗𝑥𝑖𝑗)𝑝𝑗=1𝑥𝑖𝑗

𝑗)

𝑖∈𝑅(𝑡 𝑒(∑𝑝𝑗=1𝛽𝑗𝑥𝑖𝑗)

𝑗) 𝑝

𝑗=1

]

𝑛

𝑖=1

]

= ∑ [(∑𝑖∈𝑅(𝑡𝑗)(∑𝑝𝑗=1𝑥𝑖𝑗)𝑒(∑𝑝𝑗=1𝛽𝑗𝑥𝑖𝑗))2 (∑𝑖∈𝑅(𝑡 𝑒(∑𝑝𝑗=1𝛽𝑗𝑥𝑖𝑗)

𝑗) )2

−(∑𝑖∈𝑅(𝑡𝑗)𝑒(∑𝑝𝑗=1𝛽𝑗𝑥𝑖𝑗)(∑𝑝𝑗=1𝑥𝑖𝑗))2

𝑖∈𝑅(𝑡 𝑒(∑𝑝𝑗=1𝛽𝑗𝑥𝑖𝑗)

𝑗)

]

𝑟

𝑖=1

= − ∑ [(∑𝑖∈𝑅(𝑡 𝑒(∑𝑝𝑗=1𝛽𝑗𝑥𝑖𝑗)(∑𝑝𝑗=1𝑥𝑖𝑗)

𝑗) )

2

∑ 𝑒(∑ 𝛽𝑗𝑥𝑖𝑗)

𝑝 𝑖∈𝑅(𝑡𝑗) 𝑗=1

−(∑𝑖∈𝑅(𝑡 (∑𝑝𝑗=1𝑥𝑖𝑗)𝑒(∑𝑝𝑗=1𝛽𝑗𝑥𝑖𝑗)

𝑗) )

2

(∑ 𝑒(∑ 𝛽𝑗𝑥𝑖𝑗)

𝑝

𝑖∈𝑅(𝑡𝑗) 𝑗=1 )

2 ]

𝑟

𝑖=1

(2.23)

(30)

Negatif turunan kedua dari log likelihood yaitu sebagai berikut.

−𝜕2ln 𝐿(𝛽)

𝜕2𝛽𝑗

= − [− ∑ [

(∑ (∑𝑝 𝑥𝑖𝑗

𝑗=1 )𝑒(∑ 𝛽𝑗𝑥𝑖𝑗) 𝑝 𝑗=1

𝑖∈𝑅(𝑡𝑗) )

2

𝑒(∑ 𝛽𝑗𝑥𝑖𝑗)

𝑝 𝑗=1 𝑖∈𝑅(𝑡𝑗)

(∑ (∑𝑝 𝑥𝑖𝑗

𝑗=1 )𝑒(∑ 𝛽𝑗𝑥𝑖𝑗) 𝑝 𝑗=1

𝑖∈𝑅(𝑡𝑗) )

2

(∑ 𝑒(∑ 𝛽𝑗𝑥𝑖𝑗)

𝑝 𝑗=1

𝑖∈𝑅(𝑡𝑗) )

2 ]

𝑛𝑖=1 ].

(2.24) Prosedur Newton-Raphson digunakan untuk memaksimalkan fungsi partial likelihood. Misalkan 𝐿(𝛽) merupakan fungsi partial likelihood 𝑝 dimensional vektor 𝛽 = (𝛽1, 𝛽2, … , 𝛽𝑝)𝑡 dan U(𝛽) merupakan vektor berukuran 𝑝 dari turunan parsial pertama 𝐿(𝛽), sehingga

U(𝛽) = [U1(𝛽), … , U𝑝(𝛽)]𝑡 (2.25) dengan memisalkan U𝑗(𝛽) =𝜕 ln 𝐿(𝛽)

𝜕 𝛽𝑗 , 𝑗 = 1 ,2 , … , 𝑝.

Misalkan I(𝛽) merupakan matriks Hessian berukuran 𝑝 × 𝑝 dari turunan partial likelihood kedua dari ln 𝐿(𝛽), yaitu

I(𝛽) = (I𝑖𝑗(𝛽)), 𝑖, 𝑗 = 1, 2, … , 𝑝 (2.26) dengan memisalkan I𝑖𝑗(𝛽) =𝜕2ln 𝐿(𝛽)

𝜕 𝛽𝑖𝛽𝑗 , maka

I(𝛽) =

[

𝜕2ln 𝐿(𝛽) (𝜕𝛽1)2

𝜕2ln 𝐿(𝛽)

𝜕𝛽1𝛽2

𝜕2ln 𝐿(𝛽)

𝜕𝛽2𝛽1

𝜕2ln 𝐿(𝛽) (𝜕𝛽2)2

𝜕2ln 𝐿(𝛽)

𝜕𝛽1𝛽𝑝

𝜕2ln 𝐿(𝛽)

𝜕𝛽2𝛽𝑝

⋮ ⋮ ⋱ ⋮

𝜕2ln 𝐿(𝛽)

𝜕𝛽𝑝𝛽1

𝜕2ln 𝐿(𝛽)

𝜕𝛽𝑝𝛽2 ⋯ 𝜕2ln 𝐿(𝛽) (𝜕𝛽𝑝)2 ]

(31)

Algoritma yang digunakan dalam metode Newton Raphson adalah sebagai berikut:

𝛽̂𝑐+1 = 𝛽̂𝑐 − I(𝛽̂𝑐)−1U(𝛽̂𝑐) (2.27)

dengan memisalkan 𝑐 = 0, 1, 2, … dan I(𝛽̂𝑐)−1 adalah invers dari I(𝛽̂𝑐).

Langkah-langkah iterasi dengan menggunakan metode Newton Raphson adalah sebagai berikut:

1. Menentukan nilai awal, 𝛽̂0 = 0.

2. Memasukkan ke dalam persamaan (2.28), yaitu 𝛽̂1 = 𝛽̂0− I(𝛽̂0)−1U(𝛽̂0).

3. Iterasi dilakukan sampai diperoleh nilai yang konvergen, 𝛽̂𝑐+1 ≅ 𝛽̂𝑐. Varians dari 𝛽̂𝑗 dapat didefinisikan (Hosmer et al, 2008) sebagai berikut

𝑉𝑎𝑟(𝛽̂) = I(𝛽̂)−1. (2.28) Standar deviasi dari 𝛽̂𝑗 merupakan akar kuadrat dari varians 𝛽̂𝑗 (Hosmer et al, 2008) sebagai berikut

𝑆𝐸(𝛽̂) = √𝑉𝑎𝑟(𝛽̂) = √I(𝛽̂)−1 (2.29)

Standar deviasi di atas dapat digunakan umtuk mencari selang kepercayaan 𝛽̂𝑗 yaitu (1 − 𝛼)100% selang kepercayaan untuk 𝛽̂𝑗 (Hosmer et al, 2008) sebagai berikut

𝛽̂𝑗± 𝑧1−𝛼

2𝑆𝐸(𝛽̂) (2.30)

2.2.2 Estimasi Parameter Dengan Kejadian Ties

Misalkan 𝑡1 < 𝑡2 < ⋯ < 𝑡(𝑟) dengan 𝑟 adalah banyaknya waktu kematian. Jika terdapat 𝑑𝑖 kematian pada waktu 𝑡𝑖 dimana 𝑖 = 1, 2, … , 𝑟, misalkan 𝑠𝑖 adalah

(32)

jumlah nilai variabel 𝑥𝑗 dari semua individu yang mati pada saat 𝑡𝑖 (Klein &

Moeschberger, 2003).

Ada beberapa cara pendekatan pada kejadian bersama, dua diantaranya yaitu sebagai berikut:

2.2.2.1 Metode Breslow

Metode Breslow mengasumsikan bahwa ukuran dari himpunan resiko pada kejadian bersama adalah sama (Xinxin, 2011). Berikut ini adalah fungsi partial likelihood untuk metode Breslow:

𝐿(𝛽)𝑏𝑟𝑒𝑠𝑙𝑜𝑤 = ∏ 𝑒(∑𝑝𝑗=1𝛽𝑗𝑆𝑘) (∑ 𝑒(∑ 𝛽𝑗𝑋𝑖𝑗

𝑝

𝑗=1 )

𝑖∈𝑅(𝑡𝑗) )

𝑑𝑖 𝑟

𝑖=1

(2.31)

Dengan 𝑆𝑘 adalah jumlah kovarian 𝒙 pada kasus ties dan 𝑑𝑖 adalah banyaknya kasus ties pada waktu 𝑡𝑖.

2.2.2.2 Metode Efron

Metode Efron adalah metode yang memiliki perhitungan yang lebih sama halnya dengan metode Breslow, tetapi metode Efron lebih akurat perhitungannya daripada metode Breslow terutama ketika ukuran dari himpunan resiko untuk waktu kejadian bersama adalah besar (Xinxin, 2011). Pada pendekatan metode Efron ini, himpunan resikonya diselesaikan dengan pengurangan terhadap rata- rata dari nilai fungsi variabel ke-𝑗, karena tidak diketahui variabel mana yang mengalami kejadian terlebih dahulu. Berikut ini adalah fungsi partial likelihood dari metode Efron:

𝐿(𝛽)𝑒𝑓𝑟𝑜𝑛 = ∏ 𝑒(∑𝑝𝑗=1𝛽𝑗𝑆𝑘)

∏ [∑ 𝑒(∑ 𝛽𝑗𝑋𝑖𝑗

𝑝

𝑗=1 )

𝑖∈𝑅(𝑡𝑗) −(𝑘 − 1)

𝑑𝑖 ∑ 𝑒(∑ 𝛽𝑗𝑋𝑖𝑗

𝑝

𝑗=1 )

𝑖∈𝐷(𝑑𝑖) ]

𝑑𝑖 𝑘=1 𝑟

𝑖=1

(2.32)

(33)

Dengan 𝑆𝑘 adalah jumlah kovarian 𝒙 pada kasus ties dan 𝑑𝑖 adalah banyaknya kasus ties pada waktu 𝑡𝑖.

2.2.3 Pengujian Parameter

Terdapat tiga tujuan dalam statistika, yaitu sebagai berikut: (1) untuk menguji signifikansi parameter, (2) memperoleh estimasi titik dan (3) memperoleh selang kepercayaan. Menurut Hosmer dan Lemeshow (2008) terdapat tiga cara untuk menguji signifikansi parameter model Cox, yaitu dengan uji Partial Likelihood Ratio, uji Wald serta uji Score. Pengujian parameter bertujuan untuk memeriksa apakah variabel bebas mempunyai pengaruh yang nyata dalam model.

2.2.3.1 Uji Partial Likelihood Ratio

Untuk menguji hipotesis bahwa satu atau beberapa parameter regresi 𝛽𝑗 adalah nol dapat menggunakan uji partial likelihood ratio dinotasikan dengan 𝐺.

Uji statistik ini mengikuti distribusi chi-square dengan derajat bebas p. Langkah- langkah dalam uji partial likelihood ratio adalah sebagai berikut:

1. Hipotesis:

𝐻0: 𝛽𝑗 = 0 𝐻1: 𝛽𝑗 ≠ 0

2. Taraf signifikansi: 𝛼 3. Statistika uji:

𝐺 = −2[ln 𝐿(0) − ln 𝐿(𝛽̂𝑗)] (2.33)

Dengan memisalkan,

ln 𝐿(0) adalah log partial likelihood dari model tanpa variabel bebas (model nol).

ln 𝐿(𝛽̂𝑗) adalah log partial likelihood dari model yang terdiri dari p variabel bebas.

(34)

4. Daerah penolakan:

𝐻0 ditolak jika 𝐺 ≥ 𝜒(𝛼:db=p)2 atau p-value ≤ 𝛼 p: banyaknya variabel bebas.

5. Kesimpulan:

Jika 𝐻0 ditolak maka 𝛽𝑖 ≠ 0, menunjukkan bahwa variabel bebas berpengaruh terhadap waktu survival (variabel dependen).

2.2.3.2 Uji Wald

Uji Wald digunakan untuk menguji pengaruh parameter secara terpisah, dinotasikan dengan 𝑧. Statistika uji ini mengikuti distribusi chi-square dengan derajat bebas p. Langkah-langkah dalam uji Wald adalah sebagai berikut:

1. Hipotesis:

𝐻0: 𝛽𝑗 = 0 𝐻1: 𝛽𝑗 ≠ 0

2. Taraf signifikansi: 𝛼 3. Statistika uji:

𝑧2 = ( 𝛽̂𝑗 𝑆𝐸(𝛽̂𝑗))

2

(2.34) 4. Daerah penolakan:

𝐻0 ditolak jika 𝑧2 ≥ 𝜒(𝛼:db=p)2 atau p-value ≤ 𝛼 p: banyaknya variabel bebas.

5. Kesimpulan:

Jika 𝐻0 ditolak maka 𝛽𝑖 ≠ 0, menunjukkan bahwa variabel bebas berpengaruh terhadap waktu survival (variabel dependen).

2.2.3.3 Uji Score

(35)

Uji yang lain untuk menguji signifikansi parameter yaitu uji score. Statistik uji ini adalah rasio dari turunan log partial likelihood pada persamaan (2.21), dengan akar kuadrat dari persamaan (2.24) semuanya dievaluasi terhadap 𝛽𝑗 = 0. Statistik uji ini mengikuti distribusi chi-square dengan derajat bebas p. Langkah-langkah dalam uji score adalah sebagai berikut:

1. Hipotesis:

𝐻0: 𝛽𝑗 = 0 𝐻1: 𝛽𝑗 ≠ 0

2. Taraf signifikansi: 𝛼 3. Statistika uji:

𝑧2 = (

𝜕𝐿𝛽𝑗

𝜕𝛽𝑗

√I(𝛽̂𝑗)

|| 𝛽𝑗 = 0 )

2

(2.35)

4. Daerah penolakan:

𝐻0 ditolak jika 𝑧2 ≥ 𝜒(𝛼:db=p)2 atau p-value ≤ 𝛼 p: banyaknya variabel bebas.

5. Kesimpulan:

Jika 𝐻0 ditolak maka 𝛽𝑖 ≠ 0, menunjukkan bahwa variabel bebas berpengaruh terhadap waktu survival (variabel dependen).

2.2.4 Pemilihan Model Cox Terbaik

Pemilihan model terbaik diawali dengan pemilihan variabel yang masuk atau keluar dari model. Menurut Collett (2003), pemilihan variabel yang masuk atau keluar dari model dapat dilakukan dengan tiga cara yaitu seleksi forward, eliminasi backward dan prosedur stepwise. Prosedur seleksi stepwise merupakan kombinasi dari dua proses yaitu seleksi forward dan seleksi backward.

Pada penelitian ini pemilihan model terbaik dilakukan menggunakan seleksi forward. Prosedur seleksi forward atau disebut dengan seleksi maju merupakan suatu proses penambahan satu variabel yang terpilih dan ditambahkan

(36)

ke dalam model pada setiap langkahnya. Menurut Hosmer dan Lemeshow (2008) taraf signifikasi yang digunakan dalam seleksi forward disarankan antara 20% − 25% untuk memungkinkan lebih banyak variabel yang masuk dalam model. Pada masing-masing tahapan, kita akan memutuskan variabel mana yang merupakan prediktor terbaik untuk dimsukkan ke dalam model. Berikut seleksi forward:

Langkah 0: Misalkan ada sebanyak 𝑝 variabel bebas 𝑋𝑖, dengan 𝑖 = 1,2,3, … , 𝑝. Hitung 𝐺(0)(𝑖) = −2[ln 𝐿(0)(0) − ln 𝐿(0)(𝑖)] dengan 𝐿(0)(0) adalah log partial likelihood dari model null (model tanpa variabel bebas) dan 𝐿(0)(𝑖) adalah log partial likelihood dari model dengan variabel bebas 𝑋𝑖, dengan p-value untuk uji signifikansi yaitu 𝑝(0)(𝑖) = P[𝜒2(1) ≥ 𝐺(0)(𝑖)]. Variabel bebas yang pertama kali masuk dalam model adalah variabel bebass yang paling signifikan berpengaruh terhadap waktu survival dinotasikan dengan 𝑋𝑒1 yaitu variabel yang memiliki 𝑝(0)(𝑒1) = min𝑖𝑝(0)(𝑖) dengan 𝑝(0)(𝑒1) < 𝛼, 𝛼 merupakan taraf signifikansi yang dipilih, maka proses yang berlanjut pada langkah 1.

Langkah 1: Langkah ini dimulai dengan variabel 𝑋𝑒1 dalam model. Hitung 𝐺(1)(𝑖) = −2[ln 𝐿(1)(𝑖) − ln 𝐿(0)(𝑋𝑒1)] dengan 𝑖 = 1,2,3, … , 𝑝 dan 𝑖 ≠ 𝑒1. ln 𝐿( 𝑋𝑒1) adalah log partial likelihood dengan dua variabel bebas dalam model, ln 𝐿(1)(𝑖) adalah log partial likelihood dengan variabel bebas yang terpilih pada langkah 0. p-value untuk uji signifikansi dari penambahan 𝑋𝑖 pada model yang terdiri dari 𝑋𝑒1 yaitu 𝑝(1)(𝑖) = P[𝜒2(1) ≥ 𝐺(1)(𝑖)]. Variabel bebas yang dipilih untuk masuk dalam langkah 2 yaitu 𝑋𝑒2 dengan variabel tersebut memiliki 𝑝(1)(𝑒2) = min𝑖≠𝑒1𝑝(1)(𝑖). Jika variabel yang terpilih yaitu 𝑋𝑒2 signifikan dengan 𝑝(1)(𝑒2) < 𝛼, maka berlanjut pada langkah 2.

Gambar

Tabel 4.1 Ukuran Statistika Waktu Survival Korban Kecelakaan Lalu Lintas   Ukuran Statistika  Waktu (hari)
Gambar 4.1  Distribusi  Frekuensi  Usia  Korban Kecelakaan  Lalu  Lintas  di  Kota Medan
Gambar 4.3  Distribusi  Frekuensi  Kepemilikan  SIM  Korban  Kecelakaan  Lalu Lintas di Kota Medan
Gambar 4.4  Distribusi  Frekuensi  Kendaraan  yang  terlibat  kecelakaan  dengan Korban Kecelakaan Lalu Lintas di Kota Medan
+7

Referensi

Dokumen terkait

Hasil yang didapatkan, pada regresi Weibull faktor yang berpengaruh signifikan terhadap laju kesembuhan pasien adalah faktor usia, jenis kelamin, nyeri dada, dan

Berdasarkan Tabel 4.3 dapat diketahui bahwa variabel yang berpengaruh secara signifikan atau lebih dari adalah variabel usia awal terjangkit kanker

Hasil yang didapatkan, pada regresi Weibull faktor yang berpengaruh signifikan terhadap laju kesembuhan pasien adalah faktor usia, jenis kelamin, nyeri dada, dan

Metode lain yang dapat digunakan untuk pemodelan data survival jika terdapat satu atau lebih variabel yang tidak memenuhi asumsi proportional hazard. adalah

Dari hasil pengujian regresi Cox Proportional Hazard bahwa variabel umur dan penyakit penyerta hipertensi dapat berpengaruh terhadap ketahanan hidup pasien

Hasil analisis dari ketiga metode tersebut diketahui persamaan regresi cox proportional hazard yang terbaik yaitu menggunakan metode exact dan terdapat tiga faktor

Penularan kuman infeksius penyebab diare ditularkan melalui Face-Oral kuman tersebut dapat ditularkan bila masuk ke dalam mulut melalui makanan, minuman atau benda yang

Penelitian ini dilakukan dengan tujuan untuk mengetahui bagaimana curah hujan, suhu, lokasi, kelembaban dan lama penyinaran dapat mempengaruhi tingkat keberhasilan penetasan telur penyu