• Tidak ada hasil yang ditemukan

2.1 Analisis Survival - Penerapan Regresi Cox Proportional hazard pada Analisis Survival dan Identifikasi Faktor Lama Studi Mahasiswa S-1 Manajemen Fakultas Ekonomi Universitas Sumatera Utara

N/A
N/A
Protected

Academic year: 2019

Membagikan "2.1 Analisis Survival - Penerapan Regresi Cox Proportional hazard pada Analisis Survival dan Identifikasi Faktor Lama Studi Mahasiswa S-1 Manajemen Fakultas Ekonomi Universitas Sumatera Utara"

Copied!
13
0
0

Teks penuh

(1)

BAB 2

LANDASAN TEORI

Pada bab ini akan dipaparkan teori-teori yang menjadi dasar dan landasan dalam penelitian sehingga membantu mempermudah pembahasan bab selanjutnya dan pembahasan utama dalam penelitian ini. Teori tersebut meliputi analisis survival data tersensor, fungsi survival dan fungsi hazard, estimasi Kaplan-Meier, model cox proportional hazard.

2.1 Analisis Survival

Armitage dan Berry (1987) mengatakan bahwa analisis survival merupakan analisis yang melibatkan uji statistik untuk menganalisis data yang variabelnya berkaitan dengan waktu atau lamanya waktu sampai terjadinya peristiwa tertentu. Menurut Klein baum dan Klein (2005) analisis survival adalah kumpulan dari prosedur statistik untuk menganalisis data dimana outcome variabelnya adalah waktu hingga terjadi peristiwa muncul. Waktu survival dapat didefinisikan sebagai waktu dari awal observasi hingga terjadinya peristiwa, dapat berupa hari, bulan, maupun tahun.

Menurut Le (2003) dalam menentukan waktu survival, T, terdapat tiga elemen dasar yang diperlukan yaitu:

1. Waktu awal (time origin).

2. Peristiwa akhir/waktu akhir (failure event). 3. Skala waktu sebagai satuan pengukuran waktu.

T (lama waktu)

(2)

T adalah lama dari waktu awal (time origin) harus didefinisikan dengan jelas, yaitu waktu awal melakukan studi. Begitu juga waktu akhir harus didefinisikan secara jelas yaitu kegagalan dalam menyelasaikan studi (skala waktu) (Le, 2003).

Analisis survival memiliki beberapa tujuan (Kleinbaum dan Klein, 2005): 1. Mengestimasi dan mengiterpretasikan fungsi survival dan fungsi

hazard.

2. Membandingkan fungsi survival dan fungsi hazard.

3. Mengestimasi hubungan antara variabel penjelas dengan waktu survival.

2.1.1 Data Tersensor

Perbedaan antara analisis survival dengan analisis statistika lainnya adalah terjadinya suatu peristiwa yang lama waktu terjadinya terhadap objek adalah bervariasi. Selain itu adanya data tersensor pada analisis survival. Menurut Machin et. al (2006) data dikatakan tersensor jika pengamatan waktu survival hanya sebagian, tidak sampai failure event. Penyebab terjadinya data tersensor antara lain (Le, 2003):

1. Loss to follow up, terjadi bila objek yang kita alami hilang dalam pengamatan.

2. Drop out, terjadi bila perlakuan dihentikan karena alasan tertentu.

3. Termination of study, terjadi bila masa penelitian berakhir sementara objek yang diobservasi belum mencapai failure event.

Sedangkan menurut Kleinbaum dan Klein (2005) ada 3 alasan umum terjadinya penyensoran, yaitu:

(3)

3. Objek ditarik dari penelitian karena kegagalan atau disebabkan alas an lain.

Situasi ini diilustrasikan dengan grafik di bawah ini. Grafik menggambarkan beberapa orang atau objek yang diikuti X menyatakan orang atau objek yang mendapatkan peritiwa.

Gambar 2.1 Grafik Data Tersensor

Dalam bukunya Crowder et. al (1991) mengatakan bahwa ada tiga jenis penyensoran, yaitu:

1. Left-censored, pengamatan dikatakan left-cencored jika objek yang diobservasi mengalami peristiwa di bawah waktu yang telah ditetapkan atau ketika masa observasi belum selesai.

2. Right-censored, pengamatan dikatakan right-cencored jika objek masih hidup atau masih beroperasi ketika masa observasi telah selesai.

3. Interval-censored, ketika objek mengalami peristiwa diantara interval waktu tertentu maka pengamatan dikatakan interval-censored.

dikeluarkan

hilang

X

X

Penelitian berakhir

Penelitian berakhir

(4)

Menurut Lee dan Wang (2003) ada 3 tipe penyensoran data, yaitu:

1. Tipe I, jika objek-objek diobservasi selama waktu tertentu, namun ada beberapa objek yang mengalami peristiwa setelah periode atau masa observasi selesai, dan sebagian lagi mengalami peristiwa diluar dari yang ditetapkan.

2. Tipe II, masa obsevasi selesai setelah sejumlah objek yang diobservasi diharapkan mengalami peristiwa yang ditetapkan, sedang objek yang tidak mengalami peristiwa disensor.

3. Tipe III, jika waktu awal dan waktu berhentinya observasi dari objek berbeda-beda. Sensor tipe III ini sering disebut sebagai random-censored.

2.1.2. Fungsi Survival dan Fungsi Hazard

Pada analisis survival ada 2 hal yang mendasar yaitu fungsi survival dan fungsi hazard. Fungsi survival merupakan fungsi dasar dari analisis ini, karena meliputi probabilitas survival dari waktu yang berbeda-beda yang memberikan informasi penting tentang data survival. Secara teori, fungsi survival dapat digambarkan dengan kurva mulus dan memilki karakteristik sebagai berikut (Kleinbaum dan Klein, 2005):

1. Tidak meningkat, kurva cenderung menurun ketika t meningkat.

2. Untuk t = 0, S(t) = S(0) = 1 adalah awal dari penelitian, karena tidak ada objek yang mengalami peristiwa, probabilitas dari suatu survival 0 adalah 1. 3. Untuk t = ∞, S(t) = S(∞) = 0 secara teori, jika periode penelitian meningkat

(5)

Gambar 2.2 Kurva Fungsi Survival

Berbeda dengan fungsi survival yang fokus pada tidak terjadinya peristiwa, fungsi hazard fokus pada terjadinya peristiwa. Oleh karena itu fungsi hazard dapat dipandang senagai pemberi informasi yang berlawanan dengan fungsi survival. Sama halnya dengan kurva fungsi survival, kurva fungsi hazard juga memiliki karakteristik, yaitu (Kleinbaum dan Klein 2005):

1. Selalu nonnegatif, yaitu sama atau lebih besar dari nol 2. Tidak memiliki batas atas

Selain itu fungsi hazard juga digunakan untuk alasan: 1. Member gambaran tentang keadaan failure rate. 2. Mengidentifikasi bentuk model yang spesifik

(6)

Gambar 2.3 Kurva Fungsi Hazard

Misalkan T melambangkan waktu survival dari waktu awal sampai terjadinya peristiwa yang merupakan variable acak yang memiliki karakteristik fungsi survival dan fungsi hazard. Jika fungsi survival dinotasikan dengan 𝑆(𝑡), didefinisikan sebagai probabilitas suatu objek yang bertahan lebih dari 𝑡 waktu, maka (Le, 2003):

𝑆(𝑡) =𝑃𝑟(𝑇>𝑡), 𝑡 ≥0

(2.1)

𝑆(𝑡) dikenal juga sebagai rata-rata survival, dan fungsi hazard merupakan laju failure atau kegagalan sesaat dengan asumsi objek telah bertahan sampai waktu ke-t, yang didefinisikan sebagai berikut :

ℎ(𝑡) =𝑓(𝑡)

𝑆(𝑡)

(2.2)

dengan f(t) adalah fungsi kepadatan probabilitas T. Sekarang misalkan 𝐹(𝑡) =

Pr(𝑇 ≤ 𝑡) =∫ 𝑓0𝑡 (𝑥)𝑑𝑥 , 𝑡 ≥0 adalah fungsi distribusi kumulatif dari T, maka

fungsi survival menjadi (Korosteleva,2003):

𝑆(𝑡) =𝑃𝑟(𝑇> 𝑡) =∫ 𝑓𝑡 (𝑥)𝑑𝑥 = 1− 𝐹(𝑡), 𝑡 ≥0

(2.3)

Dan fungsi hazard kumulatif 𝐻(𝑡), didefinisikan sebagai:

h(t)

(7)

𝐻(𝑡) =∫ ℎ0𝑡 (𝑥)𝑑𝑥𝑡 ≥0 (2.4)

2.2Kaplan-Meier

Telah diketahui bahwa salah satu tujuan dari analisis survival ialah mengestimasi dan menginterpretasi fungsi survival dan fungsi hazard. Banyak metode yang digunakan untuk mengestimasi fungsi survival, diantaranya Nelson-Aalen estimator, metode life-table (actuarial), metode Kaplan-Meier, AFT, bayessian counting process dan lain-lain. Namun dalam penelitian ini metode yang digunakan adalah metode Kaplan-Meier. Penelitian ini ialah penelitian statstik nonparametric dengan data tersensor, sehingga penggunaan metode Kaplan-Meier adalah yang paling baik.

Sebenarnya metode life-table sama dengan Kaplan-Meier, namun pada life-table objek di klasifikasikan berdasarkan karakteristik tertentu yang masing-masing karakteristik disusun dengan interval dengan menganggap peluang terjadinya efek selama masa interval adalah konstan, sehingga data yang diperoleh akan lebih umum. Sedangkan pada metode Kaplan-Meier objek dianalisis sesuai dengan waktu aslinya masing-masing. Hal ini mengakibatkan proporsi survival yang pasti karena menggunakan waktu survival secara tepat sehingga diperoleh data yang lebih akurat. Selain itu Kaplan-Meier merupakan metode yang digunakan ketika tidak ada model yang layak untuk data survival. Selama hampir 4 dekade metode estimasi Kaplan- Meier merupakan salah satu dari kunci metode statistika untuk analisis data survival tersensor, estimasi Kaplan-Meier dikenal juga dengan estimasi product limit.

(8)

𝑆̂ (t) = , t ≥ 0

𝑛𝑖 = 𝑜𝑏𝑗𝑒𝑘𝑦𝑎𝑛𝑔𝑏𝑒𝑟𝑒𝑠𝑖𝑘𝑜𝑛𝑎𝑚𝑢𝑛 masih bertahan pada 𝑡𝑖 (1≤ 𝑖 ≤ 𝑘)

𝑑𝑖 = menyatakan jumlah objek yang lulus pada 𝑡𝑖

2.3Uji Log Rank

Pada statistika, uji log-ran k (uji mantel-cox) adalah sebuah uji hipotesis untuk membandingkan fungsi survival diantara dua kelompok. Uji ini merupakan uji statistik nonparametrik dan sesuai digunakan ketika data tidak simetris yaitu data miring ke kanan. Uji log-rank diperluas untuk analisis stratifikasi, sebagai contoh, pengaruh variabel prognostik yang patut dperhitungkan, dan untuk membandingkan tiga grup atau lebih (Machin et. al, 2006).

Menurut Armitage dan Berry (1987) langkah pengerjaan uji ini ialah menyusun waktu survival, mengurutkan kedua grup yang diobservasi. Misalkan ada dua grup A dan B, jika 𝑡𝑖 menyatakan waktu ada 𝑑𝑖 objek yang mengalami peristiwa misalnya kelulusan dan 𝑛𝐴,𝑛𝐵 masing-masing menyatakan jumlah objek yang memiliki resiko namun masih bertahan dari grup A dan B, maka ekspektasi banyaknya objek yang mengalami peristiwa ialah:

𝐸(𝑑𝑖𝐴) = 𝑛𝑖𝐴𝑑𝑖

𝑛𝑖

𝑉𝑎𝑟(𝑑𝑖𝐴) =𝑑𝑖(𝑛𝑖 − 𝑑𝑖)𝑛𝐴𝑛𝐵

𝑛𝑖2(𝑛 𝑖 −1)

(9)

2.4Cox Proportional Hazard

Fungsi survival dan fungsi hazard merupakan analisis yang digunakan untuk melihat perbedaan 2 kelompok atau lebih. Namun apabila variabel-variabel kovariat yang ingin dikontrol atau bila menggunakan beberapa variabel penjelas dalam menjelaskan hubungan antara waktu survival maka regresi cox lah yang digunakan. Jadi regresi cox merupakan model yang menggambarkan hubungan antara waktu survival sebagai variabel dependen dengan 1 set variabel independen. Variabel independen ini bias kontinu maupun kategorik.

Cox proportional hazard merupakan pemodelan yang digunakan dalam analisis survival yang merupakan model semiparametrik. Regresi cox proportional hazard digunakan bila outcome yang diamati adalah panjang waktu suatu kejadian. Pada mulanya pemodelan ini digunakan pada cabang statistika khususnya biostatistika yaitu digunakan untuk menganalisis kematian atau harapan hidup seseorang. Namun seiring perkembangan zaman pemodelan ini banyak dimanfaatkan di berbagai bidang. Diantaranya bidang akademik, kedokteran, sosial, science, teknik, pertanian dan sebagainya.

Menurut Machin et. al (2006) dengan menotasikan rata-rata fungsi hazard ℎ0(𝑡), kita dapat menentukan hazard (resiko) objek tertentu ℎ(𝑡), dengan:

ℎ(𝑡) =𝜆(𝑡)ℎ0(𝑡)

(2.9)

(10)

𝜆(𝑡) = ℎ(𝑡)

ℎ0(𝑡)

(2.10)

Ketika 𝜆(𝑡) tidak berubah maka ℎ(𝑡) =ℎ, dimana h adalah konstanta.

Formula model Cox merupakan perkalian dari dua besaran yaitu fungsi baseline

hazard dan bentuk eksponensial untuk penjumlahan linier dari βiXi ,yaitu penjumlahan dari p variabel independent X (Kleinbaum dan Klein, 2005).

0( t ) × 𝑒∑𝑝𝑖=1𝛽𝑖𝑋𝑖

baselin hazard Eksponensial melibatkan t melibatkan x tetapi tidak x tetapi tidak t

Pada model regresi umum, fungsi hazard tergantung pada t dan kovariat dependen 𝑥1(𝑡),𝑥2(𝑡), … ,𝑥𝑚(𝑡). Dan pada model cox proportional hazard sederhana, dimana kovariat 𝑥1,𝑥2, … ,𝑥𝑚 tergantung pada t maka fungsi hazard nya adalah sebagai berikut:

ℎ(𝑡,𝑥1,𝑥2, … ,𝑥𝑚,𝛽1,𝛽2, … ,𝛽𝑚) =ℎ0(𝑡)𝑒𝑥𝑝{𝛽1𝑥1+𝛽2𝑥2+⋯+𝛽𝑚𝑥𝑚} (2.11)

fungsi ℎ0(𝑡) dikatakan sebagai fungsi dasar dari hazard, yaitu ketika fungsi hazard dari objek yang nilai semua kovariatnya adalah nol (biasanya sebagai hipotesis) (Korosteleva, 2003).

(11)

baseline hazard, h0 (t), ialah fungsi yang tidak ditentukan. Inilah yang membuat cox proportional hazard merupakan model semiparametrik.

Model cox proportional hazard merupakan pemodelan yang sangat terkenal pada analisis kesintasan. Menurut Kleinbaum dan Klein (2005) hal yang menyebabkan model ini terkenal dan digunakan secara luas antara lain:

1. Model cox merupakan model semiparametrik

2. Dapat mengestimasi hazard ratio tanpa perlu h0 (t) atau baseline hazard function.

3. Dapat mengestimasi h0 (t), h(t, X), dan fungsi kesintasan walaupun h0 (t) tidak spesifik.

4. Merupakan model robust sehingga hasil dari model cox hampir sama dengan hasil model parametrik.

5. Model yang aman dipilih ketika berada dalam keraguan untuk menentukan model parametriknya, sehingga tidak ada ketakutan tentang pilihan model parametrik yang salah

6. Lebih baik daripada model logistik ketika tersedianya informasi tentang waktu survival dan adanya pensensoran.

2.5Faktor Lama Studi Mahasiswa

(12)

Berdasarkan hal tersebut faktor-faktor yang mempengaruhi kualitas mahasiswa perlu diperhatikan baik dari internal maupun eksternal. Faktor internal yang mempengaruhi kualitas adalah indeks prestasi kumulatif (IPK) dan jalur masuk. Faktor eksternal yang mempengaruhi kualitas adalah asal daerah sekolah SMA, status sekolah SMA dan penghasilan orang tua.

1. Asal daerah sekolah

Biasanya mahasiswa yang berasal dari luar daerah akan memiliki daya juang yang tinggi karena ia menyadari orang tuanya sudah berusaha dengan keras untuk memenuhi biaya pendidikannya baik biaya kost, makan, dan biaya kuliah sehingga ia akan berusaha untuk lulus secepat mungkin atau tepat waktu.

2. Status Sekolah

Latar belakang pendidikan yang baik akan menghasilkan mahasiswa yang rajin dan disiplin. Hal itu bisa menjadi dasar yang kuat untuk sukses dalam studinya.

3. IPK (Indeks Prestasi Kumulatif)

(13)

ditetapkan di dalam kurikulum masing-masing program studi, pada program Managemen yaitu sebanyak 144 sks.

4. Penghasilan orang tua

Orang tua yang mempunyai penghasilan yang baik akan mampu membiayai pendidikan mahasiswa. Sehingga mahasiswa bisa fokus dalam belajar karena tidak harus bekerja keras untuk mencari biaya kuliah.

5. Jalur masuk

Gambar

Gambar 2.1 Grafik Data Tersensor
Gambar 2.2 Kurva Fungsi Survival
Gambar 2.3 Kurva Fungsi Hazard

Referensi

Dokumen terkait

individu yang masuk pada waktu yang sama. Pada penyensoran sebelah kanan tipe I, penelitian diakhiri apabila waktu pengamatan yang ditentukan tercapai.

Analisis survival merupakan prosedur statistika yang digunakan untuk menganalisis data dimana variabel yang diperhatikan adalah jangka waktu dari awal pengamatan

Selain itu, faktor-faktor yang signfikan berpengaruh terhadap survival pasien HIV/AIDS dengan Antiretroviral Therapy (ART) berdasarkan hasil pemodelan menggunakan

Salah satu metode statistika yang dapat digunakan untuk mengetahui faktor-faktor yang mempengaruhi laju perbaikan klinis pasien adalah analisis survival dengan model regresi Cox

Penelitian sebelumnya yang dijadikan rujukan atau referensi berkaitan dengan demam tifoid maupun metode yang digunakan diantaranya, Rinni, Wuryandari, & Rusgiyono (2014)

Tujuan dari penelitian ini adalah untuk mengetahui perbandingan hasil uji metode regresi logistik dengan analisis diskriminan dalam meneliti faktor-faktor yang memengaruhi

3 Dari hasil pemodelan regresi proportional hazard diperoleh dua variabel yang berpengaruh terhadap waktu survival pasien kanker otak yang menjalani terapi ECCT di C-Tech

Salah satu metode statistika yang dapat digunakan untuk mengetahui faktor-faktor yang mempengaruhi laju perbaikan klinis pasien adalah analisis survival dengan model regresi