PENDEKATAN REGRESI
COX
PROPORSIONAL
HAZARD
DALAM PENENTUAN FAKTOR
–
FAKTOR YANG
BERPENGARUH TERHADAP LAMA STUDI MAHASISWA
S-1 MATEMATIKA
DI UNIVERSITAS AIRLANGGA
SKRIPSI
ARDI WAHYU AS’ARI
PROGRAM STUDI S-1 MATEMATIKA DEPARTEMEN MATEMATIKA FAKULTAS SAINS DAN TEKNOLOGI
PENDEKATAN REGRESI
COX
PROPORSIONAL
HAZARD
DALAM PENENTUAN FAKTOR
–
FAKTOR YANG
BERPENGARUH TERHADAP LAMA STUDI MAHASISWA
S-1 MATEMATIKA DI UNIVERSITAS AIRLANGGA
SKRIPSI
Sebagai Salah Satu Syarat untuk Memperoleh Gelar Sarjana Sains Bidang Matematika
Pada Fakultas Sains dan Teknologi Universitas Airlangga
Disetujui oleh :
Pembimbing I,
Drs. Eko Tjahjono, M.Si. NIP 19600706 198601 1 001
Pembimbing II,
LEMBAR PENGESAHAN NASKAH SKRIPSI
Judul : Pendekatan Regresi Cox Proporsional Hazard dalam Penentuan Faktor – Faktor yang Berpengaruh terhadap Lama Studi Mahasiswa S-1 Matematika di Universitas Airlangga
Penyusun : Ardi Wahyu As’ari
NIM : 080810352
Tanggal Ujian : 30 Agustus 2012
Disetujui oleh: Pembimbing I,
Drs. Eko Tjahjono, M.Si. NIP 19600706 198601 1 001
Pembimbing II,
Drs. H. Sediono, M.Si NIP. 19610712 198701 1 001
Mengetahui,
Ketua Departemen Matematika Fakultas Sains dan Teknologi
Universitas Airlangga
PEDOMAN PENGGUNAAN SKRIPSI
Skripsi ini tidak dipublikasikan, namun tersedia di perpustakaan dalam lingkungan Universitas Airlangga, diperkenankan untuk dipakai sebagai referensi kepustakaan, tetapi pengutipan harus seijin penulis dan harus menyebutkan sumbernya sesuai kebiasaan ilmiah.
KATA PENGANTAR
Assalamu’alaikum warahmatullahi wabarakatuh.
Alhamdulillah, segala puji syukur hanya layak untuk Allah SWT, atas segala nikmat, rahmat, taufiq, serta hidayah-Nya yang tiada terkira besarnya, sehingga penyusun dapat menyelesaikan skripsi dengan judul ”Pendekatan Regresi Cox Proporsional Hazard dalam Penentuan Faktor – Faktor yang Berpengaruh terhadap Lama Studi Mahasiswa S-1 Matematika di Universitas Airlangga”.
Dalam penyusunan skripsi ini, penyusun memperoleh banyak bantuan dari berbagai pihak, karena itu penyusun mengucapkan terima kasih yang sebesar-besarnya kepada :
1. kedua orang tua tercinta yang selalu memberikan do’a restu dan kasih sayangnya yang tak berujung kepada penyusun,
2. Drs. Eko Tjahjono,M.Si. dan Drs. Sediono,M.Si. selaku Dosen Pembimbing penyusun yang selalu dengan sabar memberikan arahan dan masukan,
3. Ahmadin, S.Si, M.Si. selaku Dosen Wali, Toha Saifudin S.Si, M.Si. yang telah membantu penyusun dalam mengarahkan dan menyelesaikan proposal awal, serta segenap Dosen Matematika yang telah memberikan banyak ilmu, 4. sahabat-sahabat dekat penyusun yang selalu mengiringi, menemani dan
memotivasi : Hikma, Titin, Putri, Desi, teman-teman MU 123, teman-teman
Math ’08, dan temen – teman seperjuangan C.I.S yang sama-sama merantau di Surabaya,
5. serta rekan – rekan lain yang tidak dapat disebutkan satu persatu. Akhir kata, semoga skripsi ini bermanfaat untuk pembaca.
Wassalamu’alaikum warahmatullahi wabarakatuh.
Surabaya, Agustus 2012 Ardi Wahyu A.
Ardi Wahyu As’ari, 2012, Pendekatan Regresi Cox Proporsional Hazard dalam Penentuan Faktor – Faktor yang Berpengaruh terhadap Lama Studi Mahasiswa S-1 Matematika di Universitas Airlangga. Skripsi ini dibawah bimbingan Drs. Eko Tjahjono,M.Si. dan Drs. Sediono,M.Si., Departemen Matematika, Fakultas Sains dan Teknologi, Universitas Airlangga, Surabaya.
ABSTRAK
Pada dasarnya setiap perguruan tinggi berusaha semaksimal mungkin meningkatkan kelulusan para mahasiswanya karena tingkat keberhasilan mahasiswa dapat mempengaruhi kualitas dari suatu perguruan tinggi. Oleh karena itu diperlukan analisis faktor-faktor yang mempengaruhi lama studi pada mahasiswa S-1 Matematika Universitas Airlangga.
Metode analisis survival yaitu suatu metode statistika yang mempelajari lamanya suatu peristiwa atau kejadian yang terjadi atau biasa dikenal dengan nama failure event. Model regresi Cox merupakan model yang sangat terkenal pada analisis survival untuk menjelaskan hubungan antara kegagalan individu pada suatu waktu dengan variabel penjelas dalam adanya penyensoran. Survival
yang dimaksud dalam penelitian ini adalah kemampuan mahasiswa untuk menyelesaikan studinya.
Hasil penelitian menunjukkan bahwa faktor yang berpengaruh signifikan terhadap lama studi mahasiswa adalah faktor IPK. Model regresi Cox yang diperoleh dalam kasus ini adalah :
( ) ( ) ( ( ) ( )) dengan dan .
Dari hasil model yang diperoleh, dapat diketahui bahwa semakin tinggi IPK maka seorang mahasiswa akan semakin cepat lulus. Oleh karena itu semakin tinggi IPK maka akan semakin besar peluang mahasiswa menyelesaikan studi
Ardi Wahyu As’ari, 2012, Proporsional Hazard Cox Regression Approach in Determining Factors Affecting S-1 Mathematic Students’ Duration of Study in Airlangga University. This skripsi was supervised by Drs. Eko Tjahjono,M.Si. and Drs. Sediono,M.Si., Department of Mathematics, Faculty of Science and Technology, Airlangga University, Surabaya.
ABSTRACT
Basically every university struggles to increase graduation rate of its students because the success rate of students can affect the quality of a university. Because of it, analysis of the factors that affect the duration of study in S-1 Mathematic students of Airlangga University is required.
A method of survival analysis is a statistical method used to learn the duration of an event or commonly known as failure event. Cox regression model is a very popular model in survival analysis to describe the relationship between the failures of an individual at a time with the explanatory variables with censoring data. Survival meant in this research is the ability of students to complete their studies.
Research results show that significant factors influence a student's study duration is the GPA factor. The Cox regression models obtained in this case are:
( ) ( ) ( ( ) ( )) where and .
DAFTAR ISI
2.1.2 Sampel Tersensor Tipe I ... 11
2.1.3 Sampel Tersensor Tipe II ... 11
2.4 Estimasi Kaplan-Meier ... 12
2.5 Model Regresi Cox Proporsional Hazard ... 12
2.6 Asumsi Model Cox Proporsional Hazard ... 15
2.7 Fungsi Likelihood ... 16
2.8 Cox Likelihood ... 16
2.9 Maksimum Likelihood Estimator (MLE) ... 17
2.10 Estimasi Fungsi Hazard Dasar dan Fungsi Survival Dasar ... 17
2.11 Estimasi Fungsi Kumulatif Hazard Dasar... 18
2.13 Uji Rasio Likelihood ... 18
3.2.1 Variabel Dependen atau Variabel Respon ... 23
3.2.2 Variabel Independen ... 24
3.3 Penyajian Data ... 25
3.4 Metode Analisis ... 26
PEMBAHASAN ... 28
4.1 Analisis Distribusi Data ... 28
4.1.1 Analisis Distribusi untuk Faktor IPK ... 29
4.1.2 Analisis Distribusi untuk Faktor Asal Daerah ... 30
4.1.3 Analisis Distribusi untuk Faktor Jenis Kelamin ... 31
4.1.4 Analisis Distribusi untuk Faktor Status SMA ... 32
4.1.5 Analisis Distribusi untuk Faktor Jalur Masuk ... 33
4.1.6 Analisis Distribusi untuk Faktor Penghasilan Orang Tua .... 34
4.1.7 Analisis Distribusi untuk Faktor Rata-Rata NUN SMA ... 35
4.2 Pemeriksaan Asumsi Proporsional ... 36
4.2.1 Estimasi Survival dari Data Lama Studi Mahasiswa S-1 Matematika dengan Metode Kaplan – Meier ... 36
4.2.2 Melakukan Pemeriksaan Asumsi Proporsional Hazard dengan Menggunakan Plot ( ) Terhadap Waktu Survival( ) ... 44
4.3 Estimasi Parameter dalam Model Regresi Cox Proporsional Hazard ... 48
4.3.1 Menentukan Fungsi Parsial Likelihood ... 49
4.3.2 Menentukan Fungsi Log-CoxLikelihood... 50
4.3.3 Menentukan Turunan Pertama Log-CoxLikelihood terhadap ... 51
4.3.4 Menentukan Turunan Kedua Log-CoxLikelihood terhadap ... 51
4.3.5 Mengestimasi menggunakan metode Newton-Raphson. .. 52
4.4 Estimasi Hazard Dasar ( ) dalam Model Regresi Cox Proporsional Hazard ... 53
4.5.1 Menghitung Estimasi Parameter Model Cox Proporsional
Hazard ... 54
4.5.2 Menghitung Hazard Dasar Model Cox Proporsional Hazard ... 57
4.5.3 Menentukan Model Cox Proporsional Hazard ... 57
4.6 Dugaan Peluang Mahasiswa yang Melakukan Studi dan Peluang Mahasiswa yang Lulus pada Berbagai Waktu ... 58
PENUTUP ... 61
5.1 Kesimpulan ... 61
5.2 Saran ... 62
DAFTAR TABEL
Nomor Judul Halaman
3.1 Tabel Lama Mahasiswa Menyelesaikan Studi 25
3.2 Tabel Kaplan-Meier dari Lama Mahasiswa
Menyelesaikan Studi 26
4.1 Tabel Ringkasan Data Mahasiswa Matematika Angkatan
2006 33
4.2 Tabel Distribusi Data Mahasiswa Matematika Angkatan
2006 terhadap Variabel Penjelas atau Faktor Dugaan 33 4.3 Tabel Distribusi Data Mahasiswa Matematika Angkatan
2006 untuk Faktor IPK 34
4.4 Tabel Distribusi Data Mahasiswa Matematika Angkatan
2006 untuk Faktor Asal Daerah 35
4.5 Tabel Distribusi Data Mahasiswa Matematika Angkatan
2006 untuk Faktor Jenis Kelamin 36
4.6 Tabel Distribusi Data Mahasiswa Matematika Angkatan
2006 untuk Faktor Jenis Kelamin 37
4.7 Tabel Distribusi Data Mahasiswa Matematika Angkatan
2006 untuk Faktor Jalur Masuk 38
4.8 Tabel Distribusi Data Mahasiswa Matematika Angkatan
2006 untuk Faktor Penghasilan Orang Tua 39
4.9 Tabel Distribusi Data Mahasiswa Matematika Angkatan
2006 untuk Faktor Rata-Rata NUN SMA 40
4.10 Tabel Kaplan - Meier dari Lama Mahasiswa
Menyelesaikan Studi untuk Faktor IPK 42
4.11 Tabel Kaplan - Meier dari Lama Mahasiswa Menyelesaikan Studi untuk Faktor Daerah Asal
4.12 Tabel Kaplan - Meier dari Lama Mahasiswa Menyelesaikan Studi untuk Faktor Jenis Kelamin
Mahasiswa 44
4.13 Tabel Kaplan - Meier dari Lama Mahasiswa
Menyelesaikan Studi untuk Faktor Status Asal SMA 45 4.14 Tabel Kaplan - Meier dari Lama Mahasiswa
Menyelesaikan Studi untuk Faktor Jalur Masuk 46 4.15 Tabel Kaplan - Meier dari Lama Mahasiswa
Menyelesaikan Studi untuk Faktor Penghasilan Orang
Tua 47
4.16 Tabel Kaplan - Meier dari Lama Mahasiswa
Menyelesaikan Studi untuk Faktor Rata-Rata NUN SMA 49
4.17 Tabel Estimasi Awal Parameter 55
4.18 Tabel Estimasi Parameter yang Signifikan 57
4.19 Tabel Estimasi Hazard Dasar dan Survival 58
4.20 Dugaan Peluang Mahasiswa yang Melakukan Studi
( ) pada Berbagai Waktu 59 4.21 Dugaan Peluang Mahasiswa yang Lulus ( ) pada
DAFTAR GAMBAR
menyelesaikan studi(t) untuk faktor IPK 50 4.2 Plot [ [ ̂( )]] terhadap waktu lama mahasiswa
menyelesaikan studi(t) untuk faktor Daerah Asal 51 4.3 Plot [ [ ̂( )]] terhadap waktu lama mahasiswa
menyelesaikan studi(t) untuk faktor Jenis Kelamin 51 4.4 Plot [ [ ̂( )]] terhadap waktu lama mahasiswa
menyelesaikan studi(t) untuk faktor Status SMA 52 4.5 Plot [ [ ̂( )]] terhadap waktu lama mahasiswa
menyelesaikan studi(t) untuk faktor Jalur Masuk 52 4.6 Plot [ [ ̂( )]] terhadap waktu lama mahasiswa
menyelesaikan studi (t) untuk faktor Penghasilan Orang
Tua 53
4.7 Plot [ [ ̂( )]] terhadap waktu lama mahasiswa
menyelesaikan studi(t) untuk faktor Rata-Rata NUN SMA 53 4.8 Grafik Peluang Mahasiswa yang Melakukan Studi ( )
yang Dipengaruhi IPK pada Berbagai Waktu (t) 60 4.9 Grafik Peluang Mahasiswa yang Lulus ( ) yang
DAFTAR LAMPIRAN
Nomor Judul Lampiran
1 Data Lama Mahasiswa Matematika Universitas Airlangga Tahun 2006 dalam Menyelesaikan Studi
2 Hasil Pengolahan SPSS untuk Model Regresi Cox Proporsional
Hazard
BAB I PENDAHULUAN
1.1 Latar Belakang
Pada dasarnya setiap perguruan tinggi berusaha semaksimal mungkin meningkatkan kelulusan para mahasiswanya, baik secara kuantitas maupun kualitas. Secara kuantitas diharapkan jumlah mahasiswa yang lulus sama dengan yang terdaftar. Sedangkan secara kualitas diharapkan para mahasiswa dapat lulus dengan IPK yang maksimal dan tepat waktu.
Universitas Airlangga merupakan salah satu perguruan tinggi negeri favorit di Indonesia yang mempunyai visi menjadi World Class University. Untuk menuju keinginan tersebut, dibutuhkan kerja keras dan kesungguhan seluruh civitas akademik baik dari pihak mahasiswa, dosen maupun karyawan demi tercapainya visi tersebut. Tingginya tingkat keberhasilan mahasiswa dan rendahnya tingkat kegagalan mahasiswa dapat mencerminkan kualitas dari suatu perguruan tinggi.
menyelesaikan studi melebihi delapan semester sebesar 43,9 % dari mahasiswa keseluruhan.
Dalam statistika dikenal metode analisis survival yaitu suatu metode statistika yang mempelajari lamanya suatu peristiwa atau kejadian yang terjadi atau biasa dikenal dengan nama failure event. Kejadian dalam kasus ini merupakan lama studi mahasiswa S-1 Matematika. Dalam analisis survival atau dikenal dengan istilah waktu ketahanan hidup (survival time) atau T merupakan waktu dari awal perlakuan sampai terjadinya respon pertama kali yang ingin diamati.
Respon yang dimaksud adalah waktu yang diperlukan sampai suatu peristiwa atau kejadian yang diharapkan terjadi atau mungkin saja belum ditemukan pada saat pengumpulan data berakhir sehingga waktu survival-nya tidak dapat diamati. Pada kondisi demikian, pengamatan tersebut dapat dinyatakan sebagai pengamatan tersensor (Collet, 1994). Sedangkan metode regresi survival
adalah metode regresi yang digunakan untuk melihat faktor-faktor yang menyebabkan terjadinya suatu peristiwa atau kejadian (biasa dikenal dengan nama
time dependent covariate) dengan variabel responnya adalah waktu ketahanan hidup. Salah satu metode regresi survival yang sering digunakan adalah regresi
Cox proporsional hazard (Collet,1994). Survival yang dimaksud dalam penelitian ini adalah kemampuan mahasiswa untuk menyelesaikan studinya
1. Model Cox proporsional hazard merupakan model semiparametrik.
2. Dapat mengestimasi hazard rasio tanpa diketahui ( ) atau fungsi hazard
dasarnya.
3. Dapat mengestimasi ( ) ( ) dan fungsi survival walaupun ( ) tidak spesifik.
4. Merupakan model robust sehingga hasil dari model Cox hampir sama dengan model parametrik.
5. Model yang aman dipilih ketika berada dalam keraguan untuk menentukan model parametriknya, sehingga tidak ada ketakutan tentang pilihan model parametrik yang salah.
Penelitian sebelumnya mengenai analisis faktor-faktor yang mempengaruhi keberhasilan studi mahasiswa program sarjana ekstensi manajemen agribisnis IPB menunjukkan bahwa mahasiswa perempuan memiliki IPK lebih tinggi dan masa studi lebih singkat (Syafrudin, 2006). Sartika (2009) melakukan penelitian tentang analisis faktor-faktor yang berpengaruruh terhadap keberhasilan mahasiswa Politeknik di Politeknik Negeri Bandung dan menunjukkan faktor nilai IPK, jenis kelamin, program studi yang diambil, dan nilai mata kuliah tertentu berpengaruh terhadap lama studi mahasiswa. Selain itu faktor lain usia, asal daerah mahasiswa, penghasilan orang tua, dan jalur masuk juga dianggap berpengaruh oleh Khoirunnisak (2010).
terakhir, dan penghasilan orang tua. Pemilihan faktor – faktor tersebut dilakukan berdasarkan pertimbangan ketersediaan data karena mahasiswa yang diteliti saat ini sudah dinyatakan lulus.
Pada penelitian ini penyusun mencoba mengidentifikasi faktor-faktor yang mempengaruhi lama studi mahasiswa S1 Matematika Universitas Airlangga dengan regresi Cox proporsional hazard dengan demikian akan diperoleh analisis
survival tentang kasus tersebut.
1.2 Rumusan Masalah
Berdasarkan uraian latar belakang di atas, maka diperoleh rumusan masalah sebagai berikut :
1. Faktor - faktor apa yang mempengaruhi lama studi mahasiswa S1 Matematika Universitas Airlangga berdasarkan model regresi Cox proporsional hazard ? 2. Bagaimana model hubungan dari faktor-faktor yang mempengaruhi lama studi
mahasiswa S1 Matematika Universitas Airlangga ?
1.3 Tujuan
1. Mengetahui faktor – faktor yang mempengaruhi lama studi mahasiswa S-1 Matematika Universitas Airlangga berdasarkan model regresi Cox
proporsional hazard,
2. Mengetahui model hubungan dari faktor-faktor yang mempengaruhi lama studi mahasiswa S-1 Matematika Universitas Airlangga.
1.4 Manfaat
Diharapkan penelitian ini memberikan informasi mengenai lama studi mahasiswa S-1 Matematika Universitas Airlangga serta faktor-faktor yang mempengaruhi lama studi mahasiswa S-1 Matematika Universitas Airlangga.
1.5 Batasan Masalah
BAB II
TINJAUAN PUSTAKA
2.1 Analisis Survival
Menurut Kleinbaum dan Klein (2005), analisis survival merupakan sekumpulan prosedur dalam statistika untuk menganalisis data yaitu waktu tahan hidup sampai mengalami kejadian atau event. Waktu dapat dinyatakan dalam tahun, bulan, minggu, atau hari dari awal suatu individu sampai mengalami suatu kejadian, dengan kata lain waktu dapat menyatakan usia dari suatu individu ketika mengalami sebuah kejadian.
Pada umumnya kejadian dikenal sebagai kegagalan atau failure misalnya kematian, muncul penyakit, atau beberapa penelitian yang mempunyai dampak negatif. Namun waktu survival juga dapat dinyatakan waktu untuk kembali bekerja setelah melakukan operasi atau kembali sehat, yang dalam kasus ini kegagalan mengakibatkan kejadian positif.
Pendapat yang sama juga diungkapkan oleh Collet (1994) bahwa kejadian tidak selalu berujung pada kematian, bisa juga mengenai sembuhnya pasien dari penyakit, berkurangnya gejala penyakit, atau kambuhnya pasien dari kondisi tertentu.
2.2 Fungsi Survival dan Fungsi Hazard
sehingga harus lebih besar atau sama dengan nol. Sedangkan menyatakan nilai tertentu dari variabel random besar.
Fungsi survival ( ) merupakan probabilitas dari seseorang mampu bertahan lebih lama dari beberapa waktu tertentu , sehingga ( ) menyatakan probabilitas variabel random melewati waktu tertentu . Secara teori range merupakan bilangan dari nol sampai tak hingga. Fungsi survival dapat digambarkan sebagai kurva kontinu dan memiliki karakteristik sebagai berikut : 1. tidak meningkat, kurva cenderung turun ketika meningkat,
2. untuk , ( ) adalah awal dari penelitian, karena tidak ada objek yang mengalami kejadian, probabilitas waktu survival 0 adalah 1,
3. untuk ( ) secara teori, jika periode penelitian meningkat maka tidak ada satu pun yang bertahan, sehingga kurva survival mendekati nol.
Gambar 2.1 Kurva Fungsi Survival
bertahan hidup sampai waktu . Berbeda dengan fungsi survival yang fokus pada keberhasilan, fungsi hazard fokus pada kegagalan ketika kejadian berlangsung. Sehingga dalam beberapa pemikiran, fungsi hazard dapat dianggap memberikan informasi yang berlawanan dengan fungsi survival.
Kurva fungsi hazard juga memiliki karakteristik, yaitu : 1. selalu non negatif, yaitu sama dengan atau lebih besar dari nol, 2. tidak memiliki batas atas.
Gambar 2.2 Kurva Fungsi Hazard
Selain itu tujuan fungsi hazard dapat digunakan untuk : 1. memberikan gambaran tentang failure rate,
2. mengidentifikasi bentuk model yang spesifik,
3. membuat model matematik untuk analisis survival biasa.
probabilitas suatu individu dapat bertahan sampai waktu yang lebih besar atau sama dengan waktu. Apabila diketahui fungsi distribusi kumulatif , yaitu :
( ) ( ) ∫ ( )
maka diperoleh fungsi survival sebagai berikut : ( ) ( ) ∫ ( )
∫ ( )
( ),
Fungsi survival dapat digunakan untuk menyatakan probabilitas suatu individu mampu bertahandari waktu mula-mula sampai waktu (Collet, 1994).
Fungsi hazard ( ) didefinisikan sebagai kemampuan peluang kegagalan sesaat suatu individu pada waktu . Misalkan probabilitas variabel random berada antara dan dengan syarat lebih besar atau sama dengan , maka dapat ditulis sebagai berikut :
( | )
Sehingga fungsi hazard adalah
( ) , ( | )
{ ( ( ) )}
, ( ( ) ) ( )
( ) , ( ) ( )- ( )
( ) ( ) ( )
karena ( ) ( ) ( ) ( ) sehingga diperoleh
( )
( ) *
( )
+ ( )( ) *
( )
+ ( ) *( )
+( ) , ( )- (2.1)
dengan
( ) ∫ ( )
( ) disebut fungsi hazard kumulatif. Dari persamaan (2.1), fungsi hazard
kumulatif dapat diperoleh dari fungsi survival sehingga
( ) ( ( )) (2.2)
(Collet, 1994)
2.3 Tipe Penyensoran
2.1.1 Sampel Lengkap
Pada uji sampel lengkap, eksperimen akan dihentikan jika semua benda atau individu yang telah diuji mati atau gagal. Langkah seperti ini mempunyai suatu keuntungan yaitu dihasilkannya observasi terurut dari semua benda atau individu yang diuji.
(Lawless,2003) 2.1.2 Sampel Tersensor Tipe I
Dalam sampel tersensor tipe I, eksperimen akan dihentikan jika telah dicapai waktu tertentu (waktu penyensoran). Misalkan adalah sampel random dari distribusi tahan hidup dengan fungsi kepadatan peluang ( ), fungsi
survival ( ) dan waktu tersensor untuk semua yaitu dengan . Suatu komponen dikatakan terobservasi jika dan tersensor jika . Selanjutnya data sampel uji hidup dicatat sebagai ( ) dan :
{
(Lawless, 2003) 2.1.3 Sampel Tersensor Tipe II
Pada pengujian sampel tersensor tipe II, eksperimen akan dihentikan setelah kematian ke- dari komponen yang dioperasikan tercapai. Misalkan adalah sampel random dari distribusi tahan hidup dengan fungsi kepadatan peluang ( ) dan fungsi survival ( ). Eksperimen dikatakan telah selesai jika kegagalan ke- telah dicapai ( ).
2.4 Estimasi Kaplan-Meier
Cara yang digunakan untuk menggambarkan survival dari sampel acak yaitu menggambarkan grafik fungsi survival atau fungsi distribusi empiris dengan cara estimasi Kaplan-Meier. Selain itu juga memberikan estimasi distribusi secara nonparametrik.
Diberikan ( ) yang menyatakan sampel random tersensor, dengan merupakan data terobservasi dan merupakan data tersensor. Misalkan terdapat ( ) dengan waktu yang berbeda , yang menyatakan banyaknya data yang terobesvasi. Kemungkian terjadinya satu atau lebih event yang terobservasi dinotasikan sebagai ∑ ( ) atau menyatakan banyaknya event terobservasi pada saat . Estimasi dari ̂( ) dapat didefinisikan sebagai berikut :
̂( ) ∏
dengan ∑ ( ) merupakan banyaknya individu yang beresiko pada saat dengan kata lain banyaknya individu yang belum mengalami kejadian atau
event dan tidak tersensor sebelum pada saat .
(Lawless, 1982)
2.5 Model Regresi Cox Proporsional Hazard
variabel penjelas untuk menjelaskan hubungan antara waktu survival, maka regresi Cox proporsional hazard lah yang digunakan. Jadi regresi Cox
proporsional hazard merupakan model yang menggambarkan hubungan antara waktu survival sebagai variabel dependen dengan satu set variabel independen. Variabel independen ini bisa kontinu ataupun kategorik.
Cox proporsional hazard merupakan model semiparametrik. Regresi Cox
proporsional hazard ini digunakan bila respon yang diobservasi adalah data waktu
survival (Kleinbaum dan Klein, 2005). Pada mulanya pemodelan ini digunakan pada cabang statistika khususnya biostatistika yaitu digunakan untuk menganalisis kematian atau harapan hidup seseorang. Namun seiring perkembangan zaman pemodelan ini banyak dimanfaatkan diberbagai bidang. Diantaranya bidang akademik, kedokteran, sosial, science, teknik, pertanian dan sebagainya.
Model regresi Cox proposional hazard (Kleinbaum dan Klein, 2005) ditulis dalam bentuk sebagai berikut :
( ) ( ) ( ) (2.3) dengan :
( ) merupakan variabel prediktor atau penjelas, jumlah dari variabel penjelas
( ) fungsi hazard dasar.
Dalam memilih model yang sesuai dari regresi Cox proposional hazard
diperlukan untuk mengestimasi , koefisien dari variabel penjelas X. Fungsi
diestimasi terlebih dahulu. Ketika menentukan nilai ̂ ditemukan solusi yang implisit sehingga diselesaikan secara numerik dengan metode Newton-Raphson. Kemudian nilai ̂ yang diperoleh digunakan untuk mengestimasi fungsi hazard
dasar.
Menurut Kleinbaum dan Klein (2005) dari model Cox proposional hazard, dapat mengestimasi rasio hazard ( ̂ ) yang membandingkan dua variabel X yang dinyatakan X* dan X dengan bentuk umum sebagai berikut :
̂ ,∑ ̂ ( )
-dengan ( ) ( ).
Selain itu dari model Cox proposional hazard juga diperoleh persamaan untuk penyesuaian kurva survival (adjusted survival curves) yang merupakan model Cox fungsi survival yang didefinisikan sebagai berikut :
( ) ( ) ( ) (2.4) dengan :
( ) merupakan variabel prediktor atau penjelas, jumlah dari variabel penjelas
( ) fungsi survival dasar.
2.6 Asumsi Model Cox Proporsional Hazard
Model Cox proporsional hazard mengasumsikan bahwa perbandingan rasio hazard dua prediktor tertentu selalu konstan dari waktu ke waktu. Jadi
hazard dari suatu individu, proporsional atau sebanding dengan hazard dari individu lain dengan perbandingannya konstan atau tidak tergantung pada waktu.
Asumsi proporsional hazard terpenuhi jika grarik hazard tidak memotong dua atau lebih kategori prediktor. Namun jika fungsi hazard memotong, asumsi proporsional hazard mungkin tidak terpenuhi. Oleh karena itu, untuk memeriksa perpotongan hazard digunakan pendekatan lain untuk mengevaluasi kelayakan asumsi proporsional hazard. Pemeriksaan asumsi proportional hazard dapat dilakukan dengan melihat plot – , ̂( )- atau juga dikenal dengan log-log plot terhadap waktu survival( ) untuk setiap variabel penjelas.
Dalam hal ini fungsi survival ̂( ) merupakan hasil estimasi metode Kaplan Meier. Apabila plot antar kategori dalam satu variabel penjelas terlihat sejajar atau tidak bersilangan maka asumsi proportional hazard terpenuhi dan variabel penjelas yang bersifat kategori dapat dimasukkan model.
Gambar 2.3 Plot [ [ ̂( )]] terhadap t yang sejajar
2.7 Fungsi Likelihood
Misalkan adalah variabel random yang identik dan independen dari suatu distribusi dengan fungsi kepadatan peluang (fkp) ( ) untuk dan adalah ruang parameter. Fkp bersama antara adalah ( ) ( ) ( ). Jika fkp bersama tersebut dinyatakan sebagai fungsi terhadap maka dinamakan fungsi likelihood yang dinyatakan dengan atau ditulis :
( ) ( ) ( ) ( )
(Hogg dan Craig, 1978)
2.8 Cox Likelihood
Collet (1994) menunjukkan fungsi likelihood yang sesuai untuk model proporsional hazard dengan kejadian diberikan berikut:
( ) ∏ ( ( ) ) ∑ ( ( )) ( )
(2.5)
dengan ( ) merupakan vektor kovariat untuk individu yang terobservasi pada ( ) kategori waktu ( ) dan ( ( )) merupakan himpunan dari waktu pengamatan yang mengalami kegagalan. Penjumlahan dalam persamaan fungsi likelihood ini merupakan jumlahan dari nilai ( ) pada setiap individu yang terobservasi pada waktu ( ).
( ) ∏ {∑ ( ( ) )
( ) }
(2.6)
dengan ( ) merupakan himpunan dari waktu yang mengalami kegagalan pada waktu .
2.9 Maksimum Likelihood Estimator (MLE)
Jika statistik ̂ ( ) memaksimumkan fungsi likelihood
( ) maka statistik ̂ ( ) dinamakan maksimum likelihood estimator(MLE)dari .
(Hogg and Craig, 1978)
2.10 Estimasi Fungsi Hazard Dasar dan Fungsi Survival Dasar
Misalkan komponen linear dari model proporsional hazard yang terdapat variabel penjelas X sebanyak p dan telah diperoleh estimasi koefisien variabel ̂ ̂ ̂ , sehingga dapat mengestimasi fungsi hazard dasar.
Jika terdapat r waktu kegagalan yang berbeda sehingga diperoleh penyusunan orde waktu ( ) ( ) ( ), dan terdapat banyaknya kegagalan dan banyaknya individu yang belum mengalami kegagalan pada waktu ( ). Estimasi fungsi hazard pada waktu ( ) diberikan berikut :
̂ ( ( )) ̂ (2.7) dengan ̂ merupakan solusi dari persamaan yang diberikan berikut :
̂ ( ∑ ( ( ) )
( ) )
(2.9) Estimasi fungsi survival dasar dari model regresi Cox proporsional hazard
dengan hazard dasar yang telah diestimasi dapat diperoleh dengan persamaan berikut :
̂ ( ) ∏ ̂ (2.8)
(Collet, 1994)
2.11 Estimasi Fungsi Kumulatif Hazard Dasar
Dari persamaan (2.2) diperoleh ( ) ( ( )), maka fungsi kumulatif hazard dasar dapat diestimasi berikut :
̂ ( ) ̂ ( ) ∑ ̂
(Collet, 1994)
2.12 Estimasi Fungsi Kumulatif Hazard
Dengan mengintegralkan kedua ruas dari persamaan (2.3), maka diperoleh: ∫ ̂( ) ∑ ∫ ̂ ( )
sehingga dapat diestimasi fungsi kumulatif hazard sebagai berikut :
̂( ) ∑ ̂ ( ) (2.10) (Collet, 1994)
2.13 Uji Rasio Likelihood
dibawah adalah ( ) ∏ ( ) dan fungsi likelihood dibawah
adalah ( ) ∏ ( ), maka untuk menguji hipotesis versus digunakan statistik uji ( ̂ )
( ̂ dengan
( ̂ ) ( ) dan ( ̂ )
( ) Daerah kritis untuk uji hipotesis tersebut adalah tolak jika untuk . ( Hogg and Craig, 2004)
Menurut Arbia (2006), statistik uji berdistribusi ( ) dengan adalah banyaknya parameter. Untuk tingkat signifikansi , ditolak jika ( ).
2.14 Metode Backward
Metode backward merupakan salah satu metode untuk mendapatkan model terbaik yang dapat menggambarkan hubungan antara waktu survival dengan beberapa variabel penjelas. Berikut ini merupakan langkah yang dilakukan untuk menyeleksi variabel berdasarkan variabel mana yang seharusnya masuk dalam model maupun dihilangkan dalam model menurut Le(1997) adalah sebagai berikut:
1. Membuat model regresi untuk setiap variabel penjelas secara bersama-sama 2. Memilih salah satu variabel penjelas, yang berdasarkan kriteria pemilihan
3. Melakukan pengujian pada variabel yang terpilih pada langkah II, sehingga dapat diketahui apakah variabel tersebut harus dihilangkan dari model atau tidak
4. Mengulangi langkah II dan III untuk setiap variabel yang ada dalam model. Jika tidak ada kriteria yang cocok lagi berdasarkan langkah III, maka tidak ada lagi variabel yang dihilangkan dari model dan proses telah selesai.
2.15 Metode Newton – Raphson
Misalkan terdapat bentuk implisit dari ( )
dengan maka iterasi Newton-Raphson adalah sebagai berikut (Lawless, 2003) :
( ) ( ) (2.11) Dengan ( ) maka
( ) ( ( ) ( ) ( ) ) dan
( ) * ( )+
Keterangan :
: vektor parameter regresor berukuran pada iterasi ke . ( ) matrik Jacobian pada saat .
( ) Vektor dari fungsi turunan pertama log L.
Adapun langkah-langkah dalam metode Newton-Raphson adalah sebagai berikut : 1. Menentukan nilai awal estimator untuk ( )
3. Menghitung estimator berikutnya menggunakan (2.11).
4. Mengulangi iterasi sampai diperoleh nilai max | | dengan adalah konstanta positif yang ditentukan.
2.16 SPSS
Analisis yang dijalankan di SPSS menggunakan prosedur yang sesuai pada dataset SPSS. Sebagian besar pengguna memilih prosedur dengan menunjuk dan mengklik mouse melalui serangkaian dari menu dan kotak dialog. Kode atau perintah syntax yang digunakan untuk analisis survival sebagai berikut :
 Estimasi fungsi survival dan membandingkan tiap tingkatan
Untuk mendapatkan estimator survival dengan Kaplan-Meier, pilih Analyze
→ Survival → Kaplan-Meier. Pilih variabel waktu survival (SURVT) dari daftar variabel dan memasukkannya ke dalam Time box, kemudian pilih STATUS variabel dan masukkan ke dalam Status box. Lalu akan dilihat sebuah tanda tanya dalam tanda kurung setelah variabel status yang menunjukkan bahwa nilai event yang akan dimasukkan. Klik tombol Define Event dan masukkan nilai 1 dalam kotak karena STATUS variabel berkode 1 untuk terobesrvasi dan 0 untuk tersensor. Kemudian masukkan variabel faktor. Kemudian klik tanda Save. Klik Next dan kemudian OK untuk melihat output.
 Memeriksa asumsi proporsional hazard menggunakan kurva log-log survival
Untuk menghitung log-log survival dapat dihitung dengan memilih Transform → Compute dan mendefinisikan variabel baru dalam dialog-box. Kemudian untuk kurva log-log survival Kaplan-Meier dapat dijalankan dengan memilih Graphs → Scatter dan kemudian mengklik Simple dan kemudian klik Define di kotak dialog scatterplot. Pilih LLS untuk sumbu Y, SURVT untuk sumbu X, dan varibel faktor di Set Marker by Box.
 Menjalankan model Cox proporsional hazard
Sebuah model Cox proporsional hazard dapat dijalankan dengan memilih Analyze → Survival→ Cox Regression. Pilih variabel waktu survival
(SURVT) dari daftar variabel dan memasukkannya ke dalam kotak Time, kemudian pilih STATUS variabel dan masukkan ke dalam kotak Status. Kemudian akan dilihat sebuah tanda tanya dalam tanda kurung setelah Status
variabel menunjukkan bahwa nilai event perlu dimasukkan. Klik tombol
Define Event dan masukkan nilai 1 dalam kotak karena STATUS variabel diberi kode 1 untuk terobservasi dan 0 untuk tersensor. Klik Next dan pilih daftar variabel faktor dan memasukkan ke dalam kotak kovariat. Klik OK untuk melihat output.
BAB III
METODE PENELITIAN
3.1 Sumber Data
Data yang digunakan dalam penelitian ini adalah data sekunder tentang lama studi mahasiswa (dalam semester) S-1 Matematika di Fakultas Sains dan Teknologi Universitas Airlangga tahun angkatan 2006, yaitu sebanyak 73 mahasiswa.
3.2 Variabel Penelitian
3.2.1 Variabel Dependen atau Variabel Respon
Variabel dependen dalam penelitian ini adalah waktu yang diperlukan oleh mahasiswa S-1 Matematika di Fakultas Sains dan Teknologi Universitas Airlangga tahun angkatan 2006 dalam menjalankan studi dari waktu awal studi hingga akhir studi dinyatakan lulus S-1 yang dilambangkan dengan huruf t dan satuan waktunya adalah semester dengan ketentuan sebagai berikut :
1. Jika seorang mahasiswa diketahui waktu lama studi (dalam semester) dinyatakan lulus sampai dengan semester gasal tahun ajaran 2011/2012 maka waktu survival tersebut dinyatakan data terobservasi.
3.2.2 Variabel Independen
1. Nilai Indeks Prestasi Kumulatif / IPK ( ) 1 :
2 : 3 :
2. Asal daerah mahasiswa ( ) 1 : Surabaya
2 : Luar Surabaya
3. Jenis kelamin mahasiswa ( ) 1 : Peremupan
2 : Laki – laki 4. Status asal SMA ( )
1 : Negeri 2 : Swasta 5. Jalur masuk ( )
1 : PMDK Prestasi 2 : PMDK Umum 3 : SPMB
6. Penghasilan orang tua ( ) 1 : <Rp 500.000,00
5 : Rp 5.000.000,00 – Rp 7.500.000,00
7. Rata – rata nilai Ujian Nasional (NUN) SMA ( ) 1. :
2. :
3.3 Penyajian Data
Tabel 3.1 Tabel Lama Mahasiswa Menyelesaikan Studi Individu( )
1
2
3
N
Keterangan :
: lama mahasiswa (dalam semester) menyelesaikan studi sampai dinyatakan yusidium
: variabel dikotomi yang menyatakan status tersensor ( ) atau terobservasi ( )
Tabel 3.2 Tabel Kaplan-Meier dari Lama Mahasiswa Menyelesaikan Studi ̂( )
̂( )
̂( )
̂( )
Keterangan :
: lama mahasiswa (dalam semester) menyelesaikan studi sampai dinyatakan yusidium
: banyaknya mahasiswa terobservasi yang masih melakukan studi sampai sebelum pada saat
: banyaknya mahasiswa menyelesaikan studi sampai dinyatakan yudisium pada saat
̂( ) : estimasi fungsi survival pada saat
3.4 Metode Analisis
1. Untuk mengetahui faktor – faktor yang memenuhi asumsi proporsional
hazard dengan langkah – langkah sebagai berikut :
a. melakukan estimasi survival dari data lama studi mahasiswa S1 Matematika dengan metode Kaplan-Meier,
2. Untuk mengetahui model hubungan faktor – faktor yang mempengaruhi waktu survival mahasiswa S1 Matematika Fakultas Sains dan Teknologi Universitas Airlangga dengan langkah – langkah sebagai berikut :
a. melakukan estimasi parameter model Cox proporsional hazard secara terpisah dengan langkah – langkah berikut :
i. menentukan estimasi parameter dari persamaan (2.6) dengan metode maksimum likelihood,
ii. menghitung nilai ̂,
iii. melakukan uji signikansi parameter dengan uji Rasio Likelihood dan seleksi model dengan metode backward,
iv. menghitung estimasi fungsi hazard dasar dari ̂ yang diperoleh, b. menyusun model regresi Cox proporsional hazard dari estimasi yang
diperoleh,
c. menghitung taksiran fungsi survival dari model yang terbentuk untuk mengetahui peluang mahasiswa S-1 Matematika yang masih studi pada waktu ke t,
BAB IV PEMBAHASAN
4.1 Analisis Distribusi Data
Tabel 4.1 Tabel Ringkasan Data Mahasiswa Matematika Angkatan 2006 Frekuensi Prosentase
Informasi Kejadian Terobervasi 66 90,4%
Tersensor 7 9,6%
Total 73 100,0%
*Sumber : Hasil Pengolahan SPSS
Dari tabel 4.1 diatas terlihat bahwa banyaknya mahasiswa yang terobservasi atau banyaknya mahasiswa matematika angkatan 2006 yang lulus (yudisium) sampai semester gasal tahun ajaran 2011/2012 yaitu 66 mahasiswa atau 90,4%. Sedangkan banyaknya mahasiswa yang tersensor atau banyaknya mahasiswa matematika angkatan 2006 yang masih melakukan studi sampai semester gasal tahun ajaran 2011/2012 sebanyak tujuh mahasiswa atau 9,6%.
Tabel 4.2 Tabel Distribusi Data Mahasiswa Matematika Angkatan 2006 terhadap Variabel Penjelas atau Faktor Dugaan
3=Rp1.000.000-Rp2.500.000
Dari tabel 4.2 terlihat bahwa mahasiswa matematika angkatan 2006 untuk faktor IPK frekuensi terbesar pada kategori II (2,75 < IPK ≤ 3,50), untuk faktor asal daerah frekuensi terbesar pada asal daerah luar Surabaya, untuk faktor jenis kelamin frekuensi terbesar pada mahasiswa yang berjenis kelamin perempuan, untuk faktor status SMA frekuensi terbesar pada mahasiswa dengan status asal SMA negeri, untuk faktor jalur masuk frekuensi terbesar pada mahasiswa yang berasal dari SPMB, untuk faktor penghasilan orang tua frekuensi terbesar pada kategori III (Rp1.000.000-Rp2.500.000), dan untuk faktor rata NUN SMA frekuensi terbesar pada kategori III (rata NUN >8,00).
4.1.1Analisis Distribusi untuk Faktor IPK
IPK pada Semeter VI Frekuensi
Dari tabel 4.3 terlihat bahwa pada kategori IPK ≤ 2,75 dari 17 mahasiswa terdapat 11 mahasiswa teroservasi dan enam mahasiswa tersensor di semester XI , dan pada kategori 2,75 < IPK ≤ 3,50 dari 49 mahasiswa terdapat 48 mahasiswa teroservasi dan hanya satu mahasiswa tersensor di semester XI. Sedangkan pada kategori IPK > 3,50 seluruh mahasiswa terobservasi, yaitu sebanyak tujuh mahasiswa.
Selain itu dari tabel 4.3 dapat dilihat bahwa untuk kategori dan untuk kategori mahasiswa menyelesaikannya studi paling lama sampai sebelas semester, sedangkan untuk kategori mahasiswa menyelesaikan studinya paling lama sampai delapan semester.
4.1.2 Analisis Distribusi untuk Faktor Asal Daerah
Asal Daerah Frekuensi Total Frekuensi mahasiswa terdapat 27 mahasiswa teroservasi dan 5 mahasiswa tersensor di semester XI. Sedangkan pada kategori asal daerah luar Surabaya seluruh mahasiswa dari 41 mahasiswa terdapat 39 mahasiswa teroservasi dan 2 mahasiswa tersensor di semester XI.
4.1.3 Analisis Distribusi untuk Faktor Jenis Kelamin
Tabel 4.5 Tabel Distribusi Data Mahasiswa Matematika Angkatan 2006 untuk Faktor Jenis Kelamin
Asal Daerah Frekuensi Total Frekuensi
Sedangkan dari 22 mahasiswa laki-laki terdapat 16 mahasiswa teroservasi dan enam mahasiswa tersensor di semester XI.
4.1.4 Analisis Distribusi untuk Faktor Status SMA
Tabel 4.6 Tabel Distribusi Data Mahasiswa Matematika Angkatan 2006 untuk Faktor Asal Daerah
Status SMA Frekuensi Total Frekuensi
4.1.5 Analisis Distribusi untuk Faktor Jalur Masuk
Tabel 4.7 Tabel Distribusi Data Mahasiswa Matematika Angkatan 2006 untuk Faktor Jalur Masuk
Status SMA Frekuensi Total Frekuensi
4.1.6 Analisis Distribusi untuk Faktor Penghasilan Orang Tua
Tabel 4.8 Tabel Distribusi Data Mahasiswa Matematika Angkatan 2006 untuk Faktor Penghasilan Orang Tua
Penghasilan Orang Tua Frekuensi Total Frekuensi
Selain itu dari tabel 4.8 dapat dilihat bahwa untuk kategori penghasilan orang tua <Rp500.000,00 studi paling lama sampai delapan semester, untuk kategori penghasilan orang tua Rp500.000,00 – Rp1.000.000,00 studi paling lama sampai sembilan semester, sedangkan untuk kategori penghasilan orang tua Rp1.000.000,00 – Rp2.500.000,00 dan kategori penghasilan orang tua Rp2.500.000,00 – Rp5.000.000,00studi paling lama sampai sebelas semester. 4.1.7 Analisis Distribusi untuk Faktor Rata-Rata NUN SMA
mahasiswa terdapat 56 mahasiswa teroservasi dan tiga mahasiswa tersensor di semester XI.
4.2 Pemeriksaan Asumsi Proporsional
4.2.1 Estimasi Survival dari Data Lama Studi Mahasiswa S-1 Matematika dengan Metode Kaplan – Meier
Sebelum menggambarkan plot [ [ ̂( )]] terhadap waktu survival (t), dibutuhkan estimasi survival, yaitu probabilitas mahasiswa yang masih studi pada waktu t semester. Menurut Lawless (1983), estimasi dari ̂( ) dapat diestimasi secara empiris dengan metode Kaplan-Meier yang dapat didefinisikan
̂( ) ∏
dengan merupakan lama mahasiswa Matematikan (dalam semester) menyelesaikan studi sampai dinyatakan lulus dari mahasiswa ke-j, menyatakan banyaknya mahasiswa terobservasi yang telah menyelesaikan studi sampai dinyatakan yudisium pada saat , dan menyatakan banyaknya mahasiswa
terobservasi yang masih melakukan studi sampai sebelum pada saat ( [ ] =banyaknya data yang tersensor pada saat )
hasil perhitungan estimasi survival untuk masing – masing kategori dapat dilihat pada tabel 4.10 sampai tabel 4.16.
Tabel 4.10 Tabel Kaplan - Meier dari Lama Mahasiswa Menyelesaikan Studi untuk Faktor IPK
Dari tabel 4.10 dapat dilihat bahwa nilai estimasi probabilitas mahasiswa yang masih studi ̂( ) untuk masing-masing kategori, semakin lama studinya semakin kecil probabilitas mahasiswa yang masih studi sehingga probabilitas mahasiswa yang dapat menyelesaikan studi semakin lama semakin besar.
maka probabilitas mahasiswa yang dapat menyelesaikan studi pada semester delapan sebesar 0,61225 atau 61,225% dari total mahasiswa, dan untuk kategori nilai ̂( ) maka probabilitas mahasiswa yang dapat menyelesaikan studi pada semester delapan sebesar 1 atau 100%. Sehingga semakin tinggi IPK semakin besar untuk peluang menyelesaikan masa studi.
Tabel 4.11 Tabel Kaplan - Meier dari Lama Mahasiswa Menyelesaikan Studi untuk Faktor Daerah Asal Mahasiswa
Pada tabel 4.11 menunjukkan bahwa nilai estimasi probabilitas mahasiswa yang masih studi ̂( ) untuk masing-masing kategori semakin lama studinya semakin kecil probabilitas mahasiswa yang masih studi sehingga probabilitas mahasiswa yang dapat menyelesaikan studi semakin lama semakin besar.
maka probabilitas mahasiswa yang dapat menyelesaikan studi pada semester delapan sebesar 0,146341 atau 14,6341% dari total mahasiswa. Sehingga peluang mahasiswa Surabaya dapat menyelesaikan masa studi lebih kecil daripada mahasiswa luar Surabaya.
Tabel 4.12 Tabel Kaplan - Meier dari Lama Mahasiswa Menyelesaikan Studi untuk Faktor Jenis Kelamin Mahasiswa
Dari tabel 4.12 terlihat bahwa nilai estimasi probabilitas mahasiswa yang masih studi ̂( ) untuk masing-masing kategori semakin lama studinya semakin kecil probabilitas mahasiswa yang masih studi sehingga probabilitas mahasiswa yang dapat menyelesaikan studi semakin lama semakin besar.
Maka, mahasiswa berjenis kelamin perempuan mempunyai peluang lebih besar untuk menyelesaikan masa studi daripada mahasiswa berjenis kelamin laki-laki.
Tabel 4.13 Tabel Kaplan - Meier dari Lama Mahasiswa Menyelesaikan Studi untuk Faktor Status Asal SMA
Dari tabel 4.13 terlihat bahwa nilai estimasi probabilitas mahasiswa yang masih studi ̂( ) untuk masing-masing kategori semakin lama studinya semakin kecil probabilitas mahasiswa yang masih studi sehingga probabilitas mahasiswa yang dapat menyelesaikan studi semakin lama semakin besar.
mahasiswa. Sehingga mahasiswa yang berasal dari SMA swasta mempunyai peluang lebih besar untuk menyelesaikan masa studi daripada mahasiswa yang berasal dari SMA negeri.
Tabel 4.14 Tabel Kaplan - Meier dari Lama Mahasiswa Menyelesaikan Studi untuk Faktor Jalur Masuk
Dari tabel 4.14 terlihat bahwa nilai estimasi probabilitas mahasiswa yang masih studi ̂( ) untuk masing-masing kategori semakin lama studinya semakin kecil probabilitas mahasiswa yang masih studi sehingga probabilitas mahasiswa yang dapat menyelesaikan studi semakin lama semakin besar.
maka probabilitas mahasiswa yang dapat menyelesaikan studi pada semester delapan sebesar 0,04762 atau 4,762% dari total mahasiswa, dan kategori mahasiswa dari SPMB nilai ̂( ) maka probabilitas mahasiswa yang dapat menyelesaikan studi pada semester delapan sebesar 0,12500 atau 12,500% dari total mahasiswa.
Tabel 4.15 Tabel Kaplan - Meier dari Lama Mahasiswa Menyelesaikan Studi untuk Faktor Penghasilan Orang Tua
yang dapat menyelesaikan studi semakin lama semakin besar. Selain itu pada tabel 4.15 dapat dilihat bahwa untuk kategori penghasilan orang tua <Rp500.000,00 nilai ̂( ) maka probabilitas mahasiswa yang dapat menyelesaikan studi pada semester delapan sebesar 1,00 atau 100%, untuk kategori penghasilan orang tua Rp500.000,00 – Rp1.000.000,00 nilai ̂( ) maka probabilitas mahasiswa yang dapat menyelesaikan studi pada semester delapan sebesar 0,8 atau 80% dari total mahasiswa, untuk kategori penghasilan orang tua Rp1.000.000,00 – Rp2.500.000,00 nilai ̂( ) maka probabilitas mahasiswa yang dapat menyelesaikan studi pada semester delapan sebesar 0.52000 atau 52%, dan untuk kategori penghasilan orang tua Rp2.500.000,00 – Rp5.000.000,00 nilai ̂( ) maka probabilitas mahasiswa yang dapat menyelesaikan studi pada semester delapan sebesar 0,53333 atau 53,333% dari total mahasiswa.
Dari tabel 4.17 terlihat bahwa nilai estimasi probabilitas mahasiswa yang masih studi ̂( ) untuk masing-masing kategori semakin lama studinya semakin kecil probabilitas mahasiswa yang masih studi sehingga probabilitas mahasiswa yang dapat menyelesaikan studi semakin lama semakin besar.
Selanjutnya dari tabel 4.17 dapat dilihat bahwa untuk kategori nilai ̂( ) maka probabilitas mahasiswa yang dapat menyelesaikan studi pada semester delapan sebesar 0,07143 atau 7,143% dari total mahasiswa dan untuk kategori untuk kategori nilai ̂( ) maka probabilitas mahasiswa yang dapat menyelesaikan studi pada semester delapan sebesar 0,13559 atau 13,559% dari total mahasiswa. Sehingga untuk kategori mempunyai peluang lebih kecil untuk menyelesaikan masa studi daripada kategori .
4.2.2 Melakukan Pemeriksaan Asumsi Proporsional Hazard dengan Menggunakan Plot [ [ ̂( )]] Terhadap Waktu Survival ( )
*Sumber : Hasil Pengolahan SPSS
Gambar 4.1 Plot [ [ ̂( )]] terhadap waktu lama mahasiswa menyelesaikan studi (t) untuk faktor IPK
*Sumber : Hasil Pengolahan SPSS
*Sumber : Hasil Pengolahan SPSS
Gambar 4.3 Plot [ [ ̂( )]] terhadap waktu lama mahasiswa menyelesaikan studi(t) untuk faktor Jenis Kelamin
*Sumber : Hasil Pengolahan SPSS
*Sumber : Hasil Pengolahan SPSS
Gambar 4.5 Plot [ [ ̂( )]] terhadap waktu lama mahasiswa menyelesaikan studi(t) untuk faktor Jalur Masuk
*Sumber : Hasil Pengolahan SPSS
*Sumber : Hasil Pengolahan SPSS
Gambar 4.7 Plot [ [ ̂( )]] terhadap waktu lama mahasiswa menyelesaikan studi(t) untuk faktor Rata-Rata NUN SMA Dari gambar 4.1 sampai 4.7 dapat diketahui bahwa variabel penjelas yang diduga masuk dalam model menunjukkan seluruh variabel mempunyai bentuk garis yang sejajar pada setiap kategorinya. Menurut Kleinbaum dan Klein (2005), apabila plot antar kategori dalam satu variabel penjelas terlihat sejajar atau tidak bersilangan maka asumsi proportional hazard terpenuhi dan variabel penjelas yang bersifat kategori dapat dimasukkan model. Sehingga semua variabel dalam kasus ini memenuhi asumsi proporsional hazard dan dapat dimasukkan ke dalam model regresi Cox proporsional hazard.
4.3 Estimasi Parameter dalam Model Regresi Cox Proporsional Hazard Karakteristik analisis survival yang mengakomodasi adanya sensoring
likelihood semakin kompleks. Metode Maximum Likelihood Estimator (MLE) tidak dapat digunakan secara langsung untuk proses estimasi karena adanya
sensoring pada model regresi Cox proporsional hazard yang merupakan model semiparametrik, dimana hazard dasarnya mempunyai distribusi tertentu sehingga untuk menduga parameter model, Kalbleish dan Prentice (2002) menyarankan menggunakan Metode Maximum Partial Likelihood Estimator (MPLE). Adapun langkah-langkah sebagai berikut :
4.3.1 Menentukan Fungsi Parsial Likelihood
Misalkan terdapat n pengamatan (mahasiswa), dengan r pengamatan (mahasiswa) yang teramati (yang sudah dinyatakan lulus) yang diurutkan sehingga r order waktu kelulusan dinotasikan dengan ( ) ( ) ( ) dan { } { ( ( ))} merupakan himpunan pengamatan yang mengalami kejadian dimana mahasiswa yang diamati sudah dinyatakan lulus atau risk set pada waktu ( ) yaitu waktu kelulusan mahasiswa ke-j. Peluang bahwa mahasiswa ke-j jika diketahui mahasiswa tersebut berada di dalam pada waktu ( ) adalah :
( ( ) ( ))
∑ ( ( )) ( ( ) ) (4.1)
Jika persamaan (4.1) disubstitusikan ke dalam model Cox proporsional
hazard (persamaan 2.3), maka diperoleh persamaan: ( ( )) ( ( ) )
∑ ( ( )) ( ( )) ( )
( ( ) )
∑ ( ( )) ( ) (4.2)
( ) ∏ * ( ( ) ) ∑ ( ( )) ( )+
(4.3)
Misalkan terdapat data dengan n pengamatan waktu survival, dinotasikan sebagai dan merupakan status sensoring, maka fungsi Cox likelihood dapat dinyatakan sebagai:
( ) ∏ {∑ ( ( ) )
( ) }
(4.4)
dengan ( ) merupakan himpunan dari waktu yang terobservasi yang mengalami kejadian pada waktu dengan .
4.3.2 Menentukan Fungsi Log-Cox Likelihood
Untuk mengestimasi parameter dengan maksimum likelihood terlebih dahulu menentukan log-likelihood agar mempermudah pencarian penduga . Dari persamaan (4.4) maka persamaan log-likelihoodnya dinyatakan sebagai: , ( )- *∏ {∑ ( ( ) ) Untuk mendapatkan estimasi parameter dari fungsi likelihood, maka dicari estimasi parameter yang akan memaksimumkan fungsi likelihood atau
4.3.3 Menentukan Turunan Pertama Log-Cox Likelihood terhadap
Untuk mendapatkan estimasi parameter dari fungsi likelihood, maka dicari estimasi parameter yang akan memaksimumkan fungsi likelihood atau
log-likelihood-nya, yaitu turunan pertama disamadengankan nol. Misal :
Karena persamaan (4.6) merupakan persamaan yang berbentuk implisit, maka untuk mencari estimasi parameter menggunakan pendekatan metode numerik yaitu metode Newton-Raphson.
dengan
4.3.5 Mengestimasi ̂ menggunakan metode Newton-Raphson.
Turunan pertama dari fungsi log-likelihood-nya masih berbentuk implisit, maka untuk mencari estimasi parameter model pada kasus ini menggunakan bantuan software SPSS dimana algoritma yang dipakai dalam mengestimasi parameter menggunakan metode Newton-Raphson. Adapun langkah-langkah dalam metode Newton-Raphson sebagai berikut :
1. Menentukan nilai awal [ ]
( ) ( )
3. Menghitung nilai koreksi, yaitu ( ) (| |)
4. Ulangi langkah kedua dan ketiga hingga nilai koreksi mendekati nol atau nilai kesalahan yang dinginkan.
4.4 Estimasi Hazard Dasar ( ) dalam Model Regresi Cox Proporsional Hazard
Untuk mendapatkan estimasi hazard dasar ( ) dalam model regresi Cox
proporsional hazard maka dengan estimator selanjutnya diperoleh estimasi parameter , maka selanjutnya dicari estimasi dengan menggunakan persamaan (2.7). Karena pada kasus ini menggunakan adanya sensoring maka persamaan (2.7) menjadi sebagai berikut:
̂ ( ( )) ̂ dengan ̂ *( ∑ ( ( ) )
( ) )
( ) +
Perhitungan estimasi hazard dasar ( ) dalam model regresi Cox
proporsional hazard pada kasus ini menggunakan bantuan software SPSS.
4.5 Model Regresi Cox Proporsional Hazard
Setelah mengetahui variabel - variabel yang telah memenuhi asumsi proporsional hazard, maka diperoleh model awal regresi Cox proporsional hazard
untuk kasus ini sebagai berikut :
( ) ( ) ( )
IPK dan ( )
daerah asal mahasiswa dan ( Surabaya luar Surabaya) jenis kelamin mahasiswa dan ( perempuan laki-laki) status asal SMA dan ( negeri swasta)
jalur masuk dan ( PMDK Prestasi PMDK Umum SPMB)
penghasilan orang tua dan ( < Rp500.000,00 Rp500.000,00 – Rp1.000.000,00 Rp1.000.000,00– Rp2.500.000,00;
Rp2.500.000,00 – Rp5.000.000,00)
rata –rata NUN SMA dan ( )
Pengolahan data untuk model regresi Cox proporsional hazard dilakukan dengan menggunakan bantuan software SPSS. Untuk mengetahui model hubungan faktor – faktor yang mempengaruhi waktu survival mahasiswa S1 Matematika Fakultas Sains dan Teknologi Universitas Airlangga dengan langkah
– langkah sebagai berikut :
4.5.1 Menghitung Estimasi Parameter Model Cox Proporsional Hazard Perhitungan estimasi parameter dalam kasus ini menggunakan bantuan
Tabel 4.17 Tabel Estimasi Awal Parameter
Setelah diperoleh nilai parameter model regressi Cox proporsional hazard, selanjutnya dilakukan uji apakah parameter tersebut mempunyai nilai yang signifikan terhadap model dengan menggunakan uji Rasio Likelihood. Hipotesis uji yang digunakan yaitu :
(tidak ada pengaruh) (ada pengaruh)
Tolak terjadi jika dengan atau 0,05%.
Hasil pengolahan SPSS untuk model regresi Cox proporsional hazard
IPK, asal daerah, jenis kelamin, status SMA, jalur masuk, penghasilan orang tua, dan rata NUN SMA. Kemudian pada iterasi kedua kovariat yang dikeluarkan dari model adalah penghasilan orang tua, iterasi ketiga kovariat yang dikeluarkan dari model adalah jalur masuk, iterasi keempat kovariat asal daerah, iterasi kelima kovariat yang dikeluarkan dari model adalah status SMA, iterasi keenam kovariat yang dikeluarkan dari model adalah rata NUN SMA, dan pada iterasi ketujuh yang dikeluarkan dari model adalah jenis kelamin.
Karena yang mempunyai nilai signifikan hanya faktor IPK, maka faktor yang dianggap mempengaruhi lama studi mahasiswa hanya faktor IPK dengan besarnya pengaruh kovariat terhadap model dapat dilihat pada tabel 4.18.
Tabel 4.18 Tabel Estimasi Parameter yang Signifikan
Nama Variabel ̂ ( ̂)
IPK
IPK(1) -1.347 0.260
IPK(2) -0.345 0.708
*Sumber : Hasil Pengolahan SPSS
4.5.2 Menghitung Hazard Dasar Model Cox Proporsional Hazard
Setelah diperoleh hasil estimasi parameter, kemudian dicari estimasi
hazard dasar dengan menggunakan bantuan software SPSS. Hasil perhitungan ̂ yang diperoleh dari SPSS dapat dilihat pada tabel 4.19.
Tabel 4.19 Tabel Estimasi Hazard Dasar dan Survival
Lama Studi
7 0.209961578 0.209961578 0.81061539
8 1.415801949 1.205840371 0.24273088
9 2.826610753 1.410808804 0.05921320
10 4.237411687 1.410800934 0.01444493
11 4.973303398 0.735891711 0.00692025
*Sumber : Hasil Pengolahan SPSS 4.5.3 Menentukan Model Cox Proporsional Hazard
Setelah diperoleh hasil estimasi parameter dan hazard dasarnya, persamaan model umum regresi Cox proporsional hazard adalah :
( ) ( ) ( ( ) ( ))
dengan
dan .
Kemudian model regresi Cox proporsional hazard untuk setiap semester adalah: ( ) ( ( ) ( ) ( ))
( ) ( ( ) ( ) ( ))
( ) ( ( ) ( ) ( ))
( ) ( ( ) ( ) ( ))
4.6 Dugaan Peluang Mahasiswa yang Melakukan Studi ( ) dan Peluang Mahasiswa yang Lulus ( ) pada Berbagai Waktu
Setelah diperoleh estimasi parameter serta estimasi hazard dan survival
dasar, maka dapat dilakukan dugaan peluang mahasiswa yang melakukan studi ( ) dan peluang mahasiswa yang lulus ( ) pada berbagai waktu yang ditunjukkan pada tabel 4.20 dan 4.21, sedangkan simulasi grafiknya dapat dilihat pada gambar 4.8 dan 4.9.
Tabel 4.20 Dugaan Peluang Mahasiswa yang Melakukan Studi ( ) pada Berbagai Semester
IPK
*Sumber : Hasil Pengolahan SPSS
Gambar 4.8 Grafik Peluang Mahasiswa yang Melakukan Studi ( ) yang Dipengaruhi IPK pada Berbagai Waktu (t)
*Sumber : Hasil Pengolahan SPSS
Dari tabel 4.20 dapat dilihat bahwa semakin lama masa studi dan semakin tinggi IPK dari mahasiswa, maka dugaan peluang mahasiswa yang masih melakukan studi ( ) semakin kecil. Sedangkan dari tabel 4.21 dapat dilihat bahwa semakin lama masa studi dan semakin tingi IPK dari mahasiswa, maka dugaan peluang mahasiswa yang lulus ( ) semakin besar.
BAB V PENUTUP
5.1 Kesimpulan
Berdasarkan hasil analisis dan pembahasan model regresi Cox
proporsional hazard pada lama studi mahasiswa S-1 Matematika Universitas Airlangga, diperoleh kesimpulan sebagai berikut :
1. Faktor yang berpengaruh signifikan terhadap lama studi mahasiswa S-1 Matematika Universitas Airlangga pada model regresi Cox proporsional
hazard adalah faktor IPK.
2. Model regresi Cox proporsional hazard dari faktor-faktor yang mempengaruhi lama studi mahasiswa S-1 Matematika Universitas Airlangga diperoleh hasil sebagai berikut :
( ) ( ) ( ( ) ( ))
dengan
,
5.2 Saran
Saran yang dapat diberikan sesuai dengan hasil penelitian yang telah dilakukan antara lain adalah:
1. Kelengkapan hasil rekap data serta pembaharuan data kemahasiswaan sebaiknya lebih ditingkatkan lagi guna kelengkapan informasi yang dibutuhkan sebab data kemahasiswaan tersebut merupakan aset penting bagi pihak Institusi, khususnya dalam pengembangan pendidikan di perguruan tinggi.
DAFTAR PUSTAKA
1. Arbia, G., 2006, Spatial Econometrics: Statistical Foundations and Applications to Regional Convergence,Germany : Springer.
2. Collet, D., 1994, Modelling Survival Data in Medical Research, London:
5. Khoirunnisak, Mega, 2010, Pemodelan Faktor-Faktor yang Mempengaruhi Mahasiswa Berhenti Studi (Drop Out) di Institut Teknologi Sepuluh Nopember Menggunakan Analisis Bayesian Mixture Survival, Tugas Akhir, Surabaya: Institut Teknologi Sepuluh Nopember.
6. Kleinbaum, David G., & Klein, Mitchel, 2005, Survival Analysis: A Self-Learning Text (2nd ed), New Yor’k: Springer.
7. Lawless, Jerald F., 2003, Statistical Models and Methods for Lifetime Data, New York: John Willey & Sons.
8. Le, C. T., 1997, Applied Survival Analysis. New York: John Wiley and Sons, Inc.
9. Saefuddin, Asep, 2000, Aplikasi Regresi Cox dalam Analisis Daya Tahan Komponen Sistem Proses Reaktor Nuklir, Risalah Lokakarya Komputasi dalam Sains dan Teknologi Nuklir XI: 151-175.
Keterangan :
IPK ( ) daerah asal mahasiswa ( Surabaya luar Surabaya)
jenis kelamin mahasiswa ( perempuan laki-laki) status asal SMA ( negeri swasta)
jalur masuk ( PMDK Prestasi PMDK Umum SPMB)
penghasilan orang tua (1=Rp500.000; 2=Rp500.000–Rp1.000.000; 3=Rp1.000.000–Rp2.500.000; 4=Rp2.500.000–Rp5.000.000)