• Tidak ada hasil yang ditemukan

BAB I PENDAHULUAN 1.1. Latar Belakang Permasalahan

N/A
N/A
Protected

Academic year: 2021

Membagikan "BAB I PENDAHULUAN 1.1. Latar Belakang Permasalahan"

Copied!
7
0
0

Teks penuh

(1)

1

BAB I

PENDAHULUAN

1.1. Latar Belakang Permasalahan

Estimasi fungsi survival atau biasa disebut regresi fungsi survival merupakan bagian penting dari analisis survival. Estimasi ini biasa digunakan dalam analisis survival dimana kovariat merupakan parameter dari estimasi tersebut, sehingga estimasi tersebut tergantung pada hasil kovariatnya. Estimasi regresi fungsi survival dapat dibedakan menjadi beberapa model yaitu model parametrik, model semi-parametrik, dan model non-parametrik.

Model survival parametrik merupakan salah satu model regresi fungsi survival dimana data yang digunakan memiliki variansi yang rendah dan memenuhi asumsi distribusi atau fungsi probabilitas tertentu. Data yang digunakan dalam analisis regresi fungsi survival ini harus memenuhi asumsi tersebut agar bias pada regresi ini dapat diperkecil secara maksimal tetapi apabila data tersebut tidak memenuhi maka model dapat dikatakan buruk dikarenakan bias akan semakin besar, oleh karena itu model regresi ini biasanya digunakan pada data yang sudah diketahui secara spesifik distribusinya. Selain itu pada model ini untuk mendapatkan nilai estimasi yang memilki nilai bias yang kecil maka dilakukan seleksi variabel dimana dipilih variabel yang paling signifikan pada model regresi tersebut. Pemilihan variabel ini selain dapat meminimumkan nilai eror juga membutuhkan waktu yang lebih lama dari peneliti untuk melakukan seleksi variabel juga informasi variabel independen tidak seluruhnya terpenuhi walaupun diusahakan oleh peneliti agar informasi variabel independen tidak berkurang secara signifikan.

Berdasarkan penjelasan mengenai model regresi fungsi survival parametrik dimana terdapat beberapa kelemahan maka para peneliti ingin mengurangi kelemahan pada model parametrik tersebut khususnya pada asumsi dimana data harus berdistribusi tertentu sehingga dibentuklah model regresi fungsi survival

(2)

nonparametrik. Model regresi nonparametrik dapat mengabaikan asumsi-asumsi tersebut dimana apabila asumsi untuk model parametrik tidak terpenuhi maka nilai bias dengan menggunakan model survival nonparametrik dapat diperkecil dan memiliki parameter tak terhingga sehingga model ini dapat diaplikasikan pada seluruh data. Salah satu model survival nonparametrik yang dapat meminimumkan nilai bias adalah dengan menggunakan fungsi spline untuk fungsi log-hazard. Walaupun model ini sudah dapat megurangi kelemahan pada model regresi fungsi survival parametrik, model ini tetap memiliki kelemahan yaitu hanya bagus untuk data yang berjumlah besar dan apabila metode nonparametrik ini digunakan untuk data yang memiliki distribusi yang jelas (memenuhi semua asumsi untuk metode parametrik) maka bias dan variansinya akan sangat besar dibandingkan dengan menggunakan metode lain terutama apabila dibandingkan dengan menggunakan model parametrik.

Melihat kelemahan yang ada pada model regresi fungsi survival parametrik maupun nonparametrik maka dikembangkan kembali model regresi fungsi survival gabungan dari model parametrik dan model nonparametrik yaitu model regresi fungsi survival semi-parametrik. Model regresi semi-parametrik pada saat ini yang sering digunakan adalah estimasi dengan pendekatan model hazard proporsional yang dikombinasikan dengan estimasi baseline pada fungsi hazardnya model ini biasa disebut regresi Cox. Walaupun model ini merupakan gabungan dari model parametrik serta nonparametrik, model ini masih mempunyai asumsi yang harus terpenuhi yaitu asumsi bahwa data memiliki hazard proporsional yang sama untuk setiap sampel tetapi seperti yang sudah diketahui bahwa model regresi fungsi survival semi-parametrik dapat menjadi estimasi yang buruk apabila asumsi hazard proporsional tidak terpenuhi sehingga model ini masih memiliki kelemahan. Oleh karena itu diperlukan estimator yang lebih fleksibel dibandingkan metode-metode yang sudah disebutkan tersebut.

Regresi fungsi survival biasanya hanya menggunakan satu model baik parametrik, nonparametrik, maupun semi-parametrik dengan seleksi kovariat-kovariat

(3)

pada model tersebut sehingga hanya kovariat yang signifikan yang digunakan, tetapi seperti yang disebutkan bahwa perlu adanya estimator yang fleksibel dibandingkan model-model yang sudah disebutkan di atas. Estimator yang fleksibel ini diharapkan dapat digunakan ketika data dapat memenuhi sebagian besar asumsi untuk model parametrik dan model semi-parametrik juga dapat menutupi kelemahan model nonparametrik. Oleh karena itu dibandingkan memilih salah satu model tersebut maka dipilih untuk mengkombinasikan model-model tersebut dengan menentukan bobot untuk masing-masing model sehingga membentuk model baru.

Pendekatan untuk mengkombinasikan beberapa model tersebut adalah menggunakan metode “stacked” yaitu dengan menggabungkan beberapa model regresi fungsi survival dimana setiap model memiliki bobot masing-masing. Penentuan bobot untuk masing-masing model tersebut berdasarkan nilai minimum eror pada model gabungan tersebut. Breiman (1996) sudah memperlihatkan bahwa untuk model regresi biasa, dengan mengunakan metode “stacked” dapat memperkecil nilai eror dibandingkan dengan menggunakan salah satu model saja. Model stacked untuk data survival dimana terdapat data tersensor maka memiliki pendekatan yang berbeda dengan analisis regresi biasa. Untuk pendekatan model stacked digunakan estimasi regresi fungsi survival dengan waktu yang kontinu dimana dapat meminimumkan nilai eror dari model tersebut. Fungsi kerugian yang digunakan untuk mendapatkan nilai eror tersebut adalah Brier score dimana digunakan untuk data tanpa sensor sedangkan untuk data survival dengan data tersensor menggunakan

Inverse Probability of Censoring Weights (IPCW) Brier score sebagai pendekatannya

untuk menentukan bobot masing-masing model. Model stacked tidak menggunakan seleksi variabel independen tetapi menggunakan metode n-fold-validation untuk evaluasi estimasi pada regresi fungsi survival yang sudah dibentuk sehingga dengan tidak adanya seleksi variabel independen diharapkan pada regresi fungsi survival ini tidak ada informasi yang hilang untuk data yang digunakan. Model regresi fungsi survival ini merupakan model yang dapat digunakan untuk semua kriteria data terutama data yang tidak memiliki distribusi yang spesifik dan memiliki variabel

(4)

independen yang banyak, model ini juga memiliki eror yang relatif kecil sehingga dapat dikatakan estimator model yang lebih fleksibel dibandingkan model lainnya.

1.2. Tujuan Penulisan

Berdasarkan latar belakang di atas, penulisan skripsi ini mempunyai beberapa tujuan antara lain:

1. mempelajari dan memahami tentang regresi fungsi survival menggunakan metode stacked;

2. mempelajari dan memahami tentang Brier score dan Inverse Probability of

Censoring Weights (IPCW) untuk memodelkan regresi survival dengan

metode stacked;

3. menerapkan regresi survival dengan metode stacked untuk data Laporan Kerja Praktek Dimyati (2014) yang berisi tentang daya tahan hidup pasien (data survival dengan event meninggalnya pasien) penderita kanker pada Klinik Edward Health Care (EHC) dan data dari buku Applied Survival

Analysis: Regression Modeling of Time to Event Data: Second Edition

(Hosmer dkk, 2008) yaitu data yang dipublikasikan oleh German Breast

Cancer study.

1.3. Manfaat Penelitian

Manfaat dari penulisan skripsi ini adalah:

1. menambah pengetahuan mengenai statistika dalam bidang epidemiologi dan kesehatan terutama pada analisis survival dengan metode stacked serta metode estimasi parameter dan bobot;

2. memperkenalkan metode stacked untuk kombinasi metode parametrik, semi-parametrik dan non parametrik pada analisis regresi fungsi survival; 3. mengaplikasikan metode stacked untuk kombinasi metode parametrik,

semi-parametrik dan nonsemi-parametrik pada analisis regresi fungsi survival untuk menyelesaikan permasalahan pada studi kasus.

(5)

1.4. Pembatasan Masalah

Dalam penulisan skripsi ini, pembatasan masalah sangat diperlukan agar pembahasan yang disampaikan jelas dan fokus pada tujuan. Skripsi ini akan fokus dalam pembahasan regresi fungsi survival dengan menggunakan metode stacked dengan mengkombinasikan model parametrik, nonparametrik, dan semi-parametrik serta aplikasinya dengan menganalisis data Laporan Kerja Praktek Dimyati (2014) yang berisi tentang daya tahan hidup pasien (data survival dengan event meninggalnya pasien) penderita kanker pada Klinik Edward Health Care (EHC) dan data dari buku Applied Survival Analysis: Regression Modeling of Time to Event

Data: Second Edition (Hosmer dkk, 2008) yaitu data yang dipublikasikan oleh German Breast Cancer study.

1.5. Tinjauan Pustaka

Breiman (1992) dalam paper nya membahas mengenai stacked regression untuk regresi linear berganda menggunakan kombinasi linear dimana kombinasi linear ini berdasarkan cross-validation data dan minimum kuadrat untuk kombinasi linear koefisien non-negatif. Hothorn (2006) membahas mengenai survival ensembles yaitu metode survival dengan algoritma bersama-sama (ensembles) untuk data tersensor, Polley dan Van der Laan (2011) menyebutkan metode “stacking” untuk data yang tersensor secara umum dan memberikan contoh untuk estimasi fungsi hazard dengan fungsi survival untuk time-event diskrit.

1.6. Metode Penelitian

Metode yang dipakai dalam penulisan skripsi ini yaitu dengan menggunakan metode studi literatur, baik itu diperoleh dari buku-buku, jurnal-jurnal, maupun situs-situs internet yang sesuai dengan tema skripsi ini. Pengolahan data dalam skipsi ini menggunakan software R untuk mencari model regresi fungsi survival serta masing-masing bobotnya dengan metode stacked dimana menggunakan Inverse Probability

(6)

Data yang digunakan dalam penelitian adalah data Laporan Kerja Praktek Dimyati (2014) yang berisi tentang daya tahan hidup pasien (data survival dengan event meninggalnya pasien) penderita kanker pada Klinik Edward Health Care (EHC) dan data dari buku Applied Survival Analysis: Regression Modeling of Time to Event

Data: Second Edition (Hosmer dkk, 2008) yaitu data yang dipublikasikan oleh German Breast Cancer study.

1.7 Sistematika Penulisan

Skripsi ini akan dibahas secara rinci dalam lima bab, sebagai berikut: BAB I PENDAHULUAN

Bab ini membahas latar belakang, tujuan penulisan, pembatasan masalah, tinjauan pustaka, metode penelitian, dan sistematika penulisan.

BAB II LANDASAN TEORI

Bab ini membahas tentang beberapa definisi dan teorema yang berhubungan dengan skripsi, antara lain variable random, konsep dasar survival, fungsi hazard, hubungan antara fungsi survival dengan fungsi hazard, estimasi fungsi survival dan hazard, model survival parametrik, model survival semi-parametrik, model survival nonparametrik, cross validation, dan n-fold validation .

BAB III KOMBINASI METODE PARAMETRIK, SEMI-PARAMETRIK, DAN NONPARAMETRIK PADA REGRESI FUNGSI SURVIVAL DENGAN METODE STACKED

Bab ini membahas tentang konsep dasar model regresi fungsi survival

stacked, Brier score, Inverse Probability of Censoring Weights

(IPCW), mean integrated squared error stacked survival model, sifat asimtotik model fungsi survival dengan metode stacked.

(7)

Bab ini membahas tentang aplikasi stacked survival function dengan pendekatan Inverse Probability of Censoring Weights (IPCW) Brier

score untuk mengestimasi nilai stacked survival function pada data

Laporan Kerja Praktek Dimyati (2014) yang berisi tentang daya tahan hidup pasien (data survival dengan event meninggalnya pasien) penderita kanker pada Klinik Edward Health Care (EHC) dan data dari buku Applied Survival Analysis: Regression Modeling of Time to

Event Data: Second Edition (Hosmer dkk, 2008) yaitu data yang

dipublikasikan oleh German Breast Cancer study, interpretasi model yang didapatkan pada masing-masing data, membandingkan model regresi fungsi survival stacked dengan regresi parametrik, semi-parametrik, dan nonparametrik menggunakan ISSE.

BAB V PENUTUP

Bab ini membahas tentang kesimpulan dan saran dari hasil pembahasan bab-bab sebelumnya.

Referensi

Dokumen terkait

(3) kedisiplinan belajar santri berpengaruh terhadap tingkat keberhasilan menghafal al- Qur’an santri pondok pesantren Al-Aziz Lasem Rembang, hal ini terbukti

manual, namun salah. Pilih ulang jenis jaringan berdasarkan jenis SIM/USIM card yang digunakan. Terkoneksi ke Internet, namun tidak bias membuka halaman website apa pun.

Dengan hasil penelitian ini dapat dilihat keakuratan diagnostik potong beku, sitologi imprint intraoperasi, dan gambaran USG pada pasien dengan diagnosa tumor ovarium untuk

Hasil penelitian menunjukkan bahwa penggunaan bahasa Indonesia dalam publikasi tersebut belum memuaskan karena terdapat beberapa kesalahan, seperti kesalahan penulisan kata

algoritma kompresi LZW akan membentuk dictionary selama proses kompresinya belangsung kemudian setelah selesai maka dictionary tersebut tidak ikut disimpan dalam file yang

Substrat yang digunakan dalam penelitian ini adalah karpet plastik yang terbuat dari bahan polypropylene (PP) yang diletakkan tegak lurus dengan arus sungai pada

Setelah itu teller akan memanggil dan nasabah akan memberikan sejumlah uang dan buku tabungan untuk meminta pencetakan transaksi setor tunai ke bank..

Kebutuhan sekunder adalah kebutuhan yang pemenuhannya setelah kebutuhan primer terpenuhi, namun tetap harus dipenuhi, agar kehidupan manusia berjalan dengan baik. Contoh: pariwisata