• Tidak ada hasil yang ditemukan

BAB I PENDAHULUAN. 1.1 Latar Belakang

N/A
N/A
Protected

Academic year: 2021

Membagikan "BAB I PENDAHULUAN. 1.1 Latar Belakang"

Copied!
6
0
0

Teks penuh

(1)

1 BAB I

PENDAHULUAN

1.1 Latar Belakang

Analisis survival merupakan cabang dari ilmu statistika yang meliputi metode untuk menganalisis terjadinya suatu peristiwa (event) dengan waktu pengamatan tertentu. Secara umum, analisis survival merupakan teknik yang digunakan pada variabel random yang bernilai positif. Tujuan utama dari analisis ini adalah untuk mengetahui daya tahan hidup suatu individu. Data yang tersedia dapat berupa waktu kematian, waktu kesembuhan dari suatu penyakit, lama waktu perawatan di rumah sakit, dan sebagainya.

Fox (2008) menyatakan data survival memiliki dua karakter spesial yaitu waktu survival umumnya tidak negatif sehingga memiliki kemiringan yang positif dan memungkinkan subjek (unit observasi) memiliki data yang tersensor karena data survival tidak terobservasi (peristiwa terjadi di luar batas waktu pengamatan). Kegagalan dalam menghitung jumlah data tersensor dapat menciptakan bias dalam mengestimasi dari distribusi waktu survival. Dijelaskan oleh Collet (1997) bahwa survival merupakan metode yang mendeskripsikan analisis data dalam bentuk waktu dimulai dari waktu pertama penelitian sampai dengan terjadinya event atau waktu berakhirnya penelitian.

Terdapat beberapa tipe penyensoran dalam pengamatan, diantaranya : (1) Tersensor Tipe I, jika periode pengamata telah ditentukan dan objek pengamatan masuk ke dalam pengamatan pada waktu yang sama, (2) Tersensor Tipe II, jika seluruh objek penelitian masuk ke dalam pengamatan pada waktu yang sama dan pengamatan dihentikan jika sejumlah objek yang telah ditentukan mengalami event, (3) Tersensor Tipe III, jika setiap sampel masuk ke dalam pengamatan pada waktu yang berbeda-beda selama periode pengamatan.

(2)

Ilmu survival semakin berkembang dari hari ke hari, seperti telah dijelaskan oleh Larocque (2011), pohon survival dan hutan survival adalah model alternatif parametrik ke semi parametrik yang populer. Model ini sangat fleksibel dan secara otomatis dapat mendeteksi tipe data yang tepat dari suatu interaksi tanpa harus menentukannya terlebih dahulu. Sacara alami pohon tunggal dapat dengan sendirinya menetukan kelompoknya berdasarkan perilaku hidup pada kovariatnya. Kelompok ramalan yeng terbentuk dapat diperoleh dengan mudah dari pohon survival. Lebih lanjut, pohon survival adalah kandidat yang ideal untuk dikombinasikan pada rata-rata dari metode ensembel dan dapat ditransformasikan ke dalam alat prediksi yang sangat kuat seperti hutan survival. Pengembangan dari metode dasar seperti pohon survival dapat memperbaiki hasil dari prediksi dengan cepat melalui proses pengaplikasikan pengacakan, metode ini disebut dengan Random Forest.

Random Survival Forest merupakan metode pengembangan dari analisis Random Forest untuk menganalisis data survival tersensor kanan. Dalam Random Forest pengacakan dikenalkan dalam dua bentuk, (1) proses bootstrap; dimana data individu diambil secara acak dari data yang tersedia untuk membangun sebuah pohon, (2) pembentukan simpul pada pohon dimana subset variabel (kovariat) yang terpilih secara random digunakan sebagai calon variabel pemisah. Pengrata-rataan pohon yang dikombinasikan dengan pengacakan digunakan untuk membangun sebuah pohon dan memungkinkan metode Random Forest untuk memperhitungkan banyaknya kelas fungsi yang mempertahankan kesalahan umum yang rendah.

Berdasarkan bukti yang ada, Random Forest sangatlah akurat sebanding dengan metode state-of-the-art seperti bagging, boosting, dan alat suport vektor. Tetapi aplikasi dari Random Forest hanya terfokus pada masalah klasifikasi dan regresi. Iswaran (2008) mengembangkan suatu penelitian baru yang dapat diaplikasikan terhadap analisis survival tersenor kanan, yaitu Random Survival Forest.

(3)

1.1 Tujuan Penelitian

Tujuan dari penulisan skripsi ini adalah :

1. Mengenal metode analisis seleksi variabel untuk data survival tersensor kanan yaitu Random Survival Forest.

2. Mengetahui variabel yang prediktif di dalam proses seleksi variabel Random Survival Forest.

3. Menghitung tingkat kesalahan prediksi analisis Random Survival Forest. 4. Mengetahui apakah analisis seleksi variabel Random Survival Forest

merupakan analisis yang cukup baik bila dibandingkan dengan analisis Regresi Cox.

1.2 Pembatasan Masalah

Dalam penelitian ini dilakukan pembatasan masalah terhadap materi/topik pembahasan agar tujuan dari penelitian ini dapat tercapai. Dengan adanya pembatasan masalah maka kesimpulan yang di dapatkan dapat diuji keakuratan dan keabsahannya dengan tepat. Pembatasan masalah memudahkan penulis dalam perencanaan, pelaksanaan, dan penarikan kesimpulan dari penelitian. Model Random Survival Forest yang merupakan metode baru sebagai pengembangan dari model Random Forest merupakan fokus dari penelitian ini. Metode tersebut mengenalkan proses seleksi variabel untuk analisis survival tersensor kanan. Analisis dilakukan dengan mengacu pada proses analisis, metode yang mendasari, dan aplikasinya seperti dalam pembahasan jurnal Iswaran (2008).

1.3 Metode Penelitian

Metode penelitian yang digunakan dalam penelitian ini mengacu pada studi literatur baik dari jurnal, buku, internet, dan sumber-sumber lain yang mendukung. Dari studi literatur kemudian dilanjutkan dengan simulasi penelitian dengan menggunakan software statistik yang mendukung seperti Microsoft Excel

(4)

2007 dan R 3.1.2. Data yang digunakan merupakan data daya tahan hidup pasien penderita kanker pada Klinik Edward Health Care (EHC) yang diambil dari laporan Kerja Praktek Dimyati (2014).

1.4 Tinjauan Pustaka

Random forest merupakan metode klasifikasi yang sangat populer dan digunakan untuk data yang berjumlah besar dengan variabel independen (kovariat) yang banyak. Random Forest mengembangkan struktur pohon dimana didalamnya terdapat terminal simpul dan anak simpul. Pembentukan pohon tersebut akan menghasilkan informasi-informasi klasifikasi yang berguna.

Random Survival Forest adalah suatu analisis seleksi variabel untuk data survival tersensor kanan yang dikembangkan oleh Ishwaran (2008). Analisa tersebut menggunakan analisa pohon survival dengan menyertakan metode resampling yang dikenal dengan istilah bootstrap dan pemecahan simpul pohon survival yang dikenal dengan nama logrank splitting.

Analisis Regresi Cox merupakan analisis klasik untuk data survival. Tujuan dari analisis tersebut adalah untuk mencari variabel independen (kovariat) yang signifikan berpengaruh terhadap daya tahan hidup individu yang diobservasi. Metode tersebut akan dibandingkan tingkat keakuratannya dengan Random Survival Forest.

Seperti penelitian sebelumnya yang membahas klasifikasi data, Prasetya (2012) membahas tentang analisis Random Forest untuk proses klasifikasi. Dalam penelitian tersebut, untuk menyeleksi variabel digunakan sebuah teori ukuran bernama Mean Decrease Accuracy (MDA), dimana suatu variabel dijelaskan dapat masuk dalam penelitian apabila nilainya tidak kurang dari nol (MDA < 0).

(5)

Anzila (2014) menggunakan analisis Random Forest sebagai metode klasifikasi dan menghitung tingkat keakuratan suatu variabel dengan menggunakan Mean Decrease Gini (MDG).

Berbeda dengan penelitian sebelumnya, penelitian ini merupakan metode seleksi variabel untuk data survival tersensor kanan. Proses analisis tersebut dilakukan dengan proses resampling dimana proses ini memecahkan data menjadi dua jenis yaitu data in-bag dan data out-of-bag, kemudian dilanjutkan dengan pembangunan pohon survival menggunakan data in-bag yang selanjutnya setiap pohon dihitung estimasi Cumulative Hazard Function. Data out-of-bag digunakan untuk menghitung besarnya prediksi error.

Data yang digunakan merupakan data daya tahan hidup pasien penderita kanker pada Klinik Edward Health Care (EHC) yang diperoleh dari penelitian sebelumnya yaitu Dimyati (2014). Dengan metode Random Survival Forest akan diklasifikasikan variabel apa saja yang dapat mempengaruhi daya tahan hidup pasien kanker. Selain itu akan dilihat pula tingkat prediktifitas variabel dalam pemilihan variable importance (VIMP). Analisis ini akan dibandingkan dengan Regresi Cox untuk mengetahui perbandingan keakuratan prediksinya.

1.5 Sistematika Penulisan

Laporan tugas akhir ini disusun dalam lima bab yang disajikan dengan sistematika sebagai berikut :

BAB I PENDAHULUAN

Dalam bab ini dibahas mengenai latar belakang masalah, tujuan penelitian, pembatasan masalah, metodde penelitian, tinjauan pustaka, dan sistematika penulisan.

(6)

BAB II LANDASAN TEORI

Membahas tentang teori penunjang dari analisis penelitian yang dapat menjelaskan secara lebih rinci mengenai dasar teori yang digunakan dalam model. Teori yang digunakan antara lain, variabel random; sampel random; matriks; analisa survival; tipe tersensor; pohon survival; dan regresi cox.

BAB III RANDOM SURVIVAL FOREST

Berisi materi inti yang membahas tentang metode pengembangan dari suatu analisis terdahulu. Menganalisis sistematika analisis Random Survival Forest untuk suatu data survival tersensor kanan, proses pembentukan pohon survival, penentuan variabel yang prediktif, dan penghitungan besar error.

BAB IV STUDI KASUS DAN PEMBAHASAN HASIL

Dalam bab ini akan diambil suatu contoh kasus untuk selanjutnya akan dilakukan simulasi kasus dari metode Random Survival Forest yang selanjutnya dibandingkan dengan Regresi Cox.

BAB V PENUTUP

Berisi kesimpulan dari pembahasan pada bab-bab sebelumnya dan saran sebagai interpretasi atas kekurangan dan kelebihan kasus serta masukan untuk pengembangan penelitian yang lebih lanjut.

Referensi

Dokumen terkait

Kualitas Fisik dan Kesehatan, Pengetahuan dan Keterampilan, serta Spiritual dan Kejuangan secara simultan mempunyai pengaruh terhadap sikap kerja pegawai di Badan

Saiful Sagala (2010:'1) menuliskan dalam bulunya bahr€ nsurnsi pokok pendidikan adalah: (l) pendidikan bemula dari kondisi aldr:al dari individu yang belajar serta

Setelah melakukan serangkaian pengujian dan pembahasanm mengenai Analisis faktor-faktor yang mempengaruhi kesempatan kerja di Sulawesi Selatan peride 2002-2011 yaitu

Model general integer cut yang dikembangkan Tsai, Lin dan Hu dapat digunakan untuk mencari solusi alternatif lain diluar solusi optimal awal, dimana general integer cut

Beliau menjelaskan bahwa tari Rejang itu adalah tarian komunal masyarakat pura, dan beliau memberikan wawasan tentang tari Rejang Dewa, dimana tari Rejang tidak

Langkah terakhir dari analisis data yaitu menguji hipotesis dengan tujuan untuk mengetahui apakah terdapat hubungan yang cukup jelas dan dapat dipercaya antara variabel

Menyatakan fakta berserta huraian yang ringkas 2m Menyatakan fakta berserta huraian yang jelas dan lengkap serta disokong

Penelitian ini dilatarbelakangi oleh perkembangan kreativitas anak usia dini terkait erat dengan peranan orang tua. Hubungan ibu dan ayah atau orang dekat