Pendekatan Metode
Classification and Regression
Tree
untuk Diagnosis Tingkat Keganasan Kanker
pada pasien Kanker Tiroid
Seminar Hasil Tugas Akhir
Sri Hartati Selviani Handayani 1311106007
Pembimbing :
Jurusan Statistika - FMIPA
Institut Teknologi Sepuluh Nopember Surabaya - 2014
Jurusan Statistika - FMIPA
Kanker Tiroid
Indonesia
Terkadang Berlebih dalam menghasilkan hormon tiroid Membatasi menghasilkan hormon
tiroid
Membatasi menyerap Yodium
Kelenjar Tiroid
Urutan ke-9 dari
insiden kanker yang ada di Indonesia
Jurusan Statistika - FMIPA
Ganas
Faktor-faktor yang mempengaruhi timbulnya kanker tiroid
Classification and Regression Tree
Jurusan Statistika - FMIPA
Sumartini (2013), Variabel yang signifikan terhadap hasil patologi kanker tiroid yaitu usia pasien dan riwayat penyakit keluarga pasiendengan ketepatan klasifikasi sebesar 86,6%
Istichana (2013), Variabel penentu pada kanker
tiroid yang berpengaruh signifikan terhadap hasil
patologi yaitu hasil pemeriksaan USG dengan ketepatan klasifikasi sebesar 86,6%.
Ramdani (2013) dengan menggunakan metode CART menyimpulkan bahwa kontribusi tertinggi dari
hasil Pap Smear Test berturut-turut yaitu usia
pasien, riwayat keguguran, pemakaian alat
kontrasepsi, usia menstruasi, dan frekuensi melahirkan
Jurusan Statistika - FMIPA
Bagaimana karakteristik pasien kanker tiroid di Rumah Sakit “X” Surabaya?
Bagaimana klasifikasi dan ketepatan klasifikasi pada diagnosis tingkat keganasan kanker berdasarkan faktor yang mempengaruhi dengan pendekatan metode Classification and Regression Tree ?
Apa sajakah faktor-faktor yang memberi kontribusi tinggi terhadap klasifikasi pasien kanker tiroid di Rumah Sakit “X” Surabaya?
Jurusan Statistika - FMIPA
Mengetahui karakteristik pasien kanker tiroid di Rumah Sakit “X“ Surabaya.
Mengetahui klasifikasi dan ketepatan klasifikasi pada diagnosis tingkat keganasan kanker berdasarkan faktor yang mempengaruhi hasil patologi kanker tiroid dengan pendekatan metode Classification and
Regression Tree
Mengetahui faktor-faktor yang memberi kontribusi tertinggi pada klasifikasi pasien kanker tiroid di Rumah Sakit “X” Surabaya
Jurusan Statistika - FMIPA
Dapat memberikan informasi kepada pihak Rumah Sakit “X” Surabaya tentang klasifikasi pasien hasil patologi kanker tiroid berdasarkan variabel-variabel (faktor-faktor) yang menyebabkan timbulnya kanker tiroid setelah
melakukan pemeriksaan patologi sehingga dapat
dilakukan perlakuan/pengobatan yang tepat pada
penderita kanker tiroid
Manfaat Penelitian
Batasan MAsalah
Data Pasien Hasil Patologi Kanker Tiroid yang
Melakukan operasi dan Pemeriksaan di rumah sakit “X” pada tahun 2011 dan 2012
Jurusan Statistika - FMIPA
Variabel Respon Hasil
Data Kontinu Model Pohon Regresi
Data Kategorik Model Pohon Klasifikasi
(Breiman dkk, 1993)
Classification and Regression Trees (CART)
Metode statistik nonparametrik yang dikembangkan
Jurusan Statistika - FMIPA
Langkah-Langkah Algoritma Pada Metode CART
(Breiman dkk, 1993) Pembentukan Pohon Klasifikasi Penghentian Pembentukan pohon Pemangkasan pohon Klasifikasi Pembentukan Pohon Klasifikasi Optimal 1. Pemilihan Pemilah 2. Pemilihan Simpul
3. Menentukan Goodness of split 4.Penentuan Simpul Terminal
Jurusan Statistika - FMIPA
Kanker Tiroid
(Djokomoeljanto,2009)
Kanker Tiroid merupakan penyakit yang tidak
menular yang menyerang pada bagian depan leher sedikit dibawah laring yang berbentuk kupu-kupu.
Ciri-Ciri Kanker Tiroid Jinak Ganas Mengganggu Fungsi Aktivitas Tubuh
dan Menyebar Keseluruh Tubuh
secara sporadik Tidak Ya
Sifat Lunak Padat
Nyeri pada bagian leher Tidak Ya
Pertumbuhan Lambat Cepat
Permukaan Nodul Rata/normal
Benjolan/terjadi pembengkakan
Jurusan Statistika - FMIPA
Penyebab Kanker Tiroid
Terjadinya perubahan atau mutasi genetik pada sel tiroid yang menjadikan sel berkembang secara cepat
(Djokomoeljanto,2009)
1. Nyeri di tenggorokan atau pada daerah leher .
2. Adanya pembesaran nodul / benjolan pada leher yang mengakibatkan terganggunya pernapasan.
3. Suara serak yang tidak kunjung sembuh.
4. Pembesaran pada kelenjar getah bening yang ada di leher.
Jurusan Statistika - FMIPA
Data yang digunakan dalam penelitian ini merupakan data sekunder pasien hasil patologi kanker tiroid yang diperoleh dari data rekam medis di salah satu rumah sakit “X” Surabaya pada tahun 2011 dan 2012 dimana data berjumlah 82 orang pasien.
Jurusan Statistika - FMIPA
No Variabel Skala Keterangan 1 Jenis Kanker (Y) Nominal 0 : Jinak
1 : Ganas 2 Jenis Kelamin (X1) Nominal 0 : Laki-laki
1 : Perempuan 3 Usia (X2) Nominal 0: < 42 tahun
1 : ≥ 42 tahun
4 Hasil Pemeriksaan USG (X3) Nominal
0 : Stuma 1 : Ca thyroid 2: Kista 5 Hasil Pemeriksaan Klinis (X4) Nominal
0 : Stuma 1 : Ca thyroid 2: Kista
6 Riwayat Penyakit Gondok (X5) Nominal 0 : Ada Keluhan
1 : Tidak Ada Keluhan 7 Riwayat Penyakit Kanker (X6) Nominal 0 : Ada Riwayat
1 : Tidak Ada Riwayat
Jurusan Statistika - FMIPA
Langkah Analisis
Analisis deskriptif dari data penderita Kanker Tiroid
1.
2.
3.
Kombinasi atau membagi data learning
dan testing
Klasifikasi data penderita Kanker Tiroid dengan metode CART
Jurusan Statistika - FMIPA
Langkah Analisis
MulaiAnalisis Statistika Deskriptif
Kesimpulan dan saran
Proses pembentukan Pohon Klasifikasi CART (Classification and Regression Trees)
Penentuan data learning dan data testing
Evaluasi Ketepatan Klasifikasi
Jurusan Statistika - FMIPA
Tahap pembentukan CART
Pemisahan data menjadi dua bagian yaitu lerning dan testing
Pembentukan Pohon Klasifikasi
Menghitung ketepatan Klasifikasi model yang dihasilkan
Penentuan Pohon Klasifikasi Optimal Pemangkasan Pohon Klasifikasi
Jurusan Statistika - FMIPA
Analisis & PEmbahasan
Jinak 67% Ganas 33% Hasil Patologi
Analisis Deskriptif
Jurusan Statistika - FMIPA Laki-laki Perempuan 11 44 8 19 Jenis Kelamin Jinak Ganas
Analisis Deskriptif
Jurusan Statistika - FMIPA
Analisis Deskriptif
< 42 Tahun >= 42 Tahun 21 34 19 8 Usia Pasien Jinak GanasJurusan Statistika - FMIPA
Analisis Deskriptif
Struma Ca Thyroid Kista
47
0 8
15
12 0
Hasil Pemeriksaan USG
Jurusan Statistika - FMIPA
Analisis Deskriptif
Struma Ca Thyroid Kista
50
0 5 11
16 0
Hasil Pemeriksaan Klinis
Jurusan Statistika - FMIPA
Analisis Deskriptif
Ada Riwayat Tidak Ada Riwayat
15
40 8
19
Riwayat Penyakit Gondok
Jurusan Statistika - FMIPA
Analisis Deskriptif
Ada Riwayat Tidak Ada Riwayat
10
45 11
16
Riwayat Penyakit Keluarga
Jurusan Statistika - FMIPA
Kombinasi Data Learning dan Testing
Analisis Kombinasi Pohon (CART)
Pada penelitian ini data yang digunakan sebanyak 82
pengamatan, yang akan dicoba untuk kelompok Ke-i di jadikan sebagai data testing dan banyak data pada data learning untuk setiap kelompok ke-i merupakan penjumlahan data dari data
testing kelompok lainnya dimana i = 1,2,3,4,5. Ketepatan
klasifikasi pada data learning dan data testing yang paling tinggi yaitu pada kelompok 1 sehingga kombinasi data ini yang akan digunakan pada analisis selanjutnya
Jurusan Statistika - FMIPA
Kemungkinan Pemilah Pada Variabel
Prediktor
Variabel Skala Katagori Jumlah Katagori Kemungkinan PemilahX1 Jenis Kelamin Nominal 2 22-1 -1= 1 Pemilahan X2 Usia Nominal 2 22-1 -1=1 Pemilahan
X3
Hasil Pemeriksaan
USG Nominal 3 23-1 -1=3 Pemilahan
X4
Hasil Pemeriksaan
Klinis Nominal 3 23-1 -1=3 Pemilahan
X5
Riwayat Penyakit
Gondok Nominal 2 22-1 -1=1 Pemilahan
X6
Riwayat Penyakit
Jurusan Statistika - FMIPA
Pohon Klasifikasi Maksimal yang
terbentuk
Variabel yang memberi kontribusi tertinggi Pada Pohon Klasifikasi Maksimal
Variable Score
Hasil Pemeriksaan Klinis (X4) 100.00 Hasil Pemeriksaan USG (X3) 86.63 Usia (X2) 24.71 Riwayat Penyakit Keluarga (X6) 16.46 Jenis Kelamin (X1) 5.71 Riwayat Penyakit Gondok (X5) 4.23
Jurusan Statistika - FMIPA
Pohon Klasifikasi Maksimal
Klasifikasi pohon maksimal yang terbentuk terdiri atas 8 simpul terminal. Hasil klasifikasi dengan simpul terminal ini menujukkan bahwa pohon maksimal memiliki pengertian yang kompleks sehingga perlu untuk dilakukan pemangkasan
Ketepatan Hasil Klasifikasi Pada Pohon Klasifikasi Maksimal
Observasi
Prediksi
Total
Prediksi Sensitivity Specificity
Total Tingkat Akurasi Jinak Ganas Data Learning Jinak 36,00 4,00 40,00 90,00% 92,00% 90,76% Ganas 2,00 23,00 25,00 Data Testing Jinak 12,00 3,00 15,00 80,00 % 50,00% 76,47% Ganas 1,00 1,00 2,00
Jurusan Statistika - FMIPA
Pemangkasan Pohon Klasifikasi Maksimal
** : Pohon Klasifikasi Optimal
Urutan Simpul Akhir
Pohon ke-4 dengan simpul ke-2 merupakan pohon optimal dengan uji kesalahan relatif 0,500 ± 0,354 dimana Resubtition Relative Cost
sebesar 0,400 dan kompleksitas parameter sebesar 0,034
0.500 Re la tiv e Co st Number of Nodes 0.1 0.3 0.5 0.7 0.9 1.1 0 2 4 6 8 0.700
Jurusan Statistika - FMIPA
Jurusan Statistika - FMIPA
Ketepatan Hasil Klasifikasi Pada Pohon Klasifikasi Optimal
Validasi Pohon Klasifikasi Optimal
Ketepatan klasifikasi yang dihasilkan oleh data testing tersebut maka model
klasifikasi
optimal yang dihasilkan sudah baik atau layak dalam modelObservasi Prediksi Total Misklasifikas i/ Kelsalahan Jinak Ganas Data Learning Jinak 40,00 0,00 40,00 0% Ganas 10,00 15,00 25,00 40,00%
Tingkat Akurasi Total % 84,6%
Observasi Prediksi Total Misklasifikasi / Kesalahan Jinak Ganas Data Testing Jinak 15,00 0,00 15,00 0% Ganas 1,00 1,00 2,00 50,00%
Jurusan Statistika - FMIPA
Evaluasi Ketepatan Klasifikasi
Dari 5 kelompok kombinasi data yang dicobakan diatas dapat dilihat bahwa ketepatan klasifikasi data learning dan data
testing yang paling tinggi yaitu pada kelompok 1 dengan
tingkat akurasi data learning sebesar 0,846 dan testing sebesar 0,941 sehingga kombinasi data kelompok 1 yang digunakan pada analisis dan rata-rata nilai akurasi dari 5
kelompok data diatas maka pada data learning sebesar 0,875 dan testing yaitu sebesar 0,839.
Jurusan Statistika - FMIPA
Variabel yang Berpengaruh pada Tiap-tiap Kelompok
di Pohon Klasifikasi Optimal
Jurusan Statistika - FMIPA
Jurusan Statistika - FMIPA
Kesimpulan & Saran
Kesimpulan
1.
2.
Hasil dari statistika deskriptif menunjukkan bahwa hasil patologi kanker tiroid pasien yang didiagnosis kanker tiroid yang jinak sebanyak 55 orang atau 67% dan pasien yang didiagnosis kanker tiroid yang jinak sebanyak 27 orang atau 33%.
Karakteristik pasien pada hasil patologi kanker tiroid mayoritas dengan pemeriksaan USG dan klinis mayoritas hasil
pemeriksaannya Struma, pada riwayat penyakit gondok mayoritas tidak ada riwayat dan tidak ada riwayat penyakit kanker pada keluarga pasien.
Klasifikasi dari diagnosis tingkat keganasan pada kanker tiroid dengan faktor yang berpengaruh yaitu hasil
pemeriksaan klinis. Pasien hasil patologi yang beresiko menderita kanker tiroid jinak hasil pemeriksaan klinisnya yaitu struma dan kista. Sedangkan pasien yang beresiko menderita kanker tiroid ganas yaitu ca thyroid
Jurusan Statistika - FMIPA
3.
Dengan total akurasi pada pasien kanker tiroid pada data learning sebesar 84,6%, maka dapat disimpulkan bahwa model klasifikasi optimal yang terbentuk baik untuk menggambarkan model klasifikasi pohon dan ketepatan klasifikasi pada data testing sebesar 94,1%, hal ini menyimpulkan bahwa pohon klasifikasi yang diklasifikasikan pada data baru layak dalam model.
Faktor yang memberi kontribusi tertinggi pada
klasifikasi pasien kanker tiroid dengan menggunakan metode CART yaitu hasil pemeriksaan
klinis, sedangkan pada ketiga metode yang telah diteliti sebelumnya faktor-faktor yang berpengaruh pada klasifikasi pasien kanker tiroid yaitu hasil
pemeriksaan klinis, hasil pemeriksaan USG, riwayat penyakit keluarga dan usia.
Jurusan Statistika - FMIPA
Saran
Hasil pemeriksaan klinis merupakan variabel yang sangat berpengaruh yang menyebabkan timbulnya kanker tiroid, oleh sebab disarankan bagi pihak rumah
sakit atau bagi orang yang pernah melakukan
pemeriksaan klinis pada kelenjar tiroid sebaiknya
memeriksakan dirinya sedinimungkin dan lebih
mendalam karena bila dibiarkan akan membawa dampak yang buruk bagi kesehatan
Pada penelitian selanjutnya sebaiknya melakukan
konsultasi kembali dengan dokter ahli dalam
melakukan riset, agar memperoleh variable-variabel prediktor baru yang menyebabkan timbulnya kanker tiroid.
Jurusan Statistika - FMIPA
Daftar Pustaka
American Cancer Society. 2012. [Online]. Avaible: (http://www.thyroid.cancer.int/,diakses tanggal 8 Oktober 2013)
Breiman L., Friedman J.H Olshen R.A & Stone C.J. (1993). Classification And Regression Tree. New York, NY: Chapman And Hall
Djokomoeljanto, (2009). Indonesian Society of Endocrinology, Indonesian Study Group of Thyroidology, Indonesian Society of Endocrinology Semarang Branch, The 2nd
Thyroidology Update2009. Semarang: Badan Penerbit Undip (Di unduh tanggal 22 September 2013) Hamdani , W dan Sampepajung, D. Thyroid cancer. The diagnose and the management.
Department of Surgery Medical Faculty, Hasanuddin University, Makasar
http://med.unhas.ac.id/jurnal/attachments/article/74/THYROID%20Ca-William%20Hamdani.pdf(Diunduh tanggal 23 September 2013)
Istichana, Y. Y. (2013). PenggunaanMetode CHAID Untuk Klasifikasi Pasien Hasil Patologi kanker Tiroid. Tugas Akhir Diploma III Jurusan Statistika, Surabaya, Institut Teknologi Sepuluh November.
Layla, R. D. (2013). Klasifikasi PendekatanDiabetes Melitus Dengan Metode CHAID dan CART. Tugas Akhir Sarjana Jurusan Statistika, Surabaya, Institut Teknologi Sepuluh November. Laseduw,J.(2012) Kanker Tiroid. http://kankertiroid.wordpress.com/2013/06/21/penyebab/.
(Di unduh tanggal 18 September 2013). Lewis, M.D dan Roger, J. (2000). An Introduction to Classification and Regression Tree (CART) Analysis.
Ramdani, Y. (2013). Klasifikasi Hasil Pap Smear Test Kanker Serviks berdasarkanFaktor Resiko. Tugas Akhir Sarjana Jurusan Statistika, Surabaya, Institut Teknologi Sepuluh November.
Subekti, I., Aru, W., Sudoyo., B. S., Idrus, A., Marcellius, S., Sesiati, S. (2010). Karsinoma Tiroid. Buku Ajaran Ilmu Penyakit Dalam. Edisi 5. Jakarta : Interna Publising. P. 2031-37
Sumartini, S. H. (2013). Analisis Regresi Biner Pada Faktor Yang Mempengaruhi Hasil Patologi kanker Tiroid. Tugas Akhir Diploma III Jurusan Statistika, Surabaya, Institut Teknologi Sepuluh November.
Utama, Y. D. C (2012). Nilai diagnostikKarakteristikklinis di Bandingkandengan Biopsi patologi Anatomi dalam mendiagnosis KarsinomaTiroid, Skripsi, fakultas
Kedokteran Universitas diponegoro,Semarang. (Di unduh tanggal 14 Oktober 2013) Walpole, (1995). Pengantar Statistika. Gramedia Pustaka Utama: Jakarta.