IMPLEMENTASI ALGORITMA C4.5 UNTUK MEMPREDIKSI HIDUP PASIEN
SETELAH BEDAH TORAKS
Mohamad Jafar Surohman1, Ali Akbar Rismayadi2, Salman Topiq3
1Universitas BSI e-mail: [email protected]
2Universitas BSI
e-mail: [email protected]
3Universitas BSI e-mail: [email protected]
Abstrak
Permasalahan kanker paru yang terjadi di Indonesia disebabkan oleh orang yang merokok, bedah toraks merupakan operasi yang umum dilakukan untuk orang yang mempunyai kanker paru. Dataset bedah toraks adalah dataset yang berisi riwayat pasien setelah satu tahun melakukan operasi bedah toraks, apakah pasien tersebut hidup atau mati. Pada penelitian ini algoritma yang digunakan adalah decision tree karena algoritma ini mudah dipahami dan diinterpretasikan. Pengujian dataset bedah toraks dengan algoritma C4.5 menggunakan aplikasi Rapidminer. Hasilnya algoritma C4.5 merupakan algoritma terbaik dengan nilai akurasi tertinggi. Model C4.5 pada rapidminer diimplementasikan kedalam source code JAVA, sehingga aplikasi ini dapat memprediksi hidup dan matinya pasien dengan menggunakan data baru.
Kata Kunci: Kanker Paru, Bedah Toraks, C4.5
Abstract
Lung cancer problems that occur in Indonesia are caused by people who smoke, thoracic surgery is a common operation for people who have lung cancer. The thoracic surgery dataset is a dataset that contains a history of patients after one year of thoracic surgery, whether the patient is alive or dead. In this study the algorithm used is a decision tree because this algorithm is easily understood and interpreted. Testing thoracic surgical datasets with C4.5 algorithm using the Rapidminer application. The result is that the C4.5 algorithm is the best algorithm with the highest accuracy value. The C4.5 model on rapidminer is implemented into the JAVA source code, so this application can predict the life and death of patients using new data.
Keywords: Lung Cancer, Thoracic Surgery, C4.5
1. Pendahuluan
Indonesia menduduki rangking pertama dalam jumlah perokok disusul Rusia rangking kedua, kemudia Cina, Filipina, dan Vietnam. Sebanyak dua dari tiga laki-laki di Indonesia adalah perokok (Novia & Ucu, 2016). Menurut penelitian yang dilakukan Balitbang Kemenkes, setiap
hari tidak kurang dari 600 juta batang rokok diisap oleh rakyat Indonesia. Maka, lebih dari 225 miliar batang rokok dibakar per tahun untuk menghasilkan paparan yang merugikan kesehatan manusia (Putra, 2015). Tingginya angka merokok pada masyarakat akan menjadikan kanker paru sebagai salah satu masalah kesehatan di Indonesia. Kanker paru adalah salah satu jenis penyakit paru yang memerlukan
penanganan dan tindakan yang cepat dan terarah.
Penegakan diagnosis penyakit ini membutuhkan ketrampilan dan sarana yang tidak sederhana dan memerlukan pendekatan multidisiplin kedokteran.
Operasi toraks berbeda dari cabang ilmu jantung dan paru-paru lainnya walaupun operasi toraks dapat menangani penyakit pada organ, struktur, dan letak yang sama terutama karena mereka tidak menggunakan metode pengobatan atau intervensi dengan operasi. Dokter ahli jantung akan mendiagnosis gangguan dan penyakit jantung, kemudian memberikan obat-obatan untuk menyembuhkan penyakit tersebut.
Mereka terkadang juga dapat melakukan pengobatan dengan menjangkau jantung dan pembuluh arteri melalui sayatan kecil di selangkangan pasien. Dokter ahli paru- paru dapat melakukan hal yang serupa mereka akan membuat diagnosis, memberikan obat, dan melakukan
tindakan minim invasif
seperti bronkoskopi (docdoc, 2019).
Bedah toraks merupakan salah satu operasi paling umum pada pasien kanker paru-paru. Setelah tingkat kelangsungan hidup operasional sangat penting bagi dokter untuk memutuskan dimana operasi pasien dilakukan. Salah satu masalah keputusan utama dalam bedah toraks adalah pemilihan pasien yang tepat untuk operasi dengan resiko dan manfaat bagi pasien baik jangka panjang atau pendek.
Saat ini sudah banyak penelitian yang dilakukan mengenai klasifikasi prediksi hidup pasien pasca bedah toraks.
Penelitian ini menggunakan dataset publik, dataset bedah toraks (thoracic surgery) dari UCI Repository. Penelitian menggunakan dataset publik sangat dianjurkan karena sebanyak 64.79%
penelitian menggunakan dataset publik dan sebanyak 35.21% penelitian menggunakan dataset privat (Wahono, 2015).
Penelitian bedah toraks memiliki permasalahan seperti menentukan umur hidup pasien setelah satu tahun bedah toraks, sehingga pada penelitian ini dilakukan prediksi untuk menentukan apakah pasien tersebut hidup atau mati setelah satu tahun dilakukan bedah toraks.
C4.5 sering digunakan dalam klasifikasi dan prediksi. Ini sederhana namun merupakan cara representasi pengetahuan yang kuat. C4.5 adalah bagan alur seperti
struktur pohon, di mana setiap simpul internal (non-daun simpul) menunjukkan suatu pengujian pada suatu atribut, setiap cabang mewakili suatu hasil dari pengujian, dan setiap simpul daun (atau simpul terminal) memegang suatu label kelas (Adeyemo & Adeyeye, 2015).
Banyak penelitian yang telah dilakukan sebelumnya oleh peneliti lain. Penelitian sebelumnya mengenai bedah toraks, akan tetapi menggunakan algoritma yang lain adalah penelitian (Harun, 2015) dengan Simple Logistic Regression dan Multilayer Preceptron, Artificial Neural Network (ANN) yang dilakukan oleh (Danjuma, 2015).
Sedangkan penelitian yang menggunakan algoritma yang sama, tetapi dataset yang digunakan berbeda adalah penelitian (Durairaj & Kalaiselvi, 2015).
Penelitian yang dilakukan oleh (Harun, 2015) adalah penelitian mengenai perbandingan algoritma Boosted Simple Logistic Regression, Naive Bayes, Simple Logistic, J48, Multilayer Perceptron, Boosted Naïve Bayes, Boosted Multilayer Perceptron dan Boosted J48 untuk prediksi bedah toraks. Dataset yang digunakan adalah dataset pasien yang sudah satu tahun melakukan bedah toraks. Aplikasi yang digunakan untuk mengolah data ini adalah menggunakan Weka. Hasil pengolahan data yang dilakukan dalam penelitian ini adalah Boosted Simple Logistic Regression 84.53%, Naive Bayes 77.74%, Simple Logistic 84.55%, J48 84.64%, Multilayer Perceptron 80.91%, Boosted Naïve Bayes 78.32%, Boosted Multilayer Perceptron 80.70% dan Boosted J48 79.34%. Dari hasil tersebut, algoritma J48 merupakan algoritma terbaik untuk penelitian prediksi bedah toraks.
Penelitian selanjutnya adalah penelitian (Danjuma, 2015) yang memprediksi harapan hidup pasca operasi pada pasien kanker paru. Pada penelitian ini menggunakan Multilayer Perceptron, J48 dan Naïve Bayes. Eksperimen untuk penelitian ini menggunakan aplikasi Weka, dimana hasil yang didapatkan pada saat eksperimen adalah 84.7% untuk Multilayer Perceptron, 82.2% untuk J48 dan 79.2%
pada Naïve Bayes, sehingga algoritma terbaik adalah Multilayer Perceptron.
Penelitian selanjutnya adalah penelitian mengenai prediksi diabetes menggunakan soft computing. Dalam penelitian ini menggunakan 4 algoritma, yaitu Artificial Neural Network (ANN), C4.5,
Support Vector Machine (SVM) dan K Nearest Neighbor (KNN). Penelitian ini menggunakan dataset Pima Indian Diabetic Set dari UCI Repository dan penelitian ini menggunakan teknik soft computing. Hasil akurasi pada penelitian ini adalah 74.8%
untuk algoritma SVM, algoritma KNN sebesar 78%, sedangkan untuk algoritma C4.5 sebesar 86% dan algoritma ANN sebesar 89%. Pada penelitian ini hasil terbaik adalah algoritma ANN (Durairaj &
Kalaiselvi, 2015).
Penelitian yang dilakukan oleh (Adeyemo & Adeyeye, 2015) adalah penelitian mengenai perbandingan algoritma ID3, C4.5 dan Multilayer Perceptron (MLP) untuk prediksi demam tifoid. Dataset yang digunakan adalah dataset pasien yang terkena demam tifoid di Rumah Sakit Nigeria. Aplikasi yang digunakan untuk mengolah data ini adalah menggunakan Weka. Hasil pengolahan data yang dilakukan dalam penelitian ini adalah ID3 sebesar 70.1%, hasil algoritma C4.5 adalah sebesar 80.4% dan MLP sebesar 83.6%. Dari ketiga hasil tersebut, algoritma MLP merupakan algoritma terbaik untuk penelitian prediksi deman tifoid.
Penelitian yang terkait selanjutnya pada penelitian (Rohman, Suhartono, &
Supriyanto, 2017) dimana dalam penelitian ini tentang prediksi penyakit jantung menggunakan algoritma C4.5 dan Adaboost. Metode Adaboost digunakan untuk mengoptimalkan atribut-atribut sehingga dapat meningkatkan hasil akurasi.
Dataset yang digunakan dalam penelitian ini adalah dataset pasien yang mempunyai penyakit jantung dari UCI Repository. Hasil akurasi dalam penelitian ini untuk algoritma C4.5 tanpa Adaboost adalah sebesar 86.59%, sedangkan akurasi menggunakan algoritma C4.5 dengan Adaboost adalah sebesar 92.24%.
2. Metode Penelitian
Decission Tree merupakan serangkaian pertanyaan yang sistematis dan semuanya diatur sehingga setiap pertanyaan dari query atribut (misalnya Outlook) berdasarkan nilai dari atribut (Wu
& Kumar, 2009). Algoritma C4.5 dirancang oleh J. Ross Quinlan, dinamakan demikian karena merupakan keturunan dari pendekatan ID3 untuk merangsang pohon keputusan.
Tabel 1. Algoritma C4.5 Input: Dataset atribut bernilai 𝐷 1: Tree = {}
2: if 𝐷 adalah “murni” OR kriteria lainnya akan terpenuhi then
3: terminate 4: end if
5: for all atribut 𝑎 ∈ 𝐷 do
6: menghitung kriteria informasi-teori jika kita membagi pada 𝑎
7: end for
8: 𝑎 = atribut terbaik sesuai dengan kriteria yang dihitung
9: Tree = buat simpul keputusan yang menguji abest di root
10: 𝐷 = induksi sub dataset dari 𝐷 berbasis 𝑎
11: for all 𝐷 do 12: 𝑇𝑟𝑒𝑒 = C4.5 (𝐷)
13: melampirkan 𝑇𝑟𝑒𝑒 untuk cabang pohon yang sesuai
14: end for 15: return Tree
Sumber: (Wu & Kumar, 2009)
Pada Decission Tree untuk menentukan akar dari pohon adalah dengan mengambil atribut yang terpilih dengan cara menghitung gain dari masing- masing atribut. Nilai gain paling tertinggi menjadi akar pertama. Sebelum menghitung gain, harus menghitung entropy dengan rumus sebagai berikut:
Tabel 2. Rumus Entropy 𝐸𝑛𝑡𝑟𝑜𝑝𝑦(𝑆) = −𝑝𝑖. 𝑙𝑜𝑔 𝑝𝑖
Sumber: (Wu & Kumar, 2009) Keterangan:
𝑆 = Himpunan Kasus 𝑛 = Jumlah Partisi 𝑆 𝑝𝑖 = Proporsi 𝑆 Trehadap 𝑆
Setelah mendapatkan nilai entropy dari masing-masing atribut, selanjutnya menghitung nilai gain dengan menggunakan rumus:
Tabel 3. Rumus Gain 𝐺𝑎𝑖𝑛(𝑆, 𝐴) = 𝐸𝑛𝑡𝑟𝑜𝑝𝑦(𝑆)
− |𝑆𝑖|
|𝑆|∗ 𝐸𝑛𝑡𝑟𝑜𝑝𝑦(𝑆𝑖) Sumber: (Wu & Kumar, 2009)
Peralatan pendukung yang penulis gunakan adalah sebagai berikut:
a. Rapidminer 8.2
Data mining adalah proses mengungkap pola di dalam kumpulan data terstruktur besar untuk memprediksi hasil di masa mendatang.
Data terstruktur adalah data yang disusun dalam kolom dan baris sehingga dapat diakses dan dimodifikasi secara efisien.
Menggunakan berbagai algoritma pembelajaran mesin dan menggunakan pendekatan data mining untuk berbagai macam kasus penggunaan untuk meningkatkan pendapatan, mengurangi biaya, dan menghindari risiko.
Rapidminer adalah merupakan tools untuk data mining atau aplikasi untuk data mining. Aplikasi ini dapat di unduh secara gratis melalu situs https://rapidminer.com/data-mining- tools-try-rapidminer/.
RapidMiner sebelumnya dikenal sebagai YALE (Yet Another Learning Environment), mulai dikembangkan pada tahun 2001 oleh Ralf Klinkenberg, Ingo Mierswa, dan Simon Fischer dari Unit Kecerdasan Buatan Universitas Teknik Dortmund. Mulai tahun 2006, perkembangannya didorong oleh Rapid-I, sebuah perusahaan yang didirikan oleh Ingo Mierswa dan Ralf Klinkenberg pada tahun yang sama.
Pada tahun 2007, nama perangkat lunak itu berubah dari YALE menjadi RapidMiner. Pada tahun 2013, perusahaan
melakukan rebranding dari Rapid-I menjadi RapidMiner. Gambar II.2 merupakan tampilan dari aplikasi Rapidminer.
Gambar 1 Tampilan Aplikasi Rapidminer
b. Netbeans 8.2
NetBeans merupakan sebuah proyek kode terbuka yang sukses dengan pengguna yang sangat luas, komunitas yang terus tumbuh, dan memiliki hampir 100 mitra (dan terus bertambah!). Sun Microsystems mendirikan proyek kode terbuka NetBeans pada bulan Juni 2000 dan terus menjadi sponsor utama. Saat ini terdapat dua produk : NetBeans IDE dan NetBeans Platform.
The NetBeans IDE adalah sebuah lingkungan pengembangan - sebuah kakas untuk pemrogram menulis, mengompilasi, mencari kesalahan dan menyebarkan program. Netbeans IDE ditulis dalam Java - namun dapat mendukung bahasa pemrograman lain. Terdapat banyak modul untuk memperluas Netbeans IDE. Netbeans IDE adalah sebuah produk bebas dengan tanpa batasan bagaimana digunakan.
Tersedia juga NetBeans Platform;
sebuah fondasi yang modular dan dapat diperluas yang dapat digunakan sebagai perangkat lunak dasar untuk membuat aplikasi desktop yang besar.
Mitra ISV menyediakan plug-in bernilai tambah yang dapat dengan mudah diintegrasikan ke dalam Platform dan dapat juga digunakan untuk membuat kakas dan solusi sendiri.
Kedua produk adalah kode terbuka (open source) dan bebas (free) untuk penggunaan komersial dan non komersial. Kode sumber tersedia untuk guna ulang dengan lisensi Common Development and Distribution License (CDDL). Aplikasi ini dapat di unduh secara gratis di situs https://netbeans.org/.
Awalnya aplikasi NetBeans IDE ini diperuntukkan untuk pengembangan dalam Java. Namun, aplikasi ini juga mendukung program-program pembuatan bahasa lain secara khusus seperti PHP, C/C++ dan HTML5.
NetBeans adalah lintas platform serta penerapannya dijalankan pada Microsoft Windows, Mac OS X, Linux, Solaris dan platform lainnya yang mendukung JVM.
Awal kemunculan aplikasi NetBeans ada sejak tahun 1997 yaitu sebagai sebuah proyek mahasiswa. Pada tahun tersebut, suatu perusahaan
dibangun oleh Roman Staněk di sekitar proyek mahasiswa tersebut lalu perusahaan tersebut mulai memproduksi NetBeans IDE yang bersifat perdagangan hingga akhirnya dibeli oleh Sun Microsystems di tahun 1999 lalu menjadikan NetBeans IDE sebagai perangkat lunak open source pada bulan Juni 1999.
a. Analisa Masalah 1) Sumber Data
Pada penelitian ini data yang dikumpulkan dan digunakan adalah dataset UCI Repository. Menggunakan dataset UCI Repository karena dataset ini merupakan dataset public (umum) dan mudah diperoleh. Sebanyak 64.79%, penelitian menggunakan dataset publik dan penelitian menggunakan dataset privat sebanyak 35.21% (Wahono, 2015). Dataset yang digunakan adalah dataset thoracic surgery, dataset ini merupakan dataset yang memprediksi hidup dan mati pasien setelah melakukan operasi bedah toraks. Dataset thoracic surgery mempunyai 470 record dan 16 atribut serta 1 kelas yang berisi true dan false. dan dapat diakses melalui halaman
https://archive.ics.uci.edu/ml/datasets/
Thoracic+Surgery+Data. Tabel 4 menunjukkan deskripsi dari atribut dataset thoracic surgery yang digunakan dalam penelitian ini.
Tabel 4. Atribut dan Deskripsi Dataset Thoracic Surgery
No. Fitur atau Atribut
Dekripsi
1. DGN Diagnosis -
kombinasi spesifik kode ICD-10 untuk tumor primer dan sekunder serta beberapa tumor ganda jika ada (DGN3, DGN2, DGN4, DGN6, DGN5, DGN8, DGN1)
2. PRE4 Kapasitas vital paksa - FVC (numerik)
3. PRE5 Volume yang telah dihembuskan pada
akhir detik pertama
masa paksa
berakhir - FEV1 (numerik)
4. PRE6 Status kinerja - Skala Zubrod (PRZ2, PRZ1, PRZ0)
5. PRE7 Sakit sebelum
operasi (T, F) 6. PRE8 Haemoptysis
sebelum operasi (T, F)
7. PRE9 Dyspnoea sebelum operasi (T, F) 8. PRE10 Batuk sebelum
operasi (T, F) 9. PRE11 Kelemahan sebelum
operasi (T, F) 10. PRE14 T dalam TNM klinis -
ukuran tumor asli, dari OC11 (terkecil) sampai OC14 (terbesar) (OC11, OC14, OC12, OC13)
11. PRE17 DM tipe 2 - diabetes mellitus (T, F) 12. PRE19 MI sampai 6 bulan
(T, F)
13. PRE25 PAD - penyakit arteri perifer (T, F)
14. PRE30 Merokok (T, F) 15. PRE32 Asma (T, F)
16. AGE Usia saat operasi (numerik)
17. Risk1Y Masa kelangsungan hidup 1 tahun - (T) nilai true jika meninggal (T, F) 2) Model yang diusulkan
Pada Gambar 2 merupakan model yang diusulkan dalam penelitian ini, model yang digunakan adalah menggunakan algoritma klasifikasi Decision Tree. Tahapan penelitian yang dilakukan pada Gambar 1 adalah dimulai dari pembagian dataset menjadi data training dan data testing.
Selanjutnya masuk kedalam tahapan klasifikasi menggunakan algoritma klasifikasi Decision Tree. Kemudian data testing dan data training akan masuk kedalam proses validasi.
Langkah terakhir setelah masuk proses validasi, selanjutnya akan
menghasilkan nilai dari kenirja model Decision Tree.
Gambar 2. Model Penelitian yang diusulkan 3) Eksperimen dan Pengujian
Pada penelitian ini dilakukan eksperimen dan pengujian model dilakukan dengan beberapa tahapan sebagai berikut:
a) Menyiapkan dataset bank thoracic surgery untuk eksperimen
b) Mendesain arsitektur algoritma Decision Tree
c) Melakukan training dan testing pada dataset thoracic surgery, kemudian mencatat hasil dari kinerja model algoritma Decision Tree.
d) Mengembangkan aplikasi rapidminer
Pengembangan aplikasi menggunakan bahasa pemograman java. Pengembangan aplikasi ini bertujuan untuk dapat memprediksi hidup dan mati pasien bedah toraks.
Data diinputkan satu persatu kemudian selanjutnya adalah mengklik proses untuk penentuan hasil klasifikasi pasien bedah toraks dengan hasil true atau false.
Pada tahap ini dilakukan evaluasi pada model yang diusulkan (Decision Tree). Pada tahap evaluasi yang dilakukan adalah hasil kinerja dari model prediksi bedah toraks. Validasi yang dilakukan dalam penelitian ini adalah dengan membagi data training dan data testing secara otomatis menggunakan cross validation. Kinerja model yang dievaluasi adalah akurasi.
Sebuah sistem atau aplikasi perangkat lunak harus bebas dari error atau kesalahan, untuk itu perlu adanya tahapan dalam pengujian untuk mengetahui beberapa kekurangan atau kesalahan yang ada. Sebelum sistem perangkat lunak diterapkan atau digunakan. Black box testing (pengujian kotak hitam) yaitu menguji perangkat lunak dari segi spesifikasi fungsional tanpa menguji desain dan kode program. Pengujian dimaksudkan untuk mengetahui apakah fungsi- fungsi, masukan, dan keluaran dari perangkat lunak sesuai dengan spesifikasi yang dibutuhkan (Sukamto
& Shalahuddin, 2015). Black box testing merupakan metode pengujian yang bertujuan untuk menguji tentang cara beroperasi sistem, dari masukan dan informasi yang dikeluarkan sesuai dengan apa yang diharapkan (Maturidi, 2012). Black box testing merupakan teknik pengujian yang melakukan pendekatan kebutuhan dasar program dalam mengecek fungsional program (Swastika & Putra, 2016). Dari beberapa pernyataan di atas, maka black box testing adalah teknik pengujian perangkat lunak yang harus bebas dari kesalahan atau error yang menguji fungsional program.
Teknik ini menganjurkan sang penguji atau software tester untuk menguji bagian luarnya atau User Interface (UI), dan juga menguji flow bisnisnya berjalan dengan baik tanpa harus mengetahui sisi logic code ataupun struktur data. Teknik ini sering digunakan di banyak perusahaan- perusahaan teknologi informasi karena teknik ini mementingkan konsep flow bisnis dari sebuah aplikasi berjalan dengan baik begitu juga fungsionalitas setiap fiturnya. Pada teknik blackbox seorang penguji hanya memasukkan sebuah input dari aplikasi dan memastikan hasil keluarannya benar, begitu juga bentuk- bentuk validasinya.
Testing blackbox ini sedikit lebih ringan karena tidak memerlukan keahlian koding seperti halnya developer, hanya cukup mengetahui flow bisnis dari aplikasi yang ada, dan juga kemampuan menjaga kualitas produk dari aplikasi agar tetap
berkualitas dan bebas dari bugs atau error (Wahyudi, 2016).
b. Analisa Kebutuhan
1) Analisa Kebutuhan Perangkat Keras
Perangkat keras yang dibutuhkan dalam eksperimen pada penelitian ini ditunjukkan pada Tabel 5.
Tabel 5. Deskripsi Perangkat Keras
Laptop Lenovo Ideapad
320
Processor AMD A9-9420
Radeon R5
RAM 4 GB
Harddisk 1 TB
2) Analisa Kebutuhan Perangkat Lunak
Perangkat lunak yang dibutuhkan dalam eksperimen ini ditunjukkan pada Tabel 6.
Tabel 6. Deskripsi Perangkat Lunak Sistem Operasi Windows 10
Enterprise Aplikasi Eksperimen Rapidminer 8.0 Aplikasi Prediksi Netbeans 8.2 Bahasa
Pemograman JAVA
Pada Gambar 3 merupakan flowchart untuk penelitian ini.
Gambar 3 Flowchart Pengujian Dataset Thoracic surgery
Dimana langkah input dataset menjadi langkah awal pada penelitian ini. Penelitian ini menggunakan dataset thoracic surgery.
Selanjutnya input algoritma yang digunakan, untuk penelitian ini menggunakan algoritma Decision Tree.
Tahapan selanjutnya dilakukan pengujian, dimana setelah proses pengujian akan keluar model dari algoritma Decision Tree dan hasil nilai dari algoritma tersebut.
3. Hasil dan Pembahasan 3.1. Tampilan Hasil
1. Tampilan Pengolahan di Rapidminer Pada Gambar 4 menunjukkan cara mengolah dataset cryotherapy pada aplikasi Rapidminer, dimulai dari operator Read Excel. Operator Read Excel berfungsi sebagai wadah untuk memasukkan file yang akan di olah. Selanjutnya Cross Validation berfungsi untuk membagi dataset thoracic surgery menjadi 10 bagian secara otomatis, dimana 10 bagian itu terdiri dari data training dan data testing yang di uji sampai 10 kali.
Gambar 4. Tampilan Tahapan Proses di Rapidminer
Selanjutnya masuk dalam tahap implementasi algoritma, algoritma yang digunakan dalam penelitian ini adalah C4.5 atau Decision Tree. Kemudian operator Apply Model berfungsi untuk mengeluarkan model dan Performance untuk mengeluarkan hasil nilai akurasi. Gambar 5 merupakan tampilan implementasi algoritma pada aplikasi Rapidminer.
Gambar 5. Tampilan Tahapan Implementasi Algoritma
Pada Gambar 6 merupakan tampilan dari hasil pengolahan data pada aplikasi Rapidminer. Nilai akurasi pada pengolahan dataset thoracic surgery sebesar 84.47%, nilai ini sangat bagus pada pengolahan data mining karena mendekati nilai 100%.
Gambar 6. Hasil Pengolahan Dataset Thoracic Surgery di Rapidminer 2. Tampilan Program
Pengembangan aplikasi menggunakan bahasa pemograman java. Pengembangan
aplikasi ini bertujuan untuk dapat memprediksi hidup dan mati pasien bedah toraks. Pada Gambar 7 merupakan aplikasi yang dikembangkan dengan menggunakan rule algoritma decision tree. Data diinputkan satu persatu kemudian selanjutnya adalah mengklik proses untuk penentuan hasil klasifikasi pasien bedah toraks dengan hasil true atau false.
Gambar 7. Tampilan Program Prediksi Bedah Toraks
3.2. Cara Kerja Aplikasi
Aplikasi prediksi bedah toraks berfungi untuk memprediksi hidup pasien setelah satu tahun menjalani bedah toraks. Pada aplikasi ini terdapat 3 combobox, 10 radiobutton, 4 textbox (3 untuk diinput dan 1 adalah menampilkan hasil) dan 1 button proses. Pada saat dijalankan program prediksi bedah toraks, combobox DGN dan PRE14 diisikan dengan cara dipilih, kemudian PRE4, PRE5 dan AGE diisikan dengan inputan angka sedangkan PRE7, PRE8, PRE9, PRE10, PRE11, PRE17, PRE19, PRE25, PRE30 dan PRE32 diisikan dengan cara diklik untuk dipilih.
Selanjutnya untuk menampilkan hasil prediksi dapat ditekan button PROSES, maka akan menampilkan hasil True atau False. Hasil True akan muncul jika prediksi menunjukkan bahwa pasien tersebut meninggal setelah satu tahun menjalani bedah toraks, sedangkan False akan muncul jika pasien tidak meninggal setelah satu tahun menjalani bedah toraks. Gambar 8 merupakan cara menginputkan data pada aplikasi prediksi bedah toraks.
Gambar 8 Cara Kerja Aplikasi Prediksi Bedah Toraks
3.3. Hasil Pengujian
1. Hasil Pengujian di Rapidminer
Hasil pengujian di Rapidminer dapat ditunjukkan pada Gambar 9, dimana algoritma yang digunakan adalah C4.5 dengan menggunakan dataset thoracic surgery dan mendapatkan nilai akurasi sebesar 84.47%.
Gambar 9 Hasil Pengujian Rapidminer 2. Hasil Pengujian Aplikasi
Hasil pengujian aplikasi dapat dilihat pada gambar 10 dengan menginputkan data pasien yang akan diprediksi sehingga akan muncul hasil prediksi pasien tersebut.
Gambar 10 Hasil Pengujian Aplikasi Prediksi Bedah Toraks
Dibawah ini sebagian coding program prediksi bedah toraks, bahasa pemograman yang digunakan adalah bahasa JAVA.
pre5=Double.parseDouble(jTextField2.getT ext());
age=Double.parseDouble(jTextField3.getTe xt());
pre4=Double.parseDouble(jTextField1.getT ext());
if (pre5>0.980) {
if (age>80.500) {
if (jRadioButton1.isSelected()) {
hasil="TRUE";
} else {
hasil="FALSE";
} } else {
if (pre4>4.980) {
hasil="FALSE";
} else {
if (pre4>1.990) {
if (pre5>1.120) {
if (pre5>71.950) {
hasil="FALSE";
}
4. Kesimpulan
Berdasarkan hasil eksperimen dataset bedah toraks dengan menggunakan algoritma C4.5, dapat diambil kesimpulan bahwa prediksi dataset bedah toraks menggunakan algoritma C4.5 dilakukan dengan menguji dataset tersebut pada aplikasi Rapidminer. Hasil rule dari model C4.5 di masukkan kedalam aplikasi pengembangan Rapidminer dengan menggunakan aplikasi Netbeans dan bahasa pemograman JAVA. Kemudian Hasil akurasi dari model C4.5 pada prediksi dataset bedah toraks adalah 84.47%.
Sedangkan saran untuk penelitian selanjutnya adalah dataset bedah toraks terdapat banyak fitur, banyaknya fitur dapat menurunkan kinerja dari model yang digunakan. Maka untuk penelitian selanjutnya dapat di tambahkan seleksi fitur seperti forward selection, backward elimination untuk memilih fitur yang relevan dan dataset bedah toraks memiliki ketidakseimbangan kelas, seperti jumlah kelas true dan false tidak seimbang, hal ini juga dapat menyebabkan menurunnya kinerja dari model yang digunakan. Maka untuk penelitian selanjutnya dapat digabungkan dengan metode Bagging, Boosting dan Stacking untuk meningkatkan kinerja dari model yang digunakan.
Referensi
Adeyemo, O. ., & Adeyeye, T. . (2015).
Comparative Study of ID3/C4 . 5 Decision tree and Multilayer Perceptron Algorithms for the
Prediction of Typhoid Fever. African Journal of Computing & ICT, 8(1), 103–112.
https://doi.org/10.15388/ioi.2015.04.
Danjuma, K. J. (2015). Performance Evaluation of Machine Learning Algorithms in Post-operative Life Expectancy in the Lung Cancer Patients. Journal of Computer Science Issues (IJCSI).
Durairaj, M., & Kalaiselvi, G. (2015).
Prediction Of Diabetes Using Soft Computing Techniques-A Survey.
IInternational Journal Of Scientific &
Technology Research, 4(03), 190–
192. Retrieved from www.ijstr.org.
docdoc. (2019). Apa itu Operasi Toraks:
Gambaran Umum, Manfaat, dan Hasil yang Diharapkan. Diambil
kembali dari
https://www.docdoc.com/id/info/proce dure/bedah-dada
Harun, A. U. (2015). Predicting Outcome of Thoracic Surgery by Data Mining Techniques. International Journal of Advanced Research in Computer Science and Software Engineering (IJARCSSE), 7-10.
Maturidi, A. J. (2012). Metode Penelitian Teknik Informatika. Yogyakarta: CV.
Budi Utama.
Novia, D. R., & Ucu, K. R. (2016, Mei 24).
Jumlah Perokok di Indonesia Nomor Satu Dunia. (Republika) Dipetik Agustus 10, 2017, dari News republika.co.id:
http://nasional.republika.co.id/berita/n asional/umum/16/05/24/o7og1u282- jumlah-perokok-di-indonesia-nomor- satu-dunia.
Putra, Y. M. (2015, Juni 1). Perokok Indonesia 10 Kali Lipat Penduduk Singapura. Diambil kembali dari
News republika.co.id:
http://www.republika.co.id/berita/nasi onal/umum/15/06/01/np8b4v- perokok-indonesia-10-kali-lipat- penduduk-singapura.
Rohman, A., Suhartono, V., & Supriyanto, C. (2017). Penerapan Algoritma C4.5 berbasis Adaboost untuk Prediksi Penyakit Jantung. Jurnal Teknologi Informasi, 13, 13–19.
Sukamto, R. A., & Shalahuddin, M. (2015).
Kolaborasi Rekayasa Perangkat Lunak Terstruktur dan Berorientasi Objek. Bandung: Informatika.
Swastika, I. A., & Putra, I. (2016). Audit Sistem Informasi Dan Tata Kelola Teknologi Informasi: Implementasi Dan Studi Kasus. Yogyakarta: CV.
Andi Offset.
Wahono, R. S. (2015). A Systematic Literature Review of Software Defect Prediction: Research Trends, Datasets, Methods and Frameworks.
Journal of Software Engineering, 1- 16.
Wahyudi, H. (2016, November 26). APA SIH WHITEBOX DAN BLACKBOX TESTING ITU? Retrieved from Kudo Developers:
https://kudo.co.id/engineering/2016/1 1/26/apa-sih-whitebox-dan-blackbox- testing-itu/.
Wu, X., & Kumar, V. (2008). The Top Ten Algorithms in Data Mining. Boca Raton: Taylor & Francis Group, LLC.