JURNAL INFORMATIKA, Vol.X No.X September 2018, pp. X~X ISSN: XXXX-XXXX
E-ISSN: XXXX-XXXX 1
Diterima September XX, XXXX; Revisi Januari XX, 2019; Disetujui Maret XX, 2019
Penerapan Algoritma Naive Bayes Untuk Klasifikasi Deteksi Mesothelioma
Anggit Triprasojo1, Phitsa Mauliana2, Wildan Wiguna3
1Universitas BSI e-mail: [email protected]
2Universitas BSI e-mail: [email protected]
3Universitas BSI e-mail: [email protected]
Abstrak
Penyakit kanker Mesothelioma belum memiliki obat yang ampuh untuk menyembuhkan pasien yang menderitanya. Rata-rata harapan hidup untuk pasien yang telah divonis menderita Mesothelioma adalah 12 sampai 21 bulan. Seringkali terjadi kesalahan pada deteksi awal penyakit Mesothelioma, sebagian disebabkan karena banyak gejala Mesothelioma menyerupai gejala-gejala penyakit lainnya yang menyebabkan perawatan yang tertunda. Akibatnya adalah penderita dinyatakan mengidap Mesothelioma setelah didiagnosis memiliki kanker tahap lanjut.
Deteksi lebih awal kanker Mesothelioma adalah cara terbaik agar pasien memiliki kesempatan hidup lebih besar. Untuk mengurangi kesalahan deteksi dan menghindari keterlambatan diagnosis penderita Mesothelioma, dapat dilakukan penerapan dan pemanfaatan teknik data mining. Salah satu metode data mining yang bisa dimanfaatkan adalah klasifikasi dan metode algoritma yang dapat digunakan untuk klasifikasi adalah algoritma Naive Bayes.
Pada penelitian ini, algoritma klasifikasi data mining Naive Bayes diterapkan pada Mesotheliomaβs Disease Data Set. Setelah hasil penelitian diperoleh, terbukti metode data mining menggunakan algoritma Naive Bayes dengan 5-Fold Cross Validation menghasilkan nilai akurasi klasifikasi sebesar 99.6914% dan nilai Area Under ROC (AUC) sebesar 0,9956 yang termasuk kategori Excellent Classification.
Kata Kunci: Mesothelioma, Data Mining, Klasifikasi, Naive Bayes
Abstract
Mesothelioma disease does not yet have a powerful drug to cure patients who suffer from it.
The average life expectancy for patients who have been convicted of suffering from Mesothelioma is 12 to 21 months. Often there is an error in the early detection of Mesothelioma disease, partly due to many symptoms of Mesothelioma resembling the symptoms of other diseases that result in delayed treatment. The result is that patients are diagnosed with Mesothelioma when the cancer is already in late stage. Early detection of Mesothelioma cancer is the best way for patients to have a greater chance of living. To reduce detection errors and avoid delays in diagnosing Mesothelioma patients, the application of data mining techniques can be applied and used. One method of data mining that can be used is classification and algorithm methods that can be used for classification are the Naive Bayes algorithm. In this study, the Naive Bayes data mining classification algorithm was applied to Mesothelioma's Disease Data Set. After the research results were obtained, it has been proven that data mining method using Naive Bayes algorithm with 5-Fold Cross Validation resulted in classification accuracy values of 99.6914% and Area Under ROC (AUC) values of 0.9956 which belonged to the Excellent Classification category.
Keywords: Mesothelioma, Data Mining, Classification, Naive Bayes
2
JURNAL INFORMATIKA Vol.X No.X, April 2019: 1-2 1. Pendahuluan
Mesothelioma adalah jenis kanker langka yang menyerang dinding sel tipis yang ada di organ dalam tubuh yang disebut mesothelium. Mesothelioma dapat ditemukan di pleura, peritoneum, jantung, dan testis. Mesothelioma diketahui hanya disebabkan oleh paparan serat asbes baik secara langsung ataupun melalui orang yang sudah terkena paparan asbes (Tunesi et al., 2015).
Penyakit ini memiliki periode laten umumnya sekitar 40 tahun setelah terpapar asbes sebelum mulai berkembang menjadi kanker ganas. Mesothelioma bisa menjadi sangat sulit untuk didiagnosis karena gejala-gejalanya sering menyerupai penyakit lain dan tipe sel kanker Mesothelioma mirip dengan tipe kanker yang lain. Penderita dinyatakan mengidap Mesothelioma setelah didiagnosis memiliki kanker tahap lanjut sehingga diperlukan diagnosis lebih awal untuk mendeteksi kanker Mesothelioma agar pasien memiliki kesempatan hidup lebih besar (Cancer Council Australia, 2017).
Untuk mengurangi kesalahan deteksi dan menghindari keterlambatan diagnosis penderita Mesothelioma, dapat dilakukan penerapan dan pemanfaatan teknik data mining. Kegunaan teknik data mining telah diketahui dan dimanfaatkan di dunia medis.
Pemanfaatan ini terjadi karena data mining medis bisa menemukan pola tersembunyi yang biasanya tidak ditemukan. Teknik data mining yang telah diterapkan pada data medis meliputi association rule untuk menemukan pola berulang, prediksi, klasifikasi dan klastering. Hal ini telah mendorong pengembangan sistem kecerdasan dan penunjang keputusan dalam bidang kesehatan untuk mendiagnosis keakuratan suatu penyakit, memprediksi tingkat keparahan berbagai jenis penyakit dan pengawasan kesehatan dari jauh (Khaleel et al., 2013).
Klasifikasi data adalah proses pembentukan model klasifikasi untuk memprediksi label kategori untuk membedakan kelas tiap data. Model yang dibuat ini digunakan untuk menentukan label untuk data yang baru atau data yang label kelasnya tidak diketahui (Agarwal, 2013).
Salah satu metode yang dapat digunakan untuk klasifikasi adalah algoritma Naive Bayes. Naive Bayes menghitung sekumpulan probabilitas
dengan menjumlahkan frekuensi dan kombinasi nilai dari dataset yang diberikan.
Keuntungan menggunakan Naive Bayes yaitu metode ini hanya membutuhkan jumlah data pelatihan (Data Training) yang kecil untuk menentukan estimasi parameter yang diperlukan dalam proses pengklasifikasian (Saleh, 2015).
Dalam beberapa penelitian yang dilakukan oleh peneliti sebelumnya, objek penelitiannya adalah melakukan perbandingan performa beberapa teknik data mining klasifikasi untuk mendeteksi Mesothelioma. Hasil dari penelitian- penelitian tersebut adalah dihasilkannya nilai dengan akurasi sebesar 96.30% untuk algoritma Probabilistic Neural Network (Er et al., 2012), 74.70% untuk algoritma Random Forest (Narayanan et al., 2016) dan 99.07% untuk algoritma Artificial Neural Network (Tutuncu & Cataltas, 2017).
Pada penelitian ini data yang akan digunakan adalah Mesotheliomaβs Disease Data Set yang berjumlah 324 data. Tujuan dari penelitian ini adalah menerapkan algoritma Naive Bayes untuk mengklasifikasi Mesotheliomaβs Disease Data Set untuk menghasilkan model data mining dengan akurasi terbaik.
2. Metode Penelitian
Pada penelitian ini diperlukan kerangka penelitian untuk menggambarkan penelitian yang akan dilakukan, dibawah ini adalah gambar 2.1 kerangka penelitian.
Gambar 2.1 Kerangka Penelitian
3
JURNAL INFORMATIKA Vol.X No.X, April 2019: 1-2 Pada kerangka penelitian diatas
menjelaskan tentang 4 tahap penelitian data mining yang dilakukan yaitu Pengumpulan Data, Persiapan Data Awal, Pemodelan, dan Evaluasi. Data yang digunakan untuk penelitian ini merupakan data public yang bernama Mesotheliomaβs Disease Data Set yang terdiri dari 324 data pasien Mesothelioma dengan 34 atribut.
Kelas pada data itu sendiri dan terbagi menjadi dua kelas, yaitu 1 (Healthy) dan 2 (Mesothelioma). Dari 324 pasien dalam dataset, terdiri dari 96 pasien terdiagnosis mengidap Mesothelioma dan 228 pasien didiagnosis tidak mengidap Mesothelioma.
Pada tahap kedua, dataset kemudian diolah menggunakan proses data cleaning dan data transformation sebagai persiapan awal sebelum proses data mining.
Kemudian data dibagi menjadi dua, bagian pertama sebagai data training dan bagian kedua sebagai data testing. Kemudian data tersebut diolah menggunakan algoritma klasifikasi data mining NaΓ―ve Bayes. Hasil data mining kemudian divalidasi menggunakan 2 metode validasi, Holdout Method dan K-Fold Cross Validation. Tahap akhirnya adalah mengevaluasi hasil model data mining yang digunakan untuk mencari model klasifikasi terbaik.
Di bawah ini adalah tabel yang menjelaskan jumlah data yang dipakai dan nama atribut yang ada pada Mesotheliomaβs Disease Data Set.
Tabel 2.1 Nama-nama atribut
No Atribut
1 age
2 gender
3 city
4 asbestos exposure
5 type of MM
6 duration of asbestos exposure
7 diagnosis method
8 keep side
9 cytology
10 duration of symptoms
11 dyspnoea
12 ache on chest
13 weakness
14 habit of cigarette 15 performance status
16 white blood
17 cell count (WBC)
18 hemoglobin (HGB)
19 platelet count (PLT)
20 sedimentation
21 blood lactic dehydrogenise (LDH) 22 alkaline phosphatise (ALP)
23 total protein
24 albumin
25 glucose
26 pleural lactic dehydrogenise
27 pleural protein
28 pleural albumin
29 pleural glucose
30 dead or not
31 pleural effusion
32 pleural thickness on tomography 33 pleural level of acidity (pH) 34 C-reactive protein (CRP)
Tabel 2.2 jumlah data 2 kelas dataset Kelas Sehat 228 Kelas Mesothelioma 96
Total 324
a. Naive Bayes Classifier
Naive Bayes Classifier adalah salah satu algoritma dalam teknik data mining yang menerapkan Bayesian Theorem dalam klasifikasi. NaΓ―ve Bayes Classifier merupakan pengklasifikasian statistik yang dapat digunakan untuk memprediksi probabilitas keanggotaan suatu class.
NaΓ―ve Bayes Classifier terbukti memiliki akurasi dan kecepatan yang tinggi saat diaplikasikan ke dalam database dengan data yang besar lainnya (Agustina, 2017).
Persamaan Theorema Bayes (Karabatak, 2015):
( | ) ( | ) ( ) ( ) Keterangan:
B: Data dengan class yang belum diketahui A: Hipotesis data merupakan suatu class spesifik
P(A|B): Probabilitas hipotesis A berdasaran kondisi B (posterior probabilities)
4
JURNAL INFORMATIKA Vol.X No.X, April 2019: 1-2 P(A): Probabilitas hipotesis A (prior
probabilities)
P(B|A): Probabilitas B Berdasarkan hipotesis A (Conditional Probabilities) P(B): Probabilitas B
Rumus diatas disesuaikan untuk Naive Bayes sebagai berikut:
( | ) ( | ) ( ) ( )
P(B) harus dimaksimumkan karena nilainya sama untuk semua kelas, sehingga rumus diatas disederhanakan lagi ke dalam bentuk seperti dibawah ini:
( | ) ( | ) ( )
Asumsi sederhana dalam Naive Bayes adalah semua atribut kondisinya independen. Jadi tahapan rumusan kelas bagi data tes adalah berdasarkan rumus berikut:
( | ) β ( | )
* ( | ) ( )+
Sebagai contoh bila ada data baru dan nilai posterior probabilitasnya P(A2|B) memiliki nilai paling besar di antara semua posterior probabilitas P(Ak|B) untuk sejumlah k kelas, maka data tersebut termasuk ke dalam kelas A2.
b. Laplace Correction
Laplace Correction (Laplacian Estimator) atau additive smoothing adalah suatu cara untuk menangani nilai probabilitas 0 (nol). Dari sekian banyak data di training set, pada setiap perhitungan datanya ditambah 1 (satu) dan tidak akan membuat perbedaan yang berarti pada estimasi probabilitas sehingga bisa menghindari kasus nilai probabilitas 0 (nol) (Manning et al., 2008).
Persamaan Laplace Smoothing:
Keterangan:
Pi : Probabilitas i
mi : Jumlah sampel dengan atribut i n : Jumlah total atribut i
k : Jumlah kelas atau bin dari atribut mi.
c. Evaluasi dan Validasi
Validasi adalah proses mengevaluasi akurasi dari sebuah model, validasi mengacu untuk mendapatkan prediksi dengan menggunakan model yang ada
kemudian membandingkan hasil yang diperoleh dengan hasil yang diketahui (Gorunescu, 2011). Mengevaluasi akurasi dari model klasifikasi sangat penting, akurasi dari sebuah model mengindikasikan kemampuan model tersebut untuk memprediksi class target (Vercellis, 2009).
Untuk mengevaluasi model digunakan metode Confusion Matrix dan Kurva ROC (Receiver Operating Characteristic) (Alfisahrin, 2014).
1. Confusion Matrix
Evaluasi kinerja model klasifikasi didasarkan pada pengujian objek yang diprediksi dengan benar dan salah, hitungan ini ditabulasikan Confusion Matrix (Gorunescu, 2011). Confusion Matrix adalah alat yang berguna untuk menganalisis seberapa baik classifier dapat mengenali tupel dari kelas yang berbeda (Han et al., 2012). Confusion Matrix memberikan rincian klasifikasi, kelas yang diprediksi akan ditampilkan di bagian atas matrix dan kelas yang diobservasi ditampilkan di bagian kiri.
Tabel 2.3 Confusion Matrix Classification Predicted Class
Positif Negatif Actual
Class
Positif True Positives
False Negatives Negatif False
Positives
True Negatives
Akurasi dapat dihitung dengan menggunakan persamaan berikut:
TP : Jumlah kasus positif yang diklasifikasi sebagai positif
FP : Jumlah kasus negatif yang diklasifikasi sebagai positif
TN : Jumlah kasus negatif yang diklasifikasi sebagai negatif
FN : Jumlah kasus positif yang diklasifikasi sebagai negatif
False positives dikenal sebagai error tipe 1, terjadi ketika kasus yang seharusnya diklasifikasikan sebagai negatif diklasifikasikan sebagai positif. False negatives dikenal sebagai error tipe 2, terjadi ketika kasus yang seharusnya diklasifikasikan sebagai positif diklasifikasikan sebagai negatif (Bramer, 2016).
2. Kurva ROC
Kurva ROC banyak digunakan untuk menilai hasil prediksi, kurva ROC adalah
5
JURNAL INFORMATIKA Vol.X No.X, April 2019: 1-2 teknik untuk memvisualisasikan, mengatur,
dan memilih pengklasifikasian berdasarkan kinerja algoritma. Untuk klasifikasi data mining, nilai Area Under ROC (AUC) dapat dibagi menjadi beberapa kelompok (Gorunescu, 2011):
1. 0.90 β 1.00 = Excellent Classification 2. 0.80 β 0.90 = Good Classification 3. 0.70 β 0.80 = Fair Classification 4. 0.60 β 0.70 = Poor Classification 5. 0.50 β 0.60 = Failure
3. Hasil dan Pembahasan
Penerapan algoritma Naive Bayes pada Mesotheliomaβs Disease Data Set dimaksudkan untuk mengetahui dan mendapatkan hasil akurasi lebih baik pada klasifikasi deteksi penyakit Mesothelioma dari penelitian-penelitian sebelumnya.
Eksperimen pada algoritma Naive Bayes akan dilakukan dalam dua tahap.
Eksperimen tahap pertama adalah eksperimen terhadap algoritma Naive Bayes dengan menggunakan metode validasi Holdout Method Validation, dan cara kedua adalah eksperimen terhadap algoritma Naive Bayes dengan menggunakan metode validasi K-Fold Cross Validation.
a. Hasil Eksperimen Naive Bayes dengan Holdout Method Validation Tabel 3.1 Hasil Akurasi Model Naive Bayes
Menggunakan Holdout Method Validation Ukuran Training Akurasi
90-10 100 %
80-20 96.9231 % 70-30 97.9592 % 60-40 97.6923 % 50-50 96.2963 %
Tabel 3.2 Confusion Matrix Holdout Method 70- 30
Classification
Predicted Class Se
ha t
Mesoth elioma Actual
Class
Sehat 66 2
Mesoth
elioma 0 30
Dari confusion matrix pada Tabel 3.2 dapat diukur tingkat akurasi dari klasifikasi sebagai berikut:
TP = 66; FP = 0; TN = 30; FN = 2
Akurasi = ((TP+TN)/(TP+TN+FP+FN))*100
Akurasi = ((66+30)/(66+30+0+2))*100 Akurasi = 97,9592%
Gambar 3.1 Kurva ROC Data NB Holdout Method Validation Dengan Ukuran Training 70-
30
Pada tabel 3.1 hasil akurasi yang diperoleh untuk klasifikasi deteksi Mesotheliomaβs Disease Data Set diperoleh dengan ukuran training 70-30 adalah yang paling tinggi dengan 97.96% akurasi. Hasil yang diperoleh dari pengolahan kurva ROC seperti yang terlihat di Gambar 3.1 menghasilkan nilai AUC sebesar 0,9713 yang termasuk kategori Excellent Classification. Namun, hasil akurasi tersebut masih di bawah dari hasil penelitian sebelumnya. Maka pada eksperimen kedua akan akan diterapkan metode validasi K-Fold Cross Validation.
b. Hasil Eksperimen Naive Bayes dengan K-Fold Cross Validation Tabel 3.3 Hasil Akurasi Model Naive Bayes
Menggunakan K-Fold Cross Validation Model
(Algoritma)
Jumlah Fold
Cross Validation Akurasi Naive
Bayes 5 99.6914 %
Naive
Bayes 10 100 %
Tabel 3.4 Confusion Matrix Holdout Method 70- 30
Classification
Predicted Class Seh
at
Mesothe lioma Actu
al Clas
s
Sehat 66 2
Mesothe
lioma 0 30
Dari confusion matrix pada Tabel 3.4 dapat diukur tingkat akurasi dari klasifikasi sebagai berikut:
TP = 227; FP = 0; TN = 96; FN = 1
Akurasi = ((TP+TN)/(TP+TN+FP+FN))*100
6
JURNAL INFORMATIKA Vol.X No.X, April 2019: 1-2 Akurasi = ((227+96)/(227+96+0+1))*100
Akurasi = 99,6914%
Gambar 3.2 Kurva ROC Data NB K-Fold Cross Validation Dengan 5-Folds
Pada tabel 3.2 hasil akurasi yang diperoleh dengan penerapan metode Naive Bayes menggunakan teknik evaluasi K-Fold Cross Validation untuk klasifikasi deteksi Mesothelioma Disease Data Set telah meningkat. Metode evaluasi 5-Fold Cross Validation terbukti memberikan hasil akurasi lebih baik dengan nilai akurasi 99,6914% dibandingkan metode validasi Holdout Method Validation dengan nilai akurasi 97.96%. Hasil yang diperoleh dari pengolahan kurva ROC seperti yang terlihat di Gambar 3.2 menghasilkan nilai AUC sebesar 0,9956 yang termasuk kategori Excellent Classification.
c. Perbandingan Hasil Penelitian Dengan Penelitian Sebelumnya
Perbandingan hasil pada penelitian ini dengan penelitian-penelitian sebelumnya adalah untuk mengevaluasi hasil keseluruhan pada penelitian ini. Penelitian ini adalah penelitian lanjutan dari penelitian- penelitian sebelumnya dengan objek data yang sama, yaitu Mesotheliomaβs Disease Data Set. Penelitian pertama dilakukan oleh Orhan Er, Abdullah Cetin Tanrikulu, Abdurrahman Abakay dan Feyzullah Temurtas pada tahun 2012. Penelitian kedua oleh Krithika Narayanan, Jeevana Chaitra Singumahanti dan Shomona Gracia Jacob pada tahun 2016. Penelitian ketiga oleh Kemal Tutuncu dan Ozcan Cataltas pada tahun 2017.
Penelitian pertama menerapkan algoritma PNN (Probabilistic Neural Network), MLNN (Multilayer Neural Network) dan LVQ (Learning Vector Quantization). Penelitian kedua menerapkan algoritma Bayes Net, SMO (Sequential Minimal Optimization), J48 dan
Random Forest. Penelitian ketiga menerapkan algoritma J48, Bayes Net, SMO, LMT (Logistic Model Tree), Logistic, Multi Class Classifier, Random Committee, PART, Artificial Neural Network.
Perbandingan hasil penelitian ini dengan penelitian-penelitian sebelumnya dapat dilihat pada tabel 3.5.
Tabel 3.5 Perbandingan Hasil Penelitian No
. Judul Penelitian Algoritma Akuras i
1
An Approach Based On Probabilistic Neural Network For Diagnosis Of Mesotheliomaβs Disease
PNN 96.30%
MLNN 94.41%
LVQ 91.14%
2
A Comparative Study On The Performance Of Classifiers In Prediction Of Rare Clinical Ailments: A Case-Study With Mesothelioma
Bayes Net 69.44%
SMO 71.30%
J48 71.91%
Random
Forest 74.70%
3
Diagnosis of Mesothelioma Disease Using Different Classification Techniques
J48 87.35%
Bayes Net 88.27%
SMO 88.89%
LMT 89.20%
Logistic 89.51%
Multi Class
Classifier 89.51%
Random
Committee 90.12%
PART 90.74%
ANN 99.07%
4
Penerapan Algoritma Naive Bayes Untuk Klasifikasi Deteksi Mesothelioma
Naive Bayes (5-
Fold Cross Validation)
99.69%
Naive Bayes (Holdout Method 70-
30 Validation)
97.96%
Pada Tabel 3.5 adalah perbandingan hasil penelitian pada objek Mesotheliomaβs Disease Data Set dari seluruh penelitian yang telah dilakukan. Dari tabel tersebut terbukti bahwa Naive Bayes dengan teknik 5-Fold Cross Validation berhasil meningkatkan hasil akurasi pada klasifikasi
7
JURNAL INFORMATIKA Vol.X No.X, April 2019: 1-2 deteksi Mesothelioma menjadi nilai akurasi
terbaik dengan 99,69%.
4. Kesimpulan
Pada penelitian ini dilakukan eksperimen terhadap algoritma Naive Bayes untuk mengklasifikasi Mesotheliomaβs Disease Data Set. Untuk mencari hasil optimal dari klasifikasi, dilakukan dua metode dalam validasi performa klasifikasi. Yang pertama menggunakan metode Holdout Method Validation dan yang kedua menggunakan metode K-Fold Cross Validation.
Kesimpulan yang didapat dari hasil penelitian ini adalah:
1. Telah diterapkan algoritma klasifikasi Naive Bayes pada Mesotheliomaβs Disease Data Set menggunakan 2 metode validasi performa klasifikasi.
2. Telah diketahui hasil akurasi dari algoritma Naive Bayes untuk klasifikasi Mesotheliomaβs Disease Data Set dengan hasil akurasi optimal sebesar 99,6914% menggunakan 5-Fold Cross Validation.
Pada penelitian berikutnya bisa dilakukan eksperimen menggunakan algoritma Naive Bayes menggunakan dataset lain untuk mengetahui performa Naive Bayes Classifier untuk dataset dengan jumlah data yang lebih beragam.
Ataupun pada penelitian berikutnya bisa dilakukan eksperimen menggunakan Mesotheliomaβs Disease Data Set menggunakan metode algoritma data mining yang lain yang belum digunakan untuk dataset ini untuk mengetahui performa algoritma lainnya dalam mengklasifikasi penyakit Mesothelioma.
Referensi
Agarwal, S. (2013). Data Mining: Data Mining Concepts and Techniques.
2013 International Conference on Machine Intelligence and Research
Advancement, 203β207.
https://doi.org/10.1109/ICMIRA.2013.4 5
Agustina, C. (2017). Optimasi Naive Bayes Menggunakan Particle Swarm Optimization Untuk Meningkatkan Akurasi Deteksi Autisme Spectrum Disorder, 10(2), 1β5.
Alfisahrin, S. N. N. (2014). Komparasi Algoritma C4.5, Naive Bayes dan
Neural Network Untuk Memprediksi Penyakit Jantung. Jurnal Bianglala Informatika, 2(1).
Bramer, M. (2016). Principles of Data
Mining. Springer.
https://doi.org/10.1007/978-1-4471- 7307-6
Cancer Council Australia. (2017).
Understanding Mesothelioma.
Er, O., Tanrikulu, A. C., Abakay, A., &
Temurtas, F. (2012). An approach based on probabilistic neural network for diagnosis of Mesotheliomaβs disease. Computers and Electrical Engineering, 38(1), 75β81.
https://doi.org/10.1016/j.compeleceng.
2011.09.001
Gorunescu, F. (2011). Data mining:
Concepts, models and techniques.
Intelligent Systems Reference Library, 12. https://doi.org/10.1007/978-3-642- 19721-5
Han, J., Micheline, K., & Jian, P. (2012).
DATA MINING (Concept and Techniques). DATA MINING (Vol. 3).
https://doi.org/10.1017/CBO97811074 15324.004
Kamagi, D. H., & Hansun, S. (2014).
Implementasi Data Mining dengan Algoritma C4 . 5 untuk Memprediksi Tingkat Kelulusan Mahasiswa.
ULTIMATICS, Vol. VI, No. 1 | Juni 2014, VI(1), 15β20.
Karabatak, M. (2015). A new classifier for breast cancer detection based on NaΓ―ve Bayesian. Measurement:
Journal of the International Measurement Confederation, 72, 32β
36.
https://doi.org/10.1016/j.measurement .2015.04.028
Khaleel, M. A., Kumar, S., & Dash, P. G. N.
(2013). A Survey of Data Mining Techniques on Medical Data for Finding Locally Frequent Diseases.
International Journal of Advanced Research in Computer Science and Software Engineering, 3(8), 2277β
128.
8
JURNAL INFORMATIKA Vol.X No.X, April 2019: 1-2 Larose, D. T. (2006). Data Mining Methods
and Models. JohnWiley & Sons.
https://doi.org/10.1002/0471756482 Manning, C. D., Raghavan, P., & SchΓΌtze,
H. (2008). Introduction to Information Retrieval. Introduction to Information Retrieval.
https://doi.org/10.1017/CBO97805118 09071.017
Narayanan, K., Singumahanti, J. C., &
Jacob, S. G. (2016). A Comparative Study on the Performance of Classifiers in Prediction of Rare Clinical Ailmentsβ―: A Case-Study with Mesothelioma. Middle-East Journal of Scientific Research, 24(12), 3833β
3837.
https://doi.org/10.5829/idosi.mejsr.201 6.3833.3837
Pramadhani, A. E., & Setiadi, T. (2014).
Penerapan Data Mining untuk Klasifikasi Penyakit ISPA dengan Algoritma Desicion Tree. Jurnal Sarjana Teknik Informatika E-ISSNβ―: 2338-5197, 2(1), 831β839.
Saleh, A. (2015). Implementasi Metode Klasifikasi NaΓ―ve Bayes dalam Memprediksi Besarnya Penggunaan Listrik Rumah Tangga. Citec Journal,
2(3), 207β217.
https://doi.org/doi.org/10.24076/citec.2 015v2i3.49
Shelby, K., Pacheco, W., & Hill, D. W.
(2018). Mesothelioma.
Tunesi, S., Ferrante, D., Mirabelli, D., Andorno, S., Betti, M., Fiorito, G., β¦ Magnani, C. (2015). Gene-asbestos interaction in malignant pleural mesothelioma susceptibility.
Carcinogenesis.
https://doi.org/10.1093/carcin/bgv097 Tutuncu, K., & Cataltas, O. (2017).
Diagnosis of Mesothelioma Disease Using Different Classification Techniques. International Journal of Intelligent System and Application in Engineering, (Special Issue), 7β11.
https://doi.org/http://dx.doi.org/10.182 01/ijisae.2017SpecialIssue31416 Vercellis, C. (2009). Business Intelligence:
Data Mining and Optimization for Decision Making. Business Intelligence: Data Mining and Optimization for Decision Making.
https://doi.org/10.1002/978047075386 6
Witten, I. H., Frank, E., & Hall, M. A. (2016).
Data Miningβ―: Practical Machine Learning Tools and Techniques.
Machine Learning.
https://doi.org/10.1016/C2009-0- 19715-5