• Tidak ada hasil yang ditemukan

ALGORITMA NAÏVE BAYES DAN METODE BACKWARD ELIMINATION UNTUK MENINGKATKAN NILAI AKURASI

N/A
N/A
Protected

Academic year: 2023

Membagikan "ALGORITMA NAÏVE BAYES DAN METODE BACKWARD ELIMINATION UNTUK MENINGKATKAN NILAI AKURASI "

Copied!
4
0
0

Teks penuh

(1)

JURNAL INFORMATIKA, Vol.5 No.1 April 2018, pp. 2~1 ISSN: 2355-6579

E-ISSN: 2528-2247 1

Diterima September 20, 2017; Revisi Januari 01, 2018; Disetujui Maret 15, 2018

ALGORITMA NAÏVE BAYES DAN METODE BACKWARD ELIMINATION UNTUK MENINGKATKAN NILAI AKURASI

KLASIFIKASI KONDISI JANIN

Neneng Nurhasanah1, Maxsi Ari2, Phitsa Mauliana3

1Universitas BSI

e-mail:nurhasanahn386@gmail.com

2Universitas BSI e-mail: xxxx@xxxx.xxx

3Universitas BSI e-mail: phitsa.phu@bsi.ac.id

Abstrak

Pemantauan kondisi janin merupakan hal penting pada saat proses persalinan. Hal ini dilakukan untuk meminimalisir kematian janin di dalam rahim. World Health Organization menyatakan pada tahun 2015 angka kematian janin didunia di perkirakan sekitar 3,82-22,14 juta jiwa. Salah satu cara yang digunakan dalam pemantauan janin yaitu dengan Cardiotocography. Cardiotocography digunakan untuk mengidentifikasi awal keadaan patologis janin dan membantu dokter dalam mendiagnosa gangguan pada janin. Dataset yang digunakan yaitu data cardiotocography yang disediakan UCI Repository, data cardiotocography memiliki 2.126 record dan 39 atribut yang diklasifikasikan kedalam 3 kelas yaitu Normal, Suspect, dan Pathologic. Penelitian ini menerapkan algoritma naïve bayes dalam mengklasifikasikan kondisi janin. Hasil pengujian algoritma naïve bayes memiliki nilai akurasi 98,59%. Kemudian dilakukan penerapan seleksi fitur menggunakan metode Backward Elimination untuk meningkatkan akurasi dataset sehingga diperoleh nilai akurasi 99,53%. Algoritma naïve bayes dengan seleksi fitur backward elimination mampu menghasilkan klasifikasi yang baik. Hasil akurasi yang diperoleh pada penelitian meningkat 0,94%.

Keywords: Klasifikasi Kondisi Janin, Cardiotocography, Naïve Bayes, Backward Elimination.

Abstrack

Monitoring the condition of the fetus is important during labor. This is done to minimize the death of the fetus in the womb. The World Health Organization states thatn 2015 the world fetal mortality rate is estimated at around 3,82-22,14 million persons, one way that is used in fetal monitoring is by cardiotocography. cardiotocography used for identification early fetal pathologic state and help doctor diagnose fetal disorders. Datasets used are cardiotocography data provided by the UCI repository, cardiotocography data have 2.126 record, and 39 attributes classified into 3 clasess that is normal, suspect, and pathologic. This study applies that naïve bayes algorithm in classifying fetal conditions. The result of testing naïve bayes algorithm have an accuracy of 98,59%. Then the application of feature selection is carried out using the backward elimination method to improve the accuracy of the dataset so that an accuracy value of 99,53%. Naïve bayes algorithm with backward elimination feature selection can produce a good classification. The results of the accuracy obtained in the study increased by 0,94%.

Keyword: Classification of Fetal Condition, Cardiotocography, Naïve Bayes, Backward Elimination

(2)

2

JURNAL INFORMATIKA Vol.5 No.1, April 2018: 1-2 1. Pendahuluan

Cardiotocography (CTG) adalah representasi grafis yang membentuk gerakan janin, denyut janin (FHR), dan kegiatan kontraksi uterus (UC). Pemantauan janin secara elektronik membuat mudah dalam memastikan kondisi kesejahteraan janin dan memungkinkan untuk pemantauan kondisi janin secara terus menerus (Comert

& Kocamaz, 2017).

Perkembangan teknologi informasi telah memberikan kontribusi pada cepatnya pertumbuhan jumlah data yang dikumpulkan dan disimpan dalam basis data berukuran besar (gunung data). Ekstrasi informasi yang berguna dari gunungan data menjadi pekerjaan yang menantang, sering kali alat dan teknik analisis data tradisional tidak dapat digunakan dalam mengekstrak informasi dari data berukuran besar (Widayu et al, 2017). Salah satu metode atau teknik yang bisa digunakan untuk mengklasifikasikan hasil dari cardiotocography adalah dengan menggunakan data mining.

Data mining adalah teknologi yang merupakan campuran metode-metode analisis data dengan algoritma-algoritma untuk memperoses data berukuran besar dan data mining ini telah banyak diaplikasikan dalam berbagai bidang diantaranya dalam bidang kedokteran dan bidang bisnis (Widayu et al, 2017). Dalam bidang kedokteran, salah satu teknik data mining digunakan untuk diagnosa suatu penyakit, pemantauan kejadian atau masalah kesehatan (Kurniawan, 2009).

Penggunaan teknik data mining diharapkan dapat memberikan pengetahuan- pengetahuan yang sebelumnya tersembunyi didalam gudang data sehingga menjadi informasi yang berharga (Huda, 2010).

Backward elimination merupakan metode yang dapat menghilangkan atribut yang tidak signifikan dari model. Untuk prosedur backward elimination, model dimulai dengan semua atribut yang ada di dalamnya, dan atribut dengan nilai terkecil akan dihapus (Byana & Anisa, 2018).

Dengan adanya seleksi fitur diharapkan dapat meningkatkan kinerja analisis data dalam pengklasifikasian. Pengurangan suatu fitur dapat berpengaruh besar terhadap hasil klasifikasi. Pengaruh ini bisa menjadi hal baik tetapi juga bisa menjadi kendala dalam proses klasifikasi. Untuk menghindari terjadinya kesalahan pemilihan

fitur maka dilakukan seleksi fitur untuk hasil pengklasifikasi (Dewi, 2014).

Berdasarkan penelitian sebelumnya yang dilakukan Comert et al (2016) dalam penelitian classification and comparison of cardiotocography signals with artificial neural network and extreme learning machine menghasilkan nilai akurasi masing- masing sebesar 91,84% dan 93,42%. Pada penerapan algoritma neural network untuk klasifikasi kardiotokografi manghasilkan nilai akurasi sebasar 99,15% (Ramdhani et al, 2018). Dalam penelitian mengenai prediksi keputusan klien telemarketing untuk deposito pada bank menggunakan algoritma naïve bayes berbasis backward elimination, akurasi yang dihasilkan dari naïve bayes sebesar 89,08% sedangkan naïve bayes berbasis backward elimination sebesar 90,69% (Sulaehani,2016). Kemudian penelitian mengenai penggabungan algoritma backward elimination dan naïve bayes untuk mendiagnosis penyakit kanker payudara, akurasi yang diperoleh dari naïve bayes sebesar 96,14% sedangkan naïve bayes berbasis backward elimination sebesar 97,00% (Hermawanti, 2015).

Dalam penelitian ini klasifikasi kondisi janin menggunakan algoritma naïve bayes dan backward elimination dengan menggunakan dataset Cardiotocography.

2. Metode Penelitian

Dalam penelitian ini penulis menggunakan beberapa tahapan penelitian yaitu:

1.

Pengumpulan Data

Metode pengumpulan data dalam suatu penelitian dimaksudkan memperoleh bahan- bahan yang relevan akurat dan terpercaya.

Sehingga dapat membantu dan memudahkan penulis dalam memperoleh data sesuai dengan tujuan dan permasalahan yang ada. Data yang digunakan dalam penelitian ini adalah data sekunder yaitu data yang dikumpulkan oleh penulis dari website University of California Irvine Machine Learning Data Repository (UCI Machine Learning Repository). Penulis menggunakan dataset Cardiotocography yang sudah diolah oleh peneliti sebelumnya.

2.

Pengolahan Data Awal

Tujuan yang dingin dicapai adalah untuk mengetahui hasil dari klasifikasi cardiotocography, dataset cardiotocography terdiri dari 2126 record data. Langkah pertama yang dilakukan Untuk menguji model yang diterapkan, data dibagi menjadi dua bagian, yaitu data training dan data

(3)

3

JURNAL INFORMATIKA Vol.5 No.1, April 2018: 1-2 testing. data training digunakan untuk

pengembangan model, sedangkan data testing digunakan untuk pengujian model.

Setelah diketahui jumlah dataset maka pembagian data sebesar 80% digunakan untuk data training dan 30% digunakan untuk data testing, dengan masing-masing pembagian menghasilkan jumlah 1701 dan 425 data. Hasil eksperimen pada split validation pembagian data 80% dan 20%

menghasilkan akurasi yang tinggi dibandingkan dengan akurasi yang lain.

Kemudian langkah kedua dilakukan seleksi fitur menggunakan backward elimination Proses seleksi fitur dilakukan untuk menghasilkan atribut-atribut yang bermutu atau memiliki weight yang paling berpengaruh terhadap dataset.

3.

Metode yang Diusulkan

Pengumpulan Data

Data Training Data Testing

Evaluasi dan Validasi Pengolahan data awal

Backward Elimination Pem odelan

Naïve Bayes

Hasil

Gambar 1.1 Metode Usulan

4.

Modelling

Pada tahap ini dilakukan proses pengolahan data mining dengan menggunakan algoritma naïve bayes. Hal ini bertujuan untuk memperoleh nilai akurasi yang ingin dicapai dalam penerapan data mining.

5.

Evaluasi dan Validasi

Pada tahap ini, akan dilakukan evaluasi terhadap kualitas dan efektifitas dari model yang sudah dibuat. Proses evaluasi akan menggunakan nilai akurasi, recall dan precision. Tujuannya adalah untuk mengukur hasil kinerja dari klasifikasi. Nilai akurasi adalah proporsi jumlah prediksi yang benar, recall adalah proporsi kasus dengan hasil diagnosis positif, dan recall yaitu membandingkan nilai true positive dan tupel poritif. Kemudian tahapan evaluasi dataset cardiotocography menggunakan software

rapidminer dengan cara memasukan testing data seperti pada penjelasan sebelumnya dan diharapkan dari pemodelan ini menghasilkan tingkat akurasi yang tinggi.

3. Hasil dan Pembahasan

Penerapan algoritma Naïve bayes dan Backward Elimination pada klasifikasi kondisi janin dengan menggunakan dataset cardiotocography dimaksudkan untuk memperoleh hasil akurasi yang lebih tinggi dari penelitian sebelumnya. Hasil akurasi yang tinggi diperoleh dari beberapa eksperimen yang dilakukan. Eksperimen tahap pertama adalah penerapan algoritma Naïve Bayes tanpa Backward Elimination dan tahap kedua adalah penerapan algroritma Naïve Bayes dengan Backward Elimination. Kedua ekperimen tersebut menggunakan metode validasi Split Validation.

3.1. Hasil Eksperimen Naïve Bayes Tanpa Backward Elimination

Pada tahap ini dilakukan pengujian model Naïve Bayes tanpa Backward Elimination menggunakan Software RapidMiner. Cardiotocography dataset dibagi menjadi beberapa ukuran pembagian data training dan data testing. Dataset yang telah disiapkan untuk implementasi proses uji model kemudian diuji pada algoritma Naïve Bayes dengan metode Split Validation.

Gamber 1.2 Confusion Matrix Naïve Bayes Tanpa Backward Elimination

3.2. Hasil Eksperimen Naïve Bayes Menggunakan Backward Elimination

Pada tahap ini dilakukan penerapan optimasi seleksi fitur Backward Elimination pada model Naïve Bayes. Backward Elimination adalah salah satu seleksi fitur yang dapat memilih atribut-atribut terbaik sehingga mampu meningkatkan akurasi dataset yang diujikan.

Gambar 1.3 Confusion Matrix Naïve Bayes dan Backward Elimination

(4)

4

JURNAL INFORMATIKA Vol.5 No.1, April 2018: 1-2 3.3. Perbandingan Algoritma Naïve Bayes

dengan Algoritma Naïve Bayes Menggunakan Backward Elimination

pada tahap ini dilakukan evaluasi terhadap algoritma Naïve Bayes dengan algoritma Naïve Bayes menggunakan Backward Elimination. Tujuan pada evaluasi ini adalah untuk melihat apakah optimasi Backward Elimination dapat meningkatkan akurasi pada algoritma Naïve Bayes.

Berdasarkan ekperimen yang sudah dilakukan optimasi Backward Elimination mampu meningkatkan akurasi hingga 99,53% dari model Naïve Bayes tanpa seleksi fitur yaitu 98,59%. Algoritma Naïve Bayes menggunakan seleksi fitur Backward Elimination mampu meningkatkan akurasi sebesar 0,94% dari hasil yang diperoleh tanpa menggunakan seleksi Backward Elimination.

Tabel 1.1.

Perbandingan Naïve Bayes dengan Naïve Bayes+Backward Elimination

No Model (Algoritma) Akurasi

1 Naïve Bayes 98,59%

2 Naïve Bayes + Backward

Elimination

99,53%

4. Kesimpulan

Pada penelitian ini dilakukan eksperimen terhadap algoritma Naïve Bayes berbasis Backward Elimination untuk mengklasifikasikan kondisi janin menggunakan dataset Cardiotocography.

Algoritma naïve bayes dipadukan dengan seleksi fitur Backward Elimination, bertujuan untuk mengoptimalkan hasil akurasi klasifikasi dataset Cardiotocography.

Berdasarkan hasil eksperimen yang tekah dilakukan, maka dapat disimpulkan bahwa:

1. Klasifikasi kondisi janin dapat diidentifikasi dengan menggunakan teknik klasifikasi data mining dalam keadaan normal, suspect atau pathologic.

2. Algoritma naïve bayes dengan seleksi fitur backward elimination dapat mengklasifikasikan keadaan janin.

3. Algoritma naïve bayes dan seleksi fitur backward elimination mampu meningkatkan nilai akurasi dalam klasifikasi kondisi janin dengan baik, dibuktikan dengan nilai akurasi yang dihasilkan naïve bayes sebesar 98,59%, kemudian setelah diterapkan seleksi fitur backward elimination

meningkat sebesar 0,94% menjadi 99,53%

Referensi

Byana, A., & Anisa, F. N. (2018). Backward Elimination Untuk Meningkatkan Akurasi Kejadian Stunting Dengan Analisis Agoritma Support Vector Machine. Dinamika Kesehatan, 772.

Comert, Z., Kocamaz, A. F., & Gungor, S.

(2016). Classification and Comparison Of Cardiotocography Signals With Artificial Neural Network and Extreme Learning Machine. IEEE 978-1-5090-1679-2.

Comert, Z., & Kocamaz, A. F. (2017). A Novel Software for Comprehensive Analysis of Cardiotocography Signals "CTG-OAS". 978-1-5386- 1880-6/17.

Dewi. (2014). Analisis Performa Klasifikasi untuk Diagnosis Penyakit Parkinson. Universitas Gajah Mada.

Hermawanti, L. (2015). Penggabungan Algoritma Backward Elimination dan Naive Bayes untuk Mendiagnosis Penyakit Kanker Payudara.

Momentum.

Huda, N. (2010). Aplikasi Data Mining Untuk Menampilkan Informasi Tingkat Kelulusan Mahasiswa. Universitas Diponegoro.

Ramdhani, Y., Susanti, S., Adiwisastra, M.

F., & Topiq, S. (2018). Penerapan Algoritma Neural Network Untuk Klasifikasi Kardiotokografi. Jurnal Informatika, 43-49.

Sulaehani, R. (2016). Prediksi Keputusan Klien Telemarketing Untuk Deposito Pada Bank Menggunakan Algoritma Naive Bayes Berbasis Backward Elimination. Jurnal Ilmial ILKOM, 182-189.

Widayu, H., Nasution, S. D., Silalahi, N., &

Mesran. (2017). Data Mining Untuk Memprediksi Jenis Transaksi Nasabah Pada Koperasi Simpan Pinjam Dengan Algoritma C4.5.

Media Informatika Budidarma.

Referensi

Dokumen terkait

Penelitian ini bertujuan untuk membandingkan beberapa algoritma yaitu diantaranya algoritma Naïve Bayes Classifier dan Support Vector Machine dengan menggunakan boosting

Berdasarkan hasil pengujian yang telah dilakukan pada penelitian ini, dengan menggunakan pemodelan Algoritma Naive Bayes untuk memberikan klasifikasi dan prediksi