Klasifikasi Pasien Persalinan Caesar Menggunakan Metode Naïve Bayes Berbasis Forward Selection
Muh. Faisal1*, Bahrin Dahlan2, Rahmat Thaib3
1,Program Studi Teknik Informatika Fakultas Ilmu Komputer Universitas Ichsan Gorontalo
2,3Program Studi Informatika Fakultas Ilmu Komputer Universitas Pohuwato
*Corresponding email: [email protected]
Abstrak - Hasil observasi di lingkungan rumah maupun kantor yakni cukup banyak ibu hamil yang akhirnya melakukan operasi caesar. Ada beberapa penyebab seorang ibu hamil melakukan caesar. Pertama, faktor kesehatan ibu. Kedua, faktor janin. Ketiga adalah faktor gabungan dari faktor ibu dan janin. Faktor-faktor tersebut menjadi indikasi apakah persalinan akan dilakukan dengan mutlak atau mungkin juga bisa menjadi relatif. Pada penelitian ini akan menerapkan metode Naive Bayes dengan optimasi forward selection untuk mendapatkan klasifikasi persalinan caesar dengan lebih optimal dimana hasil yang didapatkan penelitian sebelumnya terhadap prediksi ibu melahirkan hanya mendapat akurasi 88%. Naïve Bayes merupakan pengklasifikasian dengan metode probabilitas dan statistik. Dari sembilan atribut yang digunakan yaitu Gravid Aterm, Riwayat SC, Posisi Bayi, Bayi Besar, Plasenta, Ketuban, Penyakit Ibu, Gemelli, dan Inpatu lalu dengan menggunakan algoritma Naive Bayes berbasis Forward Elimination didapatkan empat atribut weight yaitu Gravid Aterm, Bayi Besar, Ketuban dan t Gemelli dalam mengklasifikasi partus atau persalinan caesar. Secara mandiri tingkat akurasi yang dihasilkan algoritma Naive Bayes adalah 93,33 %. Sedangkan dengan menambahkan seleksi fitur Forward Elimination menghasilkan akurasi 94% dalam klasifikasi pasien persalinan Caesar. Dengan demikian, metode Naive Bayes berbasis Forward Elimination dapat digunakan sebagai metode yang lebih optimal dari penelitian sebelumnya.
Kata Kunci: Naïve Bayes, Forward Selection, Caesar
Abstract -The results of observations in the home and office environment are quite a lot of pregnant women who end up doing cesarean sections. There are several causes of a pregnant woman doing a cesarean. First, the maternal health factor. Secondly, fetal factors. Third is the combined factor of maternal and fetal factors.
These factors are an indication of whether labor will be done absolutely or maybe it can also be relative.
This study will apply the Naive Bayes method with forward selection optimization to get a more optimal classification of cesarean delivery where the results obtained by previous studies on the prediction of childbirth only got 88% accuracy. Naïve Bayes is a classification by probability and statistical methods. Of the nine attributes used, namely Gravid Aterm, SC History, The position of the Baby, Big Baby, Placenta, Amniotic, Maternal Disease, Gemelli, and Inpatu then using the Naive Bayes algorithm based on Forward Elimination obtained four weight attributes, namely Gravid Aterm, Big Baby, Amniotic and Gemelli t in classifying partus or cesarean delivery. Meanwhile, by adding the Forward Elimination feature selection resulted in 94% accuracy in the classification of Cesarean delivery patients. Thus, the Naive Bayes method based on Forward Elimination can be used as a more optimal method than previous studies.
Keywords : Naïve Bayes Forward Selection Caesar
1. Pendahuluan 1.1. Latar Belakang
Di Indonesia angka kejadian sectio caesarea atau persalinan secara sesar mengalami peningkatan dari tahun 2000 hingga sekarang[1]. Kepercayaan ibu hamil terhadap penanganan medis dan rasa ingin partus secara mudah, tidak lagi membuat ibu hamil khawatir terhadap tindakan caesar. Padahal persalinan caesar memiliki dampak negatif yang lebih besar[2].
Dalam hal penentuan keputusan persalinan sesar harus tepat agar tidak merugikan bagi ibu yang akan melahirkan. Dibutuhkan suatu metode yang dapat mengklasifikasi banyaknya kelahiran secara caesar beserta indikasi-insikasi yang menyertainya[3]. Teorema Bayes adalah teorema yang digunakan dalam statistika untuk menghitung peluang untuk suatu hipotesis, di mana Bayes Optimal Classifier menghitung peluang dari suatu kelas dari masing-masing kelompok atribut yang ada, dan menentukan kelas mana yang paling optimal[5].
Penelitian ini akan menganalisis penerapan metode Naïve Bayes untuk mengklasifikasi terhadap indikasi Submitted Date : 05 Desember 2023 Accepted Date : 12 Desember 2023
atau faktor-faktor penyebab tindakan sectio caesarea dengan menggunakan teknik peningkatan akurasi sehingga bisa lebih optimal[6].
1.2. Rumusan Masalah
1. Bagaimana mengklasifikasi persalinan caesar berdasarkan kemiripan atribut dengan persalinan normal 2. Bagaimana mendapatkan akurasi yang lebih optimal terhadap klasifikasi persalinan sesar.
1.3. Tujuan Penelitian
1. Menentukan atribut-atiribut yang paling berpengaruh dalam hal indikasi persalinan caesar sehingga klasifikasi lebih optimal
2. Meningkatkan akurasi terhadap klasifikasi persalinan caesar dengan metode Naive Bayes berbasis forward selection
2. Metodologi Penelitian
2.1. Waktu Dan Tempat Penelitian
Pengambilan data dilakukan di Rumah sakit Bahagia kota Makassar di tahun 2015.
2.2. Objek Penelitian
Objek penelitian yang diteliti adalah pengklasifikasian persalinan sesar berdasarkan atribut terbaik 2.3. Ruang Lingkup Penelitian
Langkah-langkah dalam menyusun penelitian ini adalah mengklasifikasi pasien sesar dengan metode Naïve Bayes Berbasis Forward Selection
2.4. Pengumpulan Data
Penelitian ini menggunakan data record sebanyak 150 pasien dengan masing-masing indikasi persalinan SC. Berikut atribut dan indikasi pasien SC:
Tabel 1. Atribut Data Indikasi Pasien
NO ATRIBUT PENJELASAN
1 Partus Cara melahirkan
2 Gravid Aterm Cukup bulan 3 Riwayat SC Riwayat Persalinan caesar 4 Bayi Besar Bayi melebihi ukuran normal 5 Posisi Bayi Posisi bayi tidak normal 6 Plasenta Plasenta bayi mengalami
gangguan 7 Ketuban Ketuban mengalami
reaksi/gangguan 8 Penyakit ibu Penyakit yang diidap oleh ibu
hamil
9 Gemelli Bayi kembar
10 Inpartu Sedang menunggu kelahiran 2.5. Pengolahan Awal
Jumlah data pada kasus ini ada 150 record terdiri dari 10 atribut dan 1 atribut sebagai target/label.
Parameter - parameter data akan dapat dengan mudah diketahui dengan menggunakan tool rapidMiner.
Tabel 3. Contoh Dataset Hasil Pengolahan Awal Gravid
Aterm
Riwayat
SC Plasenta bayi
besar Posisi bayi ketuban Penyakit
Ibu gemelli inpartu Partus
Ya 1 T T T T T T T Caesar
Ya 0 T T T serotinus T T T normal
Ya 0 T Ya T T T T T normal
Ya 0 lilitan T T kpd T T T Caesar
Tabel 3. Pemetaan Data
NAME TYPE RANGE MISSING
Partus Binominal Caesar (132), normal (18) 0
Gravid Aterm Binominal Ya (107), T (43) 0
Riwayat SC polynominal 1.0 (23), 0.0 (118), 2.0 (9) 0
Plasenta polynominal T (138), lilitan (11), plasenta rendah (1) 0
Bayi besar Binominal T (148), Ya (2) 0
Posisi bayi polynominal T (129), malposisi (2), letak sunsang (10), letak
lintang (8) 0
Ketuban polynominal T (91), serotinus (7), kpd (34), oligohidromnion (16),
pelepasan lendir (2) 0
Penyakit Ibu polynominal
T (129), PEB (4), hipertensi (2), kista (3), anemia (6), distorsia serviks (2), mioma (2), wasir (1), demam
(1)
0
Gemelli Binominal T (147), Ya (3) 0
Inpartu polynominal T (104), kala 1 (38), kala 2 (8) 0
3. Hasil Dan Pembahasan 3.1. Hasil Pengolahan data
Jumlah data pada kasus ini ada 150 record terdiri dari 10 atribut dan 1 atribut sebagai target (partus) . Terlebih dahulu menentukan tipedata untuk masing-masing atribut indikasi caesar. Masing-masing atribut memiliki karakteristik tersendiri dengan range yang berbeda kecuali untuk range Gravid Aterm, Bayi Besar dan Gemelli di mana ketiganya memiliki range yang sama yaitu antara “Ya” dan “Tidak”.
Pengolahan data ini mengambil sampel pasien caesar yang berjumlah 132 record. Selanjutnya mengambil sampel 18 record untuk persalinan normal yang memiliki atribut kecenderungan yang sama dengan pasien caesar tersebut. Dalam proses awal penentuan data, akan diketahui apakah ada data yang missing atau tidak.
Jika data sudah tidak missing, maka dapat dilanjutkan di tahap selanjutnya 3.2. Implementasi Dengan Perhitungan Naive Bayes
Pada tahap ini data akan diimplementasikan dengan formula Naive Bayes. Adapun cara kerja dari proses perhitungan Naive Bayes yaitu sebagai berikut :
X = (Gravid Aterm = Ya, Riwayat SC = 1, Plasenta = T, Bayi besar = T, Posisi bayi = T, Ketuban = Oligohidromnion, Penyakit ibu = T, Gemelli= T, inpartu = T)
Penyelesaian :
1. Tahap pertama menghitung jumlah class / label - P(Partus = Caesar) = 132 / 150 = 0.88
- P(Partus = Normal) = 18 / 150 = 0.12
Ya 0 T T T T PEB T kala 1 Caesar
Ya 1 T T T T T T T Caesar
Ya 1 T T T Oligohi-
dromnion T T T Caesar
T 0 T T malposisi T T T T Caesar
Ya 0 T T T T T Ya T normal
Ya 1 T T T T T T T normal
Ya 1 T T T T T T T Caesar
2. Tahap kedua menghitung jumlah kasus yang sama dengan class yang sama - P(Gravid Aterm = Ya | y = caesar) = 89 / 132 = 0.67
- P(Gravid Aterm = Ya | y = normal) =18/18 = 1
= T | y = caesar) = 111 / 132 = 0.84 - P(Posisi Bayi = T|y = normal)= 18/18 = 1
- P(Ketuban = oligohiromnion | y = caesar) = 16 / 132 = 0.12 - P(Ketuban = oligohidromnion| y = normal) = 0 / 18 = 0 - P(Penyakit Ibu = T | y = caesar) = 111 / 132 = 0.84 - P(Penyakit Ibu = T|y=normal)=18 /18 = 1
- P(Gemelli= T | y =caesar) = 132 / 132 = 1 - P(Gemelli = T | y = normal) = 15 / 18 = 0.83 - P(Inpartu = T | y = lancar) = 88 / 132 = 0.66 - P(Inpartu = T | y = tidak lancar) = 16/ 18 = 0.88
Gravid Aterm = Ya, Riwayat SC = 1, Plasenta = T, Bayi besar = T, Posisi bayi = T, Ketuban = Oligohidromnion, Penyakit ibu = T, Gemelli= T, inpartu = T
3. Tahap ketiga hitung probabilitas untuk atribut Partus = Caesar dan Partus= normal
- P (X | Partus = Caesar) = P(Gravid Aterm = Ya | y = Caesar) * P(Riwayat SC = 1 | y = Caesar) * P(Plasenta
= T | y = Caesar) * P(Bayi Besar = T | y = Caesar) * P(Posisi Bayi = T | y = lancar) * P(Ketuban = Oligohidromnion | y = Caesar) * P(Penyakit Ibu = T | y = Caesar) * P(Gemelli = T | y = Caesar) * P(Inpartu = T | y = Caesar) = 0.67 * 0.15 * 1 * 0.84 * 0.12 * 0.84 * 1 * 0.66 = 0,0056
- P (X | Partus = Normal) = P(Gravid Aterm = Ya | y = Normal) * P(Riwayat SC = 1 | y = Normal) * P(Plasenta = T | y = Normal) * P(Bayi Besar = T | y = Normal) * P(Posisi Bayi = T | y = lancar) * P(Ketuban
= Oligohidromnion | y = Normal) * P(Penyakit Ibu = T | y = Normal) * P(Gemelli = T | y = Normal) * P(Inpartu = T | y = Normal) = 1 * 0.16 * 0.83 * 0.88* 1 *0 * 1 * 0.83 * 0.88 = 0
4. Tahap keempat menghitung probabilitas akhir - P (Caesar | X ) = α * 0.88 * 0,0056 = 0.0049 - P (Normal | X ) = α * 0.12 * 0 = 0
5. Pada tahap ini peneliti akan membandingkan hasil class “Caesar” dan “Normal” seperti : (P | Caesar = 0.0049) > (P | Normal = 0 )
Dari hasil perbandingan diatas maka dapat ditarik kesimpulan bahwa Partus pasien yaitu Caesar.
3.3. Evaluasi Menggunakan Algoritma Naive Bayes
Pengujian dengan data 150 record menggunakan algoritma Naive Bayes tanpa seleksi fitur dengan model pengujian menggunakan 10 fold cross validation menghasilkan Accuracy 93.33% pada fold validation 5 dengan Precision 86.67 % dan Recall 60.00%. Dari eksperimen denggan jumlah data sebanyak 150 record menggunakan Confusion Matrix bahwa prediksi Caesar pada class Caesar sebanyak 129 record, predikisi Caesar pada class normal sebanyak 7 record, prediksi normal pada class Caesar sebanyak 3, dan prediksi normal pad class normal sebanyak 11 record. Selanjutnya menghitung nilai akurasinya dengan menjumlahkan data class normal yang diprediksi normal dan data class caesar diprediksi caesar dibagi dengan jumlah data keseluruhan yang ada didalam matrix.
3.4. Evaluasi Menggunakan Naive Bayes Berbasis Forward Elimination
Dari hasil eksperimen menggunakan algoritma Naive Bayes berbasis Forward Elimination diperoleh hasil atribut weight yang berpengaruh seperti dalam gambar dibawah ini :
Tabel 4. Atribut Weight Algoritma Naive Bayes berbasis Forward Elimination
Attribute Weight
Gravid Aterm 1
Riwayat SC 0
Plasenta 0
bayi besar 1
Posisi bayi 0
Ketuban 1
Gemelli 1
inpartu 0
Pengujian data 150 record menggunakan algoritma Naive Bayes menggunakan seleksi fitur Forward Elimination dengan model pengujian menggunakan 10 fold cross validation menghasilkan Accuracy 94%%
pada fold validation yang sama 4 s/d 10 dengan Precision 90.91% dan Recall 55.56% dapat dilihat pada tabel.
Tabel 5. Hasil Validasi Algoritma Naive Bayes Berbasis Forward Elimination Valida
tion Accuracy Precision Recall
2 92.00% 80.00% 44.44%
3 93.33% 83.33% 55.56%
4 94.00% 90.91% 55.56%
5 94.00% 90.91% 55.56%
6 94.00% 90.91% 55.56%
7 94.00% 90.91% 55.56%
8 94.00% 90.91% 55.56%
9 94.00% 90.91% 55.56%
10 94.00% 90.91% 55.56%
Tabel 3.4.3 Hasil Confusion Matrix Menggunakan Algoritma Naive Bayes
Caesar Normal Class precision
Pred. Caesar 131 8 90,91
Pred. Normal 1 10
Class Recall 50,00% 55,56%
3.5. Kesimpulan
1. Dari sembilan atribut yang digunakan yaitu Gravid Aterm, Riwayat SC, Posisi Bayi, Bayi Besar, Plasenta, Ketuban, Penyakit Ibu, Gemelli, dan Inpartu lalu dengan menggunakan algoritma Naive Bayes berbasis Forward Elimination didapatkan empat atribut weight yaitu Gravid Aterm, Bayi Besar, Ketuban dan Gemelli dalam mengoptimalkan klasifikasi partus atau persalinan caesar
2. Tingkat akurasi yang dihasilkan algoritma Naive Bayes dengan menambahkan seleksi fitur Forward Selection adalah 94%. Ini membuktikan bahwa metode dengan penambahan fitur Forward Selection lebih baik daripada hanya dengan metode Naïve Bayes.
Untuk mempertajam akurasi klasifikasi persalinan caesar dapat dilakukan dengan menambahkan atribut lain misalnya umur, paritas, hb. Begitu pula menambahkan jumlah data record yang lebih banyak dan menggunakan dataset yang lain sebagai perbandingan tingkat akurasi yang dihasilkan algoritma Naive Bayes Daftar Pustaka
[1] Dunham, Margaret,H. (2003), Data Mining Introuctory and Advanced Topics, New Jersey: Prentice Hall.
[2] Rachli, Muhamad. 2007. Email Filtering menggunakan Naïve Bayesian. Bandung : Tugas Akhir Jurusan
[3] M. Berry, Data Mining Techniques, John Wiley & Sons, 2004.
[4] F. Gorunescu, Data Mining Concept Model Technique, Craiova, Romania: Springer, 2011.
[5] M. J. Islam, Q. M. J. Wu, M. Ahmadi and M. A. Sid-Ahmed, Investigating the Performance of Naive- Bayes Classifiers and K- Nearest Neighbor Classifiers, International Conference on Convergence Information Technology, pp. 1541-1546, 2007.
[6] J. Lin and J. Yu, Weighted Naive Bayes Classification Algorithm Based on Particle Swarm Optimization, IEEE, pp. 444-447, 2011.
[7] G. Mabrur and R. Lubis, Penerapan Data Mining untuk Memprediksi Kriteria Nasabah Kredit, Jurnal Komputer dan Informatika (KOMPUTA), vol. 1, pp. 53-57, 2012.
[8] Budi Santoso, Data Mining Teknik Pemanfaatan Data Untuk Keperluan Bisnis, 1st ed. Yogyakarta, Indonesia: Graha Ilmu, 2007.
[9] Kantardzic, Mehmed (2003), Data Mining Concepts Models, Methods, and Algorithms, New Jersey: IEEE
[10] Kasdu, D. 2005. Solusi Problem Persalinan. Jakarta: Puspa Swara.
[11] Kulas, T. 2008. Modified Misgav Ladach Method For Cesarean Section: linical Experience. Gynecol Obstet Invest, 65(4):222-226
[12] Kusrini, 2006, Algoritma Data Mining, Penerbit ANDI, Yogyakarta
[13] Lang, J. and Rothman, K.J. 2011. Field Test Results of The Motherhood Method to Measure Maternal Mortality. Indian J Med Res, 133: 64-69
[14] Lia, X., Zhua, J., Dai, L., Li, M., Miao, L., Liang, J. and Wang, Y. 2010. Trends in Maternal Mortality Due to Obstetric Hemorrhage in Urban, and Rural China, 1996–2005.J. Perinat. Med. 39: 35–41 [15] A. Rahman and F. A. Sianturi, “Implementasi Metode Teorema Bayes Untuk Mendiagnosa Penyakit
Pada Tumbuhan Bunga Kertas,” J. Nas. Komputasi dan Teknol. Inf., vol. 5, no. 1, pp. 64–75, 2022.