• Tidak ada hasil yang ditemukan

PENERAPAN SEQUENTIAL METHODS UNTUK HANDLING MISSING VALUE PADA ALGORITMA C4.5 DAN NAÏVE BAYES UNTUK MEMPREDIKSI PENYAKIT DIABETES MELLITUS.

N/A
N/A
Protected

Academic year: 2017

Membagikan "PENERAPAN SEQUENTIAL METHODS UNTUK HANDLING MISSING VALUE PADA ALGORITMA C4.5 DAN NAÏVE BAYES UNTUK MEMPREDIKSI PENYAKIT DIABETES MELLITUS."

Copied!
1
0
0

Teks penuh

(1)

vii

vii ABSTRAK ABSTRAK

Banyak penelitian yang melakukan preprocessing dengan menangani missing data. Akan tetapi sedikit sekali penelitian yang khusus membahas tentang handling missing value. Missing value hal biasa yang terjadi pada dataset dan kalau tidak ditangani secara maksimal akan mengakibatkan kurang signifikan pada akurasi hasil pengujian dan bahkan akan mengakibatkan hilangnya informasi berharga dari dataset yang ada. Tujuan dari penelitian ini adalah untuk mengetahui teknik sequential methods terbaik untuk menangani missing value yang diterapkan dengan algoritma C4.5 dengan algoritma Naïve Bayes untuk mendapatkan akurasi terbaik dan signifikan dengan memperhatikan keterkaitan antara atribut yang satu dengan yang lain tanpa harus kehilangan informasi yang berharga dari dataset yang ada sehingga dataset tetap mencerminkan kondisi yang sebenarnya. Adapun manfaat dari penelitian ini yaitu dapat memberikan kontribusi dalam keilmuan terutama dalam bidang data mining khususnya untuk penanganan missing value dengan melakukan komparasi sequential methods pada preprocessing data sehingga akan dihasilkan akurasi yang baik dan signifikan dan tetap mencerminkan kondisi yang sebenarnya. Penelitian ini akan melakukan komparasi metode handling missing value. Sedangkan metode yang akan digunakan adalah sequential methods. Sequential methods adalah teknik untuk menangani missing data khususnya untuk preprocessing. Assigning All Possible Values to a Missing Attribute Value dan Assigning All Possible Attribute Values Restricted to a Concept mampu menghasilkan akurasi yang lebih baik dibanding teknik lainnya apabila diterapkan ke dalam algoritma C4.5 dan Naïve Bayes. Algoritma C4.5 menghasilkan akurasi sebesar 75.55 % dan AUC sebesar 0.814, sedangkan algoritma Naïve Bayes menghasilkan akurasi sebesar 76.79 % dan AUC sebesar0.836. Dari hasil penelitian di atas tidak mutlak yang terbaik, penelitian ini bisa dicoba algortima klasifikasi yang lain, misalnya Logistic Regression, K-Nearest Neigbors, Support Vector Machine dan lain-lain atau dicoba dengan dataset yang lain.

Kata kunci : Diabetes Mellitus; Handling Missing Value; Sequential Methods, C4.5, Naïve Bayes

Referensi

Dokumen terkait

Dari Gambar 1 terlihat bahwa kadar lemak ikan Bilih goreng rata-rata kadar lemak yang tertinggi pada sampel dari Shirley dengan nilai 33,54%.. Rata-rata

Persentase eksplan yang hidup dan respons dalam media DKW yang diperkaya dengan pikloram dengan berbagai konsentrasi serta jumlah embrio pada umur 14 hari

Dalam penelitian ini ada ketentuan dan asumsi seperti berikut: (1) semua emisi partikel timbal tidak ada yang mengalami deposisi karena jarak antara sumber emisi dengan jalur

Selain pencampuran budaya yang ditunjukkan dengan kebiasaan tokoh menonton film Hollywood di tengah bangsanya sendiri, pencampuran budaya juga ditunjukkan dengan

BALAI TEKNIK KESEHATAN LINGKUNGAN DAN PENGENDALIAN PENYAKIT (BTKLPP) KELAS I MANADO lTahun 2020 Tabel 2.1Target Perjanjian Kinerja BTKLPP Kelas I Manado

Teknik analisis yang digunakan dalam penelitian ini adalah kualitatif deskriptif dengan tujuan untuk mengetahui dan menggambarkan secara jelas dan mendalam mengenai faktor

Rendemen yang dihasilkan pada proses pembuatan bioetanol dari ubi kayu sangat tergantung pada kemampuan proses hidrolisis komponen-komponen ubi kayu terutama pati menjadi

Oleh karena itu, bagi pertanian yang bersifat land base agricultural, ketersediaan lahan merupakan syarat mutlak atau keharusan untuk mewujudkan peran sektor pertanian