BAB 1
PENDAHULUAN
1.1. Latar Belakang
Suatu elemen yang sangat penting dan menjadi kebutuhan sehari-hari saat ini adalah adalah sebuah informasi, untuk mendapatkan sebuah informasi yang tepat dan akurat tidaklah mudah. Informasi yang tersedia dalam jumlah yang besar terkadang masih harus kita gali terlebih dahulu agar informasi tersebut dapat menyajikan informasi yang tepat dan sesuai dengan kebutuhan. Untuk dapat menggali informasi yang berpotensi dari gudang data tidak bisa hanya mengandalkan data operasional saja, namun diperlukan suatu analisis data yang tepat sehingga menghasilkan informasi yang akurat dan berharga bagi yang membutuhkannya, untuk membantu para pengambil keputusan serta menjadikan perbandingan, peneliti melakukan teknik data mining untuk analisa kinerja metode rough set dan algoritma apriori.
Data mining merupakan teknik yang menggabungkan teknik analisis data tradisional dengan algoritma untuk pemrosesan data dalam jumlah yang besar.
Data mining dapat digunakan untuk melakukan analisis data dan menemukan pola-pola penting pada data. Secara sederhana, data mining atau penambangan data dapat didefinisikan sebagai proses seleksi, eksplorasi dan pemodelan dari sejumlah besar data untuk menemukan pola atau kecenderungan yang biasanya tidak disadari keberadaannya (Turban, et al. 2005). Dalam data mining, data disimpan secara elektronik dan diproses secara otomatis oleh komputer mengunakan teknik dan perhitungan tertentu (Berry & Linoff, 2004). Data mining tersebut akan menjadi acuan untuk mengambil keputusan. Pengolahan data mining dapat dilakukan dengan beberapa teknik diantaranya adalah Metode Rough set, Fuzzy, Algoritma Apriori dan lain - lain.
2
Beberapa penelitian terdahulu terkait dengan analisis kinerja metode rough set dan algoritma apriori dari berbagai kasus antara lain yaitu penelitian yang dilakukan oleh (Adeyemo, et al. 2015), melakukan penelitian tentang diagnosa demam tifoid menggunakan tiga metode yaitu ID3, C45 dan Multilayer Perceptron (MLP), dari hasil
penelitian tersebut MLP memiliki tinggi akurasi terbaik dibandingkan dengan kedua
metode lainnya, akan tetapi dalam hal kecepatan algoritma C45 ditemukan menjadi
yang terbaik dalam data training; (Oguntimilehin, et al. 2013), melakukan sebuah
pendekatan untuk diagnosa demam tifoid menggunakan teknik machine learning yang
dikembangkan dalam penelitian ini dan kinerja sistem diukur pada kedua set
pelatihan dan pengujian; (Budiono, et al. 2014) dalam penelitiannya melakukan
identifikasi dan pencarian informasi mengenai pola penyakit radang sendi dengan
teknik data mining association rule menggunakan algoritma apriori, penelitian ini
menampilkan informasi berupa nilai support dan confidence hubungan antara pola
penyakit radang sendi dengan atribut umur, jenis kelamin, pekerjaan dan gejala.
Metode Rough set adalah sebuah teknik matematik yang dikembangkan sejak
tahun 1980.Teknik ini digunakan untuk menangani masalah Uncertainty, Imprecision dan Vagueness dalam aplikasi Artificial Intelligence (AI) (Listiana, et al. 2012). Rough set menawarkan dua bentuk representasi data yaitu:
1. Information Systems (IS) adalah tabel yang terdiri dari baris yang merepresentasikan data dan kolom yang merepresentasikan atribut atau variabel dari data. Information system pada data mining dikenal dengan nama dataset. Information system dapat direpresentasikan sebagai fungsi A = (U, A), dimana U adalah himpunan tidak kosong dari objek yang direpresentasikan dan A adalah himpunan tidak kosong dari atribut atau variabel.
2. Decision Systems (DS) information system dengan atribut tambahan yang dinamakan dengan decision atribute, dalam data mining dikenal dengan nama kelas atau target. Atribut ini merepresentasikan hasil dari klasifikasi yang diketahui. Information System (IS) menjadi IS = (U, {A,C}), contoh Information System (IS) yang didalamnya terdapat objek (U), atribut kondisi (A) dan atribut keputusan (C). (Hakim & Rusli, 2013)
3
Kelebihan utama menggunakan roughset adalah bahwa roughset tidak membutuhkan data awal atau data tambahan seperti probabilitas pada teori probabilitas, tingkat keanggotaan pada teori fuzzy (Li, et al. 2007). Dalam rough set, kumpulan objek disebut sebagai information system (IS). Dari IS tersebut objek-objek diklasifikasikan kedalam area-area tertentu yang disebut dengan lower approximation, boundary region, dan outside region. Dari pengelompokan area tersebut, dapat dilakukan perhitungan dependensi antar atribut, reduksi atribut, rule generation sehingga dapat diperoleh rule dari data set yang digunakan. Untuk mendapatkan hasil identifikasi tentang asosiasi antar pola dari suatu penyakit demam tifoid, peneliti menggunakan algoritma apriori.
Algoritma Apriori merupakan sebuah algoritma untuk mencari kombinasi item set yang mempunyai suatu nilai keseringan tertentu sesuai kriteria atau filter yang diinginkan dengan cara memperhatikan minimum support (minsup). Adapun dua
proses utama yang dilakukan algoritma Apriori (Jiawei & Kamber, 2006), yaitu join (penggabungan) dan prune (pemangkasan). Pada proses penggabungan setiap item
dikombinasikan dengan item yang lainnya sampai tidak terbentuk kombinasi lagi. Sedangkan pada proses pemangkasan hasil dari item yang telah dikombinasikan tadi dipangkas dengan menggunakan minimum support yang telah ditentukan oleh user.
Berdasarkan permasalahan diatas peneliti termotivasi untuk menganalisa kinerja metode rough set dan algoritma apriori dalam identifikasi penyakit demam tifoid, dalam penelitian ini diharapkan peneliti mendapatkan akurasi yang terbaik dari kedua metode tersebut.
1.2. Rumusan Masalah
Berdasarkan latar belakang di atas maka permasalahan yang dibahas dalam penelitian ini adalah kurangnya akurasi dalam identifikasi penyakit demam tifoid kepada pasien sering kali terjadi di rumah sakit, sehingga diperlukan suatu pendekatan untuk mengatasi permasalahan akurasi identifikasi pada kasus penyakit demam tifoid.
1.3. Batasan Masalah
Rumusan masalah diatas dibatasi beberapa hal sebagai berikut :
1. Penelitian ini hanya membahas mengenai akurasi dalam identifikasi pola
penyakit demam tifoid.
4
2. Pengambilan data hanya sebatas pada data laporan rekam medik pasien yang didiagnosa terkena demam tifoid sebanyak 500 kasus pada RS. Grand Medistra Lubuk Pakam periode tahun 2012, 2013 dan 2014.
1.4. Tujuan Penelitian
Tujuan penelitian ini adalah menganalisis kinerja metode rough set dan algoritma apriori untuk mendapatkan akurasi identifikasi penyakit demam tifoid.
1.5. Manfaat Penelitian
Penelitian ini diharapkan dapat memberikan manfaat bagi pihak-pihak yang terkait dengan adanya sistem tersebut, yakni:
1. Dapat mengetahui kinerja metode rough set dan algoritma apriori dalam mengukur akurasi identifikasi penyakit demam tifoid.
2. Mengetahui penggunaan metode rough set dan algoritma apriori. 3. Meningkatkan akurasi hasil identifikasi demam tifoid.