1
IMPLEMENTASI DATA MINING UNTUK IDENTIFIKASI POLA
PENYAKIT ISPA DENGAN MENGGUNAKAN ALGORITMA
APRIORI (Studi Kasus Di UPTD Puskesmas Bae Kabupaten Kudus)
Abdul Mustakim
Program Studi Sistem Informasi, Fakultas Ilmu Komputer Universitas Dian Nuswantoro Semarang
Jl. Nakula I No. 5-11 Semarang 50131 Telepon:(024) 3517261, Fax : (024) 3520165
Email : doelmustakim@gmail.com
Abstrak
Dalam bidang kesehatan ketersediaan data rekam medis sudah bukan lagi hal yang sulit diperoleh, namun sering kali data ini hanya diperlakukan sebagai rekaman tanpa pengolahan lebih lanjut sehingga tidak mempunyai nilai guna lebih untuk keperluan masa mendatang. Berdasarkan rekap data rekam medis tahun 2013 menunjukkan penyakit ISPA menjadi penyakit paling banyak dialami oleh pengunjung UPTD Puskemas Bae, diperlukan solusi serta penanganan khusus untuk menangani masalah tersebut. Salah satunya yaitu mencari informasi mengenai pola penyakit tersebut, misalnya seberapa kuat hubungan persentase antara jenis kelamin, umur, alamat terhadap bulan periksa. Suatu teknologi yang dapat digunakan dalam pencarian pola atau hubungan asosiasi dari data yang bersekala besar adalah data mining association rule dengan algoritma apriori. Diharapkan dari hasil tahapan proses mining tersebut pihak puskemas dapat mengetahui pola penyebaran penyakit ISPA serta mempunyai referensi untuk melakukan sosialisasi atau penyuluhan mengenai gejala, bahaya serta dampak dari penyakit Ispa sehingga dapat dilakukan pencegahan lebih awal.
Kata Kunci: data mining, association rule, algoritma apriori, pola penyakit ISPA, puskesmas
bae
Abstract
In the health sector availability of medical records are no longer things that are difficult to obtain, but often this data is only treated as a recording without further processing so it does not have to be for the purposes of the value of the future. Based on recap medical records of 2013 show Acute Respiratory Infections (ARI) become most illnesses experienced by visitors UPTD Puskemas Bae, required special handling solutions as well as to address the problem. One of them is looking for information on the pattern of the disease, such as how the strong relationship between the percentage of sex, age, address of the month check. A technology that can be used in the search pattern or relationship associations from large scale data is data mining association rule with a priori algorithm. Expected from the results of the stages mining process clinics can determine the pattern of spread of respiratory diseases as well as having reference to socializing or counseling about the symptoms, dangers and impact of disease prevention ARI so it can be done earlier.
Keywords: data mining, association rule, algorithm apriori, pattern acute respiratory
infections, puskemas bae
1. PENDAHULUAN
Dalam bidang kesehatan ketersediaan data rekam medis sudah bukan lagi hal yang sulit diperoleh, namun data ini seringkali diperlakukan hanya sebagai rekaman tanpa pengolahan lebih lanjut
sehingga tidak mempunyai nilai guna lebih untuk keperluan masa mendatang. Analisa dari tiap koleksi data rekam medis tersebut akan menghasilkan pengetahuan atau informasi, misalnya berupa pola penyakit atau hubungan
asosiasi yang terjadi pada data, UPTD Puskesmas Bae Kabupaten.
Dengan mengetahui pola penyakit ISPA pada masyarakat maka pihak UPTD Puskemas Bae mempunyai referensi untuk melakukan sosialisasi atau penyuluhan mengenai gejala, bahaya serta dampak dari penyakit Ispa sehingga dapat dilakukan pencegahan lebih awal.
Metode data mining yang bisa digunakan dalam pencarian pola atau hubungan asosiasi dari data yang bersekala besar adalah data mining
association rule. Salah satu algoritma
yang dapat digunakan untuk menemukan associan rule adalah algoritma apriori, Algoritma ini ditujukan untuk mencari kombinasi item-set yang mempunyai suatu nilai keseringan tertentu sesuai kriteria atau filter yang diinginkan. Hasil dari algoritma ini dapat digunakan untuk membantu dalam pengambilan keputusan pihak manajemen.
1.1 Rumusan Masalah
Permasalahan dalam penelitian ini adalah bagaimana membuat suatu aplikasi untuk menghasilkan informasi yang berguna untuk menemukan pola penyebaran penyakit ISPA yang terdiagnosa di UPTD Puskesmas Bae dengan teknik Data Mining Association
Rule menggunakan Algoritma Apriori.
1.2 Tujuan Penelitian
1. Menghasilkan aplikasi untuk mendapatkan informasi pola penyakit ISPA dengan teknik Data
Mining Association Rule
menggunakan Algoritma Apriori. 2. Untuk dimanfaatkan UPTD
Puskesmas Bae sebagai salah satu acuan pengambilan keputusan dalam meningkatkan kualitas pelayanan
kesehatan, kebutuhan obat dan penyuluhan tentang penyakit ISPA 1.3 Manfaat Penelitian
1. Membantu mengetahui pola penyakit ISPA yang diderita oleh masyarakat. 2. Membantu dalam pengambilan
keputusan dan menjadi acuan dalam meningkatkan kualitas pelayanan kesehatan serta ketersediaan obat. 3. Membantu memberikan referensi
untuk melakukan sosialisasi atau penyuluhan mengenai gejala, bahaya serta dampak dari penyakit ISPA sehingga dapat dilakukan pencegahan lebih awal.
2. METODE PENELITIAN 2.1 Metode Pengumpulan Data 1. Studi Pustaka
Studi pustaka merupakan metode pengumpulan data yang dilakukan dengan mencari, membaca dan mengumpulkan dokumen-dokumen sebagai referensi seperti buku, artikel, dan literatur-literatur tugas akhir yang berhubungan dengan topik yang dipilih yang berkaitan dengan objek penelitian.
2. Wawancara
Merupakan jenis pengumpulan data yang dilakukan dengan cara tanya jawab atau dengan cara percakapan langsung terhadap sumber-sumber data yang dibutuhkan dengan maksud tertentu. Dalam hal ini, data diperoleh melalui kegiatan tanya jawab dengan kepala UPTD Puskesmas Bae Kabupaten Kudus. 2.2 Metode Analisis
Berdasarkan data primer dan data sekunder yang telah didapatkan oleh peneliti, maka pembuatan metode
1. Metode Association Rule
a. Mencari kombinasi yang paling sering muncul dari suatu itemset (frequent itemset).
b. Mendefinisikan Association Rule dari frequent itemset yang telah dibuat sebelumnya.
2. Algoritma Apriori
Dalam metodologi analisa asosiasi ini menggunakan :
a. Analisis pola frekuensi tertinggi Tahap ini mencari kombinasi item yang memenuhi syarat minimum dari nilai support dalam database. Nilai support sebuah item diperoleh dengan rumus sebagai berikut.
Support A = Transaksi mengandung A Transaksi Sementara itu, nilai support dari 2 item diperoleh dari rumus berikut.
Support A,B =P A∩B
Support A,B = Σ Mengandung A dan B Σ Transaksi b. Pembentukan Aturan Asosiasi
Setelah semua pola frekuensi tinggi ditemukan, barulah dicari aturan asosiasi yang memenuhi syarat minimum untuk confidence dengan menghitung confidence A → B diperoleh dari rumus berikut
Confidence = P(B|A) Σ Mengandung A dan B Σ Mengandung A
3. HASIL DAN PEMBAHASAN 3.1 Mencari Atribut Pola Penyakit ISPA
Penyakit Infeksi Saluran Pernafasan Akut (ISPA) adalah infeksi saluran pernafasan yang berlangsung sampai 14 hari, yang dimaksud dengan saluran
pernapasan adalah organ mulai dari hidung sampai gelembung paru, beserta organ-organ disekitarnya seperti : sinus, ruang telinga tengah dan selaput paru. Penyakit ISPA ini disebabkan oleh virus dan bakteri, adapun tanda-tanda atau gejala penyakit ISPA adalah badan pegal, sakit kepala, batuk, nyeri tenggorokan, demam ringan, hidung beringus dan sering bersin.
Secara umum kondisi sanitasi rumah serta efek pencemaran udara terhadap saluran pernafasan dapat menyebabkan pergerakan silia hidung menjadi lambat dan kaku bahkan dapat berhenti sehingga tidak dapat membersihkan saluran pernafasan akibat iritasi oleh bahan pencemar. Akibatnya rentan tertular virus dan bakteri, hal ini akan memudahkan terjadinya infeksi saluran pernafasan.
Bedasarkan penjelasan diatas penulis menggunakan beberapa atribut yang tersedia dalam data rekam medis untuk menghubungkan atribut yang dapat digunakan dalam association rule yaitu jenis kelamin, umur, alamat, bulan periksa.
Mengingat banyaknya umur, untuk memudahkan pengelompokan maka akan dibuat kategori pasien bedasarkan umur sebagai berikut:
No Umur Kategori 1. Umur <5 Balita 2. Umur 6-11 Kanak-kanak 3. Umur 12-15 Remaja Awal 4. Umur 16-25 Remaja Akhir 5. Umur 26-35 Dewasa Awal 6. Umur 36-45 Dewasa Akhir 7. Umur 46-55 Lansia Awal 8. Umur 56-65 Lansia Akhir 9. Umur 65> Manula
3.2 Algoritm Apriori
Metodelogi dasar analisis asosiasi di bagi menjadi dua tahap :
1. Analisis pola frekuensi tertinggi Tahap ini mencari kombinasi item yang memenuhi syarat minimum dari nilai suport dalam database. Nilai
support sebuah item diperoleh
dengan rumus berikut :
Support (A) Transaksi mengandung A
Transaksi
Melihat rumus diatas Support A dapat dimisalkan dengan atribut Laki-laki dan jika diterapkan sebagai berikut :
Support Laki-laki = Memuat Laki-laki Transaksi Transaksi dalam hal ini adalah transaksi data rekam medis pasien setiap mereka berobat di Puskesmas. Sementara itu nilai support dari 2 item diperoleh dari rumus berikut.
Support (A,B) = P ( A ∩ B )
Support A,B = ΣMengandung A dan B
Σ Transaksi
2. Pembentukan aturan asosiasi
Setelah pola frekuensi tinggi ditemukan barulah dicari aturan asosiasi yang memenuhi syarat minimum untuk confidence dengan menghitung confidence aturan asosiatif A→B
Nilai Confidence dari aturan A→B diperoleh dari rumus berikut.
𝑪𝒐𝒏𝒇𝒊𝒅𝒆𝒏𝒄𝒆 𝑃 𝐵 𝐴 =𝛴 𝑀𝑒𝑛𝑔𝑎𝑛𝑑𝑢𝑛𝑔 𝐴 𝑑𝑎𝑛 𝐵
𝛴 𝑀𝑒𝑛𝑔𝑎𝑛𝑑𝑢𝑛𝑔 𝐴
3.3 Pengembangan Dan Analisa Sistem
1. Flow Chart Diagram
2 Pemodelan Fungsi
Pemodelan fungsi digambarkan dengan Context Diagram, DFD (Data Flow
Diagram).
a. Context Diagram
Gambar 3.2 Context Diagram Gambar diatas merupakan Context Diagram pada Aplikasi Data Mining yang terdiri dari 1 input dan 1
output. External entity berupa
pengguna atau user dan 1 file data yaitu data rekam medis.
b. DFD Level 0
Tahapan proses Data Mining yang dipecah menjadi beberapa proses kecil guna menjelaskan fungsi dan arus data yang mengalur pada Aplikasi Data Mining. :
1. User
Dimulai user yang bertugas menginputkan data rekam medis dan menerima informasi berupa pola penyakit.
2. Import Data
Proses load data dari data rekam medis ke database data mining. Dalam hal ini data rekam medis berbentuk data file excel 2003 kemudian diimport menjadi sebuah database.
3. Generate frequent Itemsets Tahap pembentukan aturan asosiasi dan menemukan rule potensial dari kombinasi itemset. 3.4 Pembahasan dan Implementasi 1. Data Rekam Medis Puskesmas
Tahun 2013
Data rekam medis yang akan diproses berjumlah 3.208 transaksi dan sudah diseleksi bedasarkan kebutuhan sistem.
2. Tampilan Halaman Utama
3. Tampilan Hasil Import Data Excel ke Database
4. Tampilan Hasil Proses Data Mining
Gambar 3.5 Tampilan Halaman Utama Gambar 3.3 DFD Level-0
Gambar 3.4 Data Rekam Medis
Gambar 3.6 Hasil Import Data Excel ke Database
5. Tampilan Halaman Perhitungan (Iterasi 1-4)
Pada halaman proses penghitungan data mining diatas dapat disimpulkan dengan mengambil hasil terbanyak nilai support & confidence berdasarkan bulan periksa dari setiap iterasi bisa dilihat pada tabel dibawah ini:
4. KESIMPULAN
Dalam pembuatan laporan tugas akhir ini dan pembahasan yang sudah diuraikan sebelumnya, maka Penulis dapat menarik beberapa kesimpulan, yaitu:
1. Bedasarkan tahapan proses mining menggunakan aplikasi data mining dengan total kasus penyakit ISPA sebanyak : 3.208 memakai atribut jenis kelamin, umur, alamat dan bulan periksa didapat informasi pola
penyakit ISPA disetiap iterasi antara lain :
a. Iterasi kedua diperoleh : Remaja Akhir→April [support 3,9 / confidence 65,3] bisa diartikan dari total kunjungan pasien ISPA terdapat 3,9% yang mengandung atribut (Remaja Akhir,April) dan mempunyai nilai kepastian 65,3% maka pasien tersebut akan berobat pada bulan April.
b. Iterasi ketiga diperoleh : Kanak-kanak,Bae→Januari [support 4,6 / confidence 66,4] bisa diartikan dari total kunjungan pasien ISPA terdapat 4,6% yang mengandung atribut (Kanak-kanak,Bae,Januari) dan mempunyai nilai kepastian 66,4% pasien kanak-kanak alamat desa Bae maka akan berobat pada bulan Januari.
c. Iterasi keempat diperoleh : P,Kanak-kanak,Bae→Januari [support 3,4 / confidence 89,4] bisa diartikan dari total kunjungan pasien ISPA terdapat 3,4% yang mengandung atribut (P,Kanak-kanak,Bae,Januari) dan mempunyai nilai kepastian 89,4% pasien perempuan, kanak-kanak alamat desa Bae maka akan berobat pada bulan Januari.
2. Informasi yang di dapat dari pengolahan data mining bisa digunakan antara lain :
a. Membantu UPTD Puskesmas Bae dalam pengambilan keputusan dan menjadi acuan dalam meningkatkan kualitas pelayanan kesehatan serta ketersediaan obat.
b. Dari hasil mining tersebut pihak Puskesmas memperoleh referensi sebagai acuan melakukan penyuluhan mengenai gejala, bahaya serta dampak dari penyakit ISPA kepada masyarakat
Tabel 3.2 Hasil Penghitungan Gambar 3.8 Proses Penghitungan
DAFTAR PUSTAKA
*Kusrini, Luthfi Emha Taufiq, 2009,
Algoritma Data Mining. Yogyakarta.
C.V Andi Offset
*Jogiyanto HM, 2005, Analisis dan
Desain. Yogyakarta : CV.Andi Offset
*Fathansyah, Ir, 2001, Basis Data. Bandung: CV. Informatika.
*Sani Susanto, Dedy Suryadi, 2010,
Pengantar Data Mining Menggali Pengetahuan dari Bongkahan Data.
Bandung. CV. Andi Offset.
*haniif, 2007, Association rule,[online],
http://haniif.wordpress.com/tag/associat ion-rule/, diakses tanggal 04 Juli 2014) *Larose, Daniel T.(2005).Discovering
Knowledge in Data: an Introduction to Data Mining.John Willey and Sons, Inc.
*Iman Hermanto, Teguh, 2013, Data
mining menggunakan algoritma apriori sebagai alat bantu penentuan pola konsumen pada E-commerce moshi-moshi petshop.
*http://www.smallcrab.com/kesehatan/4 23-tanda-dan-pengobatan-ispa diakses tanggal 07 Desember 2014.
*Kadir, Abdul, 2008, Dasar
pemrograman web dinamis
menggunakan PHP(revisi). Yogyakarta:
CV. Andi Offset
*Hakim, Lukmanul, 2008, Membongkar
Trik Rahasia Master PHP, Yogyakarta,
penerbit: Lokomedia
*Pane, Kartika, Dewi, 2013,
Implementasi Data Mining Pada
Penjualan Produk Elektronik Dengan Algoritma Apriori (Studi Kasus : Kreditplus)
*Lestari, Tri, 2009, Analisis Keranjang
Belanja Pada Data Transaksi
Penjualan(Studi Kasus Toserba Yogya Banjar).