456
Information Extraction Data Rekam Medis Pasien Untuk Perolehan
Association Rule Sebagai Pendukung Pengambilan Keputusan
Kemal Farouq Mauladi*)
*)
Fakultas Teknik, Prodi Teknik Informatika Universitas Islam Lamongan Email : Kemalfarouq_mauladi@yahoo.co.id
Abstrak – Rekam medis adalah keterangan baik yang tertulis maupun terekam tentang identitas, anamnesa, penentuan fisik, laboratorium, diagnosa segala pelayanan dan tindakan medik yang diberikan kepada pasien dan pengobatan baik yang dirawat inap, rawat jalan maupun yang mendapatkan pelayanan gawat darurat. Rekam medis mempunyai pengertian yang sangat luas, tidak hanya sekedar kegiatan pencatatan, akan tetapi mempunyai pengertian sebagai suatu sistem penyelenggaraan rekam medis yaitu mulai pencatatan selama pasien mendapatkan pelayanan medik, dilanjutkan dengan penanganan berkas rekam medis yang meliputi penyelenggaraan penyimpanan serta pengeluaran berkas dari tempat penyimpanan untuk melayani permintaan atau peminjaman apabila dari pasien atau untuk keperluan lainnya.
Akhirnya dilakukan penegakkan diagnosa dan sesuai kebutuhan, pasien tersebut diberi obat atau tindakan medis lainnya kesemua pelayanan kesehatan ini dicatat dalam kartu atau status rekam medis. Yang nantinya dari dokumen kartu rekam medis akan diiputkan kedalam data base komputer untuk penyimpanan data yang lebih efisien dan lebih rapi, untuk kemudian akan dioalah dengan data mining untuk mengetahui extraction information dalam puskemas mantup dapat menentukan perolehan association rule dalam pengambilan keputusan di poliklinik puskesmas.
Kata kunci – Dokumen Rekam medis, Extarction Infrmation, Assosiation Rule.
I. Pendahuluan
Perkembangan penggunaan informasi yang cukup tinggi khususnya informasi dalam bentuk teks dokumen menyebabkan kesulitan dalam proses
menemukan kembali informasi, sehingga
diperlukan suatu cara pendeteksian kemiripan dokumen untuk mendapatkan dokumen yang relevan dan sesuai dengan permintaan pengguna.
Proses pendeteksian kemiripan dokumen
merupakan pencarian kesamaan beberapa dokumen dengan membandingkan isi dokumen sehingga menghasilkan bobot atau nilai kemiripan dari dokumen yang dibandingkan. Salah satu kegunaan perbandingan isi dokumen adalah untuk membantu pengguna dalam pengelompokan dokumen dan juga memungkinkan pengguna mengetahui apakah isi dokumen yang satu merupakan dokumen yang pada dasarnya sama dengan dokumen yang lain.
Rumah sakit merupakan tempat dimana orang sakit mencari dan menerima perawatan, pernyatan ini berarti bahwa rumah sakit berperan sebagai tempat pemberi pelayanan kesehatan. Di Rumah Sakit terdapat unit-unit atau instalasi pelayanan kesehatan antara lain: Unit Gawat Darurat, Unit Rawat Inap, unit pelayanan penunjang medis dan unit pelayanan lain termasuk poliklinik. Poliklinik merupakan salah satu instalasi kesehatan langsung kepada pasien, informasi medis hasil dari
anamnesa, riwayat penyakit, pemeriksaan fisik, diagnosa, terapi, dan tindakan poliklinik mulai diperoleh. Catatan-catatan tersebut direkam dalam dokumen rekam medis pasien.
Teknik data mining telah digunakan untuk melakukan discover (penemuan) pengetahuan biologis, drug discovery, dan perawatan pasien serta pola yang menggunakan metode analisis statistik,
pembelajaran mesin (macine learning), dan jaringan saraf tiruan pilihan.
II. Information Extraction
Informasi Ekstraksi (IE) adalah suatu proses pemilihan dan pengambilan informasi terstruktur seperti entitas, hubungan antar entitas dan atribut-atribut yang mendeskripsikan entitas dari suatu sumber tak terstruktur (unstructured). Informasi ekstraksi dapat dikatakan sebagai tugas pengisian template informasi pada suatu domain yang telah
ditentukan sebelumnya pekerjaan informasi
ekstraksi meliputi klasifikasi semantik dan dapat dikatakan sebagai bagian dari pemahaman teks himpunan awal dari dokumen yang akan diekstrak
dapat direduksi menggunakan teknik-tenik
information retrieval (IR). Contoh dari informasi tak terstruktur adalah plain text seperti artikel surat kabar secara garis besar terdapat dua pendekatan
458
yang digunakan dalam sistem informasi ekstraksi, yaitu :
1. Knowledge Engineering (KE)
Pada pendekatan ini, pengembang sistem harus sangat memahami kebutuhan domain aplikasi dan fungsi dari sistem informasi ekstraksi yang dirancang. Pengembang fokus
pada pendefinisian aturan (rules) yang
digunakan untuk mengekstrak informasi yang relevan teks masukan untuk sistem ini adalah corpus berupa teks mentah. Pengetahuan umum atau intuisi diterapkan dalam perancangan atura
kinerja dari sistem informasi ekstraksi
tergantung pada tingkat pengetahuan
pengembang atau pakar yang dilibatkan. Pendekatan KE menggunakan proses iteratif di dalam setiap iterasi, saat sistem berjalan,
beberapa aturan dimodifikasi untuk
meningkatkan kualitas dari sistem. 2. Machine Learning (ML)
Pada pendekatan ini, corpus biasanya dianotasi terlebih dahulu secara otomatis tidak diperlukan pakar pada saat sistem berjalan. Pakar pada domain aplikasi diperlukan hanya pada saat perancangan sistem pengembang memanfaatkan informasi dari pakar untuk menganotasi teks dengan tepat. Teks yang telah dianotasi merupakan input bagi sistem atau modul, yang menjalankan algoritma training terhadapnya. sistem mendapatkan pengetahuan dari teks yang telah dianotasi dan menggunakannya untuk memperoleh informasi tertentu dari teks-teks baru pada domain yang sama.
III Information Retrival
Information Retrival adalah metode dan
prosedur untuk menemukan kembali data yang
tersimpan, kemudian menyediakan informasi
mengenai subyek yang dibutuhkan tindakan tersebut mencakup text indexing, inquiry analysis, dan relevance analysis. Data mencakup teks, tabel, gambar, ucapan, dan video informasi termasuk pengetahuan terkait yang dibutuhkan untuk mendukung penyelesaian masalah dan akuisisi pengetahuan tujuan dari sistem informasi retrival adalah memenuhi kebutuhan informasi pengguna dengan meretrieve semua dokumen yang mungkin relevan, pada waktu yang sama meretrieve sesedikit mungkin dokumen yang tak-relevan.
Pada proses selanjutnya dilakukan ekstraksi sebuah term-term yang terdapat dalam dokumen pada proses ini melibatkan dua operasi utama yang ada dalam informasi retrival diataranya :
1. Penghapusan stopwords. Stopword didefinisikan
sebagai term yang tidak berhubungan
(irrelevant) dengan subyek utama dari database meskipun kata tersebut sering kali hadir di dalam dokumen. Contoh stopwords adalah a, an, the, this, that, these, those, her, his, its, my, our, their, your, all, few, many, several, some, every, for, and, nor, bit, or, yet, so, also, after, although, if, unless, because, on, beneath, over, of, during, beside, dan etc. Stop-words termasuk pula beberapa kata tertentu yang didefinisikan terkait dengan topik database, misal pada database yang menampung daftar karya tulis (paper) penelitian terkait dengan heart diseases, maka kata heart dan disease sebaiknya dihapus. 2. Stemming kata-kata yang muncul di dalam
dokumen sering mempunyai banyak varian morfologik karena itu, setiap kata yang bukan
stopwords direduksi ke bentuk stemmed word
(term) yang cocok. Kata tersebut distem untuk
mendapatkan bentuk akarnya dengan
menghilangkan awalan atau akhiran.
IV. Preprosesing
Informasi ekstraksi dokumen adalah suatu proses pemilihan dan pengambilan informasi terstruktur seperti entitas, hubungan antar entitas dan atribut-atribut yang mendeskripsikan entitas dari suatu sumber tak terstruktur (unstructured) menjadi
terstruktur (structured). Adapun proses
preprosessing yang dilakukan sebagai berikut :
Tokenization
Tahap tokenization yaitu teks dalam bentuk mentah berupa rangkaian karakter tanpa informasi eksplisit tentang batas kata dan kalimat. Pada proses tokenization dapat membagi urutan karakter menjadi kalimat dan kalimat kedalam token.
Filtering
Tahap filtering adalah tahap mengambil kata-kata penting dari hasil tokenization pada proses ini algoritma yang digunakan adalah algoritma stop list (membuang kata-kata penting) atau word list (menyimpan kata penting).
Stemming
Tahap stemming adalah tahap untuk mencari root kata dari tiap kata hasil filtering. Pada tahap ini dilakukan proses pengembalian berbagai kata kedalam suatu representasi.
Algoritma naive bayes
Pada tahap algoritma naive bayes metode yang digunakan dalam mechine learning yaitu metode dengan perhitungan probabilitas. Pada algoritma naive bayes sering diasumsikan sebagai class
459
memudahkan dalam perhitungan-perhitungan atau kemunculan suatu term kata dalam suatu kalimat tidak dipengaruhi kemungkinan kata-kata yang lain dalam kalimat padahal dalam kenyataannya bahwa
kemungkinan kata dalam kalimat sangat
dipengaruhi kemungkinan keberadaan kata-kata yang ada dalam kalimat.
Dari data dokumen training setelah tahap preprosessing dan ekstraksi fitur, maka didapat sebuah model probabilistik kata hasil ekstraksi dari masing-masing kategori. Dalam proses berikutnya dilakukan perhitungan dengan mengalikan nilai probabilitas tiap kata yang diambil dari masing-masing dokumen pada proses ini kata yang akan dijadikan traning set adalah kata jenis penyakit.
V Analisa Kebutuhan Data
Dari permasalahan yang muncul maka dapat disimpulkan bahwa dokumen rekam medik pasien di puskesmas membutuhkan suatu sistem berbasis komputer yang dapat membantu pengambilan keputusan dengan menggunakan data dokumen rekam medik pasien secara harian sebagai sumber data awal. Sistem yang dibutuhkan dalam proses informasi ekstraksi dokumen adalah sebagai berikut :
‾ Sistem berbasis data mining, yang dapat menghadirkan informasi lebih dalam pengambil keputusan dengan menggunakan data dokumen rekam medik pasien secara harian di poliklinik puskesmas. Data yang diambil dari dokumen rekam medik pasien selama dua tahun, yaitu dari bulan Januari 2010–Maret 2012. Data tersebut berupa dokumen kartu rekam medik pasien. Sedangkan untuk jumlah dokumen rekam medik pasien dalam penelitian ini ada kurang lebih 15000 dokumen rekam medik pasien.
‾ Sistem menggunakan konsep single-level
association rule, dimana dapat menunjukkan
hubungan keterkaitan antar jenis penyakit yang
diderita oleh pasien didalam poliklinik
puskesmas.
Sistem yang dapat mengintegrasikan semua faktor pengambilan keputusan pada poliklinik untuk menghasilkan informasi. Sistem menggunakan konsep informasi ekstraksi teks, dimana pada proses dokumen rekam medik pasien akan dilakukan preprosessing kedalam sistem.
VI. Association Rule
Association rule mining adalah suatu prosedur yang mencari assosiasi antar item dalam suatu data set yang ditentukan. Interestingness measure yang dapat digunakan dalam data mining adalah :
1.Support, suatu ukuran yang menunjukkan seberapa besar tingkat dominasi suatu item atau itemset dari keseluruhan transaksi.
2.Confidence, suatu ukuran yang menunjukkan hubungan antar dua item secara conditional.
3.Correlation, alternatif lain dalam menemukan
interesting relationship antara itemset data
berdasarkan hubungan atau korelasinya.
VII. Decision Support System
DSS adalah sistem yang memberikan dukungan kepada seorang manajer, atau kepada sekelompok manajer yang relatif kecil yang bekerja sebagai team pemecah masalah, dalam memecahkan masalah semi terstruktur dengan memberikan informasi atau saran mengenai keputusan tertentu.
VIII. Diskripsi Sistem
Sistem yang dibangun adalah sebuah sistem pada sebuah data rekam medis yang terdapat dalam Poliklinik Puskesmas Mantup Kecamatan Mantup Kabupaten Lamongan yang akan digunakan untuk mengetahui data pasien berdasarkan jenis penyakit yang di derita oleh pasien dalam pengambilan keputusan untuk menentukan jenis obat yang akan dikosumsi oleh pasien berdasarkan hasil anamnesa dari dokter. Sistem ini bisa dibedakan menjadi dua ketegori :
1. Proses Training
Proses ini dimulai dari pengumpulan data berupa penginputan dokumen rekam medis kedalam data base yang nantinya akan diproses melalui tahapan information extraction text, algoritma apriori single level, assosication rule dan decision support system untuk masing-masing dokumen rekam medis yang akan dijadikan sebagai data frekuensi item set. 2. Proses Testing.
Proses ini akan menghasilkan hasil dari sebuah klasifikasi pada dokumen rekam medis untuk digunakan proses informasi ekstraksi teks kedalam database yang akan dilakukan proses data mining untuk mengetahui data jenis penyakit pasien yang terdapat dalam Poliklinik Puskesmas Mantup Kecamatan Mantup Kabupaten Lamongan.
IX. Proses Informasi Ekstraksi Teks.
Data yang digunakan sebagai sampel adalah dokumen rekam medis sebanyak 100 dokumen rekam medis pasien yang akan dijadikan data mining adalah sebagai berikut ini :
• No regristrasi kartu rekam medis • Nama pasien
460
• Umur Pasien • Alamat Pasien • Jenis Peyakit Pasien
proses operasi stopwords langkah selanjutnya dengan menggunakan operasi stemming kata atau kalimat dokumen rekam medis pada proses operasi
stemming setiap kata yang bukan stopwords
direduksi ke bentuk stemmed word (term) yang cocok. Kata tersebut distem untuk mendapatkan bentuk akarnya dengan menghilangkan awalan atau akhiran dengan cara ini, diperoleh kelompok kata yang mempunyai makna serupa tetapi berbeda wujud sintaktis satu dengan lainnya pada proses stemming algoritma yang digunakan adalah
algoritma porter. Pada proses stemming
memperbaiki kalimat atau kata pada jenis penyakit pada kartu rekam medis yang tidak sesuai menjadi kalimat atau kata yang sesuai dengan bahasa ilmiah kesehatan, berikut ini tabel kosakata jenis penyakit dalam proses stemming. kosakata jenis penyakit pada operasi stemming dengan menggunakan algoritma porter maka selanjutnya konversi term ke dalam bentuk umumnya, atau dokumen diekspansi dengan mencarikan sinonim bagi term-term tertentu yang ada di dalamnya. Operasi stemming ini bertujuan untuk menemukan suatu kelompok kata yang saling terkait, berikut ini tabel hasil proses dari stemming. Tabel 9.1 Hasil Stemming NO DOKUMEN PENYAKIT KOSAKATA
1 Batuk Batuk, Atuk,
Bastu, Bastuk
2 Mual Muale
3 Flu Flu, Pilek, Pileg
4 Demam Demam, Emam,
Dema, Meriang
5 Pegelinu Linu, Linu2,
Pegel
6 Pusing Pusing Tujuh
Keliling
Menghitung nilai yang terdapat dalam
association rule mining dengan prosedur untuk mencari nilai assosiasi rule antar item dalam suatu data set yang ditentukan. Interestingness measure yang dapat digunakan didalam data mining adalah sebagai berikut :
a. Support suatu ukuran yang menunjukkan seberapa besar tingkat jenis penyakit yang diderita oleh pasien dalam dokumen rekam medis serta dominasi suatu item atau itemset dari keseluruhan jenis penyakit yang ada.
Support = Jumlah Jenis Penyakit 1,2 X 100% Jumlah Seluruh Jenis Penyakit
Confidence, suatu ukuran yang menunjukkan
hubungan antar dua item secara conditional. Pada proses ini antara satu jenis penyakit dengan yang lainnya yang sering terjadi.
X. Deskripsi Sistem
Desain arsitektur meliputi user atau aktor, data input dan output, sistem, security dan artitektur software yang akan dijelaskan secara mendetail pada bagian dibawah ini.
• User atau Aktor •Input dan Output •Arsitektur Sistem •Arsitektur Software •Desain Interface
XI. Unit Testing
Untuk memperoleh sebuah sistem yang baik harus dilakukan uji coba terhadap sistem, disamping itu uji coba merupakan salah satu hal
penting dalam membangunan sistem yang
berkesinambungan. Unit testing bisa dilakukan dengan dua pendekatan yaitu black box testing dan
white box testing. Pendekatan uji coba
menggunakan white box testing diharapkan memperoleh hasil yang tepat, uji coba ini meliputi :
461
2. Uji Coba Informasi Ekstraksi
XII. Dokumentasi Hasil Uji Coba
Berdasarkan uji coba dengan dokumen
sebanyak 100 dari dokumen rekam medis yang terdapat dalam Poliklinik Puskesmas Mantup Kecamatan Lamongan. Data yang diambil sebagai contoh.
XIII. Kesimpulan
Berdasarkan uji coba terhadap sistem dapat diambil beberapa kesimpulan antara lain :
a. Bahwa informasi ekstraksi dari dokumen rekam medik pasien bisa digunakan mengklasifikasikan jenis penyakit yang diderita berdasarkan keluhan yang disampaikan pasien.
b. Bahwa informasi ekstraksi rekam medik pasien bisa digunakan untuk pengambilan keputusan pada pasien berdasarkan keluhan jenis penyakit pasien.
c. Hasil dari proses mining akan menghasilkan keterkaitan antara jenis penyakit satu dengan jenis penyakit yang lainnya yang sering muncul secara bersamaan.
Guna perbaikan sistem dimasa yang akan datang ada beberapa hal yang perlu diperbaiki antara lain :
a. Hendaknya data dokumen rekam medis
khususnya pada jenis penyakit pasien harap
diperhatikan dalam penulisannya, khususnya kalimat jenis penyakit pasien.
b. Pengembangan sistem dapat menggabungkan beberapa item pada suatu level pilihan user kedalam kelompok-kelompok tertentu. Sehingga memungkinkan pembentukan association rule berdasarkan kelompok item jenis penyakit.
Referensi
Abidi (2001), “Manajemen Pengetahuan dalam Perawatan Kesehatan”, Bandung.
Gregorius Satia Budhi, Yulia, Budiwati Abadi (2011), “Model Rule: Multilevel And Multidimension Association Rule untuk Analisa Market Basket Pada PT. Maha Agung”, Surabaya.
http://library.gunadarma.ac.id/Managerial Decision Making and Decision Support System. 2005, Tanggal akses 15/Oktober/2012
http://digilib.its.ac.id/Information Extraction dan Information Retrieval.2009, Tanggal akses 20/Desember/2012
http://en.wikipedia.org/wiki/Apriori_algorithm.200 6, Tanggal akses 10/agustus/2012.
Iyan Mulyana, Sena Ramadona, Herfina (2009),
“penerapan terms frequency -inverse
document frequency pada sistem peringkasan teks otomatis dokumen tunggal berbahasa indonesia “, Universitas Pakuan
Saliman (2010), “Mengenal Decision Support System”, Jakarta.
Sharon Gondo Diputro (2007), “Rekam Medis dan Sistem Informasi Kesehatan di Pelayanan Kesehatan Primer”, Bandung