Information Extraction Data Rekam Medis Pasien Untuk Perolehan Association Rule Sebagai Pendukung Pengambilan Keputusan

(1)

456

Information Extraction Data Rekam Medis Pasien Untuk Perolehan

Association Rule Sebagai Pendukung Pengambilan Keputusan

Kemal Farouq Mauladi*)

*)

Fakultas Teknik, Prodi Teknik Informatika Universitas Islam Lamongan Email : [email protected]

Abstrak – Rekam medis adalah keterangan baik yang tertulis maupun terekam tentang identitas, anamnesa, penentuan fisik, laboratorium, diagnosa segala pelayanan dan tindakan medik yang diberikan kepada pasien dan pengobatan baik yang dirawat inap, rawat jalan maupun yang mendapatkan pelayanan gawat darurat. Rekam medis mempunyai pengertian yang sangat luas, tidak hanya sekedar kegiatan pencatatan, akan tetapi mempunyai pengertian sebagai suatu sistem penyelenggaraan rekam medis yaitu mulai pencatatan selama pasien mendapatkan pelayanan medik, dilanjutkan dengan penanganan berkas rekam medis yang meliputi penyelenggaraan penyimpanan serta pengeluaran berkas dari tempat penyimpanan untuk melayani permintaan atau peminjaman apabila dari pasien atau untuk keperluan lainnya.

Akhirnya dilakukan penegakkan diagnosa dan sesuai kebutuhan, pasien tersebut diberi obat atau tindakan medis lainnya kesemua pelayanan kesehatan ini dicatat dalam kartu atau status rekam medis. Yang nantinya dari dokumen kartu rekam medis akan diiputkan kedalam data base komputer untuk penyimpanan data yang lebih efisien dan lebih rapi, untuk kemudian akan dioalah dengan data mining untuk mengetahui extraction information dalam puskemas mantup dapat menentukan perolehan association rule dalam pengambilan keputusan di poliklinik puskesmas.

Kata kunci – Dokumen Rekam medis, Extarction Infrmation, Assosiation Rule.

I. Pendahuluan

Perkembangan penggunaan informasi yang cukup tinggi khususnya informasi dalam bentuk teks dokumen menyebabkan kesulitan dalam proses

menemukan kembali informasi, sehingga

diperlukan suatu cara pendeteksian kemiripan dokumen untuk mendapatkan dokumen yang relevan dan sesuai dengan permintaan pengguna.

Proses pendeteksian kemiripan dokumen

merupakan pencarian kesamaan beberapa dokumen dengan membandingkan isi dokumen sehingga menghasilkan bobot atau nilai kemiripan dari dokumen yang dibandingkan. Salah satu kegunaan perbandingan isi dokumen adalah untuk membantu pengguna dalam pengelompokan dokumen dan juga memungkinkan pengguna mengetahui apakah isi dokumen yang satu merupakan dokumen yang pada dasarnya sama dengan dokumen yang lain.

Rumah sakit merupakan tempat dimana orang sakit mencari dan menerima perawatan, pernyatan ini berarti bahwa rumah sakit berperan sebagai tempat pemberi pelayanan kesehatan. Di Rumah Sakit terdapat unit-unit atau instalasi pelayanan kesehatan antara lain: Unit Gawat Darurat, Unit Rawat Inap, unit pelayanan penunjang medis dan unit pelayanan lain termasuk poliklinik. Poliklinik merupakan salah satu instalasi kesehatan langsung kepada pasien, informasi medis hasil dari

anamnesa, riwayat penyakit, pemeriksaan fisik, diagnosa, terapi, dan tindakan poliklinik mulai diperoleh. Catatan-catatan tersebut direkam dalam dokumen rekam medis pasien.

Teknik data mining telah digunakan untuk melakukan discover (penemuan) pengetahuan biologis, drug discovery, dan perawatan pasien serta pola yang menggunakan metode analisis statistik,

pembelajaran mesin (macine learning), dan jaringan saraf tiruan pilihan.

II. Information Extraction

Informasi Ekstraksi (IE) adalah suatu proses pemilihan dan pengambilan informasi terstruktur seperti entitas, hubungan antar entitas dan atribut-atribut yang mendeskripsikan entitas dari suatu sumber tak terstruktur (unstructured). Informasi ekstraksi dapat dikatakan sebagai tugas pengisian template informasi pada suatu domain yang telah

ditentukan sebelumnya pekerjaan informasi

ekstraksi meliputi klasifikasi semantik dan dapat dikatakan sebagai bagian dari pemahaman teks himpunan awal dari dokumen yang akan diekstrak

dapat direduksi menggunakan teknik-tenik

information retrieval (IR). Contoh dari informasi tak terstruktur adalah plain text seperti artikel surat kabar secara garis besar terdapat dua pendekatan

(2)

458

yang digunakan dalam sistem informasi ekstraksi, yaitu :

1. Knowledge Engineering (KE)

Pada pendekatan ini, pengembang sistem harus sangat memahami kebutuhan domain aplikasi dan fungsi dari sistem informasi ekstraksi yang dirancang. Pengembang fokus

pada pendefinisian aturan (rules) yang

digunakan untuk mengekstrak informasi yang relevan teks masukan untuk sistem ini adalah corpus berupa teks mentah. Pengetahuan umum atau intuisi diterapkan dalam perancangan atura

kinerja dari sistem informasi ekstraksi

tergantung pada tingkat pengetahuan

pengembang atau pakar yang dilibatkan. Pendekatan KE menggunakan proses iteratif di dalam setiap iterasi, saat sistem berjalan,

beberapa aturan dimodifikasi untuk

meningkatkan kualitas dari sistem. 2. Machine Learning (ML)

Pada pendekatan ini, corpus biasanya dianotasi terlebih dahulu secara otomatis tidak diperlukan pakar pada saat sistem berjalan. Pakar pada domain aplikasi diperlukan hanya pada saat perancangan sistem pengembang memanfaatkan informasi dari pakar untuk menganotasi teks dengan tepat. Teks yang telah dianotasi merupakan input bagi sistem atau modul, yang menjalankan algoritma training terhadapnya. sistem mendapatkan pengetahuan dari teks yang telah dianotasi dan menggunakannya untuk memperoleh informasi tertentu dari teks-teks baru pada domain yang sama.

III Information Retrival

Information Retrival adalah metode dan

prosedur untuk menemukan kembali data yang

tersimpan, kemudian menyediakan informasi

mengenai subyek yang dibutuhkan tindakan tersebut mencakup text indexing, inquiry analysis, dan relevance analysis. Data mencakup teks, tabel, gambar, ucapan, dan video informasi termasuk pengetahuan terkait yang dibutuhkan untuk mendukung penyelesaian masalah dan akuisisi pengetahuan tujuan dari sistem informasi retrival adalah memenuhi kebutuhan informasi pengguna dengan meretrieve semua dokumen yang mungkin relevan, pada waktu yang sama meretrieve sesedikit mungkin dokumen yang tak-relevan.

Pada proses selanjutnya dilakukan ekstraksi sebuah term-term yang terdapat dalam dokumen pada proses ini melibatkan dua operasi utama yang ada dalam informasi retrival diataranya :

1. Penghapusan stopwords. Stopword didefinisikan

sebagai term yang tidak berhubungan

(irrelevant) dengan subyek utama dari database meskipun kata tersebut sering kali hadir di dalam dokumen. Contoh stopwords adalah a, an, the, this, that, these, those, her, his, its, my, our, their, your, all, few, many, several, some, every, for, and, nor, bit, or, yet, so, also, after, although, if, unless, because, on, beneath, over, of, during, beside, dan etc. Stop-words termasuk pula beberapa kata tertentu yang didefinisikan terkait dengan topik database, misal pada database yang menampung daftar karya tulis (paper) penelitian terkait dengan heart diseases, maka kata heart dan disease sebaiknya dihapus. 2. Stemming kata-kata yang muncul di dalam

dokumen sering mempunyai banyak varian morfologik karena itu, setiap kata yang bukan

stopwords direduksi ke bentuk stemmed word

(term) yang cocok. Kata tersebut distem untuk

mendapatkan bentuk akarnya dengan

menghilangkan awalan atau akhiran.

IV. Preprosesing

Informasi ekstraksi dokumen adalah suatu proses pemilihan dan pengambilan informasi terstruktur seperti entitas, hubungan antar entitas dan atribut-atribut yang mendeskripsikan entitas dari suatu sumber tak terstruktur (unstructured) menjadi

terstruktur (structured). Adapun proses

preprosessing yang dilakukan sebagai berikut :

 Tokenization

Tahap tokenization yaitu teks dalam bentuk mentah berupa rangkaian karakter tanpa informasi eksplisit tentang batas kata dan kalimat. Pada proses tokenization dapat membagi urutan karakter menjadi kalimat dan kalimat kedalam token.

 Filtering

Tahap filtering adalah tahap mengambil kata-kata penting dari hasil tokenization pada proses ini algoritma yang digunakan adalah algoritma stop list (membuang kata-kata penting) atau word list (menyimpan kata penting).

 Stemming

Tahap stemming adalah tahap untuk mencari root kata dari tiap kata hasil filtering. Pada tahap ini dilakukan proses pengembalian berbagai kata kedalam suatu representasi.

 Algoritma naive bayes

Pada tahap algoritma naive bayes metode yang digunakan dalam mechine learning yaitu metode dengan perhitungan probabilitas. Pada algoritma naive bayes sering diasumsikan sebagai class

(3)

459

memudahkan dalam perhitungan-perhitungan atau kemunculan suatu term kata dalam suatu kalimat tidak dipengaruhi kemungkinan kata-kata yang lain dalam kalimat padahal dalam kenyataannya bahwa

kemungkinan kata dalam kalimat sangat

dipengaruhi kemungkinan keberadaan kata-kata yang ada dalam kalimat.

Dari data dokumen training setelah tahap preprosessing dan ekstraksi fitur, maka didapat sebuah model probabilistik kata hasil ekstraksi dari masing-masing kategori. Dalam proses berikutnya dilakukan perhitungan dengan mengalikan nilai probabilitas tiap kata yang diambil dari masing-masing dokumen pada proses ini kata yang akan dijadikan traning set adalah kata jenis penyakit.

V Analisa Kebutuhan Data

Dari permasalahan yang muncul maka dapat disimpulkan bahwa dokumen rekam medik pasien di puskesmas membutuhkan suatu sistem berbasis komputer yang dapat membantu pengambilan keputusan dengan menggunakan data dokumen rekam medik pasien secara harian sebagai sumber data awal. Sistem yang dibutuhkan dalam proses informasi ekstraksi dokumen adalah sebagai berikut :

‾ Sistem berbasis data mining, yang dapat menghadirkan informasi lebih dalam pengambil keputusan dengan menggunakan data dokumen rekam medik pasien secara harian di poliklinik puskesmas. Data yang diambil dari dokumen rekam medik pasien selama dua tahun, yaitu dari bulan Januari 2010–Maret 2012. Data tersebut berupa dokumen kartu rekam medik pasien. Sedangkan untuk jumlah dokumen rekam medik pasien dalam penelitian ini ada kurang lebih 15000 dokumen rekam medik pasien.

‾ Sistem menggunakan konsep single-level

association rule, dimana dapat menunjukkan

hubungan keterkaitan antar jenis penyakit yang

diderita oleh pasien didalam poliklinik

puskesmas.

Sistem yang dapat mengintegrasikan semua faktor pengambilan keputusan pada poliklinik untuk menghasilkan informasi. Sistem menggunakan konsep informasi ekstraksi teks, dimana pada proses dokumen rekam medik pasien akan dilakukan preprosessing kedalam sistem.

VI. Association Rule

Association rule mining adalah suatu prosedur yang mencari assosiasi antar item dalam suatu data set yang ditentukan. Interestingness measure yang dapat digunakan dalam data mining adalah :

1.Support, suatu ukuran yang menunjukkan seberapa besar tingkat dominasi suatu item atau itemset dari keseluruhan transaksi.

2.Confidence, suatu ukuran yang menunjukkan hubungan antar dua item secara conditional.

3.Correlation, alternatif lain dalam menemukan

interesting relationship antara itemset data

berdasarkan hubungan atau korelasinya.

VII. Decision Support System

DSS adalah sistem yang memberikan dukungan kepada seorang manajer, atau kepada sekelompok manajer yang relatif kecil yang bekerja sebagai team pemecah masalah, dalam memecahkan masalah semi terstruktur dengan memberikan informasi atau saran mengenai keputusan tertentu.

VIII. Diskripsi Sistem

Sistem yang dibangun adalah sebuah sistem pada sebuah data rekam medis yang terdapat dalam Poliklinik Puskesmas Mantup Kecamatan Mantup Kabupaten Lamongan yang akan digunakan untuk mengetahui data pasien berdasarkan jenis penyakit yang di derita oleh pasien dalam pengambilan keputusan untuk menentukan jenis obat yang akan dikosumsi oleh pasien berdasarkan hasil anamnesa dari dokter. Sistem ini bisa dibedakan menjadi dua ketegori :

1. Proses Training

Proses ini dimulai dari pengumpulan data berupa penginputan dokumen rekam medis kedalam data base yang nantinya akan diproses melalui tahapan information extraction text, algoritma apriori single level, assosication rule dan decision support system untuk masing-masing dokumen rekam medis yang akan dijadikan sebagai data frekuensi item set. 2. Proses Testing.

Proses ini akan menghasilkan hasil dari sebuah klasifikasi pada dokumen rekam medis untuk digunakan proses informasi ekstraksi teks kedalam database yang akan dilakukan proses data mining untuk mengetahui data jenis penyakit pasien yang terdapat dalam Poliklinik Puskesmas Mantup Kecamatan Mantup Kabupaten Lamongan.

IX. Proses Informasi Ekstraksi Teks.

Data yang digunakan sebagai sampel adalah dokumen rekam medis sebanyak 100 dokumen rekam medis pasien yang akan dijadikan data mining adalah sebagai berikut ini :

• No regristrasi kartu rekam medis • Nama pasien

(4)

460

• Umur Pasien • Alamat Pasien • Jenis Peyakit Pasien

proses operasi stopwords langkah selanjutnya dengan menggunakan operasi stemming kata atau kalimat dokumen rekam medis pada proses operasi

stemming setiap kata yang bukan stopwords

direduksi ke bentuk stemmed word (term) yang cocok. Kata tersebut distem untuk mendapatkan bentuk akarnya dengan menghilangkan awalan atau akhiran dengan cara ini, diperoleh kelompok kata yang mempunyai makna serupa tetapi berbeda wujud sintaktis satu dengan lainnya pada proses stemming algoritma yang digunakan adalah

algoritma porter. Pada proses stemming

memperbaiki kalimat atau kata pada jenis penyakit pada kartu rekam medis yang tidak sesuai menjadi kalimat atau kata yang sesuai dengan bahasa ilmiah kesehatan, berikut ini tabel kosakata jenis penyakit dalam proses stemming. kosakata jenis penyakit pada operasi stemming dengan menggunakan algoritma porter maka selanjutnya konversi term ke dalam bentuk umumnya, atau dokumen diekspansi dengan mencarikan sinonim bagi term-term tertentu yang ada di dalamnya. Operasi stemming ini bertujuan untuk menemukan suatu kelompok kata yang saling terkait, berikut ini tabel hasil proses dari stemming. Tabel 9.1 Hasil Stemming NO DOKUMEN PENYAKIT KOSAKATA

1 Batuk Batuk, Atuk,

Bastu, Bastuk

2 Mual Muale

3 Flu Flu, Pilek, Pileg

4 Demam Demam, Emam,

Dema, Meriang

5 Pegelinu Linu, Linu2,

Pegel

6 Pusing Pusing Tujuh

Keliling

Menghitung nilai yang terdapat dalam

association rule mining dengan prosedur untuk mencari nilai assosiasi rule antar item dalam suatu data set yang ditentukan. Interestingness measure yang dapat digunakan didalam data mining adalah sebagai berikut :

a. Support suatu ukuran yang menunjukkan seberapa besar tingkat jenis penyakit yang diderita oleh pasien dalam dokumen rekam medis serta dominasi suatu item atau itemset dari keseluruhan jenis penyakit yang ada.

Support = Jumlah Jenis Penyakit 1,2 X 100% Jumlah Seluruh Jenis Penyakit

Confidence, suatu ukuran yang menunjukkan

hubungan antar dua item secara conditional. Pada proses ini antara satu jenis penyakit dengan yang lainnya yang sering terjadi.

X. Deskripsi Sistem

Desain arsitektur meliputi user atau aktor, data input dan output, sistem, security dan artitektur software yang akan dijelaskan secara mendetail pada bagian dibawah ini.

• User atau Aktor •Input dan Output •Arsitektur Sistem •Arsitektur Software •Desain Interface

XI. Unit Testing

Untuk memperoleh sebuah sistem yang baik harus dilakukan uji coba terhadap sistem, disamping itu uji coba merupakan salah satu hal

penting dalam membangunan sistem yang

berkesinambungan. Unit testing bisa dilakukan dengan dua pendekatan yaitu black box testing dan

white box testing. Pendekatan uji coba

menggunakan white box testing diharapkan memperoleh hasil yang tepat, uji coba ini meliputi :

(5)

461

2. Uji Coba Informasi Ekstraksi

XII. Dokumentasi Hasil Uji Coba

Berdasarkan uji coba dengan dokumen

sebanyak 100 dari dokumen rekam medis yang terdapat dalam Poliklinik Puskesmas Mantup Kecamatan Lamongan. Data yang diambil sebagai contoh.

XIII. Kesimpulan

Berdasarkan uji coba terhadap sistem dapat diambil beberapa kesimpulan antara lain :

a. Bahwa informasi ekstraksi dari dokumen rekam medik pasien bisa digunakan mengklasifikasikan jenis penyakit yang diderita berdasarkan keluhan yang disampaikan pasien.

b. Bahwa informasi ekstraksi rekam medik pasien bisa digunakan untuk pengambilan keputusan pada pasien berdasarkan keluhan jenis penyakit pasien.

c. Hasil dari proses mining akan menghasilkan keterkaitan antara jenis penyakit satu dengan jenis penyakit yang lainnya yang sering muncul secara bersamaan.

Guna perbaikan sistem dimasa yang akan datang ada beberapa hal yang perlu diperbaiki antara lain :

a. Hendaknya data dokumen rekam medis

khususnya pada jenis penyakit pasien harap

diperhatikan dalam penulisannya, khususnya kalimat jenis penyakit pasien.

b. Pengembangan sistem dapat menggabungkan beberapa item pada suatu level pilihan user kedalam kelompok-kelompok tertentu. Sehingga memungkinkan pembentukan association rule berdasarkan kelompok item jenis penyakit.

Referensi

Abidi (2001), “Manajemen Pengetahuan dalam Perawatan Kesehatan”, Bandung.

Gregorius Satia Budhi, Yulia, Budiwati Abadi (2011), “Model Rule: Multilevel And Multidimension Association Rule untuk Analisa Market Basket Pada PT. Maha Agung”, Surabaya.

http://library.gunadarma.ac.id/Managerial Decision Making and Decision Support System. 2005, Tanggal akses 15/Oktober/2012

http://digilib.its.ac.id/Information Extraction dan Information Retrieval.2009, Tanggal akses 20/Desember/2012

http://en.wikipedia.org/wiki/Apriori_algorithm.200 6, Tanggal akses 10/agustus/2012.

Iyan Mulyana, Sena Ramadona, Herfina (2009),

“penerapan terms frequency -inverse

document frequency pada sistem peringkasan teks otomatis dokumen tunggal berbahasa indonesia “, Universitas Pakuan

Saliman (2010), “Mengenal Decision Support System”, Jakarta.

Sharon Gondo Diputro (2007), “Rekam Medis dan Sistem Informasi Kesehatan di Pelayanan Kesehatan Primer”, Bandung

(6)