• Tidak ada hasil yang ditemukan

PENGENALAN CITRA TULISAN TANGAN DOKTER DENGAN MENGGUNAKAN SVM DAN FILTER GABOR

N/A
N/A
Protected

Academic year: 2022

Membagikan "PENGENALAN CITRA TULISAN TANGAN DOKTER DENGAN MENGGUNAKAN SVM DAN FILTER GABOR"

Copied!
5
0
0

Teks penuh

(1)

PENGENALAN CITRA TULISAN TANGAN DOKTER DENGAN MENGGUNAKAN SVM DAN FILTER GABOR

Angga Lisdiyanto(1), Lukman Zaman P.C.S.W (2) Teknik Informatika, Universitas Islam Lamongan (1) Teknik Informatika, Sekolah Tinggi Teknik Surabaya (2) e-mail: angga.lisdiyanto@hotmail.co.id (1), lz@stts.edu(2)

ABSTRAK

Agar informasi yang diberikan Dokter dapat didokumentasikan dengan baik, maka diperlukan sistem komputer untuk dapat mengenali dan membaca tulisan tangan Dokter secara digital. Tulisan tangan Dokter berbeda dengan tulisan tangan orang lain pada umumnya. Tulisan tangan dokter memiliki kode/simptoma khusus dan dituntut untuk menulis dengan cepat. Sehingga setiap coretan tulisan tangan Dokter perlu dikenali sebagai simbol. Filter Gabor diperlukan untuk klasifikasi dalam penelitian ini. Filter Gabor berguna untuk ekstraksi fitur-fitur citra. Kemudian SVM digunakan untuk proses klasifikasi, sehingga dapat mengetahui istilah/simptoma apa dari setuap citra coretan tulisan tangan Dokter. Pengenalan citra tulisan tangan dilakuan dengan cara memotong citra kertas cetak resep untuk mendapatkan area tulisan. Setelah mendapatkan potongan area tulisan, maka dipotong lagi per baris kalimat. Setelah mendapatkan potongan per baris kalimat, dipotong lagi menjadi potongan per kata. Kemudian pada setiap potongan citra kata dikonvolusikan dengan delapan filter Gabor (empat macam orientasi dengan dua macam skala) untuk menghasilkan fitur-fitur citra. Setelah menghasilkan fitur-fitur per potongan citra setiap kata, kemudian dimensi fitur dikurangi dengan menggunakan PCA. Lalu dilakukan proses klasifikasi menggunakan SVM untuk data latih dan data tes. Penelitian ini menunjukan bahwa SVM dipengaruhi oleh pemilihan fungsi kernel RBF, Linear dan Polynomial. Hasil akurasi dari klasifikasi SVM menggunakan fungsi kernel RBF adalah 12.1, Linear 47.1%, dan Polynomial 65.5%.

Kata kunci: Pengenalan Tulisan Tangan, Resep Dokter, Filter Gabor, PCA, SVM

LATAR BELAKANG

Pengenalan citra tulisan tangan dilakuan dengan cara mengambil area tulisan, lalu memotong per baris kalimat dan memotong per kata. Kemudian pada setiap potongan citra kata dikonvolusikan dengan delapan filter Gabor (empat macam orientasi dengan dua macam skala) untuk menghasilkan fitur-fitur citra. Metode filter Gabor dipilih karena memiliki hasil yang bagus untuk ekstraksi fitur-fitur karena memiliki parameter berupa frekuensi dan orientasi yang dapat dimodifikasi sesuai kebutuhan. Dengan orientasi yang bermacam-macam, maka tekstur pada citra yang melingkar secara tidak teratur akan menghasilkan konvolusi yang mencolok.

Setelah menghasilkan fitur-fitur per potongan citra setiap kata, kemudian dimensi fitur dikurangi dengan menggunakan PCA. Lalu dilakukan proses klasifikasi menggunakan SVM untuk data latih dan data tes. Metode SVM digunakan karena unggul

untuk memproses data-data yang bersifat multi dimensi dibanding dengan metode-metode klasifikasi lainya.

TUJUAN PENELITIAN

1. Proses pemisahan citra tulisan tangan akan melibatkan pre-processing.

2. Proses pengenalan tulisan tangan sebagai akan melibatkan ekstraksi fitur citra menggunakan filter Gabor dan klasifikasi menggunakan SVM.

HIPOTESA

Hipotesa dan target keberhasilan pada penelitian ini adalah digitalisasi tulisan tangan dokter menggunakan metode Filter Gabor dapat mengekstrak teks tulisan tangan Dokter dengan ketepatan 75%. Pada penelitian sebelumnya, akurasi pengenalan tulisan tangan Dokter mencapai

(2)

87% karena obyek penelitianya berupa tulisan tangan secara online [1]. Sedangkan pada tesis ini menggunakan sistem offline.

TINJAUAN PUSTAKA

Menurut Hermawati (2013, h.228), proyeksi (projection) citra merupakan proses perhitungan satu dimensi isi citra yang dihitung berdasarkan sumbu koordinat. Ada dua jenis projection, yaitu horizontal projection dan vertical projection.

Horizontal projection diperoleh dengan cara menghitung jumlah nilai piksel putih (1) berdasarkan baris citra. Sedangkan vertical projection diperoleh dengan cara menghitung jumlah nilai piksel putih (1) berdasarkan kolom citra. Pemotongan baris teks dapat dilakukan dengan membagi teks ke dalam garis-garis vertikal dan menentukan histogram horizontal projection dari garis-garis tersebut.

Menurut Putra (2010, h.40), filter Gabor adalah salah satu dari operasi filter citra yang bertujuan untuk menghasilkan fitur. Keberhasilan metode filter Gabor bergantung pada variabel (frekuensi) dan (orientasi). Filter Gabor dikembangkan oleh dikembangkan oleh John Daugman pada tahun 1980 menjadi dua dimensi dengan persamaan 2.2 berikut:

( , , , , ) = 1

2. . exp − +

2.

{2. . ( . . cos + . . sin )}

PCA (Principle Component Analysis) adalah teknik statistik yang sangat berguna untuk menemukan pola dalam data dimensi tinggi.

Keuntungan utama dari PCA adalah saat mendapatkan pola dalam data dan mengkompres data tersebut, yaitu dengan mengurangi jumlah dimensi tanpa kehilangan informasi.

SVM (Support Vector Machine) dikembangkan oleh Boser, Guyon, dan Vapnik.

SVM berguna mencari hyperplane yang terbaik pada input space. Fungsi kernel adalah fungsi yang membantu memetakan titik data ke dalam dimensi yang lebih tinggi. Sehingga proses pelatihan menjadi lebih cepat dan mudah.

Fungsi Kernel Linear:

( , ,) = 〈 . ,

Fungsi Kernel Radial Based Function:

( , ,) = exp(− || − || )

Fungsi Kernel Polynomial:

( , ,) = 〈 . ,

Pada k-fold Cross Validation, pelatihan data dilakukan secara acak dibagi menjadi sekitar sejumlah ukuran subset k, dan sebuah kelasifikator dilatih menggunakan subset − 1 dan telah dites menggunakan subset sisanya. Pelatihan diulang hingga k kali dan total perkiraan rekognisi untuk semua subset k yang tidak terdapat dalam data latih harus dihitung. LOO (Leave One Out) adalah kasus spesial dari sebuah Cross Validation ( = − 1) dan k-fold Cross Validation. Untuk teknik klasifikasi lainya, LOO sangat memakan waktu.

Tetapi ketika datanya banyak. Namun pada SVM, harus menerapkan LOO hanya pada support vector.

Ini dikarenakan pada saat menghapus data latih selain dari support vector, data-data tersebut tetap dapat diklasifikasi dengan tepat.

UJI COBA SISTEM

Data yang digunakan citra hasil dari scan kertas cetak resep. Ada empat Dokter yang diminta untuk menulis beberapa kasus medis di kertas cetak resep hingga minimal empat kali. Jumlah kata/simptoma adalah 100. Total data adalah 2592 kata/simptoma.

Pada tahap pre-processing, citra diubah menjadi biner, membalikan warna biner (latar jadi hitam, depan jadi putih), masking citra, menghapus objek kecil/titik piksel tidak penting, dan thinning citra.

Segmentasi tulisan tangan dilakukan dengan memotong baris tulisan dengan menggunakan proyeksi horisontal dan kemudian memotong per kata pada setiap potongan baris tulisan tangan dengan menggunakan proyeksi vertikal.

Ekstraksi fitur dilakukan dengan cara konvolusi citra potongan kata dengan 8 kernel filter Gabor. Kernel filter Gabor terdiri dari θ (3, 5) dan λ (0, 180/4, 180/2, 3*180/4). Kemudian membagi citra potongan citra kata menjadi 64 potong (8x8 piksel) pada setiap. Lalu di setiap 64 potong (8x8 piksel) dirata-ratakan menjadi 1x1 piksel. Maka didapatkan vektor fitur sejumlah 512 dengan cara mengambil seluruh 1x1 piksel dari seluruh piksel pada 8 citra hasil konvolusi dengan urutan piksel yang sama. Terkahir data fitur dinormalisasi menggunakan rumus berikut:

= −

4 + 0,5

(3)

Pada proses pelatihan data, menggunakan teknik PCA untuk mengurangi dimensi fitur dengan parameter komponen yang dijaga = 90% dan centered = true. Kemudan klasifikasi menggunakan teknik SVM multi kelas dengan parameter tiga fungsi kernel (RBF, Linear & Polynomial), teknik multi kelas one-vs-all, 512 fitur dan 2592 data (sampel jumlah fitur/citra potongan kata) dengan 100 kelas. Setiap kelas memiliki minimal 14 sampel. Teknik evaluasi untuk menghitung akurasi dari SVM adalah Cross Validation jenis LOO (Leave-one-out). Teknik Leave-one-out merupakan teknik k-Fold dengan jumlah fold/lipatan sama dengan jumlah data. Sehingga setiap satu data dibandingkan dengan semua data.

Segmentasi memanfaatkan nilai HP (Horizontal Projection) dan VP (Vertical Projection) [5].

Semakin besar nilai jumlah piksel area baris, maka semakin banyak baris yang terpotong. Sehingga jika nilainya semakin besar, maka area baris tulisan dengan nilai HP rendah akan ikut terpotong seperti pada Gambar 1.

Gambar 1. Gagal Segmentasi Baris Terpotong Banyak

Solusi dari hambatan tersebut adalah dengan mengurangi nilai jumlah piksel area baris hingga 0.

Sedangkan bila semakin besar nilai jumlah piksel spasi antar baris, maka semakin sedikit jumlah baris yang terpotong. Maka area baris tulisan dengan nilai HP rendah akan ikut menyatu seperti pada Gambar 2.

Gambar 2. Gagal Segmentasi Baris Menyatu Solusi dari hambatan tersebut adalah dengan mengurangi nilai jumlah piksel spasi antar baris hingga 0. Jika nilai jumlah piksel area baris dengan jumlah piksel spasi antar baris tepat, maka baris

tulisan tangan dapat terpotong dengan benar seperti pada Gambar 3.

Gambar 3. Berhasil Segmentasi Baris Tulisan Semakin besar nilai jumlah piksel area kata, maka semakin banyak kata yang terpotong. Maka area kolom kata dengan nilai VP rendah akan ikut terpotong seperti pada Gambar 4 (baris ketiga).

Gambar 4. Gagal Segmentasi Kata Terpotong Banyak

Solusi dari hambatan tersebut adalah dengan mengurangi nilai jumlah piksel area kata hingga 0.

Semakin besar nilai jumlah piksel spasi antar kata, maka semakin sedikit jumlah kata yang terpotong.

Maka area kata tulisan dengan nilai VP rendah akan ikut menyatu seperti pada Gambar 5.

Gambar 5. Gagal Segmentasi Baris Menyatu Solusi dari hambatan tersebut adalah dengan mengurangi nilai jumlah piksel spasi antar baris hingga 0. Jika nilai jumlah piksel area kata dengan jumlah piksel spasi antar kata tepat, maka kata tulisan tangan dapat terpotong dengan benar seperti pada Gambar 6 (baris ketiga).

Gambar 6. Berhasil Segmentasi Kata

Proses pertama adalah mengkonvolusikan delapam kernel Filter Gabor dengan citra potongan kata [6].

Sehingga dapat menghasilkan delapan citra hasil konvolusi seperti pada Gambar 7 (citra kata keluar).

(4)

Gambar 7. Citra Hasil Konvolusi Proses kedua adalah memecah citra 64x64 piksel menjadi 64 potongan (setiap potong = 8x8 piksel) pada setiap 8 citra seperti pada Gambar 7 (citra kata keluar).

Gambar 7. Citra Hasil Konvolusi Proses ketiga adalah mengambil/ ekstrak setiap 64 potong citra (8x8 piksel) dan meratakan seluruh piksel citra setiap potongan 8x8 piksel menjadi 1x1 piksel seperti pada Gambar 8 (citra kata keluar).

Gambar 8. Visualisasi Rata-rata Potongan Citra 8x8

Kemudian akan diperoleh 512 fitur seperti pada Tabel 1 (citra kata keluar).

Tabel 1. Hasil Ekstrak Fitur & Rata-rata Pecahan Citra 8x8

No Urut 1 2 ... 512

Nilai Rata-rata 0.0541 0.0068 ... 0.8154

Kemudian fitur dinormalisasi seperti pada Tabel 2 (citra kata keluar).

Tabel 2. Hasil Uji Coba Normalisasi Fitur

No Urut 1 2 ... 512

Hasil Normalisasi 0.3288 0.3287 ... 0.3297

Hasil pelatihan data dianalisa menggunakan skalabilitas. Skalabilitas antara waktu-memori- jumlah kelas berguna untuk mengetahui waktu yang dibutuhkan SVM untuk menangani data latih dengan jumlah kelas yang berbeda dan untuk mengetahui pengaruh jumlah kelas terhadap ukuran model SVM seperti pada Gambar 9.

Gambar 9. Skalabilitas Waktu-Memori-Jumlah Kelas (Polynomial)

Skalabilitas antara akurasi-jumlah kelas seperti pada Gambar 10.

Gambar 10. Skalabilitas Akurasi-Jumlah Kelas (Polynomial)

Pengujian dilakukan pada data terlatih dan data yang belum dilatih. Label kelas hasil pengujian data dapat diletakan secara teratur sesuai baris dan posisi kata yang tersegmentasi. Pengujian data menggunakan model hasil klasifikasi SVM pada Matlab dengan 100 jenis kelas dan fungsi kernel Polynomial. Hal ini berguna untuk mengetahui tingkat kelayakan sistem pengujian data menggunakan SVM dan filter Gabor. Hasil pengujian data terlatih seperti pada Gambar 11.

0 5000 10000 15000 20000 25000 30000 35000 40000

10 20 30 40 50 60 70 80 90 100

Memori (MB) & Waktu (Detik)

Jumlah Kelas Waktu Memori

55 60 65 70 75 80

10 20 30 40 50 60 70 80 90 100

Akurasi (%)

Jumlah Kelas Akurasi

(5)

Gambar 11. Hasil Pengujian Tulisan Dokter:

(a) Scan Tulisan (b) Hasil Pengujian Data Jumlah kata yang benar 24, dan jumlah kata yang salah 4. Baris 3, kata 1 (kurang seharusnya konstipasi). Baris 5, kata 6 (bayi seharusnya kemeng). Baris 7, kata 1 (pasca seharunya P:). Baris 7, kata 3 (batuk seharusnya novalgium).

Data yang digunakan adalah tulisan Dokter baru selain Dokter yang menulis tulisan pada data untuk pelatihan. Pada data baru ini diperoleh dari format kertas rekam medis. Tahap pengujian data baru adalah pre-procesing, segmentasi, ekstraksi fitur dan pengujian data. Pada proses pengujian untuk data baru terdapat kendala dalam proses pre- procesing untuk mengambil area tulisan. Kendala tersebut disebabkan oleh tulisan yang melewati atau keluar dari area tulisan pada proses masking seperti pada Gambar 12.

Gambar 12. Tulisan Keluar Area Tulisan Uji coba dilakukan dengan menguji tulisan Dokter baru yang tulisanya belum terlatih. Hasil dari uji coba dihitung akurasinya secara manual dengan dua tahap. Tahap pertama membedakan mana yang simbol/kata/simptoma dan mana yang bukan serta dihitung jumlah masing-masing. Lalu tahap kedua adalah menghitung jumlah teks digital (simbol/kata/simptoma) yang benar sesuai dengan

tulisan sebenarnya. Akurasi yang didapat pada data baru adalah 23,62 %.

KESIMPULAN

Berdasarkan uraian penjelasan di atas, maka dapat diambil kesimpulan sebagai berikut:

1. Fungsi kernel polynomial pada SVM memiliki tingkat akurasi terbaik, membutuhkan waktu yang paling sedikit dan membutuhkan memori yang paling sedikit.

2. Perfoma SVM semakin rendah jika jumlah kelas semakin banyak.

3. Akurasi terbaik pada pengenalan citra tulisan tangan (per potongan kata) Dokter menggunakan filter Gabor dan SVM dengan jumlah kelas 100 adalah 65,5%.

4. Aku terbaik (65%) tidak mencapai hipotesa (75%) dan akurasi yang telah dicapai oleh penelitian sebelumnya (85%) karena pada pada penelitian ini mengenali tulisan tangan Dokter sebagai simbol dan secara offline. Sedangkan pada penelitian sebelumnya mengenali tulisan tangan Dokter per karakter secara online melalui perangkat PDA.

DAFTAR PUSTAKA

1. Chen, Qi, dkk. A Medical Knowledge Based Postprocessing Approach for Doctor’s Handwriting Recognition. Frontiers in Handwriting Recognition (ICFHR), International Conference on. 2010: 40-50.

2. Hermawati, Fajar, 2013, Pengolahan Citra Digital: Konsep dan Teori, Andi Offset, Yogyakarta

3. Abe, Shiego. 2005. Support Vector Machines for Pattern Classification. Springer: London 4. Putra, Darma, 2010, Pengolahan Citra

Digital, Andi Offset, Yogyakarta

5. Shanjana, C dan James, Ajay. Offline Recognition of Malayalam handwritten Text.

8th International Conference Interdisciplinarity in Engineering. 2014: 772–

779.

6. Elzobi, Moftah, dkk. Gabor Wavelet Recognition Approach for Off-Line Handwritten Arabic Using Explicit Segmentation. Image Processing and Communications Challenges 5, Advances in Intelligent Systems and Computing. 2014:

245-254.

Gambar

Gambar 1. Gagal Segmentasi Baris Terpotong  Banyak
Gambar 11. Hasil Pengujian Tulisan Dokter:

Referensi

Dokumen terkait

Dari hasil penelitian dan pengamatan Uji Senyawa Bioaktif Ekstrak Daun Sembukan ( Paederia foetida L) terhadap Staphylococcus aureus dengan Metode Bioautografi

STRATEGIS INDIKATOR KINERJA Obat Dan Makanan Aman Meningkatkan Kesehatan Masyarakat dan Daya Saing Bangsa Meningkatkan sistem pengawasan Obat dan Makanan berbasis

[r]

Dusun Tunjungan Wetan, Desa Patik, Kecamatan Pulung, Kabupaten Ponorogo merupakan daerah yang tepat untuk melaksanakan program KPM Posdaya berbasis

X dengan menggunakan metode Work Load Analysis (WLA) dapat disimpulkan bahwa beban kerja karyawan pada bagian Visual 97.40% dengan jumlah karyawan yang optimal adalah 5

Untuk lebih memperkuat adanya kerusakan sel hati tikus dilanjutkan dengan pemeriksaan histopatologi.. Teh jamur merupakan minuman tradisional hasil fermentasi. Selama

Beberapa penelitian menunjukkan bahwa ketaatan beragama (religiusitas) mempunyai peran yang besar dalam pembentukan sikap dan perilaku seseorang, walaupun tidak

Bila dilihat dari sumber pertumbuhan ekonomi Kalimantan Selatan triwulan III-2015 ( y-on-y ), maka Komponen Pengeluaran Konsumsi Rumah Tangga merupakan komponen