IMPLEMENTAS I DAN EVALUAS I
Pada bab ini akan dijelaskan implementasi dan pengujian hasil perancangan yang dilakukan pada Bab 3. Perangkat lunak yang dihasilkan diimplementasikan dan diuji pada Samsung Galaxy Ace GT-S5830 yang menggunakan sistem operasi Android versi 2.3.4.
4.1 Implementasi
Dari hasil analisis dan perancangan yang telah dilakukan pada Bab 3, langkah selanjutkan dalam mengembangkan perangkat lunak ialah mengimplementasikan perangkat lunak yang dihasilkan.
Implementasi aplikasi harus pada spesifikasi standard sistem yang akan dijelaskan pada subbab 4.1.1 berikut.
4.1.1 S pesifikasi Sistem
Perangkat lunak yang dihasilkan diimplementasikan pada ponsel dengan sistem operasi Android. Versi minimal Android yang dapat menjalankan perangkat lunak adalah Android 2.2, versi di bawah 2.2 tidak dapat menjalankan perangkat lunak. Selain itu ponsel juga harus memiliki koneksi internet untuk mengunduh file kor.traineddata dan memori ekternal atau sdcard harus terpasang, serta ponsel harus memiliki kamera. M emori eksternal digunakan untuk tempat penyimpanan file kor.traineddata maupun gambar-gambar yang diambil melalui fitur kamera yang terdapat pada aplikasi.
86
4.1.2 Instalasi Aplikasi
Aplikasi yang sudah jadi harus diinstall terlebih dahulu ke dalam device sebelum dapat digunakan. File yang diinstall adalah file KoreanOCR.apk yang sudah dibuild. File ini berisi keseluruhan isi project yang sudah dienkripsi. Ada beberapa cara yang dapat digunakan untuk instalasi aplikasi, yaitu sebagai berikut
1. Install melalui Eclipse
Cara pertama ini biasanya digunakan oleh developer yang mengembangkan aplikasi. Device harus dihubungkan ke PC melalui cable usb maupun wireless, pastikan pengaturan USB debugging tercentang, menu ini dapat diakses di Setting Æ Application Æ DevelopmentÆ USB debugging. Setelah device dipastikan telah terhubunng, kemudian pada eclipse pilih projek yang ingin diinstall kemudian klik kanan pilih run Æ run configuration Æ Browse Application (KoreanOCR) Æ Target
Æ pilih Device Æ OK. Dengan demikian aplikasi sudah terinstall di device.
2. Install melalui ADB Push
Cara kedua ini juga biasa digunakan oleh developer. Sama seperti instalasi melalui eclipse, device juga harus dihubungkan ke PC hanya saja ini menggunakan command Linux di cmd Windows. Pertama pilih startÆrunÆ cmd, kemudian ketik perintah di bawah ini:
(1) cd <lokasi-Android-SDK>/platform-tools //contoh : cd C:/Android-SDK/platform-tools (2) adb push <lokasi-file> <lokasi-tujuan>
//lokasi file terdapat pada folder bin projek
//contoh : cd C:/M y_thesis/KoreanOCR/bin/KoreanOCR.apk /mnt/sdcard/myapplication
Langkah (1) digunakan untuk change directory ke lokasi adb, lokasi adb terletak antara direktori platform-tools atau directori tools. Perintah push digunakan untuk memasukkan file (parameter 1) ke dalam lokasi tujuan (parameter 2).
3. Install menggunakan Installer
Cara ketiga ini dapat digunakan oleh siapa saja terutama para pengguna ponsel Android. Sebelumnya user harus mendownload installer yang terdapat di Android Market. File KoreanOCR.apk dicopy secara manual dan dimasukkan ke dalam memori ponsel, serta pastikan pengaturan untuk unkown sources dicentang, menu ini dapat diakses melalui SettingÆApplicationÆUnkown sources. Bagian tersebut perlu dicentang untuk aplikasi-aplikasi yang bukan berasal dari Android Market. Kemudian ikuti cara-cara installasi pada masing-masing installer.
4.1.3 Mekanisme Penggunaan Aplikasi
Pada saat pertama kali aplikasi dijalankan, aplikasi akan mengunduh file kor.traineddata terlebih dahulu apabila kor.traineddata tidak tersedia pada direktori yang telah ditentukan. Proses ini memerlukan koneksi internet.
88
Gambar 4.1 Tampilan Halaman Utama pada Proses Pengunduhan file
Apabila file yang dibutuhkan telah tersedia maka aplikasi akan langsung menampilkan halaman utama seperti tampak pada Gambar 4.1.
Gambar 4.2 Tampilan Halaman Utama
Aplikasi pengenalan karakter Korea terdiri dari delapan fitur utama, yaitu menu untuk akses kamera, file browser, recognising, drawing, translate, preprocessing, dictionary dan save image . Selain fitur file browser dan kamera, keenam fitur
lainnya dapat diakses dengan menekan tombol menu yang terdapat pada ponsel Android.
Gambar 4.3 Layar Kamera
Layar ini merupakan halaman ketika user mengklik icon yang terdapat pada halaman utama. Kotak hitam putih merupakan surfacae view kamera, objek yang ingin diambil akan terlihat pada surface view ini. Surface view dapat diklik untuk memfokuskan kamera pada objek. Apabila user ingin kembali ke halaman utama, user
dapat menekan tombol atau tekan tombol untuk mengambil gambar. Gambar
yang diambil akan ditampilkan, user dapat menekan untuk menyimpan gambar
atau tombol untuk membatalkan gambar dan kembali ke layar surface view untuk pengambilan gambar baru. Apabila user menekan tombol save maka gambar akan tersimpan dan aplikasi akan menampilkan nama file dan lokasi penyimpanan file. Setelah itu aplikasi akan kembali ke halaman utama dan menampilkan gambar yang baru saja disimpan.
90
Gambar 4.4 Tampilan Halaman File Chooser
Halaman ini dapat diakses dengan cara mengklik icon . Halaman ini berisi list direktori dan file yang terdapat pada memori eksternal. File yang dapat dipilih hanya file gambar dengan ekstensi .jpg, .tiff, .bmp,.png dan .gif. File dapat dipilih dengan mengklik file tersebut. Jika file telah dipilih maka aplikasi akan kembali pada halaman utama, kemudian file yang tadi dipilih akan ditampilkan.
Gambar 4.5 (a) Halaman Drawing sebelum draw teks (b) Halaman Drawing sesudah draw teks
Halaman ini dapat diakses dengan memilih menu drawing. Halaman ini dapat digunakan oleh user untuk menguji keakuratan aplikasi dalam mengenali karakter Korea. User dapat memasukkan teks yang ingin dikenali dengan mengetik teks tersebut pada tempat yang sudah disediakan, kemudian klik draw untuk menggambar pada canvas. User juga dapat menghapus canvas dengan mengklik tombol “Clear Canvas” dan tombol “Clear Text” untuk menghapus teks pada teks area. Pada halaman ini juga terdapat menu-menu seperti halaman utama.
92
Gambar 4.6 Submenu Image Preprocessing
Layar ini merupakan submenu yang ditampilkan apabila user memilih menu image preprocessing. Submenu grayscale untuk mengubah gambar berwarna menjadi gambar dengan derajat keabuan, graussiang blur digunakan untuk melakukan blurring gambar dan otsu thresholding digunakan untuk mengubah gambar berwarna maupun grayscale menjadi gambar hitam putih dengan menerapkan algoritma Otsu.
Layar ini merupakan tampilan apabila user memilih menu save image. Aplikasi akan menampilkan alert dialog untuk memastikan bahwa user memang ingin menyimpan gambar. Jika user memilih “yes” maka gambar akan tersimpan dan aplikasi akan menginformasikan nama file dan lokasi penyimpanan file tersebut. Sebaliknya, apabila user memilih “no” maka aplikasi tidak akan melakukan penyimpanan gambar.
Gambar 4.8 Layar Halaman Dictionary
Layar ini dapat diakses dengan memilih menu Dictionary. Dalam halaman ini terdapat beberapa menu lainnya seperti yang terlihat pada gambar.
94
Gambar 4.9 Halaman Insert Word
Layar ini merupakan halaman apabila user mengklik tombol “Insert a Word” pada halaman dictionary. User dapat memasukkan kata dalam bahasa Korea berserta arti kata tersebut dalam bahasa Inggris maupun bahasa Indonesia.
Layar ini merupakan halaman apabila user mengklik tombol “Word (s) List” pada halaman dictionary. Halaman ini menampilkan semua kata-kata yang tersimpan dalam database beserta arti dalam bahasa Inggris dan bahasa Indonesia. Selain itu pada halaman ini juga terdapat fitur untuk searching, user dapat melakukan pencarian dengan memasukkan kata pada area yang sudah disediakan. Kata yang dimasukkan dapat berupa arti dalam bahasa Indonesia, arti dalam bahasa Inggris maupun karakter Korea. Pada halaman ini juga terdapat tiga menu lainnya seperti terlihat pada gambar di atas.
Gambar 4.11 (a) Tampilan Halaman Edit Word (b) Alert Dialog untuk penghapusan data
Gambar 4.11 (a) merupakan halaman pada saat user mengklik salah satu daftar kata pada halaman Word (s) List. Halaman ini digunakan untuk memperbarui kata
96
maupun untuk menghapus kata. Apabila user ingin menghapus data maka aplikasi akan menampilkan alert dialog seperti pada Gambar 4.11 (b) untuk memastikan bahwa user ingin menghapus data.
Gambar 4.12 Tampilan Halaman Translator
Halaman ini dapat diakses melalui menu pada halaman utama maupun tombol “Translator” pada halaman dictionary. Halaman ini digunakan untuk melakukan penerjemahan bahasa Korea ke dalam bahasa Inggris maupun bahasa Indonesia berdasarkan semantik kata. Selain itu juga ditampilkan romanisasi karakter Korea. User dapat memasukkan karakter Korea yang ingin dikenali kemudian klik tombol Display atau bisa juga menerjemahkan teks hasil pengenalan pada halaman utama. Teks hasil pengenalan tersebut akan dipassing ke halaman ini.
Selain halama-halaman yang terdapat pada screen shoot di atas, aplikasi juga menyediakan fitur untuk memasukkan karakter Korea serta romanisasi karakter tersebut.
4.2 Evaluasi
Sesuai dengan asumsi yang telah dijelaskan pada bab 3 bahwa Aplikasi hanya mampu mengenali teks yang sifatnya ideal, yaitu teks hitam di atas latar putih atau teks putih di atas latar hitam. Oleh karena itu pada subbab ini akan dilakukan pengujian terhadap program aplikasi untuk sample gambar yang diambil menggunakan kamera yang terdapat pada aplikasi dengan memotret sebuah buku yang berjudul “Otodidak Belajar Korea” yang juga merupakan sumber penulisan skiripsi ini. Sample gambar yang diambil menggunakan kamera terdapat 27 gambar yaitu dari sample gambar 1 sampai sample gambar 27 yang terdapat pada Lampiran 2. Sample – sample tersebut berisi karakter-karakter Korea sebagai data pengujian.
Selain itu untuk menguji bahwa program aplikasi juga mampu mengenali gambar dengan teks hitam di atas latar putih sebaik mengenali teks putih di atas latar hitam seperti jurnal yang ditulis oleh Ray Smith et al (2009), maka akan dilakukan pengujian terhadap 5 sample gambar untuk teks hitam di atas latar putih dan 5 sample gambar untuk teks putih di atas latar hitam. Sample gambar ini berisi teks dengan ukuran yang sama, hanya warna latar yang berbeda. Sample dapat dilihat pada Lampiran 2 dari sample gambar 27 sampai sample gambar 36. Berikut akan dijelaskan hasil pengujian.
98
4.2.1 Evaluasi Akurasi Pengenalan Karakter
4.2.1.1 Sample Gambar 1 sampai Sample S ambar 27
Hasil pengujian sample gambar 1 sampai sample gambar 27 dapat dilihat pada Lampiran 3 untuk masing-masing data pengujian. Evaluasi akurasi pengenalan akan dilakukan per kata dan per karakter, serta waktu proses yang diperlukan. Keseluruhan hasil pengujian disajikan dalam Tabel 4.1.
Tabel. 4.1 Hasil Pengujian Sample Gambar 1 sampai Sample Gambar 37
Sample Jumlah Kata Jumlah Karakte r Jumlah Kata Salah Jumlah Karakte r Salah Akurasi pengenala n Kata (%) Akurasi pengenalan karakte r (%) W aktu Prose s (detik) Gambar 1 9 25 5 10 44.44 60.00 0.09109 Gambar 2 7 19 1 1 85.71 94.74 0.04313 Gambar 3 7 17 1 1 85.71 94.12 0.07602 Gambar 4 5 20 4 5 20.00 75.00 0.06211 Gambar 5 6 19 3 3 50.00 84.21 0.07738 Gambar 6 7 23 1 1 85.71 95.65 0.07814 Gambar 7 9 27 5 7 44.44 74.07 0.09741 Gambar 8 7 20 0 0 100.00 100.00 0.08489 Gambar 9 7 23 4 8 42.86 65.22 0.06904 Gambar 10 8 24 1 1 87.50 95.83 0.06401 Gambar 11 7 20 0 0 100.00 100.00 0.04463 Gambar 6 19 3 3 50.00 84.21 0.06456
12 Gambar 13 8 25 3 3 62.50 88.00 0.07944 Gambar 14 9 28 5 6 44.44 78.57 0.07083 Gambar 15 8 29 2 2 75.00 93.10 0.06899 Gambar 16 9 27 7 11 22.22 59.26 0.06297 Gambar 17 9 26 5 8 44.44 69.23 0.10449 Gambar 18 9 26 5 8 44.44 69.23 0.09486 Gambar 19 8 26 4 4 50.00 84.62 0.05565 Gambar 20 4 13 3 6 25.00 53.85 0.04792 Gambar 21 9 25 3 5 66.67 80.00 0.07093 Gambar 22 8 23 3 5 62.50 78.26 0.03031 Gambar 23 7 18 7 17 0.00 5.56 0.0416 Gambar 24 11 30 8 12 27.27 60.00 0.1106 Gambar 25 9 30 1 2 88.89 93.33 0.07786 Gambar 26 8 18 2 2 75.00 88.89 0.09883 Gambar 27 8 16 0 0 100.00 100.00 0.06984 Total 209 6 86 131 1.93753
4.2.1.2 Evaluasi Data Pengujian dengan Latar Hitam dan Putih
Gambar hasil pengujian sample gambar 28 sampai sample gambar 37 dapat dilihat pada Lampiran 3. Berikut akan disajikan tabel dan diagram dari keseluruhan hasil pengujian.
100
Tabel 4.2 Hasil Evaluasi Sample Gambar Dengan Latar Hitam S ample Jumlah Kata Jumlah Karakter Jumlah Kata S alah Jumlah Karakt er S alah Akurasi pengenalan Kata (%) Akurasi pengenal an karakter (%) Waktu Proses (detik) Gambar 28 12 28 1 1 91.67 96.43 0.0846 Gambar 29 9 19 1 1 88.89 94.74 0.08552 Gambar 30 7 16 2 3 71.43 81.25 0.03032 Gambar 31 10 22 1 1 90.00 95.45 0.02877 Gambar 32 3 10 1 1 66.67 90.00 0.0515 Total 41 95 6 7 0.28071
Tabel 4.3 Hasil Evaluasi Sample Dengan Latar Putih
S ample Jumlah Kata Jumlah Karakter Jumlah Kata S alah Jumlah Karakter S alah Akurasi pengenalan Kata (%) Akurasi pengenal an karakter (%) Waktu Proses (detik) Gambar 33 12 28 1 1 91.67 96.43 0.0848 Gambar 34 9 19 1 1 88.89 94.74 0.09093 Gambar 35 7 16 2 2 71.43 87.50 0.05206 Gambar 36 10 22 2 2 80.00 90.91 0.03184 Gambar 37 3 10 1 1 66.67 90.00 0.05095 Total 41 95 7 7 0.31058
4.2.1.3 Kesimpulan Hasil Evaluasi Akurasi Pengenalan Karakter
4.2.1.3.1 Kesimpulan Hasil Evaluasi Akurasi Pengenalan Karakter Pada Sample Gambar 1 sampai Sample Gambar 27
Total karakter yang diuji untuk gambar yang dicapture dengan kamera ada sebanyak 616 karakter, karakter yang salah dikenali ada sebanyak 131 karakter. Dengan demikian dapat disimpulkan akurasi pengenalan karakter untuk sample gambar 1 sampai sample
gambar 27 sebesar 100% 78,73% 616 131 616 = × −
. Sedangkan akurasi pengenalan kat a
hanya sebesar 100% 58,85% 209 86 209 = × −
. Hal ini dikarenakan karakter yang tidak
dikenali hampir tersebar merata pada setiap kata. Untuk waktu proses dapat dikatakan
cukup cepat dengan rata-rata 100% 0.07176detik 27
1.93753
=
× .
Gambar 4.13 Diagram Akurasi Pengujian Sample Gambar 1 sampai Sample Gambar 13 dalam persentase 0 20 40 60 80 100 120
Akurasi pengenalan data uji sample gambar 1 s/d sample gambar 13 (%)
Akurasi pengenalan data uji sample gambar 1 s/d sample data 13
102
Gambar 4.14 Diagram Akurasi Pengujian Sample Gambar 14 sampai Sample Gambar 26
4.2.1.3.2 Kesimpulan Hasil Evaluasi Akurasi Pengenalan Karakter pada Sample Gambar 28 sampai Sample Gambar 37
Total kata dan karakter yang diuji pada sample gambar 28 sampai 32 dengan latar hitam sama dengan sample gambar 33 sampai sample gambar 37 yaitu 41 kata dan 95 karakter. Berikut kesimpulan untuk masing-masing kelompok data uji.
1. Sample Gambar 28 Sampai Sample Gambar 32 dengan Latar Hitam
Akurasi pengenalan kata 100% 82.93% 41 7 41 = × −
Akurasi pengenalan karakter 100% 92.63% 95 7 95 = × − 0 20 40 60 80 100
Akurasi pengenalan data uji sample gambar 14 s/d sample gambar 27 (%)
Akurasi pengenalan data uji sample gambar 14 s/d sample data 27
Waktu proses = 1det 0.056142detik 5
0.28071
=
× ik
2. Sample Gambar 33 Sampai Sample Gambar 37 dengan Latar Putih
Akurasi pengenalan kata 100% 82.93% 41 7 41 = × −
Akurasi pengenalan karakter 100% 92.63% 95 7 95 = × −
Waktu proses = 1det 0.062116detik 5
0.31058
=
× ik
Walaupun hasil perhitungan menunjukkan bahwa akurasi pengenalan pada gambar dengan latar belakang hitam dan putih adalah sama, namun hal tersebut tidak selalu mutlak. Berdasarkan diagram pada Gambar 4.5 memperlihatkan bahwa akurasi pengenalan untuk setiap gambar tidak semua sama, terjadi perbedaan pada sample gambar 29 & 34 dan pada sample gambar 30 & 35. Tabel 4.5 dan Tabel 4.6 juga memperlihatkan ada perbedaan karakter yang tidak dikenali, karakter yang dikenali pada gambar dengan latar hitam salah dikenali pada gambar dengan latar putih begitu juga sebaliknya. Namun hasil pengenalan gambar dengan latar hitam dan putih sangat memuaskan dengan akurasi di atas 90%.
104
Gambar 4.15 Diagram Evaluasi Sample Gambar 28 sampai Sample Gambar 37
Gambar 4.16 Diagram Hasil Evaluasi Akurasi Pengenalan Karakter secara Keseluruhan Dengan demikian evaluasi akurasi pengenalan karakter secara keseluruhan dapat
disimpulkan sebagai berikut :
Akurasi pengenalan kata = 100% 65,.64% 41 41 209 ) 7 7 86 ( ) 41 41 209 ( = × + + + + − + +
Akurasi pegenalan karakter= 100% 81,97% 94 94 616 ) 7 7 131 ( ) 94 94 616 ( = × + + + + − + +
Rata-rata waktu proses untuk 1 karakter =
detik 0.007246 detik 1 94 94 616 0.31058 0.28071 1.93753 = × + + + + 70 75 80 85 90 95 100 gambar 27 & 32 gambar 28 & 33 gambar 29 & 34 gambar 30 & 35 gambar 31 & 36 Latar … Latar putih 70 80 90 100
Hasil Evaluasi Keseluruhan Akurasi Pengenalan Karakter (%) Gambar Hasil Kamera Capture Gambar Dengan Latar Hitam Gambar Dengan Latar Putih
4.2.2 Evaluasi Kesalahan Aplikasi dalam Pengenalan Karakter
Berdasarkan data karakter yang salah dikenali pada Lampiran 4, kesalahan banyak terjadi karena beberapa hal berikut :
1. Komponen karakter Korea terdiri dari minimal dua simbol, seperti yang terlihat pada Tabel 2.1, Tabel 2.2 dan Tabel 2.3, simbol-simbol untuk membentuk 1 karakter hampir semua tidak saling menempel tetapi ada jarak yang memisahkan simbol-simbol tersebut. Hal tersebut yang kadang membuat aplikasi salah dalam mengenali karakter, misalnya seperti pada :
a. Gambar 1 kata ke-6 : karakter이 dikenali sebagai dua karakter terpisah 0
dan |
b. Gambar 1 kata ke-8 : 기 dikenali sebagai 71
c. Gambar 13 kata ke-1 : 지 dikenali sebagai < |
2. Kebanyakan simbol-simbol karakter Korea mempunyai bentuk yang saling menyerupai
a. 다 paling banyak dikenali sebagai karakter 댜 seperti pada
1) Gambar 1 kata ke-6 dan kata ke-7
2) Gambar 3 kata ke-2
106
4) Gambar 13 kata ke-3
5) Gambar 15 kata ke-16
6) Gambar 16 kata ke – 2
7) Gambar 17kata ke – 2, dan lain-lain
b. Simbol ㅇ dikenali sebagai ㅁ seperti pada Gambar 28 kata ke-10 dan
Gambar 33 kata ke-10
c. Simbol-simbol ㄹ,ㄷ,ㅁ,dan ㅌ saling tertukar, seperti pada Gambar 9
kata 1 dan kata 7, Gambar 12 kata 3, dan lain-lain.
d. Simbol-simbol ㅣ,ㅏ,ㅑ,ㅓ dan ㅑ saling tertukar, seperti pada Gambar
16 kata 3, kata 4, kata 7, dan kata 8.
e. Simbol-simbol ㅔ dan ㅒ saling tertukar, seperti pada Gambar 16 kata 2
dan Gambar 22 kata 2.
f. Simbol-simbol ㅡ,ㅗ,ㅛ,ㅠ dan ㅜ saling tertukar, seperti pada Gambar
16 kata 6 dan Gambar 22 kata 3.
g. Kualitas gambar akan mempengaruhi kualitas hasil binerisasi gambar. Contoh nyata dari masalah ini adalah pada sample gambar 23 di mana karakter yang dikenali hanya 1 dari keseluruhan 17 karakter. Selain gambar tersebut blur, juga dikarenakan pencahayaan pada gambar. Banyak gambar dengan gradien iluminasi yang tidak merata sehingga
proses binerisasi akan menghilangan informasi penting dari gambar, karena metode yang digunakan adalah metode Otsu yang menggunakan satu nilai threshold untuk keseluruhan gambar.