• Tidak ada hasil yang ditemukan

Bab ini akan diuraikan dan membahas proses perancangan dan pengembangan system yang meliputi hasil dari metedologi penelitian yang telah dilakukan.

BAB VI PENUTUP

Bab ini berisi kesimpulan dari uraian yang sudah diterangkan pada bab - bab sebelumnya dan juga berisi saran untuk pengembangan lebih lanjut.

14 BAB II

Landasan Teori

2.1 Pengertian aplikasi

Menurut Buyens (2014) aplikasi adalah suatu unit perangkat lunak yang dibuat untuk melayani kebutuhan akan berbagi aktivitas. Jika akan mengembangkan program aplikasi sendiri, maka untuk menulis program aplikasi tersebut, dibutuhkan suatu Bahasa pemogramman yaitu language software, yang dapat berbentuk assambler, complier atau interpreter. Jadi language software merupakan bahasanya dan program yang ditulis merupakan program aplikasinya. Language software berfungsi agar dapat menulis program dengan bahasa yang lebih mudah, dan akan menterjemahkan dalam bahasa mesin supaya bisa dimengerti oleh komputer.

2.1.1 Pengertian mobile application

Menurut Buyens (2014) aplikasi mobile berasal dari kata application dan mobile. Application yang artinya penerapan, lamaran, penggunaan. Secara istilah aplikasi adalah program siap pakai yang direka untuk melaksanakan suatu fungsi bagi pengguna atau aplikasi yang lain dan dapat digunakan oleh sasaran yang dituju sedangkan mobile dapat di artikan sebagai perpindahan dari suatu tempat ke tempat yang lain.

Maka aplikasi mobile dapat di artikan sebuah program aplikasi yang dapat dijalankan atau digunakan walaupun pengguna berpindah – pindah dari satu tempat

15 ke tempat yang lain serta mempunyai ukuran yang kecil. Aplikasi mobile ini dapat di akses melalui perangkat nirkabel, pager, PDA, telepon seluler, smartphone, dan perangkat sejenisnya.

2.1.2 Karakteristik perangkat mobile

Perangkat mobile memiliki berbagai jenis dalam hal ukuran,design dan layout tetapi mereka memiliki kesamaan karakteristik yang sangat berbeda dari sistem desktop, yaitu antara lain:

• Ukuran yang kecil

Perangkat mobile memiliki ukuran yang kecil. Konsumen menginginkan perangkat yang terkecil untuk kenyamanan dan mobilitas mereka.

• Memory yang terbatas

Perangkat mobile juga memiliki memory yang kecil, yaitu primary (RAM) dan secondary (disk). Pembatasan ini adalah salah satu faktor yang 11 mempengaruhi penulisan program untuk berbagai jenis dari perangkat ini. Dengan pembatasan jumlah dari memory, pertimbangan-pertimbangan khusus harus

diambil untuk memelihara pemakaian dari sumber daya yang mahal ini. • Daya proses yang terbatas

Sistem mobile tidaklah setangguh rekan mereka yaitu desktop. Ukuran, teknologi dan biaya adalah beberapa faktor yang mempengaruhi status dari sumber

16 daya ini. Sepertiharddisk dan RAM, Anda dapat menemukan mereka dalam ukuran yang pas dengan sebuah kemasan kecil.

• Konektivitas yang terbatas

Perangkat mobile memiliki bandwith rendah, beberapa dari mereka bahkan tidak tersambung. Kebanyakan dari mereka menggunakan koneksi wireless

• Konektivitas yang terbatas

Perangkat mobile memiliki bandwith rendah, beberapa dari mereka bahkan tidak tersambung. Kebanyakan dari mereka menggunakan koneksi wireless.

2.2 Konsep Dasar Sistem Informasi 2.2.1 Sistem

Sistem adalah sekumpulan elemen yang saling terkait atau terpadu yang dimaksud untuk mencapai tujuan. Sebagai gambaran, jika dalam sebuah system terdapat elemen yang tidak memberikan manfaat dalam mencapai tujuan yang sama, maka elemen tersebut dapat dipastikan bukanlah bagian dari system (Kadir,2013).

2.2.2 Informasi

sedangkan Informasi adalah sebagai hasil dari pengolahan data dalam suatu bentuk yang lebih berguna dan lebih berarti bagi penerimanya yang menggambarkan suatu kejadian-kejadian (event) yang nyata (fact) yang digunakan untuk pengambilan keputusan (Kusnendi,2011).

17 1. Ciri-ciri Informasi

Informasi itu memiliki ciri-ciri sebagai berikut (Kadir,2013):

A. Benar atau salah. Dalam hal ini, informasi berhubungan dengan kebenaran terhadap kenyataan. jika penerima informasi yang salah mempercayainya,efeknya seperti kalua informasi itu benar.

B. Baru. Informasi harus benar benar baru bagi si penerima.

C. Tambahan. Informasi dapat memperbarui atau memberika perubahan terhadap infromasi yang telah ada.

D. Korektif. Informasi dapat digunakan untuk melakukan koreksi terhadap informasi yang sebelumnya yang salah atau kurang benar.

E. Penegas. Informasi dapat mempertegas informasi yang telah ada sehingga keyakinan terhadap informasi semakin meningkat.

2. Kualitas Informasi

Kualitas informasi akan sangat tergantung kepada 3 hal seperti yang dikemukakan oleh Jogiyanto, yaitu sebagai berikut (Kusnendi,2011).

A. Informasi harus akurat

Informasi harus bebas dari kesalahan-kesalahan dan tidak bias atau menyesatkan. Akurat berarti informasi harus jelas mencerminkan maksudnya. Mengapa informasi itu harus akurat? Sebab dari sumber informasi sampai ke penerima informasi kemungkinan banyak terjadi gangguan (noise) yang dapat mengubah dan merusak informasi tersebut.

18 B. Informasi harus tepat pada waktunya

Informasi yang dikirim atau diterima tidak boleh terlambat diterima si penerima, sebab informasi yang usang tidak akan mempunyai nilai lagi. Apalagi jika informasi tersebut merupakan dasar untuk dijadikan dalam pengambilan keputusan. Jika pengambilan keputusan terlambat maka berakibat fatal bagi suatu organisasi. Perlu dipahami, mahalnya informasi dikarenakan harus cepatnya didapat sehingga diperlukan teknologi informasi untuk mengolah dan mengirimkannya.

C. Informasi harus relevan

Informasi harus memiliki manfaat bagi pemakainya dan relevansi informasi bagi setiap orang akan berbeda.

2.2.3 Sistem Informasi

Sistem informasi merupakan suatu komponen yang terdiri dari manusia, teknologi informasi, dan prosedur kinerja yang memproses, menyimpan, menganalisis, dan menyebarkan informasi untuk mencapai suatu tujuan (Mulyanto, 2009). Sistem Informasi adalah suatu sistem yang terdiri dari komponen utama yang saling bekerja sama atau berkaitan atau terhubung satu dengan yang lainnya, yaitu manusia, hardware, software, jaringan komunikasi, dan sumber data jaringan komunikasi, dan sumber data, dalam proses kegiatan mengumpulkan, mengolah, menyimpan, menganalisa data, dan menyebarkan untuk mencapai suatu tujuan tertentu yang telah ditetapkan (Waspodo,2008)

19 2.2.4 Komponen Sistem Informasi

Dalam suatu sistem informasi terdapat komponen-komponen seperti : (Mulyanto, 2009)

1. Sumber Daya Manusia, Manusia mengambil peranan yang penting bagi sistem informasi. Manusia dibutuhkan untuk mengoperasikan sistem informasi. Sumber daya manusia dapat dibedakan menjadi dua kelompok, yaitu pengguna akhir dan pakar sistem informasi.

2. Sumber Daya Hardware, Semua peralatan yang digunakan dalam pemrosesan informasi.

3. Sumber Daya Software, Semua rangkaian perintah yang digunakan dalam pemprosesan informasi.

4. Sumber Daya Data, Bukan hanya sekedar bahan baku untuk masukan sebuah sistem informasi, melainkan sebagai dasar membentuk sumber daya organisasi.

5. Sumber Daya Jaringan, Media komunikasi yang menghubugkan komputer, pemroses komunikasi, dan peralatan lainnya, serta dikendalikan melalui software komunikasi.

2.3 Kamus

Menurut Kamus Besar Bahasa Indonesia, pengertian kamus adalah buku acuan yang memuat kata dan ungkapan yang biasanya disusun menurut abjad berikut keterangan maknanya, pemakaiannya dan terjemahannya. Kamus juga

20 dapat digunakan sebagai buku rujukan yang menerangkan makna kata – kata yang berfungsi untuk membantu seseorang mengenal perkataan baru. Selain pengertian kamus yang telah disebutkan di atas, pengertian kamus yang dikemukakan oleh beberapa para ahli Chaer (2007).

1. Kridalaksana menyebutkan bahwa kamus adalah buku referensi yang memuat daftar kata atau gabungan kata dengan keterangan mengenai pelbagai segi maknanya dan penggunaannya dalam bahasa, biasanya disusun menurut abjad.

2. Dalam American Every Dictionary disebutkan bahwa kamus adalah sebuah buku berisi kata-kata dari sebuah bahasa, biasanya disusun secara alfabetis, disertai keterangan akan artinya ucapannya, ejaannya, dsb.

3. Labrousse (1997) menyebutkan bahwa kamus adalah buku berisi kumpulan kata-kata sebuah Bahasa yang disusun secara alfabetis, diikuti dengan defenisi atau terjemahannya dalam bahasa lain.

4. Keraf (1984) mendefinisikan kamus sebagai sebuah buku referensi, memuat daftar kata-kata yang terdapat dalam sebuah bahasa, disusun secara alfabetis, disertai keterangan cara menggunakan kata itu.

5. C.C Berg dalam buku Manual of Lexicography mendefinisikan kamus adalah satu daftar yang disusun secara sistematis tentang bentuk-bentuk linguistik dari kebiasaan ujaran sebuah masyarakat ujaran.

Definisi ini mengenai bentuk/ jenis utama kamus yang berurusan dengan makna leksikal. Berdasarkan pengertian kamus yang dikemukakan oleh beberapa ahli di atas, dapat disimpulkan beberapa hal sebagai berikut.

21 1. Kamus termasuk buku referensi yang berisi kata-kata atau gabungan

kata dari suatu bahasa;

2. Kata-kata tersebut disusun secara alfabetis;

3. Kata-kata tersebut diberi keterangan tentang makna dan penggunaannya;

4. Kata itu selain diberi keterangan maknanya, juga diberi keterangan tentang ucap annya, ejaannya, dan pelbagai hal lain;

5. Keterangan tentang makna itu diberikan juga dalam bahasa lain;

2.4 Bahasa Indonesia

Bahasa adalah sebagai alat komunikasi antar manusia. karena dengan bahasa orang bisa berinteraksi dengan sesamanya dan bahasa merupakan sumber daya bagi kehidupan bermasyarakat. Adapun bahasa dapat digunakan apabila saling memahami atau saling mengerti erat hubungannya dengan penggunaan sumber daya bahasa yang kita miliki. Kita dapat memahami maksud dan tujuan orang lain berbahasa atau berbicara apabila kita mendengarkan dengan baik apa yang dikatakan. Bahasa Indonesia ialah bahasa rasmi Republik Indonesia sebagaimana disebutkan dkarena dalam Undang-Undang Dasar RI 1945, Pasal 36. Ia juga merupakan bahasa persatuan bangsa Indonesia sebagaimana disebut dalam Sumpah Pemuda 28 Oktober 1928. Sungguhpun begitu, hanya sebahagian kecil daripada penduduk Indonesia yang benar-benar menggunakannya sebagai bahasa ibunda kerana dalam perbualan sehari-hari yang tidak rasmi masyarakat Indonesia lebih suka menggunakan bahasa daerahnya masing-masing sebagai bahasa ibu seperti

22 bahasa Melayu pasar, bahasa Jawa, bahasa Sunda, dan lain sebagainya. Untuk sebahagian besar masyarakat Indonesia lainnya, bahasa Indonesia adalah bahasa kedua dan untuk taraf rasmi bahasa Indonesia adalah bahasa pertama. Bahasa Indonesia merupakan sebuah dialek bahasa Melayu yang menjadi bahasa rasmi Republik Indonesia.

Bahasa Indonesia dirasmikan pada tahun 1945 sewaktu Indonesia mencapai kemerdekaan daripada pihak Belanda. Bahasa Indonesia adalah bahasa dinamik yang terus menyerap kata-kata daripada bahasa-bahasa asing. Berasal daripada rumpun yang sama, Bahasa Indonesia adalah sebuah loghat bahasa Melayu yang terpiawai, dan kedua-duanya cukup sama. Fonologi dan tatabahasa bahasa Indonesia cukuplah mudah, dan dasar-dasar penting untuk komunikasi asas dapat dipelajari hanya dalam tempoh masa beberapa minggu. Bahasa Indonesia merupakan bahasa hantaran untuk pendidikan di sekolah-sekolah Indonesia.

Ini ada definisi bahasa menurut tujuh para ahli :

1. Menurut Keraf dalam Smarapradhipa (2005:1), memberikan dua pengertian bahasa. Pengertian pertama menyatakan bahasa sebagai alat komunikasi antara anggota masyarakat berupa simbol bunyi yang dihasilkan oleh alat ucap manusia. Kedua, bahasa adalah sistem komunikasi yang mempergunakan simbol-simbol vokal (bunyi ujaran) yang bersifat arbitrer. 2. Menurut Owen dalam Stiawan (2006:1), menjelaskan definisi bahasa yaitu

language can be defined as a socially shared combinations of those symbols and rule governed combinations of those symbols (bahasa dapat

23 didefenisikan sebagai kode yang diterima secara sosial atau sistem konvensional untuk menyampaikan konsep melalui kegunaan simbol-simbol yang dikehendaki dan kombinasi simbol-simbol-simbol-simbol yang diatur oleh ketentuan).

3. Pendapat dengan Owen apa yang diungkapkan oleh Tarigan (1989:4), beliau memberikan dua definisi bahasa. Pertama, bahasa adalah suatu sistem yang sistematis, barang kali juga untuk sistem generatif. Kedua, bahasa adalah seperangkat lambang-lambang mana suka atau simbol-simbol arbitrer.

4. Menurut Santoso (1990:1), bahasa adalah rangkaian bunyi yang dihasilkan oleh alat ucap manusia secara sadar.

5. Menurut Mackey (1986:12), Bahasa adalah suatu bentuk dan bukan suatu keadaan (language may be form and not matter) atau sesuatu sistem lambang bunyi yang arbitrer, atau juga suatu sistem dari sekian banyak sistem-sistem, suatu sistem dari suatu tatanan atau suatu tatanan dalam sistem-sistem.

6. Menurut Wibowo (2001:3), bahasa adalah sistem simbol bunyi yang bermakna dan berartikulasi (dihasilkan oleh alat ucap) yang bersifat arbitrer dan konvensional, yang dipakai sebagai alat berkomunikasi oleh sekelompok manusia untuk melahirkan perasaan dan pikiran.

7. Hampir senada dengan pendapat Wibowo, Walija (1996:4), mengungkapkan definisi bahasa ialah komunikasi yang paling lengkap dan

24 efektif untuk menyampaikan ide, pesan, maksud, perasaan dan pendapat kepada orang lain.

2.5 Bahasa Batak Angkola

Setiap daerah mempunyai latar belakang bahasa yang berbeda di antara corak budaya itu adalah bahasa.” Bahasa adalah salah satu alat komonikasi antara anggota masyarakat, berupa lambang bunyi yang dihasilkan oleh alat ucap manusia” (keraf 1973: 15). Begitu juga Bahasa Batak Angkola dipakai oleh masyakat Batak yang tinggal di Kecamatan Batang Ankola, Kabupaten Tapanuli Selatan, Provinsi Sumatera Utara. Bahasa Batak Angkola ini digunakan untuk berbagai keperluan antara lain sebagai alat komunikasi sehari-hari dan juga untuk pelaksanaan adat dan sebagai media kegiatan keagamaan.

Suku Batak terdiri atas beberapa sub suku yang berdiam di wilayah Sumatera Utara yakni sebagian besar di Tapanuli, Simalungun, Karo, serta Nias dan Pakpak-Dairi-kedua wilayah terakhir ini termasuk wilayah Tapanuli. Sub suku Batak terdiri atas Toba yang bermukim di wilayah Toba yakni Toba, Silindung, Samosir, dan Humbang; Angkola yang bermukim di wilayah Tapanuli Selatan, Sipirok dan Angkola, Mandailing yang bermukim di Mandailing Natal; Simalungun di daerah Simalungun; Karo di daerah Karo; Pakpak Dairi bermukim di daerah Pakpak dan Dairi. Bahkan dalam pelajaran antropologi yang diajarkan di sekolah-sekolah bahwa Nias, Alas dan Gayo dikelompokkan dalam sub Suku Batak. Dalam dua dasawarsa terakhir ini terbentuk sub-suku Batak lainnya, yakni Batak Pesisir.

25 Melihat perkembangan ini, Kecamatan Batang Ankola, Kabupaten Tapanuli Selatan ini sudah banyak mengalami perubahan-perubahan dan perkembangan. Kemajuan dan perkembangan yang terdapat di kecamatan ini adalah dari segi pendidikan, mata pencarian, budaya, dan politik. Daerah kecamatan Batang Angkola ini adalah tempat peneliti melakukan penelitian ini, dan kecamatan Batang Angkola terdiri atas 20 desa.

Berdasarkan uraian di atas, bahasa Batak Angkola masih tetap dipelihara dan dipergunakan oleh masyarakat pemakainya sebagai salah satu bahasa. Bahasa Batak Angkola sudah selayaknya ditumbuh-kembangkan keberadaannya di tanah air Indonesia sebagai kekayaan suatu bangsa.

2.6 Natural Language Processing

Liddy (2001) menyatakaan bahwa NLP (Natural language processing) atau pengolahan bahasa alami Secara teoritis adalah pengembangan berbagai teknik komputasi untuk menganalisa dan menampilkan teks dalam bahasa alami pada satu atau lebih tingkat analisis linguistik untuk mencapai tujuan manusia dalam hal bahasa yaitu menyelesaikan berbagai tugas dan aplikasi.

Sebuah NLP harus memperhatikan pengetahuan terhadap bahasa itu sendiri, baik dari segi kata yang digunakan, Bagaimana kata-kata tersebut digabungkan untuk menghasilkan suatu kalimat, apa arti sebuah kata, apa fungsi sebuah kata dalam sebuah kalimat dan sebagainya.

Ada berbagai terapan aplikasi dari NLP. Diantaranya adalah Chatbot (aplikasi yang membuat user bisa seolah-olah melakukan komunikasi dengan

26 computer), Stemming atau Lemmatization (pemotongan kata dalam bahasa tertentu menjadi bentuk dasar pengenalan fungsi setiap kata dalam kalimat), Summarization (ringkasan dari bacaan), Translation Tools (menterjemahkan bahasa) dan aplikasi-aplikasi lain yang memungkinkan komputer mampu memahami instruksi bahasa yang diinputkan oleh user.

Pustejovsky dan Stubbs (2012) menjelaskan bahwa ada beberapa area utama penelitian pada field NLP, diantaranya:

1. Question Answering Systems (QAS). Kemampuan komputer untuk menjawab pertanyaan yang diberikan oleh user. Daripada memasukkan keyword ke dalam browser pencarian, dengan QAS, user bisa langsung bertanya dalam bahasa natural yang digunakannya, baik itu Inggris, Mandarin, ataupun Indonesia.

2. Summarization. Pembuatan ringkasan dari sekumpulan konten dokumen atau email. Dengan menggunakan aplikasi ini, user bisa dibantu untuk mengkonversikan dokumen teks yang besar ke dalam bentuk slide presentasi.

3. Machine Translation. Produk yang dihasilkan adalah aplikasi yang dapat memahami bahasa manusia dan menterjemahkannya ke dalam bahasa lain. Termasuk di dalamnya adalah Google Translate yang apabila dicermati semakin membaik dalam penterjemahan bahasa. Contoh lain lagi adalah BabelFish yang menterjemahkan bahasa pada real time.

4. Speech Recognition. Field ini merupakan cabang ilmu NLP yang cukup sulit. Proses pembangunan model untuk digunakan telpon/komputer dalam

27 mengenali bahasa yang diucapkan sudah banyak dikerjakan. Bahasa yang sering digunakan adalah berupa pertanyaan dan perintah.

5. Document classification. Sedangkan aplikasi ini adalah merupakan area penelitian NLP Yang paling sukses. Pekerjaan yang dilakukan aplikasi ini adalah menentukan dimana tempat terbaik dokumen yang baru diinputkan ke dalam sistem. Hal ini sangat berguna pada aplikasi spam filtering, news article classification, dan movie review.

2.7 Optical Character Recognition 2.7.1 Pengertian

Optical character recognition (OCR) adalah proses konversi gambar huruf menjadi karakter ASCII yang dikenali oleh komputer. Gambar huruf yang dimaksud dapat berupa hasil scan dokumen, hasil print-screen halaman web, hasil foto, dan lain-lain (Mohammad, Anarase, Shingote, & Ghanwat, 2014).

Adanya sistem pengenal huruf yang cerdas akan sangat membantu usaha besar-besaran yang saat ini dilakukan banyak pihak yakni usaha digitalisasi informasi dan pengetahuan, misalnya dalam pembuatan koleksi pustaka digital, koleksi sastra kuno digital, dll. Dengan adanya pengenal huruf juga akan memudahkan penanganan pekerjaan yang memakai input tulisan seperti penyortiran surat di kantor pos, pemasukan data buku di perpustakaan, dll. Selain itu adanya system pengenal huruf otomatis maka user dapat lebih leluasa memasukkan data karena user tidak harus memakai papan ketik tetapi bias menggunakan pena elektronik untuk menulis sebagaimana user menulis di kertas. (Priyatma dkk, 2004)

28 Dalam pengenal pola otomatis, sistem pengenal pola mencoba mengenali apakah citra masukan yang diterima cocok dengan salah satu citra yang telah ditentukan. Sistem ini misalnya dipakai untuk mendeteksi sidik jari, tanda tangan, bahkan wajah seseorang. Menurut Sukmawan (2008) OCR dapat dipandang sebagai bagian dari pengenal otomatis yang lebih luas yakni pengenal pola otomatis (automatic pattern recognition). Ada banyak pendekatan yang dapat dipakai untuk mengembangkan pembuatan pengenal pola otomatis antara lain memakai pendekatan numerik, statistik, sintaktik, neural dan, aturan produksi (rule-based). Secara umum metode-metode tersebut dapat digolongkan menjadi dua kelompok metode yakni metode berbasis statistik dan metode berbasis struktur.

Dalam metode yang berbasis statistik, setiap pola ditransformasi ke dalam vektor yang memakai ukuran dan karakteristik tertentu. Karakteristik ini seringkali lebih bersifat statistik misalnya distribusi pixel ataupun jarak piksel. Sedang dalam metode yang berbasis struktur, setiap pola yang diproses dinyatakan sebagai gabungan beberapa struktur elementer. Pengenalan selanjutnya dilakukan dengan mencocokkan komposisi struktur elementer dengan struktur yang sudah disimpan memakai aturan tertentu misalnya memakai pendekatan teori bahasa formal dan automata. (Sukmawan, 2008)

29 2.7.2 Cara Kerja

Ilustrasi dari proses OCR

Gambar 2.1 Ilustrasi proses OCR (Manik 2010)

Prinsip kerja dari aplikasi OCR menurut Manik (2010) adalah sebagai berikut:

1. Mengambil objek berupa teks menggunakan kamera sehingga didapat sebuah file citra.

2. File citra tersebut diproses menggunakan perangkat lunak aplikasi pengenalan teks, di mana perangkat ini melakukan proses pengenalan terhadap karakter-karakter yang ada pada file citra tersebut.

3. Keluaran dari perangkat lunak aplikasi pengenalan teks ini berupa file teks yang berisi karakter-karakter yang telah dikenali dan siap untuk diolah lebih lanjut.

30 Tingkat keberhasilan dari perangkat lunak pada aplikasi pengenalan teks ini sangat bergantung dari sejumlah faktor berikut:

1. Kualitas gambar teks yang ada pada dokumen yang dibaca serta tingkat kompleksitasnya (ukuran, format, teks, warna, latar belakang).

2. Kualitas perangkat lunak aplikasi pengenalan teks itu sendiri. 3. Kualitas alat optik yang dipakai (kamera).

Proses yang dilakukan oleh OCR secara berurutan adalah data capture, prepocessing, segmentation normalization, feature ekstraction, recognition dan postprocessing.

1. Sistem Preprocessing

Perancangan sistem preprocessing menjelaskan alur kerja dalam OCR dalam meyiapkan image sebagai sebagai input gambar yang siap diolah lebih lanjut oleh sistem. Menurut Sukamto (2010) proses preprocessing meliputi prosesproses berikut:

a. Grey Scalling/Thesholding

Proses grey scaling mengubah citra berwarna menjadi hitamputih dengan mengubah warna setiap komponen RGB gambar menjadi bernilai sama. Proses threshold digunakan untuk mengekstrak foreground (tinta) dari background (kertas) dan mengubah menjadi citra biner. Proses Thresholding mengubah warna gambar menjadi citra biner (binary image) dimana ditentukan

31 sebuah nilai level threshold kemudian piksel yang memiliki nilai di bawah level threshold diset menjadi warna putih (0 pada nilai biner) dan nilai di atas nilai threshold diset menjadi warna hitam (1 pada nilai biner).

b. Smoothing

Proses smoothing menggunakan metode Stentiford Boundary untuk menghilangkan detail dan noise dengan memeriksa keterikatan dengan piksel bernilai 0 dengan piksel yang bernilai 1 dan menghitung tetangga piksel yang bernilai 0. Jika piksel yang sedang dicek memenuhi syarat tidak boleh dihapus, maka piksel ditandai sebagai piksel yang tidak boleh dihapus. Smoothing digunakan untuk meminimalisir derau (noise).

c. Scalling

Menskala citra karakter tulisan tangan menjadi lebih kecil agar proses lainnya lebih cepat dan tidak terpengaruh besar citra karakter (pada bagian inti karakter).

d. Stroke Thinning

Proses ini menggunkan metode hybrid di mana menggunakan campuran tiga buah metode yang saling mendukung untuk proses thinning yaitu algoritma thinning Zhang-Suen yang mengecek ketetenggaan dan konektivitas 8-arah pikase, Stentiford Acute Angel Emphasis untuk menandai piksel pada bagian luar yang

32 tidak boleh dihapus, dan algoritma Holt untuk menghapus hasil thinning yang tidak diperlukan (percabangan yang tidak perlu). 2. Sistem Segmentation

Tujuan dari proses segmentasi adalah untuk mempermudah atau menyederhanakan representasi dari citra menjadi sesuatu yang lebih berarti dan mudah dianalisa. (Sukamto: 2010).

3. Normalization

Normalization adalah proses merubah dimensi region tiap karakter dan ketebalan karakter. Dalam OCR, algoritma yang digunakan pada proses ini adalah algoritma Scaling dan Thinning. (Sukamto: 2010).

4. Feature Extraction

Menurut Sukamto (2010) Feature Extraction adalah proses

Dokumen terkait