• Tidak ada hasil yang ditemukan

RANCANG BANGUN APLIKASI BATAK ANGKOLA DICTIONARY MENGGUNAKAN OPTICAL CHARACTER RECOGNITION (OCR) DAN SPEECH RECOGNITION BERBASIS ANDROID

N/A
N/A
Protected

Academic year: 2021

Membagikan "RANCANG BANGUN APLIKASI BATAK ANGKOLA DICTIONARY MENGGUNAKAN OPTICAL CHARACTER RECOGNITION (OCR) DAN SPEECH RECOGNITION BERBASIS ANDROID"

Copied!
145
0
0

Teks penuh

(1)

i

RANCANG BANGUN APLIKASI BATAK ANGKOLA DICTIONARY MENGGUNAKAN OPTICAL CHARACTER RECOGNITION (OCR) DAN

SPEECH RECOGNITION BERBASIS ANDROID

Disusun Oleh :

SYAFRIWAN NASUTION

1111091000002

PROGRAM STUDI TEKNIK INFORMATIKA

FAKULTAS SAINS DAN TEKNOLOGI

UNIVERSITAS ISLAM NEGERI SYARIF HIDAYATULLAH

JAKARTA

(2)

ii SKRIPSI

RANCANG BANGUN APLIKASI BATAK ANGKOLA DICTIONARY MENGGUNAKAN OPTICAL CHARACTER RECOGNITION (OCR) DAN

SPEECH RECOGNITION BERBASIS ANDROID

Oleh:

SYAFRIWAN NASUTION NIM: 1111091000002

Skripsi

Sebagai Salah Satu Syarat Untuk Memperoleh Gelar Sarjana Teknik Informatika

Fakultas Sains dan Teknologi Universitas Islam Negeri (UIN) Syarif Hidayatullah

Jakarta

PROGRAM STUDI TEKNIK INFORMATIKA FAKULTAS SAINS DAN TEKNOLOGI

UNIVERSITAS ISLAM NEGERI SYARIF HIDAYATULLAH JAKARTA

(3)

iii

RANCANG BANGUN APLIKASI BATAK ANGKOLA DICTIONARY MENGGUNAKAN OPTICAL CHARACTER RECOGNITION (OCR) DAN

SPEECH RECOGNITION BERBASIS ANDROID Skripsi

Sebagai Salah Satu Syarat Untuk Memperoleh Gelar Sarjana Teknik Informatika Pada Fakultas Sains dan Teknologi

Universitas Islam Negeri Syarif Hidayatullah Jakarta

Oleh: SYAFRIWAN NASUTION 1111091000002 Menyetujui, Pembimbing I Arini, MT NIP. 19760131 2009012 001 Pembimbing II Feri Fahrianto, M.Sc NIP. 19800829 2011011 002 Mengetahui,

Ketua Program Studi Teknik Informatika Fakultas Sains dan Teknologi Universitas Islam Negeri Syarif Hidayatullah Jakarta

Arini, MT

(4)

iv PERNYATAAN

DENGAN INI SAYA MENYATAKAN BAHWA SKRIPSI INI BENAR-BENAR HASIL KARYA SENDIRI DAN BELUM PERNAH DIAJUKAN SEBAGAI SKRIPSI ATAU KARYA ILMIAH PADA PERGURUAN TINGGI ATAU LEMBAGA MANAPUN.

Jakarta, Mei 2018

Syafriwan Nasution

(5)
(6)

vi ABSTRAK

SYAFRIWAN NASUTION – 1111091000002, Rancang Bangun Aplikasi Batak Angkola dictionary menggunakan Optical Character Recognition (OCR) dan Speech Recognition Berbasis Android di bawah bimbingan Arini S,T. MT dan Feri Fahrianto, M.Sc

Bahasa Batak Angkola merupakan bahasa daerah Tapanuli bagian selatan. Penggunaan bahasa Batak Angkola di luar wilayah teritorinya sudah mengalamai degradasi kebudayaan. Hal ini dapat terlihat dari masyarakat suku Batak Angkola yang telah lama berdomisili diluar wilayah teritorinya seperti Parsadaan Batak Angkola mayoritas anggotanya sudah tidak bisa menggunakan bahasa daerah tersebut. Begitu juga dengan Begitu juga dengan masyarakat pendatang di Tapanuli bagian selatan kesulitan dalam berinteraksi untuk berinteraksi dalam lingkungan sosialnya. Hal ini dikarenakan kurangnya sarana dalam keinginan untuk belajar menggunakan bahasa Batak Angkola. Tentu hal ini menghambat tujuan pemerintah untuk memajukan kebudayaan yang tertuang dalam Undang – undang Republik Indonesia No 5 Tahun 2017 sebagai investasi membangun masa depan dan peradaban bangsa demi terwujudnya tujuan nasional. Untuk dapat berinteraksi dan memahami bahasa yang digunakan oleh setiap daerah diperlukan suatu instrument (alat) untuk menerjemahkan kosa kata. Penelitian ini dilakukan untuk merancang dan membangun aplikasi kamus Batak Angkola berbasis android. Metode pengembangan aplikasi menggunakan Rapid Application Development (RAD). Hasil dari penelitian ini adalah terciptanya sebuah aplikasi kamus bahasa Batak Angkola yang menggunakan fitur Optical Character Recognition (OCR) dan

Speech Recognition yang dapat membantu masyarakat untuk memenuhi kebutuhan

dalam penyediaan sarana pembelajaran dan misi pemerintah dalam memajukan kebudayaan.

Kata Kunci: Batak Angkola, Kamus Bahasa Batak Angkola, Rapid Application

Development (RAD), Optical Character Recognition (OCR), Speech Recognition,

(7)

vii KATA PENGANTAR

Assalamu’alaikum Wr.Wb

Allhamdulillaahirabbil’alammin, puji syukur kehadirat Allah SWT yang

telah memberikan taufiq dan hidayah-Nya serta rahmat dan maghfirah-Nya sehingga penulis dapat menyelesaikan penyusunan skripsi ini dengan baik. Shalawat serta salam tercurah kepada suri tauladan kita, Nabi Muhammad SAW, semoga di akhir zaman kita mendapat syafa’at dari beliau, aamiin.

Skripsi ini disusun untuk memenuhi salah satu syarat menyelesaikan program sarjana (S-1) pada program studi Teknik Informatika, Fakultas Sains dan Teknologi, Universitas Islam Negeri Syarif Hidayatullah Jakarta.

Ucapan terima kasih penulis tujukan kepada :

1. Bapak Dr. Agus Salim, M.Si, selaku Dekan Fakultas Sains dan Teknologi, Universitas Islam Negeri Syarif Hidayatullah Jakarta.

2. Ibu Arini,ST. MT. Selaku Ketua Program Studi Teknik Informatika, dan Bapak Feri Fahrianto, M.Sc. selaku Sekretaris Program Studi Teknik Informatika, Fakultas Sains dan Teknologi UIN Syarif Hidayatullah Jakarta.

3. Ibu Arini, ST. MT. dan Bapak Feri Fahrianto, M.Sc, selaku Dosen Pembimbing yang telah memberikan banyak nasihat, saran, dan bimbingan yang bermanfaat kepada penulis selama penyusunan skripsi ini.

4. Seluruh dosen dan staff UIN Jakarta khususnya Fakultas Sains dan Teknologi yang telah memberikan ilmu dan pengalaman yang sangat berharga bagi penulis.

(8)

viii

5. Kedua Orang Tua Penulis yang tidak henti-hentinya selalu memberikan semangat dan dukungan baik dalam bentuk do’a, materi serta kasih sayang yang melimpah.

6. Sahabat-sahabat dan orang tersayang, khususnya Rani Ulfa Ritonga, Imam Munandar Hrp, Rizan Setrisman dan sahabat-sahabat yang tidak bisa disebutkan satu persatu yang selalu memberikan semangat, motivasi dan mendukung satu sama lain.

7. Sahabat-sahabat tim mardam sampe buccut yang selalu ada dalam suka dan duka sejak awal perkuliahan.

8. Seluruh teman-teman angkatan TI-A 2011 penulis ucapkan terima kasih atas bantuan nya selama menjalani perkuliahan di teknik informatika.

9. Seluruh pihak yang banyak berjasa dalam penulisan laporan ini yang tidak dapat penulis sebutkan satu persatu namun tidak mengurangi sedikit pun rasa terima kasih dari penulis.

Hanya ucapan terima kasih dan doa yang dapat penulis berikan, semoga Allah SWT membalas kebaikan serta melimpahkan berkah dan rahmat-Nya kepada seluruh pihak yang telah membantu penulis selama ini. Penulis menyadari bahwa skripsi ini jauh dari kata sempurna, oleh karena itu penulis sangat mengharapkan kritik dan saran yang bersifat membangun dari pembaca ke alamat email

[email protected]. Semoga skripsi ini dapat memberi manfaat bagi semua. Aamiin Aamiin ya Robbal ‘alamiin.

(9)

ix

Wassalamu’alaikum Wr. Wb

Jakarta, Mei 2018

Syafriwan Nasution NIM. 1111091000002

(10)

x DAFTAR ISI BAB I PENDAHULUAN ... 1 1.1 LATAR BELAKANG ... 1 1.2 RUMUSAN MASALAH ... 6 1.3 BATASAN MASALAH ... 7 1.4 TUJUAN PENELITIAN ... 7 1.5 MANFAAT PENELITIAN ... 8 1.5.1 Bagi Peneliti ... 8 1.5.2 Bagi Universitas ... 8 1.6 METODE PENELITIAN ... 9

1.6.1 Metode Pengumpulan Data ... 9

1.6.1a Studi Lapangan ... 9

1.6.1b Studi Riset ... 10

1.6.2 Metode Pengembangan RAD ... 10

1.7 SISTEMATIKA PENULISAN ... 12

BAB II LANDASAN TEORI ... 14

2.1 Pengertian Aplikasi ... 14

2.1.1 Pengertian Mobile Application ... 14

2.1.2 Karakteristik perangkat mobile ... 15

2.2 Konsep Dasar Sistem Informasi ... 16

2.2.1 Sistem ... 16

2.2.2 Informasi ... 16

(11)

xi

2.2.2 Komponen Sistem Informasi... 19

2.3 Kamus ... 19

2.4 Bahasa Indonesia ... 21

2.5 Bahasa Batak Angkola ... 24

2.6 Natural Language Processing ... 25

2.7 Optical Character Recognition ... 27

2.7.1 Pengertian OCR ... 27

2.7.2 Cara Kerja OCR ... 29

2.8 Android ... 33

2.8.1 Pembahasan Umum Android ... 33

2.8.2 Persyaratan Perangkat Keras ... 35

2.8.3 Pembahasan Umum Android ... 36

2.9 Pengembangan Aplikasi Android ... 36

2.9.1 Android SDK ... 38

2.10 Java Programming Languange ... 40

2.10.1 Java ... 40

2.10.2 Komponen Java ... 41

2.11 Metodologi Penelitian ... 42

2.11.1 Metode pengumpulan data ... 42

2.11.2 Observasi ... 43

2.11.3 Wawancara ... 43

(12)

xii

2.11.5 Tinjaun Pustaka ... 44

2.12 Pemodelan Sistem ... 44

A. Metode pengumpulan data ... 44

2.12.1 Simbol-simbol flowchart ... 46

2.12.2 Unified Modelling Language (UML) ... 48

2.12.3 Diagram UML ... 50

2.12.4 Database : SQL Lite ... 52

2.13 Metodologi Pengembangan RAD ... 55

A. Fase dan tahapan pengembangan aplikasi ... 56

B. Kelebihan dan kekurangan RAD ... 58

BAB III METEDOLOGI PENELITIAN ... 60

3.1 Metode Pengumpulan Data ... 60

3.1.1 Studi Lapangan... 60

3.1.1a Observasi ... 60

3.1.1b Wawancara ... 61

3.1.2 Studi Riset ... 61

3.1.2a Studi Pustaka/Buku ... 61

3.1.2b Studi Literatur ... 62

3.2 Metode Pengembangan Sistem ... 64

3.2.1 Fase Perencanaan syarat-syarat ... 64

3.2.2 Fase workshop desain RAD ... 65

(13)

xiii

3.3 Kerangka Berpikir Penelitian ... 68

BAB IV ANALISIS DAN PERANCANGAN SISTEM ... 69

4.1 Fase Requirements Planning ... 69

4.1.1 Tujuan Aplikasi ... 69

4.1.2 Identifikasi Syarat Informasi ... 69

A. Identifikasi Masalah ... 69

B. Analisis sistem usulan ... 70

C. Syarat-syarat pengembangan sistem... 70

4.2 Fase Workshop Design ... 69

4.2.1 Tahap Perancangan Sistem ... 69

4.2.1.1 Identifikasi Aktor ... 71

4.2.1.2 Usecase Diagram ... 72

4.2.1.3 Use case scenario ... 73

4.2.1.4 Activity Diagram ... 77

4.2.1.5 Class Diagram ... 81

4.2.1.6 Sequence Diagram ... 82

4.2.2 Tahap Perancangan User Interface ... 85

4.2.2.2 User interface menu utama ... 86

4.2.2.3 User interface cari kata ... 86

4.2.2.4 User interface cari dengan gambar ... 87

4.2.2.5 User interface cari dengan suara ... 87

(14)

xiv

BAB V HASIL DAN PEMBAHASAN ... 89

5.1 Implementation ... 89

5.1.1 Penulisan Script (Coding) ... 89

1. Android studio ... 89

2. Java ... 89

1. Coding splashscreen aplikasi ... 90

2. Coding menu utama ... 91

3. Coding menu cari kata ... 92

4. Coding menu cari dengan gambar ... 96

5. Coding menu cari dengan suara ... 102

6. Coding menu tentang aplikasi ... 106

5.2 Pengujian ... 107

BAB VI PENUTUP ... 117

6.1 Kesimpulan ... 117

6.2 Saran ... 117

(15)

xv DAFTAR TABEL

Tabel 4.1 Skenario Usecase cari kata bahasa Batak Angkola-indonesia ... 74

Tabel 4.2 Skenario Usecase cari kata Indonesia-bahasa Batak Angkola... 74

Tabel 4.3 Skenario Usecase cari gambar bahasa Batak Angkola-indonesia .... 74

Tabel 4.4 Skenario Usecase cari gambar Indonesia-bahasa Batak Angkola .... 75

Tabel 4.5 Skenario Usecase cari suara bahasa Batak Angkola-indonesia ... 76

Tabel 4.6 Skenario Usecase tentang ... 77

Tabel 5.1 Pengujian versi android ... 107

Tabel 5.2 Pengujian user interface ... 109

Tabel 5.3 Pengujian fungsi aplikasi cari kata... 113

Tabel 5.4 Pengujian fungsi aplikasi cari dengan gambar ... 114

Tabel 5.5 Pengujian fungsi aplikasi cari dengan suara ... 115

(16)

xvi DAFTAR GAMBAR

Gambar 2.1 Ilustrasi proses OCR ... 29

Gambar 2.2 Simbol penghubung flowchart ... 47

Gambar 2.3 Simbol proses flowchart ... 47

Gambar 2.4 Simbol input-output ... 48

Gambar 2.5 Siklus RAD ... 56

Gambar 3.1 Kerangka berpikir penelitian ... 68

Gambar 4.1 Usecase Diagram ... 72

Gambar 4.2 Activity Diagram cari kata ... 78

Gambar 4.3 Activity Diagram cari dengan gambar ... 79

Gambar 4.4 Activity Diagram cari dengan suara ... 80

Gambar 4.5 Class Diagram aplikasi kamus ... 81

Gambar 4.6 Sequence Diagram cari kata ... 82

Gambar 4.7 Sequence Diagram cari dengan gambar ... 83

Gambar 4.8 Sequence Diagram cari dengan suara ... 84

Gambar 4.9 Perancangan splash screen ... 85

Gambar 4.10 Perancangan menu utama ... 86

Gambar 4.11 User interface cari kata ... 86

Gambar 4.12 User interface cari dengan gambar ... 87

Gambar 4.13 User interface cari dengan suara ... 87

Gambar 4.14 User interface tentang ... 88

(17)

xvii

Gambar 5.2 Coding menu utama aplikasi ... 91

Gambar 5.3 Coding menu cari kata... 92

Gambar 5.4 Coding menu cari dengan gambar ... 96

Gambar 5.5 Coding menu cari dengan suara ... 102

Gambar 5.6 Coding menu tentang aplikasi ... 106

Gambar 5.7 Compatibel versi android 6.0 ... 108

Gambar 5.8 Compatibel versi android 8.1.0 ... 109

Gambar 5.9 Tampilan splash screen aplikasi ... 110

Gambar 5.10 Tampilan menu utama aplikasi ... 111

Gambar 5.11 Tampilan menu cari dengan gambar aplikasi ... 111

Gambar 5.12 Tampilan menu cari dengan suara ... 112

Gambar 5.13 Tampilan tentang aplikasi ... 112

Gambar 5.14 Tampilan pengujian menu cari kata ... 113

Gambar 5.15 Tampilan pengujian menu cari dengan gambar ... 114

Gambar 5.16 Tampilan pengujian menu cari dengan suara ... 115

(18)

xviii Use Case Diagram

(Rosa dan Shalahuddin, 2015: 156-160)

Simbol Nama Komponen Keterangan

Actor

Orang,

proses, atau sistem lain yang berinteraksi dengan sistem informasi yamg akan dibuat di luar sistem informasi yang akan dibuat itu sendiri.

nama use case Use Case

Fungsionalita s yang disediakan sistem sebagai unit-unit yang saling bertukar pesan antar unit atau aktor, biasanya dinyatakan menggunakan kata kerja di awal frase nama use case Assosiasi/associatio

n

Komunikasi antara aktor dan use

(19)

xix

Simbol Nama Komponen Keterangan

case yang

berpartisipasi pada

use case, atau use

case memiliki interkasi dengan aktor Menggunakan/ include Relasi use case tambahan ke

suatu use case

dimana use case

yang ditambahkan memerlukan use case

ini untuk menjalankan fungsinya atau sebagai syaratdijalankan use case ini. Ektensi/extend Relasi use case tambahan ke

sebuah use case,

(20)

xx

Simbol Nama Komponen Keterangan

yang ditambahkan dapat berdiri sendiri walau tampa use case tambahan itu.

(21)

xxi Activity Diagram

(Rosa dan Shalahuddin, 2015: 162-163)

Simbol Nama Komponen Keterangan Status Awal Status awal aktifitas sistem, sebuah diagram aktifitas memiliki sebuah status awal.

Aktivitas

Aktivitas

Aktifitas yang dilakukan sistem, aktifitas biasanya diawali dengan kata kerja

Percabangan/

decision

Asosiasi percabangan dimana jika ada pilihan aktifitas lebih dari satu.

Status akhir

Status akhir yang dilakukan sistem, sebuah diagram

(22)

xxii

Simbol Nama

Komponen

Keterangan

aktifitas memiliki sebuah status akhir.

Swimflane

Memisahkan organisasi bisnis yang bertanggung jawab terhadap aktifitas yang terjadi.

(23)

xxiii Class Diagram

(Rosa dan Shalahuddin, 2015: 144-147)

Simbol Nama Komponen Keterangan Kelas Kelas pada struktur system Asosiasi/asso ciation Relasi antar kelas dengan makna umum, biasanya disertai dengan multiplicity. Asosiasi/asso ciation Relasi antar kelas dengan makna umum, biasanya disertai dengan

multiplicity.

Generalisasi

Relasi antar kelas dengan makna

generalisasi-spesialisasi (umum-khusus)

(24)

xx Sequence Diagram

(Rosa dan Shalahuddin, 2015: 165-167)

Simbol Nama

Komponen

Keterangan

Tanpa waktu aktif

Aktor/actor

Orang, proses, atau sistem lain yang berinteraksi dengan sistem informasi yamg akan dibuat di luar sistem informasi yang akan dibuat itu sendiri.

Garis hidup/ lifeline

Menyatakan kehidupan suatu objek

Waktu aktif

Menyatakan objek dalam keadaan aktif dan berinteraksi, semua yang terhubung dengan waktu aktif ini adalah sebuah tahapan yang dilakukan di dalamnya.

(25)

xxi

Simbol Nama

Komponen

Keterangan

Pesan tipe call

Meyatakan suatu objek memanggil operasi/ metode yang ada pada objek lain atau dirinya sendiri. Arah panah mengarah pada objek yang memiliki operasi/ metode.

Pesan tipe return

Menyatakan bahwa suatu objek yang telah menjalankan suatu operasi atau metode menghasilkan suatu kembalian ke objek tertentu, arah panah mengarah pada objek

yang menerima

(26)

1 BAB I

PENDAHULUAN

1.1 Latar Belakang

Indonesia merupakan negara kepulauan yang memiliki suku bangsa, budaya, dan bahasa yang beragam dimana setiap bahasa menjadi sarana komunikasi yang sangat penting dalam melakukan interaksi. Pentingnya komunikasi dalam bentuk bahasa yang terarah dari kedua belah pihak dalam berinteraksi menjadi tolak ukur sampai tidaknya pesan yang disampaikan. Suku bangsa adalah kelompok etnis dan budaya masyarakat yang terbentuk secara turun temurun. sebagai bagian dari sistem budaya masyarakat, identitas dan atribut kesukuan dari suatu kelompok masyarakat akan diwariskan pada generasi berikutnya. secara kultural, identitas dan atribut suku bangsa langsung melekat pada setiap orang (akhsan et al,2010).

Salah satu alat komunikasi yang dipakai adalah telepon genggam atau telepon selular (ponsel). Telepon genggam merupakan perangkat telekomunikasi yang mempunyai kemampuan dasar sama dengan telepon konvensional yang sering kita kenal telepon rumah namu telepon selular mampu dibawa kemana-mana dan tetap dapat berkomunikasi tanpa harus terhubung dengan jaringan telepon kabel. Perkembangan telepon seluar atau handphone saat ini semakin maju. Mulai dari super handphone dengan spesifikasi processor dan pengolahan gambar yang canggih, teknologi kamera ponsel yang menyamai kamera profesional, hingga ponsel yang bisa digunakan sebagai televisi. Karena itulah telepon selular saat ini lebih dikenal dengan sebutan smartphone (suryadharma et al,2014).

(27)

2 Banyak Aplikasi yang terdapat pada telepon genggam ,salah satunya aplikasi penerjemah. Secara umum penerjemahan didefinisikan sebagai transfer teks dari bahasa sumber ke bahasa sasaran. Dalam konteks ini, terjemahan minimal melibatkan dua bahasa (Catford, 1965). Selanjutnya, Catford menyatakan bahwa terjemahan adalah penggantian materi tekstual dalam satu bahasa (bahasa sumber) oleh materi tekstual yang setara dalam bahasa (bahasa sasaran). Dengan demikian penerjemahan dapat dipahami tidak hanya melibatkan pengiriman pesan dari bahasa sumber ke dalam bahasa sasaran tetapi juga untuk melakukan berbagai penyesuaian yang diperlukan sehingga hasil terjemahan dapat diterima oleh pembaca bahasa sasaran.

Suku Batak di Sumatera Utara terbagi menjadi 6 yaitu, Batak Toba, Batak Karo, Batak Pakfak, Batak Simalungun, Batak Angkola, Batak Mandailing.Dan setiap suku batak memiliki tatanan Bahasa yang berbeda (Hasibuan 1972). Suku Batak Angkola Adalah salah satu suku batak yang bermukim di daerah angkola yang berada di kabupaten Tapanuli Selatan provinsi Sumatera Utara.

Dalam melakukan observasi dan wawancara dalam persadaan Batak Angkola pada tanggal 18 april 2018 didapati permasalahan diantaranya masyarakat suku Batak Angkola yang tinggal di luar wilayah teritorinya telah mengalami degradasi kebudayaan. masyarakat suku Batak Angkola yang telah lama berdomisili diluar wilayah teritorinya mayoritas sudah tidak bisa menggunakan Bahasa tersebut. Begitu juga dengan masyarakat pendatang di Tapanuli bagian selatan. Tapanuli bagian selatan merupakan salah satu daerah yang memiliki beragam jenis suku baik itu suku asli maupun pendatang. Populasi masyarakat

(28)

3 pendatang semakin meningkat, terutama semenjak adanya transmigrasi saat jaman pemerintahan soeharto dalam rangka pemerataan persebaran penduduk di indonesia.

Bahasa yang dipakai oleh masyarakat asli tapanuli selatan atau masyarakat luar tapanuli selatan untuk dapat berinteraksi adalah Bahasa Batak Angkola. Tapanuli bagian selatan sebagai salah satu daerah yang memiliki beragam jenis suku di daerah teritorinya seperti suku jawa, suku minang, melayu maupun suku batak lainnya. Selain itu suku Batak Angkola tersebar di wilayah Indonesia seperti Jakarta.

Parsadaan Batak Angkola JABODETABEK merupakan perkumpulan suku Batak Angkola yang berasal maupun keturunan dari daerah tapanuli bagian selatan yang berdomisili di wilayah JABODETABEK. Anggota parsadaan Batak Angkola memiliki beragam profesi seperti Darmin Nasution Menteri koordinator bidang perekonomian indonesia, Muhammad Ribai Subhanda Lubis pejabat eselon I bidang kesejahteraan di sekretariat negara republik indonesia, dll.

Dalam melakukan penelitian di lingkungan Trans atau wilayah pendatang. Masyarakat pendatang mayoritas belum menguasai dan kesulitan untuk berinteraksi menggunakan bahasa daerah tersebut. Hal ini dikarenakan pengaruh lingkungan yang berbeda dan kurangnya sarana dalam keinginan untuk belajar Bahasa Batak Angkola. Hal ini jelas menghambat tujuan pemerintah untuk memajukan kebudayaan yang tertuang dalam Undang – undang Republik Indonesia No 5 Tahun 2017 pasal 1 ayat 3 tentang Pemajuan Kebudayaan yang berisi kebudayaan sebagai

(29)

4 investasi membangun masa depan dan peradaban bangsa demi terwujudnya tujuan nasional.

Untuk dapat berinteraksi dan memahami bahasa yang digunakan oleh setiap daerah diperlukan suatu instrument (alat) untuk menerjemahkan kosa kata. Kamus adalah salah satu instrument yang bisa digunakan sehingga perbedaan bahasa tidak menjadi kendala dalam berinteraksi. Namun, Kamus Batak Angkola hanya terdapat di Perpustakaan Daerah Tapanuli Selatandan tidak banyak diketahui oleh masyarakat asli maupun masyarakat pendatang tapanuli bagian selatam. Selain jumlahnya yang terbatas, Kamus Batak Angkola masih berbentuk buku sehingga membutuhkan waktu yang relatif lama untuk mencari kosakata yang diinginkan dan dirasa kurang efektif dalam penggunaannya.

Aplikasi kamus dapat memiliki berberapa fitur, misalnya fitur OCR. Optical

character recognition (OCR) merupakan teknologi untuk mengkonversi image

menjadi sebuah teks, dengan menggunakan library tess two. Pengembangan aplikasi ini menggunakan metode RAD Selain aplikasi OCR, akan dikembangkan juga aplikasi kamus dengan memanfaatkan image sebagai input dengan menggunakan teknologi OCR serta database processing untuk proses penerjemahan (rellyani 2013).

Kemudia fitur selanjutnya yang ada pada kamus adalah Pengenalan ucapan atau suara (speech recognition). speech recognition adalah suatu teknik yang memungkinkan system komputer untuk menerima input berupa kata yang diucapkan. Kata-kata tersebut diubah bentuknya menjadi sinyal digital dengan cara

(30)

5 mengubah gelombang suara menjadi sekumpulan angka lalu disesuaikan dengan kodekode tertentu dan dicocokkan dengan suatu pola yang tersimpan dalam suatu perangkat (Budiman et al,2014).

Penelitian mengenai aplikasi kamus telah banyak dilakukan oleh peneliti sebelumnya. Hal ini menunjukkan bahwa aplikasi kamus merupakan aplikasi yang sangat dibutuhkan oleh pengguna untuk memudahkan dalam pencarian kosa kata yang berbasis android. Penelitian tersebut diantaranya dilakukan oleh Novita Rellyani (2013) dalam penelitian nya yang berjudul “PENERAPAN OPTICAL

CHARACTER RECOGNITION (OCR) UNTUK RANCANG BANGUN

APLIKASI TRANSLATOR PADA PLATFORM ANDROID”. Kesimpulan dari penelitian ini adalah penggunaan OCR dalam translator mempermudah proses input, Pengenalan huruf menggunkan OCR terpengaruh dengan banyaknya cahaya dan jarak fokus kamera yang digunakan dan teks yang akan diambil, Huruf yang dapat dikenali dengan baik oleh OCR adalah huruf yang tegak dan tebal dengan size huruf minimal 20.

Pada perancangan aplikasi kamus yang penulis buat ini, terdapat beberapa kelebihan jika dibandingkan dengan penelitian sebelumnya yaitu fitur pada aplikasi yang lebih komplit seperti terdapat fitur OCR pada aplikasi yang penulis buat dapat mengenali tulisan dengan font apa saja dan dapat mengenali karakter teks pada

backgound yang tidak polos atau bermotif. Selanjutnya kelebihan yang ditawarkan

adalah penggunaan system Google Cloud Vision API pada OCR yang mana dalam peneletian sebelumnya masih menggunakan system tesseract.

(31)

6 Terakhir, penggunaan fitur speech recognition yang memungkinkan sistem komputer untuk menerima input berupa kata yang diucapkan kemudian mengkoversikan nya kedalam text sehingga dalam pencarian kata akan mempersingkat waktu dalam pencariannya.

Merujuk latar belakang diatas, mendorong peneliti untuk membuat suatu aplikasi kamus berbasis android yang memiliki keunggulan dibandingkan dengan aplikasi yang telah ada sebelumnya. Hal ini juga menjadikan alasan penelitian melakukan penelitian dengan judul “RANCANG BANGUN APLIKASI BATAK ANGKOLA DICTIONARY MENGGUNAKAN OPTICAL CHARACTER RECOGNITION (OCR) DAN SPEECH RECOGNITION BERBASIS ANDROID”

1.2 Rumusan Masalah

Seperti telah dipaparkan sebelumnya pada latar belakang, bahwa peneliti menawarkan lebih banyak keunggulan seperti, fitur speech recognition, OCR yang dapat mengenali semua jenis dan tipe huruf , dan penggunaan sistem Google Cloud Vision API, maka identifikasi masalah yang didapat ialah sebagai berikut:

1. Bagaimana Merancang dan Membangun Aplikasi Batak Angkola Dictionary? 2. Bagaimana penerapan sistem Optical character recognition (OCR) (yang dapat

mengenali semua jenis dan tipe huruf background menggunakan Google Cloud Vision API) dalam Merancang dan Membangun Aplikasi Batak Angkola

(32)

7 3. Bagaimana penerapan sistem Speech recognition dalam Merancang dan

Membangun Aplikasi Batak Angkola Dictionary ?.

Berdasarkan identifikasi masalah di atas, dapat disimpulkan bahwa rumusan masalah yang akan dibahas pada penelitian ini adalah: “Bagaimana Merancang dan Membangun Aplikasi Batak Angkola Dictionary Menggunakan Optical Character Recognition (OCR) dan Speech Recognition Berbasis Android.?”

1.3 Batasan Masalah

1.3.1 Metode

1. Metode pengumpulan data yang digunakan dalam penelitian ini adalah metode observasi , wawancara dan studi literature.

2. Metode pengembangan sistem yang dipakai dalam penelitian ini adalah Rapid

Aplication Development.

1.3.2 Tools

1. Pembuatan aplikasi menggunakan Android Studio versi 3.1.2

2. Aplikasi ini menggunakan library Google Cloud Vision API untuk scanning text pada image (OCR) dan Google voice untuk pengambilan text melalui input suara.

1.3.3 Proses

1. Aplikasi kamus ini menerjemahkan bahasa Batak Angkola ke bahasa Indonesia dan juga sebaliknya.

(33)

8 2. Aplikasi ini diperuntukan hanya pada pengguna smartphone dengan

operasi sistem android.

1.4 Tujuan Penelitian

Tujuan umum dari penelitian ini yaitu menghasilkan sebuah perencanaan. Sedangkan tujuan khususnya menghasilkan:

1. Merancang dan Membangun Aplikasi Batak Angkola Dictionary.

2. Penerapan sistem Optical character recognition (OCR) (yang dapat mengenali semua jenis dan tipe huruf background menggunakan Google Cloud Vision API) dalam Merancang dan Membangun Aplikasi Batak Angkola Dictionary. 3. Penerapan sistem Speech recognition dalam Merancang dan Membangun

Aplikasi Batak Angkola Dictionary.

1.5 Manfaat Penelitian

Berdasarkan pertanyaan dan tujuan penelitian yang telah disebutkan, maka diharapkan penelitian ini menghasilkan manfaat sebagai berikut:

1.5.1 Bagi Peneliti

1. Menerapkan ilmu-ilmu yang diperoleh pada waktu perkuliahan.

2. Membandingkan teori yang telah didapat pada saat perkuliahan dengan masalah yang sebenarnya.

(34)

9 3. Untuk memenuhi salah satu syarat kelulusan strata satu (s1) Teknik

informatika fakultas sains dan teknlogi uin syarif hidayatullah Jakarta.

1.5.2 Bagi Universitas

1. Mengetahui kemampuan mahasiswa dalam menguasai materi perkuliahan yang diperoleh di bangku kuliah.

2. Mengetahui kemampuan mahasiswa dalam menerapkan ilmunya dan sebagai bahan evaluasi.

3. Memberikan gambaran tentang kesiapan mahasiswa dalam menerapkan ilmunya dan sebagai bahan evaluasi.

1.6 Metode Penelitian

Untuk melakukan analisis-analisis dalam penelitian ini, penulis melakukan pengumpulan data-data terkait yang menunjang pengembangan sistem ini dengan beberapa cara antara lain:

1.6.1 Metode Pengumpulan Data

1.6.1.a Studi Lapangan

1. Observasi

Menurut Sugiyono (2012), observasi merupakan teknik pengumpulan data yang mempunyai ciri yang spesifik bila dibandingkan dengan teknik yang lain yaitu wawancara dan kuesioner. Karena observasi tidak selalu dengan

(35)

10 obyek manusia tetapi juga obyek-obyek alam yang lain. Sutrisno (dalam Sugiyono, 2012) mengemukakan bahwa, observasi merupakan suatu proses yang kompleks, suatu proses yang tersusun dari berbagai proses biologis dan psikologis. Dua diantara yang terpenting adalah proses-proses pengamatan dan ingatan.

2. Wawancara

Wawancara digunakan sebagai teknik pengumpulan data apabila peneliti ingin melakukan studi pendahuluan untuk menemukan masalah yang harus diteliti dan juga apabila peneliti ingin mengetahui hal-hal dari responden yang lebih mendalam dan jumlah respondenya sedikit / kecil. Wawancara dapat dilakukan secara terstruktur (peneliti telah mengetahui dengan pasti tentang informasi apa yang akan diperoleh) maupun tidak terstruktur (peneliti tidak menggunakan pedoman wawancara yang telah tersusun secara sistematis dan lengkap sebagai pengumpul datanya) dan dapat dilakukan secara langsung (tatap muka) maupun secara tidak langsung (melalui media seperti telepon) (Sugiyono, 2012).

1.6.1.b Studi Riset

1. Studi dokumen

Studi dokumen, yaitu memperoleh data langsung dari tempat penelitian, meliputi buku-buku yang relevan, peraturan-peraturan, laporan kegiatan, foto- foto, film documenter, serta data yang berkaitan dengan penelitian (Guritno et al. , 2011).

(36)

11 2. Studi literatur

Studi literatur sejenis dilakukan untuk menambah referensi teori-teori yang dilakukan dalam penelitian serta mempelajari literatur yang dapat mendukung penelitian terhadap perencanaan strategis sistem informasi.

1.6.2 Metode pengembangan RAD

Metode yang digunakan dalam merancang aplikasi Batak Angkola dictionary menggunakan optical character recognition (OCR) dan speech recognition yang terdiri dari fase :

1. Requirement Planning (Perencanaan syarat-syarat)

Dalam fase ini, pengguna dan penganalisis bertemu untuk mengidentifikasikan tujuan-tujuan aplikasi atau sistem serta untuk megidentifikasikan syarat-syarat informasi yang ditimbulkan dari tujuan-tujuan tersebut. Orientasi dalam fase ini adalah menyelesaikan masalah-masalah perusahaan. Meskipun teknologi informasi dan sistem bisa mengarahkan sebagian dari sistem yang diajukan, fokusnya akan selalu tetap pada upaya pencapaian tujuan-tujuan perusahaan (Kendall, 2010).

2. RAD Design Workshop (Workshop Desain RAD)

Fase ini adalah fase untuk merancang dan memperbaiki yang bisa digambarkan sebagai workshop. Penganalisis dan dan pemrogram dapat bekerja membangun dan menunjukkan representasi visual desain dan pola kerja kepada pengguna.

Workshop desain ini dapat dilakukan selama beberapa hari tergantung dari

(37)

12 pengguna merespon prototipe yang ada dan penganalisis memperbaiki modul-modul yang dirancang berdasarkan respon pengguna. Apabila sorang pengembangnya merupakan pengembang atau pengguna yang berpengalaman, Kendall menilai bahwa usaha kreatif ini dapat mendorong pengembangan sampai pada tingkat terakselerasi (Kendall, 2010).

3. Implementation (implementasi)

Pada fase implementasi ini, penganalisis bekerja dengan para pengguna secara intens selama workshop dan merancang aspek-aspek bisnis dan nonteknis perusahaan. Segera setelah aspek-aspek ini disetujui dan sistem-sistem dibangun dan disaring, sistem-sistem baru atau bagian dari sistem diujicoba dan kemudian diperkenalkan kepada organisasi (Kendall, 2010).

1.7 Sistematika Penulisan

Dalam penyusunan skripsi ini terdiri dari 5 (lima) bab dengan beberapa sub pokok bahasan. Adapun sistematika penulisan dari skripsi ini adalah sebagai berikut: BAB I PENDAHULUAN

Bab ini berisikan latar belakang, rumusan masalah, batasan masalah, tujuan penelitian, metodologi penelitian, tujuan, manfaat dan sistematika penulisan.

BAB II LANDASAN TEORI

Bab ini menguraikan teori yang terkait dengan konsep rancang bangun Batak Angkola dictionary menggunakan Optical Speech

(38)

13

recognition (OCR) dan Speech recognition berbasis android serta

alat bantu analisis yang digunakan. BAB III METODOLOGI PENELITIAN

Bab ini membahas kerangka berfikir penulis dalam melakukan penelitian ini dan membahas metodologi yang digunakan dalam penelitian ini yang pertama metode pengumpulan data yaitu observasi, wawancara serta tinjauan studi pustaka.

BAB IV ANALISIS PERANCANGAN APLIKASI

Bab ini membahas mengenai penjelasan rancang bangun Batak Angkola dictionary menggunakan Optical Speech recognition (OCR) dan Speech recognition berbasis android.

BAB V HASIL DAN PEMBAHASAN

Bab ini akan diuraikan dan membahas proses perancangan dan pengembangan system yang meliputi hasil dari metedologi penelitian yang telah dilakukan.

BAB VI PENUTUP

Bab ini berisi kesimpulan dari uraian yang sudah diterangkan pada bab - bab sebelumnya dan juga berisi saran untuk pengembangan lebih lanjut.

(39)

14 BAB II

Landasan Teori

2.1 Pengertian aplikasi

Menurut Buyens (2014) aplikasi adalah suatu unit perangkat lunak yang dibuat untuk melayani kebutuhan akan berbagi aktivitas. Jika akan mengembangkan program aplikasi sendiri, maka untuk menulis program aplikasi tersebut, dibutuhkan suatu Bahasa pemogramman yaitu language software, yang dapat berbentuk assambler, complier atau interpreter. Jadi language software merupakan bahasanya dan program yang ditulis merupakan program aplikasinya. Language software berfungsi agar dapat menulis program dengan bahasa yang lebih mudah, dan akan menterjemahkan dalam bahasa mesin supaya bisa dimengerti oleh komputer.

2.1.1 Pengertian mobile application

Menurut Buyens (2014) aplikasi mobile berasal dari kata application dan mobile. Application yang artinya penerapan, lamaran, penggunaan. Secara istilah aplikasi adalah program siap pakai yang direka untuk melaksanakan suatu fungsi bagi pengguna atau aplikasi yang lain dan dapat digunakan oleh sasaran yang dituju sedangkan mobile dapat di artikan sebagai perpindahan dari suatu tempat ke tempat yang lain.

Maka aplikasi mobile dapat di artikan sebuah program aplikasi yang dapat dijalankan atau digunakan walaupun pengguna berpindah – pindah dari satu tempat

(40)

15 ke tempat yang lain serta mempunyai ukuran yang kecil. Aplikasi mobile ini dapat di akses melalui perangkat nirkabel, pager, PDA, telepon seluler, smartphone, dan perangkat sejenisnya.

2.1.2 Karakteristik perangkat mobile

Perangkat mobile memiliki berbagai jenis dalam hal ukuran,design dan layout tetapi mereka memiliki kesamaan karakteristik yang sangat berbeda dari sistem desktop, yaitu antara lain:

• Ukuran yang kecil

Perangkat mobile memiliki ukuran yang kecil. Konsumen menginginkan perangkat yang terkecil untuk kenyamanan dan mobilitas mereka.

• Memory yang terbatas

Perangkat mobile juga memiliki memory yang kecil, yaitu primary (RAM) dan secondary (disk). Pembatasan ini adalah salah satu faktor yang 11 mempengaruhi penulisan program untuk berbagai jenis dari perangkat ini. Dengan pembatasan jumlah dari memory, pertimbangan-pertimbangan khusus harus

diambil untuk memelihara pemakaian dari sumber daya yang mahal ini. • Daya proses yang terbatas

Sistem mobile tidaklah setangguh rekan mereka yaitu desktop. Ukuran, teknologi dan biaya adalah beberapa faktor yang mempengaruhi status dari sumber

(41)

16 daya ini. Sepertiharddisk dan RAM, Anda dapat menemukan mereka dalam ukuran yang pas dengan sebuah kemasan kecil.

• Konektivitas yang terbatas

Perangkat mobile memiliki bandwith rendah, beberapa dari mereka bahkan tidak tersambung. Kebanyakan dari mereka menggunakan koneksi wireless

• Konektivitas yang terbatas

Perangkat mobile memiliki bandwith rendah, beberapa dari mereka bahkan tidak tersambung. Kebanyakan dari mereka menggunakan koneksi wireless. 2.2 Konsep Dasar Sistem Informasi

2.2.1 Sistem

Sistem adalah sekumpulan elemen yang saling terkait atau terpadu yang dimaksud untuk mencapai tujuan. Sebagai gambaran, jika dalam sebuah system terdapat elemen yang tidak memberikan manfaat dalam mencapai tujuan yang sama, maka elemen tersebut dapat dipastikan bukanlah bagian dari system (Kadir,2013).

2.2.2 Informasi

sedangkan Informasi adalah sebagai hasil dari pengolahan data dalam suatu bentuk yang lebih berguna dan lebih berarti bagi penerimanya yang menggambarkan suatu kejadian-kejadian (event) yang nyata (fact) yang digunakan untuk pengambilan keputusan (Kusnendi,2011).

(42)

17 1. Ciri-ciri Informasi

Informasi itu memiliki ciri-ciri sebagai berikut (Kadir,2013):

A. Benar atau salah. Dalam hal ini, informasi berhubungan dengan kebenaran terhadap kenyataan. jika penerima informasi yang salah mempercayainya,efeknya seperti kalua informasi itu benar.

B. Baru. Informasi harus benar benar baru bagi si penerima.

C. Tambahan. Informasi dapat memperbarui atau memberika perubahan terhadap infromasi yang telah ada.

D. Korektif. Informasi dapat digunakan untuk melakukan koreksi terhadap informasi yang sebelumnya yang salah atau kurang benar.

E. Penegas. Informasi dapat mempertegas informasi yang telah ada sehingga keyakinan terhadap informasi semakin meningkat.

2. Kualitas Informasi

Kualitas informasi akan sangat tergantung kepada 3 hal seperti yang dikemukakan oleh Jogiyanto, yaitu sebagai berikut (Kusnendi,2011).

A. Informasi harus akurat

Informasi harus bebas dari kesalahan-kesalahan dan tidak bias atau menyesatkan. Akurat berarti informasi harus jelas mencerminkan maksudnya. Mengapa informasi itu harus akurat? Sebab dari sumber informasi sampai ke penerima informasi kemungkinan banyak terjadi gangguan (noise) yang dapat mengubah dan merusak informasi tersebut.

(43)

18 B. Informasi harus tepat pada waktunya

Informasi yang dikirim atau diterima tidak boleh terlambat diterima si penerima, sebab informasi yang usang tidak akan mempunyai nilai lagi. Apalagi jika informasi tersebut merupakan dasar untuk dijadikan dalam pengambilan keputusan. Jika pengambilan keputusan terlambat maka berakibat fatal bagi suatu organisasi. Perlu dipahami, mahalnya informasi dikarenakan harus cepatnya didapat sehingga diperlukan teknologi informasi untuk mengolah dan mengirimkannya.

C. Informasi harus relevan

Informasi harus memiliki manfaat bagi pemakainya dan relevansi informasi bagi setiap orang akan berbeda.

2.2.3 Sistem Informasi

Sistem informasi merupakan suatu komponen yang terdiri dari manusia, teknologi informasi, dan prosedur kinerja yang memproses, menyimpan, menganalisis, dan menyebarkan informasi untuk mencapai suatu tujuan (Mulyanto, 2009). Sistem Informasi adalah suatu sistem yang terdiri dari komponen utama yang saling bekerja sama atau berkaitan atau terhubung satu dengan yang lainnya, yaitu manusia, hardware, software, jaringan komunikasi, dan sumber data jaringan komunikasi, dan sumber data, dalam proses kegiatan mengumpulkan, mengolah, menyimpan, menganalisa data, dan menyebarkan untuk mencapai suatu tujuan tertentu yang telah ditetapkan (Waspodo,2008)

(44)

19 2.2.4 Komponen Sistem Informasi

Dalam suatu sistem informasi terdapat komponen-komponen seperti : (Mulyanto, 2009)

1. Sumber Daya Manusia, Manusia mengambil peranan yang penting bagi sistem informasi. Manusia dibutuhkan untuk mengoperasikan sistem informasi. Sumber daya manusia dapat dibedakan menjadi dua kelompok, yaitu pengguna akhir dan pakar sistem informasi.

2. Sumber Daya Hardware, Semua peralatan yang digunakan dalam pemrosesan informasi.

3. Sumber Daya Software, Semua rangkaian perintah yang digunakan dalam pemprosesan informasi.

4. Sumber Daya Data, Bukan hanya sekedar bahan baku untuk masukan sebuah sistem informasi, melainkan sebagai dasar membentuk sumber daya organisasi.

5. Sumber Daya Jaringan, Media komunikasi yang menghubugkan komputer, pemroses komunikasi, dan peralatan lainnya, serta dikendalikan melalui software komunikasi.

2.3 Kamus

Menurut Kamus Besar Bahasa Indonesia, pengertian kamus adalah buku acuan yang memuat kata dan ungkapan yang biasanya disusun menurut abjad berikut keterangan maknanya, pemakaiannya dan terjemahannya. Kamus juga

(45)

20 dapat digunakan sebagai buku rujukan yang menerangkan makna kata – kata yang berfungsi untuk membantu seseorang mengenal perkataan baru. Selain pengertian kamus yang telah disebutkan di atas, pengertian kamus yang dikemukakan oleh beberapa para ahli Chaer (2007).

1. Kridalaksana menyebutkan bahwa kamus adalah buku referensi yang memuat daftar kata atau gabungan kata dengan keterangan mengenai pelbagai segi maknanya dan penggunaannya dalam bahasa, biasanya disusun menurut abjad.

2. Dalam American Every Dictionary disebutkan bahwa kamus adalah sebuah buku berisi kata-kata dari sebuah bahasa, biasanya disusun secara alfabetis, disertai keterangan akan artinya ucapannya, ejaannya, dsb.

3. Labrousse (1997) menyebutkan bahwa kamus adalah buku berisi kumpulan kata-kata sebuah Bahasa yang disusun secara alfabetis, diikuti dengan defenisi atau terjemahannya dalam bahasa lain.

4. Keraf (1984) mendefinisikan kamus sebagai sebuah buku referensi, memuat daftar kata-kata yang terdapat dalam sebuah bahasa, disusun secara alfabetis, disertai keterangan cara menggunakan kata itu.

5. C.C Berg dalam buku Manual of Lexicography mendefinisikan kamus adalah satu daftar yang disusun secara sistematis tentang bentuk-bentuk linguistik dari kebiasaan ujaran sebuah masyarakat ujaran.

Definisi ini mengenai bentuk/ jenis utama kamus yang berurusan dengan makna leksikal. Berdasarkan pengertian kamus yang dikemukakan oleh beberapa ahli di atas, dapat disimpulkan beberapa hal sebagai berikut.

(46)

21 1. Kamus termasuk buku referensi yang berisi kata-kata atau gabungan

kata dari suatu bahasa;

2. Kata-kata tersebut disusun secara alfabetis;

3. Kata-kata tersebut diberi keterangan tentang makna dan penggunaannya;

4. Kata itu selain diberi keterangan maknanya, juga diberi keterangan tentang ucap annya, ejaannya, dan pelbagai hal lain;

5. Keterangan tentang makna itu diberikan juga dalam bahasa lain; 2.4 Bahasa Indonesia

Bahasa adalah sebagai alat komunikasi antar manusia. karena dengan bahasa orang bisa berinteraksi dengan sesamanya dan bahasa merupakan sumber daya bagi kehidupan bermasyarakat. Adapun bahasa dapat digunakan apabila saling memahami atau saling mengerti erat hubungannya dengan penggunaan sumber daya bahasa yang kita miliki. Kita dapat memahami maksud dan tujuan orang lain berbahasa atau berbicara apabila kita mendengarkan dengan baik apa yang dikatakan. Bahasa Indonesia ialah bahasa rasmi Republik Indonesia sebagaimana disebutkan dkarena dalam Undang-Undang Dasar RI 1945, Pasal 36. Ia juga merupakan bahasa persatuan bangsa Indonesia sebagaimana disebut dalam Sumpah Pemuda 28 Oktober 1928. Sungguhpun begitu, hanya sebahagian kecil daripada penduduk Indonesia yang benar-benar menggunakannya sebagai bahasa ibunda kerana dalam perbualan sehari-hari yang tidak rasmi masyarakat Indonesia lebih suka menggunakan bahasa daerahnya masing-masing sebagai bahasa ibu seperti

(47)

22 bahasa Melayu pasar, bahasa Jawa, bahasa Sunda, dan lain sebagainya. Untuk sebahagian besar masyarakat Indonesia lainnya, bahasa Indonesia adalah bahasa kedua dan untuk taraf rasmi bahasa Indonesia adalah bahasa pertama. Bahasa Indonesia merupakan sebuah dialek bahasa Melayu yang menjadi bahasa rasmi Republik Indonesia.

Bahasa Indonesia dirasmikan pada tahun 1945 sewaktu Indonesia mencapai kemerdekaan daripada pihak Belanda. Bahasa Indonesia adalah bahasa dinamik yang terus menyerap kata-kata daripada bahasa-bahasa asing. Berasal daripada rumpun yang sama, Bahasa Indonesia adalah sebuah loghat bahasa Melayu yang terpiawai, dan kedua-duanya cukup sama. Fonologi dan tatabahasa bahasa Indonesia cukuplah mudah, dan dasar-dasar penting untuk komunikasi asas dapat dipelajari hanya dalam tempoh masa beberapa minggu. Bahasa Indonesia merupakan bahasa hantaran untuk pendidikan di sekolah-sekolah Indonesia. Ini ada definisi bahasa menurut tujuh para ahli :

1. Menurut Keraf dalam Smarapradhipa (2005:1), memberikan dua pengertian bahasa. Pengertian pertama menyatakan bahasa sebagai alat komunikasi antara anggota masyarakat berupa simbol bunyi yang dihasilkan oleh alat ucap manusia. Kedua, bahasa adalah sistem komunikasi yang mempergunakan simbol-simbol vokal (bunyi ujaran) yang bersifat arbitrer. 2. Menurut Owen dalam Stiawan (2006:1), menjelaskan definisi bahasa yaitu

language can be defined as a socially shared combinations of those symbols and rule governed combinations of those symbols (bahasa dapat

(48)

23 didefenisikan sebagai kode yang diterima secara sosial atau sistem konvensional untuk menyampaikan konsep melalui kegunaan simbol-simbol yang dikehendaki dan kombinasi simbol-simbol-simbol-simbol yang diatur oleh ketentuan).

3. Pendapat dengan Owen apa yang diungkapkan oleh Tarigan (1989:4), beliau memberikan dua definisi bahasa. Pertama, bahasa adalah suatu sistem yang sistematis, barang kali juga untuk sistem generatif. Kedua, bahasa adalah seperangkat lambang-lambang mana suka atau simbol-simbol arbitrer.

4. Menurut Santoso (1990:1), bahasa adalah rangkaian bunyi yang dihasilkan oleh alat ucap manusia secara sadar.

5. Menurut Mackey (1986:12), Bahasa adalah suatu bentuk dan bukan suatu keadaan (language may be form and not matter) atau sesuatu sistem lambang bunyi yang arbitrer, atau juga suatu sistem dari sekian banyak sistem-sistem, suatu sistem dari suatu tatanan atau suatu tatanan dalam sistem-sistem.

6. Menurut Wibowo (2001:3), bahasa adalah sistem simbol bunyi yang bermakna dan berartikulasi (dihasilkan oleh alat ucap) yang bersifat arbitrer dan konvensional, yang dipakai sebagai alat berkomunikasi oleh sekelompok manusia untuk melahirkan perasaan dan pikiran.

7. Hampir senada dengan pendapat Wibowo, Walija (1996:4), mengungkapkan definisi bahasa ialah komunikasi yang paling lengkap dan

(49)

24 efektif untuk menyampaikan ide, pesan, maksud, perasaan dan pendapat kepada orang lain.

2.5 Bahasa Batak Angkola

Setiap daerah mempunyai latar belakang bahasa yang berbeda di antara corak budaya itu adalah bahasa.” Bahasa adalah salah satu alat komonikasi antara anggota masyarakat, berupa lambang bunyi yang dihasilkan oleh alat ucap manusia” (keraf 1973: 15). Begitu juga Bahasa Batak Angkola dipakai oleh masyakat Batak yang tinggal di Kecamatan Batang Ankola, Kabupaten Tapanuli Selatan, Provinsi Sumatera Utara. Bahasa Batak Angkola ini digunakan untuk berbagai keperluan antara lain sebagai alat komunikasi sehari-hari dan juga untuk pelaksanaan adat dan sebagai media kegiatan keagamaan.

Suku Batak terdiri atas beberapa sub suku yang berdiam di wilayah Sumatera Utara yakni sebagian besar di Tapanuli, Simalungun, Karo, serta Nias dan Pakpak-Dairi-kedua wilayah terakhir ini termasuk wilayah Tapanuli. Sub suku Batak terdiri atas Toba yang bermukim di wilayah Toba yakni Toba, Silindung, Samosir, dan Humbang; Angkola yang bermukim di wilayah Tapanuli Selatan, Sipirok dan Angkola, Mandailing yang bermukim di Mandailing Natal; Simalungun di daerah Simalungun; Karo di daerah Karo; Pakpak Dairi bermukim di daerah Pakpak dan Dairi. Bahkan dalam pelajaran antropologi yang diajarkan di sekolah-sekolah bahwa Nias, Alas dan Gayo dikelompokkan dalam sub Suku Batak. Dalam dua dasawarsa terakhir ini terbentuk sub-suku Batak lainnya, yakni Batak Pesisir.

(50)

25 Melihat perkembangan ini, Kecamatan Batang Ankola, Kabupaten Tapanuli Selatan ini sudah banyak mengalami perubahan-perubahan dan perkembangan. Kemajuan dan perkembangan yang terdapat di kecamatan ini adalah dari segi pendidikan, mata pencarian, budaya, dan politik. Daerah kecamatan Batang Angkola ini adalah tempat peneliti melakukan penelitian ini, dan kecamatan Batang Angkola terdiri atas 20 desa.

Berdasarkan uraian di atas, bahasa Batak Angkola masih tetap dipelihara dan dipergunakan oleh masyarakat pemakainya sebagai salah satu bahasa. Bahasa Batak Angkola sudah selayaknya ditumbuh-kembangkan keberadaannya di tanah air Indonesia sebagai kekayaan suatu bangsa.

2.6 Natural Language Processing

Liddy (2001) menyatakaan bahwa NLP (Natural language processing) atau pengolahan bahasa alami Secara teoritis adalah pengembangan berbagai teknik komputasi untuk menganalisa dan menampilkan teks dalam bahasa alami pada satu atau lebih tingkat analisis linguistik untuk mencapai tujuan manusia dalam hal bahasa yaitu menyelesaikan berbagai tugas dan aplikasi.

Sebuah NLP harus memperhatikan pengetahuan terhadap bahasa itu sendiri, baik dari segi kata yang digunakan, Bagaimana kata-kata tersebut digabungkan untuk menghasilkan suatu kalimat, apa arti sebuah kata, apa fungsi sebuah kata dalam sebuah kalimat dan sebagainya.

Ada berbagai terapan aplikasi dari NLP. Diantaranya adalah Chatbot (aplikasi yang membuat user bisa seolah-olah melakukan komunikasi dengan

(51)

26 computer), Stemming atau Lemmatization (pemotongan kata dalam bahasa tertentu menjadi bentuk dasar pengenalan fungsi setiap kata dalam kalimat), Summarization (ringkasan dari bacaan), Translation Tools (menterjemahkan bahasa) dan aplikasi-aplikasi lain yang memungkinkan komputer mampu memahami instruksi bahasa yang diinputkan oleh user.

Pustejovsky dan Stubbs (2012) menjelaskan bahwa ada beberapa area utama penelitian pada field NLP, diantaranya:

1. Question Answering Systems (QAS). Kemampuan komputer untuk menjawab pertanyaan yang diberikan oleh user. Daripada memasukkan keyword ke dalam browser pencarian, dengan QAS, user bisa langsung bertanya dalam bahasa natural yang digunakannya, baik itu Inggris, Mandarin, ataupun Indonesia.

2. Summarization. Pembuatan ringkasan dari sekumpulan konten dokumen atau email. Dengan menggunakan aplikasi ini, user bisa dibantu untuk mengkonversikan dokumen teks yang besar ke dalam bentuk slide presentasi.

3. Machine Translation. Produk yang dihasilkan adalah aplikasi yang dapat memahami bahasa manusia dan menterjemahkannya ke dalam bahasa lain. Termasuk di dalamnya adalah Google Translate yang apabila dicermati semakin membaik dalam penterjemahan bahasa. Contoh lain lagi adalah BabelFish yang menterjemahkan bahasa pada real time.

4. Speech Recognition. Field ini merupakan cabang ilmu NLP yang cukup sulit. Proses pembangunan model untuk digunakan telpon/komputer dalam

(52)

27 mengenali bahasa yang diucapkan sudah banyak dikerjakan. Bahasa yang sering digunakan adalah berupa pertanyaan dan perintah.

5. Document classification. Sedangkan aplikasi ini adalah merupakan area penelitian NLP Yang paling sukses. Pekerjaan yang dilakukan aplikasi ini adalah menentukan dimana tempat terbaik dokumen yang baru diinputkan ke dalam sistem. Hal ini sangat berguna pada aplikasi spam filtering, news article classification, dan movie review.

2.7 Optical Character Recognition 2.7.1 Pengertian

Optical character recognition (OCR) adalah proses konversi gambar huruf menjadi karakter ASCII yang dikenali oleh komputer. Gambar huruf yang dimaksud dapat berupa hasil scan dokumen, hasil print-screen halaman web, hasil foto, dan lain-lain (Mohammad, Anarase, Shingote, & Ghanwat, 2014).

Adanya sistem pengenal huruf yang cerdas akan sangat membantu usaha besar-besaran yang saat ini dilakukan banyak pihak yakni usaha digitalisasi informasi dan pengetahuan, misalnya dalam pembuatan koleksi pustaka digital, koleksi sastra kuno digital, dll. Dengan adanya pengenal huruf juga akan memudahkan penanganan pekerjaan yang memakai input tulisan seperti penyortiran surat di kantor pos, pemasukan data buku di perpustakaan, dll. Selain itu adanya system pengenal huruf otomatis maka user dapat lebih leluasa memasukkan data karena user tidak harus memakai papan ketik tetapi bias menggunakan pena elektronik untuk menulis sebagaimana user menulis di kertas. (Priyatma dkk, 2004)

(53)

28 Dalam pengenal pola otomatis, sistem pengenal pola mencoba mengenali apakah citra masukan yang diterima cocok dengan salah satu citra yang telah ditentukan. Sistem ini misalnya dipakai untuk mendeteksi sidik jari, tanda tangan, bahkan wajah seseorang. Menurut Sukmawan (2008) OCR dapat dipandang sebagai bagian dari pengenal otomatis yang lebih luas yakni pengenal pola otomatis (automatic pattern recognition). Ada banyak pendekatan yang dapat dipakai untuk mengembangkan pembuatan pengenal pola otomatis antara lain memakai pendekatan numerik, statistik, sintaktik, neural dan, aturan produksi (rule-based). Secara umum metode-metode tersebut dapat digolongkan menjadi dua kelompok metode yakni metode berbasis statistik dan metode berbasis struktur.

Dalam metode yang berbasis statistik, setiap pola ditransformasi ke dalam vektor yang memakai ukuran dan karakteristik tertentu. Karakteristik ini seringkali lebih bersifat statistik misalnya distribusi pixel ataupun jarak piksel. Sedang dalam metode yang berbasis struktur, setiap pola yang diproses dinyatakan sebagai gabungan beberapa struktur elementer. Pengenalan selanjutnya dilakukan dengan mencocokkan komposisi struktur elementer dengan struktur yang sudah disimpan memakai aturan tertentu misalnya memakai pendekatan teori bahasa formal dan automata. (Sukmawan, 2008)

(54)

29 2.7.2 Cara Kerja

Ilustrasi dari proses OCR

Gambar 2.1 Ilustrasi proses OCR (Manik 2010)

Prinsip kerja dari aplikasi OCR menurut Manik (2010) adalah sebagai berikut: 1. Mengambil objek berupa teks menggunakan kamera sehingga didapat

sebuah file citra.

2. File citra tersebut diproses menggunakan perangkat lunak aplikasi pengenalan teks, di mana perangkat ini melakukan proses pengenalan terhadap karakter-karakter yang ada pada file citra tersebut.

3. Keluaran dari perangkat lunak aplikasi pengenalan teks ini berupa file teks yang berisi karakter-karakter yang telah dikenali dan siap untuk diolah lebih lanjut.

(55)

30 Tingkat keberhasilan dari perangkat lunak pada aplikasi pengenalan teks ini sangat bergantung dari sejumlah faktor berikut:

1. Kualitas gambar teks yang ada pada dokumen yang dibaca serta tingkat kompleksitasnya (ukuran, format, teks, warna, latar belakang).

2. Kualitas perangkat lunak aplikasi pengenalan teks itu sendiri. 3. Kualitas alat optik yang dipakai (kamera).

Proses yang dilakukan oleh OCR secara berurutan adalah data capture, prepocessing, segmentation normalization, feature ekstraction, recognition dan postprocessing.

1. Sistem Preprocessing

Perancangan sistem preprocessing menjelaskan alur kerja dalam OCR dalam meyiapkan image sebagai sebagai input gambar yang siap diolah lebih lanjut oleh sistem. Menurut Sukamto (2010) proses preprocessing meliputi prosesproses berikut:

a. Grey Scalling/Thesholding

Proses grey scaling mengubah citra berwarna menjadi hitamputih dengan mengubah warna setiap komponen RGB gambar menjadi bernilai sama. Proses threshold digunakan untuk mengekstrak foreground (tinta) dari background (kertas) dan mengubah menjadi citra biner. Proses Thresholding mengubah warna gambar menjadi citra biner (binary image) dimana ditentukan

(56)

31 sebuah nilai level threshold kemudian piksel yang memiliki nilai di bawah level threshold diset menjadi warna putih (0 pada nilai biner) dan nilai di atas nilai threshold diset menjadi warna hitam (1 pada nilai biner).

b. Smoothing

Proses smoothing menggunakan metode Stentiford Boundary untuk menghilangkan detail dan noise dengan memeriksa keterikatan dengan piksel bernilai 0 dengan piksel yang bernilai 1 dan menghitung tetangga piksel yang bernilai 0. Jika piksel yang sedang dicek memenuhi syarat tidak boleh dihapus, maka piksel ditandai sebagai piksel yang tidak boleh dihapus. Smoothing digunakan untuk meminimalisir derau (noise).

c. Scalling

Menskala citra karakter tulisan tangan menjadi lebih kecil agar proses lainnya lebih cepat dan tidak terpengaruh besar citra karakter (pada bagian inti karakter).

d. Stroke Thinning

Proses ini menggunkan metode hybrid di mana menggunakan campuran tiga buah metode yang saling mendukung untuk proses thinning yaitu algoritma thinning Zhang-Suen yang mengecek ketetenggaan dan konektivitas 8-arah pikase, Stentiford Acute Angel Emphasis untuk menandai piksel pada bagian luar yang

(57)

32 tidak boleh dihapus, dan algoritma Holt untuk menghapus hasil thinning yang tidak diperlukan (percabangan yang tidak perlu). 2. Sistem Segmentation

Tujuan dari proses segmentasi adalah untuk mempermudah atau menyederhanakan representasi dari citra menjadi sesuatu yang lebih berarti dan mudah dianalisa. (Sukamto: 2010).

3. Normalization

Normalization adalah proses merubah dimensi region tiap karakter dan ketebalan karakter. Dalam OCR, algoritma yang digunakan pada proses ini adalah algoritma Scaling dan Thinning. (Sukamto: 2010).

4. Feature Extraction

Menurut Sukamto (2010) Feature Extraction adalah proses transformasi data masukan menjadi kumpulan fitur untuk mengambil representasi minimal dari data masukan. Fitur citra menyediakan cara untuk mendeskripsikan property citra. Fitur geometris merupakan kunci untuk mendeskripsikan struktur citra.

a. Ascenders dan Descenders

Merupakan pambagian tulisan menjadi tiga buah area yaitu bagian atas (ascenders), bagian tengah (main body), bagian bawah (descenders). Kemudian setiap area diambil fiturnya dengan menggunakan histogram untuk membedakan karakter yang akan dikenali.

(58)

33 b. Ukuran rata-rata tinggi dan lebar karakter Ukuran diambil dari perata-rataan setiap karakter yang dimasukan sebagai pembelajaran. c. Permodelan stroke menggunakan rangkaian stroke (garis tulisan) untuk mengenali karakter. Rangkaian stroke merupakan kumpulan titik-titik yang diberi label angka berdasarkan arah titik tetangga berikutnya yang disimpan di dalam list yang kemudian di periksa polanya.

5. Sistem Recognition

Recognition merupakan proses untuk mengenali karakter yang diamati dengan cara membandingkan ciri-ciri karakter yang diperoleh dengan ciri-ciri karakter yang ada pada database.

6. Postprocessing

Pada umumnya proses yang dilakukan pada tahap ini adalah proses koreksi ejaan sesuai dengan bahasa yang digunakan

2.8 Android

2.8.1 Pembahasan Umum Android

Android adalah sebuah sistem operasi untuk perangkat mobile berbasis linux yang mencakup sistem operasi, middleuare dan aplikasi. Android menyediakan platfurm terbuka bagi para pengembang untuk menciptakan aplikasi mereka. Awalnya, Google Inc. membeli Android Inc. yang merupakan pendatang baru yang membuat peranti lunak untuk ponsel/smortphone. Kemudian untuk mengembangkan Android, dibentuklah Open Handset Alliance, konsorsium dari 34

(59)

34 perusahaan peranti keras, peranti lunak, dan telekomunikasi, termasuk Google, HTC, Intel, Motorola, Qualcomm, T-Mobile, dan Nvidia (Nazruddin,2012).

Pada saat perilisan perdana Android, 5 November 2007, Android Bersama Open Handset Alliance menyatakan mendukung pengembangan open source pada perangkat mobile. Di lain pihak, Google merilis kode-kode Android di bawah lisensi Apache, sebuah lisensi perangkat lunak dan open platform perangkat seluler. Pasa masa saat ini sebagian besar uendor-uendor smartphone sudah memproduksi smartphone berbasis android, uendor-uendor itu antara lain HTC, Motorola, Samsung, LG, HKC, Huawei, Archos, Webstation Camangi, Dell, Nexus, SciPhone, WayteQ, Sony Ericsson, LG, Acer, PhiliPS, TMobile, Nexian, IMO, Asus dan masih banyak lagi uendor smartphone di dunia yang memproduksi android. Hal ini, karena android itu adalah system operasi yang open source sehingga bebas didistribusikan dan dipakai oleh vendor manapun.

Tidak hanya rnenjadi sistem operasi di smartphone, saat ini Android menjadi pesaing utama dari Apple pada sistem operasi Table PC. Pesatnya pertumbuhan Android selain faktor yang disebutkan di atas adalah karena Android itu sendiri adalah platform yang sangat lengkap baik itu sistemoperasinya, Aplikasi dan Tool Pengembangan, Market aplikasi android serta dukungan yang sangat tinggi dari komunitas Open Source di dunia, sehingga android terus berkembang pesat baik dari segi teknologi maupun dari segi jumlah device yang ada di dunia.

(60)

35 Berikut merupakan kelebihan Android :

a. Lengkap (Complete Platform): Para desainer dapat melakukan pendekatan yang komprehensif ketika mereka sedang mengembangkan platform Android. Android merupakan sistem operasi yang aman dan banyak menyediakan tools dalam membangun software dan memungkinkan untuk peluang pengembangan aplikasi.

b. Terbuka (Open Source Platfurm): Platfurm Android disediakan melalui lisensi open source. Pengembang dapat dengan bebas untuk mengembangkan aplikasi. Android sendiri menggunakan Linux Kernel 2.6. c. Free (Free Platform): Android adalah platfurmlaplikasi yang bebas untuk develop. Tidak ada lisensi atau biaya royalti untuk dikembangkan pada platfurm Android. Tidak ada biaya keanggotaan diperlukan. Tidak diperlukan biaya pengujian. Tidak ada kontrak yang diperlukan. Aplikasi untuk android dapat didistribusikan dan diperdagangkan dalam bentuk apa pun (Nazruddin,2012).

2.8.2 Persyaratan Perangkat Keras

Hingga November 2013, versi terbaru Android membutuhkan setidaknya 512 MB RAM, prosesor ARMv7 32-bit, arsitektur MIPS, atau x86, serta unit pemroses grafis (GPU) kompatibel OpenGL ES 2.0.

Platform perangkat keras utama pada Android adalah arsitektur ARM. Ada juga dukungan untuk x86 dari proyek Android-x86, dan Google TV menggunakan versi x86 khusus Android. Pada tahun 2013, Freescale mengumumkan melibatkan

(61)

36 Android dalam prosesor i.MX buatannya, yakni seri i.MX5X dan i.MX6X. Pada 2012, prosesor Intel juga mulai muncul pada platform utama Android, misalnya pada telepon seluler.

Beberapa komponen perangkat keras tidak diperlukan, namun sudah menjadi standar di perangkat tertentu. Beberapa fitur awalnya dibutuhkan sebagai persyaratan, namun kemudian ditiadakan. Setelah Android menjadi OS telepon pintar, beberapa perangkat keras, seperti mikrofon, lambat laun berubah menjadi perangkat opsional. Selain itu, kamera ditetapkan sebagai perangkat wajib bagi ponsel-ponsel Android. Perangkat Android menggabungkan berbagai komponen perangkat keras opsional, termasuk kamera video, GPS, sensor orientasi perangkat keras, kontrol permainan, akselerometer, giroskop, barometer, magnetometer, sensor proksimitas, sensor tekanan, termometer, dan layar sentuh.

Android mendukung OpenGL ES 1.1, 2.0, dan 3.0. Beberapa aplikasi secara eksplisit mengharuskan versi tertentu dari OpenGL ES, sehingga perangkat keras GPU yang cocok diperlukan bagi perangkat Android untuk menjalankan aplikasi tertentu.

2.8.3 Pengembangan

Pengembang memiliki beberapa pilihan ketika membuat aplikasi yang Berbasis android. Sebagian besar pengembang menggunakan Eclipse yang tersedia secara bebas untuk merancang dan mengembangkan aplikasi Android. Eclipse adalah IDE yang paling populer untuk pengembangan Android, karena memiliki Android plug-in yang tersedia untuk memfasilitasi pengembangan Android. Selain

Referensi

Dokumen terkait