• Tidak ada hasil yang ditemukan

KLASIFIKASI CITRA AKSARA JAWA MENGGUNAKAN METODE MODIFIED K-NEAREST NEIGHBOR TUGAS AKHIR. Diajukan Untuk Memenuhi Salah Satu Syarat

N/A
N/A
Protected

Academic year: 2021

Membagikan "KLASIFIKASI CITRA AKSARA JAWA MENGGUNAKAN METODE MODIFIED K-NEAREST NEIGHBOR TUGAS AKHIR. Diajukan Untuk Memenuhi Salah Satu Syarat"

Copied!
77
0
0

Teks penuh

(1)

KLASIFIKASI CITRA AKSARA JAWA MENGGUNAKAN METODE MODIFIED K-NEAREST NEIGHBOR

TUGAS AKHIR

Diajukan Untuk Memenuhi Salah Satu Syarat Memperoleh Gelar Sarjana Komputer

Program Studi Informatika

Oleh :

Atanasius Ivannoel Rio Aji 175314060

Program Studi Informatika Fakultas Sains dan Teknologi

Universitas Sanata Dharma Yogyakarta

(2)

ii

CLASSIFICATION OF JAVANESE CHARACTERS USING THE MKNN METHOD

THESIS

Present as Partial Fulfillment of The Requirements to Obtain Sarjana Komputer Degree

in Informatics Study Program

Created By :

Atanasius Ivannoel Rio Aji 175314060

INFORMATICS STUDY PROGRAM INFORMATICS DEPARTMENT

FACULTY OF SCIENCE OF TECHNOLOGY SANATA DHARMA UNIVERSITY

YOGYAKARTA 2021

(3)

iii

HALAMAN PERSETUJUAN PEMBIMBING

SKRIPSI

KLASIFIKASI CITRA AKSARA JAWA MENGGUNAKAN

METODE MODIFIED K-NEAREST NEIGHBOR

Oleh :

Atanasius Ivannoel Rio Aji 175314060

Telah Disetuji oleh :

(4)

iv

HALAMAN PENGESAHAN TUGAS AKHIR

KLASIFIKASI CITRA AKSARA JAWA MENGGUNAKAN METODE MODIFIED K-NEAREST NEIGHBOR

(5)

v

HALAMAN PERSEMBAHAN

“Keberhasilan saya merupakan buah dari doa yang selalu dilambungkan oleh kedua orang hebat dalam hidup saya yaitu orang tua. Perjuangan saya pada titik ini merupakan ungkapan terimakasih yang sebesar – besarnya kepada orang tua yang selalu mendoakan dan mendukung apa yang saya lakukan, terimakasih bapak dan

(6)

vi

PERNYATAAN KEASLIAN KARYA

Saya menyatakan dengan sesungguhnya bahwa tugas akhir yang saya tulis tidak mengandung atau memuat karya orang lain, kecuali yang telah disebutkan dalam

(7)

vii

LEMBAR PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH

Yang bertanda tangan dibawah ini, saya mahasiswa Universitas Sanata Dharma: Nama : Atanasius Ivannoel Rio Aji

NIM : 175314060

Demi pengembangan ilmu pengetahuan, saya memberikan kepada perpustakan Universitas Sanata Dharma karya ilmiah yang berjudul:

KLASIFIKASI CITRA AKSARA JAWA MENGGUNAKAN METODE MODIFIED K-NEAREST NEIGHBOR

Dengan demikian saya memberikan kepada perpustakaan Universitas Sanata Dharma hak untuk menyimpan, mengalihkan dalam bentuk media lain, mengelolanya dalam bentuk pangkalan data mendistribusikan secara terbatas, dan mempublikasikannya di internet atau media lain untuk kepentingan akademis tanpa perlu meminta ijin dari saya maupun memberikan royalty kepada saya selama tetap mencantumkan nama saya sebagai penulis.

Demikian pernyataan ini saya buat dengan sebenarnya. Dibuat di Yogyakarta,

Pada tanggal: 14 Juli 2021 Yang menyatakan,

(8)

viii ABSTRAK

Aksara Jawa merupakan salah satu ragam budaya Indonesia yang saat ini masih dikenal oleh banyak orang. Dibeberapa daerah , aksara Jawa masih digunakan pada fasilitas umum, seperti papan nama jalan di sudut-sudut Kota Yogyakarta. Namun, meski aksara Jawa dikenal oleh banyak orang, masih ada beberapa orang yang tidak mengetahui arti atau cara membaca aksara Jawa. Peran teknologi sangat dibutuhkan dalam pengenalan Aksara Jawa, yaitu dengan menggunakan klasifikasi Modified K-Nearest Neighbor dalam klasifikasi aksara Jawa.

Metode ini merupakan perkembangan dari metode K-Nearest Neighbor, dimana terdapat dua tambahan proses yaitu menghitung nilai Validitas dan menghitung Wieght Voting. Evaluasi pada metode Modified K-Nearest Neighbor menggunakan metode Cross Validation. Selain itu juga menggunakan variasi nilai K pada Modified K-Nearest Neighbor, variasi ukuran Ekstraksi Ciri IoC, dan variasi pada nilai K-Fold dalam Cross Validation. Dari penelitian ini didapatkan akurasi terbaik sebesar 75,37% dengan mengguanakan nilai K-Fold 7.

Kata Kunci : Modified K-Nearest Neighbor, Klasifikasi, Aksara Jawa, Cross Validation, Intensity of Character.

(9)

ix ABSTRACT

Javanese script is one of the various Indonesian cultures that is still known by many people. In some areas, Javanese script is still used in public facilities, such as street signboards in the corners of the city of Yogyakarta. However, although Javanese script is known by many people, there are still some people who do not know the meaning or how to read Javanese script. The role of technology is needed in the introduction of Javanese script, namely by using the Modified K-Nearest Neighbor classification in the classification of Javanese characters. This method is a development of the K-Nearest Neighbor method, where there are two additional processes, namely calculating the Validity value and calculating the Wieght Voting. Evaluation of the Modified K-Nearest Neighbor method using the Cross Validation method. In addition, it also uses variations in the value of K in the Modified K-Nearest Neighbor, variations in the size of IoC Feature Extraction, and variations in the value of K-Fold in Cross Validation. From this study, the best accuracy was obtained at 75.37% by using the K-Fold 7 value.

Keywords: Modified K-Nearest Neighbor, Classification, Javanese Script, Cross Validation, Intensity of Character.

(10)

x

KATA PENGANTAR

Puji syukur penulis panjatkan kepada Tuhan Yang Maha Esa, atas berkat serta rahmat karunianya penulis dapat menyelesaikan tugas akhir dengan judul “Klasifikasi Citra Aksara Jawa Menggunakan Metode Modified K-Nearest Neighbor”. Tugas Akhir ini merupakan syarat wajib untuk penulis agar mendapatkan gelar sarjana computer program studi Informatika Universitas Sanata Dharma.

Penyelesaian tugas akhir ini tidak lepas dari dukungan oleh beberapa pihak kepada penulis, oleh karena itu sudah layak dan sepantasnya penulis mengucapkan terimakasih kepada :

1. Ibu Dr. Anastasia Rita Widiarti, M.kom. selakuk dosen pembimbing dalam penyelesain tugas akhir yang selalu meluangkan waktunya untuk memberikan semangat kepada penulis dalam mengerjakan tugas akhir serta memberikan saran dan masukan dalam penyelesain tugas akhir penulis. 2. Bapak Sudi Mungkasi , S.Si., M.Math.Sc., Ph.D. selakuk dekan Fakultas

Sains dan Teknologi Universitas Sanata Dharma.

3. Seluruh dosen prodi Informatika Universitas Sanata Dharma serta dosen – dosen yang terlibat dalam perkuliahan dengan mahasiswa prodi Informatika Angkatan 2017 yang telah mendidik serta memberikan bekal ilmu untuk penulis.

4. Kedua orang tua saya, Bapak Suyatno dan Ibu Sekolastika Ely Fajar Arianti yang selalu mendukung serta selalu mendoakan penulis hingga penulis dapat menyelesaikan Tugas Akhir dengan tepat waktu.

5. Kedua saudara saya, Kakak RD. Robertus Theo Elno Respati dan Adik Veronika Ivannalia Aninda Putri yang selalu memberikan semangat dalam proses penulis mengerjakan tugas akhir.

6. Saudari Bernadeta Rima Wulandari yang selalu menemani dalam pengerjaan tugas akhir dan selalu memberi semangat dalam penyelesaian tugas akhir penulis.

(11)

xi

7. Saudari Katharina Anggun yang selalu memberi saran masukan serta mendegarkan keluh kesan penulis dalam pengerjaan tugas akhir.

8. Saudara Gabriel Ryan Prima, Joseph Hutagalung, Edrick Hernando, Agung Krisnanto, dan Fransiska Apri Wulandari yang telah bersedia meluangkan waktunya untuk berdiskusi tentang berbagai masalah dalam pengerjaan tugas akhir penulis.

9. Teman – teman kluster Mesin Cerdas , “Jos Plo”, dan Campus Ministry yang selalu memberikan hiburan dan dorongan agar segera menyelesaikan tugas akhir.

10. Semua pihak yang tidak bisa disebutkan satu – satu yang telah membantu atau terlibat dalam penulisan tugas akhir ini.

Penulis menyadari bahwa masih banyak kekurangan dalam tugas akhir ini, oleh karena itu saran serta kritik yang membangun sangat penulis harapkan. Akhirnya, semoga tugas akhir ini dapat bermanfaat bagi para pembaca dan terkhusus kepada saya sebagai penulis.

Yogyakarta, 14 Juli 2021 Penulis

(12)

xii

DAFTAR ISI

HALAMAN PERSEMBAHAN ... v

PERNYATAAN KEASLIAN KARYA ... vi

LEMBAR PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH ... vii

ABSTRAK ... viii

ABSTRACT ... ix

KATA PENGANTAR ... x

DAFTAR ISI ... xii

DAFTAR TABEL ... xiv

DAFTAR GAMBAR ... xv BAB I PENDAHULUAN ... 16 Latar Belakang ... 16 Rumusan Masalah ... 18 Tujuan ... 18 Manfaat Penelitian ... 18 Batasan Masalah ... 18 Sistematika Penulisan ... 19

BAB 2 LANDASAN TEORI ... 21

Aksara Jawa ... 21

Pengertian Citra ... 21

Pemrosesan Citra Digital ... 21

Preprocessing ... 22 Binarisasi Citra ... 22 Rotasi Citra ... 22 Penipisan Citra ... 22 Resize Citra ... 23 Ekstraksi Ciri ... 23

(13)

xiii

Modified K-Nearest Neighbor ... 24

Perhitungan Jarak Euclidean ... 24

Perhitungan Nilai Validitas ... 25

Perhitungan Weighted Voting ... 27

Evaluasi ... 29

Cross Validation ... 29

BAB 3 METODOLOGI PENELITIAN ... 30

Cara Mendapatkan Data ... 30

Kebutuhan perangkat Hardware dan Software ... 31

Validitas Data ... 32

Pemodelan Klasifikasi ... 33

Preprocessing ... 34

Ekstraksi Ciri ... 36

Klasifikasi ... 37

Cara Analisis Data ... 45

Desain User Interface ... 46

Input Tampilan ... 46

Output Tampilan ... 46

BAB 4 HASIL PENELITIAN DAN ANALISIS ... 47

Peprocessing ... 47 Binerisasi ... 47 Rotasi Citra ... 47 Cropping ... 48 Resize Citra ... 49 Thinning ... 50

Ekstraksi Ciri dan Pembagian data ... 51

Pengujian dan Evaluasi ... 53

Hasil pengujian dengan 3 fold Cross Validation ... 53

Hasil pengujian dengan 5 fold Cross Validation ... 54

(14)

xiv

Data Uji Tunggal ... 57

Perbandingan Hasil Akurasi ... 60

Merubah Preprocessing dan Ekstraksi Ciri ... 60

Hasil perbandingan dengan merubah nilai a ... 61

Hasil Perbandingan dengan KNN ... 62

Pembahasan ... 62 BAB 5 PENUTUP ... 64 Kesimpulan ... 64 Saran ... 64 DAFTAR PUSTAKA ... 66 LAMPIRAN ... 67 DAFTAR TABEL Tabel 3. 1 Data Aksara Jawa ... 30

Tabel 3. 2 Hasil Ekstraksi Ciri ... 37

Tabel 3. 3 Tabel Data Latih Data Citra ... 39

Tabel 3. 4 Tabel Data Uji Data Citra ... 39

Tabel 3. 5 Hasil Perthitungan Jarak Euclidean data Citra ... 41

Tabel 3. 6 Hasil Nilai Validitas data latih ... 43

Tabel 3. 7 Hasil Eucliean data uji citra ... 44

Tabel 3. 8 Hasil Weight Voting ... 44

Tabel 3. 9 Hasil Penentuan Tetangga ... 45

Tabel 4. 1 Kelas Aksara Jawa ... 51

Tabel 4. 2 Hasil Pengujian 3 fold ... 53

Tabel 4. 3 Hasil pengujian 5 fold ... 54

Tabel 4. 4 Hasil pengujian 7 fold ... 56

Tabel 4. 5 Tabel Data Uji ... 57

Tabel 4. 6 Tabel Hasil Uji Tunggal ... 59

Tabel 4. 7 Tabel Hasil Perbandingan Akurasi ... 60

Tabel 4. 8 Hasil Perbandingan Nilai a ... 61

(15)

xv

DAFTAR GAMBAR

Gambar 2. 1 3 Fold Cross Validation ... 29

Gambar 3. 1 Salah Satu Sampel Data Aksara ... 31

Gambar 3. 2 Gambar Aksara Jawa ... 32

Gambar 3. 3 Folder Kelas Citra Aksara Na ... 33

Gambar 3. 4 Pemodelan Klasifikasi Metode Modified K-Nearest Neighbor ... 34

Gambar 3. 5 Desain alat uji Preprocessing ... 34

Gambar 3. 6 Alur MKNN ... 38

Gambar 4. 1 Hasil Binerisasi ... 47

Gambar 4. 2 Hasil Rotasi Citra ... 48

Gambar 4. 3 Hasil Cropping ... 49

Gambar 4. 4 Hasil Resize ... 50

Gambar 4. 5 Hasil penipisan citra ... 51

Gambar 4. 6 Pembagian data latih dengan 3 fold ... 52

Gambar 4. 7 Hasil pembagian data uji dengan 3 fold ... 52

Gambar 4. 8 Grafik Akurasi 3 fold. ... 54

Gambar 4. 9 Grafik Akurasi 5 fold. ... 55

(16)

BAB I PENDAHULUAN Latar Belakang

Indonesia terkenal dengan ragam budayanya, salah satunya adalah aksara. Hampir seluruh suku di Indonesia memiliki aksaranya masing – masing. Salah satu aksara yang cukup dikenal oleh banyak orang adalah Aksara Jawa. Aksara Jawa merupakan aksara yang dimiliki oleh Suku Jawa. Aksara Jawa juga dikenal dengan sebutan Hanacaraka. Pada aksara Jawa terdapat 20 aksara dasar, antara lain : Ha, Na, Ca, Ra, Ka, Da, Ta, Sa, Wa, La, Pa, Dha, Ja, Nya, Ma, Ga, Ba, Tha, Nga.

Selain aksara dasar, aksara Jawa juga terdiri dari beberapa aksara lain , seperti : Aksara Carakan, Aksara Pasangan, Aksara Swara, Aksara Rekan, Aksara Murda, Aksara Wilangan, dan Sandangan. Setiap aksara tersebut memiliki fungsi tersendiri dalam penyusunan sebuah kalimat dalam bentuk Aksara Jawa.

Aksara Jawa saat ini masih digunakan di beberapa daerah yang masih memegang erat Budaya Jawa seperti Yogyakarta dan Solo. Di Yogyakarta, aksara Jawa dapat dijumpai pada papan – papan nama jalan yang ada di Kota Yogyakarta. Selepas dari penggunaannya pada fasilitas umum, aksara Jawa sendiri pada jaman dulu digunakan pula untuk menulis perihal sistem pemerintahan jaman dahulu, sehingga saat ini masih digunakan oleh kalangan tertentu seperti kalangan Kraton Yogyakarta. Biasanya, aksara Jawa disimpan di museum – museum sebagai bentuk kekayaan budaya nusantara, dan masih sedikit orang yang tau arti atau terjemahan dari setiap aksara Jawa.

Oleh karena itu, peran teknologi sangat dibutuhkan dalam pengenalan aksara Jawa dengan menggunakan metode klasifikasi. Pada penelitian tentang klasifikasi aksara Jawa, penulis menggunakan metode klasifikasi Modified K-Nearest Neighbor (MKNN). Metode MKNN merupakan metode klasifikasi pengembangan dari metode K-Nearest Neighbor (KNN). Terdapat dua proses yang ditambahkan dalam metode KNN sehingga menjadi MKNN yaitu perhitungan nilai validitas dan Weight Voting.

(17)

17

Penelitian terkait klasifikasi aksara Jawa sebelumnya sudah dilakukan oleh Widiarti (2020) dengan menggunakan metode KNN dengan hasil rata – rata akurasi bernilai 50% - 60%. Unjuk kerja dari metode MKNN sudah dilakukan oleh Ravi, dkk (2019) telah melakukan perbandingan hasil akurasi dari metode MKNN dan KNN dalam penelitian Implementasi Algoritme Modified K-Nearest Neighbor (MKNN) Untuk Mengidentifikasi Penyakit Gigi Dan Mulut yang dimana hasil akurasi tertinggi didapatkan dari metode MKNN dengan nilai sebesar 86,6% dan 76,66%. Pada penelitian lain, Wafiyah, dkk (2017) juga mendapatkan akurasi sebesar 88,55% dalam Implementasi Algoritma Modified K-Nearest Neighbor (MKNN) untuk Klasifikasi Penyakit Demam. Bela, dkk (2017) pada penelitian Diagnosis Penyakit Kulit Pada Kucing Menggunakan Metode Modified K- Nearest Neighbor juga mendapatkan hasil akurasi terendah yang cukup baik yaitu sebesar 89.668%. Berdasarkan hasil akurasi dari beberapa penelitian tentan metode MKNN tersebut, penulis ingin mengimplementasikan metode tersebut pada kasus klasifikasi aksara Jawa.

(18)

Rumusan Masalah

1. Bagaimana mengimplementasikan metode klasifikasi Modified K-Nearest Neighbor untuk sistem klasifikasi aksara Jawa?

2. Berapa besar tingkat akurasi metode klasifikasi Modified K-Nearest Neighbor dalam proses klasifikasi aksara Jawa?

Tujuan

1. Mengimplementasi metode klasifikasi Modified K-Nearest Neighbor untuk sistem klasifikasi aksara Jawa.

2. Mengetahui akurasi dari metode klasifikasi Modified K-Nearest Neighbor pada proses klasifikasi aksara Jawa.

Manfaat Penelitian

1. Bagi peneliti, menambah pengetahuan peneliti tentang bagaimana penerapan metode klasifikasi Modified K-Nearest Neigbor untuk sistem klasifikasi aksara Jawa.

2. Bagi pihak – pihak yang bergerak pada pengembangan sistem klasifikasi atau pengenalan aksara Jawa. Penelitian ini memberikan pandangan akan sebuah metode yang dapat dipergunakan dalam membangun sebuah sistem klasifikasi aksara Jawa.

Batasan Masalah

1. Data yang digunakan adalah citra dengan jumlah data 2.144 aksara. 2. Nilai k yang digunakan adalah K=1, K=3, K=5, K=7, K=9.

3. Nilai K-fold yang digunakan adalah K-fold=3, K-fold=5 , K-fold = 7. 4. Ekstraksi Ciri yang digunakan adalah metode IoC.

(19)

19

Sistematika Penulisan

BAB I : PENDAHULUAN

Pada bab ini berisikan tentang latar belakang penelitian, rumusan masalah penelitian, tujuan masalah penelitian, batasan masalah penelitian dan sistematika penulisan.

BAB 2 : LANDASAN TEORI

Pada bab ini berisikan tentang teori – teori yang digunakan peneliti yang memiliki keterkaitan dengan penelitian yang dilakukan penulis. Seperti pengertian proses – proses pengolahan citra yang digunakan dari preprocessing hingga ekstraksi ciri, teori dasar dari metode Modified K-Nearest Neighbor, hingga teori pengujian yang menggunakan K-fold Cross Validation.

BAB 3 : METODOLOGI PENELITIAN

Pada bab ini berisikan penguraian dari metodologi penelitian yang digunakan. Dari sumber data yang berasal dari mana hingga bagaimana data tersebut diolah agar dapat diproses pada metode klasifikasi. Serta terdapat contoh perhitungan manual dari metode klasifikasi MKNN dengan data citra itu sendiri.

BAB 4 : HASIL PENELITIAN DAN ANALISIS

Pada bab ini berisikan penerapan sistem yang telah dirancang. Selain itu menampilkan hasil pengujian dari beberapa metode pengujian yang telah dirancang. Serta memberikan analisis dari hasil penelitian yang sudah didapat.

(20)

BAB 5 : PENUTUP

Pada bab ini berisikan kesimpulan yang didapat dari penelitian dan saran yang diberikan penulis agar penelitian ini dapat dikembangkan lagi.

(21)

BAB 2 LANDASAN TEORI

Pada bab ini akan dipaparkan teori – teori yang digunakan dalam penelitian ini. Mulai dari pengertian aksara jawa , pengertian citra, teori – teori pemrosesan citra dari tahap pengolahan citra hingga ekstraksi ciri serta teori yang digunakan dalam tahap klasifikasi MKNN itu sendiri.

Aksara Jawa

Aksara Jawa merupakan salah satu kekayaan Budaya Nusantara yang lahir dan berkembang di Pulau Jawa. Aksara Jawa juga dikenal dengan Hanacaraka, Carakan, atau Dentawyanjana (Wikipedia, 2020). Aksara ini memiliki 20 aksara dasar yaitu Ha, Na, Ca, Ra, Ka, Da, Ta, Sa, Wa, La, Pa ,Dha, Ja, Ya, Nya, Ma, Ga, Ba, Tha, Nga. Aksara ini pada jaman dulu aktif digunakan oleh masyarakat secara luas untuk tulisan sehari - hari maupun sastra.

Pengertian Citra

Citra atau yang sering dikenal dengan gambar merupakan sebuah komponen multimedia yang memberikan informasi dalam bentuk visual. Dalam matematis , citra dinyatakan sebagai 0 < f (x,y) < karena citra merupakan fungsi kontinu dari intensitas bidang dua dimensi (2D). Dalam dunia digital , citra didefinisikan sebagai citra f(x,y) dengan nilai dalam koordinat bidang merupakan nilai diskrit. Citra digital tersusun dari kumpulan titik atau elemen - elemen gambar yang disebut dengan piksel(picture element) (Gonzalez, R.C. & Woods, R.E., 1992).

Pemrosesan Citra Digital

Pemrosesan Citra Digital atau Pengolahan Citra Digital merupakan suatu pengolahan terhadap sebuah citra dengan menggunakan komputer. Pemrosesan Citra dilakukan untuk memperbaiki sebuah citra agar mudah dimengerti atau diinterpretasi oleh manusia atau mesin. Dasar dari pemrosesan citra adalah memodifikasi setiap titik atau piksel pada citra sesuai dengan kebutuhan (Gonzalez, R.C. & Woods, R.E., 1992).

(22)

Preprocessing

Preprocessing adalah proses mempersiapkan data untuk bisa diolah sesuai kebutuhan. Proses ini diperlukan karena tidak semua data yang disiapkan sudah bisa digunakan sesuai kebutuhan.

Binarisasi Citra

Binarisasi merupakan tahap pengolahan pada tingkat piksel dimana terjadi proses pemisahan antara objek pada citra dengan latar belakang yang tidak dibutuhkan. Proses ini secara otomatis menentukan nilai ambang threshold yang berfungsi untuk membagi citra menjadi dua bagian. Dua bagian tersebut adalah kelompok obyek dan kelompok latar.

Rotasi Citra

Rotasi Citra merupakan proses untuk mengkoreksi kemiringan dari sebuah citra. Sebuah citra yang akan dikoreksi kemiringannya akan dideteksi terlebih dahulu tingkat kemiringannya (skew-detection). Proses deteksi kemiringan (skew-detection) merupakan salah satu proses pengolahan citra untuk mendeteksi sudut kemiringan dari suatu citra dokumen masukan sehingga dokumen tersebut dapat diperbaiki kemiringannya berdasarkan sudut kemiringan yang didapatkan. Salah satu metode dalam mendeteksi sudut kemiringan sebuah citra adalah metode pendekatan momen. Pendekatan momen adalah pendekatan di mana untuk mengetahui seberapa besar penyimpangan orientasi suatu obyek dengan sumbu utama dilakukan dengan mempergunakan orientasi momen. Apabila besar sudut kemiringan (𝜃) citra dokumen teks masukan sudah diperoleh, maka langkah selanjutnya adalah rotasi citra dengan sudut rotasi sama dengan sudut (𝜃) (Widiarti & Himamunanto, 2013).

Penipisan Citra

Penipisan citra atau thinning merupakan proses reduksi sebuah citra menjadi garis yang kira - kira merupakan garis tengah sehingga menghasilkan sebuah rangka (skeleton). Tujuan dari penipisan adalah mereduksi komponen obyek citra menjadi

(23)

23

suatu informasi yang sifatnya esensial atau mendasar sehingga proses analisis lebih lanjut dapat terfasilitasi. Ada beberapa algoritma dalam penerapan thinning salah satunya adalah Algoritma Rosenfeld.

Resize Citra

Resize Citra merupakan proses pengubahan ukuran citra sesuai kebutuhan. Tujuan dari proses ini adalah untuk menyamakan semua ukuran data dalam satu ukuran, sehingga mempermudah dalam proses selanjutnya.

Ekstraksi Ciri

Ekstraksi ciri citra merupakan tahapan mengekstrak ciri / informasi dari objek di dalam citra yang ingin dikenali / dibedakan dengan objek lainya. Proses mengekstrak ciri berarti mencari sifat pola atribut dari setiap kelas (Widiarti & Himamunanto, 2013). Salah metode ekstraksi ciri adalah Intensity of Character (IoC). IoC merupakan metode ekstraksi ciri dengan membuat sebuah matriks dengan ukuran N x N, Dimana setiap unit 1x1 nya berisikan n pixel hasil penjumlahan pixel yang bernilai 0 atau berwarna hitam (Nugroho & Widiarti, 2016).

Berikut algoritma dari Ekstraksi Ciri :

Input : citra hasil preprocessing, ukuran ciri Algoritma :

1. Baca ukuran dari data yang masuk

(24)

3. Baca ukuran dari data yang masuk 4. Set variabel kolom dari lebar ukuran data 5. Set variabel baris dari tinggi ukuran data 6. Bagi data sesuai ukuran ciri yang diinginkan

7. Cari piksel dengan nilai 0 disetiap bagian dan jumlahkan 8. Ulangi langkah 5 disetiap bagian , hingga mendapatkan

sejumlah n (ukuran ciri) ciri. • Output : Matriks ciri NxN Modified K-Nearest Neighbor

Algoritma Modified K-Nearest Neighbor (MKNN) merupakan pengembangan dari algoritma KNN. Pengembangannya terletak pada penambahan beberapa proses yaitu perhitungan nilai validitas dan perhitungan bobot.

Perhitungan Jarak Euclidean

Euclidean merupakan metode untuk mendefinisikan jarak antara dua titik yaitu titik pada data training (x) dan titik pada data testing (y). Untuk mendapatkan jarak Euclidean digunakan rumus seperti pada persamaan (2.1).

𝑑 (𝑥𝑖, 𝑦𝑖) = √∑𝑛 (𝑥𝑖 − 𝑦𝑖)2 𝑖=0

(2.1) Dimana :

d(xi,yi) = Jarak Euclidean data xi dengan data yi. xi = Data training ke – i.

(25)

25

yi = Data testing ke – i. i = titik atau posisi data.

Berikut algoritma dari Jarak Euclidean : • Input : data latih.

• Algoritma :

1. Lakukan perulangan untuk i = 1 sampai total data latih. 2. Lakukan perulangan untuk j = 1 sampai total data latih. 3. Buat variabel untuk menyimpan hasil jumlah euclidean = 0. 4. Lakukan perulangan untuk k = 1 sampai banyaknya atribut

pada data latih.

5. Set variabel jumlaheuclidean = jumlah euclidean ditambah dengan kuadrat penjumlahan daru datalatih pada baris i dan kolom j dikurangi datalatih pada baris j dan kolom y.

6. Buat variabel untuk menyimpan hasil Euclidean = akar jumlah euclidean.

• Output : hasil nilai euclidean data latih

Perhitungan Nilai Validitas

Perhitungan nilai validitas merupakan tahap untuk mengvalidasi data training dengan data tetangganya dengan melihat kesamaan kelas antara data training dengan data tetangganya. Nilai Validitas didapat dengan persamaan 2.2.

𝑉𝑎𝑙𝑖𝑑𝑖𝑡𝑦(𝑥) = 1

𝐻∑ 𝑆 (𝑙𝑏𝑙(𝑥), 𝑙𝑏𝑙(𝑁𝑖(𝑥))) 𝑛

(26)

Dimana :

H : jumlah tetangga terdekat. lbl x : kelas x.

lbl (Ni(x)) : label kelas titik terdekat dengan x.

Fungsi S digunakan untuk menghitung kesamaan antara titik x dan data ke – i dari tetangga terdekat. Seperti terlihat pada persamaan 2.3

𝑆(𝑎, 𝑏) = {

1, 𝑎 = 𝑏

0, 𝑎 ≠ 𝑏 (2.3)

Keterangan :

a = kelas a pada data training

b = kelas lain selain a pada data training

Berikut algoritma dari Nilai Validitas : • Input : data euclidean data latih dan nilai k

(27)

27

• Algoritma :

1. Lakukan perulangan untuk i = 1 sampai jumlah data euclidean data latih.

2. Lakukan sorting terhadap data euclidean data latih. 3. Lakukan perulangan untuk j = 1 sampai nilai k – 1, 4. Lakukan perulangan untuk x= j+1 sampai nilai k.

5. Cek apakah Datalatih [indexurutvalidataslatih[j]] [diagnosis] = datalatih [indexurutvaliditaslatih[x]] [diagnosis].

6. Set K [ j ] = 1. 7. Set K [ x ] = 1.

8. Jumlahkan seluruh nilai pada variable K. 9. Buat variabel validitas ke I = sum/nilai k. • Output : Nilai validitas data latih.

Perhitungan Weighted Voting

Perhitungan Weighted Voting merupakan tahap untuk mencari bobot masing – masing tetangga yang dihitung dengan menggunakan rumus 1 / (de + 0.5). Kemudian, validitas dari tiap data pada data training dikalikan dengan bobot berdasarkan pada jarak Euclidian, sehingga Weighted Voting didapat dengan menggunakan persamaan 2.4.

(28)

𝑊(𝑖) = 𝑉𝑎𝑙𝑖𝑑𝑖𝑡𝑦(𝑖)𝑥 1

𝑑𝑒 + 𝑎 (2.4) Dimana :

W(i) = Perhitungan bobot atau Weight Voting Validity(i) = Nilai Validitas

de = Jarak Euclidian

𝑎 = 0.5

Hasil perhitungan Weighted Voting memiliki peran yang terpenting terhadap klasifikasi data uji dengan data training yang memiliki nilai validitas lebih tinggi dan dekat dengan data.

Berikut algoritma dari Weighted Voting :

• Input : Data euclidean data uji dan Nilai validitas data latih • Algoritma :

1. Lakukan perulangan untuk i = 1 sampai dengan jumlah data latih.

2. Lakukan perulangan unutk j = 1 sampai dengan jumlah data uji.

3. Buat variabel untuk menyimpan Weight Voting kemudian set variabel tersebut dengan nilai validitas data pada baris ke i dan kolom j dikalikan satu per nilai euclidean data uji pada baris ke i dan kolom j.

(29)

29

Evaluasi

Evaluasi merupakan sebuah proses penilain suatu kinerja algoritma. Terdapat dua hal yang dinilai yaitu penilaian hasil kinerja algoritma dan hasil akurasi algoritma. Dalam penilaian hasil kinerja algortima menggunakan metode Cross Validation.

Cross Validation

Cross validation merupakan salah satu metode untuk mengevaluasi dan membandingkan proses belajar (learning) dari sebuah algoritma. Metode ini membagi data menjadi dua bagian , yaitu data training dan data testing. Cross validation serupa dengan metode subsampling acak yang diulang, tetapi pengambilan sampel dilakukan sedemikian rupa sehingga tidak ada dua set pengujian yang tumpang tindih. Dalam k-fold cross-validation, set pembelajaran yang tersedia dipartisi menjadi k subset yang terpisah dengan ukuran yang kira-kira sama (Berrar, 2018). Berikut adalah gambaran dari k-fold cross validation dengan k = 3.

(30)

BAB 3 METODOLOGI PENELITIAN

Pada bab ini akan dipaparkan tentang metodologi penelitian yang dilakukan. Dari bagaimana mendapatkan data, kebutuhan perangkat yang digunakan baik perangkat keras maupun lunak, proses pengolahan data dari validasi data hinnga data bisa diolah pada klasifikasi, skenario pengujian, hingga rancangan desain antar muka yang akan digunakan dalam penelitian ini.

Cara Mendapatkan Data

Dalam penelitian ini, data Aksara Jawa diperoleh dari https://www.kaggle.com/phiard/aksara-Jawa . Jumlah data yang tersedia sebanyak 2.154 data Aksara Jawa tulis tangan, dengan setiap aksara memiliki jumlah data yang berbeda – beda. Berikut adalah rincian data dari Kaggle :

Tabel 3. 1 Data Aksara Jawa Aksara Jumlah Data

Ha 102 Na 108 Ca 108 Ra 108 Ka 108 Da 108 Ta 108 Sa 108 Wa 108 La 108 Pa 108 Dha 108 Ja 108 Ya 108 Nya 108 Ma 108 Ga 108 Ba 114 Tha 108 Nga 102

(31)

31

Gambar 3. 1 Salah Satu Sampel Data Aksara Kebutuhan perangkat Hardware dan Software

a) Spesifikasi Hardware

1. Processor AMD A9-9420 RADEON R5 2. RAM 8 Gb

3. Hardisk 1 Terra (HDD) + 120 Gb (SDD) b) Spesifikasi Software

1. Sistem Operasi Windows 10 2. MATLAB R2014b

(32)

Validitas Data

Tahap validitas data dilakukan untuk mengecek validitas dari data aksara disetiap kelas. Pengecekan ini dilakukan secara manual yaitu dengan menggunakan indra penglihatan peneliti. Pengecekan dilakukan dengan membandingkan citra aksara Jawa dari data penelitian dengan gambar aksara Jawa dari Buku Pepak Basa Jawa. Berikut adalah gambar aksara Jawa dari Buku Pepak Basa Jawa.

Gambar 3. 2 Gambar Aksara Jawa pada Buku Pepak Basa Jawa (Iskandar & Sariyun,2014)

Dari pengecekan melaui pengamatan secara manual, didapati ada citra aksara Jawa yang tidak sesuai kelas aksaranya dengan nama folder kelas aksara Jawa. Folder kelas tersebut adalah aksara Na. Berikut isi dari folder kelas aksara Na.

(33)

33

Gambar 3. 3 Folder Kelas Citra Aksara Na

Terdapat 6 data Aksara Jawa Ka pada folder kelas aksara Na seperti yang terlihat pada kotak bergaris merah. Aksara yang berbeda tersebut tidak digunakan pada penelitian, sehingga total data yang digunakan pada penelitian ini yang mulanya 2.154 aksara menjadi 2.148 data aksara Jawa.

Pemodelan Klasifikasi

Metode klasifikasi MKNN berjalan dengan menyiapkan data latih dengan diberikan proses perhitungan jarak euclidean dan nilai validitas. Setelah mendapatkan nilai validitas dari setiap data latih, proses akan berlanjut untuk data uji yaitu dengan mecari jarak euclidean data uji dengan data latih serta menghitung nilai weight voting. Sebelum data uji maupun data latih bisa diolah pada MKNN , data – data tersebut harus diproses pada tahap preprocessing hingga ekstraksi ciri. Secara garis besar, model dari proses klasifikasi MKNN dari data yang berupa citra hingga muncul akurasi seperti pada gambar 3.4.

(34)

Gambar 3. 4 Pemodelan Klasifikasi Metode Modified K-Nearest Neighbor Pada Gambar 3.4 terlihat ada proses model yang mana pada menghasilkan nilai validitas dari setiap data latih. Kemudian hasil dari model tersebut digunakan untuk proses klasifikasi data citra uji dan selanjutnya dicari akurasi dengan menghitung berapa data citra uji yang diklasifikasikan dengan benar.

Preprocessing

Data Aksara Jawa yang berupa citra akan masuk pada proses Preprocessing agar data bisa diolah untuk diambil ekstraksi ciri sebelum dibagi menjadi data training dan data testing. Berikut adalah alur dari proses Preprocessing.

(35)

35

Binerisasi

Citra yang masuk merupakan citra dengan jenis citra gambar atau citra RGB (Red Green Blue). Citra RGB tersebut harus diubah menjadi citra biner agar dapat diolah pada proses selanjutnya. Citra biner akan menghasilkan dua nilai pada setiap pixelnya yaitu bernilai 1 untuk warna putih dan bernilai 0 unutk warna hitam. Dalam penelitian ini, data Aksara Jawa yang digunakan sudah memiliki warna hitam dan putih. Namun, Citra dari aksara tersebut masih termasuk citra RGB. Oleh karena itu perlu proses Binerisasi. Penulis akan menggunakan fungsi binerisasi dari MATLAB yaitu im2bw. Rotate Image

Rotate image bertujuan untuk memperbaiki data citra yang miring. Sehingga citra yang dihasilkan pada tahap ini sudah pada posisi lurus. Proses Rotate image menggunakan Proses Normalisasi Orientasi. Proses Normalisasi Orientasi bertujuan mendeteksi sudut kemiringan dari sebuah citra. Kemudian memperbaiki citra tersebut denga melihat sudut kemiringan yang sudah didapat.

Cropping

Setelah diolah pada tahap Binerisasi tahap Preprocessing selanjutnya adalah Cropping. Pada tahap ini, citra akan memotong bagian yang kosong sehingga objek pada citra lebih menonjol. Metode cropping yang digunakan dalam penelitian ini menggunakan fungsi MATLAB yaitu imcrop.

Resize Citra

Citra yang sudah melalui tahap Cropping akan diubah ukurannya dengan tujuan agar memiliki ukuran yang sama. Pada

(36)

penelitian ini, penulis menggunakan fungsi resize citra dari MATLAB yaitu imresize.

Thinning

Pada tahap ini citra akan ditipiskan dengan menggunakan algoritma Rosenfeld. Rosenfeld bekerja dengan menghilangkan garis bagian tepi (edge) pada citra.

Ekstraksi Ciri

Tahap Ekstraksi Ciri merupakan tahap untuk mendapatkan ciri dari setiap citra aksara yang telah diproses pada preproccesing. Ciri inilah yang akan membantu proses pengenalan aksara pada tahap klasifikasi aksara. Metode ekstraksi ciri yang digunakan adalah Intensity of Character(Ioc). Berikut adalah algoritma dari metode IoC. Penelitian tentang klasifikasi aksara Jawa ini hanya menggunakan IoC dengan ukuran 3x3 piksesl.

Metode IoC menghitung piksel yang berwarna hitam atau bernilai 0 pada setiap bagian citra. Bagian citra tersebut dibagi berdasarkan ukuran ioc yang dimasukan. Jika ukuran IoC yang dimasukan adalah 3, maka citra akan dibagi menjadi 9 bagian. Ekstraksi ciri IoC akan menghasilkan sebuah matriks dengan ukuran NxN. Agar bisa digunakan pada tahap selanjutnya yaitu tahap klasifikasi, matriks yang awalnya berukuran NxN harus diubah menjadi matriks dengan ukuran 1xN. Berikut representasi dari hasil IoC dari data citra aksara Jawa yang sudah berukuran 1x9 (karena menggunakan IoC berukuran 3x3).

(37)

37

Tabel 3. 2 Hasil Ekstraksi Ciri Ciri Kelas 1 2 3 4 5 6 7 8 9 41 40 28 23 20 37 42 40 21 1 42 37 18 20 23 35 37 41 37 1 36 40 18 23 20 14 48 40 30 1 29 32 20 19 46 27 26 32 30 2 29 33 21 19 44 27 26 32 30 2 9 34 12 29 41 21 8 34 6 2 22 22 30 23 23 47 25 40 22 3 19 24 27 23 24 44 23 40 20 3 9 32 22 41 17 37 14 40 30 3

Tabel diatas merupakan representasi dari hasil ekstraksi ciri IoC dari aksara Ha yang ditunjukan dengan kelas 1, aksara Na yang ditunjukan dengan kelas 2, dan aksara Ca yang ditunjukan dengan kelas 3. Hasil Ekstraksi Ciri yang berupa angka inilah yang akan digunakan untuk tahap klasifikasi.

Klasifikasi

Melakukan klasifikasi data dengan menggunakan metode klasifikasi Modified K – Nearest Neighbor. Disini ada dua data yang digunakan yaitu data uji dan data latih. Data uji merupakan data yang belum memiliki label aksara. Sehingga pada tahap ini, data uji tersebut diklasifikasi dengan data latih yang sudah memiliki label aksara. Kemudian didapatkan hasil klasifikasi yang berupa label aksara dari data uji. Pada gambar 3.4 sudah terlihat alur dari klasifikasi metode MKNN dari data berupa citra hingga akurasi. Namun secara lebih detail, alur dari metode MKNN dapat dilihat pada gambar 3.6

(38)

Gambar 3. 6 Alur MKNN

Dari Gambar 3.6 metode MKNN mendapat inputan data latih citra yang merupakan data hasil ekstraksi ciri. Data latih yang sudah berupa angka tersebut dihitung jaraknya antar data latih dengan metode jarak euclidean. Setiap data latih akan mendapatkan hasil jarak dengan data latih lainnya, dimana akan diambil sejumlah k tetangga terdekat. K merupakan variabel untuk menentukan berapa jumlah tetangga yang harus diambil. Setelah mendapatkan sejumlah k tetangga dilakukanlah perhitungan nilai validitas.

Nilai validitas yang dijelaskan pada bab 2.6.2 akan melihat kesamaan kelas data latih dengan kelas tetangga terdekatnya, jika kelas sama akan mendapat nilai 1 dan jika kelasnya berbeda akan mendapat nilai 0. Setelah berproses pada data latih, metode MKNN akan memulai menghitung jarak antar data latih dengan data uji. Hasil dari perhitungan jarak tersebut digunakan untuk mencari Weight Voting. Pada persamaan 2.4 terlihat bahwa weight voting didapatkan dari perhitungan hasil jarak euclidean data latih dan data uji serta nilai validitas data latih.

Setelah mendapatkan nilai weight voting akan dicari sejumlah k tetangga dengan nilai weight voting paling tinggi. Penentuan kelas data uji didapatkan dengan melihat kelas dominan yang ada pada sejumlah k data dengan nilai weight voting tertinggi. Berikut adalah contoh perhitungan manual metode Modified K-Nearest Neighbor dengan data dummy.

(39)

39

Tabel 3. 3 Tabel Data Latih Data Citra

Citra Ciri Kelas

1 2 3 4 5 6 7 8 9 41 40 28 23 20 37 42 40 21 1 42 37 18 20 23 35 37 41 37 1 29 32 20 19 46 27 26 32 30 2 29 33 21 19 44 27 26 32 30 2 22 22 30 23 23 47 25 40 22 3 19 24 27 23 24 44 23 40 20 3

Tabel 3. 4 Tabel Data Uji Data Citra

Citra Ciri Kelas

1 2 3 4 5 6 7 8 9 36 40 18 23 20 14 48 40 30 1

Pada tabel diatas terdapat 9 ciri dari setiap data yang akan digunakan sebagai data dummy untuk perhitungan manual MKNN. Terdapat 3 kelas yang digunakan yaitu kelas 1 untuk aksara Ha, kelas 2 untuk aksara Na, dan kelas 3 untuk aksara Ca.

1. Menghitung Jarak Euclidean data latih

Perhitungan Jarak Euclidean antar data latih menggunakan rumus seperti persamaan (2.1). Proses perhitungan jarak Euclidean dimulai dengan :

(40)

• Menghitung jarak Data latih 1 dengan 6 data latih lainya : D(1,1) =√ (41 − 41)2+ (40 − 40)2+ (28 − 28)2 +(23 − 23)2+ (20 − 20)2 +(37 − 37)2+ (42 − 42)2+ (40 − 40)2+ (21 − 21)2 = 0 D (1,2) =√ (41 − 42)2+ (40 − 37)2+ (28 − 18)2 +(23 − 20)2+ (20 − 23)2 +(37 − 35)2+ (42 − 37)2+ (40 − 41)2+ (21 − 37)2 = 20,3470 D (1,3) =√ (41 − 29)2+ (40 − 32)2+ (28 − 20)2 +(23 − 19)2+ (20 − 46)2 +(37 − 27)2+ (42 − 26)2+ (40 − 32)2+ (21 − 30)2 = 38,2753 D (1,4) =√ (41 − 29)2+ (40 − 33)2+ (28 − 21)2 +(23 − 19)2+ (20 − 44)2 +(37 − 27)2+ (42 − 26)2+ (40 − 32)2+ (21 − 30)2 = 36,5377

(41)

41 D (1,5) =√ (41 − 22)2+ (40 − 22)2+ (28 − 30)2 +(23 − 23)2+ (20 − 23)2 +(37 − 47)2+ (42 − 25)2+ (40 − 40)2+ (21 − 22)2 = 32,9848 D (1,6) =√ (41 − 19)2+ (40 − 24)2+ (28 − 27)2 +(23 − 23)2+ (20 − 24)2 +(37 − 44)2+ (42 − 23)2+ (40 − 40)2+ (21 − 20)2 = 34,1760

Untuk data latih ke 2 hingga data latih ke 6 diperlakukan cara yang sama seperti data latih 1, sehingga didapatkan hasil jarak Euclidean untuk data latih seperti tabel 3.5.

Tabel 3. 5 Hasil Perthitungan Jarak Euclidean data Citra

Pada tabel 3.5 terlihat bahwa terdapat hasil yang bernilai 0. Hasil 0 tersebut menunjukan perhitungan jarak data latih terhadap dirinya sendiri, sehingga bernilai 0.

Data ke 1 2 3 4 5 6 Kelas 1 0,0000 20,3470 38,2753 36,5377 32,9848 34,1760 1 2 20,3470 0,0000 32,2955 30,8383 35,9444 36,8239 1 3 38,2753 32,2955 0,0000 2,4495 36,3731 34,2783 2 4 36,5377 30,8383 2,4495 0,0000 35,1710 33,0908 2 5 32,9848 35,9444 36,3731 35,1710 0,0000 6,3246 3 6 34,1760 36,8239 34,2783 33,0908 6,3246 0,0000 3

(42)

Selain itu hasil untuk jarak Euclidean data latih ke 1 dengan 2 akan sama hasilnya dengan jarak Euclidean data latih ke 2 dengan 1. Hal ini berlaku ke semua data latih. 2. Mencari nilai validitas data latih

Nilai validitas didapatkan dengan persamaan (2.2). Sebelum menghitung nilai validitas, langkah sebelumnya adalah mencari tetangga terdekat dari setiap data latih. Tetangga terdekat merupakan data dengan jarak Euclidean yang nilainya mendekati 0. Jumlah tetannga yang dipilih tergantung dengan nilai K. Pada contoh ini , nilai K yang digunakan adalah 3. Jadi, akan diambil 3 data yang memiliki nilai Euclidean mendekati 0 untuk setiap data latih.

• 3 tetangga terdekat data pertama adalah 2, 5, 6 • 3 tetangga terdekat data kedua adalah 1, 4, 3 • 3 tetangga terdekat data ketiga adalah 4, 2, 6 • 3 tetangga terdekat data keempat adalah 3, 2, 6 • 3 tetangga terdekat data kelima adalah 6, 1, 4 • 3 tetangga terdekat data keenam adalah 5, 4, 1

Setelah mendapatkan 3 tetangga untuk setiap data latih, selanjutnya masuk ketahap mencari nilai validitas dengan melihat kelas dari setiap data tetangga yang ada. Jika kelas data latih sama dengan kelas tetangganya akan mendapatkan nilai 1, jika berbeda akan mendapatkan nilai 0, sehingga hasil dari perhitungan nilai validitas seperti tabel 3.6.

(43)

43

Tabel 3. 6 Hasil Nilai Validitas data latihD

Data K = 1 K = 2 K = 3 Nilai Validitas

1 1 0 0 0.333 2 1 0 0 0.333 3 1 0 0 0.333 4 1 0 0 0.333 5 1 0 0 0.333 6 1 0 0 0.333

Pada tabel 3.6 nilai validitas untuk semua datalatih adalah 0.333. Hal ini menunjukan bahwa hanya ada 1/3 dari tetangga untuk setiap data latih yang kelas tetangga terdekatnya sama dengan data latih itu sendiri.

3. Menghitung Jarak Euclidean data uji dengan data latih

Perhitungan jarak Euclidean data uji dengan data latih sama dengan perhitungan jarak Euclidean data latih. Perbedaanya terletak pada data yang digunakan yaitu data uji dengan data latih. Hasil yang didapat dari perhitungan tahap ini terlihat pada tabel 3.7.

(44)

Tabel 3. 7 Hasil Eucliean data uji citra Data Uji Latih 1 27,7669 Latih 2 25,9808 Latih 3 39,0640 Latih 4 37,6298 Latih 5 48,5283 Latih 6 47,6130

Hasil pada tabel 3.6 dan 3.7 diatas akan digunakan untuk menghitung weight voting pada tahap berikutnya.

4. Menghitung Weight Voting

Perhitungan Weight Voting menggunakan persamaan 2.4, sehingga diperoleh hasil seperti tabel 3.8.

Tabel 3. 8 Hasil Weight Voting

Data Weight Voting

1 0,01167 2 0,01246 3 0,00834 4 0,00865 5 0,00673 6 0,00686

5. Menentukan label dari data uji

Penentuan label dilakukan dengan mencari nilai terbesar dari hasil Weight Voting. Banyaknya nilai terbesar bergantung pada nilai k, misal nilai k = 3 jumlah data terbesar yang diambil adalah tiga nilai Weight Voting terbesar.

(45)

45

Tabel 3. 9 Hasil Penentuan Tetangga

Data Tetangga Weight Voting Kelas

1 0,01246 1

2 0,01167 1

3 0,00865 2

Dari hasil tetangga terdekat tersebut, terlihat dari 3 tetangga yang mendominasi adalah kelas 1, sehingga klasifikasi aksara untuk data uji tersebut adalah kelas 1. Dimana kelas 1 merupakan kelas untuk aksara Jawa Ha. Jadi, aksara prediksi dari hasil klasifikasi adalah Ha. Hasil prediksi aksara uji ini sesuai dengan kelas aksara asalnya yaitu Ha (Tabel 3.4).

Cara Analisis Data

Analisis data yang dilakukan yaitu dengan melihat hasil akurasi terbaik. Hasil akurasi didapatkan dengan metode Cross fold Validation. Metode ini akan membagi data menjadi dua data yaitu data latih dan data uji seperti pada penjelasan bab 2.7.1. Pada pengujian ini akan menggunakan 3 nilai fold yaitu 3 fold, 5 fold, dan 7 fold. Sedangkan untuk nilai k pada metode Modified K-Nearest Neighbor yang dilakukan menggunakan 4 nilai k antara lain K=1, K=3, K=5, K=7, dan K=9.

Sesudah mendapatkan akurasi terbaik dari nilai K dan k-fold, hasil tersebut dibandingkan dengan akurasi dari hasil klasifikasi dengan menambahkan 2 ciri yaitu ukuran citra pada proses ekstraksi ciri, hasil klasifikasi tanpa adanya proses thinning dan hasil klasifikasi dengan mengubah nilai 𝑎 dengan nilai 0,25 dan 0,75. Hasil klasifikasi terbaik dari skenario tersebut akan digunaakn untuk pegujian data tunggal dan hasil klasifikasi dari skenario terbaik akan dibandingkan dengan hasil klasifikasi menggunakan metode KNN.

(46)

Desain User Interface

Desain user interface ini digunakan untuk melihat kinerja metode MKNN pada kasus klasifikasi aksara Jawa dengan data tunggal. Desain dapat dilihat pada gambar 3.9.

Gambar 3.9 Desain UI Uji Input Tampilan

3.1.1. Langkah awal dalam penggunaan interface ini adalah mengklik button Input Data Citra untuk memasuk data citra yang akan diklasifikasi. 3.1.2. Klik Mulai Klasifikasi untuk memulai proses klasifikasi Aksara Jawa

pada sistem. Output Tampilan

(47)

BAB 4 HASIL PENELITIAN DAN ANALISIS

Pada bab Hasil Penelitian dan Analisis akan memaparkan hasil dari pemrosesan citra aksara Jawa dari preprocessing hingga pengujian Klasifikasi Aksara Jawa dengan menggunakan metode Modified K-Nearest Neighbor.

Peprocessing

Seperti yang dijelaskan pada bab sebelumnya bahwa preprocessing merupakan tahap untuk menyipakan data agar dapat menghasilkan data yang mudah diolah saat klasifikasi.

Binerisasi

Binerisasi dilakukan menggunakan fungsi dari MATLAB yaitu im2bw(). Berikut adalah gambar sebelum dan sesudah citra mendapatkan proses binerisasi:

Citra asli Citra hasil biner

Gambar 4. 1 Hasil Binerisasi

Pada gambar 4.1 jika dilihat tidak ada perubahan yang mencolok dari citra asli menjadi citra biner. Namun, jika dilihat dari keterangan value, nampak bahwa citra asli yang awalnya berupa uint 8 ketika diproses binerisasi menjadi citra logical.

Rotasi Citra

Pada tahap ini citra yang telah diubah menjadi citra biner akan dideteksi kemiringannya. Hasil deteksi kemiringan atau yang disebut teta akan digunakan

(48)

sebagai sudut acuan dalam melakukan rotasi citra. Rotasi citra dilakukan menggunakan fungsi dari MATLAB yaitu imrotate(). Berikut hasil dari proses rotasi image:

Citra Sebelum Rotasi Citra Sesudah Rotasi

Gambar 4. 2 Hasil Rotasi Citra

Pada gambar 4.2 terlihat bahwa citra sebelum rotasi terlihat lebih naik dibagian kanan. Setelah dilakukan proses rotasi citra terlihat citra aksara sudah lebih lebih sejajar dari pada citra sebelum dirotasi.

Cropping

Croping merupakan tahap untuk membuang ruang yang kosong pada citra hasil rotasi, dengan tujuan agar menonjolkan objek yang ada pada citra. Proses Cropping menggunakan metode proyeksi profile. Hasil dari proses cropping terlihat pada gambar 4.3.

(49)

49

Citra sebelum cropping Citra sesudah cropping

Gambar 4. 3 Hasil Cropping

Gambar 4.3 menunjukkan hasil dari cropping citra, dimana citra yang awalnya memiliki ruang putih yang cukup banyak dihilangkan hingga hanya tersisa objek citra aksara itu sendiri. Ruang putih atau pixel putih yang hilang pada citra akan berpengaruh pada ukuran citra itu sendiri, seperti yang ditunjukan pada value masing – masing citra pada Gambar 4.3. Value tersebut menunjukan informasi ukuran citra sebelum cropping dan sesudah cropping, dimana ukuran setelah dicropping menjadi lebih kecil dari pada ukuran awalnya.

Resize Citra

Tahap Resize Citra merupakan kelanjutan dari tahap cropping, dimana citra yang sudah di cropping akan diubah ukurannya. Perubahan ukuran pada tahap ini bertujuan agar semua citra memiliki ukuran citra yang sama. Resize Citra menggunakan fungsi dari MATLAB yaitu imresize. Ukuran yang dipilih adalah 60 x 60 pixel. Hasilnya terlihat seperti pada Gambar 4.4

(50)

Citra Sebelum Resize memiliki ukuran 129x159 pixel

Citra Sesudah Cropping dengan ukuran 60x60 pixel

Gambar 4. 4 Hasil Resize

Hasil resize pada gambar 4.4 menunjukan ukuran dari citra asli yang diubah menjadi 60 x 60 piksel. Perubahan ini juga diberlakukan sama ke semua data citra, sehingga pada akhirnya seluruh data citra yang diolah pada proses preproccesing memiliki ukuran yang sama yaitu 60 x 60 piksel.

Thinning

Setelah citra mendapatkan proses resize, maka selanjutnya masuk pada proses Thinning atau penipisan. Proses ini merupakan proses untuk medapatkan kerangka dari citra dengan membuang pixel bagian tepi dari citra tersebut. Proses Thinning pada proses ini menggunakan metode Rosenfeld. Hasil dari penipisan terlihat pada gambar 4.5.

(51)

51

Citra awal Citra hasil penipisan

Gambar 4. 5 Hasil penipisan citra

Setelah didapatkan kerangka citra pada proses ini, data citra akan masuk pada proses ekstrasi ciri.

Ekstraksi Ciri dan Pembagian data

Proses ekstraksi ciri dengan metode IoC yang menggunakan ukuran 3 x 3 piksel. Hasil dari ekstraksi ciri akan sama seperti pada Tabel 3.2, dimana akan ada 9 ciri yang digunakan dalam proses klasifikasi. Perbedaannya pada kolom kelas akan ada 20 kelas aksara Jawa yang misalkan dalam bentuk angka. Angka tersebut menunjukan urutan dari Aksara Jawa itu sendiri. Pemilihan angka sebagai kelas bertujuan untuk mempermudah nanti ketika melakukan perbandingan kelas hasil prediksi dengan kelas asal.

Tabel 4. 1 Kelas Aksara Jawa Kelas Nama Aksara Kelas Nama Aksara Kelas Nama Aksara Nama Kelas Aksara 1 Ha 6 Da 11 Pa 16 Ma 2 Na 7 Ta 12 Dha 17 Ga 3 Ca 8 Sa 13 Ja 18 Ba 4 Ra 9 Wa 14 Ya 19 Tha 5 Ka 10 La 15 Nya 20 Nga

Data ekstraksi ciri itulah yang akan dibagi menjadi data latih dan data uji. Pembagian data menggunakan metode k-fold cross validation dimana jumlah data latih dan data uji sesuai dengan nilai fold yang digunakan. Misal nilai fold yang digunakan

(52)

adalah 3, maka data ekstraksi ciri yang berjumlah 2148 akan dibagi menjadi 3 fold untuk data latih dan data uji. Data yang masuk ke dalam data latih adalah 2/3 data yang berarti data latih akan memiliki data berjumlah 1432 data. Data yang masuk ke dalam data uji adalah 1/3 data yang berarti jumlah data ujinya adalah 713. Berikut adalah hasil pembagian data menggunakan 3 fold:

Gambar 4. 6 Pembagian data latih dengan 3 fold

Gambar 4. 7 Hasil pembagian data uji dengan 3 fold

Gambar 4.6 menunjukan data latih 3 fold dimana untuk setiap fold memiki 1432 data latih. Begitu juga dengan Gambar 4.2 menunjukan data uji 3 fold dimana setiap fold memiliki 716 data uji.

Untuk nilai fold 5 dan 7 juga sama aturanya yaitu membagi data sebanyak nilai fold yang dimasukan. Misal fold 5 maka data akan dibagi menjadi 1/5 dari jumlah seluruh data. Begitu juga dengan nilai fold 7, data akan dibagi menjadi 1/7 dari jumlah seluruh data. Pada pembagian dengan menggunakan k fold Cross Validation ini setiap fold akan menyimpan lebih dari 2 data untuk setiap kelas aksara. Sehingga ketika melakukan pengujian dapat dipastikan semua kelas aksara ada didalam data uji maupun didalam data latih.

(53)

53

Pengujian dan Evaluasi

Pengujian pada klasifikasi Modified K-Nearest Neighbor menggunakan beberapa variasi pengujian. Untuk nilai K pada Modified K-Nearest Neighbor menggunakan nilai K = 1,3,5,7, dan 9. Penentuan K didasarkan pada jumlah data untuk setiap kelas yang di range 102 – 115. Sehingga diambil nilai akar 100 yang hasilnya adalah 10. Maka, nilai K yang digunakan hanya mencapai 9. Ukuran citra aksara Jawa yang digunakan berukuan 60 x 60 piksel. Ekstraksi ciri dari IoC hanya menggunakan ukuran 3x3. Kemudian untuk fold yang digunakan adalah 3-fold, 5-fold, dan 7-fold.

Hasil pengujian dengan 3 fold Cross Validation

Pada pengujian 3 fold cross validation dengan 1432 data latih dan 716 data uji untuk setiap foldnya menunjukan hasil seperti pada tabel 4.2 :

Tabel 4. 2 Hasil Pengujian 3 fold

Nilai K Hasil Pengujian Rata - rata

Data uji 1 Data uji 2 Data uji 3

1 72,486 63,9665 68,1564 68,2029

3 72,3464 63,4075 68,1564 67,9701

5 69,9721 62,2905 66,7598 66,3408

7 63,2682 60,3352 63,5475 62,3836

9 62,1508 59,6369 60,7542 60,8473

Pada tabel 4.2 terlihat hasil rata – rata akurasi tertinggi pada nilai k = 1 dengan nilai 68,2029 %. Untuk hasil rata – rata akurasi terendah berada pada nilai k = 9 dengan nilai 60,8473%. Dari tabel 4.2 juga terlihat bahwa nilai k semakin tinggi akan mengurangi nilai rata – rata akurasi. Hal ini bisa dilihat lebih jelas pada gambar grafik 4.8.

(54)

Gambar 4. 8 Grafik Akurasi 3 fold.

Dari gambar grafik 4.8 lebih jelas penurunan nilai akurasi ketika nilai k bertambah. Pada pengujian 3 fold ini rentang dari akurasi berkisar 60 % hingga 68 %.

Hasil pengujian dengan 5 fold Cross Validation

Pada pengujian 5 fold cross validation jumlah data untuk data latih dan data uji disetiap foldnya berbeda. Fold data 1 sampai 4 memiliki jumlah data latih sebanyak 1713 dan jumlah data uji sebanyak 435. Sedangkan fold data 5 memiliki jumlah data latih sebanyak 1740 dan data uji sebanyak 408. Dari pengujian menggunakan 5 fold tersebut didapati hasil seperti pada tabel 4.3.

Tabel 4. 3 Hasil pengujian 5 fold

Nilai K Hasil Pengujian Rata - rata

Data Uji 1 Data Uji 2 Data Uji 3 Data Uji 4 Data Uji 5

1 72,8736 74,2529 70,5747 69,4253 74,0196 72,2292 3 73,3333 69,4253 69,8851 70,3448 70,5882 70,7153 5 76,3218 63,2184 69,4253 68,2579 65,9314 68,6310 7 72,1839 66,4368 70,5747 68,5057 63,7255 68,2853 9 67,3563 61,1494 69,8851 65,0575 57,1078 64,1112

(55)

55

Dari tabel 4.3 terlihat bahwa nilai akurasi tertinggi berada pada k 1 dan pada data uji 5 dengan nilai 76,3218 %. Sedangkan nilai akurasi terendah berada pada k 9 pada data uji 5 dengan nilai 57,1078%. Representasi lain dari hasil akurasi fold 5 tampak pada gambar grafik 4.9

Gambar 4. 9 Grafik Akurasi 5 fold.

Dari pengujian dengan 5 fold masih terlihat bahwa semakin besar nilai k semakin menurun pula hasil akurasinya. Namun, pada grafik rata – rata terlihat bahwa nilai rata – rata akurasi dari k 5 ke k 7 mengalami perubahan yang tidak terlalu signifikan. Hal ini berbeda dengan pengujian 3 fold. Dimana pada 3 fold grafik rata – rata akurasi terlihat turun jauh dari setiap hasil pengujian untuk nilai k nya, sedangkan pada 5 fold terjadi penurunan dari k 1 sampai k 5 namun pada hasil akurasi k 7 tidak begitu turun jauh dari hasil akurasi pada k 5. Secara keseluruhan , hasil dari setiap pengujian untuk nilai k pada fold 5 ini menunjukan penurunan ketika nilai k nya semakin naik.

(56)

Hasil pengujian dengan 7 fold Cross Validation

Pada pengujian 7 fold cross validation jumlah data untuk data latih dan data uji disetiap foldnya berbeda. Fold data 1 sampai 6 memiliki jumlah data latih sebanyak 1847 dan jumlah data uji sebanyak 301. Sedangkan fold data 5 memiliki jumlah data latih sebanyak 1806 dan data uji sebanyak 342. Dari pengujian menggunakan 7 fold tersebut didapati hasil sebagai berikut :

Tabel 4. 4 Hasil pengujian 7 fold Nilai

K

Hasil Pengujian Rata -

rata 1 2 3 4 5 6 7 1 75,75 76,74 67,11 73,09 73,75 85,38 75,73 75,37 3 78,41 70,43 67,11 73,75 72,09 81,06 75,15 74,00 5 75,75 65,45 67,44 73,42 68,77 78,41 71,93 71,60 7 73,75 63,46 70,10 74,75 69,77 72,76 67,25 70,26 9 69,44 64,12 62,46 76,41 67,77 70,10 63,45 67,68

Dari tabel 4.12 terlihat bahwa nilai akurasi tertinggi berada pada k 1 dan pada data uji 6 dengan nilai 85,38%. Sedangkan nilai akurasi terendah berada pada k 9 pada data uji 3 dengan nilai 62,46%. Representasi dari hasil akurasi pengujian dengan 7 fold tampak gambar grafik 4.10.

(57)

57

Dari pengujian dengan 7 fold masih terlihat bahwa semakin besar nilai k semakin menurun pula hasil akurasinya. Namun, pada fold 7 ini terjadi peningkatan hasil rata – rata akurasi dari pengujian fold sebelumnya. Dimana, pada fold 7 ini hanya ada satu hasil rata – rata akurasi dibawah 70%. Selain itu, juga terlihat hasil akurasi pengujian banyak yang bernilai diatas 70%. Hal ini juga diperkuat dari hasil rata – rata akurasi yang ditunjukan pada grafik 4.5. Dimana nilai rata – rata akurasi mencapai 75,37% dan rata – rata akurasi terendah 67,68%.

Data Uji Tunggal

Berdasarkan pengujian dengan menggunakan Cross Fold Validation yang menunnjukan bahwa hasil akurasi terbaik menggunakan nilai k sama dengan 1. Oleh karena itu, dilakukanlah uji tunggal menggunakan GUI dengan data uji sebagai berikut :

Tabel 4. 5 Tabel Data Uji

No. Aksara Citra Aksara

1 Ha 2 Na 3 Ca 4 Ra 5 Ka 6 Da

(58)

No. Aksara Citra Aksara 7 Ta 8 Sa 9 Wa 10 La 11 Pa 12 Dha 13 Ja 14 Ya 15 Nya 16 Ma 17 Ga

(59)

59

No. Aksara Citra Aksara

18 Ba

19 Tha

20 Nga

Dari data uji diatas didapatkan hasil sebagai berikut: Tabel 4. 6 Tabel Hasil Uji Tunggal

Data Uji Label Citra Label Prediksi Keterangan

1 Ha Ha Benar 2 Na Na Benar 3 Ca Ca Benar 4 Ra Ra Benar 5 Ka Ta Salah 6 Da Na Salah 7 Ta Ha Salah 8 Sa Ca Salah 9 Wa Dha Salah 10 La Ta Salah 11 Pa Wa Salah

12 Dha Dha Benar

13 Ja Da Salah

14 Ya Ya Benar

15 Nya Nya Benar

16 Ma Wa Salah

17 Ga Ga Benar

18 Ba Ba Benar

19 Tha Tha Benar

(60)

Berdasarkan Tabel 4.6 menunjukan bahwa 11 data uji dapat diprediksi dengan benar dan 9 data uji diprediksi salah. Akurasi yang didapatkan untuk data uji tunggal ini sebesar 55%, dengan hasil seperti itu metode MKNN ini hanya mampu mengenali 11 citra aksara jawa dalam data uji.

Perbandingan Hasil Akurasi

Rata – rata akurasi tertinggi dari percobaan dengan menggunakan Cross Fold Validataion mendapatkan rata – rata 75,3655 dengan nilai K = 1 dan k-fold = 7. Hasil ini dibandingkan dengan hasil dari klasifikasi menggunakan tambahan ciri ukuran, tanpa menggunakan thinning, ,mengubah nilai a, dan dengan hasil klasifikasi KNN.

Merubah Preprocessing dan Ekstraksi Ciri

Hasil akurasi perbandingan dari hasil akurasi terbaik pada poin 4.3.3 dibandingkan dengan hasil akurasi klasifikasi dengan tambahan ciri, hasil akurasi klasifikasi tanpa thining, dan hasil akurasi klasifikasi tanpa thining serta tambahan ciri. Hasilnya terlihat pada Tabel 4.7.

Tabel 4. 7 Tabel Hasil Perbandingan Akurasi Hasil Pengujian Pengujian 1 2 3 4 5 6 7 Rata - Rata A 75,7475 76,7442 67,1096 73,0897 73,7542 85,3821 75,731 75,3655 B 79,7342 75,4153 65,1163 65,7807 71,0963 76,7442 71,0526 72,1342 C 76,7442 78,7375 66,4452 67,1096 77,4086 82,0598 69,883 74,05541 D 77,7409 80,3987 61,794 68,1063 77,7409 81,7276 71,345 74,1219

Pengujian A merupakan pengujian dengan menggunakan skenario awal. Pengujian B merupakan proses klasifikasi MKNN sama dengan pengujian A namun pada ada penambahan ciri pada ekstraksi ciri, dimana ekstraksi ciri yang awalnya hanya

(61)

61

memiliki 9 ciri ditambah 2 ciri yang didapatkan dari ukuran citra sehingga menjadi 11 ciri. Pengujian C merupakan pengujian sama dengan pengujian A namun terdapat penghilangan proses thinning pada tahap preprocessing. Pengujian D merupakan pengujian dengan skenario gabungan dari pengujian A, B, dan C, dimana ada penambahan ciri pada ekstraksi ciri dan tidak menggunakan proses thinning pada tahap preprocessing.

Dari hasil perbandingan pengujian pada Tabel 4.7 terlihat bahwa pengujian A memiliki akurasi yang lebih tinggi dari pada pengujian lain. Hal ini menunjukkan bahwa dalam penelitian ini penambahan ciri ukuran dan penghilangan proses thinning pada preprocessing membuat akurasi dari klasifikasi ini turun.

Hasil perbandingan dengan merubah nilai 𝒂

Nilai 𝑎 merupakan nilai pembagi dalam perhitungan bobot atau Weight Voting. Nilai 𝑎 yang digunakan di hasil klasifikasi terbaik pada poin 4.3.3 yaitu 0,5. Hasil tersebut dibandingkan dengan hasil klasifikasi jika nilai 𝑎 0,25 dan nilai 𝑎 0,75, sehingga hasilnya perbandingannya terlihat pada Tabel 4.8

Tabel 4. 8 Hasil Perbandingan Nilai 𝑎 Hasil Pengujian Pengujian Nilai 𝑎 1 2 3 4 5 6 7 Rata - Rata 0,5 75,7475 76,7442 67,1096 73,0897 73,7542 85,3821 75,731 75,3655 0,25 75,7475 76,7442 67,1096 73,0897 73,7542 85,3821 75,731 75,3655 0,75 75,7475 76,7442 67,1096 73,0897 73,7542 85,3821 75,731 75,3655

Dari Tabel 4.8 terlihat bahwa perubahan nilai 𝑎 pada proses pembobotan / Weight Voting tidak menunjukkan perubahan yang signifikan bahkan bisa dikatakan sama.

(62)

Hasil Perbandingan dengan KNN

Hasil perbandingan klasifikasi MKNN dan KNN untuk kasus klasifikasi aksara jawa ini terlihat pada Tabel 4.9

Tabel 4. 9 Hasil Perbandingan MKNN dan KNN Hasil Pengujian

Pengujian 1 2 3 4 5 6 7 Rata -

Rata MKNN 75,7475 76,7442 67,1096 73,0897 73,7542 85,3821 75,731 75,3655

KNN 76,0797 79,4020 76,4120 74,4186 81,0631 86,7110 75,7310 78,5453

Dari Tabel 4.9 terlihat bahwa hasil klasifikasi KNN menunjukan akurasi yang lebih baik daripada hasil MKNN. Dari setiap pengujian fold juga terlihat bahwa hasil akurasi yang lebih tinggi pada hasil klasifikasi KNN.

Pembahasan

Tahap ini akan membahas hasil dari pengujian dan evaluasi klasifikasi aksara Jawa dengan menggunakan metode modified k nearest neighbor. Bisa dilihat pada point 4.4 dimana hasil rata – rata akurasi pengujian tertinggi berada pada pengujian di 7 fold dengan nilai rata – rata 75,37%. Jumlah data latih pada 7 fold lebih banyak dibandingkan dengan jumlah data latih pada fold lainnya yang membuat hasil rata – rata akurasinya lebih baik dari hasil rata – rata fold lainya. Hal ini sejalan dengan penelitian yang dilakukan oleh Bela,dkk (2017) yang menyatakan bahwa banyaknya data latih akan mempengaruhi akurasi. Dimana, semakin banyak data latih akan membuat hasil akurasi semakin tinggi.

Pada hasil pengujian dan evaluasi juga terlihat pengaruh dari nilai K yang digunakan. Pada setiap hasil pengujian untuk seluruh fold , terlihat bahwa semakin tinggi nilai k hasil akurasinya semakin menurun. Hal ini sejalan dengan penelitian yang dilakukan oleh Bela, dkk (2017) yang menyatakan bahwa banyaknya K akan

(63)

63

berdampak pada hasil akurasi klasifikasi. Dimana , semakin kecil nilai K maka hasil akurasi semakin baik. Sedangkan semakin besar nilai K maka hasil akurasi semakin menurun. Hal ini terjadi karena, nilai K yang merupakan nilai tetangga jika semakin banyak akan membuat memunculkan banyak pertimbangan dalam penentuan kelas. Jika tetangga semakin sedikit maka jumlah tetangga yang dipertimbangkan semakin sedikit. Pada representasi dengan menggunakan grafik untuk setiap pengujian, terlihat bahwa hasil selalu konsisten menurun jika nilai k yang digunakan semakin tinggi.

Dalam perbandingan hasil akurasi terbaik dari MKNN dengan hasil akurasi klasifikasi MKNN penambahan ciri dan tidak menggunakan thinning menunjukan hasil bahwa akurasi tertinggi tetap didapatkan dari proses tanpa penambahan ciri dan menggunakan thinning. Perubahan nilai a pada pembobotan / weight voting dengan nilai a = 0,25 dan a=0,75 tidak menunjukkan perubahan yang signifikan. Hasil perbandingan dari akurasi terbaik MKNN dengan KNN menunjjukan bahwa hasil KNN pada kasus klasifikasi citra aksara jawa dengan ioc 3x3 piksel lebih tinggi dari pada hasil MKNN. Hal ini tidak sejalan dengan penelitian yang dilakukan oleh Ravi, dkk(2019) yang menunjukkan bahwa hasil MKNN lebih baik dari pada KNN.

(64)

BAB 5 PENUTUP Kesimpulan

Berdasarkan penelitian mengenai klasifikasi aksara Jawa menggunakan metode k-nearest neighbor, dapat ditarik kesimpulan sebagai berikut:

1. Dalam klasifikasi aksara Jawa menggunakan metode k-nearest neighbor dengan hasil akurasi 60% - 75% relatif cukup baik digunakan untuk pengenalan aksara Jawa.

2. Hasil rata – rata akurasi terbaik didapatkan pada pengujian menggunakan fold 7 dengan nilai 75,37%. Untuk rata – rata akurasi terendah berada pada k-fold 3 dengan nilai 60,8473%.

3. Pada seluruh pengujian dengan k-fold 3, k-fold 5, dan k-fold 7, rata – rata hasil dari setiap pengujian meningkat dari k-fold 3 hingga k-fold 7. Hal ini menunjukkan bahwa semakin tinggi nilai k-fold yang digunakan akan semakin baik hasil yang didapatkan.

4. Dari seluruh hasil akurasi dari setiap pengujian menggunakan nilai k tetangga 1, 3, 5, 7, dan 9. Terlihat bahwa akurasi tertinggi berada pada nilai k tetangga = 1. Hal ini menunjukan bahwa semakin kecil nilai k tetangga akan memberikan hasil yang lebih baik.

Saran

Untuk mengembangkan sistem klasifikasi aksara Jawa menggunakan metode k-nearest neighbor agar semakin baik kedepan, maka perlu adanya saran sebagi berikut :

1. Menambah beberapa proses tambahan pada preprocessing citra aksara Jawa ini, karena masih ada beberapa citra yang memiliki hasil preprocessing kurang maksimal.

(65)

65

2. Mencoba menggunakan ekstraksi ciri selain IoC atau menggunakan ukuran IoC lain seperti 4x4 piksel atau 5x5 piksel untuk mendapatkan nilai ciri yang lebih baik.

3. Mengembangkan lagi sistem klasifikasi aksara Jawa ini ke aplikasi mobile agar bisa digunakan secara umum oleh banyak orang

(66)

DAFTAR PUSTAKA

Bela, M., Putri, P., & Santoso, E. (2017). Diagnosis Penyakit Kulit Pada Kucing Menggunakan Metode Modified K- Nearest Neighbor. 1(12), 1797–1803. Berrar, D. (2018). Cross-validation. Data Science Laboratory, Tokyo Institute of

Technology, 1, 542–545.

Fakihatin, W., Nurul, H., & Perdana, R. S. (2017). Implementasi Algoritma Modified K-Nearest Neighbor ( MKNN ) untuk Klasifikasi Penyakit Demam. Jurnal Pengembangan Teknologi Informasi Dan Ilmu Komputer (J-PTIIK) Universitas Brawijaya, 1(10), 1210–1219.

http://j-ptiik.ub.ac.id/index.php/j-ptiik/article/view/364/156

Iskandar, A. K., & Sariyun. (2014). Pepak basa Jawa : cara gampang sinau cepet lan tuntas basa Jawa (Sariyun (ed.); Edisi Revi). Aswaja Pressindo.

Ravi, M. R., Indriati, & Adinugroho, S. (2019). Implementasi Algoritme Modified K-Nearest Neighbor (MKNN) Untuk Mengidentifikasi Penyakit Gigi Dan Mulut. Jurnal Pengembangan Teknologi Informasi Dan Ilmu Komputer, Vol. 3, 2596– 2602.

Widiarti, A. R. (2020). Unjuk kerja k-nearest neighbor untuk alihaksara citra aksara Nusantara. Jurnal Teknologi Dan Sistem Komputer, 8.

Widiarti, A. R., & Himamunanto, A. R. (2013). Teori Dan Aplikasi Pengolahan Citra Digital Transliterasi Otomatis Citra Dokumen Teks Aksara Jawa. In Lintang Pustaka Utama.

Gambar

Gambar 2. 1 3 Fold Cross Validation
Tabel 3. 1 Data Aksara Jawa   Aksara  Jumlah Data
Gambar 3. 1 Salah Satu Sampel Data Aksara    Kebutuhan perangkat Hardware dan Software
Gambar 3. 2 Gambar Aksara Jawa pada Buku Pepak Basa Jawa (Iskandar &amp;
+7

Referensi

Garis besar

Dokumen terkait

Untuk mengetahui nilai akurasi dari penerapan metode k-nn ini, penulis mencoba melakukan beberapa uji coba dengan enam skenario, yaitu dengan menggunakan data uji

Dari unjuk kerja algoritma ID3 untuk klasifikasi pola batik Yogyakarta dengan menggunakan 10 jenis pola batik Yogyakarta, dimana setiap jenis memiliki 40

Tujuan penelitian adalah mengetahui temperatur terendah dan koefisien unjuk kerja (COP) yang dapat dicapai alat pendingin adsorpsi Amonia-CaCl 2.. Pada penelitian ini

47 Tabel 4.3 Pengujian metode k-Nearest Neighbor (kNN) dan hasil nilai k pada fitur gabungan semantik kata dan statistik kata (ensemble feature) ... 4.4 Akurasi dan penggunaan nilai

Dalam penulisan tugas akhir ini, metode analisis yang digunakan untuk mengklasifikasikan citra adalah dengan menggunakan algoritma yang terdapat pada Pembelajaran Dalam,

Berdasarkan akurasi yang didapat pada pengujian 10-fold cross validation untuk seratus data tugas akhir, metode Naïve Bayes Classifier dapat melakukan klasifikasi

ANALISIS PERBANDINGAN PENGIRIMAN BARANG MENGGUNAKAN METODE NORTH WEST CORNER DAN LEAST COST.. (STUDI KASUS: PT. COCA COLA AMATIL

Sehingga didapatkan akurasi terbaik sebesar 91,67% dan waktu komputasi 69,6s dengan menggunakan metode Gabor Wavelet dimana digunakan ekstraksi ciri berdasarkan tekstur dan