PENUTUP - KLASIFIKASI CITRA AKSARA JAWA MENGGUNAKAN METODE MODIFIED K-NEAREST NEIGHBOR TUGAS AK

BAB I PENDAHULUAN

BAB 5 PENUTUP

Pada bab ini berisikan kesimpulan yang didapat dari penelitian dan saran yang diberikan penulis agar penelitian ini dapat dikembangkan lagi.

BAB 2 LANDASAN TEORI

Pada bab ini akan dipaparkan teori – teori yang digunakan dalam penelitian ini. Mulai dari pengertian aksara jawa , pengertian citra, teori – teori pemrosesan citra dari tahap pengolahan citra hingga ekstraksi ciri serta teori yang digunakan dalam tahap klasifikasi MKNN itu sendiri.

Aksara Jawa

Aksara Jawa merupakan salah satu kekayaan Budaya Nusantara yang lahir dan berkembang di Pulau Jawa. Aksara Jawa juga dikenal dengan Hanacaraka, Carakan, atau Dentawyanjana (Wikipedia, 2020). Aksara ini memiliki 20 aksara dasar yaitu Ha, Na, Ca, Ra, Ka, Da, Ta, Sa, Wa, La, Pa ,Dha, Ja, Ya, Nya, Ma, Ga, Ba, Tha, Nga. Aksara ini pada jaman dulu aktif digunakan oleh masyarakat secara luas untuk tulisan sehari - hari maupun sastra.

Pengertian Citra

Citra atau yang sering dikenal dengan gambar merupakan sebuah komponen multimedia yang memberikan informasi dalam bentuk visual. Dalam matematis , citra dinyatakan sebagai 0 < f (x,y) < karena citra merupakan fungsi kontinu dari intensitas bidang dua dimensi (2D). Dalam dunia digital , citra didefinisikan sebagai citra f(x,y) dengan nilai dalam koordinat bidang merupakan nilai diskrit. Citra digital tersusun dari kumpulan titik atau elemen - elemen gambar yang disebut dengan piksel(picture element) (Gonzalez, R.C. & Woods, R.E., 1992).

Pemrosesan Citra Digital

Pemrosesan Citra Digital atau Pengolahan Citra Digital merupakan suatu pengolahan terhadap sebuah citra dengan menggunakan komputer. Pemrosesan Citra dilakukan untuk memperbaiki sebuah citra agar mudah dimengerti atau diinterpretasi oleh manusia atau mesin. Dasar dari pemrosesan citra adalah memodifikasi setiap titik atau piksel pada citra sesuai dengan kebutuhan (Gonzalez, R.C. & Woods, R.E., 1992).

Preprocessing

Preprocessing adalah proses mempersiapkan data untuk bisa diolah sesuai kebutuhan. Proses ini diperlukan karena tidak semua data yang disiapkan sudah bisa digunakan sesuai kebutuhan.

Binarisasi Citra

Binarisasi merupakan tahap pengolahan pada tingkat piksel dimana terjadi proses pemisahan antara objek pada citra dengan latar belakang yang tidak dibutuhkan. Proses ini secara otomatis menentukan nilai ambang threshold yang berfungsi untuk membagi citra menjadi dua bagian. Dua bagian tersebut adalah kelompok obyek dan kelompok latar.

Rotasi Citra

Rotasi Citra merupakan proses untuk mengkoreksi kemiringan dari sebuah citra. Sebuah citra yang akan dikoreksi kemiringannya akan dideteksi terlebih dahulu tingkat kemiringannya (skew-detection). Proses deteksi kemiringan (skew-detection) merupakan salah satu proses pengolahan citra untuk mendeteksi sudut kemiringan dari suatu citra dokumen masukan sehingga dokumen tersebut dapat diperbaiki kemiringannya berdasarkan sudut kemiringan yang didapatkan. Salah satu metode dalam mendeteksi sudut kemiringan sebuah citra adalah metode pendekatan momen. Pendekatan momen adalah pendekatan di mana untuk mengetahui seberapa besar penyimpangan orientasi suatu obyek dengan sumbu utama dilakukan dengan mempergunakan orientasi momen. Apabila besar sudut kemiringan (𝜃) citra dokumen teks masukan sudah diperoleh, maka langkah selanjutnya adalah rotasi citra dengan sudut rotasi sama dengan sudut (𝜃) (Widiarti & Himamunanto, 2013).

Penipisan Citra

Penipisan citra atau thinning merupakan proses reduksi sebuah citra menjadi garis yang kira - kira merupakan garis tengah sehingga menghasilkan sebuah rangka (skeleton). Tujuan dari penipisan adalah mereduksi komponen obyek citra menjadi

suatu informasi yang sifatnya esensial atau mendasar sehingga proses analisis lebih lanjut dapat terfasilitasi. Ada beberapa algoritma dalam penerapan thinning salah satunya adalah Algoritma Rosenfeld.

Resize Citra

Resize Citra merupakan proses pengubahan ukuran citra sesuai kebutuhan. Tujuan dari proses ini adalah untuk menyamakan semua ukuran data dalam satu ukuran, sehingga mempermudah dalam proses selanjutnya.

Ekstraksi Ciri

Ekstraksi ciri citra merupakan tahapan mengekstrak ciri / informasi dari objek di dalam citra yang ingin dikenali / dibedakan dengan objek lainya. Proses mengekstrak ciri berarti mencari sifat pola atribut dari setiap kelas (Widiarti & Himamunanto, 2013). Salah metode ekstraksi ciri adalah Intensity of Character (IoC). IoC merupakan metode ekstraksi ciri dengan membuat sebuah matriks dengan ukuran N x N, Dimana setiap unit 1x1 nya berisikan n pixel hasil penjumlahan pixel yang bernilai 0 atau berwarna hitam (Nugroho & Widiarti, 2016).

Berikut algoritma dari Ekstraksi Ciri :

• Input : citra hasil preprocessing, ukuran ciri • Algoritma :

1. Baca ukuran dari data yang masuk

3. Baca ukuran dari data yang masuk 4. Set variabel kolom dari lebar ukuran data 5. Set variabel baris dari tinggi ukuran data 6. Bagi data sesuai ukuran ciri yang diinginkan

7. Cari piksel dengan nilai 0 disetiap bagian dan jumlahkan 8. Ulangi langkah 5 disetiap bagian , hingga mendapatkan

sejumlah n (ukuran ciri) ciri. • Output : Matriks ciri NxN Modified K-Nearest Neighbor

Algoritma Modified K-Nearest Neighbor (MKNN) merupakan pengembangan dari algoritma KNN. Pengembangannya terletak pada penambahan beberapa proses yaitu perhitungan nilai validitas dan perhitungan bobot.

Perhitungan Jarak Euclidean

Euclidean merupakan metode untuk mendefinisikan jarak antara dua titik yaitu titik pada data training (x) dan titik pada data testing (y). Untuk mendapatkan jarak Euclidean digunakan rumus seperti pada persamaan (2.1).

𝑑 (𝑥𝑖, 𝑦𝑖) = √∑^𝑛 (𝑥𝑖 − 𝑦𝑖)2 𝑖=0

(2.1) Dimana :

d(xi,yi) = Jarak Euclidean data xi dengan data yi. xi = Data training ke – i.

yi = Data testing ke – i. i = titik atau posisi data.

Berikut algoritma dari Jarak Euclidean : • Input : data latih.

• Algoritma :

1. Lakukan perulangan untuk i = 1 sampai total data latih. 2. Lakukan perulangan untuk j = 1 sampai total data latih. 3. Buat variabel untuk menyimpan hasil jumlah euclidean = 0. 4. Lakukan perulangan untuk k = 1 sampai banyaknya atribut

pada data latih.

5. Set variabel jumlaheuclidean = jumlah euclidean ditambah dengan kuadrat penjumlahan daru datalatih pada baris i dan kolom j dikurangi datalatih pada baris j dan kolom y.

6. Buat variabel untuk menyimpan hasil Euclidean = akar jumlah euclidean.

• Output : hasil nilai euclidean data latih

Perhitungan Nilai Validitas

Perhitungan nilai validitas merupakan tahap untuk mengvalidasi data training dengan data tetangganya dengan melihat kesamaan kelas antara data training dengan data tetangganya. Nilai Validitas didapat dengan persamaan 2.2.

𝑉𝑎𝑙𝑖𝑑𝑖𝑡𝑦(𝑥) = ¹

𝐻^∑ ^{𝑆 (𝑙𝑏𝑙(𝑥), 𝑙𝑏𝑙(𝑁𝑖(𝑥)))} 𝑛

Dimana :

H : jumlah tetangga terdekat. lbl x : kelas x.

lbl (Ni(x)) : label kelas titik terdekat dengan x.

Fungsi S digunakan untuk menghitung kesamaan antara titik x dan data ke – i dari tetangga terdekat. Seperti terlihat pada persamaan 2.3

𝑆(𝑎, 𝑏) = {

1, 𝑎 = 𝑏

0, 𝑎 ≠ 𝑏 (2.3)

Keterangan :

a = kelas a pada data training

b = kelas lain selain a pada data training

Berikut algoritma dari Nilai Validitas : • Input : data euclidean data latih dan nilai k

• Algoritma :

1. Lakukan perulangan untuk i = 1 sampai jumlah data euclidean data latih.

2. Lakukan sorting terhadap data euclidean data latih. 3. Lakukan perulangan untuk j = 1 sampai nilai k – 1, 4. Lakukan perulangan untuk x= j+1 sampai nilai k.

5. Cek apakah Datalatih [indexurutvalidataslatih[j]] [diagnosis] = datalatih [indexurutvaliditaslatih[x]] [diagnosis].

6. Set K [ j ] = 1. 7. Set K [ x ] = 1.

8. Jumlahkan seluruh nilai pada variable K. 9. Buat variabel validitas ke I = sum/nilai k. • Output : Nilai validitas data latih.

Perhitungan Weighted Voting

Perhitungan Weighted Voting merupakan tahap untuk mencari bobot masing – masing tetangga yang dihitung dengan menggunakan rumus 1 / (de + 0.5). Kemudian, validitas dari tiap data pada data training dikalikan dengan bobot berdasarkan pada jarak Euclidian, sehingga Weighted Voting didapat dengan menggunakan persamaan 2.4.

𝑊(𝑖) = 𝑉𝑎𝑙𝑖𝑑𝑖𝑡𝑦(𝑖)𝑥 ¹

𝑑𝑒 + 𝑎 (2.4) Dimana :

W(i) = Perhitungan bobot atau Weight Voting Validity(i) = Nilai Validitas

de = Jarak Euclidian

𝑎 = 0.5

Hasil perhitungan Weighted Voting memiliki peran yang terpenting terhadap klasifikasi data uji dengan data training yang memiliki nilai validitas lebih tinggi dan dekat dengan data.

Berikut algoritma dari Weighted Voting :

• Input : Data euclidean data uji dan Nilai validitas data latih • Algoritma :

1. Lakukan perulangan untuk i = 1 sampai dengan jumlah data latih.

2. Lakukan perulangan unutk j = 1 sampai dengan jumlah data uji.

3. Buat variabel untuk menyimpan Weight Voting kemudian set variabel tersebut dengan nilai validitas data pada baris ke i dan kolom j dikalikan satu per nilai euclidean data uji pada baris ke i dan kolom j.

Evaluasi

Evaluasi merupakan sebuah proses penilain suatu kinerja algoritma. Terdapat dua hal yang dinilai yaitu penilaian hasil kinerja algoritma dan hasil akurasi algoritma. Dalam penilaian hasil kinerja algortima menggunakan metode Cross Validation.

Cross Validation

Cross validation merupakan salah satu metode untuk mengevaluasi dan membandingkan proses belajar (learning) dari sebuah algoritma. Metode ini membagi data menjadi dua bagian , yaitu data training dan data testing. Cross validation serupa dengan metode subsampling acak yang diulang, tetapi pengambilan sampel dilakukan sedemikian rupa sehingga tidak ada dua set pengujian yang tumpang tindih. Dalam k-fold cross-validation, set pembelajaran yang tersedia dipartisi menjadi k subset yang terpisah dengan ukuran yang kira-kira sama (Berrar, 2018). Berikut adalah gambaran dari k-fold cross validation dengan k = 3.

BAB 3 METODOLOGI PENELITIAN

Pada bab ini akan dipaparkan tentang metodologi penelitian yang dilakukan. Dari bagaimana mendapatkan data, kebutuhan perangkat yang digunakan baik perangkat keras maupun lunak, proses pengolahan data dari validasi data hinnga data bisa diolah pada klasifikasi, skenario pengujian, hingga rancangan desain antar muka yang akan digunakan dalam penelitian ini.

Cara Mendapatkan Data

Dalam penelitian ini, data Aksara Jawa diperoleh dari https://www.kaggle.com/phiard/aksara-Jawa . Jumlah data yang tersedia sebanyak 2.154 data Aksara Jawa tulis tangan, dengan setiap aksara memiliki jumlah data yang berbeda – beda. Berikut adalah rincian data dari Kaggle :

Tabel 3. 1 Data Aksara Jawa Aksara Jumlah Data

Ha 102 Na 108 Ca 108 Ra 108 Ka 108 Da 108 Ta 108 Sa 108 Wa 108 La 108 Pa 108 Dha 108 Ja 108 Ya 108 Nya 108 Ma 108 Ga 108 Ba 114 Tha 108 Nga 102

Gambar 3. 1 Salah Satu Sampel Data Aksara Kebutuhan perangkat Hardware dan Software

a) Spesifikasi Hardware

1. Processor AMD A9-9420 RADEON R5 2. RAM 8 Gb

3. Hardisk 1 Terra (HDD) + 120 Gb (SDD) b) Spesifikasi Software

1. Sistem Operasi Windows 10 2. MATLAB R2014b

Validitas Data

Tahap validitas data dilakukan untuk mengecek validitas dari data aksara disetiap kelas. Pengecekan ini dilakukan secara manual yaitu dengan menggunakan indra penglihatan peneliti. Pengecekan dilakukan dengan membandingkan citra aksara Jawa dari data penelitian dengan gambar aksara Jawa dari Buku Pepak Basa Jawa. Berikut adalah gambar aksara Jawa dari Buku Pepak Basa Jawa.

Gambar 3. 2 Gambar Aksara Jawa pada Buku Pepak Basa Jawa (Iskandar & Sariyun,2014)

Dari pengecekan melaui pengamatan secara manual, didapati ada citra aksara Jawa yang tidak sesuai kelas aksaranya dengan nama folder kelas aksara Jawa. Folder kelas tersebut adalah aksara Na. Berikut isi dari folder kelas aksara Na.

Gambar 3. 3 Folder Kelas Citra Aksara Na

Terdapat 6 data Aksara Jawa Ka pada folder kelas aksara Na seperti yang terlihat pada kotak bergaris merah. Aksara yang berbeda tersebut tidak digunakan pada penelitian, sehingga total data yang digunakan pada penelitian ini yang mulanya 2.154 aksara menjadi 2.148 data aksara Jawa.

Pemodelan Klasifikasi

Metode klasifikasi MKNN berjalan dengan menyiapkan data latih dengan diberikan proses perhitungan jarak euclidean dan nilai validitas. Setelah mendapatkan nilai validitas dari setiap data latih, proses akan berlanjut untuk data uji yaitu dengan mecari jarak euclidean data uji dengan data latih serta menghitung nilai weight voting. Sebelum data uji maupun data latih bisa diolah pada MKNN , data – data tersebut harus diproses pada tahap preprocessing hingga ekstraksi ciri. Secara garis besar, model dari proses klasifikasi MKNN dari data yang berupa citra hingga muncul akurasi seperti pada gambar 3.4.

Gambar 3. 4 Pemodelan Klasifikasi Metode Modified K-Nearest Neighbor Pada Gambar 3.4 terlihat ada proses model yang mana pada menghasilkan nilai validitas dari setiap data latih. Kemudian hasil dari model tersebut digunakan untuk proses klasifikasi data citra uji dan selanjutnya dicari akurasi dengan menghitung berapa data citra uji yang diklasifikasikan dengan benar.

Preprocessing

Data Aksara Jawa yang berupa citra akan masuk pada proses Preprocessing agar data bisa diolah untuk diambil ekstraksi ciri sebelum dibagi menjadi data training dan data testing. Berikut adalah alur dari proses Preprocessing.

• Binerisasi

Citra yang masuk merupakan citra dengan jenis citra gambar atau citra RGB (Red Green Blue). Citra RGB tersebut harus diubah menjadi citra biner agar dapat diolah pada proses selanjutnya. Citra biner akan menghasilkan dua nilai pada setiap pixelnya yaitu bernilai 1 untuk warna putih dan bernilai 0 unutk warna hitam. Dalam penelitian ini, data Aksara Jawa yang digunakan sudah memiliki warna hitam dan putih. Namun, Citra dari aksara tersebut masih termasuk citra RGB. Oleh karena itu perlu proses Binerisasi. Penulis akan menggunakan fungsi binerisasi dari MATLAB yaitu im2bw. • Rotate Image

Rotate image bertujuan untuk memperbaiki data citra yang miring. Sehingga citra yang dihasilkan pada tahap ini sudah pada posisi lurus. Proses Rotate image menggunakan Proses Normalisasi Orientasi. Proses Normalisasi Orientasi bertujuan mendeteksi sudut kemiringan dari sebuah citra. Kemudian memperbaiki citra tersebut denga melihat sudut kemiringan yang sudah didapat.

• Cropping

Setelah diolah pada tahap Binerisasi tahap Preprocessing selanjutnya adalah Cropping. Pada tahap ini, citra akan memotong bagian yang kosong sehingga objek pada citra lebih menonjol. Metode cropping yang digunakan dalam penelitian ini menggunakan fungsi MATLAB yaitu imcrop.

• Resize Citra

Citra yang sudah melalui tahap Cropping akan diubah ukurannya dengan tujuan agar memiliki ukuran yang sama. Pada

penelitian ini, penulis menggunakan fungsi resize citra dari MATLAB yaitu imresize.

• Thinning

Pada tahap ini citra akan ditipiskan dengan menggunakan algoritma Rosenfeld. Rosenfeld bekerja dengan menghilangkan garis bagian tepi (edge) pada citra.

Ekstraksi Ciri

Tahap Ekstraksi Ciri merupakan tahap untuk mendapatkan ciri dari setiap citra aksara yang telah diproses pada preproccesing. Ciri inilah yang akan membantu proses pengenalan aksara pada tahap klasifikasi aksara. Metode ekstraksi ciri yang digunakan adalah Intensity of Character(Ioc). Berikut adalah algoritma dari metode IoC. Penelitian tentang klasifikasi aksara Jawa ini hanya menggunakan IoC dengan ukuran 3x3 piksesl.

Metode IoC menghitung piksel yang berwarna hitam atau bernilai 0 pada setiap bagian citra. Bagian citra tersebut dibagi berdasarkan ukuran ioc yang dimasukan. Jika ukuran IoC yang dimasukan adalah 3, maka citra akan dibagi menjadi 9 bagian. Ekstraksi ciri IoC akan menghasilkan sebuah matriks dengan ukuran NxN. Agar bisa digunakan pada tahap selanjutnya yaitu tahap klasifikasi, matriks yang awalnya berukuran NxN harus diubah menjadi matriks dengan ukuran 1xN. Berikut representasi dari hasil IoC dari data citra aksara Jawa yang sudah berukuran 1x9 (karena menggunakan IoC berukuran 3x3).

Tabel 3. 2 Hasil Ekstraksi Ciri Ciri Kelas 1 2 3 4 5 6 7 8 9 41 40 28 23 20 37 42 40 21 1 42 37 18 20 23 35 37 41 37 1 36 40 18 23 20 14 48 40 30 1 29 32 20 19 46 27 26 32 30 2 29 33 21 19 44 27 26 32 30 2 9 34 12 29 41 21 8 34 6 2 22 22 30 23 23 47 25 40 22 3 19 24 27 23 24 44 23 40 20 3 9 32 22 41 17 37 14 40 30 3

Tabel diatas merupakan representasi dari hasil ekstraksi ciri IoC dari aksara Ha yang ditunjukan dengan kelas 1, aksara Na yang ditunjukan dengan kelas 2, dan aksara Ca yang ditunjukan dengan kelas 3. Hasil Ekstraksi Ciri yang berupa angka inilah yang akan digunakan untuk tahap klasifikasi.

Klasifikasi

Melakukan klasifikasi data dengan menggunakan metode klasifikasi Modified K – Nearest Neighbor. Disini ada dua data yang digunakan yaitu data uji dan data latih. Data uji merupakan data yang belum memiliki label aksara. Sehingga pada tahap ini, data uji tersebut diklasifikasi dengan data latih yang sudah memiliki label aksara. Kemudian didapatkan hasil klasifikasi yang berupa label aksara dari data uji. Pada gambar 3.4 sudah terlihat alur dari klasifikasi metode MKNN dari data berupa citra hingga akurasi. Namun secara lebih detail, alur dari metode MKNN dapat dilihat pada gambar 3.6

Gambar 3. 6 Alur MKNN

Dari Gambar 3.6 metode MKNN mendapat inputan data latih citra yang merupakan data hasil ekstraksi ciri. Data latih yang sudah berupa angka tersebut dihitung jaraknya antar data latih dengan metode jarak euclidean. Setiap data latih akan mendapatkan hasil jarak dengan data latih lainnya, dimana akan diambil sejumlah k tetangga terdekat. K merupakan variabel untuk menentukan berapa jumlah tetangga yang harus diambil. Setelah mendapatkan sejumlah k tetangga dilakukanlah perhitungan nilai validitas.

Nilai validitas yang dijelaskan pada bab 2.6.2 akan melihat kesamaan kelas data latih dengan kelas tetangga terdekatnya, jika kelas sama akan mendapat nilai 1 dan jika kelasnya berbeda akan mendapat nilai 0. Setelah berproses pada data latih, metode MKNN akan memulai menghitung jarak antar data latih dengan data uji. Hasil dari perhitungan jarak tersebut digunakan untuk mencari Weight Voting. Pada persamaan 2.4 terlihat bahwa weight voting didapatkan dari perhitungan hasil jarak euclidean data latih dan data uji serta nilai validitas data latih.

Setelah mendapatkan nilai weight voting akan dicari sejumlah k tetangga dengan nilai weight voting paling tinggi. Penentuan kelas data uji didapatkan dengan melihat kelas dominan yang ada pada sejumlah k data dengan nilai weight voting tertinggi. Berikut adalah contoh perhitungan manual metode Modified K-Nearest Neighbor dengan data dummy.

Tabel 3. 3 Tabel Data Latih Data Citra

Citra ^Ciri ^Kelas

1 2 3 4 5 6 7 8 9 41 40 28 23 20 37 42 40 21 1 42 37 18 20 23 35 37 41 37 1 29 32 20 19 46 27 26 32 30 2 29 33 21 19 44 27 26 32 30 2 22 22 30 23 23 47 25 40 22 3 19 24 27 23 24 44 23 40 20 3

Tabel 3. 4 Tabel Data Uji Data Citra

Citra ^Ciri Kelas

1 2 3 4 5 6 7 8 9 36 40 18 23 20 14 48 40 30 1

Pada tabel diatas terdapat 9 ciri dari setiap data yang akan digunakan sebagai data dummy untuk perhitungan manual MKNN. Terdapat 3 kelas yang digunakan yaitu kelas 1 untuk aksara Ha, kelas 2 untuk aksara Na, dan kelas 3 untuk aksara Ca.

1. Menghitung Jarak Euclidean data latih

Perhitungan Jarak Euclidean antar data latih menggunakan rumus seperti persamaan (2.1). Proses perhitungan jarak Euclidean dimulai dengan :

• Menghitung jarak Data latih 1 dengan 6 data latih lainya : D(1,1) =√ (41 − 41)2+ (40 − 40)2+ (28 − 28)2 +(23 − 23)2+ (20 − 20)2 +(37 − 37)2+ (42 − 42)2+ (40 − 40)2+ (21 − 21)2 = 0 D (1,2) =√ (41 − 42)2+ (40 − 37)2+ (28 − 18)2 +(23 − 20)2+ (20 − 23)2 +(37 − 35)2+ (42 − 37)2+ (40 − 41)2+ (21 − 37)2 = 20,3470 D (1,3) =√ (41 − 29)2+ (40 − 32)2+ (28 − 20)2 +(23 − 19)2+ (20 − 46)2 +(37 − 27)2+ (42 − 26)2+ (40 − 32)2+ (21 − 30)2 = 38,2753 D (1,4) =√ (41 − 29)2+ (40 − 33)2+ (28 − 21)2 +(23 − 19)2+ (20 − 44)2 +(37 − 27)2+ (42 − 26)2+ (40 − 32)2+ (21 − 30)2 = 36,5377

41 D (1,5) =√ (41 − 22)2+ (40 − 22)2+ (28 − 30)2 +(23 − 23)2+ (20 − 23)2 +(37 − 47)2+ (42 − 25)2+ (40 − 40)2+ (21 − 22)2 = 32,9848 D (1,6) =√ (41 − 19)2+ (40 − 24)2+ (28 − 27)2 +(23 − 23)2+ (20 − 24)2 +(37 − 44)2+ (42 − 23)2+ (40 − 40)2+ (21 − 20)2 = 34,1760

Untuk data latih ke 2 hingga data latih ke 6 diperlakukan cara yang sama seperti data latih 1, sehingga didapatkan hasil jarak Euclidean untuk data latih seperti tabel 3.5.

Tabel 3. 5 Hasil Perthitungan Jarak Euclidean data Citra

Pada tabel 3.5 terlihat bahwa terdapat hasil yang bernilai 0. Hasil 0 tersebut menunjukan perhitungan jarak data latih terhadap dirinya sendiri, sehingga bernilai 0.

Data ke 1 2 3 4 5 6 Kelas 1 0,0000 20,3470 38,2753 36,5377 32,9848 34,1760 1 2 20,3470 0,0000 32,2955 30,8383 35,9444 36,8239 1 3 38,2753 32,2955 0,0000 2,4495 36,3731 34,2783 2 4 36,5377 30,8383 2,4495 0,0000 35,1710 33,0908 2 5 32,9848 35,9444 36,3731 35,1710 0,0000 6,3246 3 6 34,1760 36,8239 34,2783 33,0908 6,3246 0,0000 3

Selain itu hasil untuk jarak Euclidean data latih ke 1 dengan 2 akan sama hasilnya dengan jarak Euclidean data latih ke 2 dengan 1. Hal ini berlaku ke semua data latih. 2. Mencari nilai validitas data latih

Nilai validitas didapatkan dengan persamaan (2.2). Sebelum menghitung nilai validitas, langkah sebelumnya adalah mencari tetangga terdekat dari setiap data latih. Tetangga terdekat merupakan data dengan jarak Euclidean yang nilainya mendekati 0. Jumlah tetannga yang dipilih tergantung dengan nilai K. Pada contoh ini , nilai K yang digunakan adalah 3. Jadi, akan diambil 3 data yang memiliki nilai Euclidean mendekati 0 untuk setiap data latih.

• 3 tetangga terdekat data pertama adalah 2, 5, 6 • 3 tetangga terdekat data kedua adalah 1, 4, 3 • 3 tetangga terdekat data ketiga adalah 4, 2, 6 • 3 tetangga terdekat data keempat adalah 3, 2, 6 • 3 tetangga terdekat data kelima adalah 6, 1, 4 • 3 tetangga terdekat data keenam adalah 5, 4, 1

Setelah mendapatkan 3 tetangga untuk setiap data latih, selanjutnya masuk ketahap mencari nilai validitas dengan melihat kelas dari setiap data tetangga yang ada. Jika kelas data latih sama dengan kelas tetangganya akan mendapatkan nilai 1, jika berbeda akan mendapatkan nilai 0, sehingga hasil dari perhitungan nilai validitas seperti tabel 3.6.

Tabel 3. 6 Hasil Nilai Validitas data latihD

Data K = 1 K = 2 K = 3 Nilai Validitas

1 1 0 0 0.333 2 1 0 0 0.333 3 1 0 0 0.333 4 1 0 0 0.333 5 1 0 0 0.333 6 1 0 0 0.333

Pada tabel 3.6 nilai validitas untuk semua datalatih adalah 0.333. Hal ini menunjukan bahwa hanya ada 1/3 dari tetangga untuk setiap data latih yang kelas tetangga terdekatnya sama dengan data latih itu sendiri.

3. Menghitung Jarak Euclidean data uji dengan data latih

Perhitungan jarak Euclidean data uji dengan data latih sama dengan perhitungan jarak Euclidean data latih. Perbedaanya terletak pada data yang digunakan yaitu data uji dengan data latih. Hasil yang didapat dari perhitungan tahap ini terlihat pada tabel 3.7.

Tabel 3. 7 Hasil Eucliean data uji citra Data Uji Latih 1 _27,7669 Latih 2 _25,9808 Latih 3 _39,0640 Latih 4 _37,6298 Latih 5 _48,5283 Latih 6 _47,6130

Hasil pada tabel 3.6 dan 3.7 diatas akan digunakan untuk menghitung weight voting pada tahap berikutnya.

4. Menghitung Weight Voting

Perhitungan Weight Voting menggunakan persamaan 2.4, sehingga diperoleh hasil seperti tabel 3.8.

Tabel 3. 8 Hasil Weight Voting

Data Weight Voting

1 0,01167 2 0,01246 3 0,00834 4 0,00865 5 0,00673 6 0,00686

5. Menentukan label dari data uji

Penentuan label dilakukan dengan mencari nilai terbesar dari hasil Weight Voting. Banyaknya nilai terbesar bergantung pada nilai k, misal nilai k = 3 jumlah data terbesar yang diambil adalah tiga nilai Weight Voting terbesar.

Tabel 3. 9 Hasil Penentuan Tetangga

Data Tetangga Weight Voting Kelas

1 ^0,01246 1

2 ^0,01167 1

3 ^0,00865 2

Dari hasil tetangga terdekat tersebut, terlihat dari 3 tetangga yang mendominasi adalah kelas 1, sehingga klasifikasi aksara untuk data uji tersebut adalah kelas 1. Dimana kelas 1 merupakan kelas untuk aksara Jawa Ha. Jadi, aksara prediksi dari hasil klasifikasi adalah Ha. Hasil prediksi aksara uji ini sesuai dengan kelas aksara asalnya yaitu Ha (Tabel 3.4).

Cara Analisis Data

Analisis data yang dilakukan yaitu dengan melihat hasil akurasi terbaik. Hasil akurasi didapatkan dengan metode Cross fold Validation. Metode ini akan membagi data menjadi dua data yaitu data latih dan data uji seperti pada penjelasan bab 2.7.1. Pada pengujian ini akan menggunakan 3 nilai fold yaitu 3 fold, 5 fold, dan 7 fold. Sedangkan untuk nilai k pada metode Modified K-Nearest Neighbor yang dilakukan menggunakan 4 nilai k antara lain K=1, K=3, K=5, K=7, dan K=9.

Sesudah mendapatkan akurasi terbaik dari nilai K dan k-fold, hasil tersebut dibandingkan dengan akurasi dari hasil klasifikasi dengan menambahkan 2 ciri yaitu ukuran citra pada proses ekstraksi ciri, hasil klasifikasi tanpa adanya proses thinning dan hasil klasifikasi dengan mengubah nilai 𝑎 dengan nilai 0,25 dan 0,75. Hasil klasifikasi terbaik dari skenario tersebut akan digunaakn untuk pegujian data tunggal dan hasil klasifikasi dari skenario terbaik akan dibandingkan dengan hasil klasifikasi

Dalam dokumen KLASIFIKASI CITRA AKSARA JAWA MENGGUNAKAN METODE MODIFIED K-NEAREST NEIGHBOR TUGAS AKHIR. Diajukan Untuk Memenuhi Salah Satu Syarat (Halaman 20-77)