1 PERBANDINGAN ALGORITMA PERHITUNGAN JARAK MENGGUNAKAN ECUILDEAN DAN MANHATTAN DISTANCE PADA K-NEAREST NEIGHBOR
GUNA KLASIFIKASI CITRA JENIS MOBIL RODA EMPAT
Erlangga Fery Anggriwan1 ,DR. Pulung Nurtantio Andono,S.T,M.Kom2
1
Fakultas Ilmu Komputer,2Universitas Dian Nuswantoro Jl. Nakula 1 No. 5-11, Jawa Tengah 50131 Telp : (024) 3517261 E-mail : [email protected], [email protected]
Abstrak
Perhitungan nilai kesamaan suatu citra merupakan salah satu komponen esensial dari hasil proses suatu algoritma ataupun metode untuk mencocokkan antara citra hasil training dengan citra baru sebagai pembanding. Salah satu tahap pencocokan kesamaan ataupun kemiripan ciri-ciri suatu citra adalah dengan menggunakan metode pengukuran jarak. Beberapa metode pengukuran jarak dalam mengukur tingkat kesamaan (similarity) atau kemiripan suatu citra diantaranya menggunakan jarak Euclidean dan Manhattan/City Block Distance. Penggunaan metode pengukuran jarak banyak digunakan dalam algoritma pengklasifikasian atau pendeteksian, Ada beberapa metode yang sering digunakan salah satunya adalah dengan algoritma K-Nearest Neighbour (KNN). Dengan membandingkan 2 metode pengukuran jarak menggunakan algoritma K-NN, akan diketahui metode pengukuran jarak mana yang memiliki tingkat akurasi paling tinggi dengan melakukan pengujian terhadap citra jenis mobil.
Kata Kunci: K-Nearest Neighbor,Ecuildean Distance,Manhattan Distance, Klasifikasi Abstract
The calculation of the value of the similarity of an image is one of the essential components of processing an algorithm method for matching between the image of the training results with a new image as a comparison. One commonality or similarity matching phase characteristics of an image is to use methods of distance measurement. Some distance measurement method in measuring the degree of similarity (similarity) or resemblance of an image of them using the Euclidean distance and Manhattan / City Block Distance. The use of distance measurement method widely used in the classification or detection algorithms, There are several methods commonly used one is the algorithm K-Nearest Neighbor (KNN). By comparing the two methods of measuring distances using K-NN algorithm, will be known distance measurement method which has the highest level of accuracy by testing the image type of car.
Keywords: K-Nearest Neighbor,Ecuildean Distance,Manhattan Distance, Clasification
1. PENDAHULUAN
Perhitungan nilai kesamaan suatu citra merupakan salah satu komponen
esensial dari hasil proses suatu
algoritma ataupun metode untuk
mencocokkan antara citra hasil training dengan citra baru sebagai pembanding. Salah satu tahap pencocokan kesamaan ataupun kemiripan ciri-ciri suatu citra adalah dengan menggunakan metode pengukuran jarak. Jarak merupakan aspek penting dalam pengembangan
metode pengelompokan maupun
regresi. Sebelum dilakukan
pengelompokkan data atau objek untuk
proses deteksi, terlebih dahulu
ditentukan ukuran jarak kedekatan antar elemen data. Keakuratan penghitungan nilai kemiripan sangat menentukan dalam pembandingan citra hasil proses training dari suatu algortima memiliki ciri – ciri karakteristik dengan citra pembanding [1].
Beberapa metode pengukuran jarak dalam mengukur tingkat kesamaan (similarity) atau kemiripan suatu citra
2
diantaranya menggunakan jarak
Euclidean dan Manhattan/City Block
Distance[2]. Euclidean Distance
merupakan metode perbandingan jarak dengan membandingkan jarak minimum
image testing dengan database
pelatihan, sedangkan Manhattan
Distance merupakan metode
pengukuran jarak yang sering
digunakan dengan mengganti perbedaan kuadrat jarak absolut variabel, Kedua metode tersebut merupakan metode yang paling sering digunakan dalam
pengukuran jarak. Sehingga pada
akhirnya akan dibandingkan jarak
manakah yang memiliki tingkat
kesamaan ataupun kemiripan paling tinggi untuk suatu citra .
Penggunaan metode pengukuran jarak banyak digunakan dalam algoritma pengklasifikasian atau pendeteksian, Ada beberapa metode yang sering digunakan salah satunya adalah dengan algoritma K-Nearest Neighbour (KNN). Algoritma K-Nearest Neighbor (KNN)
merupakan sebuah metode untuk
melakukan klasifikasi terhadap objek berdasarkan data pembelajaran yang jaraknya paling dekat dengan objek tersebut. Dekat atau jauhnya tetangga biasanya dihitung berdasarkan metode perhitungan jarak. Data pembelajaran diproyeksikan ke ruang berdimensi
masing-masing dimensi
merepresentasikan ciri dari data citra tersebut. Ruang ini dibagi menjadi bagian-bagian berdasarkan klasifikasi data pembelajaran [1].
Peneliti menggunakan algoritma K-NN
dikarenakan dalam penggunaan
algoritma K-NN, proses pengaturan parameter ketetanggaan (k) dan jarak dihitung berulang hingga diperoleh hasil akurasi yang paling maksimum. Jarak terdekat dengan basis data suatu kelas yang diperoleh akan dapat dijadikan sebagai acuan penentu data uji tersebut akan termasuk kejenis kelas mana begitu juga hasil yang akan
dikeluarkan [3]. Dengan
membandingkan 2 metode pengukuran jarak menggunakan algoritma K-NN, akan diketahui metode pengukuran jarak mana yang memiliki tingkat akurasi paling tinggi dengan melakukan pengujian terhadap citra jenis mobil. Jenis mobil digunakan dikarenakan
bentuk untuk setiap jenis mobil
memiliki karakteristik yang berbeda, contohnya adalah bentuk mobil jenis SUV dengan jenis City Car. Dimana
penggunaan citra jenis mobil
merupakan salah satu tahap
pencocokan, kesamaan ataupun
kemiripan ciri-ciri suatu citra, dan tahap tersebut merupakan tahapan dalam
penggunaan algoritma K-NN.
Diharapkan karakteristik citra jenis mobil dapat di klasifikasikan sesuai dengan jenisnya.
Berdasarkan uraian di atas, pada
penelitian ini akan dilakukan
perbandingan metode jarak ecuidean
dan manhattan distance yang di
implementasikan menggunakan
Algoritma K-Nearest Neighbourhood guna penklasifikasian jenis mobil.
2. METODE PENELITIAN
Metode penelitian Klasifikasi mobil menggunakan K-NN sebagai berikut :
3
2.1 Objek Penelitian
Dalam tugas akhir ini pemilihan mobil
sebagai objek penelitian. Objek
penelitian adalah bagaimana melakukan klasifikasi jenis mobil yang memiliki
karakteristik berbeda untuk setiap
jenisnya. Penekanan pada metode
pengukuran jarak dengan
membandingkan 2 metode pengukuran pada K-NN, sehingga nantinya di dapatkan performa ke 2 metode
pengukuran jarak dalam
pengklasifikasian jenis mobil.
2.2 Instrumen Penelitian
Instrumen penelitian yang
dipergunakan berupa hardware dan software sebagai berikut :
2.2.1 Perangkat Lunak (Software)
Perangkat lunak yang digunakan dalam menyelesaikan penelitian adalah sebagai berikut :
a. Windows 7 ultimate 64 bit
Penulis menggunakan windows 7
ultimate 64 bit dalam pembuatan aplikasi dan laporan penelitian.
b. Matlab R2014
Digunakan dalam implementasi
Ekstraksi Citra, Impelentasi Metode
pengukuran jarak dan k-Nearest
Neighbors (KNN).
c. Microsoft Office Word 2010
Digunakan dalam penulisan
penelitian
d. Adobe Photoshop
Software photoshop digunakan dalam melakukan perbaikan citra seperti cropping citra.
2.2.2 Perangkat Keras ( Hardware) Perangkat lunak yang digunakan dalam
menyelesaikan penelitian adalah
sebagai berikut :
a. Laptop Asus A47 Core i5 b. VGA Nvidia 2Gb
c. Ram 4 Gb d. Harddisk 500 Gb
2.3 Teknik Analisis Data
Teknik analisis data adalah cara
mengolah data menjadi informasi
sehingga sifat atau karakteris datanya mudah dipahami. Data yang telah dikumpulkan akan dibagi menjadi dua jenis yaitu data training dan data testing. Data training berfungsi sebagai bahan pembelajaran pada mesin agar mesin dapat memiliki sebuah pengetahuan tentang jenis mobil yang berbeda. Data testing berfungsi sebagai data uji coba kemampuan mesin. Data-data tersebut
kemudian dipindahkan kedalam
database. Data training dan data testing menggunakan 30 citra mobil dari 3 jenis mobil yang berbeda . Dalam penelitian
ini ada beberapa tahapan yang
dilakukan terhadap data-data yang
diperoleh, tahapan tersebut antara
yaitu :
Gambar 3.2 Proses Pengolahan Data Data yang sudah dimasukkan ke dalam mesin aplikasi. Kemudian di uji menggunakan data citra testing jenis mobil secara acak. Sehingga didapatkan output klasifikasi citra jenis mobil. Proses Preprocessing yang dilakukan
pada tahapan pengolahan dataset
sebagai berikut :
1. Citra inputan berupa citra mobil RGB 2. Citra yang sudah diinputkan akan diekstraksi menggunakan ekstraksi fitur histogram.
3. Ekstraksi fitur histogram yang digunakan adalah Rata-rata intnsitas, deviasi, skewnessm energy dan entropi. 4. Dari hasil ekstraksi akan didapatkan nilai nilai ekstraksi seperti dibawah ini .
4
5. Nilai ektraksi tersebut akan menjadi nilai acuan yang nantinya dibandingkan dengan nilai ektraksi citra acuan.
6. Citra uji dan citra acuan yang sudah diekstraksi akan dihitung menggunakan metode perhitungan jarak Ecuildean dan Manhattan Distance untuk mendapatkan perbandingan nilai keduanya.
7. Nilai yang didapat dari perbandingan ke 2 metode pengukuran jarak sebagai berikut:
2.4 Objek Data
Objek data yang digunakan dalam penelitian ini adalah citra jenis mobil. Jenis mobil yang digunakan terdiri dari 3 jenis yaitu Hatchback, SUV dan Sedan. Citra yang digunakan
nantinya menggunakan background
putih agar mempermudah dalam
pembacaan dan ukuran citra yang digunakan adalah 512 x 512. Dan citra yang digunakan sebagai berikut :
Citra Jenis Jumlah
Citycar 30 Citra SUV 30 Citra Sedan 30 Citra 2.5 Eksperimen
Pada tahap ini akan dilakukan penelitian dengan melakukan pengujian terhadap aplikasi yang sudah di bangun. Pada tahap ekperimen ini penulis menerapkan metode yang digunakan
adalah K-Nearest Neighbourhood.
Tahap awal pada penelian, penulis melakukan pengumpulan data yang akan digunakan yaitu model – model dari jenis mobil. Selanjutnya citra dari mobil jenis mobil tersebut di proses menggunakan histrogram dan di bagi menjadi data training dan data testing. Dari data tersebut penulis sudah mendapatkan data training, selanjutnya adalah untuk citra data testing. Data testing dipilih secara acak dimana data yang nantinya diinputkan dipilih tidak sesuai dengan jenisnya. Dari data
testing tersebut akan didapatkan
klasifikasi jenis mobil menggunakan aplikasi yang sudah di bangun. Akurasi dan jarak tiap citra akan berbeda beda. Sehingga di tahapan akhir, penulis akan
membandngkan antara 2 metode
pengukuran jarak pada K-NN.
Diharapkan dapat diketahui metode pengukuran jarak mana yang memiliki tingkat akurasi tertinggi. Antara metode pengukuran jarak Ecuildean Distance atau Manhattan Distance.
5
3. HASIL DAN PEMBAHASAN
Dalam melakukan eksperimen ini, diperlukan citra gambar jenis mobil. Citra yang digunakan dalam penelitian ini adalah citra jenis mobil yaitu jenis City car, Sedan dan SUV. Citra yang digunakan berukuran 625 x 417 pixel .Citra yang digunakan dibagi menjadi 2 yaitu data citra training 60 dan juga 30 data testing yang nantinya seperti dengan metode yang diusulkan.
Gambar 2. Citra yang digunakan
Pada tahap pengujian, sample pada citra jenis mobil yang digunakan sebagai data citra uji. Citra tersebut kemudian diproses menggunakan fitur ekstraksi histogram, dari hasil pengolahan citra uji tersebut, selanjutnya dilakukan perhitungan jarak menggunakan 2
metode perhitungan jarak pada k-nn. Proses fitur ekstraksi tersebut yaitu : Memasukkan citra jenis mobil dan diuji dengan melakukan proses pengolahan
awal citra jenis mobil yang
menggunakan feature ekstraksi
histogram, pada feature ekstraksi ini
citra mobil yang diuji akan
menghasilkan angka-angka piksel
disetiap citra yang nantinya digunakan dalam pengujian perhitungan antar 2 metode pengukuran jarak.
Berikut adalah tampilan program untuk mengekstraksi citra jenis mobil.
Terdapat tiga kelas/label yaitu
“Citycar”, “Sedan” dan “SUV”. Citra mobil yang telah diinput lalu ditentukan apakah citra mobil tersebut termasuk dalam kelas jenis mobil Citycar, Sedan atau SUV.
Gambar diatas menunjukkan tampilan program saat dijalankan. Pada bagian atas ditampilkan citra mobil yang telah diinput, kemudian pada bagian kanan gambar muncul nilai fitur ekstraksi dari citra yang diinput. Nilai-nilai fitur ekstraksi tersebut meliputi intensitas, deviasi, skewness, energy,entropi, dan smoothness. Dan terakhir adalah output aplikasi dimana terdapat perhitungan jarak menggunakan cityblock dan
ecuildean distance sehingga akan
muncul jarak kedekatan menggunkan perhitungan jarak, dan akan terlihat
kedekatan jarak menggunakan 2
perbandingan metode yang memiliki jarak terkecil guna mendapatkan tingkat
6
akurasi diantara ke 2 nya
Ekstraksi fitur tekstur pada citra mobil di penelitian ini yang bertujuan untuk mendapatkan ciri tiap jenis mobil yaitu jenis city car, sedan dan SUV yang
sebelumnya melalui tahap-tahap
pengolahan awal citra yang sudah dijelaskan di sub bab sebelumnya.
Ekstraksi fitur tekstur tersebut
menggunakan metode histogram pada metode ini didalamnya terdapat 6 fitur yaitu : rerata intensitas, deviasi, skewness, energi, entropi dan kehalusan (smoothness). Pada table dibawah ini adalah 5 sample data citra berdasarkan jenis mobil yang di fitur ekstraksi histogram.
Tabel 3. Tabel luas marker
Dari data diatas adalah sample beberapa citra jenis mobil yang sudah difitur ekstraksi menggunakan fitur ekstraksi histogram dan menghasilkan
angka-angka piksel tersebut. Dan
langkah selanjutnya akan
diperhitungkan jaraknya menggunakan 2 metode perhitungan jarak guna
mendapatkan keakuratan dalam
perbandingan 2 metode pengukuran jarak.
4.1.1 Perhitungan Ekstraksi Fitur
1. Intensitas
Fitur pertama yang dihitung adalah intensitas. Dengan persamaan sebagai berikut : M = ∑ = 0× + 1× + 2× + 3× 5× 6× 7× + 8× + 9× + 10× = 0.005429368 + 0.000206039 + 0.000403837 + + + + 0.000717933 + + 0.001772855 + 0.003187659 + 0.003750833 = 7018.684 2. Deviasi σ = √∑ = √ + √ + √ + √ + √ +
7 √ + √ + √ + √ + √ + √ = + + + + + + + + = 99837.47559 3. Skewness skewnes s = ∑ = (0- ) × + ) × + ) × + ) × + ) × + ) × + ) × + ) × + ) × + ) × + ) × = 24379549.78) + 4747233.253) + (6643285.797) + (8853927.799) + ( -5689377.181)+( -11373888.66) + (8842574.484)+( 11679832.55) +( -13883588.72) + 18608665.06) + (-20177032.76) = -330603501002.68 4. Energy Energy = ∑ = [ ] + [ ] + [ ] +[ ] + [ ] +[ ] + [ ] +[ ] + [ ] +[ ] = 4.971839312 × 10ˉ9 + 1.886766479 × 10ˉ10 + 3.698062298 × 10ˉ10 + 6.574332974 × 10ˉ10 + 2.716943729 × 10ˉ10 + 1.086777492 × 10ˉ9 + 6.574332974 × 10ˉ10 + 1.147992582 × 10ˉ9 + 1.623457734 × 10ˉ9 + 2.919037383 × 10ˉ9 = 0.006427225 5. Entropi Entropi = ∑ = + + + + + + + + +
8 = (-9.724763994 × 10ˉ4) + (-2.218588951 × 10ˉ4) + (-3.01267527 × 10ˉ4) + (-3.0910482827 × 10ˉ4 ) + (-2.618950374 × 10ˉ4) + (-4.908237664 × 10ˉ4 )+ (-3.0910482827 × 10ˉ4) + ( -5.031184584 × 10ˉ4 ) + (-5.882308691 × 10ˉ4) + (-7.658988034 × 10ˉ4) = -7.528903833 6. Smoothness smoothness = = = 0.09106210957
7. Perhitungan Ecuildean Distance a. Ecuildean Distance : =√ √ √ √ √ √ = 18.3523 b. Manhattan Distance : = = 23.7483
Pada sub bab berikut akan
menjelaskan tentang perbandingan
antara metode perhitungan jarak
ecluidean dan cityblock, setelah
dilakukan perhitungan jarak untuk mendapatkan hasil label dengan cara melakukan beberapa proses untuk mendapatkan akurasi dari citra, proses yang dilakukan pertama kali mencari hasil dengan metode K-NN yang didapatkan dari perbandingan nilai antara distance ecuildean dan cityblock.
Kemudian dihitung menggunakan
perhitungan akurasi antara 2 metode perbandingan jarak.
1. Citra City car
Citra Ecluidean Manhattan Hasil 1 5.966319 9.519727 Correct 2 20.93597 23.99612 Correct 3 12.17201 18.92776 Correct 4 21.32968 28.07414 Correct 5 14.92454 18.52364 Correct 6 15.1552 22.77551 Correct 7 16.44944 23.83267 Correct 8 21.24344 31.21623 Correct 9 24.51905 34.78669 Correct 10 24.14606 34.83288 Correct Total 137.589 191.581 53.99223 2. Citra sedan
Citra Ecluidean Manhattan Hasil 1 18.3523 23.7483 Correct 2 18.3468 23.5926 Correct 3 26.4167 40.6249 Correct 4 5.54286 8.15497 Correct 5 16.5863 21.6913 Correct 6 5.52907 8.1326 Correct 7 30.7403 41.9054 Correct 8 5.50288 7.78665 Correct 9 5.04222 7.81153 Correct 10 5.52907 8.1326 Correct Total 194.7977 276.553 81.7553 7
9
3. Citra SUV
Citra Ecluidean Manhattan Hasil 1 11.7849 15.24419 Correct 2 5.636878 7.57331 Correct 3 32.66671 40.15874 Correct 4 9.966807 15.43397 False 5 45.31843 67.31526 Correct 6 10.26037 14.37839 Correct 7 20.50857 28.47747 Correct 8 25.5349 38.25847 Correct 9 7.339802 11.04766 False 10 25.78031 38.66559 Correct Total 176.8417 246.4854 69.64365
Dari tabel diatas dapat diketahui perhitungan jarak antara dua metode
yaitu ecluidean dan cityblock.
Dimana nilai perhitungan jarak
menggunakan metode Ecluidean
Distance memiliki nilai yang lebih kecil, artinya metode Ecluidean Distance lebih baik dibandingan dengan metode Cityblock dalam
perhitungan jarak menggunakan
metode K-NN
Nilai akurasi yang digunakan dari jumlah citra bernilai kebenaran dibagi dengan jumlah data uji keseluruhan dikali 100%
Akurasi =
x100%
= 93 %
Nilai perbandingan perhitungan jarak
menggunakan metode Ecuildean
Distance dan Manhattan Distance
sebagai berikut :
Jenis Ecuildean Manhattan Selisih City Car 137.589 191.581 53.99223 Sedan 194.7977 276.553 81.75537 SUV 176.8417 246.4854 69.64365
Dapat dilihat dari tabel diatas
bahwa perbandingan metode
pengukuran jarak ecuildean dan
manhattan distance, Metode Ecuildean Distance memiliki nilai yang lebih kecil
daripada perhitungan menggunakan
Manhattan Distance. Sehingga Metode
pengukuran jarak menggunakan
Ecuildean Distance memiliki
keakuratan lebih tinggi daripada
menggunakan Manhattan Distance hal ini ditunjukan dengan nilai pengukuran menggunakan Ecuildean Distance yang lebih kecil.
5. SARAN
Beberapa saran yang dihasil dalam penulisan penelitian ini, dan sebagai penelitian berikutnya sebagai berikut : 1. Menggunakan metode perbandingan jarak lebih dari 2, sehingga akan meningkatkan perbandingan tentang perhitungan jarak
2. Penggunaan data yang lebih banyak
sehingga akan diketahui ketika
menghitung perbandingan dengan
jumlah data yang banyak.
3. Menggunakan metode lain dalam perhitungan dan dikolaborasikan.
DAFTAR PUSTAKA
[1] Hermawati F.A, “Pengolahan citra Digital”. Yogyakarta: ANDI, 2013. [2] M. K. T. Sutoyo, S.Si., M.Kom., Edy
Mulyanto, S.Si., M.Kom.,
Dr.Vincent Suhartono, Oky Dwi Nurhayati, M.T., Wijanarto, “Teori Pengolahan Citra Digital,” 2009. [3] Andi, “Pengolahan Citra Digital,”
Yogyakarta: Darma Putra, 2010. [4] L A Dewi, H Bambang,W.A Tody,
“Klasifikasi Jenis mobil
menggunakan metode
Backpropagatioan dan Deteksi tepi Canny” Universitas Telkom.2011. [5] D Rosmawati, U Koredianto dan R
Achmad ,” Desain dan Simulasi Sistem Identifikasi Manusia Dengan
10
Analisis Ciri Fisis Citra Palmprint Berbasis Image Processing dan K-NN “ Universitas Telkom, Bandung, 2010.
[6] H.A Thariq, A.P Ricardus,
“Memodifikasi Algoritma K-Nearest Neighbour Menggunakan Chebyshev
Distance Berdasarkan GRAY
LEVEL CO-OCCURRENCE
MATRIX untuk Klasifikasi Kayu”
Universitas Dian Nuswantoro,
Semarang , 2015
[7] Y. Bertha, H Bambang, “Klasifikasi
Jenis Mobil Berdasarkan
Transformasi wavelet multi Scale dan Metode K-Nearest Neighbor” Universitas Telkom , 2011.
[8] Hermawati F.A, “Pengolahan citra Digital”. Yogyakarta: ANDI, 2013. [9] S. Kom. Prof achmad Benny mutiara
Ssi, “Pengantar Pengolahan Citra.”
[Online]. Available:
http://amutiara.staff.gunadarma.ac.id/Do
wnloads/files/39981/Bab-Pengantar+Pengolahan+Citra.pdf
[10] Raditya “Mengenal jenis jenis
mobil berdasarkan bentuknya “ http://www.ototaiment.com/2015/03/16/
533/mengenal-jenis-jenis-mobil-berdasarkan-bentuknya/ (diakses 10 September 2016)
[11] Teiseran T, Martin “ Kiat Merawat
Mobil “ Yogyakarta, Penerbit Kanisius (Anggota IKAPI), 2014
[12] Lafortune, Pierre “ How to
Calculate Euclidean and Manhattan Distance
“http://math.stackexchange.com/questio ns/139600/how-to-calculate-the-euclidean-and-manhattan-distance (diakses : 11 Januari 2017)