IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOR UNTUK MENGKLASIFIKASIKAN MOTIF
BATIK BESUREK BENGKULU
SKRIPSI
WESTHYMA SIBARANI 101401071
PROGRAM STUDI S1 ILMU KOMPUTER
FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA
MEDAN 2015
IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOR UNTUK MENGKLASIFIKASIKAN MOTIF
BATIK BESUREK BENGKULU
SKRIPSI
Diajukan untuk melengkapi tugas dan memenuhi syarat memperoleh Sarjana Ilmu Komputer
WESTHYMA SIBARANI 101401071
PROGRAM STUDI S1 ILMU KOMPUTER
FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA
MEDAN 2015
PERSETUJUAN
Judul : IMPLEMENTASI ALGORITMA K-NEAREST
NEIGHBOR UNTUK MENGKLASIFIKASIKAN MOTIF BATIK BESUREK BENGKULU
Kategori : SKRIPSI
Nama : WESTHYMA SIBARANI
Nomor Induk Mahasiswa : 101401071
Program Studi : S1 ILMU KOMPUTER
Fakultas : ILMU KOMPUTER DAN TEKNOLOGI
INFORMASI (Fasilkom-TI)
Diluluskan di Medan, September 2015 Komisi Pembimbing
Pembimbing 2 Pembimbing 1
Drs.Marihat Situmorang,M.Kom Drs.Partano Siagian,M.Sc
NIP. 196312141989031001 NIP. 195112271980031001
Diketahui/Disetujui oleh
Program Studi S1 Ilmu Komputer Ketua,
Dr.Poltak Sihombing, M.Kom NIP.196203171991031001
PERNYATAAN
IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOR UNTUK MENGKLASIFIKASIKAN MOTIF
BATIK BESUREK BENGKULU
SKRIPSI
Saya mengakui bahwa skripsi ini adalah hasil karya saya sendiri, kecuali beberapa kutipan dan ringkasan yang masing-masing telah disebutkan sumbernya.
Medan, 2015
Westhyma Sibarani NIM. 101401071
PENGHARGAAN
Pujian, hormat dan syukur buat kasih Allah Bapa, Tuhan Yesus Kristus dan Roh Kudus atas berkatNya yang begitu besar sehingga penulis dapat menyelesaikan penyusunan skripsi ini sebagai syarat untuk memperoleh gelar Sarjana Komputer pada Program Studi S1 Ilmu Komputer, Fakultas Ilmu Komputer dan Teknologi Informasi Universitas Sumatera Utara.
Dalam kesempatan ini penulis ingin mengucapkan terima kasih kepada :
1. Bapak Prof. Subhillar, Ph.D selaku pejabat Rektor Universitas Sumatera Utara. 2. Bapak Prof.Dr. Muhammad Zarlis selaku Dekan Fakultas Ilmu Komputer dan
Teknologi Informasi Universitas Sumatera Utara.
3. Bapak Dr.Poltak Sihombing,M.Kom selaku Ketua Program Studi S1 Ilmu Komputer Universitas Sumatera Utara.
4. Ibu Maya Silvi Lydia, B.Sc,M.Sc selaku Sekretaris Program Studi S1 Ilmu Komputer Universitas Sumatera Utara.
5. Bapak Drs.Partano Siagian,M.Sc selaku Dosen Pembimbing I yang telah memberikan bimbingan kepada penulis dalam pengerjaan skripsi.
6. Bapak Drs.Marihat Situmorang,M.Kom selaku Dosen Pembimbing II yang telah meluangkan waktu dan memberi masukan yang bermanfaat bagi penulis.
7. Ibu Dr.Elviawaty Muisa Zamzami,ST,MT,MM selaku Dosen Penguji I yang telah memberikan kritik dan saran dalam penyempurnaan skripsi ini.
8. Bapak Jos Timanta Tarigan,S.Kom, M.Sc selaku Dosen Penguji II yang telah memberikan kritik dan saran dalam penyempurnaan skripsi ini.
9. Seluruh bapak/ibu dosen dan pegawai di Program Studi S1 Ilmu Komputer, Fakultas Ilmu Komputer dan Teknologi Informasi Universitas Sumatera Utara. 10. Ayahanda M.Sibarani, ibunda M.Sihombing (Alm) dan E.Sihombing tercinta,
saudaraku bang Parulian Sibarani,ST, bang Faber Zufrianton Sibarani,dan Lionel Teguh Sibarani yang selalu memberikan cinta dan kasih sayang,semangat,dana, dan doa tanpa henti kepada penulis.
11. Sahabat terkasih AGATHA (bang Boris Sirait, kak Desi Mariza Sinaga, Lennora Marbun,Sunfirst Lady Jeanfera Nababan,Tetti Sinaga,Noviyanti Sagala, dan Helen Sri Maharani) serta sahabat terkasih Dian Rahayu Purba, Amalia Dwi Putri,
Bernadet Elvina, Yuliza Andriany, bang Markus, dan adik Ls.Hari Simanjuntak yang terus memberikan dukungan dan doa bagi penulis
12. Adik kelompok terkasih AOPHIA (Janferson Panggabean, Tuti Simanjuntak, Anggi Fitriani Lumbanbatu, Astria Martina Silaban, dan Yonathan Hutapea) 13. Sanak keluarga besar baik opung,tulang dan nantulang no.1,3,dan4,kak Lawrellya,
kak Ria,bang Boby,bang Gilbert,tulang Maringan Simanjuntak,Amd, tante Ruceh, tulang dan nantulang Pendeta, dan semua keluarga yang tetap mendukung penulis. 14. Teman-teman kampus LOGIC (bang Johanes G.Hutabarat, bang Yudhi Pangaribuan, bang Samuel Tarigan,bang Jonhri Sibarani, Johanes P.Saragih, Rivai H.Purba, Yansen Simatupang,Lorent Oliver Barus, Kurniawan Hutagaol, dan Hengky Gulo) , teman KOMDIS,Arifin, para Hadeuh serta semua teman-teman Kom-A 2010 yang selalu mengingatkan, mendorong, memberikan semangat dan membantu dalam pengerjaan skripsi ini.
15. Adik junior di kampus Winda Sari Elisabeth,Baringin Sihite,Maya Hartina Hutagalung,Ardi,Toni A.Sianturi,Mangasa Manullang,Endang, Rosalia,Evelin, Maya K.Nasution dan semua adik-adik terkasih yang selama ini juga membantu dalam memberi semangat dan doa.
16. Abang/kakak/teman/adik semasa pelayanan di UKM KMK USU, UP FMIPA, dan Tim Kerja UKM KMK USU 2014 baik Tiara Tobing,Wahyu Rahyuni Butar-butar, Mardi Sirait,Octa Manurung, Harif Nepen Marbun, Gery L.Purba, kak Destriani, bang Jakup, Julfi, Fahmy, Marlina, Suryati
17. Semua pihak yang tidak dapat disebutkan penulis satu per satu yang telah membantu penyelesaian skripsi ini.
Penulis menyadari bahwa skripsi ini masih terdapat kekurangan, oleh karena itu penulis mengharapkan kritik dan saran yang membangun demi kesempurnaan skripsi ini.
Medan, 2015 Penulis
ABSTRAK
Indonesia merupakan negara yang terkenal dengan salah satu kebudayaannya yaitu batik. Batik di Indonesia memiliki beragam corak dan motif yang pada umumnya beberapa daerah memiliki perbedaan. Dari perbedaan itu pula yang menjadi latar belakang untuk membahas mengenai batik dari daerah Bengkulu yaitu batik Besurek. Perkembangan teknologi di bidang pengenalan pola menjadi dasar dalam klasifikasi motif batik Besurek Bengkulu. K-NN
(K-Nearest Neighbor) merupakan salah satu metode klasifikasi dalam data mining dimana
pengklasifikasiannya berdasarkan kedekatan lokasi (jarak) suatu data dengan data yang lain dan jumlah anggota kelas terbanyak. Metode ekstraksi ciri dalam penelitian ini menggunakan
threshold dan deteksi tepi Robert. Citra yang dilatih dan diuji adalah citra batik Besurek
Bengkulu yang terdiri dari 4 kelas motif yaitu Relung Paku, Bunga Rafflesia, Burung Kuau, dan Rembulan dengan ukuran citra sebesar 100x100 piksel. Dari hasil pengujian didapati bahwa tingkat pengenalan untuk citra latih diperoleh nilai sebesar 100% pada k = 1 dan tingkat pengenalan untuk citra diluar citra latih diperoleh nilai sebesar 50% pada k= 3. Rata-rata waktu pengujian tercepat untuk citra latih diperoleh pada saat k = 5 sebesar 27,06 detik dan rata-rata waktu pengujian tercepat untuk citra diluar citra latih tercepat diperoleh pada saat k = 1 sebesar 31,94 detik.
Kata kunci : Data Mining, Ekstraksi Ciri, K-Nearest Neighbor, Motif Batik Besurek
ABSTRACT
Indonesia is a country which is well-known with its culture called Batik. Batik has various of pattern and motif which is generally different each area in Indonesia. The difference is the reason for researching about Bengkulu Batik called Besurek. The development of technology in feature identification sector is a basic in classifying Bengkulu Besurek Batik motif. K-NN (K-Nearest Neighbor) is one of classification methods of data mining which is based on nearness location(distance) of each data and the most amount of class member. Feature extraction method used in this research is threshold and Robert edge detection. Image training and testing are Bengkulu Besurek batik image which are contain of 4 motif classes that are Relung Paku, Bunga Rafflesia, Burung Kuau, and Rembulan which have a measurement of 100 x 100 pixels. According to the result of the testing, the degree of identification of image training is 100% on K = 1 and outside image training as big as 50 % on K = 3. The average of the fastest time testing of image training for K = 5 is 27.06 seconds and the fastest time testing of outside image training for K = 1 is 31.94 seconds.
Keywords : Bengkulu Besurek Batik Pattern, Data Mining, Feature Extraction,
DAFTAR ISI Hal Persetujuan ii Pernyataan iii Penghargaan iv Abstrak vi Abstract vii
Daftar Isi viii
Daftar Gambar x
Daftar Tabel xii
Daftar Simbol xiii
Daftar Lampiran xvi
Bab I Pendahuluan 1.1 Latar Belakang 1 1.2 Rumusan Masalah 2 1.3 Batasan Masalah 2 1.4 Tujuan Penelitian 3 1.5 Manfaat Penelitian 3 1.6 Metodologi Penelitian 3 1.7 Sistematika Penulisan 4
Bab II Tinjauan Pustaka
2.1 Batik Besurek 6
2.1.1 Sejarah Batik Besurek Bengkulu 6
2.1.2 Jenis-jenis Motif Dasar Batik Besurek 7
2.2 Data Mining 9
2.3 K-Nearest Neighbor (K-NN) 10
2.3.1 Algoritma K-NN 11
2.4 Ekstraksi Ciri
2.4.1 Thresholding 13
2.4.2 Deteksi Tepi (Edge Detection) 14
2.4.2.1 Deteksi Tepi Robert 14
2.5 Pengenalan Pola (Pattern Recognition) 16
2.6 Format File Citra 18
2.6.1 JPEG (Joint Photographic Expert Group) 18 Bab III Analisis dan Perancangan Sistem
3.1 Analisis Sistem 19
3.1.1 Analisis Permasalahan 19
3.1.2 Analisis Kebutuhan 20
3.1.2.2 Analisis Kebutuhan Non-Fungsional Sistem 20
3.1.3 Analisis Proses 21
3.1.3.1 Use Case Diagram 21
3.1.3.1.1 Use Case Pelatihan Sistem 22 3.1.3.1.2 Use Case Pengujian Sistem 23
3.1.3.2 Activity Diagram 25
3.1.3.2.1 Activity Diagram Pelatihan 25 3.1.3.2.2 Activity Diagram Pengujian 26
3.1.3.3 Sequence Diagram 27
3.1.3.3.1 Sequence Diagram Pelatihan 27 3.1.3.3.2 Sequence Diagram Pengujian 28
3.2 Perancangan Sistem 28
3.2.1 Flowchart Sistem 28
3.2.1.1 Flowchart Proses Pelatihan 28 3.2.1.2 Flowchart Subproses Ekstraksi Ciri 29 3.2.1.3 Flowchart Proses Pengujian 30
3.2.2 Perancangan Antarmuka 31
3.2.2.1 Perancangan Antarmuka Beranda 31 3.2.2.2 Perancangan Antarmuka Bantuan 32 3.2.2.3 Perancangan Antarmuka Pelatihan 33 3.2.2.4 Perancangan Antarmuka Pengujian 35 3.2.2.5 Perancangan Antarmuka Keluar 37 Bab IV Implementasi dan Pengujian
4.1 Implementasi Sistem 39
4.1.1 Tampilan Antarmuka Sistem 39
4.1.1.1 Tampilan Antarmuka Beranda 39 4.1.1.2 Tampilan Antarmuka Bantuan 40 4.1.1.3 Tampilan Antarmuka Pelatihan 40 4.1.1.4 Tampilan Antarmuka Pengujian 44 4.1.1.5 Tampilan Antarmuka Keluar 48
4.2 Pengujian Sistem 49
4.2.1 Pengujian K-NN terhadap Citra Latih 54 4.2.2 Pengujian K-NN terhadap Citra diluar Citra Latih 56 Bab V Kesimpulan dan Saran
5.1 Kesimpulan 58
5.2 Saran 59
Daftar Pustaka 60
DAFTAR GAMBAR
Hal
Gambar 2.1 Motif Relung Paku 7
Gambar 2.2 Motif Bunga Rafflesia 7
Gambar 2.3 Motif Burung Kuau 8
Gambar 2.4 Motif Rembulan 8
Gambar 2.5 Operator Robert 14
Gambar 2.6 Pengenalan Pola 16
Gambar 3.1 Diagram Ishikawa Analisis Permasalahan 19
Gambar 3.2 Use case Diagram 22
Gambar 3.3 Activity Diagram Pelatihan 25
Gambar 3.4 Activity Diagram Pengujian 26
Gambar 3.5 Sequence Diagram Pelatihan 27
Gambar 3.6 Sequence Diagram Pengujian 28
Gambar 3.7 Flowchart Proses Pelatihan 29
Gambar 3.8 Flowchart Subproses Ekstraksi Ciri 29
Gambar 3.9 Flowchart Proses Pengujian 30
Gambar 3.10 Tampilan Rancangan Antarmuka Beranda 31 Gambar 3.11 Tampilan Rancangan Antarmuka Bantuan 32 Gambar 3.12 Tampilan Rancangan Antarmuka Pelatihan 33 Gambar 3.13 Tampilan Rancangan Antarmuka Pengujian 35 Gambar 3.14 Tampilan Rancangan Antarmuka Keluar 37
Gambar 4.1 Tampilan Antarmuka Beranda 39
Gambar 4.2 Tampilan Antarmuka Bantuan 40
Gambar 4.3 Tampilan Antarmuka Pelatihan 41
Gambar 4.4 Tampilan Antarmuka Pelatihan setelah button Load diklik 41 Gambar 4.5 Tampilan Antarmuka Pelatihan setelah slider Threshold diklik 42 Gambar 4.6 Tampilan Antarmuka Pelatihan saat deteksi tepi Robert 42
Gambar 4.7 Tampilan Penyimpanan Matriks Vektor 43
Gambar 4.8 Tampilan Antarmuka Pelatihan setelah button Reset diklik 43
Gambar 4.10 Tampilan Buka File Motif Batik 44 Gambar 4.11 Tampilan Antarmuka Pengujian setelah dimasukkan citra 45 Gambar 4.12 Tampilan Antarmuka Pengujian setelah threshold 45
dan deteksi tepi Robert
Gambar 4.13 Tampilan Antarmuka Pengujian untuk memilih nilai K 46 Gambar 4.14 Tampilan Antarmuka Pengujian dengan nilai K=1 46 Gambar 4.15 Tampilan Antarmuka Pengujian dengan nilai K=3 47 Gambar 4.16 Tampilan Antarmuka Pengujian dengan nilai K=5 47 Gambar 4.17 Tampilan Antarmuka Pengujian dengan nilai K=7 48
Gambar 4.18 Tampilan Antarmuka Keluar 48
Gambar 4.19 Tampilan Matriks Vektor Ekstraksi Ciri Data latih dan Data Uji 52 Gambar 4.20 Tampilan Hasil Ascending Euclidean Distance 53
DAFTAR TABEL
Hal
Tabel 2.1 Klasifikasi Data Latih 11
Tabel 2.2 Perhitungan kuadrat jarak data latih dengan data uji 12 Tabel 2.3 Penentuan 3 tetangga tedekat dari data uji 12
Tabel 2.4 Klasifikasi kelas tetangga terdekat 12
Tabel 2.5 Perhitungan deteksi tepi Robert 15
Tabel 3.1 Spesifikasi Use Case Pelatihan 22
Tabel 3.2 Spesifikasi Use Case Pengujian 24
Tabel 4.1 Data Citra Latih 49
Tabel 4.2 Data Citra diluar Citra Latih 51
Tabel 4.3 Hasil Pengujian K-NN terhadap Citra Latih 54 Tabel 4.4 Tingkat Akurasi Pengenalan terhadap Citra Latih 55 Tabel 4.5 Rata-rata Waktu Pengujian terhadap Citra Latih 56 Tabel 4.6 Hasil Pengujian K-NN terhadap Citra diluar Citra Latih 56 Tabel 4.7 Tingkat Akurasi Pengenalan terhadap Citra diluar Citra Latih 57 Tabel 4.8 Rata-rata Waktu Pengujian terhadap Citra diluar Citra Latih 57
DAFTAR SIMBOL
Flowchart
No Simbol Nama Fungsi
1 Terminator Permulaan/akhir program
2 Input/Output
Data
Proses input/output data, parameter, informasi
3 Process Proses perhitungan/proses
pengolahan data
4 Decision
Perbandingan pernyataan, penyeleksian data yang memberikan pilihan untuk langkah
selanjutnya
5 Subprocess Permulaan sub program/ proses
menjalankan sub program
6 Magnetic Disk
(Database)
Lokasi penyimpanan data yang digambarkan dalam bentuk
database
7 Flow Line Arah aliran program
Use Case Diagram
No Simbol Nama Fungsi
1
Actor1
Actor
Segala sesuatu yang perlu berinteraksi dengan sistem untuk pertukaran informasi
2 UseCase1 Use Case Mengidentifikasi dan menggambarkan
fungsi-fungsi sistem
3 Association Hubungan antara aktor dengan use
Activity Diagram
No Simbol Nama Fungsi
1 Initial State Awal sebuah proses
2 State1 State Menggambarkan sebuah
kegiatan/tugas yang perlu dilakukan 3 Control Flow Sasaran yang mengawali kegiatan
4 Transition
Fork/Join
Menunjukkan kegiatan yang dilakukan secara paralel atau untuk
menggabungkan dua/lebih kegiatan paralel menjadi satu
5 Decision Sebuah kegiatan keputusan
6 Final State Akhir dari sebuah proses
Sequence Diagram
No Simbol Nama Fungsi
1
Object
Object
Contoh dari sebuah class dengan nama objek di dalamnya dan dituliskan
secara horizontal
2
User
Actor
Dapat berkomunikasi dengan objek maka actor juga dapat diurutkan
sebagai kolom
3 Lifeline Keberadaan sebuah objek dalam basis
waktu
4 Activition
Mengindikasikan sebuah objek yang akan melakukan aksi
5 Message1 Message Mengindikasikan komunikasi antara
objek-objek
6 Message Self Message Mengindikasikan komunikasi kembali
ke dalam sebuah objek itu sendiri
7 Message2 Message
(return)
Menampilkan hasil dari pengiriman
DAFTAR LAMPIRAN
Halaman
A. Listing Program A-1