ORGANIZING MAP
(SOM)
I GUSTI RAI AGUNG SUGIARTHA
PROGRAM PASCASARJANA
UNIVERSITAS UDAYANA
i
TESIS
IMAGE RETRIEVAL
DENGAN TEKNIK
SELF
ORGANIZING MAP
(SOM)
I GUSTI RAI AGUNG SUGIARTHA
NIM 1291761017
PROGRAM MAGISTER
PROGRAM STUDI TEKNIK ELEKTRO
PROGRAM PASCASARJANA
UNIVERSITAS UDAYANA
DENPASAR
IMAGE RETRIEVAL
DENGAN TEKNIK
SELF
ORGANIZING MAP
(SOM)
Tesis untuk Memperoleh Gelar Magister pada Program Magister, Program Studi Teknik Elektro,
Program Pascasarjana Universitas Udayana
I GUSTI RAI AGUNG SUGIARTHA
NIM 1291761017
PROGRAM MAGISTER
PROGRAM STUDI TEKNIK ELEKTRO
PROGRAM PASCASARJANA
UNIVERSITAS UDAYANA
DENPASAR
UCAPAN TERIMAKASIH
Segenap puja dan puji syukur penulis panjatkan kehadapan Ida Sang Hyang Widhi Wasa sebagai sumber dari segala sumber pengetahuan, karena atas asung kertha wara nugrahaNya Tesis yang berjudul "Image Retrieval dengan Teknik Self Organizing Map (SOM)" ini dapat diselesaikan.
Pada kesempatan ini perkenankanlah penulis mengucapkan terima kasih yang sebesar-besarnya kepada Bapak Dr. Ir. Made Sudarma, M.A.Sc., selaku Dosen Pembimbing I yang telah banyak membantu dalam memberikan ide, saran, dan motivasi. Terima kasih yang sebesar-besarnya pula kepada penulis sampaikan kepada Bapak Dr. I Made Oka Widyantara, ST., MT., selaku Dosen Pembimbing II yang telah memberikan bimbingan dan arahan dalam penyelesaian Tesis ini.
Ucapan yang sama juga ditunjukkan kepada Rektor Universitas Udayana Prof. Dr. dr. Ketut Suastika, Sp.PD-KEMD atas kesempatan dan fasilitas yang diberikan kepada penulis untuk mengikuti dan menyelesaikan pendidikan Program Magister di Universitas Udayana. Ucapan terima kasih ini juga penulis sampaikan kepada Direktur Program Pascasarjana Universitas Udayana Prof. Dr. dr. A. A. Raka Sudewi, Sp.S (K) atas kesempatan yang diberikan kepada penulis untuk menjadi mahasiswa pada Program Pascasarjana Universitas Udayana, serta ucapan terima kasih kepada Prof. Ir. I.A Dwi Giriantari, MEngSc.,PhD sebagai Ketua Program Magister Program Studi Teknik Elektro Program Pascasarjana Universitas Udayana.
Penulis juga menyampaikan terima kasih yang sebesar-besarnya kepada Bapak, Ibu, Istri dan Anak-anak tercinta serta seluruh keluarga yang telah banyak memberikan bantuan, dorongan, dan semangat untuk menyelesaikan Tesis ini.
Penulis juga mengucapkan terima kasih kepada Bapak/Ibu Dosen di Program Magister Teknik Elektro Universitas Udayana dan Civitas Akademika STMIK STIKOM Bali serta berbagai pihak yang tidak mungkin disebutkan satu persatu, yang dengan semangat sudah memberikan dorongan untuk mengikuti dan menyelesaikan pendidikan program Magister ini.
Semoga Ida Sang Hyang Widhi Wasa/Tuhan Yang Maha Esa selalu melimpahkan rahmat-Nya kepada semua pihak yang sudah penulis sebutkan maupun yang belum penulis sebutkan sudah berpartisipasi dan menunjukkan dedikasi ketulusan yang sangat luar biasa dalam membantu penyelesaian Tesis ini
Denpasar, Agustus 2016
vii
Abstrak
Image retrieval merupakan teknologi yang membantu mengelola data digital dalam bentuk gambar. Pencarian dan penemuan gambar bertujuan untuk mempertegas apa yang sebenarnya dicari, dimana melakukan pencarian, dan dalam bentuk apa pengguna melakukan pencarian. Penelitian ini mempergunakan metode
clustering untuk mengelompokkan gambar berdasarkan fitur-fitur yang dimiliki oleh gambar itu sendiri. Proses ekstraksi fitur mempergunakan metode ekstraksi fitur warna, fitur tekstur, dan bentuk. Fitur warna menggunakan metode Color Histogram, ekstraksi tekstur mempergunakan Gray Level oCcurance Matrix, dan bentuk mempergunakan Edge Direction metode Canny Edge Detection. Proses perhitungan jarak antar fitur gambar mempergunakan metode Mahattan. Proses
clustering mempergunakan metode Self Optimizing Map (SOM). Evaluasi sistem menggunakan dua pendekatan, yaitu dengan pengukuran nilai cluster menggunakan
purity dan entropy, dan pengukuran pencarian gambar menggunakan recall dan
precision. Hasil pengujian sistem image retrieval dengan metode SOM menunjukkan bahwa dalam pengukuran cluster dengan purity dan entropy
menunjukkan nilai rata-rata purity di bawah 0,5 dan entropy rata-rata diatas 0,8.
Kata Kunci : image retrieval, fitur warna, tekstur dan bentuk, Self Organizing
Abstract
A Image retrieval is a technology that helps manage digital data in images
form. Search and discovery images aims to reinforce what is actually looked for,
where to search, and the purpose of the search. The research used clustering
methods to classify images based on features from the image itself. Color, texture,
and shape feature are used in features extraction process. Color feature is extracted
using the Color Histogram method, texture feature is extracted using Gray Level
occurance Matrix, and shape feature is extracted using Edge Direction from Canny
Edge Detection method. Mahattan method is applied for calculating the distance
between the image features. And then the clustering is done by Self Optimizing Map
(SOM). There are two approaches for evaluation systems: by using a cluster
measurements with purity and entropy, and measurement image searching result
using recall and precision. The evaluations image retrieval system with SOM
method shows that in the measurement of the cluster with the purity and entropy
method the average purity values below 0,5 and entropy average above 0,8.
ix
DAFTAR ISI
Lembar Persetujuan Pembimbing ... iii
UCAPAN TERIMAKASIH... vi
DAFTAR ISTILAH DAN SINGKATAN ... xv
BAB I PENDAHULUAN ... 1
1.6. Keaslian Penelitian ... 7
BAB II LANDASAN TEORI ... 9
2.1. Stateof the Art ... 9
2.2. Data Mining ... 11
2.3. ImageClustering ... 12
2.4. Image Retrieval by Unsupervised Learning ... 15
2.5. Feature Extraction ... 16
2.6. Self Organizing Map (SOM) ... 20
BAB III METODE PENELITIAN ... 24
3.1. Tempat dan Waktu Penelitian ... 24
3.2. Sistematika Penelitian ... 24
3.3. Studi Pustaka ... 25
3.4. Pengumpulan Data ... 26
3.6. Tahap Penarikan Kesimpulan ... 43
3.7. Instrumen Penelitian ... 44
BAB IV HASIL DAN PEMBAHASAN ... 45
4.1. Antarmuka Sistem ... 45
4.2. Inputan Gambar Latih ... 45
4.3. Pre-Processing Gambar Latih ... 47
4.4. Feature Extraction Gambar Latih ... 48
4.5. Similiarity dan NeighboringImage ... 52
4.6. Cluster Image ... 53
4.7. Evaluasi ... 54
BAB V KESIMPULAN DAN SARAN ... 80
5.1. Kesimpulan ... 80
5.2. Saran ... 81
xi
DAFTAR GAMBAR
Gambar 3. 1 Sistematika Penelitian ... 25
Gambar 3. 2 Gambaran Umum Sistem ... 27
Gambar 3. 3 Gambar Latih kategori : (a) Anjing, (b) Ballon, (c) Bunga ... 29
Gambar 3. 4 RGB Citra Warna ... 31
Gambar 3. 5 Citra Abu-abu ... 31
Gambar 3. 6 Color Histogram 8 Bin ... 34
Gambar 3. 7 GLCM korelasi antara sepasang piksel dengan jarak dan arah tertentu (Jeremiah, 2007) ... 36
Gambar 3. 8 Flowchart SOM (Warsito, 2008) ... 39
Gambar 4. 1 Tampilan Aplikasi Image Retrieval dengan teknik SOM ... 45
Gambar 4. 2 Halaman penyimpanan gambar latih ... 46
Gambar 4. 3 Dialog pemilihan folder gambar latih ... 46
Gambar 4. 4 Halaman pemilihan kategori gambar dan penyimpanan gambar latih ... 47
Gambar 4. 5 Halaman Pre-processing grayscale gambar latih ... 48
Gambar 4. 6 Halaman color extraction ... 49
Gambar 4. 7 Nilai fitur warna gambar latih ... 49
Gambar 4. 8 Halaman texture extraction ... 50
Gambar 4. 9 Nilai fitur teksture gambar latih ... 50
Gambar 4. 10 Halaman shape extraction ... 51
Gambar 4. 11 Nilai fitur bentuk gambar latih ... 52
Gambar 4. 12 Halaman Aplikasi Pemilihan Gambar Uji ... 52
Gambar 4. 13 Halaman Similiarity dan Ordering Image ... 53
Gambar 4. 14 Halaman Clustering dan Hasil Retrieval Image ... 54
Gambar 4. 15 Contoh Gambar Latih ... 56
Gambar 4. 16 Gambar latih jarak kedekatan terkecil dengan gambar uji kategori anjing ... 58
xiii
DAFTAR TABEL
Tabel 3. 1 Komposisi Warna Citra (RGB) ... 33
Tabel 3. 2 Komposisi grayscale dari nilai RGB ... 33
Tabel 3. 3 Keanggotaan warna abu ke 16 bin ... 35
Tabel 3. 4 Komposisi Warna Keabuan citra ... 35
Tabel 3. 5 Keanggotaan warna abu-abu ke dalam 16 bin ... 36
Tabel 3. 6 GLCM arah nol derajat dengan jarak 1 piksel ... 36
Tabel 4. 1 Hasil Pengukuran clustering dan hasil pencarian gambar kategori Anjing ... 57
Tabel 4. 2 Hasil Pengukuran jarak fitur Warna kategori Anjing ... 59
Tabel 4. 3 Hasil Pengukuran jarak fitur Tekstur kategori Anjing ... 59
Tabel 4. 4 Hasil Pengukuran jarak fitur Bentuk kategori Anjing ... 59
Tabel 4. 5 Hasil pengujian cluster kategori Anjing... 60
Tabel 4. 6 Hasil pengujian pencarian gambar kategori Anjing ... 60
Tabel 4. 7 Hasil Pengukuran clustering dan hasil pencarian gambar kategori Gajah ... 62
Tabel 4. 8 Hasil Pengukuran jarak fitur Warna kategori Gajah ... 63
Tabel 4. 9 Hasil Pengukuran jarak fitur Tekstur kategori Gajah ... 64
Tabel 4. 10 Hasil Pengukuran jarak fitur Bentuk kategori Gajah ... 64
Tabel 4. 11 Hasil pengujian cluster kategori Gajah ... 65
Tabel 4. 12 Hasil pengujian pencarian gambar kategori Gajah ... 65
Tabel 4. 13 Hasil Pengukuran clustering dan hasil pencarian gambar kategori Bunga Mawar ... 66
Tabel 4. 14 Hasil Pengukuran jarak fitur Warna kategori Bunga Mawar ... 68
Tabel 4. 15 Hasil Pengukuran jarak fitur Tekstur kategori Bunga Mawar ... 68
Tabel 4. 16 Hasil Pengukuran jarak fitur Bentuk kategori Bunga Mawar ... 68
Tabel 4. 17 Hasil pengujian cluster kategori Bunga Mawar ... 69
Tabel 4. 19 Hasil Pengukuran clustering dan hasil pencarian gambar kategori Bus
... 71
Tabel 4. 20 Hasil Pengukuran jarak fitur Warna kategori Bus ... 72
Tabel 4. 21 Hasil Pengukuran jarak fitur Tekstur kategori Bus ... 72
Tabel 4. 22 Hasil Pengukuran jarak fitur Bentuk kategori Bus ... 73
Tabel 4. 23 Hasil pengujian cluster kategori Bus ... 73
Tabel 4. 24 Hasil pengujian pencarian gambar kategori Bus... 74
Tabel 4. 25 Hasil Pengukuran clustering dan hasil pencarian gambar kategori Dinosaurus ... 75
Tabel 4. 26 Hasil Pengukuran jarak fitur Warna kategori Dinosaurus ... 76
Tabel 4. 27 Hasil Pengukuran jarak fitur Tekstur kategori Dinosaurus ... 77
Tabel 4. 28 Hasil Pengukuran jarak fitur Bentuk kategori Dinosaurus ... 77
Tabel 4. 29 Hasil pengujian cluster kategori Dinosaurus ... 78
xv
DAFTAR ISTILAH DAN SINGKATAN
Image : merupakan istilah lain untuk gambar sebagai salah satu komponen multimedia yang memegang peranan yang sangat penting sebagai bentuk informasi visual. Image didefinisikan sebagai fungsi f(x,y) berukuran M baris dan N kolom, dnegan x da y merupakan koordinat, (x,y) dinamakan intensitas atau tingkat keabuan.
Histogram : representasi grafis untuk distribusi warna dari citra digital atau menggambarkan penyebaran nilai-nilai intensitas pixel dari suatu citra atau bagian tertentu di dalam citra. Dari sebuah histogram dapat diketahui frekuensi kemunculan relative dari intensitas pada citra, kecerahan, dan kontas dari sebuah gambar.
Clustering : merupakan proses klasifikasi yang tidak terlatih (unsupervised learning) terhadap suatu data/pattern/feature vector menjadi beberapa kelompok atau cluster berdasarkan kemiripannya
Image Retrieval : merupakan sistem computer yang berfungsi untuk menjelajah, mencari, mengurutkan dan mengembalikan citra dari kumpulan basis data citra yang besar.
CLUE: Teknik penemuan cluster suatu citra dilakukan dengan mengurutkan citra, pencarian citra dan kesamaan antar citra.
Self Organizing Map : Jaringan Kohonen merupakan salah satu bentuk topologi dari Unsupervised Artificial Neural Network (Unsupervised ANN) dimana dalam proses pelatihannya tidak memerlukan pengawasan (target