Pengenalan pola (pattern recognition) adalah suatu ilmu untuk mengklasifikasikan atau menggambarkan sesuatu berdasarkan pengukuran kuantitatif fitur (ciri) atau sifat utama dari suatu obyek. Pola sendiri adalah suatu entitas yang terdefinisi dan dapat diidentifikasikan serta diberi nama. Pola bisa merupakan kumpulan hasil pengukuran atau pemantauan dan bisa merupakan kumpulan hasil pengukuran atau pemantauan dan bisa dinyatakan dalam notasi vektor atau matriks (Putra, 2010)
Pada dasarnya pengenalan pola terdiri dari beberapa mekanisme utama yang tergantung dari pendekatan yang dilakukan. Beberapa kasus data yang sudah diklasifikasikan diasumsikan tersedia untuk melatih sistem. Penelitian ini mengelompokkan mekanisme pengenalan pola dalam sistem pengenalan pola yang ditunjukan pada struktur berikut :
15
Gambar 2.1Mekanisme Pengenalan Pola
Pra pengolahan berfungsi mempersiapkan data citra digital retina agar dapat menghasilkan ciri yang lebih baik pada tahap berikutnya. Pada tahap ini dilakukan proses grayscaling, penajaman kontras, dan cropping yang bertujuan untuk menonjolkan ciri dan mengurangi dimensi data.
Pencari dan seleksi fitur merupakan langkah untuk menemukan karakteristik pembeda yang mewakili sifat utama pada citra digital retina sekaligus mengurangi dimensi menjadi sekumpulan bilangan yang lebih sedikit namun representatif.
Klasifikasi berfungsi mengelompokan hasil ekstraksi fitur ke dalam kelas yang sesuai dengan menggunakan pemisah kelas.
2.3.1. Ekstraksi fitur
Ekstraksi fitur merupakan langkah awal dalam melakukan klasifikasi dan interpretasi citra. Proses ini berkaitan dengan kuantisasi karakteristik citra ke dalam sekelompok nilai ciri yang sesuai. Secara umum metode ekstraksi fitur dikelompokkan menjadi empat bagian (Putra, 2010) yaitu :
1. Berdasarkan bentuk atau topologi
2. Berdasarkan sifat-sifat permukaan atau tekstur 3. Berdasarkan struktur geometri
4. Berdasarkan warna Klasifikasi Pra pengolahan Pencari dan Seleksi Fitur
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Fitur menurut D.G. Kendall (M.B Stegman, 2002) dinyatakan dengan susunan bilangan yang dapat dipakai untuk mengidentifikasi objek.
Fitur-fitur suatu objek mempunyai peran penting untuk berbagai aplikasi berikut :
1. Pencarian citra : fitur dipakai untuk mencari objek-objek tertentu yang berada
di dalam database.
2. Penyederhanaan dan hampiran bentuk : bentuk objek dapat dinyatakan dengan representasi yang lebih ringkas
3. Pengenalan dan klasifikasi: sejumlah fitur dipakai untuk menentukan jenis objek.
Untuk kepentingan aplikasi yang telah disebutkan, fitur hendaknya efisen. Fitur yang efisien perlu memenuhi sifat-sifat penting berikut : (Mingqiang, Kidiyo, & Joseph, 2008) :
1. Teridentifikasi : fitur berupa nilai yang dapat digunakan untuk membedakan antara suatu objek dengan objek lain. Jika kedua fitur tersebut didampingkan, dapat ditemukan perbedaan hakiki.
2. Tidak dipengaruhi oleh translas, rotasi, dan penyekalan. Dua objek sama tetapi berbeda dalam lokasi, arah pemutaran, dan ukuran tetap dideteksi sama.
3. Tidak bergantung pada affline 4. Tahan terhadap derau
17
5. Tidak bergantung pada tumpang tindih
6. Tidak bergantung secara statis : dua fitur harus tidak bergantung satu dengan yang lain secara statistik.
2.3.1.1 Filter Gabor 2D
Metode Filter Gabor 2D mampu menghubungkan representasi tekstur dan detektor citra yang optimal. Fungsi fabor Filter 2D juga mampu meminimalisasi ciri yang tidak penting dalam citra. (Mandasari, dkk, 2012)
Filter Gabor 2D diperoleh dari sebuah fungsi Gaussian yang dimodulasi menggunakan variasi frekuensi ditunjukkan dengan
Fungsi Gaussian 2-D ditunjukkan dengan persamaan :
(2.1)
Dengan nilai dan nilai . x dan y merupakan nilai koordinat piksel dalam citra, f merupakan frekuensi gelombang sinusoidal, merupakan kontrol terhadap orientasi dari sebuah
fungsi Filter Gabor 2D, dan σ merupakan standar deviasi dimana .
Fungsi kompleks filter Gabor 2D ditunjukkan dengan persamaan :
(2.2)
Real
(2.3)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Imaginer
(2.4)
2.3.1.2 Principal Component Analysis
Analisis komponen utama atau Pincipal Component Analysis adalah salah satu cara mengidentifikasi pola dalam data dan mengekspresikannya sedemikian rupa sehingga dapat terlihat persamaan dan perbedaannya. Pola ini berguna untuk mengkompresi data, yaitu mengurangi ukuran atau dimensi data tanpa kehilangan banyak informasi yang terkandung.
Principal Component Analysis (PCA) melakukan/ transformasi set data dari dimensi lama ke dimensi baru (yang relatif berdimensi lebih rendah) dengan memanfaatkan teknik dalam aljabar linear, tanpa memerlukan masukan parameter tertentu dalam memberikan hasil pemetaan. Tujuan dari PCA yaitu meminimalkan redundansi yang diukur oleh nilai jarak dari kovarian dan memaksimalkan nilai keluaran pemetaan, diukur dengan varian.
Jika data dalam dimensi asli sulit untuk dipresentasikan melalui grafik, maka data tersebut disederhanakan menggunakan data set yang dipresentasikan melalui rumus. Misalkan mempunyai data set yang sudah decentering dengan kovarian
(2.5)
19
(2.6)
atau
(2.7)
Persamaan di atas bisa diselesaikan untukmencari nilai dengan menyelesaikan
(2.8)
Untuk eigenvalue dan eigenvector dengan solusi adalah eigenvector dan adalah eigenvalue yang terletak dalam span
(Santoso, 2007)
2.3.1.3 Support Vector Machine
Support Vector Machine (SVM) dikembangkan oleh Boser, Guyon, Vapnik. Pertama kali dipresentasikan pada tahun 1992 di Annual Workshop on Computational Learning Theory. SVM merupakan metode yang berusaha menemukan hyperplane terbaik pada input space. Prinsip dasar SVM adalah pengklasifikasi linier, dan selanjutnya dikembangkan agar dapat bekerja pada permasalahan nonlinier dengan memasukkan konsep kernel trick pada ruang kerja berdimensi tinggi. (Nugroho dkk, 2003).
Hyperplane (batas keputusan) pemisah terbaik antara kedua kelas dapat ditemukan dengan mengukur margin dan mencari titik maksimalnya. Margin adalah jarak antara hyperplane tersebut dengan data terdekat dari masing- masing kelas. Data yang paling dekat ini disebut sebagai support vector.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Usaha untuk mencari lokasi hyperplane merupakan inti dari proses pelatihan pada SVM. Data latih yang tersedia dinyatakan oleh (xi, yi)
dengan i = 1, 2, …, N, dan xi = xi1, xi2, … xiq)T sebagai atribut (fitur) set
untuk data latih yang ke-i, Untuk yi ϵ {-1,+1} menyatakan label kelas. Diasumsikan terpisah oleh hyperplane klasifikasi linear SVM, yang dinotasikan :
(2.9)
w dan b adalah parameter model. Secara teknis SVM bertujuan
menentukan variabel w dan b sehingga data pelatihan dideskripsikan sebagai :
(2.10)
(2.11)
Agar SVM dapat bekerja pada permasalahan non-linear, perlu proses pemetaan dengan menggunakan perhitungan dot-product dua buah data pada ruang fitur baru untuk memetakan data ke dimensi yang lebih tinggi. Teknik komputasi ini disebut dengan kernel trick, yaitu menghitung dot-product dua buah vector di ruang dimensi baru dengan menggunakan komponen kedua buah vector tersebut di ruang dimensi asal sebagai berikut:
21
Dan untuk prediksi pada set data dengan dimensi fitur yang baru diformulasikan :
(2.13)
N adalah jumlah data yang menjadi support vector, xi adalah support
vector, dan z adalah data uji yang akan dilakukan prediksi.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
BAB III
METODOLOGI PENELITIAN
Bab Analisa dan Perancangan Sistem merupakan bab yang berisi penjelasan mengenai gambaran proses yang akan dilalui beserta cara kerja yang akan digunakan dalam penelitian.
3.1.Data
Data yang digunakan untuk penelitian merupakan data yang dimiliki oleh MESSIDOR (Methods to evaluate segmentation and indexing techniques in the field of retinal ophthalmology). MESSIDOR adalah program penelitian Techno Vision yang didanai oleh Kementrian Riset dan Pertahanan Perancis pada tahun 2004.
Data MESSIDOR yang digunakan berupa data citra digital retina berekstensi .tiff . Data yang digunakan berjumlah 100 data citra yang terdiri dari 25 data mata normal, 25 data grade 1, 25 data grade 2, dan 25 data grade 3. Penampakan data citra yang digunakan dapat dilihat pada halaman lampiran.
Data citra yang digunakan mengandung informasi utnuk menentukan tingkat keparahan retinopati diabetik yang diderita. Informasi tersebut ditunjukan oleh jumlah mikroaneurisma, hemorrhages, dan neovaskularisasi yang terdapat pada masing-masing citra.
23
Contoh citra retina sehat dan yang terjangkit retinopati diabetik ditunjukkan pada gambar 3.1
Grade 0 Grade 1
Grade 2 Grade 3
Gambar 3. 1 Citra digital retina grade0, grade 1, grade 2, grade 3
3.2.Metodologi Penelitan
Penelitian yang dilakukan menggunakan data citra digital berwarna sebagai masukkan. Karakter yang akan dikenali pada citra tersebut berupa beratnya perubahan mikrovaskular retina dan ada tidaknya pembetukan pembuluh darah baru.
Input yang diproses dengan menggunakan ekstensi .tiff dengan ukuran asli 2240x1488 pixel berupa citra digital berwarna retina. Data cita masukkan akan melalui preprocessing yang terdiri dari beberapa langkah. Langkah untuk melakukan preprocessing diawali dengan memisahkan kanal yang terdiri dari
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
kanal merah, hijau, dan biru. Hasil dari kanal hijau yang digunakan pada penelitian. Citra kanal hijau kemudian mengalami penajaman kontras untuk menonjolkan informasi di dalamnya. Hasil dari penajaman kontras dikenai proses binerisasi kemudian dinegasikan. Untuk semakin meminimalkan ukuran dilakukan proses cropping. Gambaran dari keseluruhan sistem yang dibuat ditunjukkan pada gambar 3.2 berupa diagram blok keseluruhan sistem.
Gambar 3. 2 Diagram Blok Keseluruhan Sistem
Preprocessing
cropping Preprocessing
Klasifikasi Support Vector Machine tahap
training Dataset citra berwarna
retina Modelling SVM merah Binerisasi Citra Asli hijau Penajaman kontras Negasi cropping biru merah Binerisasi cropping Citra Asli hijau Penajaman kontras Negasi cropping biru Input dataset pelatihan hasil dari
preprocessing
Ekstraksi ciri Filter Gabor 2D Input data testing Ekstraksi ciri Filter Gabor 2D Klasifikasi Support Vector Machine tahap testing Hasil klasifikasi
25
3.3.Metode Preprocessing
Proses preprocessing diperlukan dalam pengolahan suatu citra digital berwarna. Fungsinya untuk memperbaiki kualitas suatu citra dan mengolah informasi di dalamnya untuk proses berikutnya. Pada tahap ini sinyal informasi ditonjolkan dan sinyal pengganggu (derau) diminimalisasi (Putra, 2010).
Gambar 3. 3 Diagram Blok Preproses
Proses preprocessing yang akan dilkaukan diawali dengan memisahkan citra asli berdasarkan kanal merah, hijau, dan biru. Kemudian diambil kanal hijau dan dilakukan penajaman kontras. Hasil penajaman kontras dikenai binerisasi dan dinegasikan. Keduanya di-cropping untuk nantinya menjadi masukkan pada tahap ekstraksi fitur.