HYBRID ALGORITMA SUPPORT VECTOR MACHINE DAN K- NEAREST NEIGHBOR UNTUK MENGOPTIMASI DIAGNOSA PENYAKIT MATA TESIS SUMITA WARDANI

Teks penuh

(1)HYBRID ALGORITMA SUPPORT VECTOR MACHINE DAN KNEAREST NEIGHBOR UNTUK MENGOPTIMASI DIAGNOSA PENYAKIT MATA. TESIS. SUMITA WARDANI 167038083. PROGRAM STUDI S2 TEKNIK INFORMATIKA FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA MEDAN 2020. Universitas Sumatera Utara.

(2) HYBRID ALGORITMA SUPPORT VECTOR MACHINE DAN KNEAREST NEIGHBOR UNTUK MENGOPTIMASI DIAGNOSA PENYAKIT MATA TESIS Diajukan untuk melengkapi tugas dan memenuhi syarat memperoleh ijazah Magister Teknik Informatika. SUMITA WARDANI 167038083. PROGRAM STUDI S2 TEKNIK INFORMATIKA FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI. UNIVERSITAS SUMATERA UTARA MEDAN 2020. Universitas Sumatera Utara.

(3) Universitas Sumatera Utara.







(10) ABSTRAK. Retinopati Diabetik merupakan salah satu penyakit komplikasi dari Diabetes Melitus. Penyakit ini dapat menyebabkan kebutaan menetap jika tidak ditangani sedini mungkin. Sistem yang dibangun pada tesis ini adalah deteksi tingkat retinopati diabetik dari citra yang didapatkan dari foto fundus. Terdapat tiga tahap utama untuk menyelesaikan permasalahan yaitu prapengolahan, ekstraksi ciri dan klasifikasi. Metode prapengolahan yang digunakan diantaranya citra kanal hijau, Filter Gaussian, Contrast Limited Adaptive Histogram Equalization dan Masking. Metode Two Dimensional Linear Discriminant Analysis (2DLDA) digunakan sebagai ekstraksi ciri. Support Vector Machine (SVM) dan K-Nearest Neighbor (K-NN) digunakan sebagai metode klasifikasi. Hasil pengujian dilakukan dengan mengambil dataset dari The STARE (STructured Analysis of the Retina) database dengan sejumlah citra yang bervariasi untuk tahap pelatihan, sisanya digunakan untuk tahap pengujian. Hasil pengujian menunjukkan akurasi optimal sebesar 75% untuk metode SVM dan 90% untuk metode SVM-K-NN.. Kata Kunci : Retinopati Diabetik, Two Dimensional Linear Discriminant Analysis, Support Vector Machine, K-Nearest Neighbor. Universitas Sumatera Utara.

(11) HYBRID OF SUPPORT VECTOR MACHINE ALGORITHM AND KNEAREST NEIGHBOR ALGORITHM TO OPTIMIZE THE DIAGNOSIS OF EYE DISEASE. ABSTRACT. Diabetic retinopathy is a complication of diabetes mellitus. This disease can cause permanent blindness if not treated as early as possible. The system built on this thesis is the detection of the level of diabetic retinopathy from images obtained from fundus photographs. There are three main stages to solve the problem, namely preprocessing, feature extraction and classification. Preprocessing methods used include green channel imagery, Gaussian Filters, Contrast Limited Adaptive Histogram Equalization and Masking. Two Dimensional Linear Discriminant Analysis (2DLDA) method is used as a feature extraction. Support Vector Machine (SVM) and K-Nearest Neighbor (K-NN) are used as a classification method. The test results are done by taking a dataset from The STARE (Structured Analysis of the Retina) database with several images that vary for the training stage, the rest is used for the testing phase. The test results showed an optimal accuracy of 75% for the SVM method and 90% for the SVM-K-NN method.. Keywords: Diabetic Retinopathy, Two Dimensional Linear Discriminant Analysis, Support Vector Machine, K-Nearest Neighbor. Universitas Sumatera Utara.

(12) DAFTAR ISI. Hal. Pesetujuan Pernyataan Persetujuan Publikasi Panitia Penguji Tesis Riwayat Hidup Ucapan Terima Kasih Abstrak Abstract Daftar Isi Daftar Tabel Daftar Gambar BAB 1. BAB 2. BAB 3. ii iii iv v vi vii ix x xi xiii xiv. PENDAHULUAN 1.1. Latar Belakang Masalah 1.2. Perumusan Masalah 1.3. Batasan Masalah 1.4. Tujuan Penelitian 1.5. Manfaat Penelitian. 1 4 4 5 5. LANDASAN TEORI 2.1. Citra 2.2. Citra Digital 2.2.1. Representasi Warna Digital 2.2.2. Format Citra Bitmap 2.2.3. Citra Format PNG (Portable Network Graphics) 2.3. Algoritma Support Vector Machine (SVM) 2.3.1. Metode Sequential Training SVM 2.3.2. SVM Non Linear 2.4. Metode Klasifikasi K-Nearest Neighbor (K-NN) 2.5. Ekstraksi Fitur 2.5.1. Ekstraksi Ciri Zoning 2.6. Penyakit Mata Katarak 2.6.1. Gejala Katarak pada Lansia 2.6.2. Diabetic Retinopathy 2.7. Penelitian Terkait METODOLOGI PENELITIAN 3.1. Pendahuluan 3.2. Bagan Penelitian 3.3. Flowchart Algoritma Pelatihan SVM 3.4. Flowchart Pengujian Algoritma SVM 3.5. Flowchart Pelatihan Algoritma Kombinasi SVMK-NN 3.6. Flowchart Pengujian Algoritma Kombinasi SVM-. 6 6 8 8 9 10 13 14 16 17 17 19 19 21 24 27 29 30 32 34. Universitas Sumatera Utara.

(13) K-NN 3.7. Data Yang Digunakan 3.8. Image Preprocessing36 3.8.1. Menghitung Nilai RGB Citra 3.8.2. Menghitung Nilai Grayscale 3.8.3. Adaptif Histogram Equalization 3.8.4. Deteksi Tepi Algoritma Canny 3.9. Perhitungan Pelatihan Algoritma SVM 3.9.1. Normalisasi Data 3.9.2. Perhitungan Kernel RBF 3.9.3. Perhitungan Matriks Hessian 3.9.4. Perhitungan Nilai Error 3.10. Perhitungan Pengujian Algoritma SVM 3.11. Perhitungan Pelatihan Algoritma Kombinasi SVMK-NN 3.12. Perhitungan Pengujian Algoritma Kombinasi SVMK-NN 3.12.1. Perhitungan nilai bobot (W) dan Bias (b) 3.12.2. Penetapan Klasifikasi BAB 4. BAB 5. HASIL DAN PEMBAHASAN 4.1. Pendahuluan 4.2. Hasil Pengujian 4.2.1. Hasil Pengujian Diagnosa Diabetic Retinopathy dengan Algoritma SVM 4.2.2. Hasil Pengujian Diagnosa Diabetic Retinopathy dengan Algoritma SVM-K-NN 4.3. Pembahasan KESIMPULAN DAN SARAN 5.1. Kesimpulan 5.2. Saran. DAFTAR PUSTAKA. 35 36 36 38 39 44 47 47 48 50 51 56 58 62 62 63. 65 68 68 73 79. 81 81 82. Universitas Sumatera Utara.

(14) DAFTAR TABEL. Hal. Tabel 2.1. Tabel 2.2. Tabel 3.1. Tabel 3.2. Tabel 3.3. Tabel 3.4. Tabel 3.5. Tabel 3.6. Tabel 3.7. Tabel 3.8. Tabel 3.9. Tabel 3.10. Tabel 3.11. Tabel 3.12. Tabel 3.13. Tabel 3.14. Tabel 3.15. Tabel 3.16. Tabel 3.17. Tabel 3.18. Tabel 3.19. Tabel 3.20. Tabel 3.21. Tabel 3.22. Tabel 3.23. Tabel 3.24. Tabel 3.25. Tabel 3.26. Tabel 3.27. Tabel 4.1. Tabel 4.2. Tabel 4.3. Tabel 4.4.. Hubungan antara bit per piksel dengan jumlah warna maksimum pada bitmap Penelitian Terkait Matriks Nilai RGB Citra Warna Frekuensi Nilai Grayscale Frekuensi Nilai Grayscale Citra Nilai Pr Nilai rk Nilai Frekuensi Kumulatif Sk Nilai Sk yang mendekati rk Nilai Ps(Sk) Hasil Konvolusi Matriks Citra Hasil Canny Matriks Citra Hasil Threshold Tabel Normalisasi Grayscale Hasil Perhitungan Kernel RBF Hasil Perhitungan Matriks Hessian Hasil Perhitungan Nilai Error Awal Hasil Perhitungan Nilai Error Hasil Perhitungan Nilai K(x,x+) dan Nilai K(x,x-) Hasil Perhitungan w.x+ dan w.xBobot dan Bias Normalisasi Piksel Citra Uji Hasil Normalisasi Piksel Citra Training dan Uji Hasil perhitungan nilai K(x,xi) dan nilai w Nilai Piksel Normalisasi Perhitungan Xc Perhitungan Yc Matriks Jarak62 Hasil perhitungan nilai K(x,xi) dan nilai w Hasil Pengujian Diagnosa Penyakit Diabetic Retinopathy dengan algoritma SVM Hasil Pengujian Diagnosa Penyakit Diabetic Retinopathy dengan algoritma SVM Hasil Pengujian Diagnosa Penyakit Diabetic Retinopathy dengan algoritma Kombinasi (SVM-K-NN) Hasil Pengujian Diagnosa Penyakit Diabetic Retinopathy dengan algoritma SVM-K-NN. 9 25 38 39 40 41 42 42 43 43 45 46 46 48 50 51 52 53 54 55 55 56 56 57 58 59 59 64 69 72 74 77. Universitas Sumatera Utara.

(15) DAFTAR GAMBAR. Hal. Gambar 2.1. Kordinat Citra Digital Gambar 2.2. Hyperplane Mengklasifikasikan Data Menjadi Dua Kelas Gambar 2.3. Support Vector, Jarak Terdekat Dengan Masing-Masing Kelas Gambar 2.4. Dimensi Data Gambar 2.5. Pembagian Zona pada Citra Biner Gambar 2.6. Citra Retina Normal dan Sakit Gambar 2.7. Citra Retina (a) Mild NPDR (b) Moderate NPDR (c) Severe NPDR Gambar 3.1. Bagan Penelitian Gambar 3.2. Flowchart Pelatihan Algoritma SVM Gambar 3.3. Flowchart Algoritma Pengujian SVM Gambar 3.4. Flowchart Pelatihan Algoritma Kombinasi SVMK-NN Gambar 3.5. Flowchart Pengujian Algoritma Kombinasi SVMK-NN Gambar 3.6. Contoh Nilai Piksel Citra Warna Gambar 3.7. Citra Warna Retina Gambar 3.8. Matriks Nilai Grayscale Gambar 3.9. Kurva Histogram Citra Asli Gambar 3.10. Kurva Histogram Hasil Equlization Gambar 3.11. Citra Biner Retina Untuk algoritma ICZ Gambar 4.1. Citra Fundus Normal Dan Diabetes Retinopati Gambar 4.2. Citra RGB Fundus Dan Grayscale Gambar 4.3. Histogram Citra Fundus Gambar 4.4. Citra Fundus Grayscale Hasil Histogram Equalization Gambar 4.5. Hasil Histogram Equalization Citra Fundus Gambar 4.6. Citra Fundus Hasil Pengolahan Gambar 4.7. Grafik Percobaan 2 Hasil Pengujian Algoritma SVM Gambar 4.8. Grafik Nilai Akurasi (%) Gambar 4.9. Grafik Percobaan 2 Hasil Pengujian Algoritma SVM-K-NN Gambar 4.10. Grafik Perbandingan Akurasi Algoritma SVM dengan Kombinasi. 7 11 11 15 17 22 24 29 31 33 34 35 36 37 39 40 44 58 65 66 66 67 67 68 73 77 78 79. Universitas Sumatera Utara.

(16) 1. BAB 1 PENDAHULUAN. 1.1 Latar Belakang Diabetic Retinopathy adalah suatu penyakit mata mikroangiopati progresif yang ditandai oleh kerusakan dan sumbatan pada pembuluh darah halus pada retina mata. Pada penyakit ini terjadi penebalan membran basal endotel kapiler dan penurunan jumlah perisit. Secara umum klasifikasi Diabetic Retinopathy dibagi menjadi 2, yaitu Non-Proliferatif. Diabetic Retinopathy (NPDR). dan Preproliferatif. Diabetic. Retinopathy (PDR). Pada NPDR merupakan tahap awal dari diabetes retinopati dimana pembuluh darah kecil pada retina mengalami pendarahan, cairan yang bocor ini menyebabkan retina membengkak dan membentuk gumpalan-gumpalan atau exudate. Ada tiga klasifikasi dari NPDR yaitu Mild NPDR yaitu paling tidak terdapat satu mikroaneurisma dan pendarahan karena pembuluh darah pada retina pecah. Selanjutnya moderate NPDR yaitu Hemorrhages dan mikroaneurisma berada paling tidak di satu kuadran yang sama. Jumlah mikroaneurisma semakin banyak, lebih banyak dibandingkan dengan Mild NPDR dan Severe NPDR yaitu jika mikroanerisma dan intraretinal hemorrhages semuanya pada empat kuadran yang sama. Ketiga klasifikasi penyakit Diabetic Retinopathy sulit dibedakan dengan mata telanjang dan untuk menentukan klasifikasi dengan cepat diperlukan pengolahan citra exudate. Support Vector Machine (SVM) adalah sebuah sistem pembelajaran yang menggunakan ruang hipotesis yang berupa fungsi linear di dalam suatu fitur yang memiliki dimensi tinggi dan menggunakan algoritma pembelajaran yang berdasarkan teori optimasi. SVM merupakan salah satu teknik yang baru apabila dibandingkan dengan teknik yang lain.. 1 Universitas Sumatera Utara.

(17) 2. Hal yang perlu dan sangat penting di dalam algoritma SVM adalah pemilihan fungsi kernel yang sesuai dan tepat, dikarenakan fungsi dari kernel ialah menentukan feature space dimana fungsi dari klasifier akan dicari (Parapat, I. M. 2018). Dasar dari SVM telah ada pada tahun 1960-an dan baru dikembangkan pada tahun 1992 oleh Vladimir Vapnik, Bernhard Boser dan Isabelle Guyon melalui teori structural risk minimaization. SVM menjadi suatu metode baru yang menjanjikan dalam mengklasifikasi data, baik secara linear maupun nonlinear. Dengan menggunakan pemetaan secara nonlinear yang tepat, data dari dua kelas yang memiliki dimensi yang cukup tinggi selalu dapat dipisahkan dengan menggunakan hyperplane. Untuk menemukan hyperplane, harus menggunakan support vector dan margins (Listiana, E. 2017). Kelebihan yang terdapat pada SVM ialah memiliki proses komputasi yang cepat dikarenakan SVM menggunakan support vector dalam menentukan jarak. Pada penelitian terdahulu, telah dilakukan perbandingan antara metode klasifikasi K-Nearest Neighbor (KNN) dengan SVM dan ditarik kesimpulan bahwa SVM memiliki kinerja yang lebih unggul dibandingkan dengan menggunakan KNN. Hal ini dikarenakan SVM mampu mengklasfikasikan data dengan tepat. SVM juga memiliki tingkat akurasi yang lebih tinggi apabila dibandingkan dengan menggunakan metode regresi logistik (Octaviani, P.A. 2014). K-Nearest Neighbor adalah sebuah algoritma untuk melakukan klasifikasi terhadap objek berdasarkan data pembelajaran yang jaraknya paling dekat dengan objek tersebut. Algoritma K-Nearest Neighbor mengelompokkan data baru yang belum diketahui classnya dengan memilih data sejumlah k yang letaknya paling dekat dari data baru. Class paling banyak dari data terdekat sejumlah k akan dipilih sebagai class yang diprediksi untuk data baru. Pada umumnya nilai k menggunakan jumlah ganjil agar tidak terdapat jarak yang sama dalam proses klasifikasi. Jauh atau dekatnya tetangga dihitung menggunakan jarak Euclidean (Fatoni, C. S. & Noviandha, F. D. 2018). SVM adalah metode klasifikasi dan penerapannya berkisar dari bioinformatika ke bidang pengetahuan lain karena keakuratan teknisnya. Ia memiliki kemampuan untuk memproses data volume besar seperti ekspresi gen. Ini termasuk ke dalam metode kernel kategori umum. Algoritma SVM memiliki kemampuan untuk menghasilkan batas keputusan non-linear dan kedua dengan menerapkan fungsi-fungsi kernel, pengguna berada dalam posisi untuk menerapkan pengklasifikasi untuk menginput data yang. Universitas Sumatera Utara.

(18) 3. tidak menunjukkan representasi ruang vektor dimensi tetap yang jelas. Ada beberapa kernel yang umum digunakan termasuk Linear Kernel (K (a, b) = a, b) dan Polynomial Kernel K (a, b) = (a. B + 1) d (Princye, P H & Vijayakumari, V. 2018). SVM adalah salah satu algoritma dalam machine learning yang secara luas digunakan untuk analisis sentiment. Itu telah dibuktikan dalam pengkategorian teks – teks tradisional yang ternyata sangat efektif (Munir Ahmad). Didirikan menggunakan prinsip yang unik, Support Vector Machine (SVM) mencapai kinerja generalisasi yang lebih tinggi daripada jaringan saraf tradisional yang menerapkan prinsip empirical risk minimization (ERM) dalam memecahkan permasalahan pada Machine Learning. SVM mulai banyak dipakai dalam permasalahan pada Machine Learning dikarenakan SVM memiliki kinerja generalisasi yang sangat tinggi (Shetty, S., Kari, K. B. & Jayantkumar. A.R. 2016). K-Nearest Neighbor (KNN) adalah algoritma klasifikasi yang sangat efisien karena fitur utamanya seperti: sangat mudah digunakan, membutuhkan waktu pelatihan yang rendah, data pelatihan yang kuat dan mudah diimplementasikan. Namun, KNN juga memiliki kekurangan seperti kompleksitas komputasional yang tinggi, persyaratan memori yang besar untuk dataset pelatihan yang besar (Rani, P, 2015). Diabetes adalah penyakit berbahaya yang dapat mempengaruhi berbagai organ tubuh seperti sistem saraf, ginjal, jantung, paru-paru, mata dan lainnya. Ketika diabetes merusak pembuluh darah di retina mata maka akan mengakibatkan Diabetic Retinopathy (DR). DR adalah penyakit mata kritis yang merusak pembuluh darah di retina dan menyebabkan kebutaan. Diabetes adalah penyakit yang disebabkan oleh peningkatan abnormal kadar glukosa dalam darah. Dengan meningkatnya kadar glukosa, pembuluh darah rusak di retina mata. Pendeteksian secara dini sangat penting untuk mencegah kebutaan. Deteksi dapat dilakukan dengan dilatasi pupil menggunakan larutan kimia yang mempengaruhi pasien dan juga membutuhkan waktu. Metodemetode ini dapat diubah dan diatasi oleh dokter mata dengan mendeteksi berbagai tahap DR dengan menggunakan bio microscopy (Chaudhari, V. V. 2015). Mata merupakan salah satu indera terpenting dalam tubuh yang berfungsi untuk melihat. Penyakit mata dapat terjadi pada siapa pun tanpa mengenal usia maupun golongan. Penyakit mata dapat diminimalisir apabila menyadari gejala – gejala yang terjadi dan segera diberi penanganan. Namun tidak semua penderita menyadari gejala tersebut sehingga tidak mengetahui penyakit yang sedang dihadapi. Ada beberapa. Universitas Sumatera Utara.

(19) 4. algoritma yang dapat digunakan dalam mendiagnosa penyakit mata, yaitu: Support Vector Machine (SVM), K-Nearest Neighbor (K-NN), Singular Value Decomposition (SVD), Spectral Clustering. Walau dengan adanya algoritma-algoritma tersebut, diagnosa terhadap suatu penyakit mata belumlah optimal baik dari segi kecepatan, keakuratan dan lain sebagainya. Pada penelitian Aulia, S., Ramadan, D. N. & Hadiyoso, S (2016) yang berjudul Analisis Perbandingan KNN dengan SVM untuk Klasifikasi Penyakit Diabetes Retinopati berdasarkan Citra Eksudat dan Mikroaneurisma, dilakukan perbandingan algoritma SVM dengan KNN untuk klasifikasi penyakit diabetes retinopati (mild, moderate, severe) berdasarkan citra eksudat dan microaneurisma. Penelitian ini menggunakan 160 data uji, masing-masing 40 citra untuk kelas normal, kelas mild, kelas moderate, kelas saviere. Tingkat akurasi yang diperoleh dengan menggunakan metode KNN lebih tinggi dibandingkan SVM, yaitu 65 % dan 62%. Klasifikasi dengan algoritma KNN diperoleh hasil terbaik dengan parameter K=9 city block. Berdasarkan kelebihan metode KNN dan kelemahan metode SVM pada penelitian Aulia, S. et al diatas, maka penulis mencoba menggabungkan algoritma Support Vector Machine (SVM) dan algoritma K-Nearest Neighbor (K-NN) untuk mendapatkan hasil yang lebih optimal dalam mendiagnosa penyakit mata Diabetic Retinopathy.. 1.2 Perumusan Masalah Berdasarkan latar belakang yang telah dijelaskan sebelumnya, permasalahan yang akan dibahas pada penelitian ini adalah bagaimana mendapatkan hasil klasifikasi yang lebih baik dalam mendiagnosa penyakit mata Diabetic Retinopathy berdasarkan citra retina mata.. 1.3 Batasan Masalah Penelitian ini dibatasi dengan batasan masalah sebagai berikut: 1.. Menggunakan algoritma Support Vector Machine (SVM) dan K-Nearest Neighbor (K-NN).. 2.. Melakukan analisa terhadap kombinasi algoritma Support Vector Machine (SVM) dan K-Nearest Neighbor (K-NN) dalam menyelesaikan contoh kasus.. Universitas Sumatera Utara.

(20) 5. 3.. Jenis penyakit yang dijadikan sampel penelitian ialah penyakit Diabetic Retinopathy.. 4.. Analisis algoritma K-NN dan SVM untuk klasifikasi penyakit Diabetic Retinopathy berdasarkan citra Eksudat dan Mikroaneurisma.. 5.. Data yang diolah berupa citra fundus diperoleh dari The STARE (STructured Analysis of the Retina) database http://cecas.clemson.edu/~ahoover/stare/ . Citra fundus dengan format file citra Tagged Image Format File (.tif) dengan ukuran 2240 x 1488 piksel.. 1.4 Tujuan Penelitian Adapun tujuan penelitian ini, yaitu : 1.. Menganalisis kombinasi algoritma Support Vector Machine (SVM) dan K-Nearest Neighbor (K-NN) dalam klasifikasi penyakit Diabetic Retinopathy.. 2.. Menghasilkan algoritma baru yang lebih optimal dalam menyelesaikan klasifikasi citra Exudate dan Mikroaneurisma.. 1.5 Manfaat Penelitian Manfaat penelitian dalam tesis ini dapat diuraikan sebagai berikut: 1.. Evaluasi terhadap algoritma Support Vector Machine (SVM) dan K-Nearest Neighbor (K-NN).. 2.. Menghasilkan hasil klasifikasi DR yang lebih akurat menggunakan algoritma Support Vector Machine (SVM) dan K-Nearest Neighbor (K-NN).. Universitas Sumatera Utara.

(21) 6. BAB 2 LANDASAN TEORI. 2.1 Citra Citra analog adalah citra yang bersifat kontinu, seperti gambar pada monitor televisi, foto sinar-X, foto yang tercetak dikertas foto, lukisan, pemandangan, hasil CT scan, gambar-gambar yang terekam pada pita kaset, dan lain-lain sebagainya. Citra analog tidak dapat direpresentasikan dalam komputer sehingga tidak dapat diproses dikomputer secara langsung. Oleh sebab itu, agar citra ini dapat diproses dikomputer, proses konversi analog ke digital harus dilakukan terlebih dahulu. Citra analog dihasilkan dari alat-alat analog, video kamera analog, kamera foto analog, Web Cam, CT scan, sensor ultrasound pada sistem USG, dan lain-lain (Sutoyo, 2010).. 2.2 Citra Digital Citra digital merupakan yang dihasilkan dari gambar analog dua dimensi yang kontinu menjadi gambar diskrit melalui proses sampling. Gambar analog dibagi menjadi N baris dan M kolom sehingga menjadi gambar diskrit. Persilangan antara baris dan kolom tertentu disebut dengan pixel. Contohnya adalah gambar/titik diskrit pada baris m dan kolom n disebut dengan pixel [m,n]. Sampling adalah proses untuk menentukan warna pada pixel tertentu pada citra dari sebuah gambar yang kontinu. Pada proses sampling biasanya dicari warna rata-rata dari gambar analog yang kemudian dibulatkan. Citra digital dapat didefenisikan sebagai fungsi f(x,y), berukuran M baris dan N kolom, dengan x dan y adalah koordinat spasial dan amplitudo f di titik kordinat f(x,y) dinamakan intensitas atau tingkat keabuan dari citra pada titik tersebut. Apabila nilai x, y dan nilai amplitudo f secara keseluruhan berhingga (finite) dan nilai bernilai diskrit maka dapat dikatakan bahwa citra tersebut adalah citra digital. Kordinat citra digital dapat dilihat pada Gambar 2.1. 6 Universitas Sumatera Utara.

(22) 7. Gambar 2.1 Kordinat Citra Digital (Gonzalez, 2003). Teknologi dasar untuk menciptakan dan menampilkan warna pada citra digital berdasarkan pada penelitian bahwa sebuah warna merupakan kombinasi dari tiga warna dasar, yaitu merah, hijau,dan biru (Red, Green, Blue-RGB) (Sutoyo, 2010). RGB adalah suatu model warna yang terdiri dari merah, hijau, dan biru, digabungkan dalam membentuk suatu susunan warna yang luas. Setiap warna dasar, misalnya merah, dapat diberi rentang-nilai. Untuk monitor komputer, nilai rentangnya paling kecil = 0 dan paling besar = 255. Pilihan skala 256 ini didasarkan pada cara mengungkap 8 digit bilangan biner yang digunakan oleh mesin komputer. Dengan cara ini, akan diperoleh warna campuran sebanyak 256 x 256 x 256 = 1677726 jenis warna. Sebuah jenis warna, dapat dibayangkan sebagai sebuah vektor di ruang 3 dimensi yang biasanya dipakai dalam matematika, koordinatnya dinyatakan dalam bentuk tiga bilangan, yaitu komponen-x, komponen-y dan komponen-z. Misalkan sebuah vektor dituliskan sebagai r = (x,y,z). Untuk warna, komponen-komponen tersebut digantikan oleh komponen R(ed), G(reen), B(lue). Jadi, sebuah jenis warna dapat dituliskan sebagai berikut: warna = RGB (30, 75, 255). Putih = RGB (255,255,255), sedangkan untuk hitam = RGB (0,0,0) (Gonzalez, 2003).. Universitas Sumatera Utara.

(23) 8. 2.2.1 Representasi Warna Digital Warna digital adalah kombinasi dari tiga warna primer yaitu merah, hijau, dan biru (RGB) (Gonzalez, 2003). Setiap warna dapat dispesifikasikan sebagai triplet nilai intensitas RGB, dengan setiap intensitas berkisar antara 0 sampai 255, yaitu: : RGB (255, 0, 0). ……….………….………..………………….……(2.1). Green : RGB (0, 255, 0). .………………….……………………….…….… (2.2). Blue. …..…………………………………………….…. (2.3). Red. : RGB (0, 0, 255). Dari nilai triplet RGB persamaan (2.1) sampai (2.3) di atas dapat dikonversikan ke dalam nilai desimal seperti dibawah ini:. Red. : 255*2560 + 0*2561 + 0*2562 = 255 + 0 + 0 = 255 ………..………....… (2.4). Green : 0*2560 + 255*2561 + 0*2562 = 0 + 65,280 + 0 = 65,280 ………….…… (2.5) Blue. : 0*2560 + 0*2561 + 255*2562 = 0 + 0 + 16,711,680 = 16,711,680 …..… (2.6). Rumus dasar mencari nilai RGB citra adalah: R = COLOR And RGB(255, 0, 0). ….……….……………………………...…. (2.7). G = (COLOR And RGB(0, 255, 0)) / 256 .……….……………………........… (2.8) B = ((COLOR And RGB(0, 0, 255)) / 256) / 256 ….……….……………….… (2.9) Dari persamaan (2.4) sampai (2.6). diatas, rumus RGB pada persamaan (2.7). sampai (2.9) menjadi: Nilai R = c and 255. ………………………………................................ (2.10). Nilai G = (c and 65,280)/256 ..…………...………………….….…….…..….. (2.11) Nilai B = ((c and 16,711,680)/256)/256. ……………….....……….………...... (2.12). 2.2.2 Format Citra Bitmap Pada format bitmap, citra disimpan sebagai suatu matriks di mana masing – masing elemennya digunakan untuk menyimpan informasi warna untuk setiap piksel. Jumlah warna yang dapat disimpan ditentukan dengan satuan bit-per-piksel. Semakin besar ukuran bit-per-piksel dari suatu bitmap, semakin banyak pula jumlah warna yang dapat disimpan. Format bitmap ini cocok digunakan untuk menyimpan citra digital yang memiliki banyak variasi dalam bentuknya maupun warnanya, seperti foto,. Universitas Sumatera Utara.

(24) 9. lukisan, dan frame video. Format file yang menggunakan format bitmap ini antara lain adalah BMP, DIB, PCX, GIF, dan JPG. Format yang menjadi standar dalam system operasi Microsoft Windows adalah format bitmap BMP atau DIB. Karakteristik lain dari bitmap yang juga penting adalah jumlah warna yang dapat disimpan dalam bitmap tersebut. Ini ditentukan oleh banyaknya bit yang digunakan untuk menyimpan setiap titik dari bitmap yang menggunakan satuan bpp (bit per piksel). Dalam Windows dikenal bitmap dengan 1, 4, 8, 16, dan 24 bit per piksel. Jumlah warna maksimum yang dapat disimpan dalam suatu bitmap adalah sebanyak n. 2 , dimana n adalah banyaknya bit yang digunakan untuk menyimpan satu titik dari bitmap. Berikut ini tabel yang menunjukkan hubungan antara banyaknya bit per piksel dengan jumlah warna maksimum yang dapat disimpan dalam bitmap, dapat dilihat pada Tabel 2.1.. Tabel 2.1 Hubungan antara bit per piksel dengan jumlah warna maksimum pada bitmap No Jumlah bit per piksel. 2.2.3. Maksimum Warna. 1. 1. 2. 2. 4. 16. 3. 8. 256. 4. 16. 65536. 5. 24. 16777216. Citra Format PNG (Portable Network Graphics). Citra berformat PNG dikembangkan sebagai alternatif lain untuk GIF, yang menggunakan paten dari LZW–algoritma kompresi. PNG adalah format citra yang sangat baik untuk grafis internet, karena mendukung transparansi didalam perambah (browser) dan memiliki keindahan tersendiri yang tidak bisa diberikan GIF atau bahkan JPG. Format PNG menggunakan teknik kompresi Loseless dan mendukung kedalaman warna 48 bit dengan tingkat ketelitian sampling: 1,2,4,8, dan 16 bit. Format ini memiliki alpha channel untuk mengkontrol transparency.. Universitas Sumatera Utara.

(25) 10. 2.3 Algoritma Support Vector Machine (SVM) Support Vector Machine (SVM) dikembangkan oleh Boser, Guyon, dan Vapnik, pertama kali diperkenalkan pada tahun 1992 di Annual Workshop on Computational Learning Theory. Konsep dasar metode SVM sebenarnya merupakan gabungan atau kombinasi dari teori-teori komputasi yang telah ada pada tahun sebelumnya, seperti kernel diperkenalkan oleh Aronszajn tahun 1950, Lagrange Multiplier yang ditemukan oleh Joseph Louis Lagrange pada tahun 1766, dan demikian juga dengan konsepkonsep pendukung lain. Konsep SVM dapat dijelaskan secara sederhana sebagai usaha mencari pemisah dua buah kelas pada input space (Listiana, E. & Much, A. M. 2017). SVM merupakan salah satu metode unggulan dibidang pattern recognition, sebagai algoritma yang terhitung masih baru (1992), SVM berkembang pesat karena berprinsip Structural Risk Minimization (SRM) dengan tujuan menemukan hyperplane terbaik untuk memisahkan dua buah kelas pada suatu space sehingga algoritma ini cocok untuk diimplementasikan sebagai clasificator. Berbeda dengan strategi neural network yang berusaha mencari hyperplane pemisah antar class, SVM berusaha menemukan hyperplane yang terbaik pada input space. Prinsip dasar SVM adalah linear classifier, dan selanjutnya dikembangkan agar dapat bekerja pada problem nonlinear. dengan memasukkan konsep kernel trick pada ruang kerja berdimensi tinggi . Konsep. SVM. adalah. mendesain. sebuah. hyperplane. yang. dapat. mengklasifikasikan seluruh data training menjadi dua buah kelas, pada Gambar 2.1 memperlihatkan beberapa pattern yang merupakan anggota dari dua buah class yang berbentuk lingkaran dan kotak. Berbagai alternatif garis pemisah (discrimination boundaries) ditunjukkan pada Gambar 2.2.. Universitas Sumatera Utara.

(26) 11. Gambar 2.2 Hyperplane Mengklasifikasikan Data Menjadi Dua Kelas (Listiana, E. & Much, A. M. 2017). Hyperplane terbaik antara kedua class dapat ditemukan dengan cara mengukur margin hyperplane tersebut dan mencari titik maksimalnya. Margin adalah jarak antara hyperplane dengan pattern terdekat dari masing-masing kelas, seperti yang terlihat pada Gambar 2.3 Pattern yang paling dekat ini disebut sebagai Support Vector.. Gambar 2.3 Support Vector, Jarak Terdekat Dengan Masing-Masing Kelas (Listiana, E. & Much, A. M. 2017). Universitas Sumatera Utara.

(27) 12. Pattern yang merupakan anggota dari dua buah kelas: +1 dan -1 dan berbagi alternatif garis pemisah (discrimination boundaries). Margin adalah jarak antara pemisah tersebut dengan pattern terdekat dari masing-masing kelas. Pattern yang memiliki jarak paling dekat disebut sebagai support vector. Dalam menyelesaikan permasalahan linear diasumsikan terdapat data latih {𝑥𝑖 , 𝑦𝑖 } , 𝑥𝑖 merupakan atribut untuk data latih {𝑥1, … , 𝑥𝑛 } dan 𝑦𝑖 ∈ {−1,1} adalah label kelas dari data latih 𝑥𝑖. Bidang pemisah yang baik tidak hanya bisa memisahkan data tetapi juga memiliki margin yang besar atau maksimal, data yang berada dekat dan diatas bidang pemisah. Apabila terdapat dua kelas yang dipisahkan oleh dua bidang pembatas secara sejajar yaitu kelas +1 dan kelas -1. Bidang pembatas dinyatakan dengan H. H1 dinyatakan sebagai bidang pembatas pada kelas +1 dan H2 dinyatakan sebagai bidang pembatas kelas -1, yang dinyatakan dengan persamaan 2.1 dan 2.2 sebagai berikut: 𝑤. 𝑥𝑖 + 𝑏 ≥ +1 𝑓𝑜𝑟 𝑦𝑖 = +1 ………………………………………………..…….. (2.13) 𝑤. 𝑥𝑖 + 𝑏 ≥ −1 𝑓𝑜𝑟 𝑦𝑖 = −1 ………………………………………………………. (2.14) Keterangan : 𝑥𝑖 : Data ke-i, i = 1, 2, 3, … , n 𝑤𝑖 : Bobot support vector 𝑏 : Nilai bias 𝑦𝑖 : Kelas dataset Sehingga didapatkan persamaan 2.3 sebagai berikut: 𝑦𝑖 (𝑥𝑖 . 𝑤 + 𝑏) ≥ 1 …………………………………………………………………. (2.15) Jika titik terpisah secara linear fungsi untuk permukaan ini ditentukan dengan persamaan 2.4 sebagai berikut: f(x) =(∑𝑛𝑖=1 ∝∗𝑖 yi (xi.x)+b*). (xi,yi) €Rn x{-1,1}. …………………………..… (2.16). Keterangan : 𝛼𝑖 ∗ : Lagrange Multiplier 𝑏∗ : Bias Jika kelas tidak terpisah secara linear maka fungsi untuk permukaan ditentukan oleh persamaan 2.5 sebagai berikut: f(x) =(∑𝑛𝑖=1 ∝∗𝑖 yik (x.x)+b*) ………………………………………………….. (2.17). Universitas Sumatera Utara.

(28) 13. Keterangan : 𝛼𝑖 ∗ : Lagrange Multiplier 𝑏∗ : Bias 𝑘(𝑥, 𝑦) : Fungsi Kernel Terdapat beberapa fungsi kernel yang digunakan untuk menyelesaikan masalah pada VM non linear dapat dilihat pada persamaan 2.18 hingga 2.20 berikut ini: a. Fungsi Kernel Linear 𝑘(𝑥, 𝑦) = 𝑥. 𝑦 ……………………………………………………….……(2.18) b. Fungsi Kernel Polinomial 𝑘(𝑥, 𝑦) = (1 + 𝑥. 𝑦)𝑞, 𝑞 = 1,2, … , 𝑁 …………………………….…....…(2.19) c. Fungsi Kernel Radial Basis 𝑘(𝑥, 𝑦) = 𝑒𝑥𝑝. (−||x − y||2) 2σq. …………………………………………….. (2.20). 2.3.1 Metode Sequential Training SVM Metode Sequential Training merupakan metode yang digunakan untuk training data agar menghasilkan hyperlane yang optimal. Metode ini digunakan juga untuk mendapatkan nilai α. Metode ini dikembangkan oleh Vijayakumar dan memiliki langkah proses seperti berikut: a. Melakukan perhitungan kernel dan melakukan inisialisasi parameter-parameter SVM seperti contoh nilai αi = 0; ε = 0,001; γ = 0,01; λ = 1; C = 1; dan nilai iterasi maksimal = 10; b. Menghitung matriks Hessian dengan persamaan 2.21. 𝐷𝑖𝑗 = 𝑦𝑖𝑦𝑗 (𝐾(𝑥𝑖 , 𝑥𝑗 ) + λ2) …………………………………………….. (2.21) c. Melakukan iterasi untuk setiap iterasi = 1, 2, 3, … , n dan dihitung menggunakan persamaan 2.10 hingga 2.13. - Menghitung nilai Ei menggunakan persamaan 2.22. Ei= ∑𝑛𝑗=1 ∝𝑖 ∗ 𝐷ij …………………………………..……………..….… (2.22) - Menghitung nilai γ dan δαi menggunakan persamaan 2.23 dan 2.24. 𝐾𝑜𝑛𝑠𝑡𝑎𝑛𝑡𝑎. ɤ=. 𝑚𝑎𝑥𝐷𝑖𝑖. ………………………………………………..……….. (2.23). δα𝑖 = min[max[𝛾(1 − 𝐸𝑖 ), 𝛼𝑖 ] , 𝐶 − 𝛼𝑖 ] …………………………….. (2.24) - Memperbarui nilai αi menggunakan persamaan 2.25.. Universitas Sumatera Utara.

(29) 14. 𝛼𝑖 = 𝛼𝑖 + 𝛿𝛼 …………………………………………………….…….. (2.25) Keterangan: 𝐸𝑖 : Nilai Error 𝐷𝑖𝑗 : Nilai Matriks Hessian γ : Gamma δα𝑖 : Delta alpha i 𝐶 : Complexity d. Proses 1, 2, dan 3 diulangi hingga nilai δαi mencapai konvergen (|δα|<ε) dan atau ketika nilai iterasi sudah mencapai nilai maksimum maka iterasi dihentikan. e. Menghitung nilai w.x+ dan w.x- untuk mendapatkan nilai bias menggunakan persamaan 2.26 hingga 2.27. 𝑤. 𝑥+ = 𝛼𝑖 . 𝑦𝑖 . 𝐾(𝑥, 𝑥+) ……………………………………………… (2.26) 𝑤. 𝑥− = 𝛼𝑖 . 𝑦𝑖 . 𝐾(𝑥, 𝑥−) …………………………………………….… (2.27) 1. b= -2 (𝑤. 𝑥 + 𝑤. 𝑥 −) …………………………………………….….… (2.28) Keterangan: 𝐾(𝑥, 𝑥+) : Nilai kernel data x dengan data x kelas positif yang memiliki nilai α tertinggi. 𝐾(𝑥, 𝑥−) : Nilai kernel data x dengan data x kelas negatif yang memiliki nilai α tertinggi dan 𝑏 : Nilai bias.. 2.3.2 SVM Non Linear Dalam SVM terdapat SVM linear dan SVM non linear (kernel trick). SVM sebenarnya hanya bekerja pada data yang dapat dipisahkan secara linear. Untuk data yang tidak linear dapat menggunakan metode kernel pada fitur data awal set data. Kernel adalah suatu fungsi yang memetakan fitur data dari dimensi rendah ke fitur baru dengan dimensi yang relatif lebih tinggi seperti diilustrasikan dalam Gambar 2.4 (Prayoginingsih, S. & Kusumawardani, R. P. 2018):. Universitas Sumatera Utara.

(30) 15. Gambar 2.4 Dimensi Data (Prayoginingsih, S. & Kusumawardani, R. P. 2018) Algoritma pemetaan kernel dijelaskan sebagai berikut :. ………………………………….…….… (2.29). merupakan fungsi kernel yang digunakan untuk pemetaan, D merupakan data latih, r merupakan set fitur dalam satu data yang lama, q merupakan set fitur yang baru sebagai hasil pemetaan untuk setiap data latih. Sementara x merupakan data latih, dengan x1, x2, …. xN.. Dr merupakan fitur-fitur yang akan dipetakan ke fitur. berdimensi tinggi q. Jadi set data yang digunakan sebagai pelatihan dengan algoritma adalah himpunan data dari dimensi fitur yang lama r ke dimensi bari q. Misalnya untuk contoh data N sebagai berikut: (Φ (x1),y1, Φ(x2),y2,Φ (xN),yN) ɛ Dq ….………………………….………….… (2.30) Proses pemetaan pada fase ini memerlukan perhitungan perkalian titik dua buah data pada ruang fitur baru. perkalian titik kedua buah vektor (x1) dan (xj) dinotasikan sebagai Φ(x1). Φ (xj), Nilai dotproduct kedua buah vektor ini dapat dihitung secara tidak langsung, yaitu tanpa mengetahui fungsi transformasi Φ. Teknik komputasi seperti ini disebut kernel trick, yaitu menghitung dot-product dua buah vektor di ruang dimensi baru dengan memakai komponen kedua buah vektor tersebut di ruang dimensi asal sebagai berikut: K (x1,y1) = Φ (x1). Φ (xj) …………….………………….………………….…… (2.31) Dan untuk prediksi pada set data dengan dimensi fitur yang baru diformulasikan sebagai berikut: ∗ f(Xd) =(∑𝑛𝑠𝑣 𝑖=1 ∝𝑖 yi K (xi.x)+b) …..……………………..……………………… (2.32). Nsv adalah jumlah data yang menjadi support vector, xi adalah support vector, dan xd adalah data uji yang akan dilakukan prediksi.. Universitas Sumatera Utara.

(31) 16. 2.4. Metode Klasifikasi K-Nearest Neighbor (K-NN). K-NN merupakan salah satu algoritma pembelajaran mesin sederhana. Hal ini hanya didasarkan pada gagasan bahwa suatu objek yang 'dekat' satu sama lain juga akan memiliki karakteristik yang mirip. Ini berarti jika kita mengetahui ciri-ciri dari salah satu objek, maka kita juga dapat memprediksi objek lain berdasarkan tetangga terdekatnya. K-NN adalah improvisasi lanjutan dari teknik klasifikasi Nearest Neighbor. Hal ini didasarkan pada gagasan bahwa setiap contoh baru dapat diklasifikasikan oleh suara mayoritas dari k tetangga, dimana k adalah bilangan bulat positif, dan biasanya dengan jumlah kecil (Fatoni et al. 2018). Algoritma klasifikasi K-NN memprediksi kategori tes sampel sesuai dengan sampel pelatihan k yang merupakan tetangga terdekat dengan sampel uji, dan memasukkan ke dalam kategori yang memiliki kategori probabilitas terbesar. Dalam pengenalan. pola,. algoritma. KNN. adalah. metode. yang. digunakan. untuk. mengklasifikasikan objek berdasarkan contoh pelatihan terdekat di ruang fitur. KNN adalah jenis insctance-based learning, atau lazy learning dimana fungsi ini hanya didekati secara lokal dan semua perhitungan ditangguhkan sampai klasifikasi.. Metode klasifikasi K-NN memiliki beberapa tahap yaitu (Karyono, G. 2016): a. Tahap pertama, nilai k yang merupakan jumlah tetangga terdekat yang akan menentukan kueri baru masuk ke kelas mana ditentukan. b. Tahap kedua, k tetangga terdekat dicari dengan cara menghitung jarak titik kueri dengan titik training. c. Tahap ketiga, setelah mengetahui jarak masing-masing titik training dengan titik kueri, kemudian lihat nilai yang paling kecil. d. Tahap keempat ambil k nilai terkecil selanjutnya lihat kelasnya. Kelas yang paling banyak merupakan kelas dari kueri baru. Dekat atau jauhnya jarak titik dengan tetangganya bisa dihitung dengan menggunakan Euclidean distance. Euclidean distance direpresentasikan sebagai berikut: 𝑘. j(a,b) = √∑𝑎𝑛𝑘 (𝑎𝑘 − 𝑏𝑘 )2 ……………………………………………… (2.33). J(a,b) merupakan jarak antara titik a yang merupakan titik yang telah diketahui kelasnya dan b berupa titik baru. Jarak antara titik baru dengan titik-titik training. Universitas Sumatera Utara.

(32) 17. dihitung dan diambil k buah titik terdekat. Titik baru diprediksi masuk ke kelas dengan klasifikasi terbanyak dari titik-titik tersebut.. 2.5 Ekstraksi Fitur Ekstraksi fitur adalah proses pengukuran terhadap data yang telah dinormalisasi untuk membentuk sebuah nilai fitur. Nilai fitur digunakan oleh pengklasifikasi untuk mengenali. unit. masukan. dengan. unit. target. keluaran. dan. memudahkan. pengklasifikasian karena nilai ini mudah untuk dibedakan (Princye, P. H. & Vijayakumari, V. 2018). Pada penelitian ini , penulis menggunakan metode ekstraksi zoning.. 2.5.1 Ekstraksi Ciri Zoning Zoning adalah salah satu ekstraksi fitur yang paling popular dan sederhana untuk diimplementasikan (Hussain, E., Hannan, A. & Kashyap, K. 2015). Sistem optical character recognition (OCR) komersil yang dikembangkan oleh CALERA menggunakan metode zoning pada citra biner. Setiap citra dibagi menjadi NxM zona dan dari setiap zona tersebut dihitung nilai fitur sehingga didapatkan fitur dengan panjang NxM. Salah satu cara menghitung nilai fitur setiap zona adalah dengan menghitung jumlah piksel hitam setiap zona dan membaginya dengan jumlah piksel hitam terbanyak pada yang terdapat pada salah satu zona. Contoh pembagian 3 zona pada citra biner dapat dilihat pada Gambar 2.5.. Gambar 2.5 Pembagian zona pada citra biner (Hussain et al, 2015). Universitas Sumatera Utara.

(33) 18. Ada beberapa algoritma untuk metode ekstraksi ciri zoning, di antaranya metode ekstraksi ciri jarak metrik ICZ (image centroid and zone), metode ekstraksi ciri jarak metrik ZCZ (zone centroid and zone). Kedua algoritma tersebut menggunakan citra digital sebagai input dan menghasilkan fitur untuk klasifikasi dan pengenalan sebagai output-nya (Budianto, A. 2018). Berikut merupakan tahapan dalam proses ekstraksi ciri ICZ dan ZCZ. Algoritma Image Centroid and Zone (ICZ) berdasarkan jarak matriks dengan langkah-langkah sebagai berikut:. 1. Hitung centroid dari citra masukan. 2. Bagi citra masukan ke dalam n zona yang sama. 3. Hitung jarak antara centroid citra dengan masing-masing piksel yang ada dalam zona. 4. Ulangi langkah ke 3 untuk setiap piksel yang ada di zona. 5. Hitung rata-rata jarak antara titik-titik tersebut. 6. Ulangi langkah-langkah tersebut untuk keseluruhan zona. 7. Hasilnya adalah n fitur yang akan digunakan dalam klasifikasi dan pengenalan.. Algoritma Zone Centroid Zone (ZCZ) berdasarkan jarak matriks dengan langkahlangkah sebagai berikut: 1. Bagi citra masukan ke dalam sejumlah n bagian yang sama. 2. Hitung centroid dari masing-masing zona. 3. Hitung jarak antara centroid masing-masing zona dan piksel yang ada di zona. 4. Ulangi langkah ke 3 untuk seluruh piksel yang ada di zona. 5. Hitung rata-rata jarak antara titik-titik tersebut. 6. Ulangi langkah 3-7 untuk setiap zona secara berurutan. 7. Hasilnya adalah n fitur yang akan digunakan dalam klasifikasi dan pengenalan.. Pada algoritma Image Centroid and Zone, centroid (pusat) dari citra dari citra dinyatakan dengan nilai koordinat titik (Xc ) dengan persamaan 2.34.. Xc =. ∑𝑥 𝑖=1 𝑓(𝑥,𝑦)𝑥𝑖 ∑ 𝑓(𝑥,𝑦). ………………………………………………………… (2.34). Universitas Sumatera Utara.

(34) 19. Nilai Yc dengan persamaan 2.35.. Yc = 2.6. ∑𝑦 𝑖=1 𝑓(𝑥,𝑦)𝑦𝑖 ∑ 𝑓(𝑥,𝑦). ……………………………………………….………… (2.35). Penyakit Mata Katarak. Katarak merupakan penyakit mata yang ditandai dengan mengeruhnya lensa mata, sehingga membuat penglihatan kabur. Kondisi ini umumnya terjadi pada lansia, dan bisa terjadi pada salah satu atau kedua mata sekaligus. Meski demikian, katarak bukan jenis penyakit menular. Lensa mata adalah bagian transparan di belakang pupil (titik hitam di tengah mata), yang berfungsi untuk memfokuskan cahaya yang masuk melalui mata ke retina agar objek dapat terlihat jelas. Seiring bertambahnya usia, protein pada lensa akan menggumpal dan perlahan-lahan membuat lensa keruh dan berkabut. Hal ini menyebabkan penglihatan menjadi kabur dan tidak jelas (Aini, A. N & Santik, D. Y. P. 2018). Katarak adalah penyebab utama kebutaan di Indonesia. Dari hasil survey kebutaan di 15 provinsi tahun 2014-2016, diketahui 70-80% penyebab utama kebutaan dan gangguan penglihatan di Indonesia adalah katarak.. 2.6.1 Gejala Katarak pada Lansia Katarak umumnya berkembang secara perlahan. Awalnya, penderita tidak akan menyadari ada gangguan penglihatan, karena hanya sebagian kecil lensa mata yang mengalami katarak. Namun seiring waktu, katarak akan memburuk dan memunculkan sejumlah gejala berikut: a. Pandangan samar dan berkabut. b. Mata semakin sensitif saat melihat cahaya yang menyilaukan. c. Melihat lingkaran cahaya di sekeliling sumber cahaya. d. Sulit melihat dengan jelas saat malam hari. e. Warna terlihat pudar atau tidak cerah. f. Objek terlihat ganda. g. Ukuran lensa kacamata yang sering berubah. Meski umumnya katarak tidak menyebabkan rasa sakit pada mata, namun penderita bisa merasakan nyeri pada mata, terutama jika katarak yang dialami sudah. Universitas Sumatera Utara.

(35) 20. parah, atau penderita memiliki gangguan lain pada mata. Proses mengeruhnya lensa saat mengalami penuaan belum diketahui dengan jelas. Meski demikian, ada beberapa faktor yang dapat meningkatkan risiko seseorang terkena katarak, antara lain: a. Mata yang terlalu sering terpapar sinar matahari. b. Penyakit tertentu, misalnya diabetes, kerusakan retina yang diturunkan (retinitis pigmentosa), atau radang pada lapisan tengah mata (uveitis). c. Konsumsi kortikosteroid dalam jangka panjang. d. Pernah menjalani operasi mata. e. Pernah mengalami cedera pada mata. f. Memiliki keluarga dengan riwayat katarak. g. Pola makan yang tidak sehat dan kekurangan h. Konsumsi minuman beralkohol dalam jumlah banyak secara rutin. i.. Merokok. Untuk memperoleh diagnosis katarak, dokter mata akan menanyakan riwayat. penyakit dan gejala apa saja yang dialami pasien. Kemudian, dokter akan melakukan pemeriksaan pada mata pasien, diikuti dengan pemeriksaan penunjang seperti tes ketajaman penglihatan. Dalam tes ini pasien akan diminta membaca huruf dalam jarak 6 meter menggunakan satu mata, di mana di saat yang sama mata yang lain akan ditutup. Huruf yang ditampilkan akan semakin mengecil, hingga pasien tidak bisa membacanya dengan jelas. Pemeriksaan slit lamp (lampu celah). Pemeriksaan slit lamp menggunakan mikroskop khusus yang dilengkapi cahaya untuk menerangi lensa, iris, dan kornea mata. Cahaya ini akan membantu dokter melihat kelainan pada mata dengan lebih jelas. Pemeriksaan retina mata. Dilakukan dengan memberikan obat tetes mata untuk membuat pupil membesar. Dengan bantuan alat khusus bernama oftalmoskop, dokter akan lebih mudah melihat kondisi retina. Operasi katarak merupakan satu-satunya penanganan katarak pada lansia. Namun keputusan untuk menjalani operasi mempertimbangkan terganggunya aktivitas seharihari atau tidak, seperti menyetir kendaraan atau membaca. Dalam operasi katarak, lensa yang keruh akan diangkat dan diganti dengan lensa tiruan. Lensa tiruan ini terbuat dari plastik atau silikon, dan dapat digunakan untuk seumur hidup. Sedangkan pada kondisi di mana lensa tiruan tidak bisa dipasang, pasien harus mengenakan kacamata atau lensa kontak pasca operasi katarak untuk memperbaiki penglihatan.. Universitas Sumatera Utara.

(36) 21. Operasi katarak dilakukan dengan bius lokal agar mata menjadi mati rasa, dan biasanya tanpa rawat inap. Rasa tidak nyaman di mata umumnya dirasakan hingga beberapa hari pasca operasi. Pada pasien dengan katarak di kedua mata, operasi dilakukan secara terpisah hingga pasien sembuh dari operasi pertama, yaitu sekitar 612 minggu. Operasi katarak merupakan operasi yang aman dilakukan. Namun, tetap ada risiko terjadinya perdarahan dan infeksi pasca operasi katarak, walaupun jarang. Risiko lain yang mungkin terjadi setelah operasi adalah ablasi retina, yaitu kondisi lepasnya retina dari posisi normalnya. Kondisi tersebut bisa mengakibatkan hilang penglihatan sebagian atau seluruhnya. Segera hubungi dokter bila muncul gejala ablasi retina seperti munculnya bintik hitam yang tampak melayang pada penglihatan (floaters) pasca operasi katarak.. 2.6.2 Diabetic Retinopathy Retinopati Diabetik adalah penyakit mata yang diakibatkan oleh diabetes. Retinopati adalah kondisi yang mempengaruhi kerja retina mata, yang merupakan lapisan syaraf yang berada di bagian belakang mata dan yang menangkap gambar yang dilihat mata dan mengirimkan informasinya ke otak agar dapat diterjemahkan oleh otak. Retinopati Diabetik pada awalnya menyebabkan pandangan mengabur dan dapat berkembang menjadi kebutaan jika tidak diobati. Penyakit ini juga dapat menyebabkan pembengkakan makula bagian tengah retina yang berfungsi untuk memproses penglihatan lebih rinci di mana penyakit ini lebih dikenal dengan nama edema makula, yang makin memperburuk pandangan bagi penderita diabetes (Biram et al. 2016). 1.. Penyebab Retinopati Diabetik Retinopati Diabetik pada umumnya disebabkan oleh diabetes. Pada prinsipnya,. retina mata perlu dialiri darah secara teratur agar dapat bekerja dengan baik. Diabetes sendiri adalah kondisi yang menyebabkan kelainan pada kemampuan tubuh dalam menyimpan dan memproses gula dalam tubuh, terutama yang akan digunakan dalam darah. Orang yang menderita diabetes pada umumnya memiliki kadar gula yang tinggi. Karenanya, pengaliran darah yang berkadar gula tinggi dapat menyebabkan kerusakan penglihatan dalam dua cara:. Universitas Sumatera Utara.

(37) 22. a. Penyempitan pembuluh darah di mata, yang dapat mengakibatkan kebocoran atau terjadi pendarahan, dan penimbunan cairan dan materi berlemak dalam retina, yang dapat menyebabkan terjadinya kondisi edema makula, yang akan menyebabkan penglihatan yang kabur. b. Kerusakan yang mungkin terjadi pada pembuluh darah dekat area retina mata akan menyebabkan tubuh secara alami merangsang pertumbuhan pembuluh darah yang baru yang lebih lemah; kondisi yang biasa disebut neovascularization. Jika pembuluh darah tumbuh di sekitar area pupil, glaukoma bisa muncul karena adanya tekanan tambahan dalam mata. Pembuluh darah yang baru ini sangat lemah dan rentan terhadap akan terjadinya pendarahan dan dapat menyebabkan bekas luka, yang dapat menyebabkan retina lepas dari bagian belakang mata. Jika dibiarkan, lepasnya retina ini dapat menyebabkan kerusakan penglihatan yang parah dan juga kebutaan.. Gambar 2.6 Citra Retina Normal dan Sakit (Biran et al, 2016) Tidak semua penderita diabetes dapat menjangkit Retinopati diabetis. Namun, pasien diabetes yang tidak dirawat dengan baik memiliki kemungkinan 25 kali lebih besar dalam menderita penurunan kemampuan penglihatan dibandingkan orang biasa. Para penderita diabetes juga memiliki tekanan darah tinggi dan dengan tingkat kolesterol yang tinggi, sehingga mempunyai risiko lebih besar menderita Retinopati. Ditambah, semakin lama seseorang menderita diabetes, kemungkinan untuk menderita Retinopati juga menjadi lebih besar. Perawatan yang tepat dan teratur dapat mengurangi kemungkinan penderita Retinopati dan risiko masalah penglihatan serius yang permanen.. Universitas Sumatera Utara.

(38) 23. 2.. Tanda dan Gejala dari Retinopati Diabetik. Pada tahap awal, Retinopati biasanya tidak memunculkan gejala yang terlihat. Tanda adanya kerusakan pada retina biasanya baru dapat diketahui pada tahap lanjutan, saat pasien sudah menderita penurunan kemampuan penglihatan yang biasanya sudah tidak dapat diobati lagi. Gejala dari tahapan penyakit Retinopati diabetik ini termasuk: a. Penglihatan yang kabur. b. Sulit melihat saat malam. c. Munculnya benang tipis atau tikit dalam penglihatan (floaters). d. Penglihatan yang berubah-ubah. e. Ketidakmampuan untuk melihat warna dengan benar. f. Titik gelap atau lubang dalam pandangan. g. Kehilangan kemampuan penglihatan (dalam tahap lanjutan). Retinopati diabetes adalah suatu mikroangiopati progresif yang ditandai oleh kerusakan dan sumbatan pada pembuluh darah halus retina. Kelainan patologik yang paling dini adalah penebalan membran basal endotel kapiler dan penurunan jumlah perisit. Secara umum klasifikasi retinopati diabetes dibagi menjadi 2, yaitu NonProliferatif Diabetic Retinopathy (NPDR) dan Preproliferatif Diabetic Retinopathy (PDR). NPDR adalah stage awal dari diabetes retinopati, pada stage ini, pembulu darah kecil pada retina mengalami pendarahan atau bocor, cairan yang bocor ini menyebabkan retina membengkak dan membentuk gumpalan-gumpalan atau exudate. Ada tiga klasifikasi dari NPDR seperti yang diperlihatkan pada Gambar 2.9 yaitu: a) Mild NPDR : Paling tidak terdapat satu mikroaneurisma dan pendarahan karena pembulu darah pada retina pecah. Pada tahap ini pasien disarankan menemui dokter mata secara rutin sekurang-kurangnya 1 kali setahun. b) Moderate NPDR : Hemorrhages dan mikroaneurisma berada paling tidak di satu kuadran yang sama. Jumlah mikroaneurisma semakin banyak, lebih banyak dibandingkan dengan Mild NPDR. c) Severe NPDR : Jika mikroanerisma dan intraretinal hemorrhages semuanya berada diempat kuadran yang sama.. Universitas Sumatera Utara.

(39) 24. Gambar 2.7 Citra Retina (a) Mild NPDR (b) Moderate NPDR (c) Severe NPDR (Biran et al, 2016). Pada penelitian ini, tipe non-proliferatif ditandai dengan munculnya: a.. Mikroaneurisma Mikroaneurisma adalah penonjolan dinding kapiler berbentuk gelembung, disebabkan oleh kelemahan dinding kapiler, sebagai akibat dari hilangnya sel perisit. Ukuran mikroaneurisma berkisar antara 12-100μ, terdapat disisi kapiler berwarna kekuningan.. b.. Exudate Exudate atau lemak protein dibagi menjadi dua, yaitu: 1. Hard Exudate, berwarna kuning karena eksudasi plasma yang lama. Pada angiografi fluoresin tampak sebagai kebocoran flouresin diluar pembuluh darah. Terutama terdiri dari lipid yang didapatkan pada hiperlipoproteinemia. 2. Cotton Wool Patch, berwarna putih, tidak berbatas tegas yang dihubungkan dengan iskemik retina.. 2.7. Penelitian Terkait. Beberapa penelitian yang berhubungan algoritma Support Vector Machine (SVM) dan K-Nearest Neighbor (K-NN) dapat dilihat seperti pada Tabel 2.2.. Universitas Sumatera Utara.

(40) 25. Tabel 2.2 Penelitian Terkait Tahun. Peneliti/Tahun. Metode Yang Digunakan Support Vector Machine (SVM).. Keterangan (Hasil). 2018. Putranto, T. G. A. & Candradewi, I. 2018. 2018. Retina, Erwin, Noviyanti, D. S., Nurjanah, L. A. & Yurika. 2018. Klasifikasi Penyakit Diabetik Retinopathy dengan. Metode Naïve Bayes. Chaudhari, V. V. & Salunkhe, P. 2017. Diabetic Retinopathy Classification using SVM Classifier. SVM Classifier. Dari data uji sebanyak 15 citra retina didapatkan hasil klasifikasi 5 citra Normal, 6 citra NPDR, dan 3 citra PDR. Dengan metode Naïve Bayes mendapatkan akurasi sebesar 93%. Metode Naïve Bayes yang digunakan mendapatkan hasil yang baik dalam pengklasifikasian. Sistem ini dapat digunakan untuk mendeteksi penampilan penyakit dan jika itu terjadi juga dapat mendeteksi sampai sejauh mana keparahannya. Dengan melakukan ini kesehatan pasien dapat. 2017. Hasil klasifikasi menunjukan nilai terbaik dengan menggunakan 6 ciri statistik antara lain, contrast, homogeneity, correlation, energy, entropy dan inverse difference moment pada arah 45 derajat dengan kernel RBF. Hasil penelitian klasifikasi sistem pada 240 data training dan 60 data testing menghasilkan nilai ratarata akurasi sebesar 95,93%, nilai specificity sebesar 97,29%, dan nilai sensitivity sebesar 91,07%. Dilihat dari hasil penelitian, kernel RBF menghasilkan akurasi terbaik jika dibandingkan dengan kernel polynomial atau kernel linear. Universitas Sumatera Utara.

(41) 26. dipantau dan kemajuan serta respons terhadap pengobatan dapat diamati. Sistem ini juga mengurangi biaya dan membuat skrining mata lebih mudah. Universitas Sumatera Utara.

(42) BAB 3 METODOLOGI PENELITIAN. 3.1 Pendahuluan Pada penelitian ini dilakukan klasifikasi penyakit Diabetes Retinopati (DR) berdasarkan Citra Eksudat dan Mikroaneurisma dengan cara mengkombinasikan algoritma Support Vector Machine (SVM) dengan algoritma K-Nearest Neighbor (K-NN) untuk mendapatkan hasil yang lebih optimal. Sebelum dilakukan pelatihan dan pengujian dataset terlebih dahulu dilakukan pengolahan awal citra retina. Langkah-langkah untuk melakukan klasifikasi penyakit Diabetes Retinopati berdasarkan citra eksudat dan mikroaneurisma dengan cara mengkombinasikan algoritma Support Vector Machine (SVM) dengan algoritma K-Nearest Neighbor (K-NN) adalah sebagai berikut: 1.. Deteksi Mikroaneurisma a. Grayscale Pada proses ini yang dilakukan adalah mengubah warna citra input (diambil hanya layer-2 saja dari RGB) ke grayscale untuk mempermudah proses deteksi mikroaneurisma. b. Adaptif Histogram Ekualisasi Adaptif histogram ekualisasi dilakukan untuk memperjelas mikroaneurisma yang berada didekat pembuluh darah. c. Canny Edge Detection Selanjutnya dilakukan deteksi tepi dengan Canny pada citra hasil ekualisasi adaptif histogram, pada proses ini, nilai threshold diatur agar optic disc hilang.. 27 Universitas Sumatera Utara.

(43) 28. d. Filling Proses Filling adalah penebalan pada calon mikroaneurisma kemudian dikurangkan hasilnya dengan citra hasil deteksi tepi sehingga diperoleh citra yang hanya terdapat mikroaneurisma saja. 2.. Deteksi Eksudat Dengan langkah yang sama pada proses deteksi mikroaneurisma, diperoleh citra biner yang hanya terdiri dari eksudat saja.. 3.. Pelatihan citra fundus yang terdiri dari 20 citra dimana masing-masing 10 citra dengan status retina sehat dan retina Diabetic Retinopathy (DR).. 4.. Pendeteksian citra fundus pada proses klasifikasi DR dengan menggunakan algoritma SVM serta Kombinasi SVM-KNN.. Pada penelitian ini, proses percobaan klasifikasi retina Diabetic Retinopathy (DR) dilakukan dengan menggunakan algoritma SVM serta algoritma Kombinasi SVMKNN. Algoritma klasifikasi SVM dibagi menjadi dua proses besar, pertama yaitu proses pelatihan dan proses pengujian. Pada proses klasifikasi pelatihan, variable hyperplane untuk setiap pengklasifikasi (classifier) yang didapat akan disimpan dan nantinya akan digunakan sebagai data tiap pengidentifikasi dalam proses pengujian, dengan kata lain proses identifikasi pelatihan adalah untuk mencari support vector, alpha dan bias dari data input (dalam hal ini digunakan quadratic programming). Algoritma pelatihan untuk masing-masing pengidentifikasian SVM yaitu input berupa matriks Xtrain (matriks hasil ekstraksi fitur pelatihan) dan vektor Ytrain sebagai pasangan input-target dan output-nya adalah w yaitu weight (bobot), xsup adalah koordinat dari support vector, b adalah nilai bias (variabel-variabel persamaan hyperplane). Adapun urutan langkah pada algoritma pelatihan SVM sebagai berikut: 1. Menentukan input (Z= Xtrain) dan Target (Ytrain) sebagai pasangan pelatihan. 2. Data yang menjadi masukan adalah data pelatihan dan inisialisasi parameterparameter SVM. 3. Menghitung kernel RBF, Matriks Hessian dan Max Gamma. 4. Melakukan iterasi untuk tiap data untuk mendapatkan nilai Ei, δα, dan memperbarui nilai αi menggunakan persamaan 2.12 hingga 2.14. 5. Memeriksa nilai | δα | < ε, jika benar iterasi dihentikan atau iterasi sudah mencapai maksimal iterasi dihentikan.. Universitas Sumatera Utara.

(44) 29. 6. Menentukan nilai maksimal alpha kelas positif dan nilai maksimal alpha kelas negatif. Data kelas positif dan data kelas negatif memiliki nilai alpha tertinggi digunakan untuk perhitungan nilai w.x+ dan w.x-. 7. Menghitung nilai kernel antara data pelatihan dengan data kelas positif yang memiliki nilai alpha tertinggi (K(x, x+)) dan data pelatihan dengan data kelas negatif yang memiliki nilai alpha tertinggi (K(x, x-)). 8. Menghitung nilai w.x+ dan w.x- menggunakan persamaan 2.16 dan 2.17. 9. Menghitung nilai bias dengan menggunakan persamaan 2.18. 10. Hasil nilai keluaran adalah nilai bias.. 3.2 Bagan Penelitian Pada penelitian ini dilakukan diagnosa penyakit Diabetes Retinopati menggunakan algoritma SVM dan Kombinasi yang terdiri dari proses Pelatihan dan Pengujian. Adapun secara garis besarnya penelitian ini dapat digambarkan dalam bentuk bagan seperti pada Gambar 3.1.. INPUT Citra Retina. PREPROCESSING IMAGE a.Grayscale b. Adaptif Histogram Ekualisasi c. Deteksi Tepi Canny d. Filling. PELATIHAN SVM/KOMBINASI. PENGUJIAN SVM/KOMBINASI. HASIL KLASIFIKASI SVM/KOMBINASI. KESIMPULAN PENELITIAN Gambar 3.1 Bagan Penelitian. Universitas Sumatera Utara.

(45) 30. Pada awalnya pengguna memasukkan input data sampel berupa citra fundus retina mata. Proses awal yang dilakukan proses preprocessing citra sampel guna mendapatkan hasil identifikasi yang maksimal. Preprocessing yang dilakukan antara lain meliputi konversi citra berwarna mengambil nilai green channel (kanal hijau) dikonversi ke grayscale, adaptif histogram ekualisasi untuk penajaman citra, deteksi tepi citra untuk menghilangkan optic disk, mendeteksi exudates, microaneurysms, nilai entropy dan nilai homogenity. Setelah preprocessing selesai, proses selanjutnya dilakukan pelatihan citra masing-masing algoritma mendapatkan nilai Bias, Alpha dan Sigma yang akan digunakan pada proses Pengujian.. 3.3 Flowchart Algoritma Pelatihan SVM Adapun flowchart algoritma pelatihan SVM dapat dijelaskan sebagai berikut: 1. Data yang menjadi inputan adalah data pelatihan dan inisialisasi parameterparameter SVM. 2. Menghitung kernel RBF, matriks Hessian dan Max Gamma. 3. Melakukan iterasi untuk tiap data untuk mendapatkan nilai Ei, δα, dan memperbarui nilai αi. 4. Memeriksa nilai | δα | < ε, jika benar iterasi dihentikan atau iterasi sudah mencapai maksimal iterasi dihentikan. 5. Menentukan nilai maksimal alpha kelas positif dan nilai maksimal alpha kelas negatif. Data kelas positif dan data kelas negatif memiliki nilai alpha tertinggi digunakan untuk perhitungan nilai w.x+ dan w.x-. 6. Menghitung nilai kernel antara data pelatihan dengan data kelas positif yang memiliki nilai alpha tertinggi (k(x, x+)) dan data pelatihan dengan data kelas negatif yang memiliki nilai alpha tertinggi (K(x, x-)). 7. Menghitung nilai w.x+ dan w.x8. Menghitung nilai bias Adapun flowchart Pelatihan algoritma SVM untuk klasifikasi penyakit Diabetes Retinopati dapat dilihat seperti pada Gambar 3.2.. Universitas Sumatera Utara.

(46) 31. Start. Input Matrix Citra. Inisialisasi Parameter SVM. Menghitung Kernel RBF, Matriks Hessian, Max Gamma. Menghitung Alpha Positif dan Negatif. Menghitung Kernel. Menghitung Bobot + dan Bobot -. Yes. Iterasi < Max Iterasi ? No. Menghitung Bias. Nilai Bias Training. Stop. Gambar 3.2 Flowchart Pelatihan Algoritma SVM. Universitas Sumatera Utara.

(47) 32. 3.4 Flowchart Pengujian Algoritma SVM Adapun flowchart Pengujian Algoritma SVM dapat dijelaskan sebagai berikut: 1. Data yang menjadi inputan adalah matriks citra Pengujian 2. Inisialisasi parameter-parameter SVM. 3. Menghitung kernel RBF, matriks Hessian dan Max Gamma. 4. Melakukan iterasi untuk tiap data untuk mendapatkan nilai Ei, δα, dan memperbarui nilai αi. 5. Memeriksa nilai | δα | < ε, jika benar iterasi dihentikan atau iterasi sudah mencapai maksimal iterasi dihentikan. 6. Menentukan nilai maksimal alpha kelas positif dan nilai maksimal alpha kelas negatif. Data kelas positif dan data kelas negatif memiliki nilai alpha tertinggi digunakan untuk perhitungan nilai w.x+ dan w.x-. 7. Menghitung nilai kernel antara data pelatihan dengan data kelas positif yang memiliki nilai alpha tertinggi (K(x, x+)) dan data pelatihan dengan data kelas negatif yang memiliki nilai alpha tertinggi (K(x, x-)). 8. Menghitung Total Weight. 9. Menghitung Bias Total Weight (Bias Pelatihan + Total Weight) 10. Jika nilai Bias Total Weight < 0 maka Klasifikasi-1, selain itu Klasifikasi+1. Adapun flowchart Pengujian Algoritma SVM untuk klasifikasi penyakit Diabetes Retinopati dapat dilihat seperti pada Gambar 3.3.. Universitas Sumatera Utara.

(48) 33. Start. Input Matrix Citra. Inisialisasi Parameter SVM. Menghitung Kernel RBF, Matriks Hessian, Max Gamma. Menghitung Alpha Positif dan Negatif. Menghitung Kernel. Menghitung Total Weight. Menghitung Bias Total Weight. Ya. Tidak. Bias Total Weight < 0. Klasifikasi=1. Klasifikasi= -1. Hasil Klasifikasi. Stop. Gambar 3.3 Flowchart Algoritma Pengujian SVM. Universitas Sumatera Utara.

(49) 34. 3.5 Flowchart Pelatihan Algoritma Kombinasi SVM-KNN Adapun flowchart Algoritma Pelatihan SVM-KNN dalam melakukan klasifikasi penyakit Diabetes Retinopati dapat dilihat seperti pada Gambar 3.4.. Start. Input Citra Retina. Image Preprocessing. Ekstraksi Ciri ICZ & ZCZ. Menghitung Jarak Piksel Dengan Centroid Zone. Simpan data pelatihan (.dat). Jarak Piksel Dengan Centroid Zone. Stop. Gambar 3.4 Flowchart Pelatihan Algoritma Kombinasi SVM-K-NN. Pada flowchart Gambar 3.4, tahap awal proses pelatihan algoritma Kombinasi adalah dengan penginputan citra-citra pelatihan, selanjutnya dilakukan preprocessing citra yaitu pengolahan awal. Proses selanjutnya dilakukan perhitungan ekstraksi ciri dengan metode Image Centroid and Zone (ICZ) serta Zone Centroid and Zone (ZCZ) dan selanjutnya dilakukan perhitungan jarak piksel dengan centroid zone dan simpan sebagai data pelatihan untuk proses pengajuan.. Universitas Sumatera Utara.

(50) 35. 3.6 Flowchart Pengujian Algoritma Kombinasi SVM-KNN Adapun flowchart Pengujian Algoritma SVM-KNN dalam melakukan klasifikasi penyakit Diabetes Retinopati dapat dilihat seperti pada Gambar 3.5.. Start. Input Citra Uji, data Pelatihan. Inisialisasi Parameter SVM. Menghitung Kernel RBF, Matriks Hessian, Max Gamma. Menghitung Alpha Positif dan Negatif Menghitung Kernel. Menghitung Total Weight. Menghitung Bias Total Weight Tidak. Ya. Bias Total Weight < 0. Klasifikasi=1. Klasifikasi= -1. Hasil Klasifikasi. Stop. Gambar 3.5 Flowchart Pengujian Algoritma Kombinasi SVM-KNN. Universitas Sumatera Utara.

(51) 36. 3.7 Data Yang Digunakan Pada pembuatan aplikasi ini datanya berupa data citra digital fundus mata. Data citra masukan ini berupa citra RGB dengan format file citra Tagged Image Format File (.tif) dengan ukuran 2240 x 1488 piksel. Data citra fundus diperoleh dari database The STARE (STructured Analysis of the Retina) database yang berkonsentrasi pada penelitian tentang Diabetic Retinopathy.. 3.8 Image Preprocessing 3.8.1 Menghitung Nilai RGB Citra Pada citra warna 24-bit (true color) tidak terdapat palet RGB, karena nilai RGB langsung diuraikan dalam data bitmap berbentuk biner. Untuk membaca nilai RGB-nya, dilakukan mencari header-header serta data bitmap yang berisi informasi dimensi, format dan nilai piksel citra. Setiap elemen data bitmap panjangnya 3 byte, masingmasing byte menyatakan komponen R, G, dan B. Setiap byte data merepresentasikan 8 bit, jadi pada citra warna ada 3 byte x 8 bit = 24 bit kandungan warna. Pada citra warna, tiap piksel-nya mengandung 24-bit kandungan warna atau 8-bit untuk masing-masing warna dasar (R, G, dan B), dengan kisaran nilai kandungan antara 0 (00000000) sampai 255 (11111111) untuk tiap warna. Sebagai contoh suatu nilai piksel sebuah citra warna seperti pada Gambar 3.6. <Header>. Piksel. <data bitmap> 1001000010110100111 10001 xxxxxxxxxxxxxxxxxxx xxxxx. Piksel. 2 1 1101000010110100100 10100 Piksel n. Gambar 3.6 Contoh Nilai Piksel Citra Warna. Pada contoh citra Gambar 3.6 di atas, data pertama adalah header yang berisi informasi nama file, jenis format dan dimensi citra. Di bawah data bitmap terdapat piksel pertama 100100001011010011110001. Misalkan diberikan citra warna dengan dimensi 400 x 500 piksel yang dihasilkan dari alat perekam digital. Tujuan yang hendak. Universitas Sumatera Utara.

(52) 37. dicapai adalah untuk mendapatkan nilai RGB. Citra warna retina mata dapat dilihat pada Gambar 3.7.. Gambar 3.7 Citra Warna Retina. Untuk mendapatkan citra grayscale, maka nilai piksel pada citra Gambar 3.7 dibaca. Misalkan piksel (0,0) nilai pikselnya (c) adalah 100100001011010011110001 (24 bit). Nilai R, G dan B dihitung dengan persamaan (3.3) sebagai berikut: Nilai R = c and 255. …………………………………………………………….. (3.1). Nilai G = (c and 65280) / 256……………………………………………….……. (3.2) Nilai B = ((c and 16,711,680)/256)/256 ……....……...………………………....... (3.3) Dimana c adalah nilai piksel citra Pada Gambar 3.2 di atas, nilai piksel (0,0) adalah 100100001011010011110001. Nilai R dihitung dengan persamaan 3.3 yaitu: Nilai R = 100100001011010011110001 and 000000000000000011111111 = = 000000000000000011110001 = 241 (desimal) Nilai G = (100100001011010011110001 and 1111111100000000)/ 100000000 = 000000000000000010110100 = 180 (desimal) Nilai B= (100100001011010011110001 and 111111110000000000000000) / 10000000000000000/ 10000000000000000 = 000000000000000010010000 = 144 (desimal) Sehingga diperoleh nilai piksel (0,0): R=. 11110001 = 241 (desimal). G=. 10110100 = 180 (desimal). B=. 10010000 = 144 (desimal). Dalam contoh analisis ini jumlah piksel citra retina yang dihitung sebanyak 25 piksel saja dan untuk mendapatkan nilai RGB piksel selanjutnya dilakukan sama seperti cara di atas dan selanjutnya nilai RGB semua nilai piksel pada citra dimasukkan ke dalam matriks seperti pada Tabel 3.1.. Universitas Sumatera Utara.

(53) 38. Tabel 3.1 Matriks Nilai RGB Citra Warna R G B 241,180,144 200,189,134 45,200,67 78,204,45 56,100,123. R G B 240,190,145 201,180,111 65,180,52 34,180,52 45,120,35. R G B 245,175,133 150,180,120 50,180,67 50,180,45 50,230,123. R G B 10,200,200 150,180,25 50,180,52 50,180,52 45,200,200. R G B 110,220,120 145,200,0 210,180,0 67,230,34 56,230,100. 3.8.2 Menghitung Nilai Grayscale Matriks citra warna pada Tabel 3.1 di atas ditransformasikan menjadi citra grayscale dengan menghitung rata-rata warna Red, Green dan Blue. Secara matematis penghitungannya adalah sebagai berikut. f0 (x,y) = (. fR (𝑥,𝑦)+ fG (𝑥,𝑦)+ fB (𝑥,𝑦) 3. ) ………………………………………..…… (3.4). Sebagai contoh menghitung nilai grayscale piksel (0,0) dengan nilai komponen RGB (241,180,144) menggunakan persamaan (3.6) adalah: f(0,0) = (. 241+ 180+144. f(0,1) = (. 240+ 190+145. f(0,2) = (. 245+ 175+133. f(0,3) = (. 10+ 200+200. f(0,4) = (. 110+ 220+120. f(1,0) = (. 200+ 189+144. f(1,1) = (. 201+180+111. f(1,2) = (. 150+180+120. f(1,3) = (. 150+180+25. f(1,4) = (. 145,200,0. 3 3 3 3. 3 3. 3 3. ) = 191.66 = 192 ) = 184.33 = 184. ) = 136.66 = 137. 3. 3. ) = 188.33 = 188. ) = 150 ) = 177.66 = 178. ) = 164 ) = 150. ) = 118.33 = 118. ) = 115. Untuk menghitung nilai grayscale piksel selanjutnya dilakukan sama seperti cara di atas, selanjutnya hasil nilai grayscale matriks citra warna dimasukkan ke dalam matriks nilai grayscale seperti pada Gambar 3.8.. Universitas Sumatera Utara.

(54) 39. 188 178 188 110 94. 192 164 192 188 110. 184 150 192 94 110. 137 118 94 94 188. 150 115 94 110 94. Gambar 3.8 Matriks Nilai Grayscale Dari matriks citra grayscale diatas dapat diperoleh tabel frekuensi nilai grayscale seperti pada Tabel 3.2. Tabel 3.2 Frekuensi Nilai Grayscale Piksel 99 110 115 118 137 150 164 178 188 192. Freq 2 3 1 1 1 2 1 1 4 3. 3.8.3 Adaptif Histogram Equalization Penajaman dengan Adaptif histogram equalization adalah mengubah derajat keabuan suatu piksel (r) dengan derajat keabuan yang baru (s) dengan suatu fungsi transformasi T dengan persamaan (1) (Putra, 2010): 𝑛𝑗. sk = T(rk) = ∑𝑘𝑗=0 𝑛 = ∑𝑘𝑗=0 𝑃(𝑟𝑗). …………................................................... (3.5). Dimana: 0 ≤ rk ≥ dan k = 0,1, ........ L-1 Dimana L adalah grey level maksimal yang ada pada citra r = derajat keabu-abuan piksel asli k = nomor piksel s = derajat keabu-abuan piksel baru n = jumlah derajat keabu-abuan. Universitas Sumatera Utara.

(55) 40. Histogram equalization adalah: 𝑛𝑘. Pr (rk) =. .......................................................................................................... (3.6). 𝑛. 𝑘. rk = 𝐿−1, 0 ≤ k ≤ L-1 ............................................................................................ (3.7) Rumus diatas berarti derajat keabuan (k) dinormalkan terhadap derajat keabuan terbesar (L-1). Nilai rk =0 menyatakan hitam, dan rk =1 menyatakan putih dalam skala keabuan yang didefinisikan. Misalkan sebuah citra memiliki nilai grayscale yg berukuran 20x20 piksel dengan jumlah seluruh piksel (n)=400 seperti pada Tabel 3.3 berikut: Tabel 3.3 Frekuensi Nilai Grayscale Citra Piksel. Freq. 99. 2. 110. 3. 115. 1. 118. 1. 137. 1. 150. 2. 164. 1. 178. 1. 188. 4. 192. 3. Dari Tabel 3.3 di atas dapat diperoleh kurva histogram citra asli seperti Gambar 3.9. 4.5 4 3.5 3 2.5 2 1.5 1 0.5 0. 4 3. 3. 2. 99. 2. 110. 1. 1. 1. 115. 118. 137. 150. 1. 1. 164. 178. 188. 192. Gambar 3.9 Kurva Histogram Citra Asli. Universitas Sumatera Utara.

(56) 41. Dari kurva Gambar 3.9 di atas terlihat kurva condong ke kanan yang menyebabkan citra kurang terang (gelap). Diketahui histogram sebuah citra akan dibuat ekualisasinya:. Pr (r0) = Pr (r1) = Pr (r2) = Pr (r3) = Pr (r4) = Pr (r5) = Pr (r6) = Pr (r7) = Pr (r8) = Pr (r9) =. 99. = 0.2475. 400 110. = 0.25. 400 115. = 0.2875. 400 118. = 0.295. 400 137. = 0.3425. 400 150. = 0.375. 400 164. = 0.41. 400 178. = 0.445. 400 188. = 0.47. 400 192. = 0.48. 400. Hasil perhitungan Pr dimasukkan pada Tabel 3.4. Tabel 3.4 Nilai Pr Piksel Freq 99 2 110 3 115 1 118 1 137 1 150 2 164 1 178 1 188 4 192 3 Jumlah Piksel(n). Pr(rk) 0.2475 0.25 0.2875 0.295 0.3425 0.375 0.41 0.445 0.47 0.48 400. Universitas Sumatera Utara.

(57) 42. Langkah pertama hitung rk seperti pada Tabel 3.5 Tabel 3.5 Nilai rk k. rk. nk (jml piksel). Pr(rk)=nk/n. 0. 0/9. 99. 0.2475. 1. 1/9. 110. 0.25. 2. 2/9. 115. 0.2875. 3. 3/9. 118. 0.295. 4. 4/9. 137. 0.3425. 5. 5/9. 150. 0.375. 6. 6/9. 164. 0.41. 7. 7/9. 178. 0.445. 8. 8/9. 188. 0.47. 9. 9/9. 192. 0.48. Langkah kedua hitung frekuensi kumulatif Sk seperti pada Tabel 3.6. Tabel 3.6 Nilai Frekuensi Kumulatif Sk k. rk. nk (jml piksel). Pr(rk)=nk/n. Sk. 0. 0/9. 99. 0.2475. 0.2475. 1. 1/9. 110. 0.25. 0.4975. 2. 2/9. 115. 0.2875. 0.5375. 3. 3/9. 118. 0.295. 0.5825. 4. 4/9. 137. 0.3425. 0.6375. 5. 5/9. 150. 0.375. 0.7175. 6. 6/9. 164. 0.41. 0.785. 7. 7/9. 178. 0.445. 0.855. 8. 8/9. 188. 0.47. 0.915. 9. 9/9. 192. 0.48. 0.95. Universitas Sumatera Utara.

(58) 43. Langkah ketiga cari nilai Sk yang mendekati rk seperti pada Tabel 3.7. Tabel 3.7 Nilai Sk yang mendekati rk k. rk. Sk. Sk ≈ rk. Sk ≈ rk. 0. 0/9=0. 0.2475. 0.2475 ≈ 0.222=2/9 2/9. 99. 1. 1/9=0.111. 0.4975. 0.4975 ≈ 0.444=4/9 4/9. 110. 2. 2/9=0.222. 0.5375. 0.5375 ≈ 0.556=5/9 5/9. 115. 3. 3/9=0.333. 0.5825. 0.5825 ≈ 0.556=5/9 5/9. 118. 4. 4/9=0.444. 0.6375. 0.6375 ≈ 0.667=6/9 6/9. 137. 5. 5/9=0.556. 0.7175. 0.7175 ≈ 0.778=7/9 7/9. 150. 6. 6/9=0.667. 0.785. 0.785 ≈ 0.889=8/9. 8/9. 164. 7. 7/9=0.778. 0.855. 0.855 ≈ 0.889=8/9. 8/9. 178. 8. 8/9=0.889. 0.915. 0.915 ≈ 0.889 = 8/9 8/9. 188. 9. 9/9=1.000. 0.95. 0.95 ≈ 1.000 = 9/9. 192. 9/9. nk. Langkah terakhir meringkas nilai Sk, menghitung jumlah pikselnya nk, dan membuat histogramnya seperti pada Tabel 3.8. Tabel 3.8 Nilai Ps(Sk) Sk. nk. Ps(Sk). 2/9. 99. 0.2475. 4/9. 110. 0.25. 5/9. 115+118. 0.5825. 6/9. 137. 0.3425. 7/9. 150. 0.375. 8/9. 164+178+188. 1.325. 9/9. 192. 0.48. Dari nilai Sk di atas diperoleh kurva histogram yang baru seperti pada Gambar 3.10.. Universitas Sumatera Utara.