KLASIFIKASI TUMBUHAN ANGIOSPERMAE BERDASARKAN BENTUK TULANG DAUN MENGGUNAKAN
PROBABILISTIC NEURAL NETWORK
SKRIPSI
MARISA RAUDIAH 161402080
PROGRAM STUDI S1 TEKNOLOGI INFORMASI
FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA
MEDAN
2021
KLASIFIKASI TUMBUHAN ANGIOSPERMAE BERDASARKAN BENTUK TULANG DAUN MENGGUNAKAN
PROBABILISTIC NEURAL NETWORK
SKRIPSI
Diajukan untuk melengkapi tugas dan memenuhi syarat memperoleh ijazah Sarjana Teknologi Informasi
MARISA RAUDIAH 161402080
PROGRAM S1 STUDI TEKNOLOGI INFORMASI
FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA
MEDAN
2021
PERNYATAAN
KLASIFIKASI TUMBUHAN ANGIOSPERMAE BERDASARKAN BENTUK TULANG DAUN MENGGUNAKAN PROBABILISTIC NEURAL NETWORK
SKRIPSI
Saya mengakui bahwa skripsi ini adalah hasil karya saya sendiri, kecuali beberapa kutipan dan ringkasan yang masing-masing telah disebutkan sumbernya.
Medan, 24 Juni 2021
Marisa Raudiah
UCAPAN TERIMA KASIH
Puji dan syukur penulis panjatkan kepada kehadirat Allah SWT, karena dengan rahmat dan karunia-Nya penulis dapat menyelesaikan skripsi untuk memperoleh gelar Sarjana Komputer, pada Program Studi S1 Teknologi Informasi Fakultas Ilmu Komputer dan Teknologi Informasi Universitas Sumatera Utara.
Ucapan terima kasih kepada semua pihak yang secara langsung ataupun tidak langsung membantu penulis menyelesaikan skripsi ini. Di kesempatan ini penulis mengucapkan terima kasih kepada:
1. Keluarga penulis, Ayahanda Ahmad Supiyanto, S.E. dan Ibunda Farida Aryani, Ak., M.Si. yang tidak henti-hentinya senantiasa mendoakan, membesarkan, merawat, memberikan semangat, memberi ilmu, memberikan kasih sayang yang tiada batasnya kepada penulis. Kepada nenek penulis, Sri Aryanti yang selalu memberi perhatian kepada penulis. Kepada kakak penulis, Aida Fitryani, S.T. dan adik penulis Muhammad Hafid Malik yang menjadi guru, penyemangat, pendukung, dan teman dalam setiap waktu.
Kepada kucing penulis, Juju yang selalu menjadi penghibur penulis selama masa penulisan Tugas Akhir.
2. Ibu Sarah Purnamawati, ST., M.Sc. selaku Dosen Pembimbing 1 dan Bapak Ivan Jaya, S.Si., M.Kom. selaku Dosen Pembimbing 2 yang telah memberikan ilmu, bimbingan, motivasi, kritik, dan saran kepada penulis dalam menjalani Tugas Akhir yang tidak ternilai harganya.
3. Bapak Prof. Dr. Drs. Opim Salim Sitompul, M.Sc. selaku Dekan Fasilkom-TI Universitas Sumatera Utara.
4. Bapak Romi Fadillah Rahmat, B.Comp.Sc., M.Sc., selaku Ketua Program Studi S1 Teknologi Informasi Universitas Sumatera Utara.
5. Ibu Sarah Purnamawati, ST., M.Sc., selaku Sekretaris Program Studi S1
Teknologi Informasi Universitas Sumatera Utara.
6. Seluruh Dosen Program Studi S1 Teknologi Informasi yang telah memberikan ilmu yang bermanfaat bagi penulis selama masa perkuliahan.
7. Staff dan juga pegawai Fasilkom-TI Universitas Sumatera Utara yang membantu urusan administrasi dalam menyelesaikan skripsi.
8. Muhammad Alisiraj Fachreza Siregar yang telah menemani penulis sejak awal perkuliahan hingga sekarang, selalu ada di segala situasi, baik suka maupun duka, memberikan semangat yang tak henti-henti, dan membantu penulis selama masa perkuliahan.
9. Teman-teman seperjuangan hidup dan perkuliahan, Hanna Rabitha Hasni, Audry Welvira, dan Sarah Charisa Yosephin Pasaribu yang telah menyemangati, memberi dukungan dan bantuan tiada henti kepada penulis serta sebagai tempat berkeluh kesah selama masa perkuliahan.
10. Teman-teman Menantu Idaman, yaitu Riri, Rara, Yasmin, Melati, Adine, Manda, Dessy, Dita, dan Pika yang selalu menjadi penyemangat dan membantu penulis dalam menjalani masa perkuliahan.
11. Teman-teman masa sekolah penulis, Icut, Kesuma, Indah, Edo, Rizka, Tasya, Jeli, dan Danty yang masih terus menjalin persahabatan dengan penulis.
12. Teman-teman Beta Tester yang telah mengisi masa perkuliahan penulis dalam susah maupun senang.
13. Teman-teman pengisi waktu luang penulis, Andra, Aditama, dan Syaika.
14. Teman-teman Teknologi Informasi angkatan 2016 yang telah berjuang bersama penulis dalam menghadapi perkuliahan.
Medan, 24 Juni 2021
Penulis
ABSTRAK
Angiospermae merupakan tumbuhan biji tertutup yang dibagi menjadi 2 jenis, yaitu monokotil (berkeping 1) dan dikotil (berkeping 2). Sekitar 90% tumbuhan yang hidup saat ini merupakan tumbuhan Angiospermae. Namun, begitu banyaknya keanekaragaman tumbuhan jenis Angiospermae yang ada menyebabkan proses identifikasi secara biologis menjadi kurang efektif. Sistem cerdas menjadi solusi yang diharapkan dapat memudahkan proses identifikasi maupun pembelajaran tumbuhan dikotil dan monokotil menjadi lebih mudah dan cepat. Penelitian ini menggunakan metode Probabilistic Neural Network. Data yang digunakan ialah citra daun angiospermae berjumlah 1.800 citra dimana 880 citra merupakan 5 jenis tumbuhan monokotil dan 920 citra merupakan 5 jenis tumbuhan dikotil. Data dibagi menjadi data training dan data testing, kemudian dilakukan image resize dan RGB to gray- scale image kepada citra sebagai tahap pre-processing. Untuk mengklasifikasi nama tumbuhan, dilakukan proses shape segmentation yang terdiri dari converting to binary image, Gaussian blur, dan transform to inverse image. Sedangkan untuk mengklasifikasi jenis tumbuhan (monokotil atau dikotil) dilakukan proses vein segmentation yang terdiri dari Canny edge detection, dan binarization. Hasil shape segmentation dan vein segmentation dilakukan GLCM sebagai feature extraction dan diklasifikasikan menggunakan PNN. Hasil pengujian nama tumbuhan dikotil memperoleh tingkat akurasi sebesar 87%, sedangkan untuk tumbuhan monokotil memperoleh tingkat akurasi sebesar 80%, sehingga untuk klasifikasi nama tumbuhan memperoleh tingkat akurasi rata-rata sebesar 83,6%. Untuk hasil pengujian jenis tumbuhan memperoleh tingkat akurasi sebesar 87%. Dari hasil pengujian yang sudah diperoleh terkait pengklasifikasian nama dan jenis Tumbuhan Angiospermae, dapat disimpulkan bahwa sistem bekerja dengan cukup baik.
Kata Kunci: Image Processing, Angiospermae, Probabilistic Neural Network (PNN)
CLASSIFICATION OF ANGIOSPERM BASED ON LEAF VEIN USING PROBABILISTIC NEURAL NETWORK
ABSTRACT
Angiosperms are closed-seed plants that are devided into two types, monocot (single cotyledon) and dicot (two cotyledons). Around 90% of plants living today are Angiosperms. However, the diversity of Angiosperms made the biological identification process is less effective. A smart system is a solution that is expected to make the identification and learning process of dicot and monocot plants easier and faster. This study uses a Probabilistic Neural Network method. The data used were 1,800 images of angiosperms, where 880 images were 5 types of monocot plants and 920 images were 5 types of dicot plants. The data is divided into training data and testing data, then image resize and RGB to gray-scale image are performed on the image as the pre-processing stage. To classify plant names, a shape segmentation process is carried out which consists of converting to binary image, Gaussian blur, and transform to inverse image. Meanwhile, to classify plant type (monocot or dicot), a vein segmentation process is carried out which consists of, Canny edge detection, and binarization. The results of shape segmentation and vein segmentation were performed GLCM as feature extraction and classified using PNN. Dicotyl plant name test results obtained an accuracy rate of 87%, while for monocot plants obtained an accuracy rate of 80%, so that the classification of plant names obtained an average accuracy rate of 83.6%. For plant type test results obtained an accuracy rate of 87%.
From the test results that have been obtained regarding the classification of names and types of Angiosperm Plants, it can be concluded that the system works quite well.
Keywords: Image Processing, Angiosperm, Probabilistic Neural Network (PNN)
DAFTAR ISI
PERSETUJUAN i
PERNYATAAN ii
UCAPAN TERIMA KASIH iii
ABSTRAK v
ABSTRACT vi
DAFTAR ISI vii
DAFTAR TABEL xii
DAFTAR GAMBAR xiii
BAB 1 PENDAHULUAN 1
1.1 Latar Belakang 1
1.2 Rumusan Masalah 2
1.3 Tujuan Penelitian 3
1.4 Batasan Masalah 3
1.5 Manfaat Penelitian 3
1.6 Metodologi Penelitian 3
1.7 Sistematika Penulisan 4
BAB 2 LANDASAN TEORI 6
2.1 Tumbuhan Angiospermae 6
2.1.1. Monokotil 6
2.1.2. Dikotil 6
2.1.3. Perbedaan Monokotil dan Dikotil 7
2.2 Citra Digital 7
2.2.1. Citra Berwarna 8
2.2.2. Citra Keabuan 8
2.2.3. Citra Biner 9
2.3 Citra Digital Daun 9
2.4 Pengolahan Citra Digital (Digital Image Processing) 10
2.5 Machine Learning 10
2.5.1 Supervised Learning 10
2.5.2 Unsupervised Learning 11
2.5.3 Reinforcement Learning 11
2.6 Open Source Computer Vision Library (OpenCV) 11
2.7 Probabilistic Neural Network (PNN) 11
2.7.1 Lapisan Input (Input Layer) 12
2.7.2 Lapisan Pola (Pattern Layer) 12
2.7.3 Lapisan Penjumlahan (Summation Layer) 12
2.7.4 Lapisan Output / Keputusan (Decision Layer) 13
2.8 Resize Image 13
2.9 Grayscale 14
2.10 Binary Image 15
2.11 Gaussian Blur 15
2.12 Inverse Image 16
2.13 Canny Edge Detection 16
2.14 GLCM 17
2.15 Confusion Matrix 18
2.15.1 True Positive 19
2.15.2 True Negative 19
2.15.3 False Positive 19
2.15.4 False Negative 19
2.16 Penelitian Terdahulu 20
BAB 3 ANALISIS DAN PERANCANGAN SISTEM 24
3.1 Data yang digunakan 24
3.2 Analisis Sistem 27
3.2.1 Pre-Processing 28
3.2.1.1 Image Resize 28
3.2.1.2 Gray-scale Image 29
3.2.2 Shape Segmentation 32
3.2.2.1 Binary Image 32
3.2.2.2 Gaussian Blur 34
3.2.2.3 Inverse Image 36
3.2.3 Vein Segmentation 37
3.2.3.1 Canny Edge Detection 37
3.2.3.2 Binary Image 38
3.2.4 GLCM 41
3.2.5 PNN 47
3.2.5.1 Lapisan Input 47
3.2.5.2 Lapisan Pola 48
3.2.5.3 Lapisan Penjumlahan 49
3.2.5.4 Lapisan Output 50
3.2.5.5 Proses Learning (Pembelajaran) 52
3.2.5.6 Proses Testing (Pengujian) 54
3.3 Perancangan Antarmuka Sistem 54
3.3.1 Rancangan Tampilan Halaman Awal 54
3.3.2 Rancangan Tampilan Halaman Training Data 55
3.3.3 Rancangan Tampilan Halaman Testing Data 56
3.3.4 Rancangan Tampilan Halaman Hasil 57
BAB 4 IMPLEMENTASI DAN PENGUJIAN SISTEM 58
4.1 Implementasi Sistem 58
4.1.1 Perangkat Keras dan Perangkat Lunak 58
4.1.2 Implementasi Data 59
4.1.3 Implementasi Perancangan Antarmuka 62
4
.1.3.1 Tampilan Halaman Awal 62
4
.1.3.2 Tampilan Halaman Training 63
4
.1.3.3 Tampilan Halaman Testing 64
4
.1.3.4 Tampilan Halaman Hasil 64
4.2 Prosedur Operasional 65
4.3 Pengujian Sistem 70
BAB 5 KESIMPULAN DAN SARAN 84
5.1 Kesimpulan 84
5.2 Saran 85
DAFTAR PUSTAKA 86
DAFTAR TABEL
Tabel 2. 1 Penelitian Terdahulu 21
Tabel 3. 1 Data Monokotil 25
Tabel 3. 2 Data Dikotil 26
Tabel 3. 3 Hasil GLCM Shape 45
Tabel 3. 4 Hasil GLCM Vein 46
Tabel 3. 5 Data Input Implementasi PNN 50
Tabel 4. 1 Hasil Pengujian Proses Segmentasi dan Klasifikasi 72
Tabel 4. 2 Tingkat Keberhasilan Klasifikasi Tumbuhan Angiospermae 77
Tabel 4. 3 Hasil Implementasi confusion matrix Data Testing Jenis Tumbuhan 78
Tabel 4. 4 Hasil Implementasi confusion matrix Data Testing Tumbuhan Monokotil 78
Tabel 4. 5 Hasil Implementasi confusion matrix Data Testing Tumbuhan Dikotil 79
Tabel 4. 6 Pengujian Beragam Jumlah Data Training Tumbuhan Dikotil 81
Tabel 4. 7 Pengujian Beragam Jumlah Data Training Tumbuhan Monokotil 81
Tabel 4. 8 Tingkat Keberhasilan Klasifikasi Tumbuhan Berbagai Sisi 82
DAFTAR GAMBAR
Gambar 2. 1 Perbedaan Monokotil dan Dikotil 7
Gambar 2. 2 Citra Berwarna (Color Image) 8
Gambar 2. 3 Citra Keabuan (Grayscale Image) 9
Gambar 2. 4 Citra Biner (Binary Image) 9
Gambar 2. 5 Citra Digital Daun Monokotil (a) dan Dikotil (b) 10
Gambar 2. 6 Lapisan PNN 13
Gambar 2. 7 Image Resize 14
Gambar 3. 1 Contoh Citra Digital Daun 24
Gambar 3. 2 Bobot nilai data latih dan data uji 27
Gambar 3. 3 Arsitektur Umum 28
Gambar 3. 4 Citra Daun Sebelum dan Sesudah Diubah Menjadi Grayscale 29 Gambar 3. 5 Citra Daun Sebelum Menjadi Proses Grayscale 30 Gambar 3. 6 Citra Daun Sesudah Menjadi Proses Grayscale 30 Gambar 3. 7 Citra Daun Sebelum dan Sesudah Diubah Menjadi Binary Image 32 Gambar 3. 8 Citra Daun 3x3 Sebelum Diubah Menjadi Binary Image 33 Gambar 3. 9 Citra Daun 3x3 Sesudah Diubah Menjadi Binary Image 34 Gambar 3. 10 Citra Daun Sebelum dan Sesudah Diubah Menjadi Gaussian Blur 34 Gambar 3. 11 Lokasi Entri Kernel Filter Pada Citra 5x5 35
Gambar 3. 12 Citra yang Telah Dikalikan dengan 55 35
Gambar 3. 13 Citra yang Telah Dinormalisasi 36
Gambar 3. 14 Citra Daun Sebelum dan Sesudah Diubah Menjadi Inverse Image 36 Gambar 3. 15 Citra Daun Sebelum dan Sesudah Diubah Menjadi Canny 38 Gambar 3. 16 Citra Daun Sebelum dan Sesudah Diubah Menjadi Binary Image 41
Gambar 3. 17 Matriks Kookurensi 42
Gambar 3. 18 Perhitungan Matriks Simetris 42
Gambar 3. 19 Matriks Normalisasi 42
Gambar 3. 20 Grafik Akurasi dan Loss Model Jenis Tumbuhan 53
Gambar 3. 21 Grafik Akurasi dan Loss Model Dikotil 53
Gambar 3. 22 Grafik Akurasi dan Loss Model Monokotil 53
Gambar 3. 23 Rancangan Tampilan Halaman Awal 54
Gambar 3. 24 Rancangan Tampilan Halaman Training 55
Gambar 3. 25 Rancangan Tampilan Halaman Testing 56
Gambar 3. 26 Rancangan Tampilan Halaman Hasil 56
Gambar 4. 1 Citra Daun Alpukat 59
Gambar 4. 2 Citra Daun Durian 59
Gambar 4. 3 Citra Daun Lemon 60
Gambar 4. 4 Citra Daun Mangga 60
Gambar 4. 5 Citra Daun Rambutan 60
Gambar 4. 6 Citra Daun Bambu 61
Gambar 4. 7 Citra Daun Padi 61
Gambar 4. 8 Citra Daun Kurma 61
Gambar 4. 9 Citra Daun Pandan 62
Gambar 4. 10 Citra Daun Tebu 62
Gambar 4. 11 Tampilan Halaman Awal 63
Gambar 4. 12 Tampilan Halaman Training 63
Gambar 4. 13 Tampilan Halaman Testing 64
Gambar 4. 14 Tampilan Halaman Hasil 65
Gambar 4. 15 Tampilan Halaman Utama 65
Gambar 4. 16 Tampilan Halaman Training 66
Gambar 4. 17 Input File CSV 67
Gambar 4. 18 Tampilan Halaman Testing 68
Gambar 4. 19 Input File PNG 68
Gambar 4. 20 Halaman Loading 69
Gambar 4. 21 Tampilan Halaman Hasil 69
Gambar 4. 22 Citra Daun Sebelum dan Sesudah Dilakukan Pre-processing 70
Gambar 4. 23 Citra Daun Sebelum dan Sesudah Dilakukan Shape Segmentation 71
Gambar 4. 24 Citra Daun Sebelum dan Sesudah Dilakukan Vein Segmentation 71
Gambar 4. 25 Citra Daun Mangga dengan Background Tidak Polos 80
Gambar 4. 26 Citra Daun Mangga dengan Background Polos 80
BAB 1 PENDAHULUAN
1.1 Latar Belakang
Indonesia adalah negara yang kaya akan keanekaragaman hayati. Dalam dunia tumbuhan, 25% flora di dunia dapat ditemui di Indonesia dan menempati negara urutan ketujuh dengan flora mencapai 20.000 spesies (Kusmana, 2015). Tumbuhan dibagi menjadi yang menghasilkan biji dan yang tidak menghasilkan biji. Tumbuhan berbiji (Spermatophyta) memiliki dua kelompok, yaitu Angiospermae dan Gymnospermae. Angiospermae adalah tumbuhan berbiji tertutup yang mempunyai bunga yang sesungguhnya. Spermatophyta jenis ini dibagi menjadi 2, yaitu monokotil (berkeping satu) dan dikotil (berkeping dua). Keduanya dapat dibedakan dari tiap bagiannya, contohnya dari bentuk tulang daun. Tulang daun monokotil berbentuk sejajar dan memanjang, sedangkan tulang daun dikotil berbentuk menjari atau menyirip.
Namun, begitu banyaknya keanekaragaman tumbuhan jenis Angiospermae yang ada menyebabkan proses identifikasi secara biologis menjadi kurang efektif.
Sistem cerdas menjadi solusi yang diharapkan dapat memudahkan proses identifikasi maupun pembelajaran tumbuhan dikotil dan monokotil menjadi lebih mudah dan cepat.
Beberapa penelitian menggunakan citra daun telah dilakukan sebelumnya,
beberapa diantaranya ialah Plant identification based on leaf shape and texture
pattern using local graph structure (Sayeed et al., 2013) yang memiliki tingkat
akurasi sebesar 83,3%.. Selanjutnya, Klasifikasi Citra Daun Monokotil dan Dikotil
Menggunakan Naïve Bayes (Karima et al., 2014) yang memiliki tingkat akurasi
sebesar 50%. Selanjutnya, ialah Identifikasi Tulang Daun Monokotil dan Dikotil
dengan Metode Manual Thresholding (Christy et al., 2015). Selanjutnya,
Implementasi Deep Learning pada Identifikasi Jenis Tumbuhan Berdasarkan Citra
Daun Menggunakan Convolutional Neural Network (Ilahiyah & Nilogiri, 2018)
mendapatkan tingkat akurasi sebesar 90%. Kemudian, Leaves Classification Using
Neural Network Based on Ensemble Features (Adinugroho & Sari, 2018) yang memiliki tingkat akurasi sebesar 95,54%.
Penelitian lain terkait klasifikasi tanaman berdasarkan citra daun juga telah beberapa kali dilakukan menggunakan PNN seperti algoritma pengenalan daun untuk klasifikasi tanaman (Wu et al., 2007) yang memiliki tingkat akurasi diatas 90%.
Penelitian selanjutnya berjudul Machine Recognition for Broad-Leaved Trees Based on Synthetic Features of Leaves Using PNN (Lin & Peng, 2008) yang memiliki tingkat akurasi sebesar 93,7%. Penelitian selanjutnya ialah Identifikasi Jenis Shorea Berdasarkan Morfologi Daun Menggunakan Probabilistic Neural Network (Hutabarat, 2012) yang memiliki tingkat akurasi sebesar 84%. Penelitian selanjutnya berjudul Plant Leaf Classification Using Centroid Distance and Axis of Least Inertia Method (Mahdikhanlou & Ebrahimnehzad, 2014) yang memiliki tingkat akurasi sebesar 82,4%.
Pada penelitian kali ini, penulis mengajukan metode Probabilistic Neural Network (PNN) yang telah banyak dilakukan penelitian sebelumnya. PNN adalah sebuah metode jaringan saraf tiruan atau neural network yang menggunakan training supervised. Pada tahun 1988, metode ini dikembangkan oleh Donald F. Specht. PNN masuk ke dalam struktur Feedforward. Metode PNN berasal dari jaringan Bayesian dan algoritma statistik yang dikenal dengan nama Kernel Fisher Discriminant Analysis. Teori Bayes bisa berfungsi untuk mengklasifikasi beberapa kategori.
Pengambilan keputusan dalam pengklasifikasian menggunakan PNN didasarkan pada hasil perhitungan jarak (distance) antara fungsi kepekatan peluang dengan vektor ciri.
Berdasarkan latar belakang tersebut, penulis akan menerapkan metode PNN untuk membuat penelitian yang berjudul “Klasifikasi Tumbuhan Angiospermae Berdasarkan Bentuk Tulang Daun Menggunakan Probabilistic Neural Network (PNN)”.
1.2 Rumusan Masalah
Identifikasi keanekaragaman tumbuhan jenis Angiospermae masih dilakukan secara
manual sehingga diperlukan analisis dan pengetahuan yang cukup untuk dapat
membedakan keberagaman tumbuhan jenis Angiospermae. Oleh sebab itu, dibutuhkan
sebuah sistem yang bisa membantu mengklasifikasikan tumbuhan jenis
Angiospermae.
1.3 Tujuan Penelitian
Penelitian ini bertujuan untuk pengklasifikasian jenis tumbuhan angiospermae berdasarkan bentuk tulang daun menggunakan Probabilistic Neural Network agar dapat mempermudah masyarakat menentukan jenis tumbuhan angiospermae berdasarkan daunnya.
1.4 Batasan Masalah
Penelitian ini memilki beberapa batasan masalah. Batasan masalah pada penelitian ini ialah:
a. Tanaman yang akan diteliti merupakan tanaman jenis angiospermae yang terbagi menjadi dua kelompok, yaitu monokotil dan dikotil.
b. Jenis tumbuhan yang diuji berjumlah 10 jenis, yaitu bambu, kurma, padi, pandan, tebu, alpukat, durian, lemon, mangga, dan rambutan.
c. Data yang digunakan adalah citra digital daun pencahayaan minimal 450 lumen dan tulang daun terlihat jelas.
d. Output dari penelitian ini ialah nama dan jenis tumbuhan.
1.5 Manfaat Penelitian
Beberapa manfaat dari penelitian ini ialah:
a. Sebagai sumber informasi bagi masyarakat dan pelajar dalam mengenali jenis- jenis tumbuhan angiospermae.
b. Penelitian ini diharapkan dapat membantu mempermudah pengklasifikasian jenis tumbuhan angiospermae berdasarkan bentuk daunnya.
1.6 Metodologi Penelitian
Metodologi penelitian dalam penelitian ini terdiri dari 7 tahap, yaitu:
1. Studi Literatur
Tahap studi literatur ialah tahap pengumpulan dan pembelajaran literatur serta
dokumen pendukung yang diperoleh melalui jurnal, skripsi, buku dan sumber
lainnya.
2. Pengumpulan Data
Setelah mempelajari dan memahami literatur dilakukan pengumpulan data yang terkait dengan penelitian.
3. Analisis Permasalahan
Tahap analisis permasalahan merupakan tahap dimana penulis melakukan analisis terhadap informasi-informasi dari dokumen yang sudah dipelajari agar dapat mendapat metode yang tepat untuk menyelasaikan masalah dalam penelitian ini.
4. Perancangan Sistem
Tahap perancangan sistem ialah tahap dimana penulis merancang sistem, yang dapat menyelesaikan masalah yang dianalisis di tahapan sebelumnya.
5. Implementasi
Tahapan implementasi merupakan tahap dimana pengimplementasian analisis sesuai perancangan sistem yang telah dibuat.
6. Pengujian
Tahap pengujian ialah tahap dimana dilakukan proses pengujian terhadap Probabilistic Neural Network yang telah dibuat.
7. Penyusunan Laporan
Tahap penyusunan laporan merupakan tahap dimana penulis akan menyusun dokumentasi berupa laporan yang menjabarkan hasil penelitian yang telah penulis lakukan.
1.7 Sistematika Penulisan
Penulisan ini memiliki sistematika penulisan yang terdisi dari 5 bagian, yaitu:
BAB 1. PENDAHULUAN
Bab 1 berisi latar belakang pemilihan judul skripsi “Klasifikasi Tumbuhan Angiospermae Berdasarkan Bentuk Tulang Daun Menggunakan Probabilistic Neural Network", rumusan masalah, tujuan penelitian, batasan masalah, manfaat penelitian, metodologi penelitian dan sistematika penulisan.
BAB 2. LANDASAN TEORI
Bab 2 merupakan bab yang berisi teori mengenai tumbuhan Angiospermae, citra digital daun, pengolahan citra digital, Probabilistic Neural Network (PNN), dan penelitian terdahulu untuk memahami permasalahan dan proses dalam pengaplikasian sistem yang dibuat dalam penelitian ini.
BAB 3. ANALISIS DAN PERANCANGAN SISTEM
Bab 3 merupakan bab yang membahas menganai analisis arsitektur umum dari metode Probabilistic Neural Network (CNN) yang digunakan dalam Image Processing pada citra daun untuk mengklasifikasi nama dan jenis tumbuhan Angiospermae.
BAB 4. IMPLEMENTASI DAN PENGUJIAN SISTEM
Bab 4 merupakan bab yang membahas mengenai implementasi hasil analisis dan mengenai perancangan sistem pada bab 3. Selain itu, ab 4 juga mengandung pemaparan hasil pengujian terhadap sistem yang telah dibuat.
BAB 5. KESIMPULAN DAN SARAN
Bab 5 merupakan bab yang membahas mengenai kesimpulan penelitian yang sudah
dilakukan oleh penulis dan saran yang diajukan penulis untuk penelitian serupa
selanjutnya.
BAB 2
LANDASAN TEORI
2.1 Tumbuhan Angiospermae
Tumbuhan berbiji (Spermatophyta) adalah kelompok tumbuhan yang memiliki tingkat perkembangan filogenetik paling tinggi. Karakteristik khusus yang dimiliki oleh tumbuhan Spermatophyta ialah berupa biji (dalam bahasa Yunani: sperma).
Tumbuhan Spermatophyta terbagi menjadi 2, yaitu tumbuhan biji terbuka (Gymnospermae) dan tumbuhan biji tertutup (Angiospermae) (Tjitrosoepomo, 2010).
Angiospermae mempunyai beberapa karakterisitik, diantaranya yaitu bakal biji selalu dibungkus oleh bakal buah, mempunyai organ bunga yang sebenarnya, terdiri dari tumbuhan berkayu atau batang basah, akar tumbuhan dapat berupa akar tunggang ataupun akar serabut, batang dapat bercabang ataupun tidak, serta kebanyakan memiliki daun tunggal, majemuk, atau lebar dengan komposisi yang beragam, dan juga memilki bentuk tulang daun yang beraneka ragam. Angiospermae memiliki 2 kelompok, yaitu dikotil dan monokotil, yang berjumlah kurang lebih 300 famili / lebih dari 250.000 spesies, yang mana di antara famili tersebut telah ditemukan di banyak lokasi yang merupakan rerumputan berjumlah 7500 spesies. (Tjitrosomo, 1984).
2.1.1 Monokotil
Tumbuhan berkeping satu (monocotyledoneae atau monokotil) yang telah dikenali berjumlah sekitar 50.000 spesies. Karakteristik utama monokotil ialah memiliki biji dengan lembaga yang memiliki 1 daun lembaga (Kadaryanto et al, 2016). Tumbuhan monokotil yang digunakan dalam penelitian ini ialah bamboo, padi, kurma, pandan, dan tebu.
2.1.2 Dikotil
Tumbuhan berkeping dua (dycotyledoneae atau dikotil) yang telah ditemui dan
dinamai saat ini berjumlah sekitar 200.000 spesies. Karakteristik utama dikotil ialah
memiliki biji yang mempunyai 2 daun lembaga. Tumbuhan dikotil dapat berupa
semak, perdu, ataupun pohon. Pertumbuhan dikotil ada yang merambat, tegak berdiri,
ataupun menempel pada tumbuhan lain. (Kadaryanto et al, 2016). Tumbuhan dikotil yang digunakan dalam penelitian ini ialah alpukat, durian, lemon, mangga, dan rambutan.
2.1.3 Perbedaan monokotil dan dikotil
Tumbuhan monokotil dan dikotil mempunyai ciri khas masing-masing sehingga dapat dibedakan melalui tulang daun, batang, bunga, dan akarnya. Berdasarkan tulang daun, tanaman monokotil memiliki daun sejajar ataupun melengkung, sedangkan dikotil memiliki tulang daun menyirip atau menjari. Berdasarkan batangnya, berkas pengangkut monokotil tersebar sedangkan dikotil tersusun. Berdasarkan jumlah bunganya, monokotil memiliki jumlah kelopak bunga sebanyak 3 atau kelipatannya, sedangkan dikotil memiliki 2, 4, 5, atau kelipatannya. Berdasarkan akar, monokotil mempunyai akar serabut, sedangkan dikotil akar tunggang. Perbedaan tumbuhan dikotil dan monokotil dapat dilihat di gambar 2.1.
Gambar 2.1. Perbedaan Monokotil dan Dikotil Sumber : Campbell Biology (2014)
2.2 Citra Digital
Citra ialah sebuah imitasi atau gambaran dari sebuah objek. Terdapat dua jenis citra,
analog dan digital. Citra analog bersifat kontinu, contohnya ialah gambar di monitor
televisi, foto yang dicetak, dsb, sedangkan citra digital ialah sebuah citra yang bisa diolah komputer.
Citra digital merupakan gambar fungsi dua dimensi dengan 𝑥, 𝑦 dan nilai intensitas 𝑓 semuanya terbatas, di mana 𝑥 dan 𝑦 merupakan koordinat spasial (bidang), dan amplitudo 𝑓 pada tiap koordinat (𝑥, 𝑦) disebut intensitas atau tingkat abu dari gambar pada titik itu (Gonzalez et al., 2020).
Citra digital umumnya terbagi menjadi tiga, yaitu citra berwarna, keabuan, dan biner.
2.2.1 Citra berwarna (Color Image)
Citra berwarna atau yang biasa disebut citra RGB memiliki tiga bentuk komponen pada tiap pikselnya, yaitu red, green, dan blue. Setiap komponen berukuran 8 bit (0- 255). Warna yang mungkin bisa disajikan ialah 255x255x255, lebih lengkapnya dapat mencapai 16.581.375 warna. Contoh citra berwarna dapat dilihat di gambar 2.2.
Gambar 2.2. Citra berwarna (color image) 2.2.2 Citra keabuan (Grayscale Image)
Citra keabuan atau grayscale adalah citra yang terdiri dari warna tingkat keabuan.
Warna abu pada citra grayscale merupakan warna RGB yang memiliki intensitas yang sama, dengan begitu grayscale hanya memerlukan sebuah intensitas tunggal, sedangkan citra berwarna (RGB) memerlukan 3 intensitas pada setiap pikselnya.
Intensitas grayscale menggunakan 8 bit, yang memberi kemungkinan sebanyak 256,
yaitu 0 untuk hitam hingga 255 untuk putih. Contoh citra keabuan dapat dilihat di
Gambar 2.3.
Gambar 2.3. Citra keabuan (grayscale image)
2.2.3 Citra biner (Binary Image)
Binary image merupakan suatu citra yang tiap pikselnya hanya memiliki 2 nilai derajat keabuan (grayscale), yaitu hitam dan putih. Piksel akan berwarna putih jika bernilai 0 dan berwarna hitam jika bernilai 1. Biasanya dalam citra biner objek akan berwarna hitam dan latar akan berwarna putih. Nilai derajat keabuan pada citra biner hanya membutuhkan 1 bit. Kegunaan citra biner ialah untuk mengidentifikasi keberadaan objek, memfokuskan morfologi, mengubah citra yang telah ditingkatkan garis tepinya, dll. Contoh citra biner dapat dilihat di gambar 2.4.
Gambar 2.4. Citra biner (binary image)
2.3 Citra Digital Daun
Citra digital daun adalah citra digital yang memuat gambaran atau imitasi daun
di dalamnya sehingga memuat informasi daun. Contoh citra digital daun monokotil
dan dikotil dapat dilihat di gambar 2.5.
(a) (b)
Gambar 2.5. Citra Digital Daun Monokotil (a) dan Dikotil (b)
2.4 Pengolahan Citra Digital (Digital Image Processing)
Digital image processing ialah sebuah ilmu yang menggunakan software dan hardware untuk mengumpulkan, memproses, dan menampilkan data untuk tujuan umum meningkatkan atau meningkatkan gambar. Ilmu ini rumit dan melibatkan pengetahuan tentang optik, elektronik, komputer, dan matematika (Mckinley, 1990).
Awalnya, penggunaan pengolahan citra digital ialah untuk memperbaiki dan meningkatkan kualitas gambar, namun dengan berkembangnya ilmu komputasi membuat manusia bisa mengambil informasi dari sebuah gambar. Dengan menggunakan citra (gambar) sebagai input, ditingkatkan kualitasnya dengan berbagai metode, misalnya menghilangkan noise, dan menghasilkan citra dengan kualitas lebih baik, sehingga menghasilkan informasi yang lebih baik.
2.5 Machine Learning
Machine learning bisa diartikan sebagai sebuah aplikasi komputer & algoritma matematika yang diangkat secara pembelajaran yang berasal dari data, yang kemudian menghasilkan prediksi di masa mendatang (Goldberg & Holland, 1988). Machine learning terbagi menjadi 3 kategori, yaitu:
2.5.1 Supervised Learning
Supervised learning adalah sebuah teknik machine learning yang bisa menerima
informasi data dengan cara membuat label. Teknik ini berguna untuk dapat membuat
target terhadap keluaran dengan membandingkan pengalaman belajar dari pengalaman
sebelumnya.
2.5.2 Unsupervised Learning
Unsupervised learning merupakan sebuah teknik machine learning yang dilakukan kepada data yang tak memilki informasi yang bisa diterapkan secara langsung. Teknik ini berguna untuk membantu menemukan struktur / pola tersembunyi dari data yang tak mempunyai label.
2.5.3 Reinforcement Learning
Reinforcement learning merupakan sebuah teknik pada machine learning yang dapat membuat agent software dan mesin bekerja secara otomatis untuk menentukan perilaku ideal sehingga dapat memaksimalkan kinerja algoritmanya.
2.6 Open Source Computer Vision Library (OpenCV)
OpenCV merupakan library open source untuk bahasa pemrograman C, C++, python, java, dan matlab dari intel untuk menyederhanakan programming terkait citra digital secara real-time. OpenCV bisa dengan mudah melakukan berbagai hal kompleks seperti mengenali wajah, mengidentifikasi objek, melacak objek bergerak, dan sebagainya. Penelitian ini menggunakan OpenCV untuk melakukan resize, grayscale, binary image, Gaussian blur, Canny, membaca, dan menulis gambar.
2.7 Probabilistic Neural Network (PNN)
Jaringan Neural Probabilistik (PNN) dikembangkan berdasarkan teori Bayesian untuk
probabilitas bersyarat dan Metode Parzen untuk memprediksi probabilitas fungsi
kepadatan variabel acak. PNN dapat didefinisikan sebagai implementasi algoritma
statistic yang disebut sebagai kernel analitik diskriminatif. Berdasarkan tentang
karakteristik PNN, PNN memiliki proses pelatihan cepat dan struktur paralel terpadu,
sehingga PNN dapat menemukan klasifikasi optimal sesuai dengan peningkatan data
pelatihan di mana data pelatihan dapat dimodifikasi tanpa pelatihan ulang data. Selain
itu, PNN memiliki waktu belajar lebih cepat jika dibandingkan dengan berbagai model
dari jaringan saraf tiruan, sehingga telah diterapkan di banyak kasus. Oleh karena itu,
PNN dapat digambarkan sebagai supervised neural network yang dapat
diimplementasikan pada klasifikasi pola (Nurrahmadayeni, 2017).
PNN memiliki 4 lapisan, yaitu lapisan input, pola, penjumlahan, dan output atau keputusan.
2.6.1 Lapisan Input (Input Layer)
Input layer merupakan masukan berupa vektor x dengan jumlah elemen sebanyak n, yang dimana vektor tersebut akan diklasifikasi pada salah satu kelas dari total keseluruhan M kelas.
2.6.2 Lapisan Pola (Pattern Layer)
Pattern layer merupakan lapisan untuk menghitung jarak (distance) antara vektor input dan vektor bobot pelatihan yang dipresentasikan oleh neuron. Pada lapisan pola dilakukan perkalian titik antara vektor x dengan vektor bobot pelatihan, yang kemudian hasilnya akan dimasukkan ke dalam fungsi radial basis Gaussian. Fungsi Gaussian ditunjukkan dalam Persamaan 2.1.
𝑓(𝑥) = exp(− (𝑥 − 𝑥
𝑖𝑗)
𝑇(𝑥 − 𝑥
𝑖𝑗) 2𝜎
2(2.1) Dimana :
𝑥 = vektor testing
𝑥
𝑖𝑗= vektor training ke j dari kelas i 𝜎 = spread / smoothing parameter
2.6.3 Lapisan Penjumlahan (Summation Layer)
Summation layer menerima input dari pattern layer yang terkait dengan kelas yang ada. Setiap kelas mempunyai 1 neuron. Pada neuron-neuron tersebut ditampung hasil penjumlahan dari tiap kelas dari lapisan pola. Persamaan summation layer dapat dilihat di Persamaan 2.2.
𝑝(𝑥) = 1
(2𝜋)
𝑑/2𝜎
𝑑𝑖 − 1
𝑁
𝑖∑ 𝑓(𝑥)
𝑖
𝑖=1
(2.2) Dimana :
𝑥
𝑖𝑗= vektor pelatihan ke j dari kelas i
𝜎 = spread / smoothing parameter
𝑁 = jumlah data latih pada kelas i
𝑑 = dimensi vektor x
2.6.4 Lapisan Output / Keputusan (Decision Layer)
Output layer adalah lapisan terakhir PNN yang berisi output berupa keputusan.
Lapisan ini menghasilkan sebuah vektor dengan panjang M elemen, yang dimana M merupakan banyaknya kelas. Vektor input x akan diklasifikasikan ke dalam kelas M, jika nilai p(x) indek ke M pada vektor output merupakan nilai terbesar jika dibandingkan dengan elemen lainnya.
Lebih jelasnya. Keempat lapisan PNN dapat dilihat di gambar 2.6.
Gambar 2.6. Lapisan PNN
Sumber : https://www.programmersought.com/
2.8 Resize
Resizing adalah proses mengubah ukuran pixel gambar menjadi lebih besar (upscale)
atau kecil (downscale) sesuai dengan keinginan dengan cara mengatur ukuran panjang
dan lebar gambar. Dalam melakukan pengolahan citra digital biasanya belum tentu
semua citra yang diproses memiliki ukuran citra yang sama. Dalam tahap resizing
dilakukan proses interpolasi citra atau proses pembuatan ulang data citra dari nilai-
nilai antara pixel yang ditetapkan. Pada penelitian ini menggunakan proses resizing
untuk mengubah ukuran citra menjadi lebih kecil agar jumlah pixel yang diolah tidak
telalu banyak hingga dapat meminimalisir waktu komputasi dengan algoritma
interpolasi citra nearest neighbor interpolation.
Nearest-neighbor Interpolation atau interpolasi tetangga terdekat ialah algoritma resizing atau pembuatan ulang citra dengan mengubah tiap nilai pixel dengan nilai pixel terdekat pada citra. Contoh penerapan nearest-neighbor interpolation dilakukan pada citra 2 dimensi seperti pada Gambar 2.7, untuk mengurangi ukuran gambar (downscale), neighbor terdekat dipilih dari 4 titik asal yang saling berbatasan dan kemudian menghitung nilai rata-rata dari ke empat nilai tersebut yang menjadi nilai pixel yang baru. Untuk meningkatkan ukuran gambar (upscale), nilai pixel diinterpolasi menjadi nilai pixel yang berulang berdasarkan ukuran pixel yang ditetapkan. Proses upscale dan downscale dapat melihat Gambar 2.7.
Gambar 2.7
.Resize Image
2.9 Gray-scale Image
Mengubah citra daun yang memilki berbagai macam warna menjadi warna putih, abu- abu, dan hitam dengan menggunakan grayscale. Untuk mengganti RGB menjadi grayscale, bisa diterapkan dengan mengambil seluruh piksel citra, yang selanjutnya mengambil informasi 3 warna dasar yaitu merah (red), hijau (green), dan biru (blue) (melalui fungsi warna to RGB), 3 warna ini akan ditambahkan dan dibagi 3 sehingga mendapatkan rata-rata yang kemudian akan digunakan untuk memberi warna pada piksel citra sehingga citra RGB menjadi grayscale. (Santi, 2011).
Grayscale image adalah citra keabuan yang memiliki warna gradiasi mulai dari
putih hingga hitam pada pixelnya. Untuk mendapatkan citra grayscale dilakukan
dengan mengubah citra warna RGB menjadi keabuan, 3 layer model warna RGB yaitu red, green, blue akan di sederhanakan menjadi 1 layer matriks keabuan dengan mencari rata-rata dari total nilai RGB yang ditunjukan pada Persamaan 2.3.
I = (R + G + B) / 3
(2.3) Dimana:
I = intensitas keabuan suatu piksel citra hasil grayscaling R = komponen merah pada suatu piksel
G = komponen hijau suatu piksel B = komponen biru suatu piksel
2.10 Binary Image
Mengkonversi citra ke binary image memiliki proses yang mirip dengan mengkonversi citra ke gray-scale, perbedaannya ialah warna rata-rata akan dibagi menjadi 2 kelompok, dengan ketentuan jika intensitas warna ialah 0 – 255, diambil nilai tengahnya, yaitu 127. Jika intensitas warna lebih rendah dari 127 maka warna akan menjadi hitam dan jika intensitas warna lebih tinggi dari 127 warna akan menjadi putih (Santi, 2011). Persamaan resize image dapat dilihat di Persamaan 2.4.
𝑔(𝑥, 𝑦) = { 0, 𝑗𝑖𝑘𝑎𝑓(𝑥, 𝑦) ≥ 𝑎 1, 𝑗𝑖𝑘𝑎𝑓(𝑥, 𝑦) < 𝑎
(2.4)
2.11 Gaussian Blur
Gaussian blur dinamai berdasarkan nama ahli matematika dan ilmuan, yaitu Carl Fredrich Gauss. Tahap Gaussian blur (penghalusan Gaussian) berfungsi untuk menghaluskan gambar, hal ini memungkinkan untuk mengurangi noise dan detail gambar sehingga mempermudah proses pengenalan gambar. Untuk menentukan elemen matriks kernel gauss pada posisi(i,j) dapat dilihat di Persamaan 2.5.
𝐺(𝑖, 𝑗) = 𝑐. 𝑒 − (𝑖 − 𝑢)
2+(𝑗 − 𝑣)
22𝜎
2(2.5)
Dimana:
𝒄𝐝𝐚𝐧𝝈 = konstanta
𝑮(𝒊, 𝒋) = elemen matriks kernel gauss pada posisi (𝒊, 𝒋) 𝒖𝒅𝒂𝒏𝒗 = indeks tengah dari matriks kernel gauss
2.12 Inverse Image
Inverse image merupakan proses membalik warna yang kontras dengan warna aslinya.
Proses inverse image berguna untuk memperjelas garis tepi sehingga bentuk daun terlihat jelas.
2.13 Canny Edge Detection
Garis tepi merupakan sebuah kontras antara permukaan tintaan dan garis pada jalan.
Metode ini sudah cukup berumur tapi masih banyak digunakan karena efektif untuk mendeteksi tepi. Metode ini dapat membuat garis-garis tepi daun dan tulang daun terlihat jelas.
Untuk melakukan canny edge detection, terdiri dari beberapa tahap. Tahap pertama ialah menghilangkan noise menggunakan Gaussian.Selanjutnya dilakukan pendeteksian tepi menggunakan salah satu operator deteksi tepi (Operator Sobel dan Prewitt) yang dapat dilakukan dengan cara horizontal (𝑮
𝒙) dan vertikal (𝑮
𝒚).
Persamaan deteksi tepi dapat dilihat di Persamaan 2.10.
|𝑮| = |𝑮
(2.10) Tahap selanjutnya ialah menghitung jarak gradient yang dapat dilihat di Persamaan 2.11.
|𝑮| = √𝑮𝒙
𝟐+ 𝑮𝒚
𝟐
(2.11)
Tahap berikutnya ialah membagi garis-garis yang telah ada menjadi empat
kelompok sesuai dengan sudutnya. Ketentuannya adalah sebagai berikut:
- Arah tepian menjadi 0 ̊ jika arah tepi adalah 0 ̊ - 22,5 ̊ , 157,5 ̊ , atau 180 ̊ . - Arah tepian menjadi 45 ̊ jika arah tepi adalah 22,5 ̊ - 67,5 ̊.
- Arah tepian menjadi 90 ̊ jika arah tepi adalah 67,5 ̊ - 112,5 ̊.
- Arah tepian menjadi 135 ̊ jika arah tepi adalah 112,5 ̊ - 157,5 ̊.
Tahap selanjutnya ialah mengecilkan garis tepi menjadi lebih tipis (non maximum suppression). Tahap terakhir ialah menerapkan proses binerisasi berdasarkan low & high threshold yang telah diberikan.
2.14 GLCM
Gray Level Co-Occurrence Matrix berguna untuk menganalisis piksel citra untuk mendeteksi tingkat keabuan yang sering terjadi. GLCM juga berfungsi untuk tabulasi tentang frekuensi kombinasi nilai pixel yang muncul pada suatu citra. (Xie, 2010).
Ekstraksi ciri dilakukan berdasarkan parameter contrast, dissimilarity, homogeneity, angular second moment (ASM), energy, correlation, dan entropy.
Rumus parameter contrast dalam GLCM ditunjukkan dalam Persamaan 2.13.
𝐶𝑜𝑛𝑡𝑟𝑎𝑠𝑡 = ∑ 𝑃
𝑖,𝑗(
𝑙𝑒𝑣𝑒𝑙𝑠−1
𝑖,𝑗=0
𝑖 − 𝑗)
2(2.13) Rumus parameter dissimilarity dalam GLCM ditunjukkan dalam Persamaan 2.14.
𝐷𝑖𝑠𝑠𝑖𝑚𝑖𝑙𝑎𝑟𝑖𝑡𝑦 = ∑ 𝑃
𝑖,𝑗|𝑖 − 𝑗|
𝑙𝑒𝑣𝑒𝑙𝑠−1
𝑖,𝑗=0
(2.14) Rumus parameter homogeneity dalam GLCM ditunjukkan dalam Persamaan 2.15.
𝐻𝑜𝑚𝑜𝑔𝑒𝑛𝑒𝑖𝑡𝑦 = ∑ 𝑃
𝑖,𝑗1 + (𝑖 − 𝑗)
2𝑙𝑒𝑣𝑒𝑙𝑠−1
𝑖,𝑗=0
(2.15)
Rumus parameter ASM dalam GLCM ditunjukkan dalam Persamaan 2.16.
𝐴𝑆𝑀 = ∑ 𝑃
𝑖,𝑗2𝑙𝑒𝑣𝑒𝑙𝑠−1
𝑖,𝑗=0
(2.16) Rumus parameter energy dalam GLCM ditunjukkan dalam persamaan 2.17.
𝐸𝑛𝑒𝑟𝑔𝑦 = √𝐴𝑆𝑀
(2.17) Rumus parameter correlation dalam GLCM ditunjukkan dalam Persamaan 2.18.
𝐶𝑜𝑟𝑟𝑒𝑙𝑎𝑡𝑖𝑜𝑛 = ∑ 𝑃
𝑖,𝑗[
(𝑖 − 𝜇𝑖)(𝑗 − 𝜇𝑗)
√(𝜎
𝑖2)(𝜎
𝑗2) ]
𝑙𝑒𝑣𝑒𝑙𝑠−1
𝑖,𝑗=0
(2.18) Rumus parameter entropy dalam GLCM ditunjukkan dalam Persamaan 2.19.
𝐸𝑛𝑡𝑟𝑜𝑝𝑦 = ∑ 𝑃
𝑖,𝑗𝑙𝑒𝑣𝑒𝑙𝑠−1
𝑖,𝑗=0
log 𝑃
𝑖,𝑗(2.19)
Dimana,
𝑃
𝑖,𝑗= elemen i,j dari GLCM simetris yang sudah dinormalisasi levels = angka tingkat grayscale
𝜇 = nilai rata-rata GLCM
𝜎
2= varians intensitas semua piksel referensi dalam hubungan yang berkontribusi pada GLCM
2.15 Confusion Matrix
Confusion matrix merupakan pengukuran performa dalam pengklasifikasian machine
learning, dimana outputnya berupa dua kelas atau lebih. Confusion matrix merupakan
tabel dengan empat kombinasi berbeda dari nilai prediksi dan nilai aktual. Nilai
prediksi ialah output program yang hasilnya benar atau salah. Nilai aktual ialah nilai
sebenarnya dimana nilainya true dan false. Empat kombinasi berbeda yang ada dalam
confusion matrix yaitu TP, TN, FP, dan FN.
2.14.1. True Positive (TP)
True positive adalah memprediksi positif dan hasilnya benar.
2.14.2. True Negative (TN)
True negative adalah memprediksi negatif dan hasilnya benar.
2.14.3. False Positive (FP)
False positive adalah memprediksi positif dan hasilnya salah.
2.14.4. False Negative (FN)
False negative adalah memprediksi negatif dan hasilnya salah.
Untuk menghitung nilai accuracy, precision, recall, dan F-1 score, dapat dilihat seperti di bawah ini.
- Accuracy menunjukkan seberapa akurat model dalam mengklasifikasi dengan benar.
𝐴𝑐𝑐𝑢𝑟𝑎𝑐𝑦 = (𝑇𝑃 + 𝑇𝑁) (𝑇𝑃 + 𝐹𝑃 + 𝐹𝑁 + 𝑇𝑁)
(2.20)
- Precision menunjukkan akurasi antara data yang diminta dengan hasil prediksi dari oleh model.
𝑃𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛 = 𝑇𝑃 (𝑇𝑃 + 𝐹𝑃)
(2.21)
- Recall atau sensitivity menunjukkan keberhasilan model dalam menemukan kembali sebuah informasi.
𝑅𝑒𝑐𝑎𝑙𝑙 = 𝑇𝑃
(𝑇𝑃 + 𝐹𝑁)
(2.22)
- F-1 Score menunjukkan rata-rata precision dan recall yang dibobotkan.
𝐹1𝑆𝑐𝑜𝑟𝑒 = (2 ∗ 𝑅𝑒𝑐𝑎𝑙𝑙 ∗ 𝑃𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛) (𝑅𝑒𝑐𝑎𝑙𝑙 + 𝑃𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛)
(2.23)
2.16 Penelitian Terdahulu
Beberapa penelitian sudah dilakukan untuk mengidentifikasi jenis tanaman berdasarkan daunnya. Diantaranya ialah penelitian oleh (Hutabarat, 2012) terkait identifikasi jenis shorea menggunakan Probabilistic Neural Network (PNN).
Penelitian tersebut menggunakan 100 citra daun yang mewakili 10 jenis tumbuhan Shorea. Penelitian ini melibatkan 10 fitur morfologi daun yaitu diameter, luas, keliling, aspect ratio, form factor, perimeter ratio of diameter, sudut daun, jarak tangkai-daun, dan jumlah tulang daun. Penelitian ini memiliki tingkat akurasi sebesar 84%.
Selanjutnya, penelitian oleh (Sayeed et al., 2013) yang berjudul Plant identification based on leaf shape and texture pattern using local graph structure.
Penelitian ini menggunakan 300 citra daun yang mewakili 50 spesies yang kemudian diproses menggunakan LGS. Penelitian ini dilakukan dengan cara menerapkan LGS pada data training dan data testing untuk mendapatkan histogram, kemudian kedua hasil tersebut dicocokkan dengan menerapkan fungsi korelasi. Penelitian ini menghasilkan tingkat akurasi sebesar 83,3%.
Penelitian selanjutnya ialah dari (Karima et al., 2014) terkait klasifikasi citra daun monokotil dan dikotil menggunakan Naïve Bayes. Penelitian ini dilakukan dengan cara mengolah 30 citra daun yang diolah dengan pre-proses grayscaling, binerisasi, image resizing, dan deteksi tepi. Kemudian diklasifikasi dengan Naïve Bayes. Lalu, Dilakukan ekstraksi fitur dan citra piksel. Penelitian ini menghasilkan tingkat akurasi sebesar 50%.
Penelitian selanjutnya ialah dari (Christy, 2015) terkait identifikasi tulang daun
monokotil dan dikotil dengan metode Manual Thresholding. Penelitian tersebut
menggunakan citra daun melati air sebagai tumbuhan monokotil dan daun jambu biji
sebagai tumbuhan dikotil. Penelitian ini dilakukan dengan cara citra diubah dari RGB
menjadi grayscale, dan kemudian segmentasi citra dengan metode manual
thresholding.
Penelitian berikutnya ialah dari (Padao & Maravillas, 2015) terkait klasifikasi tanaman berdasarkan bentuk dan tekstur daun menggunakan Naïve Bayes (NB) Classifier. Penelitian ini menggunakan 447 citra daun yang mewakili 30 spesies yang kemudian diproses menggunakan NB classifier. Penelitian ini menggunakan atribut seperti eksentrisitas, rasio aspek, panjang, soliditas, stokastik konveksitas, factor isoperimetri, kedalaman indentasi maksimal dan lobedness untuk menentukan bentuk daun. Sedangkan untuk menentukan tektur daun, penelitian ini menggunakan 7 variabel seperti intensitas rata-rata, kontras rata-rata, kehalusan, momen ketiga, keseragaman dan entropi. Penelitian ini menghasilkan tingkat akurasi sebesar 74,10%.
Terakhir ialah penelitian dari (Ilahiyah & Nilogiri, 2018) terkait identifikasi tumbuhan berdasarkan citra daun menggunakan Convolutional Neural Network (CNN). Penelitian ini menggunakan 2000 citra daun dengan 1800 citra untuk training dan 200 citra untuk testing. Penelitian ini menggunakan operasi konvolusi, Rectified Linear Unit (ReLU), pooling layer, dan softmax classifier. Tingkat akurasi dari penelitian ini ialah 85%.
Penelitian terdahulu yang telah dijelaskan dapat dilihat pada tabel 2.1.
Tabel 2.1. Penelitian Terdahulu
No. Judul Penelitian Peneliti Metode Keterangan 1 Identifikasi Jenis
Shorea Berdasarkan
Morfologi Daun Menggunakan Probabilistic Neural Network (2012)
Yuni
Purnamasari Hutabarat
Probabilistic Neural Network (PNN)
Penelitian menggunakan
100 citra daun yang
mewakili 10 jenis Shorea
yang kemudian diproses
menggunakan PNN dan
menghasilkan tingkat
akurasi sebesar 84%.
2 Plant identificatio n based on leaf shape and texture pattern using local graph structure (2013)
• Shohel Sayeed
• Jakir Hossen
• Ibrahim Yusof
• M. Fikri Azli A.
Local Graph Structure (LGS)
Penelitian menggunakan 300 citra daun yang kemudian diproses menggunakan LGS dan menghasilkan tingkat akurasi sebesar 83,3%.
3 Klasifikasi Citra Daun Monokotil dan Dikotil Menggunakan Naïve Bayes (2014)
• Lita Karima
• Niar Ariati
• Dynda Perwary
• Putranti Puji P.
• Anisa Rachmawati
Naïve Bayes (NB)
Penelitian menggunakan 30 citra daun yang kemudian diproses menggunakan NB dan menghasilkan tingkat akurasi sebesar 50%.
4 Identifikasi Tulang Daun Monokotil dan Dikotil dengan Metode Manual Thresholding (2015)
Laorency Fania Christy
Manual Thresholding
Penelitian menggunakan citra daun melati air sebagai tumbuhan monokotil dan daun jambu biji sebagai tumbuhan dikotil.
5 Using Naïve Bayesian Method for Plant Leaf Classification Based on Shape and Texture Features (2015)
• Francis Rey F. Padao
• Elmer A.
Maravillas
Naïve Bayes (NB)
Classifier
Penelitian meggunakan 447 citra daun yang mewakili 30 spesies yang kemudian diproses
menggunakan NB
classifier dan
menghasilkan tingkat akurasi sebesar 74,10%
6 Implementasi Deep Learning pada Identifikasi Jenis
• Sarirotul Ilahiyah
• Agung
Convolu- tional Neural Network
Penelitian menggunakan
2000 citra daun yang
kemudian diproses
Tumbuhan
Berdasarkan Citra Daun
Menggunakan Convolutional Neural Network (2018)
Nilogiri (CNN) menggunakan CNN dan menghasilkan tingkat akurasi sebesar 85%.
Dalam penelitian ini, penulis memiliki beberapa perbedaan dengan penelitian-
penelitian sebelumnya. Perbedaan penelitian terletak pada metode, data, dan jenis
tumbuhan. Penelitian yang dilakukan oleh penulis mengklasifikasikan tumbuhan
angiospermae berdasarkan bentuk tulang daun menggunakan PNN. Hasil dari
penelitian merupakan informasi nama dan jenis tumbuhan.
BAB 3
ANALISIS DAN PERANCANGAN SISTEM
3.1 Data yang digunakan
Data input yang digunakan berupa citra daun dari 10 jenis tumbuhan, yaitu 5 tumbuhan monokotil dan 5 tumbuhan dikotil. Data diperoleh secara manual, difoto menggunakan ponsel dan kamera dengan format file png. Tanaman yang digunakan merupakan tanaman dari BBI Hortikultura Gedung Johor dengan pencahayaan yang jelas sehingga bentuk dan tulang daun terlihat jelas. Contoh dari data yang digunakan dapat dilihat pada Gambar 3.1.
Gambar 3.1. Contoh citra digital daun
Terdapat 10 jenis tumbuhan yang digunakan citra daunnya. Untuk monokotil, tumbuhan yang digunakan adalah rambutan, manga, alpukat, durian, dan kelengkeng.
Sedangkan untuk dikotil, tumbuhan yang digunakan adalah pandan, bamboo, padi,
nanas, dan kurma. Jumlah data yang digunakan sebayak 1.800 citra yang kemudian
dibagi menjadi 2, yaitu untuk data training dan data testing. Contoh citranya yang
bisa dilihat pada Tabel 3.1. untuk tumbuhan monokotil dan Tabel 3.2. untuk tumbuhan
dikotil.
Tabel 3.1 Data monokotil Nama
Tumbuhan
Contoh Citra
Data Pelatihan
Data Pengujian
Jumlah Data
Pandan 172 43 215
Bambu 147 33 180
Tebu 128 32 160
Padi 123 37 160
Kurma 129 31 160
Jumlah Data - 700 176 875
Tabel 3.2 Data dikotil Nama
Tumbuhan
Contoh Citra
Data Pelatihan
Data Pengujian
Jumlah Data
Rambutan 127 33 160
Mangga 116 37 153
Alpukat 163 41 204
Durian 161 39 200
Lemon 172 36 208
Jumlah Data - 739 186 925
Data training bertujuan untuk melatih model sehingga dapat memahami
informasi-informasi pada data tersebut. Sedangkan, data uji bertujuan untuk
melakukan pengujian terhadap performa model yang telah dilatih. Bobot nilai masing-
masing data dapat dilihat pada Gambar 3.2.
Gambar 3.2. Bobot nilai data latih dan data uji
3.2 Analisis Sistem
Perancangan sistem pengklasifikasian tumbuhan Angiospermae berdasarkan bentuk tulang daun memiliki beberapa tahap . tahapan pertama merupakan data collecting.
Data yang digunakan adalah citra digital dari daun-daun tumbuhan yang akan digunakan. Penulis akan mengumpulkan beberapa citra digital yang kemungkinan akan digunakan untuk training. Selanjutnya untuk tahap testing, sistem akan berjalan seperti Gambar 3.3. Ketika citra telah diinput, sistem masuk ke tahap preprocessing, yaitu tahap untuk pengolahan data asli sebelum data diolah menggunakan PNN sebagai classifier. Pada tahap ini, citra diubah ukurannya sesuai dengan ketentuan agar lebih mudah diolah dan ukuran datanya tepat. Kemudian, citra akan diubah dari RGB menjadi gray-scale. Setelah itu, untuk mengidentifikasi nama tanaman, masuk ke tahap shape segmentation untuk pengklasifikasian nama tanaman berdasarkan bentuk daun. Dalam proses ini, terdapat tiga tahap. Pertama, citra akan diubah menjadi binary image, kemudian tahap menghilangkan noise menggunakan Gaussian blur.
Terakhir, citra yang telah diubah menjadi gambar biner, diubah menjadi inverse image-nya. Selanjutnya, untuk mengidentifikasi tanaman masuk ke kelompok dikotil atau monokotil, masuk ke tahap vein segmentation untuk mengambil bagian penting yang unik dari citra, yaitu tulang daun. Pertama, dilakukan Canny Edge Detection untuk mendeteksi garis tepi pada citra. Terakhir, binarization yaitu mengubah citra menjadi biner. Kemudian, citra diekstraksi menggunakan fitur GLCM yang terdiri dari contrast, correlation, energy, dissimilarity, ASM, homogeneity, dan entropy. Lalu masuk ke tahap PNN untuk mengklasifikasikan jenis tumbuhan berdasarkan citra yang telah diolah. Kemudian, hasil akan muncul. Adapun untuk memperjelas tahapan penelitian ini dapat dilihat pada Gambar 3.3.
1.439 data latih (80%) 361 data uji (20%)
Gambar 3.3. Arsitektur Umum
3.2.1 Pre-processing
Sebelum melakukan segmentasi dan klasifikasi, citra dipersiapkan dengan tahap preprocessing. Preprocessing terdiri dari 2 tahap, yaitu image resize dan RGB to gray- scale image.
3.2.1.1 Image Resize
Beberapa gambar memiliki ukuran citra yang berbeda-beda, karena itu untuk
mempermudah sistem bekerja, harus dibuat standar ukuran yang tepat dan citra yang
tidak sesuai dengan standar tersebut akan diubah menjadi seukuran standar. Ukuran standar dalam penelitian ini ialah 224 x 224 pixel.
- Fungsi resize dilakukan menggunakan library OpenCV. CV2.resize merupakan fungsi OpenCV untuk merubah ukuran gambar dengan sintaks
cv2.resize(src,dsize[,dst[,fx[,fy[,interpolation]]]])
. Fungsi resize memiliki dua parameter yang wajib dicantumkan, parameter pertama, yaitu souce dari gambar. Parameter keduanya ialah ukuran akhir yang diharapkan, yaitu 224x224. Untuk parameter-parameter lainnya yang tidak wajib dimasukkan ialah fx untuk sumbu horizontal (x), fy untuk sumbu vertikal (y), dan yang terakhir adalah interpolation untuk teknik resize yang digunakan.
- Teknik resize yang digunakan ialah bilinear interpolation, yang dimana merupakan salah satu jenis interpolasi. Billinear interpolation merupakan penulisan kembali atau pembuuatan ulang dengan mengubah nilai dengan nilai terdekat. Billinear interpolation menjadi teknik default untuk fungsi resize, karena itu tidak perlu dicantumkan.
3.2.1.2 Gray-scale Image
Mengubah citra daun yang memilki berbagai macam warna menjadi warna putih, abu- abu, dan hitam dengan menggunakan grayscale. Untuk mengganti RGB menjadi grayscale, bisa diterapkan dengan mengambil seluruh piksel citra, yang selanjutnya mengambil informasi 3 warna dasar, yaitu red, green, dan blue (melalui fungsi warna to RGB), 3 warna ini akan ditambahkan dan dibagi 3 sehingga mendapatkan rata-rata yang kemudian akan digunakan untuk memberi warna pada piksel citra sehingga citra RGB menjadi grayscale. (Santi, 2011).
Citra daun sesudah dilakukan image resize dan sesudah diubah menjadi gray- scale dapat dilihat di Gambar 3.4.
img = cv2.resize(img,(224,224))
Gambar 3.4. Citra daun asli (kiri), citra daun sesudah diubah dilakukan preprocessing (kanan)
Langkah proses gray-scale yang dilakukan di penelitian ini bisa dilihat di bawah ini.
- Membaca citra menggunakan fungsi imread dari library OpenCV.
CV2.imread memiliki sintaks
CV2.imread(path,flag). CV2.imread berfungsi untuk membaca gambar dari path file yang diberikan. Gambar akan diproses tergantung dengan flag yang diberikan. Flag memiliki default 1 yang berarti color, atau gambar berwarna. Nilai flag 0 akan membaca gambar menjadi gray-scale seperti cara di atas, dan nilai flag -1 yaitu untuk membaca gambar beserta alpha channelnya. Jika citra merupakan gambar berwarna, maka nilai keabuan tiap piksel akan dihitung dengan mengambil rata-rata nilai warna dan membacanya dengan array.
Berikut adalah penjelasan implementasi proses gray-scale image dengan representasi data berukuran 3x3 seperi Gambar 3.5.
Gambar 3.5. Citra daun sebelum melalui proses gray-scale
img = cv2.imread(filename[3],0)