• Tidak ada hasil yang ditemukan

Vol.1 No.6 Nopember KLASIFIKASI SPESIES LEBAH BERBASIS DATA CITRA DENGAN METODE SUPPORT VECTOR MACHINE

N/A
N/A
Protected

Academic year: 2021

Membagikan "Vol.1 No.6 Nopember KLASIFIKASI SPESIES LEBAH BERBASIS DATA CITRA DENGAN METODE SUPPORT VECTOR MACHINE"

Copied!
6
0
0

Teks penuh

(1)

………..

ISSN 2722-9475 (Cetak) Jurnal Inovasi Penelitian

ISSN 2722-9467 (Online)

KLASIFIKASI SPESIES LEBAH BERBASIS DATA CITRA DENGAN METODE SUPPORT VECTOR MACHINE

Oleh Ariyadi

Informatika, Institut Teknologi Kalimantan Email: ariyadi@lecturer.itk.ac.id

Abstrak

Kemampuan sistem yang mampu membedakan spesies lebah dari citra adalah suatu tantangan yang memungkinkan peneliti bergerak cepat dan efektif dalam pengumpulan data lapangan. Lebah yang melakukan penyerbukan memiliki posisi penting dalam ekologi dan agrikultur. Lebah bumble dan lebah madu sering kali membingungkan karena kedua spesies tersebut memiliki kemiripan. Sehingga perlu dikembangkan sistem klasifikasi spesies lebah, lebah madu atau lebah bumble berbasis citra digital. Data awal yang disiapkan dalam penelitian ini adalah 500 data citra lebah yang masing-masing 250 citra lebah madu dan 250 citra lebah bumble. Penelitian ini menerapkan Support Vector Machine (SVM) untuk melakukan klasifikasi dengan mempelajari fitur-fitur dari 70% data citra yang ada dan disertai dengan label. Kemudian menguji hasil pelatihan data terhadap 30% data citra yang tersisa. Untuk memaksimalkan proses komputasi, fitur data telah diolah dengan Histogram of Oriented Gradient (HOG) dan Principal Component Analysis (PCA). Hasil akhir penelitian ini menunjukkan bahwa model yang telah dibangun dengan metode SVM menghasilkan tingkat akurasi 74%.

Kata Kunci: Citra, HOG, Klasifikasi, PCA & SVM PENDAHULUAN

Lebah bumble dan lebah madu sering kali membingungkan karena kedua spesies tersebut memiliki kemiripan. Keduanya memiliki populasi yang besar di kawasan tropis dan Amerika dan betina dari kedua tipe tersebut membawa serbuk bunga (pollen) di dalam corbiculae, atau biasa disebut keranjang pollen. Kebanyakan spesies lain dari lebah membawa pollen di kaki belakangnya dengan menempelkan di bulu kaki yang disebut dengan scopa. Namun pollen di scopa dan pollen di corbiculae terlihat sangat berbeda. Lebah bumble membawa pollen di dalam corbiculae dibungkus dengan rapat, dan serbuknya terikat dengan nectar yang membentuk bola padat dan berkilau. Pollen yang dibawa di scopa akan terlihat buram, menggumpal, dan ringan. Gambar 1 menunjukkan proses penyimpanan pollen di tubuh lebah.

Gambar 1 (a) Pollen yang dibawa lebah bumble berada di corbicula (b) Pollen yang dibawa lebah bumble atau lebah madu berada di scopa

(a) (b)

Beberapa negara hanya memiliki satu spesies lebah madu [1], namun terdapat 40 spesies dari lebah bumble. Hal ini berarti bahwa lebah madu yang ditemukan akan terlihat sama ketimbang lebah bumble. Lebah madu memiliki belang yang sempit di bagian perutnya danmemiliki corak kuning dan emas, coklat, abu-abu, atau hitam. Lebah bumble memiliki belang yang lebar berwarna hitam hingga jingga, kuning, dan putih. Belang tersebut dimulai dari kepala hingga bagian

(2)

……….. belakang. Perbedaan spesies dari lebah bumble

meliputi warna dan ukuran.

Kedua spesies lebah memiliki rambut, namun lebah bumble memiliki rambut yang kaku. Rambut tersebut menutupi sebagian besar bagian dari lebah dari kepala hingga ujung perut. Sedangkan rambut dari lebah madu kebanyakan berkisar pada sisi depan dari tubuhnya.

Kemampuan sistem yang mampu mengidentifikasi spesies lebah dari citra adalah suatu tantangan yang memungkinkan peneliti bergerak cepat dan efektif dalam pengumpulan data lapangan. Lebah yang melakukan penyerbukan memiliki posisi penting dalam ekologi dan agrikultur. Hal ini juga menghindarkan dari fenomena Colony Collapse Disorder (CCD), sebuah fenomena abnormal yang terjadi ketika koloni lebah pekerja dari lebah madu menghilang dan meninggalkan sarangnya [2]. Fenomena ini menyebabkan penurunan ekonomi yang signifikan bagi peternak lebah untuk produksi madu. Penurunan jumlah lebah pekerja ini menyebabkan peningkatan biaya petani hingga 20 % dalam produksi madu karena harus menyewa jasa penyerbukan. Identifikasi beragam spesies lebah di alam liar membuat pemahaman tentang penyebaran dan pertumbuhan serangga ini.

METODE PENELITIAN

Klasifikasi dilakukan dengan membangun machine learning pipeline, alur kerja dari mengolah data yang disediakan kemudian diambil fitur penting dari data tersebut untuk dipelajari oleh mesin sehingga mendapatkan model yang sesuai untuk mengidentifikasi data yang baru (Gambar 2).

Gambar 2. Proses Pemelajaran Mesin (Machine Learning Pipeline)

Input data

Data berupa citra RGB lebah berukuran 100x100 pixel dengan ekstensi jpg yang berjumlah 500 citra. Citra tersebut disertai dengan label berupa angka, 1 untuk lebah madu dan 0 untuk lebah bumble. Gambar 3 menunjukkan sampel citra yang digunakan untuk dataset.

Gambar 3 (a) Lebah Madu dengan label 1 (b) Lebah Bumble dengan label 0

(a) (b)

Pre-processing

Pada fase pre-processing, citra dimanipulasi ke dalam skala keabuan (greyscale) dengan formula (1):

𝑌 = 0.2125𝑅 + 0.7154𝐺 + 0.0721𝐵

(1)

Pada dasarnya, data citra direpresentasikan dengan matriks, yang mana kedalaman merupakan jumlah dari kanal warna. Citra RGB memiliki tiga kanal (merah, hijau, dan biru), sedangkan skala keabuan hanya memiliki satu kanal. Citra asli memiliki dimensi 100x100x3, namun setelah dimanipulasi menjadi skala keabuan, citra tersebut hanya memiliki satu kanal dengan dimensi 100x100x1. Hal ini akan mempercepat

(3)

………..

ISSN 2722-9475 (Cetak) Jurnal Inovasi Penelitian

ISSN 2722-9467 (Online)

proses komputasi. Gambar 4 menunjukkan citra yang telah dikonversi ke dalam skala keabuan. Feature extraction

Feature extraction bertujuan untuk mengambil fitur penting yang ada di dalam citra sehingga algoritma yang dibangun dapat dengan mudah memahami dari data. Teknik visi komputer tradisional sangat bergantung pada transformasi matematika untuk mengubah citra menjadi fitur yang berguna. Sebagai contoh, deteksi tepi dari obyek di dalam citra bisa dilakukan dengan meningkatkan kontras [3] atau menyaring warna tertentu [4].

Gambar 4 Citra skala keabuan lebah bumble

Metode yang digunakan untuk feature extraction dalam kasus ini menggunakan deskriptor Histogram of Oriented Gradients (HOG) [5]. Ide di balik HOG adalah bentuk obyek di dalam citra yang dideteksi berdasarkan tepi dengan memperhatikan intensitas dari gradien kecerahan dari citra tersebut. Citra dibagi berdasarkan kolom-kolom sesuai piksel dan piksel tersebut dihitung histogram dari arah gradiennya. Gambar 5 menunjukkan hasil konversi citra lebah bumble dengan HOG.

Gambar 5 Citra lebah bumble setelah diproses dengan HOG

Agar dapat meningkatkan invarian guna memberikan penekanan dan bayangan dari citra, kolom-kolom tersebut dilakukan normalisasi blok, nilai intensitas dihitung berdasarkan area yang lebih besar dari citra, disebut dengan blok. Kemudian digunakan untuk memberikan normalisasi kontras kepada histogram dari kolom pada setiap blok. Faktor normalisasi yang digunakan dalam kasus ini adalah L2-hys, yang mana memiliki kemiripan dengan L2-norm hanya saja dilakukan pembatasan maksimal v hingga 0.2 dan dilakukan normalisasi ulang dari hasil L2-norm dengan formula yang sama (2). Setiap kolom mengambil 16x16 pixel dari data. Data HOG yang didapatkan adalah 1296 fitur.

𝑓 = 𝑣

√‖𝑣‖22+ 𝑒2

(2)

Setelah dilakukan fitur dari HOG, data citra skala keabuan digabungkan dengan data HOG, sehingga fitur yang dimiliki saat ini adalah 31296 fitur.

Kebanyakan metode machine learning bekerja dengan baik pada data dengan menghilangkan rata (mean) atau nilai rata-rata adalah 0 dan mengubah skala data ke dalam variansi unit. Formula yang digunakan untuk menstandarisasi skala tersebut ditunjukkan pada formula (3).

𝑓 =𝑥 − 𝑢

(4)

……….. Di mana, u adalah rata-rata dari sampel

latih, dalam hal ini diatur menjadi nol, x adalah data, dan s adalah deviasi standar dari sampel latih. Saat ini, setiap citra memiliki 31296 fitur dengan jumlah citra sebanyak 500. Model yang digunakan dalam penelitian ini adalah Support Vector Machine (SVM) [6], yang mana untuk meningkatkan performa, diperlukan pengurangan fitur yang dimiliki saat ini. Metode yang digunakan untuk pengurangan jumlah fitur adalah Principal Component Analysis (PCA) [7].

PCA melakukan transofrmasi seluruh data ke dalam ukuran fitur yang lebih kecil, disebut dengan komponen. Misalkan, matriks transformasi W berukurang d x k yang berguna untuk memetakaan vector x ke dalam ruang bagian dari fitur berukuran k-dimensi yang mana memiliki dimensi lebih sedikit dari ruang fitur asli berukuran d-dimensi seperti formula (4).

(4)

Gambar 6 menunjukkan contoh penerapan citra dengan 784 komponen ke dalam 59 komponen. Dalam kasus ini, komponen yang disimpan adalah 500 komponen, sehingga matriks dari fitur hanya memiliki 500 kolom ketimbang 31296.

Gambar 6 Contoh Penerapan PCA

Split Dataset

Pada proses ini, data dibagi ke dalam dua tipe, training data dan test data, dengan persentase 70% untuk training data dan 30% untuk test data. Pembagian data dilakukan secara acak namun diberikan nilai random state agar pengacakan tetap konsisten.

Train Model

Model yang digunakan adalah SVM, model bertipe supervised machine learning yang digunakan dalam kasus regresi, klasifikasi, dan deteksi outlier. Model SVM adalah representasi dari data yang dibuat sebagai titik-titik pada suatu ruang, sampel-sampel tersebut dikelompokkan sesuai labelnya dan dibuat garis pemisah yang dibuat selebar mungkin disebut dengan kernel. Data baru yang dipetakan ke dalam ruang yang sama akan diprediksi berdasarkan masuk area mana data tersebut ketika diletakkan.

Gambar 7 Contoh Visualisasi Pemisahan Dua Kelompok Label dengan Kernel Linear

Gambar 8 menunjukkan contoh visualisasi data dari dua label/ kelas yang berbeda menggunakan metode SVM dengan kernel linear.

Mengingat kasus yang dihadapi adalah klasifikasi, apakah citra yang dimaksud lebah madu atau lebah bumble, maka digunakan modul support vector classifier (SVC) [8], salah satu modul dari SVM. Formula dari SVC ditunjukkan pada (5). Kondisi acak dibangun dalam model ini sehingga membangun nilai kemungkinan terkait klasifikasi dari citra. Kondisi lain yang diatur adalah random state, yang mana dapat menjamin data teracak dalam kondisi yang konsisten, sehingga hasil dari model tidak akan berubah jika dijalankan kembali.

(5)

………..

ISSN 2722-9475 (Cetak) Jurnal Inovasi Penelitian

ISSN 2722-9467 (Online) 𝑚𝑖𝑛 𝑤,𝑏,𝜁 1 2𝑤𝑇𝑤 + 𝐶 ∑ 𝜁𝑖 𝑛 𝑖=1 subject to 𝑦𝑖(𝑤𝑇𝜙(𝑥 𝑖) + 𝑏) ≥ 1 − 𝜁𝑖, 𝜁𝑖 ≥ 0, 𝑖 = 1, . . . , 𝑛 (5)

HASIL DAN PEMBAHASAN

Setelah model dilatih dengan metode SVC, model tersebut digunakan untuk melakukan prediksi kepada test data. Hal ini bertujuan untuk membuktikan seberapa baik model dalam mengidentifikasi citra, perhitungan akurasi dilakukan dengan membandingkan hasil prediksi label dari test data dengan label sesungguhnya pada test data. Akurasi adalah jumlah prediksi benar dibagi dengan jumlah prediksi (6). Kadang kala hasil akurasi bisa salah kaprah, namun karena jumlah data lebah madu dan lebah bumble sama, metrik ini adalah metrik yang sesuai untuk masalah ini.

acc(𝑦, 𝑦^) = 1 𝑛s ∑ 1(𝑦 ^ 𝑖 = 𝑦𝑖) 𝑛s−1 𝑖=0 (6)

Hasil akurasi yang didapatkan dari pengujian test data terhadap model adalah 0.68, dengan hanya memprediksi nilai 0 atau 1 dari setiap citra pada test data, tanpa mempertimbangkan nilai probabilitas.

Pengujian lain dilakukan dengan memperhatikan probabilitas dari suatu citra tersebut lebah madu atau lebah bumble. Pengujian dilakukan ke data pertama (Gambar 8) pada dataset yang mana merupakan citra lebah bumble. Hasil pengujian dengan disertai probabilitas menghasilkan nilai [0.46195176, 0.53804824], yang berarti bahwa 46% kemungkinan citra tersebut adalah lebah madu dan 54% kemungkinan citra tersebut adalah lebah bumble. Total dari dua probabilitas setiap citra adalah 1.

Dengan hasil tersebut, maka diatur bahwa probabilitas di atas 50% mengacu pada kelompok label 1 (lebah bumble) dan di bawah nilai tersebut masuk ke kelompok label 0 (lebah madu).

Gambar 8 Citra dengan probabilitas 46% lebah madu dan 54% lebah bumble

Namun nilai ambang bisa disesuaikan untuk mencari kondisi optimal. Kemudian digunakan kurva Receiver Operating Characteristic (ROC) [9] untuk mengevaluasi model yang menampilkan tingkat false positive dan true positive pada nilai ambang yang berbeda. Nilai Area Under the Curve (AUC) juga dikalkulasi, yang mana 1 berarti setiap prediksi dari label adalah benar.

Gambar 9 Kurva ROC Hasil Penelitian

Umumnya, nilai terburuk dari AUC adalah 0.5, yang merupakan performa dari model dengan prediksi acak. Hasil dari AUC dalam kurva ROC kasus klasifikasi lebah adalah 0.74 seperti yang ditunjukkan pada Gambar 9.

PENUTUP Kesimpulan

Model untuk klasifikasi lebah madu dan lebah bumble mampu membedakan dua jenis lebah tersebut dengan kemungkinan 70%. Hal ini sudah cukup baik mengingat data yang dimiliki hanay sekitar 500 data dan metode

(6)

……….. yang digunakan sangat bergantung pada

ekstraksi fitur yang cukup berat secara komputasi. Penelitian lanjutan yang dibutuhkan untuk memaksimalkan akurasi dari hasil identifikasi adalah dengan menambah data citra dari lebah, menambah fitur baru, atau menggunakan metode lain yang cocok terhadap data bertipe citra digital. Hal lain yang bisa dilakukan adalah dengan menambahkan data baru dengan label yang berbeda atau jenis lebah yang berbeda dari dua sebelumnya, sehingga permasalahan menjadi multi-klasifikasi, tidak hanya klasifikasi biner.

DAFTAR PUSTAKA

[1] López-Uribe, M.M., Simone-Finstrom, M. (2019) Special Issue: Honey Bee Research in the US: Current State and Solutions to Beekeeping Problems. Insects, 10, 22. Doi:10.3390/insects10010022

[2] vanEngelsdorp, D, et al., (2009). Colony Collapse Disorder: A Descriptive Study. Epidemiological Survey of CCD. 4. 1-17. Diakses dari http://journals.plos.org

[3] Roomi, Mansoor & Ganesan, G.Maragatham. (2015). A Review of Image Contrast Enhancement Methods and Techniques. Research Journal of Applied Sciences, Engineering and Technology. 9. 309-326. Doi: 10.19026/rjaset.9.1409. [4] Ariyadi (2012). Penilaian Kualitas Nyala

Api Las Menggunakan Webcam dengan metode Backpropagation. Tersedia dari EEPIS Repository. Diakses dari http://repo.pens.ac.id/1545/

[5] Dalal, N. and Triggs, B., (2005). Histograms of Oriented Gradients for Human Detection. IEEE Computer Society Conference on Computer Vision and Pattern Recognition. 886-893. Doi:0.1109/CVPR.2005.177.

[6] Evgeniou, Theodoros & Pontil, Massimiliano. (2001). Support Vector Machines: Theory and Applications. 2049. 249-257. Doi: 10.1007/3-540-44673-7_12. [7] Mishra, et al. (2017). Principal Component Analysis. International Journal of

Livestock Research. 1. Doi: 10.5455/ijlr.20170415115235.

[8] Ladicky, Lubor & Torr, Philip. (2011). Linear Support Vector Machines. ICML, 985-992. Diakses dari

https://www.semanticscholar.org

[9] Hajian-Tilaki K. (2013). Receiver Operating Characteristic (ROC) Curve Analysis for Medical Diagnostic Test Evaluation. Caspian journal of internal medicine, 4(2), 627–635. Diakses dari https://www.ncbi.nlm.nih.gov

Gambar

Gambar  2.  Proses  Pemelajaran  Mesin  (Machine Learning Pipeline)
Gambar  4  Citra  skala  keabuan  lebah  bumble
Gambar 6 Contoh Penerapan PCA
Gambar  8  Citra  dengan  probabilitas  46%  lebah madu dan 54% lebah bumble

Referensi

Dokumen terkait

Berkaitan dengan upaya meningkatkan prestasi belajar di kelas V pada mata pelajaran mata pelajaran Al Qur’an Hadist dan analisa terhadap pemanfaatan metode

Komunikasi merupakan dasar dari kehidupan. Manusia tidak pernah bisa lepas dari komunikasi, karena komunikasi merupakan salah satu cara manusia sebagai makhluk

Oleh karena itu dibentuklah Gabungan Petani Pemakai Pupuk (GP3) , Gabungan Petani Pemakai Pupuk (GP3) adalah suatu kelompok atau gabungan yang terdiri dari beberapa

Penelitian ini bertujuan untuk menguji pengaruh pestisida nabati lasekiku (lengkuas - serai wangi - kipahit - kunyit), buah bitung (Barringtonia Asiatica), serta

menindaklanjuti kendala tersebut, yaitu dengan menyampaikan indikator penilaian yang akan disampaikan pada hari itu, merencanakan dan mengatur dengan baik kegiatan pembelajaran

Sedangkan dalam masyarakat Jawa dijadikan sebagai simbol penjagaan pada sebuah bangunan, sebagai seni dekorasi pada gamelan, sebagai lambang penjaga dunia bawah

Perubahan ini antara lain terlihat, pada bahasa pengantar yang digunakan, termasuk juga fungsi yang semakin khusus cukup menonjol, misalnya pada saat-saat musim

Capaian kinerja Tujuan Strategis 5 “Meningkatnya kapasitas aparat pengawasan intern pemerintah yang profesional dan kompeten di wilayah Perwakilan BPKP Provinsi