Fakultas Ilmu Komputer
Universitas Brawijaya
5272
Klasifikasi Masa Panen Varietas Unggul Kedelai menggunakan Support Vector Machine (SVM)
Abas Saritua Gultom1, Muhammad Tanzil Furqon2, Sutrisno3
Program Studi Teknik Informatika, Fakultas Ilmu Komputer, Universitas Brawijaya Email: 1abassgultom@gmail.com, 2m.tanzil.furqon@ub.ac.id, 3sutrisno@ub.ac.id
Abstrak
Kedelai adalah komoditas pertanian dibutuhkan banyak di Indonesia, karena kedelai banyak dikonsumsi dalam berbagai produk makanan, kedelai juga digunkan sebagai bahan baku industri. Petani kedelai perlu mengetahui tumbuhan kedelai tersebut termasuk kedalam jenis apa benih yang akan ditanam, sehingga peningkatan produksi tanaman kedelai tetap terjaga. Untuk memudahkan proses nya akan digunakan data dari berbagai jenis kedelai. Penelitian tersebut akan menggunakan metode Support Vector Machinee alasan menggunakan Support Vectorr Machiine karena dapat mengeneralisasi yang tinggi tanpa harus memiliki datasett tambahaan. Dalam penilitian ini terdapat 6 variabel dan objek yang dimiliki 3 kelas yaitu umur genjah, umur sedang, dan umur dalam. Hasil pengujian terbaik menggunakan kernel polynomial degree 2, dengan menggunkan nilai lamda (λ) sebesar 10, Konstanta 1, Epsilon 0.01 dan iter maks sebesar 10. Berdasarkan berbagai pengujian dan skenario yang telah dilakukan, nilai evaluasi terbaik dihasilkan pada pengujian menggunakan K-Fold Cross Validation dengan nilai K= 5 dan menghasilkan nilai akurasi sebesar 56.666%.
Kata kunci : Varietas unggul kedelai, SVM (Support Vector Machine), K-means.
Abstract
Soybean is an agricultural commodity that is very much needed in Indonesian, because soybeans are widely consumed in various food products, soybeans are also used as industrial raw materials. Soybean farmers need to know what type of soybean plant is included in the seeds to be planted, so that the increase in soybean production is maintained. To facilitate the process, data from various types of soybeans will be used. The research will be conducted using the SVM (Support Vector Machine) method because the SVM method can generalize high without having to have additional datasets. In this study, there were 6 variables and objects belonging to 3 classes, namely early age, medium age, and deep age.
The best test results use a polynomial degree 2 kernel, using the lamda (λ) value of 10, Constant 1, Epsilon 0.01 and iter max of 10. Based on various tests and scenarios that have been carried out, the best evaluation value is generated in tests using K-Fold Cross Validation with a value of K = 5 and produces an accuracy value of 56.666%.
Keywords : Superior soybean varieties, SVM (Support Vector Machine), K-means.
1. PENDAHULUAN
Kebutuhan kedelai di Indonesia setiap tahunnya selalu meningkat seiring berjalannya waktu dengan pertambahan penduduk dan perbaikan pendapatan perkapita. Oleh karena itu, perlu dilakukan penyuplaian kedelai yang harus di impor karena produksi di dalam negeri belum mencukupi kebutuhan tersebut. Lahan budidaya kedelai pun diperluas produktivitasnya sehingga dapat meningkatkan kebutuhan penduduk.
Kedelai (Glycine max L. Meril) adalah produk pertanian yang selalu dibutuhkan di
negara Indonesia, yang dimanfaatkan untuk berbagai macam jenis olahan yaitu tahu, tempe, susu, kecap dan berbagai jenis produk yang ingin di olah. Protein yang terdapat dalam tanaman kedelai sangat tinggi dan menjadi sumber protein alternative bagi masyarakat. Kedelai dapat dimanfaatkan menjadi bahan baku industry, bahan penyegar kemudian bahan limbah dari tumbuhan kedelai diolah Kembali untuk dijadikan pakan bagi para peternak (Riawati, Aslim rasyad, 2016).
Varietas berperan penting dalam produksi
kedelai, karena pada saat mencapai hasil produksi kedelai yang tinggi sangat ditentukan oleh potensi genetiknya. Potensi hasil yang terdapat di lapangan dipengaruhi oleh interaksi antara factor genetik dengan pengelolaan kondisi lingkungan. Bila pengelolaan lingkungan lingkungan tidak dilakukan dengan baik, potensi daya hasil biji yang tinggi dari varietas unggul tidak dapat tercapai (Irwan, 2006).
Metode yang akan digunakan dalam peneiitian ini adalah metode Support Vector Machine (SVM).Peneiitian yang dillakukan dalam pengklasifikasian jenis ikan menyatakan Support Vector Machine (SVM) mempunyai tingkat akurasi sebesar 78,59% (Ogunlana et al., 2015).
Penelitian yang telah dilakukan “KNN and SVM Classification for Chainsaw Sound Identification in the Forest Areas”. Pengkajian ini dilakukan untuk menguji perbandingan kedua metode yaitu SVM dan KNN untuk mengidentifikasi suara gergaji di kawasan hutan.
Pada metode KNN diperoleh akurasi sebesar 94.02% dan pada metode SVM diperoleh akurasi sebesar 95.63% (GNAMELE et al., 2019).
2. TINJAUAN PUSTAKA 2.1 Klasifikasi
Pengklasifikasi adalah kelompok data dan objek yang diperbarui ke dalam kelas dengan atribut tertentu. Untuk melakukan ini, cari variabel di grup yang tersedia. Klasifikasi tersebut bertujuan untuk memprediksi kelas fitur yang sampai saat ini belum diketahui (Nasution et al., 2019).
Klasifikasi memiliki tiga tahap, pertama pengembangan model, kemudian implementasi model, dan terakhir evaluasi.Pengembangan model membangun model dengan menggunakan data latih yang sudah memiliki atribut kelas.
Selain itu, data diterapkan untuk mendefinisikan kelas data dan objek baru. Kemudian mengevaluasi data untuk melihat akurasi dari pengembangan model dan aplikasi ke data baru.
Ada dua fase untuk klasifikasi. Tahap pertama adalah tahap pembelajaran di mana Anda membangun model menggunakan data yang diperoleh. Tahap kedua adalah tahap uji coba.
Pengujian model dilakukan dengan menggunakan data lain untuk mengetahui keakuratan model. (Nasution et al., 2019).
2.2 Masa Panen Varietas Unggul Kedelai
Masa panen varietas unggul kedelai terdiri dari kedelai umur genjah yang berarti dapat dipanen dengan cepat, kemudian kedelai umur sedang yaitu varietas yang dapat dipanen lebih lama daripada umur genjah, kemudian umur dalam yaitu varietas unggul kedelai yang dapat dipanen yang lebih lama dipanen daripada umur genjah dan umur sedang.
2.3 Support Vector Machine (SVM)
Tujuan dari support vector machine (SVM) adalah untuk menemukan fungsi overtaking classifier terbaik sehingga dapat memisahkan 2 kelas di ruang input. Jalur menyalip terbaik dapat ditemukan dengan mengukur margin jalur menyalip yang diperoleh dengan menggunakan aturan kernel untuk mengukur margin maksimum antara ruang input nonlinier dan ruang fitur (Putri et al., 2015).
SVM dapat dibagi menjadi dua bagian, yaitu SVM linier, yaitu data yang dipisahkan secara linier, memisahkan dua kelas pada hyperplane dengan batas lunak, dan kemudian SVM nonlinier menerapkan fungsi teknik kernel ke ruang berdimensi tinggi (Racchman &
Purnami, 2012).
Support Vector Machine Iinear adalah pengimplementasian secara liniear.
Pengklasifikasian linier akan diselesaikan dengan mencai garis yang pembatas (hyperlane) dengan 𝑓(𝑤,𝑏)= 𝑥𝑖 ∗ 𝑤+𝑏 yang mmemisahkan data positip dan negative (Vijayakumar & Wu, 1999).
Selanjutnya akan dilakukan Langkah yang berikutnya yaitu perhitungan matriks hessian:
Dij = 𝑦𝑖𝑦𝑗(𝐾(𝑥𝑖𝑥𝑗) + 𝜆2) (1) Keterrangan:
xi = data ke-i xj = data ke-j
yi = kelas data ke-i uj = kelas data ke-j n = jumlah data
pelenitian ini menggunakan kerneI polynomial degree 2. Persamaan tersebut menggunakan persamaan 2.2:
𝐾 (𝑥,𝑦)= (𝑥 ∗𝑦+𝑐)𝑑 (2) Selanjutnya akan dilakukan perhitungan error rate dengan persamaan berikut:
Fakultas Ilmu Komputer, Universitas Brawijaya
𝐸𝐼= ∑𝑖𝑗=1𝑎𝑗𝐷𝑖𝑗 (3)
Menghitung nilai delta alpha dengan persamaan:
𝛿𝛼
𝑖= min {max[y (1-𝐸
𝑖)-α
𝑖] C-α
𝑖} (4)
Persamaan menghitung nilai iα𝑖:
α
𝑖= α
𝑖+ 𝛿𝛼
𝑖(5)
Penjelasan:α𝑖 = alfa ke-i
Dij = matriks hessian Ei i= error rate C = Konstanta 𝛿𝛼𝑖 = delta alfa ke-i
Selanjutnya akan dilakukan perhitungan nilai bias:
𝑏=− 1
2 [∑1𝑛= 1(𝑤∗𝑥+)+
∑ = 1
1𝑛 (𝑤∗𝑥−)𝑛𝑖=1]Keterangan:
𝛼𝑖 = alfa ke-𝑖
𝑦𝑖 = kelas data latih ke-𝑖 b = bias
𝐾 (𝑥𝑖,𝑥𝑗) = fungsi kernel 𝑛 = jumlah data
𝑥 = data uji 𝑛 = jumlah data w = nilai bobot
Kemudian Langkah selanjutnya yaitu mencari hasil klasifikasi dengan proses penghitungan nilai f(x) dengan persamaan:
𝑓(𝑥)= Σ𝛼𝑖𝑦𝑖𝐾(𝑥𝑖,𝑥)+𝑏.
3. METODOLOGI PENELITIAN 3.1 Data Penelitian
Data diperoleh dari webssite badan penelitian pertanian.
3.2 Perancangan
Perancangan sistem membahas mengenai gambaran sistem secara umum. Analisa dalam penentuan akurasi dalam perbandingan data hasil dan pengelolaan perhitungan manual dengan perhitungan dalam sistem
pengklasifikasian masa penen varietas unggul kedelai menggunakan metode Support Vector Machine (SVM). Perancangan syistem dilakukan untuk merancang Langkah kerja secara meneyeluruh dari sistem, sehingga model yang didapat lebih baik, atau dari desain sehingga memudahkan pengimplementasian maupun pengujian. Tahap yang akan dilakukan ialah melakukan normalisasi data latih dan data ujii, berikutnya akan dilakukan training.
4. PERANCANGAN & IMPLEMENTASI 4.1 Formulasi Permasalahan
Setiap jenis masa panen varietas unggul kedelai mempunyai ekosistem atau media tanam yang berbeda-beda. Faktor yang mempengaruhi nya berupa umur, rata hasil, hama, tinggi tanaman dan jenis penyakit. Dari factor tersebut akan dibagi ke beberapa kelas yaitu umur dalam, umur sedang, dan umur genjah.
Berdasarkan dari kriteria diatas dibutuhkan pengklasifikasian untuk masa panen varietas unggul kedelai. Untuk memenuhi kebutuhan tersebuh maka diperlukan pengklasifikasian Support Vector Machine (SVM). SVM berfungsi sebagai pemisah (classifier hyperlane) yang terbaik untuk dapat memisahkan dua buah kelas pada input space.
4.2 Proses Penyelesaian Masalah
Dalam proses pemecahan masalah, akan dijelaskan bagaimana proses penggunaan algoritma SVM untuk menyelesaikan masalah tersebut. Langkah pertama adalah menginput data, langkah kedua melakukan proses preprocessing, kemudian melakukan proses perhitungan SVM pelatihan sekuensial, kemudian menghitung nilai wx+
dan wx-, mencari nilai deviasi, kemudian melakukan proses pengujian pada SVM, dan akhirnya hasil klasifikasi.
5. PENGUJIAN DAN ANALISIS 5.1 Pengujian Pada Parameter Lamda
Selanjutnya akan dilakukan uji dari
parameter 𝝀 (lamda), data yang dipakai
merupakan data Iatih dan uji. Nilai 𝝀 (lamda)
yang dipakaiuntuk menguji ialah 0.5, 1, 5,
10, 20. Pengujian parameter lamdaa
dilakukan dengan memakai Polynomial
degree2 serta nillai K= 5 dan parameter
Sequence training support vector machine
yaitu 𝜖 (epsilon) = 0.0001, C = 1, itermax = 10.
Gambar1. Pengujian Parameter Lamda 5.2 Pengujian Parameter Konstanta
Pada hasil uji parameter C (konstanta), data yang digunakan adalah data latih serta data uji, sebanyak 90 data. Saat menggunakan kernel Polynomial degree 2 akan diuji parameter C (contanta) menggunakan epsilon = 0,0001, lamda = 10, itermaxx = 10.
Gambar2. Pengujian Parameter Konstanta
5.3 Pengujian Parameter Epsilon
Hasil uji parameter 𝝐 (Epsilon), data yang akan dipakai adalah data latih dan juga data uji yang memiliki jumlah 90 data. Pada tahap pengujian parameter epsilon yang dipakai dalam pengujian adalah 0.0001,0.01,1,10,50. pengujian parameter epsilon menggunakan kernel polynomial degree dan parameter C = 1, lamda
= 10, itermax = 10.
Gambar3. Pengujian Parameter Epsilon 5.4 Pengujian Parameter Iterasi
Pada tahap ini iterasi yang dipakai unytuk pengujian adalah 10, 50, 100, 150, dan 200.
Pengujian iterasi tersebut menggunakn kernel Polynomial Degree 2 dengan nilai konstanta = 0.0001, lamda = 10, epsilon = 0.01.
Gambar4. Pengujian Parameter Iterasi 5.5 Analisis Uji Coba Jumlah K pada K-fold
Analisis uji coba K pada K-Fold, data yang digunakan yaitu dataa Iatih serta data ujii dengan jumlah data yangg dimiliki adalah 90.
Gambar5. Analisi Uji Coba Jumlah K pada K- Fold
6. PENUTUP 6.1 Kesimpulan
1. Dalam Algoritme Support Vector Machine (SVM) menentukan masa panen varietas unggul kedelai. Penerapan yang dilakukan merupakan Langkah awal yaitu dengan normalisasi data yang dipakai. Data set yang akan digunakn pada penelitian yaitu sebesar 90 data set yang didapat dari masa panen varietas unggul kedelai. Tahap berikutnya akan dilakukan penghitungan kernel, dalam penghitungan kernel akan digunakan kernel polynomial degree 2. Berikutnya akan dilakukan perhitungan sequential training dengan proses yaitu menghitung matriks hessian, berikutnya akan dilakukan proses penghitungan nilai dari error rate (𝐸𝑖),
0 20 40 60
0,5 1 5 10 20
LAMDA
0 20 40 60
0,1 1 10 20 50
Konstanta
0 20 40 60
0,0001 0,01 1 10 50
Epsilon
0 20 40 60
10 50 100 150 200
Iterasi
0 10 20 30 40
K = 2 K = 3 K = 5 K = 6
Data Latih dan Data Uji
Fakultas Ilmu Komputer, Universitas Brawijaya
berikutnya akan dilakukan proses penghitungan delta alpha (𝛿𝛼𝑖), kemudian dilanjutkan dengan niIai alpha. Setelah itu maka Langkah berikutnya akan dilakukan proses menghitung data testing yaitu dengan menghitung nilai pada bias sehingga akan digunakan dalam perhitungan nilai 𝑓(𝑥).
Dalam proses untuk mencapai akurasi sehingga diperlukan tahap untuk mengiju parameter terdiri dari parameter 𝜆 (lamda), kemudian dilanjutkan dengan perhitungan parameter C (Konstanta), berikutnya akan dilakukan penghitungan parameter 𝜖 (epsilon), pengujian berikutnya akan dilakukan pengujian validasi.
2. Hasil yang didapatkan dalam pengujiann parameter Suppporrt Vector Machine (SVM) dalam penelitian ini dapat disimpulkan akurasi terbaik yang didapatkan dalam parameter 𝜆 (lamda) yaitu 10, kemudian nilai dari parameter C (Konstanta) yang terbaik yaitu sebesar 1, nilai akurasi yangbaik dalam 𝜖 (epsilon) sebesar 0.01, niIai akurasi yanterbaik pada akurasi yaitu 10 iterasi dengan menggunkan kernel Polynomial Degree 2.
6.2 Saran
1. Penelitian ini menggunakan 90 data set.
Apabila algoritma support vector machine (SVM) digunakan pada 90 data set, datanya sangat kecil, sehingga penelitian selanjutnya akan menggunakan lebih banyak data untuk menghindari penurunan tingkat akurasi dan kemungkinan menyebabkan inkonsistensi Hasil yang sesuai adalah seperti yang diharapkan.
2. Diperlukan algoritma optimasi agar nilai parameter lamda, parameter konstanta dan parameter epsilon akan menghasilkan nilai yang lebih baik. Contoh algoritma yang dapat dipakai adalah Particle Swarm Optimization (PSO).
3. Kernel yang digunakan dalam penelitian ini adalah kernel dengan derajat polinomial 2.
Disarankan pada penelitian selanjutnya menggunakan kernel yang lain yaitu kernel Gaussian RBF atau kernel linier.
7. DAFTAR PUSTAKA
Demidova, L., Nikulchev, E., & Sokolova, Y.
(2016). The SVM Classifier Based on the
Modified Particle Swarm Optimization.
International Journal of Advanced Computer Science and Applications, 7(2), 16–24.
https://doi.org/10.14569/ijacsa.2016.0702 03
GNAMELE, N. A. J., Berenger, Y., Arsene, T., BAUDOIN, G., & LAHEURTE, J.-M.
(2019). KNN and SVM Classification for Chainsaw Sound Identification in the Forest Areas. International Journal of Advanced Computer Science and Applications, 10(12), 531–536.
https://doi.org/10.14569/ijacsa.2019.0101 270
Hamza, A., & Moetque, H. (2017). Diabetes Disease Diagnosis Methodi based on Feature Extraction using K-SVM.
International Journal of Advanced Computer Science and Applications, 8(1), 236–244.
https://doi.org/10.14569/ijacsa.2017.0801 30
Imelda A.Muis & Muhammad Affandes, M. . (2015). Penerapan Metode Support Vector Machine ( SVM ) Menggunakan Kernel Radial Basis Function ( RBF ) Pada Klasifikasi Tweet. Sains, Teknologi Dan Industri.UIN Sultan Syarif Kasim Riau, 12(2), 189–197.
Irwan, A. W. (2006). Budidaya tanaman kedelai (Glycine max (L.) Merill). Jurusan Budidaya Pertanian Fakultas Pertanian Universitas Padjadjaran, 1–43.
Menti, A. S. (2011). 6 Universitas Sumatera
Utara. 6–24.
repository.usu.ac.id/bitstream/123456789 /22456/4/Chapter II.pdf
Nugroho, A., Witarto, A., & Handoko, D.
(2003). Support Vector Machine –Teori dan Aplikasinya dalam Bioinformatika1–
Anto. Kuliah Umum IlmuKomputer.Com, 1–11.
https://doi.org/10.1109/CCDC.2011.5968 300
Ogunlana, S. O., Olabode, O., & Oluwadare, S.
A. A. (2015). Fish Classification Using Support Vector Machine. African Journal of Computing & ICT, 8(2), 75–82.
Putri, E., Puspitaningrum, D., & Mirfen, A.
(2015). Identifikasi Tanda Tangan dengan
Support Vector Machine (Identifikasi Tanda Tangan dengan Support Vector Machine). Jurnal Sains, Teknologi Dan Industri, 12(2), 225–231.
Rachman, F., & Purnami, W. S. (2012).
Perbandingan Klasifikasi Tingkat Keganasan Breast Cancer Dengan Menggunakan Regresi Logistik Ordinal Dan Support Vector Machine (SVM).
Jurnal Sains Dan Seni ITS, 1(1).
https://doi.org/10.12962/j23373520.v1i1.
1932
Rezwanul, M., Ali, A., & Rahman, A. (2017).
Sentiment Analysis on Twitter Data using KNN and SVM. International Journal of Advanced Computer Science and Applications, 8(6), 19–25.
https://doi.org/10.14569/ijacsa.2017.0806 03
Riawati, Aslim rasyad, W. (2016). RESPON EMPAT VARIETAS KEDELAI (Glycine max (L).Merril ) TERHADAP PEMBERIAN BEBERAPA DOSIS PUPUK FOSFOR. RESPON EMPAT VARIETAS KEDELAI (Glycine Max (L).Merril ) TERHADAP PEMBERIAN BEBERAPA DOSIS PUPUK FOSFOR, 3(1).
Santoshi, G., & Pushpa, G. G. (2015). Detect Pedestrian Orientation by Integrating Multiclass SVM Utilizing Binary Decision Tree.
4(11), 535–538.
https://doi.org/10.17148/IJARCCE.2015.
411120
Vijayakumar, S., & Wu, S. (1999). Sequential Support Vector Classifiers and Regression. Proceedings of International Conference on Soft Computing (SOCO
‘99), 619(February), 610–619.