Fakultas Ilmu Komputer
7149
Implementasi Algoritme
Modified K-Nearest Neighbor
(MKNN) untuk
Diagnosis Penyakit Tanaman Cengkeh
Rizaldy Amsyar1, Nurul Hidayat2, Rizal Setya Perdana3
Program Studi Teknik Informatika, Fakultas Ilmu Komputer, Universitas Brawijaya Email: 1[email protected], 2[email protected], 3[email protected]
Abstrak
Tanaman cengkeh memiliki nilai ekonomi tinggi dan merupakan salah satu komoditas ekspor hasil perkebunan Indonesia, di daerah Wonosalam Kabupaten Jombang terdapat kebun cengkeh yang kurang terawat karena pemilik yang tidak setiap saat ada di kebun, dan dengan demikian tanaman rentan terkena penyakit dan berkurangnya hasil panen dari cengkeh tersebut. dibutuhkan sebuah cara untuk membantu petani untuk mengetahui jenis penyakit yang menyerang tanaman cengkeh tersebut, maka dibuatlah sistem diagnosis tanaman cengkeh dengan menggunakan algoritme Modified K – Nearest Neighbor (MKNN). Sistem diagnosis akan memberikan informasi penyakit tanaman cengkeh berdasarkan masukan berupa gejala-gejala yang dapat diamati dari tanaman. Algoritme MKNN adalah pengembangan dari algoritme KNN dengan menambahkan proses perhitungan nilai validasi data latih dan Weight Voting. Perhitungan validasi bertujuan untuk mengatasi permasalahan data yang menyimpang pada algoritme KNN agar tidak terjadi bias dan Weight Voting bertujuan untuk menghitung bobot dari data. Hasil akurasi dari sistem diagnosis tanaman cengkeh menggunakan algoritme MKNN adalah sebesar 96.67%.
Kata kunci: tanaman cengkeh, sistem diagnosis, data mining, modified k-nearest neighbor
Abstract
Clove plant have high economic value and one of many export commodity of Indonesian plantation product, in Wonosalam region Jombang Regency there are less well groomed clove farm because the owners are not at all the times in the farm, and thus the plant susceptible to disease and reduced yields from the clove harvest. Needed a way to help farmers to know the types of diseases that attack the clove plants, then made a clove plant diagnosis system using the algorithm Modified K - Nearest Neighbor (MKNN). The diagnostic system will provide clove plant disease information based on inputs of observable symptoms of the plant. MKNN algorithm is the development of KNN algorithm by adding calculation process of data training validation and weight voting. Validation calculation aims to overcome the problem of data that deviates on the KNN algorithm in order to avoid bias and weight voting aims to calculate the weight of the data. Accuracy of clove plant diagnosis system using MKNN algorithm is 96.67%.
Keywords: clove plant, system diagnosis, data mining, modified k-nearest neighbor
1. PENDAHULUAN
Tanaman cengkeh sejak dulu sudah dibudidayakan di Indonesia, Nilai ekonomi dari produksi cengkeh ini cukup tinggi, hasilnya yang paling banyak digunakan adalah bunga kering sebagai bahan baku rokok kretek dan rempah rempah masakan. Indonesia sendiri merupakan negara produksi cengkeh serta konsumsi cengkeh, serta cengkeh dapat tumbuh subur di Indonesia Karena iklim yang panas dan matahari
yang cukup, produksi cengkeh di Indonesia selalu menunjukkan grafik yang naik turun yang tergantung oleh siklus tertentunya.
daerah, dan mereka tidak secara langsung ikut merawat perkebunan cengkeh tersebut.
Permasalahan yang muncul karena pemilik perbekebunan yang tidak selalu ada di tempat, banyak tanaman cengkeh yang rusak karena kurangnya perwatan dan penanganan dari penyakit. Hal itu dapat menyebabkan kerugian bagi pemilik perkebunan cengkeh. Tentunya sebelum terkena penyakit tanaman cengkeh menunjukkan gejala-gejala yang dapat diamati dan langsung dilakukan penanganan. Oleh karena itu diperlukan ahli yang dapat memberikan pengetahuan mengenai hal-hal yang menyangkut dengan tanaman cengkeh. Namun pengetahuan tentang penyakit cengkeh memiliki kendala seperti perlunya konsultasi pada ahli untuk setiap masalah yang menjadikannya kurang efektif dan dapat berdampak pada kualitas produksi sampai gagal panen. Pada hal-hal seperti inilah petani serta pemilik perkebunan memerlukan suatu alat bantu yang dapat melakukan diagnosis serta memberi informasi mengenai penyakit dari tanaman cengkeh.
Klasifikasi merupakan salah satu bagian dari data mining yang berutujuan menggali nilai-nilai atau informasi dari sekumpulan data (Nikam, 2015). Dengan melakukan klasifikasi suatu jenis penyakit dapat diketahui polanya berdasarkan data yang ada, yaitu gejala gejala penyakit cengkeh yang terlihat pada tanaman tersebut seperti bagaimana kondisi daun, batang, akar dan buahnya. Dari situ dapat dilakukan proses klasifikasi menggunakan computer dengan menggunakan algoritme seperti fuzzy tsukamoto, Naïve bayes, K-Nearest Neighbor.
Algoritme Modified K-Nearest Neighbor
atau MKNN merupakan salah satu cara untuk melakukan klasifikasi dan memberikan hasil diagnosis, alasan menggunakan algoritme ini karena memiliki keunggulan untuk mengklasifikasikan data gejala penyakit dengan data uji yang ada. MKNN memiliki penambahan prosedur dalam melakukan klasifikasi, dengan adanya menghitung nilai validitas dari data latih dan proses Weight Voting untuk menghitung Weight dari tetangga terdekatnya. Dengan adanya 2 proses baru diharapkan dapat memperbaiki kekurangan pada algoritme K-NN (Wafiyah, 2017). Algoritme MKNN masih lebih unggul dibandingkan dengan algoritme KNN, banyaknya data latih mempengaruhi hasil kinerja dari algoritme tersebut, apabila data semakin banyak maka hasilnya semakin baik (Mutrofin, 2016).
2. LANDASAN KEPUSTAKAAN
2.1 Cengkeh
Cengkeh merupakan tanaman tropis dengan nama latin Eugenia aromatica yang merupakan tanaman asli Indonesia. Tanaman ini tumbuh optimal pada 300 – 600 mdpl dengan suhu rata-rata 22° - 30°C dan curah hujan sekitar 1500 – 4500 mm/tahun. Persebaran perkebunan cengkeh di Indonesia paling banyak dari Sulawesi, berdasarkan survey oleh Kementerian Pertanian Republik Indonesia luas lahan yang digunakan untuk perkebunan cengkeh di Indonesia mencapai 510.00 Ha dengan total produksi nasional 122.134 Ton.
2.2 Penyakit Cengkeh
Penyakit yang menyerang tanaman cengkeh menyebabkan tanaman cengkeh kurang produktif bahkan dapat menyebabkan gagal panen bagi petani. Serta cengkeh juga rentan terkena penyakit dan penanganan untuk masing-masing penyakit berbeda, adapun beberapa penyakit yang sering ditemui berdasarkan data yang didapat dari pakar:
1. Bakteri Pembuluh Kayu Cengkeh (BPKC) Penyakit yang menyerang tanaman cengkeh ketika masa berbuah awal atau baru dewasa dan siap produktif, penyakit ini tergolong penyakit yang sangat merusak. Penyakit yang disebabkan
pseudomonas syzgii ini menyebar dengan bantuan serangga dari tanaman yang terserang ke tanaman yang sehat. Beberapa ciri-ciri tanaman yang terjangkit penyakit ini seperti daun yang mendadak berguguran, lalu di pucuknya banyak ranting yang mati. Untuk penyakit ini bias berlangsung dari minggu sampai beberapa bulan. Untuk perawatan dari penyakit ini yang pertama dapat dilakukan sanitasi kebun dan penyemprotan Hindola fulfa
dengan menggunakan insektisida kontak dengan interval sekitar 6 minggu sekali untuk tanaman yang masih bias diselamatkan. Kedua dapat dilakukan penyuntikan antibiotic oksitetasklin
(OTC) sebanyak 6 gr/100 ml air dilakukan setiap 3 – 4 bulan sekali. Ketiga dapat dilakukan pemupukan kombinasi N dan K.
2. Cacar Daun Cengkeh (CDC)
Cacar daun dapat di golongkan sebagai penyakit kedua yang termasuk berbahaya selain BPKC dikarenakan cacar daun ini dapat ditemui hampir diseluruh tempat produksi hasil cengkeh. Pada cacar daun cengkeh penyebabnya adalah
di bagian daunnya terdapat bekas yang menonjol, hal ini menyebabkan tanaman kekurangan nutrisi karena kemampuan untuk melakukan fotosintesis berkurang. Pengendalian dari penyakit Cacar Daun Cengkeh dapat dilakukan penyemprotan fungsida dengan interval 7 – 10 hari sekali, selain itu sanitasi kebun juga harus dijaga, daun, ranting dan biji dari tanaman yang terkena penyakit sebaiknya di kumpulkan dan di bakar.
3. Jamur Akar Putih (JAP)
Untuk penyakit jamur akar putih didapat dari pakar bahwa penyebabnya adalah
Rigidoporus sp, dan gejala yang dapat diamati seperti pada akar dan batang dekat akar terdapat pertumbuhan rhizomorph yang menyerupai kipas berwarna putih, oleh karena itu dinamakan jamur akar putih. Akibatnya akar menjadi lunak dan basah dan jika dibiarkan akar tanaman akan busuk. Dan bagian permukaan daun yang terlihat kasar dan melengkung kebawah tidak seperti cengkeh biasanya kemudian berubah menjadi kecoklatan. Ada beberapa cara perawatan apabila tanaman yang terkena jamur akar putih yaitu dengan melakukan kultur teknis pada perkebunan atau dapat melakukan pemupukan, terakhir dapat di bantu dengan menanam jenis kacang-kacangan didekat tanaman untuk mencegah penyakit ini.
2.3 Klasifikasi
Klasifikasi merupakan sebuah teknik pada data mining yang dapat memproses data yang besar, teknik yang sering digunakan untuk melakukan analisis dari data latih yang sudah ada sehingga kesalahan ketika melakukan klasifikasi bisa berkurang (Nikam, 2015). Klasifikasi umumnya memiliki 2 tahap utama, tahap pertama model dibuat menggunakan algoritma klasifikasi seperti algoritme ID3, C4.5, fuzzy, K-Nearest Neighbot, support vector machine dan naive bayes dengan menggunakan data pada data latih. Selajutnya pada tahap kedua model yang diekstrak di test dengan data latih tersebut untuk mengukur performa dan akurasi dari klasifikasi tersebut. Sehingga klasifikasi menentukan kelas dari sebuah data yang kelasnya tidak diketahui dengan menggunakan data latih sebagai acuan untuk menentukan kelasnya.
2.4 Algoritme KNN
Kebanyakan algoritme ini digunakan karena dapat mencarari solusi dari permasalahan klasifikasi data. Pada KNN terdapat beberapa
keunggulan seperti mudah dipahami dan memiliki proses training yang cepat. Adapun proses dari KNN ini adalah dengan mencari jarak terdekat menggunakan Euclidean Distance
antar tetangganya, dari namanya KNN yang berarti k tetangga terdekat, dibutuhkan nilai k untuk berapa banyak titik-titik tetangga yang berdekatan yang akan digunakan untuk melakukan proses perhitungan. Setelah itu nilai
Euclidean tadi akan dihitung sampai dengan menentukan kelas dari data masukan atau data uji. Adapun persamaan dari algoritme KNN ini ada pada persamaan 1.
𝑑(𝑥, 𝑦) = √∑ (𝑥𝑖 − 𝑦𝑖)𝑛 2
2.5 Algoritme Modified K-NN
Modified K-NN merupakan pengembangan dari algoritme KNN dengan penambahan beberapa proses yakni perhitungan nilai validasi data latih dan Weight Voting atau pembobotan. Perhitungan nilai validasi bertujuan untuk mengatasi permasalahan data yang menyimpang pada algoritme KNN sehingga kurangnya bias dari data latih (Mutrofin, 2016) dan Weight Voting untuk menghitung bobot dari data. Algoritme Modified K-NN menggunakan nilai perhitungan Weight Voting terbesar untuk menentukan kelas dari suatu data yang belum diketahui. Nilai dari Weight juga dipengaruhi oleh nilai validasi. Maka dengan ditambahnya perhitungan nilai validasi dan Weight Voting ini dapat mengungguli akurasi dari penggunaan algoritme K-NN(putri, 2017).
2.6 Validasi Data Training
Pada algoritme Modified K-NN semua data latih harus divalidasi, pada tahap ini nilai validasi didapat dengan membandingkan kelas dari data
training dengan kelas dari tetangga yang berdekatan. Kemudian hasil perbandingan kelas tadi akan di total dan kemudian dibagi dengan k. persamaan dari validasi data training
ditunjukkan seperti persamaan 2.
𝑉𝑎𝑙𝑖𝑑𝑖𝑡𝑎𝑠(𝑥) =1𝑘∑𝑘 𝑆(𝑙𝑎𝑏𝑒𝑙(𝑥), (𝑙𝑎𝑏𝑒𝑙(𝑁𝑖(𝑥))))
Keterangan
𝑘 : Banyaknya tetangga
𝑙𝑎𝑏𝑒𝑙(𝑥) : Kelas dari data 𝑥
𝑁𝑖(𝑥) : Kelas tetangga terdekat ke-i data 𝑥
Kemudian fungsi 𝑆 disini digunakan sebagai pembanding kelas dari data a dan data b, apabila kelas keduanya sama maka nilai fungsi 𝑆 adalah 1, sedangkan jika kelasnya berbeda maka bernilai 0. Persamaan dari fungsi 𝑆 didefinisikan seperti persamaan 3.
𝑆(𝑎, 𝑏) = {1 𝑎 = 𝑏0 𝑎 ≠ 𝑏 (3)
Keterangan:
𝑎 = nilai kelas 𝑎 data training
𝑏 = nilai kelas 𝑏 data training
2.7 Weight Voting
Perhitungan Weight Voting adalah salah satu tahap di algoritme Modified K-NN, pada masing masing data dihitung bobotnya menggunakan
1/(𝑑𝑒+ 𝑎) yang mana 𝑑𝑒 merupakan jarak Euclidean dan 𝑎 ditambah untuk menghindari penyebut dibagi dengan 0. Hasil klasifikasi Modified K-NN ditentukan dengan mengambil nilai perhitungan 𝑊 yang terbesar. Untuk persamaannya dapat ditulis seperti persamaan 4.
𝑊(𝑖) = 𝑉𝑎𝑙𝑖𝑑𝑖𝑡𝑎𝑠(𝑖) ×𝑑1 𝑒+𝑎(4)
Keterangan:
𝑉𝑎𝑙𝑖𝑑𝑖𝑡𝑎𝑠(𝑖): Hasil Validitas data ke-i
𝑑𝑒 : Euclidean Distance dari data uji
𝑎 : 0.5
3. METODOLOGI
Pada bagian ini membahas mengenai metodologi yang digunakan dalam penulisan skripsi ini, bagaimana proses pengumpulan data serta bagaimana bentuk data yang digunakan dalam pengerjaan penelitian ini. adapun proses tahapan penelitian ditunjukkan gambar 1.
Gambar 1. Diagram Alir Penelitian
3.1 Pengumpulan Data
Pada penelitian ini digunakan data yang didapat diperoleh dengan melakukan wawancara kepada ahli dari tanaman cengkeh di kecamatan Wonosalam Kabupaten Jombang, didapatkan data berjumlah 61 dan 11 jenis gejala yang sudah diberi nilai untuk tiap parameternya sesuai dengan pengetahuan dari narasumber dan penyakit tanaman cengkeh serta bagaimana penanganan untuk masing-masing penyakit. Untuk rincian gejala yang didapatkan tersebut ada pada tabel 1.
Tabel 1. Gejala dan Kode Gejala
No Gejala pada tanaman Kode
gejala 1 Ranting yang ada di pucuk batang
kering dan mati
G-1
2 Daun berguguran dari pucuk ke akar
G-2
3 Percabangan pohon mudah layu tiba-tiba
G-3
4 Daun yang sudah tua warnanya kuning
G-4
5 Batang tanaman kering G-5
6 Ditemui bercak melepuh pada daun yang masih muda/merah
G-6
7 Ada titik hitam di bagian yang melepuh
G-7
8 Daun yang berada di bawah lebih banyak bercak cacar dari daun yang ada di atas
G-8
9 Daun tiba-tiba layu, kering dan kemudian rontok
G-9
10 Benang-benang miselium dari jamur ditemui pada bagian akar
G-10
4. PERANCANGAN
Pada bagian ini menjelaskan bagaimana
tahap-tahap perancangan dalam pembuatan
sistem yang nantinya akan digunakan untuk
melakukan diagnosis dan memberikan solusi
kepada pengguna. Adapun diagram dari
perancangan seperti gambar 2.
Gambar 2. Diagram Perancangan Sistem
4.1 Perancangan Proses
Sistem yang dibuat ini adalah sistem diagnosis penyakit, sebelum melakukan klasifikasi dibutuhkan beberapa masukan dari pengguna yang nantinya akan digunakan untuk melakukan perhitungan oleh sistem dan kemudian hasilnya berupa jenis penyakit. Masukan tadi berupa 11 gejala penyakit dari tanaman cengkeh. Perancangan proses dapat dilihat pada gambar 3.
Gambar 3. Diagram Alir Sistem
4.1.1 Proses Klasifikasi Modified K-Nearest Neighbor (MKNN)
Pada tahap klasifikasi Modified K-NN berguna untuk mengetahui hasil diagnosis dari sistem yang mana didapat dari masukan pengguna dari gejala-gejala lalu dilakukan perhitungan matematis untuk mencari kesamaan dari masukan tadi dengan data training. Untuk klasifikasi ini mulai dengan menentukan nilai k atau jumlah tetangga yang terdekat, kemudian dihitung euclidean distance antar data training, dilakukan ranking dengan nilai terkecil dari tiap data tadi, lalu dicari validitas untuk setiap data
training, setelah itu disini data uji mulai di gunakan dengan menghitung euclidean distance
dari data uji dengan data training, tahap terakhir adalah menghitung weight voting dari data uji dan hasilnya adalah nilai weight yang paling besar. Tahap-tahap proses modified K-NN seperti gambar 4.
Gambar 4. Diagram Proses Klasifikasi
4.1.2 Proses Perhitungan Euclidean Distance
Tidak seperti algoritme K-NN yang menghitung euclidean distance sebanyak 1 kali, pada algoritme Modified K-NN akan dihitung sebanyak 2, yang pertama antar data training
dengan dirinya sendiri, kemudian yang kedua antar data uji dan data training. Perhitungan
klasifikasi cenderung ke kelas penyakit yang mana. Untuk tahap perhitungan euclidean distance seperti gambar 5.
Gambar 5. Perhitungan Jarak Euclidean
4.1.3 Proses Perhitungan Validitas
Validitas disini berguna untuk mencari kesamaan kelas dari setiap data pada data
training. Nilai-nilai kesamaan ini bertujuan untuk mengetahui apakah kelas dari jumlah tetangga yang terdekat dari sebuah titik itu sama atau tidak, nilai validitas ini dipengaruhi oleh banyaknya nilai k, semakin banyak nilai k maka validitas dari sebuah data bisa bernilai kecil. Untuk mendapatkan nilai validitas dimulai setelah didapat jarak euclidean kemudian di urutkan berdasarkan terkecil yang berarti terdekat sebanyak k, kemudian akan dibandingkan kesamaan dari kelas dari data latih dan data uji, apabila kelasnya sama maka nilainya 1, sedangkan jiba tidak sama maka nilainya 0, setelah itu seluruh nilai kesamaan tadi akan di jumlah kemudian dibagi dengan k. Didapatkan nilai validitas, untuk proses perhitungannya seperti gambar 6.
Gambar 6. Diagram Alir Perhitungan Validitas
4.1.4 Proses Perhitungan Weight Voting
Weight Voting atau pembobotan berguna untuk mendapatkan hasil akhir dari klasifikasi
Modified K-NN (MKNN). Klasifikasi didapat dengan mencari Weight Voting terbesar dengan menggunakan persamaan (4), nilai validitas dan nilai eculidean data latih dan data uji digunakan untuk mendapatkan hasil akhir dari sistem. Proses perhitungan Weight Voting dijelaskan pada gambar 7 Diagram Alir Perhitungan Weight Voting.
5. PENGUJIAN DAN ANALISIS
Dengan diselesaikannya implementasi dari sistem maka dilanjutkanlah dengan melakukan pengujian serta memberikan analisis terhadap hasil diagnosis sistem yang sudah dibangun. Untuk pengujian yang digunakan disini adalah pengujian akurasi. Diagnosis sistem dibandingkan dengan diagnosis dari ahli yang sudah ada di data training. Untuk pengujian berdasarkan nilai k dan jumlah data training,
untuk nilai k antara 2 samai 7 dan data training
berjumlah 20, 40 dan 60.
Nilai k Akurasi
2 85%
3 90%
4 90%
5 90%
6 90%
7 90%
5.1 Pengujian 20 Data Latih
Hasil pengujian yang didapat seperti pada tabel 3.
Tabel 2. Hasil Akurasi 20 Data Latih
5.2 Pengujian 40 Data Latih
Hasil pengujian yang didapat seperti pada tabel 4.
Tabel 3. Hasil Akurasi 40 Data Latih
Nilai k Akurasi
2 95%
3 95%
4 95%
5 95%
6 95%
7 95%
5.3 Pengujian 40 Data Latih
Hasil pengujian yang didapat seperti pada tabel 5.
Tabel 4. Hasil Akurasi 60 Data Latih
Nilai k Akurasi
2 96.67%
3 96.67%
4 96.67%
5 96.67%
6 96.67%
7 96.67%
5.4 Analisis Pengujian
Setelah dilakakukannya pengujian maka akan dibuat analisi terhadap pengujian itu tadi, dari pengujian tersebut diketahui bahwa nilai k tidak terlalu berpengaruh terhadap akurasi dari hasil diagnosis sistem. Kemudian semakin banyak data training maka akurasi akan semakin besar, karena data yang benar juga semakin banyak. Hasil akurasi dari pengujian dapat
dilihat di gambar 8.
Gambar 8. Grafik Hasil Pengujian Akuras
Akurasi yang didapat dari sistem ketika menggunakan k bernilai 2 dan data sebanyak 20 adalah 85%, yang mana berarti sistem mendiagnosis 17 data yang benar dari total 20. Kemudian berlanjut dengan k bernilai 3 sampai dengan k bernilai 7 didapatkan akurasi 90%. Untuk pengujian k bernilai 3 sampai 7 didapat bahwa data yang tidak sesuai sama semua. Kemudian akurasi ketika k bernilai 2 sampai dengan k bernilai 7 dengan data sebanyak 40 adalah sebesar 95% yakni 38 dari 40 data yang sesuai. Untuk pengujian 40 data meskipun grafik persentase akurasi terlihat datar namun hasil diagnosis yang salah berbeda beda. Selanjutnya pada pengujian akurasi dengan 60 data didapat juga besaran akurasi yang stagnan sebesar 96.67% atau 58 data sesuai dari 60 data, pada 60 data ditemukan juga bahwa data yang tidak sesuai juga berbeda beda dari tiap nilai k.
6. Kesimpulan
Dengan selesainya pengujian dan analisis dari penelitian ini dapat disimpulkan hasil akhir dan tujuan skripsi ini yang berdasar dari rumusan masalah, maka disimpulkan sebagai berikut: 1. Algoritme Modified K-Neares Neighbor
dapat digunakan melakukan proses klasifikasi terhadap penyakit yang ada pada tanaman cengkeh, klasifikasi yang dilakukan dengan menggunakan masukan dari pengguna yang berupa 11 gejala penyakit cengkeh kemudian sistem yang dibangun akan melakukan klasifikasi dengan menggunakan algoritme Modified K-NN tahap awal dimulai dengan menghitung euclidean distance antar data latih kemudian hasil dari tiap euclidean
tersebut diambil nilai terkecil sebanyak k, kemudian setelah didapat nilai terkecil dari
data training dengan nilai kelas dari data yang terdekat, jika kelas keduanya bernilai sama maka hasilnya adalah 1 dan apabila tidak maka hasilnya 0, kemudian dibandingkan sampai dengan jumlah tetangga terdekatnya sama dengan nilai k. Nilai total validitas akan dijumlah dengan semua nilai validasi dan dibagi dengan nilai
k dan menghasilkan nilai validitas. Setelah itu masukan berupa gejala diambil untuk dihitung jarak euclideannya dengan data latih yang ada, setelah didapat akan dihitung
Weight Voting dengan menggunakan nilai validitas dan euclidean data uji yang sudah dilakukan sebelumnya. Hasil Weight Voting
yang terbesar adalah hasil diagnosis dari sistem yang dibangun.
2. Sedangkan untuk akurasi dari sistem setelah dilakukan pengujian serta analisis dapat diambil kesimpulan bahwa:
a. Ketika data training yang digunakan sebanyak 60 dihasilkan akurasi sistem 96.67%, setelah itu akurasi terbesar kedua diperoleh dengan data training
sebanyak 40 dengan besaran akurasi 95% lalu untuk rata-rata akurasi terkecil di dapat dengan data training berjumlah 20 dan akurasi 89.16%.
b. Akurasi yang terendah didapat dari nilai k=2 dengan jumlah data sebanyak 20 menghasilkan nilai akurasi 85%. Adapun saran yang ingin penulis berikan untuk melakukan pengembangan kedepan mengenai diagnosis penyakit untuk tanaman cengkeh berdasarkan penelitian yang sudah dilakukan penulis sampaikan adapun sarannya yaitu:
1. Karena Penulis menggunakan data gejala yang bernilai 1 dan 0 saja, sebaiknya nilai dari gejala-gejala pada data training lebih bervariasi dan tidak bernilai 1 dan 0 saja agar diagnosis dari sistem dapat lebih baik. 2. Penulis juga merasa bahwa data yang
dimiliki kurang banyak, maka dengan menambahkan jumlah data training yang digunakan diharapkan menghasilkan akurasi yang lebih baik.
3. Lebih baik lagi jika ada pencarian nilai k optimal dengan menggunakan Algoritma Genetik sehingga nilai k dari sistem akan selalu menghasilkan nilai yang optimal, karena pada penelitian ini nilai k juga kurang begitu berpengaruh banyak terhadap akurasi dari sistem. Diharapkan dengan adanya variasi dari data dan lebih banyaknya data
training yang digunakan dapat memberikan hasil yang berbeda-beda dari tiap k yang digunakan.
DAFTAR PUSTAKA
Nikam, S.S., 2015. A Comparative Study of Classification Techniques in Data Mining Algorithms. Oriental Journal of Computer Science & Technology, 13-19.
Putri, M.B.P., 2017. Diagnosis Penyakit Kulit Pada Kucing Menggunakan Metode
Modified K-Nearest Neighbor.
Mutrofin, S., 2016. Optimasi Teknik Klasifikasi
Modified K Nearest Neighbor
Menggunakan Algorima Genetika.
Jurnal Gamma, 1-5.
Wafiyah, F., 2017. Implementasi Algoritma
Modified K-Nearest Neighbor (MKNN) untuk Klasifikasi Penyakit demam.