i
KOREKSI INPUT TEKSTUAL MENGGUNAKAN JARO-WINKLER DISTANCE DAN STEMMING DENGAN ALGORITMA NAZIEF DAN ANDRIANI UNTUK DETEKSI
DINI HAMA DAN PENYAKIT PADA TANAMAN PADI
SKRIPSI
Diajukan untuk Memenuhi Salah Satu Syarat Mencapai Gelar Strata Satu Program Studi Informatika
Disusun oleh : FAIRLY OKTA’MAL
NIM. M0509026
PROGRAM STUDI INFORMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SEBELAS MARET
iv MOTTO
“Lebih baik dibenci sebagai burung gagak, daripada burung malang yang dikurung dalam sangkar dan lupa bagaimana cara terbang.”
(Bouya Harumichi)
“Jangan pernah takut mati untuk hidup.
Dan jangan pernah takut hidup untuk mati.”
v
PERSEMBAHAN
1. Kedua orang tua 2. Arofiah
3. Afif, Prima, Hedik, Fakrunnisak
vi
KATA PENGANTAR
Segala puji dan syukur penulis ucapkan kepada Allah SWT, yang hanya karena rahmat dan karunia-Nya, penulis dapat menyelesaikan Tugas Akhir dengan judul “Koreksi Input Tekstual Menggunakan Jaro-Winkler Distance dan Stemming dengan Algoritma Nazief dan Andriani untuk Deteksi Dini Hama dan Penyakit pada Tanaman Padi”. Penulis menyadari akan keterbatasan yang dimiliki. Begitu banyak bantuan dan bimbingan yang diberikan dalam penyusunan Tugas Akhir ini. Oleh karena itu, penulis mengucapkan terima kasih kepada :
1. Ayah, Ibu, selaku orang tua yang senantiasa memberikan kasih sayang, doa, dukungan dan motivasi tiada henti.
2. Bapak Ristu Saptono, S.Si., M.T. selaku Dosen Pembimbing I yang penuh kesabaran membimbing, mengarahkan dan memberi motivasi kepada penulis selama proses penyusunan Tugas Akhir ini,
3. Bapak Meiyanto Eko Sulistyo S.T., M.Eng. selaku Dosen Pembimbing II yang telah memberikan pengarahan dan masukan selama proses penyusunan Tugas Akhir ini,
4. Bapak Didiek Sri Wiyono S.T., M.T. dan Ibu Esti Suryani S.Si., M. Kom. sebagai Pembimbing Akademik yang telah memberikan bimbingan dan pengarahan selama Penulis menempuh studi di Program Studi Informatika,
5. Ibu Sari Widya Sihwi, S.Kom., M.T.I dan Bapak Afrizal Doewes, S.Kom., M.Sc. selaku anggota penguji yang telah memberikan masukan, kritik dan saran yang membangun, 6. Teman-teman informatika angkatan 2009 dan 2010 yang senantiasa selalu berbagi
pengetahuan, pengalaman, dan memberikan dukungan dan motivasi.
Semoga Tugas Akhir ini dapat memberikan manfaat sekaligus inspirasi kepada pembaca.
vii
KOREKSI INPUT TEKSTUAL MENGGUNAKAN JARO-WINKLER DISTANCE
DAN STEMMING DENGAN ALGORITMA NAZIEF DAN ANDRIANI UNTUK
DETEKSI DINI HAMA DAN PENYAKIT PADA TANAMAN PADI
FAIRLY OKTA’MAL
Program Studi Informatika. Fakultas Matematika dan Ilmu Pengetahuan Alam. Universitas Sebelas Maret
ABSTRAK
Deteksi hama dan penyakit tanaman padi sangat dibutuhkan untuk mendapatkan hasil panen yang maksimal. Pada kasus yang kerap terjadi, petani sering kali menganggap bahwa untuk mengatasi berbagai gejala penyakit tanaman yang berbeda hanya dibutuhkan suatu penanggulangan yang sama. Padahal kesalahan dalam penaggulangan hama dan penyakit berakibat berkurangnya hasil panen.
Penelitian ini digunakan metode Stemming dengan algoritma Nazief dan Andriani untuk menyederhanakan database yang digunakan untuk mendeteksi inputan user. Jika inputan user terjadi kesalahan, maka akan dicari kemiripan teks gejala dengan menggunakan algoritma Jaro-Winkler Distance selanjutnya inputan diidentifikasi dengan menggunakan Hamming Distance. Pada penelitian ini, data gejala pada percobaan pertama diperoleh dari input random sedangkan pada percobaan kedua, data diperoleh dari hasil survey di Desa Pondok Kabupaten Sukoharjo.
Pada percobaan input didapatkan hasil akurasi sebesar 99%. Pada percobaan output didapatkan nilai akurasi sebesar 98%, nilai precision 94,86%, dan nilai recall 98,15%.
viii
TEXTUAL INPUT CORRECTION USING JARO-WINKLER ALGORITHM AND STEMMING WITH AN NAZIEF AND ANDRIANI ALGORITHM FOR EARLY
DETECTION OF PESTS AND DISEASE IN RICE PLANTS
FAIRLY OKTA’MAL
Department of Informatics. Faculty of Mathematics and Natural Sciences Sebelas Maret University
ABSTRACT
The detection of pests and diseases of rice plant is urgently needed to get the maximum crop yields. In the case that often occur, farmers often assume that to solve variety symptoms of diseases from different crops need the same method. In fact, it need different method and the wrong method to cope with the problem can reduce of harvest's result.
This research using Nazief Stemming algorithm and Andriani to simplify the database that can be used to detect the input from user. If the user's input has any mistake, the text similarity will be searched using jaro wrinkler distance algorithm, then it will be identified with
humming distance. In this study, the symptom’s data in the first experiments using random input,
while in the second experiment, the symptom's data is obtained from the survey which is held in Pondok Village district Sukoharjo.
In the input experiment, it showed an accuracy of 99%. The result of the output experiment produce 98% accuracy, 94,86% precision and 98,15% of recall value.
ix DAFTAR ISI
HALAMAN JUDUL ... i
HALAMAN PERSETUJUAN... ii
HALAMAN PENGESAHAN ... ii
MOTTO ………... iv
PERSEMBAHAN ... v
KATA PENGANTAR ... vi
ABSTRAK ... vii
ABSTRACT ... viii
DAFTAR ISI ... ix
DAFTAR TABEL ... xii
DAFTAR GAMBAR ... xiii
DAFTAR LAMPIRAN ... xii
BAB I PENDAHULUAN ... Error! Bookmark not defined. 1.1 Latar Belakang ... Error! Bookmark not defined. 1.2 Rumusan Masalah ...2
1.3 Batasan Masalah ...2
1.4 Tujuan Penelitian ...3
1.5 Manfaat Penelitian...3
1.6 Sistematika Penulisan ...3
BAB II LANDASAN TEORI ... 5
2.1 Dasar Teori ...5
2.1.1 Hama dan Penyakit Tanaman Padi ...5
2.1.2 Preprocessing Input ...5
2.1.2.1 Stemming ...5
x
2.1.3 Jaro-Winkler Distance ...7
2.1.3 Hamming Distance...9
2.1.3 Tanaman Padi...9
2.2 Penelitian Terkait ...10
2.3 Kerangka Pemikiran ...12
BAB III METODOLOGI PENELITIAN ... 13
3.1 Tahap Penelitian ...13
3.1.1 Pengumpulan Data ...13
3.1.2 Pemodelan Data ...13
3.1.3 Implementasi ...13
3.1.3.1 Proses Deteksi Input Gejala User ...14
3.1.3.2 Proses Deteksi Hama dan Penyakit Tanaman Padi...15
3.1.4 Pengembangan Aplikasi ...15
3.1.5 Pengujian dan Analisis Hasil ...16
BAB IV HASIL DAN PEMBAHASAN ... 17
4.1 Deskripasi Data ...17
4.2 Implementasi ...20
4.2.1 Deteksi Input Gejala ...20
4.2.2 Identifikasi Term Kata ...21
4.2.3 Identifikasi Input Gejala User ...24
4.2.4 Deteksi Hama dan Penyakit Tanaman Padi ...25
4.3 Pengembangan Aplikasi ...25
4.4 Pengujian ...27
4.4.1 Pengujian Identifikasi Input ...27
4.4.2 Pengujian Identifikasi Output ...27
4.5 Analisis Hasil ...27
xi
xii
DAFTAR TABEL
Tabel 4.1 Daftar penyakit ... 17
Tabel 4.2 Daftar Gejala ... 18
Tabel 4.3 Hubungan Antara Gejala dan Penyakit ... 19
Tabel 4.4 Contoh Input Gejala oleh User ... 20
Tabel 4.5 Hasil deteksi Term Kata oleh Aplikasi ... 21
Tabel 4.6 Table Gejala yang Terdeteksi oleh Sistem ... 21
xiii
DAFTAR GAMBAR
Gambar 3.1 Alur Implementasi ... 14
Gambar 4.1 Penentuan Transposisi dan Karakter Sama Persis antara “danu” dengan “daun” ... 22
Gambar 4.2 Penentuan Transposisi dan Karakter Sama Persis antara “kuneng” dengan
“kuning” ... 23
Gambar 4.3 Penentuan Transposisi dan Karakter Sama Persis antara “menggulug” dengan
“menggulung” ... 24
xiv
DAFTAR LAMPIRAN