• Tidak ada hasil yang ditemukan

Implementasi Algoritma Jaro-Winkler Distance Fitur Autocorrect dan Spelling Suggestion Penulisan Proposal Program Kreativitas Mahasiswa(PKM)

N/A
N/A
Protected

Academic year: 2022

Membagikan "Implementasi Algoritma Jaro-Winkler Distance Fitur Autocorrect dan Spelling Suggestion Penulisan Proposal Program Kreativitas Mahasiswa(PKM)"

Copied!
16
0
0

Teks penuh

(1)

Implementasi Algoritma Jaro-Winkler Distance Fitur Autocorrect dan Spelling Suggestion Penulisan Proposal Program Kreativitas

Mahasiswa(PKM)

Tugas Akhir

Diajukan Untuk Memenuhi Persyaratan Guna Meraih Gelar Sarjana Informatika Universitas Muhammadiyah Malang

Lutfi Aish Diaurrakman (201710370311272)

Bidang Minat Data Science

PROGRAM STUDI INFORMATIKA FAKULTAS TEKNIK

UNIVERSITAS MUHAMMADIYAH MALANG 2020

(2)

ii

LEMBAR PERSETUJUAN

Implementasi Algoritma Jaro-Winkler Distance Fitur Autocorrect dan Spelling Suggestion Penulisan Proposal Program Kreativitas

Mahasiswa(PKM)

TUGAS AKHIR

Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata Ⅰ Informatika Universitas Muhammadiyah Malang

Disusun Oleh : Lutfi Aish Diaurrakman

201710370311272

Malang, 11 Februari 2021 Menyetujui,

Dosen 1

Nur Hayatin S.ST., M.Kom,

NIP. 108.0907.0476

Dosen 2

Galih Wasis Wicaksono, S.Kom., M.Cs.

NIP.108.1410.0541

(3)
(4)

iv

LEMBAR PERNYATAAN

Yang bertanda tangan dibawah ini:

NAMA : LUTFI AISH DIAURRAKMAN

NIM : 201710370311272

FAK / JUR : TEKNIK / INFORMATIKA

Dengan ini saya menyatakan bahwa Tugas Akhir dengan judul “Implementasi Algoritma Jaro-Winkler Distance Fitur Autocorrect dan Spelling Suggestion Penulisan Proposal Program Kreativitas Mahasiswa(PKM)” beserta seluruh isinya adalah karya saya sendiri dan bukan merupakan karya tulis orang lain, baik sebagian maupun seluruhnya, kecuali dalam bentuk kutipan yang telah disebutkan sumbernya.

Demikian surat pernyataan ini saya buat dengan sebenar-benarnya. Apabila kemudian ditemukan adanya pelanggaran terhadap etika keilmuan dalam karya saya ini, atau ada klaim dari pihak lain terhadap keaslian karya saya ini maka saya siap menanggung segala bentuk resiko/saknsi yang berlaku.

Mengetahui, Malang, 11 Februari 2022

Dosen Pembimbing Yang Membuat Pernyataan

Nur Hayatin S.ST., M.Kom, Lutfi Aish Diaurrakman

(5)

v ABSTRAK

Program Kreativitas Mahasiswa (PKM) yang diluncurkan oleh Direktorat Jenderal Pendidikan Tinggi pada tahun 2001 merupakan salah satu upaya untuk menumbuhkan, mewadahi, dan mewujudkan ide kreatif serta inovatif mahasiswa.

Dalam penulisan proposal PKM mahasiswa harus memperhatikan penulisannya yang ada di buku panduan. Jika terjadi kesalahan format ataupun penulisan maka otomatis proposal tidak akan masuk pendanaan. Oleh kareana itu dibutuhkan sebuah system yang dapat mendeteksi dan memperbaiki kesalahan penulisan secara otomatis(autocorrect). Sistem autocorrect dapat mengganti kata yang dianggap salah oleh sistem secara otomatis tanpa memberi tahu pengguna sehingga pengguna seringkali tidak sadar tulisannya berubah, sedangkan kata penggantinya tidak selalu benar sesuai dengan yang dimaksud pengguna. Dengan fitur autocorrect dan spelling suggestion bahasa Indonesia diharapkan dapat membantu dalam mengidentifikasi kesalahan penulisan proposal PKM sebelum diupluod ke simbelmawa. Metode jaro winkler distance digaunakan untuk mengukur kesamaan jarak antara dua string. Dari pengujian yang dilakukan bahwa fitur autocorrect dan spell suggestion digunakan untuk kesalahan penulisan ejaan kata dengan proposal yang diujikan 4 dokumen terdapat jumlah penulisan salah 332 dari 8183 kata dengan waktu proses 7.8 detik dengan total presentasi akurasi dalam memberikan perbaikan kata typo sebesar 84%.

Kata Kunci: Jaro Winkler distance, Auotocorrect, Spell Suggestion, Proposal PKM, Ejaan Kata

(6)

vi ABSTRAK

The Student Creativity Program (PKM) which was launched by the Directorate General of Higher Education in 2001 is one of the efforts to grow, accommodate, and realize creative and innovative ideas for students. In writing a PKM proposal, students must pay attention to what is written in the guide book. If there is an error in formatting or writing, the proposal will automatically not enter funding.

Therefore we need a system that can detect and correct writing errors automatically (autocorrect). The autocorrect system can replace words that are considered wrong by the system automatically without notifying the user so that users are often not aware that their writing has changed, while the replacement words are not always correct according to what the user intended. With the autocorrect feature and Indonesian spelling suggestion, it is hoped that it can help identify errors in writing the PKM proposal before it is uploaded to Simbelmawa.

The jaro winkler distance method is used to measure the similarity of the distance between two strings. From the tests carried out that the autocorrect and spell suggestion features were used for spelling errors with the proposal tested in 4 documents, there were 332 errors out of 8183 words with a processing time of 7.8 seconds with a total accuracy presentation in providing typo word corrections of 84%.

Kata Kunci: Jaro Winkler distance, Auotocorrect, Spell Suggestion, Proposal PKM, word spelling

(7)

vii

LEMBAR PERSEMBAHAN

Puji Syukur kepada Allah SWT atas rahmat dan karunia-Nya sehingga penulis dapat menyelesaikan Tugas Akhir ini. Penulis menyampaikan ucapan terima kasih yang sebesar-besarnya kepada:

1. Ibu Nur Hayatin S.ST., M.Kom, dan Bapak Galih Wasis Wicaksono, S.Kom., M.Cs. selaku pembimbing tugas akhir.

2. Bapak/Ibu Dekan Fakultas Teknik Universitas Muhammadiyah Malang.

3. Bapak/Ibu Ketua Jurusan Teknik Informatika Universitas Muhammadiyah Malang.

4. Kedua Orang Tua 5. Rekan

6. Sahabat

Malang, 11 Februari 2022

Lutfi Aish Diaurrakman

(8)

viii

KATA PENGANTAR

Dengan memanjatkan puji syukur kehadirat Allah SWT. Atas limpahan rahmat dan hidayah-NYA sehingga peneliti dapat menyelesaikan tugas akhir yang berjudul

Implementasi Algoritma Jaro-Winkler Distance Fitur Autocorrect dan Spelling Suggestion Penulisan Proposal Program Kreativitas

Mahasiswa(PKM)

Di dalam tulisan ini disajikan pokok-pokok bahasan yang meliputi latar belakang, metode penelitian, serta hasil dan pembahasan yang telah didapat pada proses penelitian ini. Diberikan kesimpulan berdasarkan hasil yang telah didapatkan pada proses penelitian ini.

Peneliti menyadari sepenuhnya bahwa dalam penulisan tugas akhir ini masih banyak kekurangan dan keterbatasan. Oleh sebab itu peneliti mengharapkan saran yang membangun agar tulisan ini bermanfaat bagi perkembangan ilmu pengetahuan.

Malang, 11 Februari 2022

Lutfi Aish Diaurrakman

(9)

ix DAFTAR ISI

LEMBAR PERSETUJUAN... ii

LEMBAR PENGESAHAN ... iii

LEMBAR PERNYATAAN ... iv

ABSTRAK ... v

ABSTRAK ... vi

LEMBAR PERSEMBAHAN ... vii

KATA PENGANTAR ... viii

DAFTAR ISI ... ix

DAFTAR GAMBAR ... xi

DAFTAR TABEL ... xii

BAB 1 ... 13

PENDAHULUAN ... 13

1.1. Latar Belakang ... 13

1.2. Rumusan Masalah ... 15

1.3. Tujuan Penelitan... 15

1.4. Batasan Masalah... 15

BAB II ... 16

2.1. Penelitian Terdahulu ... 16

2.2. Proposal Program Kreatvitas Mahasiswa (PKM) ... 17

2.3. Typographical Eror ... 18

2.4. Text Mining ... 18

2.5. Information Retrieval ... 19

2.6. Preprocessing ... 19

2.7. Spelling Checker ... 20

2.8. Jaro Winkler Distance ... 21

2.9. Pengujian dan Evaluasi ... 22

BAB III ... 23

METODE PENELITIAN ... 23

3.1. Metode ... 23

3.2. Pengumpulan Data ... 23

(10)

x

3.3. Preprocessing ... 24

3.4. Perhitungan Jaro-Winkler Distance ... 25

3.5. Spell Sugestion dan Fitur Autocorrect ... 27

3.6. Evaluasi ... 28

BAB IV ... 29

HASIL DAN PEMBAHASAN ... 29

4.1. Kebutuhan Sistem ... 29

4.2. Collecting Data ... 29

4.3. Pre-Processing Data ... 29

4.3.1. Mount Drive ... 31

4.3.2. Setting Location Root Dirictory Project ... 32

4.3.3. Load Data Document ... 32

4.3.4. Pre-processing Document ... 33

4.4. Spell Suggestion Document ... 34

4.5. Identifikasi typographical ... 36

4.5.1. Typo Corrector ... 38

4.5.2. Hasil Uji System ... 39

4.6. Evaluasi ... 41

BAB V ... 44

KESIMPULAN DAN SARAN ... 44

5.1. Kesimpulan ... 44

DAFTAR PUSTAKA ... 45

(11)

xi

DAFTAR GAMBAR

Gambar 1. Alur Penelitian ... 23

Gambar 2. Tampilan Dokumen Proposal ... 24

Gambar 3. Isi Dokumen Hasil Convert .txt ... 30

Gambar 4. Lembar Baru Google Colab ... 31

Gambar 5. Hasil Mout Drive ... 32

Gambar 6. Hasil Cleaning Data ... 33

Gambar 7. Perbandingan Dokumen asli dengan Dokumen koreksi ... 41

(12)

xii

DAFTAR TABEL

Tabel 1. Penellitian Terdahulu ... 16

Tabel 2. Rancangan Analisis Perhitungan Jaro Winkler ... 27

Tabel 3. Source code mount drive ... 31

Tabel 4. Source code setting root directory project ... 32

Tabel 5. Source code load data ... 33

Tabel 6. Source Code Preprocessing Data ... 33

Tabel 7. Kata typo dokumen PKM ... 34

Tabel 8. Candidate kata typo ... 36

Tabel 9. Koreksi kata typo... 38

Tabel 10. Kalkulasi kata dari hasil koreksi typo ... 40

Tabel 11. Pegujian spell suggestion and correction ... 42

Tabel 12. Hasil evaluasi dokumen PKM ... 42

(13)

TA-010

UNIVERSITAS MUHAMMADIYAH MALANG

FAKULTAS TEKNIK

PROGRAM STUDI TEKNIK INFORMATIKA

Jl. Raya Tlogomas 246 Malang 65144 Telp. 0341 - 464318 Ext. 247, Fax. 0341 - 460782

FORM CEK PLAGIARISME LAPORAN TUGAS AKHIR

Nama Mahasiswa : Lutfi Aish Diaurrakman

NIM : 201710370311272

Judul TA : Implementasi Algoritma Joro Winkler Distance Fitur Autocorrect dan Spelling Suggestion pada Penulisan Proposal Program Kreativitas Mahasiswa (PKM) Hasil Cek Plagiarisme dengan Turnitin

No. Komponen Pengecekan Nilai Maksimal

Plagiarisme (%)

Hasil Cek Plagiarisme (%) *

1. Bab I – Pendahuluan 10 % 7 %

2. Bab II – Tinjauan Pustaka 25 % 16 %

3. Bab III – Metode Penelitian 25 % 16 %

4. Bab IV – Hasil dan Pembahasan 15 % 8 %

5. Bab V – Kesimpulan dan Saran 5 % 0 %

6. Makalah Tugas Akhir 20% 18 %

Mengetahui,

Dosen Pembimbing

(Agus Eko Minarno., S.Kom., M.Kom.)

*) Hasil cek plagiarism bisa diisikkan oleh salah satu pembimbing

(14)

DAFTAR PUSTAKA

[1] Dirjen Pembelajaran dan Kemahasiswaan. (2020). Pedoman Program Kreativitas Mahasiswa (PKM). jakarta: Kementrian Pendidikan dan Kebudayaan.

[2] Friendly, F. (2018). Perbaikan Metode Jaro–Winkler Distance Untuk Approximate String Search Menggunakan Data Terindeks Aplikasi Multi User. Jurnal Teknovasi: Jurnal Teknik dan Inovasi, 4(2), 69-78.

[3] Kurniawati, Anna, Sulistyo Puspitodjati, and Sazali Rahman.

"Implementasi algoritma jaro-winkler distance untuk membandingkan kesamaan dokumen Berbahasa Indonesia." Skripsi Program Studi Sistem Informasi (2010).

[4] Deolika, Agatha, Kusrini Kusrini, and Emha Taufiq Luthfi. "ANALISIS PEMBOBOTAN KATA PADA KLASIFIKASI TEXT MINING." JurTI (Jurnal Teknologi Informasi) 3.2 (2019): 179-184.

[5] Agus, T. (2016). PENGKOREKSIAN DAN SUGGESTION WORD

PADA KEYWORD MENGGUNAKAN ALGORITMA JARO

WINKLER. AITI, 13(2), 169-181.

[6] SPELLING, A. F. D. (2018). Algoritma Jaro-Winkler Distance: Fitur Autocorrect dan Spelling Suggestion pada Penulisan Naskah Bahasa Indonesia di BMS TV. Jurnal Teknologi Informasi dan Ilmu Komputer (JTIIK), 5(4).

[7] Wihardodo, W. (2018). Implementasi Perbaikan Kesalahan Ejaan Pada Sistem Essay Scoring (Doctoral dissertation, Universitas Komputer Indonesia).

[8] Mutammimah, M., Sujaini, H., & Nyoto, R. D. (2017). Analisis

(15)

Perbandingan Metode Spelling Corrector Peter Norvig dan Spelling Checker BK-Trees pada Kata Berbahasa Indonesia. JUSTIN (Jurnal Sistem dan Teknologi Informasi), 5(1), 12-16.

[9] Novantara, P. (2018). Implementasi Algoritma Jaro-Winkler Distance Untuk Sistem Pendeteksi Plagiarisme Pada Dokumen Skripsi. Buffer Informatika, 3(2).

[10] HANCOX, P. dan POLATIDIS, N., 2012. Query Matching Evaluation in an Infobot for University Admissions Processing. Symposium on Languages, Applications and Technologies, [online] 21, pp.149–161.

[11] Rochmawati, Y., & Kusumaningrum, R. (2016). Studi Perbandingan Algoritma Pencarian String dalam Metode Approximate String Matching untuk Identifikasi Kesalahan Pengetikan Teks. Jurnal Buana Informatika, 7(2).

[12] D. C. Brock, “Learning from artificial intelligence’s previous awakenings:

The history of expert systems,” AI Mag., vol. 39, no. 3, pp. 3–15, 2018, doi:

10.1609/aimag.v39i3.2809.

[13] Fahma, A. I. (2017). Identifikasi kesalahan penulisan kata (Typographical Error) pada dokumen berbahasa Indonesia menggunakan metode N-gram dan Levenshtein Distance (Doctoral dissertation, Universitas Brawijaya).

[14] Naradhipa, A. R., Kamayani, M., Reinanda, R., Simbolon, S., Soleh, M. Y.,

& Purwarianti, A. (2011). Application of Document Spelling Checker for Bahasa Indonesia. Icacsis,(May 2017), 249-252.

[15] Baskoro, S. Y., Ridok, A., & Furqon, M. T. (2015). Pencarian Pasal pada Kitab Undang-Undang Hukum Pidana (KUHP) Berdasarkan Kasus Menggunakan Metode Cosine Similarity dan Latent Semantic Indexing

(16)

(LSI). Journal of Environmental Engineering and Sustainable Technology, 2(2), 83-88.

[16] Manning, C.D., Raghavan, P. dan Schütze, H., 2009. An Introduction to Information Retrieval. Online ed. [online] Tersedia di:

<http://nlp.stanford.edu/IRbook/pdf/irbookonlinereading.pdf>.

[17] Soleh, M. Y., & Purwarianti, A. (2011, July). A non word error spell checker for Indonesian using morphologically analyzer and HMM.

In Proceedings of the 2011 International Conference on Electrical Engineering and Informatics (pp. 1-6). IEEE.

[18] J. Van den Broeck, S. A. Cunningham, R. Eeckels, and K. Herbst,

“Pembersihan Data: Mendeteksi, Mendiagnosis, dan Mengedit Kelainan Data,” https://journals.plos.org/, 2005, [Online]. Available:

https://journals.plos.org/plosmedicine/article?id=10.1371/journal.pmed.002 0267#s5.

[19] Mishra, A., & Vishwakarma, S. (2015, December). Analysis of tf-idf model and its variant for document retrieval. In 2015 international conference on computational intelligence and communication networks (cicn) (pp. 772- 776). IEEE.

[20] Butt, M., 2013. Precision and Recall. [online] Tersedia di:

<http://ling.unikonstanz.de/pages/home/butt/main/material/precision- recall.pdf>

Referensi

Dokumen terkait

Setelah selesai melaksanakan tugas latihan mengajar, mahasiswa sesegera mungkin mengadakan pertemuan dengan Dosen Luar Biasa PLP atau Dosen Tetap PLP. Pada pertemuan ini

Dari hasil pengolahan data menggunakan Economic Order Quantity (EOQ) kesimpulannya adalah total biaya material packing benang selama setahuan sebesar Rp 51.284.724,95 Total biaya

Tujuan dari penelitian ini adalah untuk memformulasikan dan mengevaluasi stabilitas fisik krim topikal yang mengandung 5% vitamin C dari ekstrak buah jambu biji dengan

Hasil penelitian ini menunjukkan bahwa minyak kenari dan gliserin memiliki pengaruh terhadap mutu fisik dan aktivitas lipbalm, tidak terdapat perbedaan aktivitas antara

1.. Ad 1) Online rezervacije su vrlo važna komponenta Internet stranice. Osim što olakšava gostima da odmah rezerviraju objekt koji im se svidi, zapravo veće su

Proses kontak pertama kali ditemukan pada tahun 1831 oleh Phillips, seorang Inggris, yang patennya mencakup aspek – aspek penting dari proses kontak yang modern, yaitu

Tidak hanya sebagai subjek pelaksana pacht ( pachter ) sebagaimana yang umum diungkapkan dalam penerapan pacht di wilayah lain, komunitas Cina di Pontianak merupakan objek

Dalam hal suatu liabilitas keuangan yang ada digantikan oleh liabilitas keuangan lain dari pemberi pinjaman yang sama dengan persyaratan yang berbeda secara