BAB VII PENUTUP
7.1 Capaian
Berdasarkan requirement yang telah ditentukan dan analisis yang telah dilakukan, serta rancangan yang telah dibuat, Tabel 68 menyajikan capaian dari pengembangan aplikasi pemeriksa ejaan bahasa Indonesia.
Tabel 68 Capaian pengembangan aplikasi
Requirement Analisis Desain Implementasi
Aplikasi dapat melakukan pemeriksaan pada
teks √ √ √
Aplikasi dapat membaca dokumen dengan
format pdf dan ext √ √ √
Pemeriksaan yang dilakukan meliputi pemeriksaan terhadap kesalahan tipografi, kesalahan morfologis, serta kesalahan
penggabungan dan pemisahan kata untuk kata gabung dan bentuk terikat yang tidak
berimbuhan.
√ √ √
Pemeriksaan kesalahan penggabungan dan pemisahan kata untuk kata yang memiliki unsur
‘di’ √ √ ×
Aplikasi dapat menampilkan daftar kesalahan
kata √ √ √
Aplikasi dapat memberikan saran kata
perbaikan √ × ×
Keterangan :
1. Proses pemeriksaan penggabungan dan pemisahan kata yang sudah diimplementasi saat ini ialah pemeriksaan untuk kata gabung dan bentuk terikat yang tidak berimbuhan.
2. Proses pemeriksaan penggabungan dan pemisahan kata belum dilakukan dengan memanfaatkan kelas kata.
3. Proses analisis morfologi yang ada saat ini belum dapat menangani kata-kata yang dilekatkan oleh imbuhan pengecualian yang menyebabkan bentuk dari kata tersebut berbeda dari bentuk umumnya, sehingga untuk kata-kata yang dilekatkan imbuhan pengecualian yang salah penggunaannya masih dianggap sebagai kata yang benar.
4. Pada proses pemeriksaan tipografi dan morfologis, nama tempat dan nama orang dianggap sebagai kata yang salah.
5. Proses pemberian saran kata perbaikan belum dapat diimplementasikan, namun analisis proses pemberian saran kata perbaikan sudah dilakukan, yaitu dengan menggunakan algoritme editdistance.
6. Proses analisis morfologi untuk kata ulang hanya dapat menangani kata ulang murni, seperti ‘anak-anak’ dan ‘berjalan-jalan’.
Hasil pencapaian pengembangan aplikasi pemeriksa ejaan bahasa Indonesia disajikan pada Tabel 69 hingga Tabel 71.
Tabel 69 Hasil pencapaian pada tahap analisis
No. Analisis Status Keterangan
1. Analisis sistem sejenis (spellchecker.net,
star21.com, Microsoft Word 2013, Hunspell)
100% Dilakukan analisis terhadap 3 aplikasi pemeriksa ejaan bahasa Indonesia dan 1 library bahasa inggris untuk mengetahui kemampuan dari masing- masing aplikasi tersebut
2. Analisis kasus (kesalahan tipografi, kesalahan morfologis, kesalahan penggabungan dan pemisahan kata)
100% Analisis dilakukan pada setiap kategori kesalahan untuk memberikan gambaran mengenai pemeriksaan ejaan pada masing-masing kasus 3. Analisis proses
pemeriksaan kesalahan tipografi dan morfologis
100% Analisis mengenai proses pemeriksaan yang dilakukan untuk kategori kesalahan tipografi dan morfologis 4. Analisis proses
pemeriksaan kesalahan penggabungan dan pemisahan kata
100% Analisis mengenai proses pemeriksaan yang dilakukan untuk kategori kesalahan penggabungan dan pemisahan kata
5. Analisis pemeriksaan kata asing
100% Analisis mengenai proses pemeriksaan yang dilakukan untuk kata asing
Tabel 69 Hasil pencapaian pada tahap analisis (lanjutan)
No. Analisis Status Keterangan
6. Analisis pemeriksaan imbuhan bahasa asing
100% Analisis mengenai proses pemeriksaan yang dilakukan untuk imbuhan yang berasal dari bahasa asing
7. Analisis pemberian saran kata perbaikan untuk kesalahan tipografi dan morfologis
100% Analisis mengenai proses pemberian saran kata perbaikan untuk kategori kesalahan tipografi dan morfologi 8. Analisis pemberian saran
kata perbaikan untuk kesalahan penggabungan dan pemisahan kata
100% Analisis mengenai proses pemberian saran kata perbaikan untuk kategori kesalahan penggabungan dan pemisahan kata
9. Analisis algoritme lemmatization
100% Analisis yang dilakukan untuk mengetahui kemampuan dari algoritme lemmatization dengan melakukan uji coba terhadap algoritme tersebut, serta menyesuaikan algoritme lemmatization untuk kebutuhan analisis morfologi
10. Analisis algoritme Damerau-Lavenstain Distance
100% Analisis yang dilakukan untuk menyesuaikan algoritme Damerau- Lavenstain Distance untuk kebutuhan pemberian saran kata perbaikan 11. Analisis tool PDFBox 70% Analisis yang dilakukan untuk
mengetahui kemampuan dari PDFBox, serta menyesuaikan PDFBox dengan kebutuhan membaca teks, namun belum dilakukan analisis untuk jenis pdf dan style apa saja yang dapat dibaca oleh PDFBox
12. Analisis algortime Edit Distance
100% Analisis yang dilakukan untuk menyesuaikan algoritme Edit Distance untuk kebutuhan pemberian saran kata perbaikan
13. Analisis kebutuhan aplikasi yang dibangun
100% Analisis mengenai kebutuhan- kebutuhan aplikasi yang dibangun
Tabel 70 Hasil pencapaian tugas akhir
No. Requirement Analisis Perancangan Nama Method/Table Implementasi Keterangan
1. Pemeriksaan ejaan 100% 100% check() 100% Sudah dilakukan analisis,
perancangan, dan implementasi
2. setCorrect() 100% Sudah dilakukan analisis,
perancangan, dan implementasi
3. setError() 100% Sudah dilakukan analisis,
perancangan, dan implementasi 4. Pemeriksaan
kesalahan tipografi dan morfologis
100% 100% checkTypoMorfology() 70% Pemeriksaan yang dilakukan meliputi kata dasar, kata berimbuhan, kata ulang murni, kata ulang berubah bunyi, kata ulang sebagian, kata ulang berimbuhan, frasa, dan akronim, namun untuk pemeriksaan kata ulang berubah bunyi, kata ulang berimbuhan, dan kata ulang sebagian belum diimplementasi [KET-01]
5. readText() 100% Sudah dilakukan analisis,
perancangan, dan implementasi
6. readPdf() 100% Sudah dilakukan analisis,
perancangan, dan implementasi
7. lookup() 100% Sudah dilakukan analisis,
perancangan, dan implementasi
8. analyze() 100% Sudah dilakukan analisis,
Tabel 70 Hasil pencapaian tugas akhir (lanjutan)
No. Requirement Analisis Perancangan Nama Method/Table Implementasi Keterangan
9. deleteInflectionalSuffix() 100% Sudah dilakukan analisis,
perancangan, dan implementasi
10. deleteDerSuffix() 100% Sudah dilakukan analisis,
perancangan, dan implementasi
11. deletePersonalPronoun() 100% Sudah dilakukan analisis,
perancangan, dan implementasi
12. checkRulePrecedence () 100% Sudah dilakukan analisis,
perancangan, dan implementasi
13. checkAllowedCombination () 100% Sudah dilakukan analisis,
perancangan, dan implementasi
14. affixRemoval() 100% Sudah dilakukan analisis,
perancangan, dan implementasi
15. generateRule() 100% Sudah dilakukan analisis,
perancangan, dan implementasi
16. removing() 100% Sudah dilakukan analisis,
perancangan, dan implementasi
17. searchAffix() 100% Sudah dilakukan analisis,
perancangan, dan implementasi
18. hasDissallowedPair() 100% Sudah dilakukan analisis,
perancangan, dan implementasi
19. recoding() 100% Sudah dilakukan analisis,
perancangan, dan implementasi
20. getRecodingRule() 100% Sudah dilakukan analisis,
Tabel 70 Hasil pencapaian tugas akhir (lanjutan)
21. generateWord() 100% Sudah dilakukan analisis,
perancangan, dan implementasi
22. getQuery() 100% Sudah dilakukan analisis,
perancangan, dan implementasi 23. Pemeriksaan
kesalahan
penggabungan dan pemisahan kata
100% 100% checkPenggabungan() 50% Pemeriksaan yang dilakukan meliputi kata gabung, bentuk terikat, dan kata 'di', serta dengan memanfaatkan kelas kata, namun untuk pemeriksaan kata 'di' dan pemanfaatan kelas kata belum diimplementasi [KET-02, KET- 03]
24. isKataGabung() 100% Sudah dilakukan analisis,
perancangan, dan implementasi
25. getRuleWord() 0% Belum diimplementasinya
pemeriksaan untuk kata 'di' [KET- 02]
26. checkRuleWord() 0% Belum diimplementasinya
pemeriksaan untuk kata 'di' [KET- 02]
27. getKataGabung() 100% Sudah dilakukan analisis,
perancangan, dan implementasi
28. getKelasKata() 0% Pemeriksaan belum
memanfaatkan kelas kata [KET- 02, KET-03]
Tabel 70 Hasil pencapaian tugas akhir (lanjutan)
No. Requirement Analisis Perancangan Nama Method/Table Implementasi Keterangan
29. checkKataGabung() 0% Pemeriksaan kata gabung belum
memanfaatkan kelas kata [KET- 02, KET-03]
30. Text preprocessing 100% 100% Tokenizing 100% Sudah dilakukan analisis,
perancangan, dan implementasi
31. stopwordRemoval 100% Sudah dilakukan analisis,
perancangan, dan implementasi
32. caseFolding 100% Sudah dilakukan analisis,
perancangan, dan implementasi
33. Filtering 100% Sudah dilakukan analisis,
perancangan, dan implementasi
34. isStopword 100% Sudah dilakukan analisis,
perancangan, dan implementasi
35. getToken 100% Sudah dilakukan analisis,
perancangan, dan implementasi 36. Pemberian saran kata
perbaikan
100% 0% editDistance 0% Fitur pemberian saran perbaikan pada tugas akhir ini hanya dilakukan pada tahap analisis [KET-04]
37. getSuggestTypo 0%
38. getSuggestPenulisan 0%
39. Kamus istilah 0% 0% getKataIstilah 0% Fitur kamus istilah pada tugas akhir belum dilakukan analisis, perancangan, maupun implementasi [KET-05]
Tabel 70 Hasil pencapaian tugas akhir (lanjutan)
No. Requirement Analisis Perancangan Nama Method/Table Implementasi Keterangan
41. Perancangan database
100% LEMMA 100% Sudah dilakukan analisis,
perancangan, dan implementasi
42. KAMUS_ISTILAH 0% Belum diimplementasi [KET-05]
43. RULE_TYPE 100% Sudah dilakukan analisis,
perancangan, dan implementasi
44. MORPHOLOGY_RULE 100% Sudah dilakukan analisis,
perancangan, dan implementasi
45. RULE_WORDS 0% Belum diimplementasi [KET-02,
Tabel 71 Keterangan hasil pencapaian tugas akhir
No. Nama Keterangan Deskripsi
1. KET-01 Belum diimplementasikannya aturan untuk imbuhan pengecualian, serta aturan kata ulang (kata ulang berubah bunyi, kata ulang sebagian, dan kata ulang berimbuhan)
2. KET-02 Belum diimplementasikannya aturan penulisan
kata “di”
3. KET-03 Belum diimplementasikannya pemeriksaan kesalahan penggabungan dan pemisahan kata yang memanfaatkan kelas kata bahasa Indonesia 4. KET-04 Aplikasi belum dapat memberikan saran kata
perbaikan untuk setiap kata yang salah
5. KET-05 Aplikasi belum menyediakan fitur kamus istilah 7.2 Saran
Berdasarkan capaian dari aplikasi yang dibangun, terdapat hal-hal yang belum selesai pengerjaannya, kurangnya analisis yang dilakukan, kurangnya desain dan perancangan yang dibuat, hingga belum diimplementasinya fitur-fitur maupun keutuhan suatu proses, sehingga aplikasi perlu dilengkapi dengan hal-hal berikut.
1. Pemeriksaan ejaan untuk kategori kesalahan penggabungan dan pemisahan kata dengan memanfaatkan kelas kata bahasa Indonesia.
Pemeriksaan untuk kategori kesalahan ini masih terdapat kekurangan, yaitu kasus penggabungan dan pemisahan kata yang melibatkan kelas kata bahasa Indonesia. Contohnya kata ‘di makan’, kata tersebut seharusnya digabungkan penulisannya karena berdasarkan aturan yang telah dibuat dari hasil analisis penggabungan dan pemisahan kata, kata ‘di’ jika bertemu dengan kata dasar yang memiliki kelas kata verb maka penulisannya harus digabungkan.
2. Menyediakan fitur kamus istilah
Kamus istilah digunakan untuk penambahan sumber kata yang digunakan pada proses pemeriksaan ejaan, namun fitur penambahan kamus istilah ini belum dapat diimplementasikan.
Aplikasi pemeriksaan yang dibuat hanya dapat menangani pemeriksaan kesalahan untuk kata ulang murni, seperti ‘anak-anak’, ‘jalan-jalan’, dan lain- lain. Dalam bahasa Indonesia terdapat 3 jenis kata ulang, yaitu kata ulang murni, kata ulang sebagian, dan kata ulang berubah bunyi.
4. Navigasi untuk Ignore dan CorrectWord
Navigasi yang disediakan untuk melakukan pengabaian pemeriksaan suatu kata dan pembenaran kata pada proses pemeriksaan ejaan.
5. Aturan imbuhan pengecualian bahasa Indonesia
Dalam aturan pembentukan kata terdapat beberapa imbuhan pengecualian yang menyebabkan suatu kata yang dilekatkan pada imbuhan tersebut memiliki bentuk yang berbeda dari bentuk umumnya karena salah satu huruf dari kata tersebut dilebur, dihilangkan, digantikan, maupun luluh menjadi huruf tertentu. Misalnya prefiks me- yang dilekatkan pada kata ‘pukul’ menghasilkan kata ‘memukul’, huruf kedua dari kata ‘pukul’ merupakan huruf vokal sehingga huruf ‘p’ pada awal kata tersebut dilebur. Kata-kata yang dilekatkan oleh imbuhan pengecualian seperti di atas harus diberikan perilaku berbeda dengan kata-kata berimbuhan umumnya (bukan imbuhan pengecualian), karena kata- kata tersebut berhasil melalui proses analisis morfologi walaupun penggunaannya tidak sesuai dengan aturan morfologi. Kata ‘mempukul’ dan ‘memukul’ keduanya berhasil dilakukan proses analisis morfologi dengan bentuk dasar ‘pukul’, namun apabila secara aturan pembentukan kata bahasa Indonesia, pengimbuhan pada kata ‘pukul’ dengan imbuhan me- menjadi ‘memukul’.
6. Implementasi pemberian saran kata perbaikan
Saran kata perbaikan diberikan untuk setiap kata yang salah berdasarkan kategori kesalahan dari masing-masing kata yang salah tersebut.
145
DAFTAR PUSTAKA
Jelita, Asian. 2007. ‘Effective Techniques for Indonesian Text Retrieval’, PhD thesis School of Computer Science and Information Technology RMIT University Australia.
Kushartanti, dkk. (ed). 2005. Pesona Bahasa: Langkah Awal Memahami Linguistik. Jakarta: PT Gramedia Pustaka Utama.
Norvig, Peter. How to Write a Spelling Corrector. http://norvig.com/spell- correct.html [2 Juni 2016]
Suhartono, Derwin. 2014. Lemmatization Technique in Bahasa: Indonesian Language (JOURNAL OF SOFTWARE, VOL. 9, NO. 5).
Sommerville, Ian. 2011. SoftwareEngineeringNinthEdition.
Taufik, Jiwa. 2011. Analisa dan Evaluasi Afiks Stemming untuk Bahasa Indonesia. FMIPA Universitas Syiah Kuala Banda Aceh Indonesia
A-1
Lampiran A
B-1
Lampiran B
Lampiran B Daftar Stopword Tala
ada, adalah, adanya, adapun, agak, agaknya, agar, akan, akankah, akhir, akhiri, akhirnya, aku, akulah, amat, amatlah, anda, andalah, antar, antara, antaranya, apa, apaan, apabila, apakah, apalagi, apatah, artinya, asal, asalkan, atas, atau, ataukah, ataupun, awal, awalnya, bagai, bagaikan, bagaimana, bagaimanakah, bagaimanapun, bagi, bagian, bahkan, bahwa, bahwasanya, baik, bakal, bakalan, balik, banyak, bapak, baru, bawah, beberapa, begini, beginian, beginikah, beginilah, begitu, begitukah, begitulah, begitupun, bekerja, belakang, belakangan, belum, belumlah, benar, benarkah, benarlah, berada, berakhir, berakhirlah, berakhirnya, berapa, berapakah, berapalah, berapapun, berarti, berawal, berbagai, berdatangan, beri, berikan, berikut, berikutnya, berjumlah, berkali-kali, berkata, berkehendak, berkeinginan, berkenaan, berlainan, berlalu, berlangsung, berlebihan, bermacam, bermacam-macam, bermaksud, bermula, bersama, bersama- sama, bersiap, bersiap-siap, bertanya, bertanya-tanya, berturut, berturut-turut, bertutur, berujar, berupa, besar, betul, betulkah, biasa, biasanya, bila, bilakah, bisa, bisakah, boleh, bolehkah, bolehlah, buat, bukan, bukankah, bukanlah, bukannya, bulan, bung, cara, caranya, cukup, cukupkah, cukuplah, cuma, dahulu, dalam, dan, dapat, dari, daripada, datang, dekat, demi, demikian, demikianlah, dengan, depan, di, dia, diakhiri, diakhirinya, dialah, diantara, diantaranya, diberi, diberikan, diberikannya, dibuat, dibuatnya, didapat, didatangkan, digunakan, diibaratkan, diibaratkannya, diingat, diingatkan, diinginkan, dijawab, dijelaskan, dijelaskannya, dikarenakan, dikatakan, dikatakannya, dikerjakan, diketahui, diketahuinya, dikira, dilakukan, dilalui, dilihat, dimaksud, dimaksudkan, dimaksudkannya, dimaksudnya, diminta, dimintai, dimisalkan, dimulai, dimulailah, dimulainya, dimungkinkan, dini, dipastikan, diperbuat, diperbuatnya, dipergunakan, diperkirakan, diperlihatkan, diperlukan, diperlukannya, dipersoalkan, dipertanyakan, dipunyai, diri, dirinya, disampaikan, disebut, disebutkan, disebutkannya, disini, disinilah, ditambahkan, ditandaskan, ditanya, ditanyai, ditanyakan, ditegaskan, ditujukan, ditunjuk, ditunjuki, ditunjukkan, ditunjukkannya, ditunjuknya, dituturkan, dituturkannya, diucapkan, diucapkannya, diungkapkan, dong, dua, dulu, empat, enggak, enggaknya, entah, entahlah, guna, gunakan, hal, hampir, hanya, hanyalah, hari, harus, haruslah, harusnya, hendak, hendaklah, hendaknya, hingga, ia, ialah, ibarat, ibaratkan, ibaratnya, ibu, ikut, ingat, ingat-ingat, ingin, inginkah, inginkan, ini, inikah, inilah, itu, itukah, itulah, jadi, jadilah, jadinya, jangan, jangankan, janganlah, jauh, jawab, jawaban, jawabnya, jelas, jelaskan, jelaslah, jelasnya, jika, jikalau, juga, jumlah, jumlahnya, justru, kala, kalau, kalaulah, kalaupun, kalian, kami, kamilah, kamu, kamulah, kan, kapan, kapankah, kapanpun, karena, karenanya, kasus, kata, katakan, katakanlah, katanya, ke, keadaan, kebetulan, kecil, kedua, keduanya, keinginan, kelamaan, kelihatan, kelihatannya, kelima, keluar, kembali, kemudian, kemungkinan, kemungkinannya, kenapa, kepada, kepadanya, kesampaian, keseluruhan,
keseluruhannya, keterlaluan, ketika, khususnya, kini, kinilah, kira, kira-kira, kiranya, kita, kitalah, kok, kurang, lagi, lagian, lah, lain, lainnya, lalu, lama, lamanya, lanjut, lanjutnya, lebih, lewat, lima, luar, macam, maka, makanya, makin, malah, malahan, mampu, mampukah, mana, manakala, manalagi, masa, masalah, masalahnya, masih, masihkah, masing, masing-masing, mau, maupun, melainkan, melakukan, melalui, melihat, melihatnya, memang, memastikan, memberi, memberikan, membuat, memerlukan, memihak, meminta, memintakan, memisalkan, memperbuat, mempergunakan, memperkirakan, memperlihatkan, mempersiapkan, mempersoalkan, mempertanyakan, mempunyai, memulai, memungkinkan, menaiki, menambahkan, menandaskan, menanti, menanti-nanti, menantikan, menanya, menanyai, menanyakan, mendapat, mendapatkan, mendatang, mendatangi, mendatangkan, menegaskan, mengakhiri, mengapa, mengatakan, mengatakannya, mengenai, mengerjakan, mengetahui, menggunakan, menghendaki, mengibaratkan, mengibaratkannya, mengingat, mengingatkan, menginginkan, mengira, mengucapkan, mengucapkannya, mengungkapkan, menjadi, menjawab, menjelaskan, menuju, menunjuk, menunjuki, menunjukkan, menunjuknya, menurut, menuturkan, menyampaikan, menyangkut, menyatakan, menyebutkan, menyeluruh, menyiapkan, merasa, mereka, merekalah, merupakan, meski, meskipun, meyakini, meyakinkan, minta, mirip, misal, misalkan, misalnya, mula, mulai, mulailah, mulanya, mungkin, mungkinkah, nah, naik, namun, nanti, nantinya, nyaris, nyatanya, oleh, olehnya, pada, padahal, padanya, pak, paling, panjang, pantas, para, pasti, pastilah, penting, pentingnya, per, percuma, perlu, perlukah, perlunya, pernah, persoalan, pertama, pertama-tama, pertanyaan, pertanyakan, pihak, pihaknya, pukul, pula, pun, punya, rasa, rasanya, rata, rupanya, saat, saatnya, saja, sajalah, saling, sama, sama-sama, sambil, sampai, sampai- sampai, sampaikan, sana, sangat, sangatlah, satu, saya, sayalah, se, sebab, sebabnya, sebagai, sebagaimana, sebagainya, sebagian, sebaik, sebaik-baiknya, sebaiknya, sebaliknya, sebanyak, sebegini, sebegitu, sebelum, sebelumnya, sebenarnya, seberapa, sebesar, sebetulnya, sebisanya, sebuah, sebut, sebutlah, sebutnya, secara, secukupnya, sedang, sedangkan, sedemikian, sedikit, sedikitnya, seenaknya, segala, segalanya, segera, seharusnya, sehingga, seingat, sejak, sejauh, sejenak, sejumlah, sekadar, sekadarnya, sekali, sekali-kali, sekalian, sekaligus, sekalipun, sekarang, sekarang, sekecil, seketika, sekiranya, sekitar, sekitarnya, sekurang-kurangnya, sekurangnya, sela, selain, selaku, selalu, selama, selama-lamanya, selamanya, selanjutnya, seluruh, seluruhnya, semacam, semakin, semampu, semampunya, semasa, semasih, semata, semata-mata, semaunya, sementara, semisal, semisalnya, sempat, semua, semuanya, semula, sendiri, sendirian, sendirinya, seolah, seolah-olah, seorang, sepanjang, sepantasnya, sepantasnyalah, seperlunya, seperti, sepertinya, sepihak, sering, seringnya, serta, serupa, sesaat, sesama, sesampai, sesegera, sesekali, seseorang, sesuatu, sesuatunya, sesudah, sesudahnya, setelah, setempat, setengah, seterusnya, setiap, setiba, setibanya, setidak-tidaknya, setidaknya, setinggi, seusai, sewaktu, siap, siapa, siapakah, siapapun, sini, sinilah, soal, soalnya, suatu, sudah, sudahkah, sudahlah, supaya, tadi,
tadinya, tahu, tahun, tak, tambah, tambahnya, tampak, tampaknya, tandas, tandasnya, tanpa, tanya, tanyakan, tanyanya, tapi, tegas, tegasnya, telah, tempat, tengah, tentang, tentu, tentulah, tentunya, tepat, terakhir, terasa, terbanyak, terdahulu, terdapat, terdiri, terhadap, terhadapnya, teringat, teringat-ingat, terjadi, terjadilah, terjadinya, terkira, terlalu, terlebih, terlihat, termasuk, ternyata, tersampaikan, tersebut, tersebutlah, tertentu, tertuju, terus, terutama, tetap, tetapi, tiap, tiba, tiba- tiba, tidak, tidakkah, tidaklah, tiga, tinggi, toh, tunjuk, turut, tutur, tuturnya, ucap, ucapnya, ujar, ujarnya, umum, umumnya, ungkap, ungkapnya, untuk, usah, usai, waduh, wah, wahai, waktu, waktunya, walau, walaupun, wong, yaitu, yakin, yakni, yang
C-1
Lampiran C
Lampiran C Kelas Kata pada Bahasa Indonesia
No. Tag Kelas Kata Deskripsi Contoh
1. A Adjektiva Kata yang menjelaskan
nomina atau Pronomina
Gembira, besar, betul
2. Adv Adverbia Kata yang menjelaskan
verba, adjektiva, adverbia lain, atau kalimat
Sangat, amat, dengan, untuk, karena
3. N Nomina Kata benda Kota, orang,
buah, siswa
4. V Verba Kata kerja Makan, siram,
baca asah
5. Num Numeralia Kata bilangan Enam, semua,
seluruh
6. Pron Pronomina Kelas kata yang
meliputi kata ganti, kata tunjuk, dan kata tanya
Dia, saya, engkau, sana, sini
D-1
Lampiran D
Lampiran D Daftar Aturan Morfologi Bahasa Indonesia yang Digunakan
Aturan Prefiks
No. Checking Rule Stem
Rule Tipe Deskripsi
1. Di di- DER_PREFIX
2. Ke ke- DER_PREFIX
3. Se se- DER_PREFIX
4. ber(?!ajar)+V ber-*|be-* DER_PREFIX 5. ber[bcdfghjklmnpqstvwxyz]+A+(?!er) ber-* DER_PREFIX 6. ber[bcdfghjklmnpqstvwxyz]+A+er ber-* DER_PREFIX
7. Belajar bel-ajar DER_PREFIX
8. be[bcdfghjkmnpqstvwxyz]er+C be-* DER_PREFIX
9. ter+V ter-* DER_PREFIX
10. ter[bcdfghjklmnpqstvwxyz]er+V ter-* DER_PREFIX 11.
5 ter+C+(?!er) ter-* DER_PREFIX
12. te[bcdfghjklmnpqstvwxyz]er+C ter-* DER_PREFIX
13. me[lrwy]+V me-* DER_PREFIX
14. mem[bfv] mem-* DER_PREFIX
15. Mempe mem-* DER_PREFIX
16. memr+V mem- p* DER_PREFIX 17. mem+V mem- m*|me m-p* DER_PREFIX
18. mem[bfv] men-* DER_PREFIX
19. men+V men-t* DER_PREFIX
20. meng[ghqk] meng-* DER_PREFIX
21. meng(+V+)
meng- *|meng- k
No. Checking Rule Stem
Rule Tipe Deskripsi
22. meny+V me-s* DER_PREFIX
23. memp[abcdfghijklmnopqrstuvwxyz] mem-* DER_PREFIX
24. pe[wy]+V pe-* DER_PREFIX
25. per+V per-* DER_PREFIX
26. per[bcdfghjklmnpqstvwxyz][a-
z](?!er) per-* DER_PREFIX
27. pem[bfv] pem-* DER_PREFIX
28. pem(r?)+V pe-* DER_PREFIX
29. pen+V pen-* DER_PREFIX
30. peng+C peng-* DER_PREFIX
31. peng+V peng-* DER_PREFIX
32. peny+V peny-s* DER_PREFIX
33. pel+V
pel- ajar|pe- *
DER_PREFIX 34. pe[bcdfghjkpqstvxz]er+V per-* DER_PREFIX 35. pe[bcdfghjkpqstvxz](?!er) pe-* DER_PREFIX 36. pe[bcdfghjkpqstvxz]er+C pe-* DER_PREFIX
37. Ku ku-* PERS_PRONOUN
38. kau Kau-* PERS_PRONOUN
Aturan Sufiks
No. Checking Rule Stem Rule Tipe Deskripsi
1. [^i]i *-i DER_SUFFIX
2. an *-an|*-kan DER_SUFFIX
3. kan *-kan DER_SUFFIX
4. ku *-ku POSS_PRONOUN
No. Checking Rule Stem Rule Tipe Deskripsi
6. nya *-nya POSS_PRONOUN
7. lah *-lah PARTICLE
8. kah *-Kah PARTICLE
9. tah *-Tah PARTICLE
10. pun *-Pun PARTICLE
Aturan Morfologi
No. Checking Rule Tipe Deskripsi
1. 1 + 2 + 2 + stem + 3 + 4 + 5 MORPH_RULE -
Keterangan.
1. Personal Pronoun (PERS_PRONOUN) 2. Derivational Prefix (DER_PREFIX) 3. Derivational Suffix (DER_SUFFIX) 4. Possesive Pronoun (POSS_PRONOUN) 5. Particle (PARTICLE)
Aturan DisallowedPairs
No. CheckingRule Tipe Deskripsi
1. be+stem+i DISS_PAIRS 2. ke+stem+i DISS_PAIRS 3. se+stem+i DISS_PAIRS 4. ke+stem+kan DISS_PAIRS 5. se+stem+kan DISS_PAIRS 6. di+stem+an DISS_PAIRS 7. te+stem+an DISS_PAIRS
No. CheckingRule Tipe Deskripsi
8. me+stem+an DISS_PAIRS
Aturan AllowedCombination
No. CheckingRule Tipe Deskripsi
1. diber+stem ALLOWED_COMB
2. member+stem ALLOWED_COMB
3. keber+stem ALLOWED_COMB
E-1
Lampiran E
Lampiran E Hasil Uji Coba terhadap Lemmatization
No. Kata yang
Dimasukkan Hasil Output Keterangan
1. Tulis Tidak berhasil Tulis
Hasil yang diberikan seharusnya berhasil dengan output‘tulis’ 2. Penulisan Berhasil Tulis
3. Penulisaan Tidak berhasil penulisaan
Tidak dapat dilakukan proses lemmatization 4. Penulisam Tidak berhasil penulisam
Tidak dapat dilakukan proses lemmatization 5. Penulisn Tidak berhasil penulisn
Tidak dapat dilakukan proses lemmatization 6. Anak-anak Tidak berhasil Anak
Hasil yang diberikan seharusnya berhasil dengan output‘anak’
7. Kekanak-kanakan Berhasil kanak-kanak
Output yang dihasilkan berupa kata ulang yang sudah dihilangkan imbuhannya 8. Mencari-cari Berhasil Cari
Output yang dihasilkan berupa kata dasar 9. Berlari-lari Berhasil Lari
Output yang dihasilkan berupa kata dasar
10. Sayur-mayur Tidak berhasil sayur-mayur
Tidak berhasil dilakukan proses lemmatization dan tidak ditemukan pada dictionary lemmatizer
11. Teka-teki Tidak berhasil teka-teki
Tidak berhasil dilakukan proses lemmatization dan tidak ditemukan pada dictionary lemmatizer
12. Bolak-balik Tidak berhasil bolak-balik
Tidak berhasil dilakukan proses lemmatization, namun kata ‘bolak-
No. Kata yang
Dimasukkan Hasil Output Keterangan
balik’ terdapat pada dictionary lemmatizer
13. Membolak-balikan Berhasil bolak-balik
Output yang dihasilkan berupa kata ulang yang sudah dihilangkan imbuhannya 14. Garisbawah Tidak berhasil garisbawah
Hasil yang diberikan seharusnya berhasil dengan output
‘garisbawah’ 15. Menggarisbawahi Berhasil garisbawah
Output yang dihasilkan berupa lema ‘garis bawah’ 16. Hancurlebur Tidak berhasil hancurlebur
Hasil yang diberikan seharusnya berhasil dengan output
‘hancurlebur’ 17. Penghancurleburan Berhasil hancurlebur
Output yang dihasilkan berupa lema ‘hancur lebur’
18. Belajar Berhasil Ajar
19. Berajar Berhasil Ajar
Seharusnya pada proses lemmatization kata ‘berajar’ tidak berhasil dilakukan karena tidak sesuai dengan aturan morfologi (termasuk pengecualian kata berimbuhan)
20. Pelajar Berhasil Ajar
21. Perajar Berhasil Ajar
Seharusnya pada proses lemmatization kata ‘perajar’ tidak