APLIKASI STEMMING KATA BERIMBUHAN BAHASA INDONESIA MENGGUNAKAN ALGORITMA ECSP (ENHANCED CONFIX STRIPPING PORTER) STEMMER
BERBASIS ANDROID
SKRIPSI
REFADHLY MUHARRAM 1110511104
UNIVERSITAS PEMBANGUNAN NASIONAL “VETERAN” JAKARTA FAKULTAS ILMU KOMPUTER
PROGRAM STUDI TEKNIK INFORMATIKA
2015
APLIKASI STEMMING KATA BERIMBUHAN BAHASA INDONESIA MENGGUNAKAN ALGORITMA ECSP (ENHANCED CONFIX STRIPPING PORTER) STEMMER
BERBASIS ANDROID
SKRIPSI
Diajukan Sebagai Salah Satu Syarat Untuk Memperoleh Gelar Sarjana Komputer
REFADHLY MUHARRAM 1110511104
UNIVERSITAS PEMBANGUNAN NASIONAL “VETERAN” JAKARTA FAKULTAS ILMU KOMPUTER
PROGRAM STUDI TEKNIK INFORMATIKA
2015
v
APLIKASI STEMMING KATA BERIMBUHAN BAHASA INDONESIA MENGGUNAKAN ALGORITMA ECSP (ENHANCED CONFIX STRIPPING PORTER) STEMMER
BERBASIS ANDROID
Refadhly Muharram
Abstrak
Bahasa Indonesia kaya akan kata berimbuhan. Imbuhan-imbuhan ini terdiri dari prefiks (awalan), sufiks (akhiran), maupun infiks (sisipan). Stemming adalah proses pemetaan dan penguraian berbagai bentuk (variants) dari suatu kata menjadi bentuk kata dasarnya dengan menggunakan aturan-aturan tertentu. Secara ilmu bahasa, hal ini mudah dilakukan oleh manusia untuk melakukan ejaan dari suatu kata. Pada penerapannya, banyak orang yang masih belum optimal dan salah dalam menentukan kata dasar dari suatu kata berimbuhan. Maka dari itu dalam tugas akhir ini penulis membuat aplikasi stemming dimana aplikasi ini berguna dalam pencarian kata dasar dari suatu kata. Implementasi aplikasi dilakukan menggunakan bahasa pemrograman Java Andoid, Web Service, PHP dan Database dibuat di PHPMySQL yang nantinya ditempatkan di server. Salah satu metode algoritma yang digunakan pada stemming bahasa Indonesia ini adalah perpaduan algoritma ECS (Enhanced Confix Stripping) dan algoritma Porter Stemmer. Hasil yang didapat dari penelitian adalah aplikasi yang dapat beroperasi dengan baik dalam mencari kata dasar dari kata berimbuhannya dengan optimal.
Kata Kunci : Stemming, Algoritma ECSP, Android, Web Service, PHPMySQL
vi
STEMMING APPLICATION WORD THAT HAS AFFIX OF INDONESIAN USING ALGORITHM ECSP (ENHANCED
CONFIX STRIPPING PORTER) STEMMER BASED ON ANDROID
Refadhly Muharram
Abstract
Indonesian rich affixes word. Affixes consist of prefixes, suffixes, and infix.
Stemming is the process of mapping and decomposition of various forms (variants) of a word to form said essentially by using certain rules. In linguistics, this is easily done by humans to do the spelling of a word. In practice, many people are still not optimal, and one in determining the basis of a word which affixes. Therefore in this thesis the author to create applications stemming assumption of where the application is useful in the search for the root of a word. Implementation of the application is done using the Java programming language Andoid, Web Services, PHP and a database created in PHPMySQL that will be placed on the server. One method algorithm used in Indonesian stemming algorithm is a combination of ECS (Enhanced confix stripping) and Porter Stemmer algorithm. The results of the research are applications that can operate well in finding the root of the word that affixes to the optimum.
Keywords: Stemming, Algorithm ECSP, Android, Web Service, PHPMySQL
vii
KATA PENGANTAR
Puji syukur kami panjatkan kehadirat Allah SWT yang telah memberikan rahmat, hidayah serta kekuatan sehingga Skripsi yang berjudul APLIKASI STEMMING KATA BERIMBUHAN BAHASA INDONESIA MENGGUNAKAN
ALGORITMA ECSP (ENHANCED CONFIX STRIPPING PORTER) STEMMER BERBASIS ANDROID dapat diselesikan dengan baik.
Penulis menyampaikan rasa hormat dan mengucapkan banyak terima kasih yang tulus kepada :
1. Yth. Bapak Dr. Nidjo Sandjojo, M.Sc selaku Dekan Fakultas Ilmu Komputer.
2. Yth. Ibu Yuni Widiastiwi, S.Kom, M.Si selaku Kaprodi Teknik Informatika.
3. Yth. Bapak Yudhi Biantoro, S.Kom, MTI selaku Dosen Pembimbing kami yang telah memberi petunjuk dan arahan selama penulisan Skripsi ini.
4. Kedua orang tua dan keluarga yang telah memberikan semangat, dorongan dan doa kepada saya sampai Skripsi ini dapat terselesaikan dengan baik.
5. Kepada Riri Elriana yang selalu menemani dan memberikan semangat serta doa kepada saya sebagai dorongan untuk menyelesaikan Skripsi ini dengan baik.
6. Teman-teman di Fakultas Ilmu Komputer S1 Teknik Informatika angkatan 2011 yang sudah memberikan bantuan dan semangat yang luar biasa.
Penulis berharap semoga Skripsi ini dapat berguna dan bermanfaat bagi semua pihak.
Jakarta, 9 Agustus 2015
( Penulis )
viii
DAFTAR ISI
HALAMAN JUDUL ………... i
PERNYATAAN ORISINALITAS ………...… ii
PERNYATAAN PERSETUJUAN PUBLIKASI ………. iii
PENGESAHAN ……… iv
ABSTRAK ... v
ABSTRACT ……….. vi
KATA PENGANTAR ……….. vii
DAFTAR ISI ... viii
DAFTAR TABEL ……….… x
DAFTAR GAMBAR ... xi
DAFTAR LAMPIRAN ……….… xii
BAB I PENDAHULUAN ... 1
I.1 Latar Belakang ... 1
I.2 Rumusan Masalah ... 2
I.3 Batasan Penelitian ... 2
I.4 Manfaat Penelitian ... 3
I.5 Tujuan Penelitian ... 3
I.6 Sistematika Penulisan... 3
BAB II TINJAUAN PUSTAKA ... 5
II.1 Kamus Elektronik ... 5
II.2 Bahasa Indonesia ... 5
II.3 Afiksasi ... 6
II.4 Text Mining ... 6
II.5 Stemming ... 7
II.6 Algoritma Porter Stemmer ... 9
II.7 Algoritma ECS (Enhanced Confix Stripping) Stemmer ... 12
II.8 UML ……….………..………… 16
II.9 Konsep Dasar Sistem ... 21
II.10 Pengertian Perancangan ... 23
II.11 Android ... 23
II.12 Perangkat Lunak Pendukung ... 24
II.13 Konsep Database ... 26
II.14 Database MySQL ... 27
II.15 PHP ………...……... 27
II.16 JSON ………...……. 28
II.17 Web Service ... 28
II.18 Penelitian Terkait ... 29
BAB III METODE PENELITIAN... 31
III.1 Kerangka Berpikir ... 31
III.2 Tahap Penelitian ... 32
III.3 Alat Dan Bahan Penelitian ... 33
ix
III.4 Teknik Analisa Data ... 34
BAB IV ANALISA DAN PERANCANGAN ... 35
IV.1 Analisa Permasalahan ... 35
IV.2 Analisa Kebutuhan ... 35
IV.3 Gambaran Umum Aplikasi ... 36
IV.4 Objek Pengguna Aplikasi ... 37
IV.5 Prosedur Kerja ……….. 37
IV.6 Analisa Algoritma ECSP ... 39
IV.7 UML ... 42
IV.8 Rancang Bangun Aplikasi ... 47
IV.9 Pembuatan Aplikasi ... 50
IV.10 Tampilan Hasil Aplikasi ………..………... 50
IV.11 Pengujian Sistem ……...……….………... 55
IV.12 Implementasi ………..………….……….….. 55
BAB V PENUTUP ... 56
V.1 Kesimpulan ... 56
V.2 Saran ... 56
DAFTAR PUSTAKA ... 57 RIWAYAT HIDUP
LAMPIRAN
x
DAFTAR TABEL
Tabel 1 Rule Pertama : Inflectional Particles ………...… 11
Tabel 2 Rule Kedua : Inflectional Possesive Pronouns ……….... 11
Tabel 3 Rule Ketiga : First Order Of Derivational Prefixes ... 11
Tabel 4 Rule Keempat : Second Order Of Derivational Prefixes …………. 12
Tabel 5 Kelompok Rule Kelima : Derivational Suffixes ……….……...…. 12
Tabel 6 Aturan Dasar Awalan Akhiran Yang Berlaku ... 12
Tabel 7 Urutan Pengembalian Akhiran ...13
Tabel 8 Aturan Pemenggalan Awalan Algoritma Nazief dan Adriani ……. 13
Tabel 9 Aturan Pemenggalan Awalan Algoritma ECS Stemmer ... 15
Tabel 10 Penelitian Terkait ... 29
Tabel 11 Teknik Analisa Data ... 34
Tabel 12 Pemenggalan Awalan ... 41
Tabel 13 Deskripsi Use Case Diagram User ………..…..… 43
xi
DAFTAR GAMBAR
Gambar 1 Porter Stemmer Bahasa Indonesia ... 10
Gambar 2 Flowchart Kerangka Berpikir ... 31
Gambar 3 Android Web Service ... 36
Gambar 4 Prosedur Kerja ... 37
Gambar 5 Algoritma ECSP ... 39
Gambar 6 Use Case Diagram ... 42
Gambar 7 Sequence Diagram Stemming ... 44
Gambar 8 Sequence Diagram Menu Informasi ... 44
Gambar 9 Activity Diagram Stemming ... 45
Gambar 10 Activity Diagram Menu Informasi ... 46
Gambar 11 Rancang Halaman Awal ... 47
Gambar 12 Rancang Halaman Utama ... 48
Gambar 13 Rancang Halaman Hasil Stemming ... 48
Gambar 14 Rancang Halaman ECSP ... 49
Gambar 15 Rancang Halaman Profil ……... 50
Gambar 16 Aplikasi APK ... 51
Gambar 17 Halaman Awal ...52
Gambar 18 Halaman Utama ... 52
Gambar 19 Halaman Input ... 53
Gambar 20 Halaman Hasil Stemming …... 54
Gambar 21 Halaman ECSP ... 54
Gambar 22 Halaman Profil ... 55
xii
DAFTAR LAMPIRAN
Lampiran 1 Format Penelitian Angket (Questionaire) Lampiran 2 Jawaban Responden 1
Lampiran 3 Jawaban Responden 2 Lampiran 4 Hasil Analisa Skala Guttman Lampiran 5 Source Code Algoritma ECSP