IMPLEMENTASI ALGORITMA
ENHANCED CONFIX STRIPPING
STEMMER
PADA KAMUS SISTEM BAHASA ISYARAT
INDONESIA
SKRIPSI
ANNIFA IQRAMITHA
091402028
PROGRAM STUDI S1 TEKNOLOGI INFORMASI
FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI
UNIVERSITAS SUMATERA UTARA
IMPLEMENTASI ALGORITMA
ENHANCED CONFIX STRIPPING
STEMMER
PADA KAMUS SISTEM BAHASA ISYARAT INDONESIA
SKRIPSI
Diajukan untuk melengkapi tugas dan memenuhi syarat memperoleh ijazah Sarjana Teknologi Informasi
ANNIFA IQRAMITHA
091402028
PROGRAM STUDI S1 TEKNOLOGI INFORMASI
FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA
ii
PERSETUJUAN
Judul : IMPLEMENTASI ALGORITMA ENHANCED
CONFIX STRIPPING STEMMER PADA KAMUS SISTEM BAHASA ISYARAT INDONESIA
Kategori : SKRIPSI
Nama : ANNIFA IQRAMITHA
Nomor Induk Mahasiswa : 091402028
Program Studi : SARJANA (S1) TEKNOLOGI INFORMASI
Departemen : TEKNOLOGI INFORMASI
Fakultas : ILMU KOMPUTER DAN TEKNOLOGI
INFORMASI
Diluluskan di
Medan, 22 Juli 2013
Komisi Pembimbing :
Pembimbing 2 Pembimbing 1
M. Anggia Muchtar, ST., MM.IT Dr. Erna Budhiarti Nababan, M.IT NIP 198001102008011010 NIP -
Diketahui/Disetujui oleh
Program Studi S1 Teknologi Informasi Ketua,
PERNYATAAN
IMPLEMENTASI ALGORITMA ENHANCED CONFIX STRIPPING STEMMER PADA KAMUS SISTEM BAHASA ISYARAT INDONESIA
SKRIPSI
Saya mengakui bahwa skripsi ini adalah hasil karya sendiri, kecuali beberapa kutipan dan ringkasan yang masing-masing disebutkan sumbernya.
Medan, 22 Juli 2013
iv
PENGHARGAAN
Alhamdulillah, puji dan syukur penulis ucapkan kehadirat Allah SWT, serta shalawat dan salam kepada junjungan kita nabi Muhammad SAW, karena atas berkah, rahmat dan hidayahnya penulis dapat menyelesaikan penyusunan skripsi ini.
Dalam penulisan skripsi ini penulis banyak mendapatkan bantuan serta dorongan dari pihak lain. Dalam kesempatan ini dengan segala kerendahan hati,penulis mengucapka terima kasih kepada:
1. Ketua dan Sekretaris Jurusan Prof. Dr. Opim Salim, M.Sc dan Drs.Sawaluddin, M.IT.
2. Kepada Bapak M. Anggia Muchtar, ST, M.MIT dan Ibu Dr. Erna Budhiarti Nababan, MIT selaku dosen pembimbing penulis yang telah memberikan saran dan masukan serta bersedia meluangkan waktu, tenaga dan pikiran dalam membantu menyelesaikan skripsi ini.
3. Bapak Muhammad Andri Budiman, S.T., M.Comp.Sc. dan Bapak M. Fadly Syahputra, ST., M.MIT selaku dosen pembanding dan penguji yang telah banyak memberikan petunjuk, saran dan kritik dalam menyelesaikan skripsi ini.
4. Kedua orang tua penulis, yaitu Mama, Analisa beserta Ayah, Muhammad Amin, karena berkat dukungan mereka baik secara moril maupun materil secara terus-menerus sehingga penulis dapat menyelesaikan skripsi ini. Kepada adik-adik penulis, Annisa Iqramina dan Muhammad Alhamidi serta kepada Donny Fadli, Amd. yang telah banyak memberikan dukungan moril maupun materil kepada penulis selama ini, dan seluruh keluarga besar atas perhatiannya dan dukungannya kepada penulis.
5. Bapak M. Safri Lubis, ST, M.Com selaku dosen penasihat akademik saya. 6. Seluruh Dosen yang mengajar dan staff tata usaha pada program studi
Teknologi Informasi Universitas Sumatera Utara.
ABSTRAK
Bahasa isyarat merupakan bahasa alami yang memiliki proses penentuan struktur kalimat berdasarkan aturan tata bahasa dan kamus kata sesuai dengan bahasa isyarat. Aturan tata bahasa dalam bahasa isyarat memiliki sedikit perbedaan dengan tata aturan dalam bahasa Indonesia. Untuk penguraian kata berimbuhan, bahasa isyarat hanya mengenal awalan me-, berbeda dengan bahasa Indonesia yang terdapat awalan me-, men-, meng-, menge-. Begitu juga dengan awalan pe- pada bahasa isyarat, yang di dalam bahasa Indonesia terdapat awalan pe-, pen-, peng-, penge-. Melihat aturan tata bahasa dalam bahasa isyarat yang memerlukan penguraian imbuhan, maka diperlukan proses stemming untuk mendapatkan kata imbuhan dan kata dasar yang di-input-kan. Proses stemming yang dilakukan menggunakan algoritma Enhanced Confix Stripping Stemmer. Algoritma ini dapat menghasilkan kata dasar yang lebih akurat, sehingga penerjemahan sesuai dengan kaedah yang berlaku pada system bahasa isyarat Indonesia. Algoritma Enhanced Confix Stripping Stemmer dapat diterapkan dalam sistem pembelajaran bahasa isyarat. Algoritma ini mampu memenggal kata dengan kombinasi Prefiks 1 ditambah Prefiks 2 ditambah Kata dasar ditambah Sufiks 3 ditambah Sufiks 2 ditambah Sufiks 1 dimana Sufiks 3 adalah akhiran, Sufiks 2 adalah kata ganti kepunyaan, dan Sufiks 1 adalah partikel. Output yang dihasilkan berupa gambar dari database yang sesuai dengan kata yang di- input-kan user.
vi
ABSTRACT
Sign languageis a natural language that has the process of determining the structure of sentences based on rules of grammar and dictionary of words according to the sign language. Grammar rulesin sign languagehas littledifferencewith thegrammarrules inIndonesian language. For the decomposition of confixes, sign language only has the prefix me-, which in Indonesian language has prefix me-, men-, meng-, menge-. It is same to the prefix pe- in sign language, which in Indonesian language has prefix pe-, pen-, peng-, penge-. The rules of grammar in sign language which require to parse the word has confixes, accordingly require stemming process to get the confixes and the root word that user has input. Algorithm of stemming process are performed using enhanced confix stripping stemmer. This algorithm can produce more accurate root word in previous research, so the translation can be match with the grammar of Indonesian sign language. Enhanced Confix Stripping Stemmer algorithm is applied to a sign language learning system. This algorithm is able to cut off the word with a combination of prefixes 1 plus prefixes 2 plus root word plus suffix 3 plus suffixes 2 plus suffixes 1 where the suffix 3 is a suffix, suffix 2 is a possessive pronoun, and the suffix 1 is a particle. The output is an image from the database according to the words that the user has input.
DAFTAR ISI
1.6Metodologi Penelitian 3
1.7Sistematika Penulisan 3
BAB 2 TINJAUAN PUSTAKA 6
2.1Kamus Sistem Bahasa Isyarat Indonesia 6
2.2Proses Stemming 7
2.3Algoritma Enhanced Confix Stripping Stemmer 9
2.4Bahasa Pemrograman PHP 14
BAB 3 ANALISIS DAN PERANCANGAN SISTEM 18
3.1Data Yang Digunakan 18
3.2Agoritma Enhanced Confix Stripping Stemmer (ECS) 18
3.3Analisis Sistem 23
3.3.1 System Requirement 23
3.3.2 Process Modeling 23
3.3.3 Kebutuhan Hardware 26
3.3.4 Kebutuhan Software 26
3.3.5 Antarmuka Sistem 26
BAB 4IMPLEMENTASI DAN PENGUJIAN 29
4.1Implementasi 29
4.1.1 Tampilan Halaman Utama 29
4.1.2 Tampilan Halaman Input 29
4.1.3 Tampilan Halaman Output 29
4.1.4 Tabel Kata Pada Database Kata 29
4.2Pengujian 30
BAB 5 KESIMPULAN DAN SARAN 33
5.1Kesimpulan 33
5.2Saran 33
DAFTAR PUSTAKA 34
viii
DAFTAR TABEL
Halaman Tabel 2.1 Kombinasi Awalan-Akhiran yang dilarang 10 Tabel 2.2 Aturan Pemenggalan Awalan Stemmer Nazief dan Adriani
yang sudah dimodifikasi 12
Tabel 4.1 Output Sistem dari input-an kalimat “Ayah membaca koran Tribun
DAFTAR GAMBAR
Halaman
Gambar 2.1 Contoh kata melempar 6
Gambar 2.2 Contoh kata alirkan 6
Gambar 2.3 Contoh kata berlompatan 7
Gambar 2.4 Flowchart Proses Stemming 13
Gambar 3.1 Diagram Sistem 18
Gambar 3.2 Flow Chart Sistem 20
Gambar 3.3 Flow Chart Proses Stemming 22
Gambar 3.4 Context Diagram 24
Gambar 3.5 DFD Level 1 25
Gambar 3.6 Rancangan halaman utama 27
Gambar 3.7 Rancangan halaman output 27
Gambar 4.1 Halaman Utama 31
Gambar 4.2 Halaman Input 31
Gambar 4.3 Halaman Output 32