• Tidak ada hasil yang ditemukan

Oky Purwantiningsih¹, -². ¹Teknik Informatika, Fakultas Teknik Informatika, Universitas Telkom

N/A
N/A
Protected

Academic year: 2021

Membagikan "Oky Purwantiningsih¹, -². ¹Teknik Informatika, Fakultas Teknik Informatika, Universitas Telkom"

Copied!
9
0
0

Teks penuh

(1)

PERANGKAT LUNAK KAMUS BERINTELEGENSIA UNTUK BAHASA INDONESIA UNTUK MENENTUKAN KELAS KATA BERDASARKAN KELAS AKAR KATA DAN IMBUHAN INTELLIGENCE DICTIONARY SOFTWARE FOR BAHASA INDONESIA

TO DETERMINE CLASS OF WORD BASED ON CLASS OF STEM AND AFFIXES

Oky Purwantiningsih¹, -²

¹Teknik Informatika, Fakultas Teknik Informatika, Universitas Telkom Abstrak

Pekerjaan mengedit suatu naskah buku atau berita membutuhkan tingkat ketelitian dan kejelian yang tinggi, sehingga terkadang pekerjaan ini menjadi sangat melelahkan. Atas dasar itulah maka muncul ide untuk membuat Software Editor Naskah Bahasa Indonesia yang dapat membantu tugas seorang Editor.

Software Editor Naskah Bahasa Indonesia memerlukan Kamus Berintelegensia yang dapat menentukan kelas kata (kata benda, kata sifat, kata kerja, kata keterangan, dll) dari suatu kata untuk mendukung fungsinya. Inputan dari Kamus Berintelegensia berupa sebuah kata dan outputannya berupa kelas kata dari kata tersebut. Kamus Berintelegensia ini terdiri atas tiga bagian yaitu bagian penentuan komponen kata (imbuhan, akar kata, kelas akar kata, dan kelas kata), bagian untuk mengelola Kamus Akar Kata dan bagian untuk mengelola Knowledge Base. Untuk mempercepat akses terhadap data-data yang disimpan dalam Kamus Akar Kata dan Knowledge Base, semua data disimpan dalam file B+tree. Dengan mesin inferensi yang dimiliki, Kamus Berintelegensia bisa menentukan kelas kata dari kata-kata lain yang merupakan kata bentukan dari akar kata seperti kata berimbuhan dan kata ulang.

Dalam Natural Language Processing, morfologi merupakan tahapan analisa yang membahas mengenai komponen (morfem) yang membentuk suatu kata. Sesuai dengan fungsinya untuk menentukan kelas kata, dalam Kamus Berintelegensia dilakukan analisa morfologi terhadap kata-kata dalam Bahasa Indonesia dengan menentukan imbuhan dan akar kata-kata dari suatu kata-kata. Untuk kemudian akan ditentukan kelas katanya sesuai dengan Aturan Imbuhan yang ada.

Pada TA ini penulis mengimplementasikan Kamus Berintelegensia tersebut dan melakukan pengujian apakah kelas kata yang dioutputkan sudah benar sesuai dengan aturan dalam Kamus Besar Bahasa Indonesia. Kamus Berintelegensia ini nantinya diharapkan dapat dimanfaatkan untuk pengembangan Software Editor.

Kata Kunci : Natural Language Processing, Morfologi, Software Editor.

(2)

Abstract

Document Editing is an exhausting job because it demands high rates observation and thoroughly examination. This leads to an idea of creating an Indonesian Document Software Editor which can help an editor’s work.

Indonesian document Software Editor needs an intelligence dictionary that can determine class of word like adverb, adjective, noun, etc from a word both the stem and the derivative words. The input for this intelligence dictionary is a word and it gives class of the word as a result.

Intelligence Dictionary consist of three parts : words component (affixes and suffixes, stem word, class of stem word and class of word) determination, stem word dictionary management, and knowledge base management. B+tree file is used for maintaining the knowledge base data and stem word dictionary data to gain fastest access. By inference machine within it, the intelligence dictionary can determine class of word from derived words.

Morphological Analysis is one of Natural Language Processing process. The Intelligence

Dictionary do the Morphological Analysis to determine affixes and stem word of a word. And then it will determine class of word based on the affixation rule in the Knowlege Base.

In this final project the writer implement the Intelligence Dictionary, do a test and analyze the result wether it gives the correct output based on Kamus Besar Bahasa Indonesia. The

Intelligence Dictionary is hopefully can support the development of Indonesia Document Software Editor.

(3)

BAB I

PENDAHULUAN

1.1. Latar Belakang

Kegiatan mengedit naskah berita atau naskah buku memerlukan tingkat ketelitian dan kejelian yang tinggi. Karena selain membenarkan kesalahan penulisan kata, editor juga harus dapat menentukan apakah suatu kalimat sudah sesuai dengan grammar atau belum dan apakah kata-kata yang ditulis sesuai dengan konteks bacaan atau tidak.

Karena tingkat ketelitian yang dibutuhkan sangat tinggi, pekerjaan ini terkadang menjadi menjemukan dan sangat melelahkan. Maka muncul ide untuk membuat sebuah software yang dapat menggantikan tugas seorang editor. Seterusnya, software ini akan disebut dengan Software Editor (harap dibedakan dengan software pengolah kata seperti microsoft word). Secara garis besar, Software Editor ini harus mampu mendeteksi kesalahan penulisan kata sesuai dengan konteks bacaan , membetulkan kesalahan penulisan kata dan mengecek kesesuaian kalimat dengan grammar.

Dengan fungsi terakhir di atas, maka software editor memerlukan kamus berintelegensia yang dapat menentukan kelas kata (misal : kata benda, kata sifat, kata kerja, kata keterangan, dll) dari suatu kata. Baik, kata dasar (akar kata) maupun kata berimbuhannya. Kamus Berintelegensia ini digunakan untuk mendukung proses pengecekan apakah suatu kalimat sudah sesuai dengan grammar dalam bahasa Indonesia. Inputan dari kamus berintelegensia berupa sebuah kata yang sedang dan outputannya berupa kelas kata dari kata tersebut. Output dari kamus bisa lebih dari satu kelas kata.

Ada beberapa metode untuk mengorganisasikan file kamus, misalnya : Hash Table, Unsorted Array (Sequential Search), Sorted Array (Binary Search), Binary-Search Tree,B-tree, B+-tree, dll. Untuk kamus

1

(4)

Bab I – Pendahuluan 2

berintelegensia ini, penulis akan menerapkan salah satu metode di atas. Kamus ini hanya berisi kata-kata dasar (akar kata) dalam bahasa indonesia. Sedangkan untuk menentukan kelas kata dari kata-kata lainnya seperti kata berimbuhan dan kata ulang akan dilakukan melalui proses penentuan kelas kata berdasarkan kata dasar dan imbuhannya.

Berdasarkan paper Jelita Asian dari universitas RMIT Melbourne Australia, Algoritma Nazief dan Andriani merupakan algoritma stemming bahasa indonesia yang memiliki tingkat kebenaran paling tinggi diantara algoritma stemming bahasa Indonesia lainnya. Oleh karena itu, untuk menentukan akar kata dari suatu kata pada kamus berintelegensia ini akan digunakan algoritma Stemming Nazief dan Andriani.

1.2. Perumusan Masalah

Dalam tugas akhir ini penulis akan menitikberatkan pembahasan tentang bagaimana menentukan kelas kata dari suatu kata yang diinputkan ke dalam kamus berintelegensia berdasarkan kelas kata dari kata dasar(akar kata) dan imbuhannya.

1.3. Maksud dan Tujuan Pembahasan

Keluaran dari tugas akhir ini berupa software yang akan digunakan untuk menentukan kelas kata suatu kata sesuai dengan kata dasar dan imbuhannya. Dengan tugas akhir ini, diharapkan hal-hal sebagai berikut :

• Kamus dapat dimanfaatkan untuk pengembangan Software Editor. • Melakukan pengujian apakah kelas kata yang dioutputkan sudah

(5)

Bab I – Pendahuluan 3

1.4. Pembatasan Masalah

Batasan masalah untuk tugas akhir ini adalah sebagai berikut : • Tidak menangani istilah asing dan bahsa daerah yang belum

menjadi kata serapan.

• Tidak menangani kesalahan penulisan kata.

• Hanya dapat digunakan untuk dokumen bahasa Indonesia. • Ejaan yang digunakan adalah Ejaan Yang Disempurnakan. • Tidak menangani kata majemuk dan kata ulang semu.

1.5. Metode Penyelesaian Masalah

Metode yang digunakan dalam penyelesaian tugas akhir ini adalah :

• Mencari informasi dengan studi pustaka dan referensi dari berbagai sumber seperti artikel, informasi dari buku maupun internet mengenai aturan pembentukan kata dalam Bahasa Indonesia.

• Mempelajari konsep dan implementasi Natural Language dan

algoritma Stemming yang akan digunakan dalam implementasi

perangkat lunak

• Melakukan analisis penerapan aturan pembentukan kata (Basis Pengetahuan) dalam perancangan perangkat lunak dan merepresentasikan aturan tersebut ke dalam Basis Pengetahuan. • Melakukan Software Requirement Analysis, Desain, dan Coding

perangkat lunak

• Melakukan pengujian perangkat lunak dengan memasukkan inputan kata yang akan dievaluasi serta mencatat hasil keluaran program.

• Pengambilan kesimpulan dan penyusunan makalah.

(6)

Bab I – Pendahuluan 4

1.6. Sistematika Penulisan

Tugas Akhir ini disusun dengan sistematika pembahasan sebagai berikut : BAB I PENDAHULUAN

Bab ini memaparkan latar belakang dilakukannya penelitian, perumusan masalah yang akan dibahas, pembatasan masalah, tujuan yang ingin dicapai melalui penelitian ini, metode penyelesaian masalah dan sistematika pembahasan.

BAB II DASAR TEORI

Bab ini membahas teori yang mendukung penyusunan tugas akhir ini yaitu mengenai Aturan pembentukan kata dalam bahasa Indonesia , Natural Language Processing, Algoritma Stemming dan Metode pengorganisasian data B+tree.

BAB III ANALISA DAN PERANCANGAN SISTEM

Menguraikan mengenai analisis terhadap penerapan aturan pembentukan kata dalam bahasa Indonesia ke dalam kamus berintelegensia , proses perancangan sistem, spesifikasi kebutuhan sistem dan perancangan subsistem.

BAB IV IMPLEMENTASI DAN PENGUJIAN

Bab ini menyajikan analisa hasil pengujian terhadap perangkat lunak.

BAB V KESIMPULAN DAN SARAN

Berisi kesimpulan dari hasil penelitian tugas akhir ini serta saran-saran untuk pengembangan lebih lanjut.

(7)

BAB V

PENUTUP

5.1 Kesimpulan

1. Perangkat Lunak Kamus Berintelegensia telah berhasil dibuat sesuai dengan spesifikasi yang ditetapkan.

2. Dengan file library IntelligenceDictionaryLib.dll maka pengembangan Software Editor dapat dilakukan dengan menggunakan method-method yang terdapat pada class IntDictLib.

3. Dengan menggunakan algoritma Stemming Nazief dan Andriani, tingkat kebenaran output dari Perangkat Lunak Kamus Berintelegensia dapat mencapai 89,7 %.

5.2 Saran

1. Perangkat Lunak tidak dapat mendeteksi ketidaksesuaian penulisan kata, seperti melari, menduduk, dan berambil. Diharapkan untuk pengembangan lebih lanjut, ketidaksesuaian kata ini dapat diatasi. 2. Masih terdapat kasus-kasus khusus untuk kata ulang seperti

memukul-mukul, mengedip-ngedipkan, menambah-nambahi yang belum tertangani oleh algoritma stemming Nazief dan Andriani. Untuk pengembangan lebih lanjut, disarankan untuk memperbaiki algoritma stemming Nazief dan Andriani sehingga kata-kata tersebut dapat tertangani.

3. Kamus Berintelegensia ini belum dilengkapi dengan makna kata. Untuk pengembangan lebih lanjut, dapat ditambahkan fungsi untuk menentukan makna kata berdasarkan imbuhan dan akar kata.

43

Powered by TCPDF (www.tcpdf.org)

(8)

DAFTAR PUSTAKA

[1] Luger, George F. dan William A. Stubblefield.1993. Artificial Intelligence : Structures and Strategies for Complex Problem Solving. 2nd ed .

California : The Benjamin/Cummings Publishing Company, Inc. [2] Coxhead, Peter.2001.An Introduction to Natural Language

Processing.Tersedia : http://www.cs.bhm.ac.uk/~pxc/nlpa/2002/AI-HO-IntroNLP.html

[3] Russel, Stuart dan Peter Norvig.1995. Artificial Intellingence : A Modern Approach. New Jersey : Prentice Hall Inc.

[4] Asian, Jelita.2001.Stemming Indonesian.Tersedia : http:// crpit.com/confpapers/CRPITV38Asian.pdf

[5] Folk, Michael J. dan Bill Zoelick. 1992. File Structures.2nd Ed .United States of America : Addison-Wesley Publishing Company, Inc.

[6] Tharp, Alan L. 1988. File Organization and Processing.United States of America : John Wiley & Sons, Inc.

[7] Pusat Pembinaan dan Pengembangan Bahasa Departemen Pendidikan Nasional Republik Indonesia. 2001 . Pedoman Umum Ejaan Bahasa Indonesia yang Disempurnakan dan Pedoman Umum Pembentukan Istilah.Bandung : CV. Yrama Widya.

[8] Departemen Pendidikan dan Kebudayaan. 2002.Kamus Besar Bahasa Indonesia. Edisi Ketiga. Jakarta : Balai Pustaka.

[9] __________. 2000.Pelajaran Bahasa Indonesia Online. Tersedia :

http://free.ulsm.org/v12/sponsor/Sponsor_Pendamping/Praweda/Indonesia /Indonesia.htm

[10] Tim Penyusunan Buku Ajar Bahasa Indonesia Fakultas Sastra Universitas Diponegoro Semarang. 1995 .Bahasa Indonesia Untuk Mahasiswa. Semarang : Badan Penerbit Universitas Diponegoro Semarang. [11] _________.Stemming Algorithm. Tersedia :

http://www.Answer.com/Stemming algorithm Information From Answer_com.htm

[12] Watters, Aaron. 2004.Bplustreedotnet -- A B+tree implementation for C#, java, and Python with related modules. Tersedia :

(9)

[13] Rickyanto, Isak. 2003. Membuat Aplikasi Windows dengan Visual Basic .NET. Jakarta : PT Elex Media Komputindo

[14] Tarigan, Henry Guntur. 1985. Pengajaran Morfologi. Bandung : Penerbit Angkasa

[15] Kentjono, Djoko, dkk. 2004. Tata Bahasa Acuan Bahasa Indonesia untuk Penutur Asing. Jakarta : Wedatama Widya Sastra.

[16] Mahdi, Sutiono. 2004. Afiks Inflektif pada Verba Bahasa Indonesia dan Bahasa Inggris. Bandung : Uvula Press.

xv

Powered by TCPDF (www.tcpdf.org)

Referensi

Dokumen terkait

Berdasarkan hasil evaluasi yang telah dilaksanakan, maka bersama ini Panitia Pengadaan Barang dan Jasa Satuan Kerja Dinas Kelautan dan Perikanan Provinsi Jawa Timur

Berdasarkan Surat Penetapan Pemenang Pemilihan Langsung Nomor : 027/ 14 / PP.Gdg.Sukorejo/ 405.21/ 2012, tanggal 11 Juli 2012, maka diumumkan kepada para Peserta

Peraturan Pemerintah Nomor 10 Tahun 1961 tentang Pendaftaran Tanah yang?. menjadi dasar untuk mengatur lebih lanjut kegiatan

Dengan kata lain, pemilik sertifikat Berkaitan dengan sertifikat sebagai tanda bukti hak yang bersifat kuat,. sertifikat yang diterbitkan oleh Kantor Pertanahan

Tradisi yang dilakukan oleh masyarakat di desa penulis (desa Bakalan Kalinyamatan Jepara) dan juga di masyarakat Jawa pada umumnya dalam menghadapi peristiwa kematian, hampir

[r]

[r]

- Republik Indonesia, Undang-Undang Nomor 5 Tahun 1960 tentang.. Undang-Undang