• Tidak ada hasil yang ditemukan

Penambahan modul pembentukan Word Graph kata kerja pada aplikasi BogorDelftConstruct

N/A
N/A
Protected

Academic year: 2017

Membagikan "Penambahan modul pembentukan Word Graph kata kerja pada aplikasi BogorDelftConstruct"

Copied!
73
0
0

Teks penuh

(1)

ii

ABSTRACT

CHRISTIAN HENRY. The development of verb word graph module in BogorDelftConstruct appplication. Directed by SRI NURDIATI.

Knowledge Graph (KG) is one of natural language processing methods that is able to represent the result of semantic analysis of a text in a graph form. Until now, there are only a few researches using KG to do semantic analysis for texts in Indonesian language. They were mainly focus on analyzing text, constructing rules to analyze text and engineering to understand the text. Some other researches have done semantic analysis from various part-of-speech. Nevertheless, the results of the research have not been implemented yet. To realize a long term goal of doing text abstraction automatically, BogorDelftConstruct has been developed as an early stage prototype. In line with that, this research implemented semantic analysis for one part-of-speech in BogorDelftConstruct.

The objective of the research is to develop a module dictionary of verb word graph taken from the result of previous research in BogorDelftConstruct system. The verb to be analyzed has 10 patterns of word graph which formed by affixation. Word graph pattern formation process begins by knowing the basic word and affix using stemming. This stemming process refers to the adjusted Kamus Besar Bahasa Indonesia (KBBI). Basic word and affixe from the result of stemming will be used to determine appropriate pattern of the verb word graph. Appropriate pattern of the verb word graph will be generated and displayed on the system.

Development of a verb word graph module has been able to identify 10 patterns of the verb word graph. The system however can only recognize one-word-verb so each entry is assumed to be intransitive verb that does not need to be followed by an object. The results of testing with 171 entries from overall yield was 98.83% accuracy. Despite of having a good accuracy, this system still has some short comings, such as could not process input with more than one words. This problem is expected to be the focus of the following research.

(2)

1

PENDAHULUAN

Latar Belakang

Bahasa alami yang digunakan manusia untuk berkomunikasi satu sama lain sangat bermanfaat dan penting dalam penyampaian informasi secara langsung. Di lain pihak, komputer masih sulit untuk memahami bahasa alami manusia. Dalam ilmu komputer bidang yang secara spesifik mempelajari cara komunikasi antara manusia dan komputer adalah Natural Language Processing (NLP). Sebuah kalimat dalam bahasa alami dapat dianalisis dari sudut pandang semantik atau sintaksis. Knowledge Graph merupakan salah satu metode dalam NLP yang menganalisis bahasa alami dengan lebih berfokus pada semantik daripada sintaksis.

Pengimplementasian metode Knowledge Graph pada bahasa alami diharapkan mampu memberikan abstraksi dari informasi atau pengetahuan yang terkandung di dalamnya ke dalam bentuk graf. Salah satu penelitian yang telah berhasil mengimplementasikan metode

Knowladge Graph pada suatu bahasa alami adalah DelftConstruct yang dikembangkan oleh Mark Van Koningsveld pada tahun 2003-2008.

DelfConStruct merupakan sebuah prototype

aplikasi untuk menganalisis Bahasa Inggris dan disajikan ke dalam bentuk graf dengan menggunakan metode Knowladge Graph. DelftConstruct dibangun menggunakan bahasa pemrograman MATLAB yang dapat membentuk suatu graf antara suatu kata dengan kata lainnya (word graph), namun belum sesuai dengan konsep Knowladge Graph (Romadoni 2009). Selain itu, DelftConstruct memiliki beberapa kekurangan antara lain:

• Belum memiliki fitur Dictionary untuk menyimpan, menampilkan dan mengubah graf.

• Ketidakjelasan arah relasi antar token, karena tidak adanya tanda panah yang menunjuk dari dan/atau ke suatu token.

• Belum memiliki kemampuan untuk membuat graf baru. Hanya mampu mengubah graf yang sedang ditampilkan.

• Belum mampu untuk menghapus token dan/atau teks.

• Tidak memiliki mekanisme untuk menampilkan graf lain yang sudah dibuat.

Dengan keterbatasan DelfConStruct yang hanya mampu menganalisis teks berbahasa Inggris maka dikembangkan BogorDelftConstruct yang nantinya mampu

menganalisis teks bahasa Indonesia dengan visualisasi graf sesuai yang dengan konsep

Knowledge Graph. Dengan pembentukan modul

word graph yang ada pada Bogor

DelfConStruct maka akan dikembangkan modul

word graph untuk kata kerja. Analisis bentuk dan makna dari kata kerja telah dilakukan pada penelitian sebelumnya oleh Ahmad Muslik (2009) yang menghasilkan pola aturan dari kata kerja. Penelitian ini mengembangkan modul pembentukan word graph kata kerja pada aplikasi BogorDelftConstruct berdasarkan aturan tersebut.

Tujuan

Penelitian ini bertujuan untuk menambahkan modul pembentukan word graph pada sistem aplikasi Bogor DelfConStruct. Hasil dari penelitian ini berupa word graph yang merepresentasikan kata kerja berdasarkan hasil analisis aturan dari penelitian sebelumnya. Ruang Lingkup

Penelitian ini dibatasi pada pengembangan modul pembentukan word graph untuk kata kerja pada sistem BogorDelftConstruct dengan menggunakan pola aturan dari hasil penelitian sebelumnya oleh Ahmad Muslik (2009). Berikut ini merupakan batasan-batasan sistem, pada pengembangan yang dilakukan:

a. Pada sistem ini yang menjadi masukan hanyalah kata dan posisi kata dalam kalimat tidak diperhatikan.

b. Makna semantik dari kata kerja tidak diperhatikan.

c. Pada saat proses pengecekan kata, sifat atau label dari kata dasar berdasarkan kamus. Manfaat

Manfaat jangka panjang penelitian ini adalah dibentuknya suatu sistem yang mampu membaca input berupa teks Bahasa Indonesia dan menghasilkan output berupa ringkasan atau informasi tentang teks tersebut secara otomatis. Selain itu dalam jangka pendek, sistem ini diharapkan mampu memberikan pengetahuan atau mengekspresikan makna kata kerja dalam bentuk word graph.

TINJAUAN PUSTAKA

Knowledge Graph (KG)

(3)

1

PENDAHULUAN

Latar Belakang

Bahasa alami yang digunakan manusia untuk berkomunikasi satu sama lain sangat bermanfaat dan penting dalam penyampaian informasi secara langsung. Di lain pihak, komputer masih sulit untuk memahami bahasa alami manusia. Dalam ilmu komputer bidang yang secara spesifik mempelajari cara komunikasi antara manusia dan komputer adalah Natural Language Processing (NLP). Sebuah kalimat dalam bahasa alami dapat dianalisis dari sudut pandang semantik atau sintaksis. Knowledge Graph merupakan salah satu metode dalam NLP yang menganalisis bahasa alami dengan lebih berfokus pada semantik daripada sintaksis.

Pengimplementasian metode Knowledge Graph pada bahasa alami diharapkan mampu memberikan abstraksi dari informasi atau pengetahuan yang terkandung di dalamnya ke dalam bentuk graf. Salah satu penelitian yang telah berhasil mengimplementasikan metode

Knowladge Graph pada suatu bahasa alami adalah DelftConstruct yang dikembangkan oleh Mark Van Koningsveld pada tahun 2003-2008.

DelfConStruct merupakan sebuah prototype

aplikasi untuk menganalisis Bahasa Inggris dan disajikan ke dalam bentuk graf dengan menggunakan metode Knowladge Graph. DelftConstruct dibangun menggunakan bahasa pemrograman MATLAB yang dapat membentuk suatu graf antara suatu kata dengan kata lainnya (word graph), namun belum sesuai dengan konsep Knowladge Graph (Romadoni 2009). Selain itu, DelftConstruct memiliki beberapa kekurangan antara lain:

• Belum memiliki fitur Dictionary untuk menyimpan, menampilkan dan mengubah graf.

• Ketidakjelasan arah relasi antar token, karena tidak adanya tanda panah yang menunjuk dari dan/atau ke suatu token.

• Belum memiliki kemampuan untuk membuat graf baru. Hanya mampu mengubah graf yang sedang ditampilkan.

• Belum mampu untuk menghapus token dan/atau teks.

• Tidak memiliki mekanisme untuk menampilkan graf lain yang sudah dibuat.

Dengan keterbatasan DelfConStruct yang hanya mampu menganalisis teks berbahasa Inggris maka dikembangkan BogorDelftConstruct yang nantinya mampu

menganalisis teks bahasa Indonesia dengan visualisasi graf sesuai yang dengan konsep

Knowledge Graph. Dengan pembentukan modul

word graph yang ada pada Bogor

DelfConStruct maka akan dikembangkan modul

word graph untuk kata kerja. Analisis bentuk dan makna dari kata kerja telah dilakukan pada penelitian sebelumnya oleh Ahmad Muslik (2009) yang menghasilkan pola aturan dari kata kerja. Penelitian ini mengembangkan modul pembentukan word graph kata kerja pada aplikasi BogorDelftConstruct berdasarkan aturan tersebut.

Tujuan

Penelitian ini bertujuan untuk menambahkan modul pembentukan word graph pada sistem aplikasi Bogor DelfConStruct. Hasil dari penelitian ini berupa word graph yang merepresentasikan kata kerja berdasarkan hasil analisis aturan dari penelitian sebelumnya. Ruang Lingkup

Penelitian ini dibatasi pada pengembangan modul pembentukan word graph untuk kata kerja pada sistem BogorDelftConstruct dengan menggunakan pola aturan dari hasil penelitian sebelumnya oleh Ahmad Muslik (2009). Berikut ini merupakan batasan-batasan sistem, pada pengembangan yang dilakukan:

a. Pada sistem ini yang menjadi masukan hanyalah kata dan posisi kata dalam kalimat tidak diperhatikan.

b. Makna semantik dari kata kerja tidak diperhatikan.

c. Pada saat proses pengecekan kata, sifat atau label dari kata dasar berdasarkan kamus. Manfaat

Manfaat jangka panjang penelitian ini adalah dibentuknya suatu sistem yang mampu membaca input berupa teks Bahasa Indonesia dan menghasilkan output berupa ringkasan atau informasi tentang teks tersebut secara otomatis. Selain itu dalam jangka pendek, sistem ini diharapkan mampu memberikan pengetahuan atau mengekspresikan makna kata kerja dalam bentuk word graph.

TINJAUAN PUSTAKA

Knowledge Graph (KG)

(4)

2 sintatik. KG memiliki beberapa keuntungan

yang sangat besar. KG memiliki kemampuan menyatakan lapisan semantik yang paling dalam dengan hanya menggunakan sejumlah terbatas jenis relasi yang berguna dalam pemahaman bahasa manusia.

Pada prinsipnya, komposisi dari KG mencakup concept (banyak token dan type) serta relationship (binary dan multivariate relation) (Zhang 2002).

Concept (konsep)

Token

Dalam KG, token dinyatakan dengan simbol . Token menyatakan segala sesuatu yang dialami di dunia nyata atau sebuah konsep yang dialami menurut cara pandang masing-masing (Zhang 2002).

Type

Type adalah sebuah konsep yang bersifat umum dan objektif. Type memberi pandangan yang bersifat objektif karena membagi token

yang berbeda ke dalam kelas yang sama. Aspek Ontologi

Menurut Zhang (2002), ontologi word graph

terdiri atas 8 binary relationships dan 4 frame relationships. Delapan binary relationships

tersebut adalah :

1. Similarity of sets, alikeness : ALI

2. Causality : CAU

3. Equality : EQU

4. Subset relationship : SUB

5. Disparateness : DIS

6. Attribution : PAR

7. Ordering : ORD

8. Information dependency : SKO

Berikut penjelasan dari masing-masing

binary relationship tersebut: 1.Relasi ALI

Digunakan di antara type dan token dengan panah ke arah token untuk penamaan konsep. Contoh: jeruk, dinyatakan dengan

word graph:

Gambar 1 Contoh relasi ALI 2.Relasi CAU

Dilambangkan dengan anak panah berlabel CAU antara dua token yang menyatakan hubungan sebab akibat atau sesuatu yang mempengaruhi sesuatu yang lain. Contoh:

adik beli jeruk, dinyatakan dengan word graph:

Gambar 2 Contoh relasi CAU 3.Relasi EQU

Ada dua macam relasi EQU. Relasi EQU antara dua token menyatakan bahwa kedudukan kedua token tersebut sama, contoh: jeruk adalah buah. Relasi EQU yang dilambangkan dengan arah panah dari type

menuju konsep dapat diartikan penetapan sesuatu, contoh: kuning adalah nilai yang ditetapkan untuk warna. Relasi EQU dapat dinyatakan dengan word graph:

Gambar 3 Contoh relasi EQU 4.Relasi SUB

Digunakan jika dua token dinyatakan berturut-turut serta token yang satu merupakan subset dari token yang lain. Contoh: daun merupakan bagian dari pohon, dinyatakan dengan word graph:

Gambar 4 Contoh relasi SUB 5.Relasi DIS

Digunakan untuk menyatakan dua token

yang berbeda satu sama lain. Contoh: air berbeda dengan api, dinyatakan dengan

word graph:

Gambar 5 Contoh relasi DIS 6.Relasi PAR

Digunakan untuk menyatakan sesuatu merupakan atribut dari sesuatu yang lain. Contoh: air dingin, dinyatakan dengan word graph:

(5)

3 7.Relasi ORD

Digunakan untuk menunjukkan dua hal yang saling berurutan dalam hal waktu dan tempat. Contoh: dari pagi hingga malam, dinyatakan dengan word graph:

pagi

ALI ORD ALI

malam Gambar 7 Contoh relasi ORD 8.Relasi SKO

Relasi SKO digunakan berdasarkan konsep tentang ketergantungan informasi. Contoh: besar gaji ditentukan dari pangkat, dinyatakan dengan word graph:

pangkat

ALI SKO ALI

gaji Gambar 8 Contoh relasi SKO Di samping 8 binary relationships, ada ontologi F (Focus) yang digunakan untuk menunjukkan fokus dari suatu graf (Nurdiati & Hoede 2009). Ontologi F untuk menunjukkan kata atau kalimat yang diterangkan dalam suatu pernyataan (inti). Contoh: gunung meletus, dinyatakan dengan word graph:

CAU ALI gunung meletus ALI F PAR

Gambar 9 Contoh relasi Focus

Kemudian empat frame relationships terdiri atas:

1. Focusing on a situation : FPAR

2. Negation on a situation : NEGPAR

3. Possibility on a situation : POSPAR

4. Necessityon a situation : NECPAR

Frame relationship merupakan verteks berlabel yang digunakan untuk mengelompokkan beberapa graf. Adakalanya suatu objek tidak cukup direpresentasikan dengan sebuah token, sehingga diperlukan sebuah frame untuk pengelompokan tersebut. Berikut penjelasan dari masing-masing frame relationship. Relasi FPAR menyatakan sesuatu memiliki properti dari sesuatu yang lain. Relasi NEGPAR menyatakan negasi dari isi frame. Relasi POSPAR menyatakan kemungkinan dari isi frame. Relasi NECPAR menyatakan keharusan terjadinya isi dari frame.

Gambar 10 Frame relationship Verba (kata kerja)

Kata kerja atau verba merupakan kelas kata yang menyatakan suatu tindakan, keberadaan, pengalaman, atau pengertian dinamis lainnya. Menurut Alwi et. al (2003) yang diacu dalam Ahmad Muslik (2009), ciri kata kerja dapat diketahui dengan mengamati perilaku semantis, perilaku sintaksis, dan bentuk morfologinya. Kata kerja secara umum mempunyai ciri sebagai berikut:

1.Kata kerja sebagai predikat atau inti predikat. Contoh : pencuri itu lari, adik

sedang belajar di kamar. Kata lari

merupakan predikat, sedangkan sedang belajar merupakan inti predikat.

2.Ada makna perbuatan (aksi), proses, atau keadaan yang bukan sifat atau kualitas. 3.Kata kerja yang bermakna keadaan tidak

dapat diberi prefiks ter yang artinya paling. Contoh: mati atau suka tidak dapat menjadi

termati atau tersuka.

4.Secara umum, kata kerja tidak dapat bersatu dengan kata-kata yang maknanya kesangatan seperti agak belajar, agak lari,

belanja sekali.

Kata Kerja dari segi bentuknya

Dari segi bentuk, kata kerja terbagi atas kata kerja dasar dan kata kerja turunan. Contoh kata kerja dasar: ada, bangun, cinta, naik, tamat, paham, rasa, yakin, dan sebagainya. Kata kerja turunan dibentuk dari transposisi, pengafiksan, pengulangan (reduplikasi), dan pemaduan dengan penjelasan sebagai berikut:

a.Transposisi

Transposisi merupakan suatu proses penurunan kata dari kategori sintaksis yang satu ke kategori sintaksis yang lain tanpa mengubah bentuknya (Alwi et al. 2003 dalam Muslik 2009). Contoh: telepon, cangkul, sikat.

b.Pengafiksan

(6)

4 c.Reduplikasi

Kata-kata yang mengalami proses ini disebut kata berulang, artinya kata kerja yang telah direduplikasi disebut juga kata kerja berulang. Contoh: lari-lari, makan-makan, tembak-menembak, menari-nari. d.Pemaduan

Pemaduan merupakan penggabungan dua kata dasar atau lebih sehingga menjadi beberapa kata yang memiliki satu makna. Contoh: jual beli, jatuh bangun, salah sangka.

METODE PENELITIAN

Pada penelitian ini akan ditambahkan modul pembentukan word graph untuk kata kerja. Tahapan yang dilakukan pada penelitian ini secara garis besar dapat dilihat pada Gambar 11.

Gambar 11 Tahapan penelitian

Studi Literatur

Pada tahap ini dilakukan pengumpulan materi-materi yang dapat digunakan sebagai bahan rujukan yang relevan dengan topik penelitian. Penelitian ini didasarkan pada

penelitian sebelumnya, yaitu tesis Ahmad Muslik (2009) “Analisis Pembentukan Word Graph Kata Kerja Menggunakan Metode

Knowledge Graph” serta skripsi Deni Romadoni (2009) “Pengembangan Sistem Pembentukan Word Graph Untuk Teks Berbahasa Indonesia”.

Pembentukan Pola Word Graph Kata Kerja Pembentukan pola word graph kata kerja harus sesuai dengan aturan-aturan pembentukan kata kerja dari hasil analisis Muslik (2009). Pada penelitian Muslik (2009) diperoleh 30 aturan dengan 10 daftar pola kata kerja berdasarkan afiks dan maknanya.

Penambahan Modul Pembentukan Word Graph Kata Kerja

1. Praposes

Pada tahap ini ditentukan apakah kata kerja yang dimasukkan bersifat tunggal, mengandung numerik/karakter atau tidak. Jika tidak maka proses akan dilanjutkan ke tahap berikutnya. Selain itu, tahap ini juga bertujuan untuk memeriksa nilai masukan, dimana masukan yang akan dapat diproses harus berupa karakter.

2. Stemming

Pada tahap ini kata kerja akan dipecah untuk mendapatkan afiks (imbuhan) dan kata dasar. Program stemming dibuat dalam bahasa pemrograman MATLAB akan menghasilkan kata dasar serta imbuhan yang dapat berupa prefiks (awalan), sufiks (akhiran), atau infiks (sisipan).

Stemming ini mengacu pada Kamus Besar Bahasa Indonesia (KBBI) yang disesuaikan. Pada KBBI asli terdapat 3 (tiga) field yaitu, ‘Kata’, ‘Sifat’, dan ‘Subkata’. Field ‘Kata’ berisi kata dasar, field ‘Sifat’ berisi sifat kata seperti v (verba), n (nomina), dan sebagainya.

Field ‘Subkata’ berisi kata turunan yang terbentuk dari turunan kata dasar yang mengandung imbuhan. Satu kata dasar dapat memiliki lebih dari satu subkata. Untuk penelitian ini, basis data KBBI dibuat dalam tabel Entry.

Penentuan Pola Hasil (Pengujian)

(7)

4 c.Reduplikasi

Kata-kata yang mengalami proses ini disebut kata berulang, artinya kata kerja yang telah direduplikasi disebut juga kata kerja berulang. Contoh: lari-lari, makan-makan, tembak-menembak, menari-nari. d.Pemaduan

Pemaduan merupakan penggabungan dua kata dasar atau lebih sehingga menjadi beberapa kata yang memiliki satu makna. Contoh: jual beli, jatuh bangun, salah sangka.

METODE PENELITIAN

Pada penelitian ini akan ditambahkan modul pembentukan word graph untuk kata kerja. Tahapan yang dilakukan pada penelitian ini secara garis besar dapat dilihat pada Gambar 11.

Gambar 11 Tahapan penelitian

Studi Literatur

Pada tahap ini dilakukan pengumpulan materi-materi yang dapat digunakan sebagai bahan rujukan yang relevan dengan topik penelitian. Penelitian ini didasarkan pada

penelitian sebelumnya, yaitu tesis Ahmad Muslik (2009) “Analisis Pembentukan Word Graph Kata Kerja Menggunakan Metode

Knowledge Graph” serta skripsi Deni Romadoni (2009) “Pengembangan Sistem Pembentukan Word Graph Untuk Teks Berbahasa Indonesia”.

Pembentukan Pola Word Graph Kata Kerja Pembentukan pola word graph kata kerja harus sesuai dengan aturan-aturan pembentukan kata kerja dari hasil analisis Muslik (2009). Pada penelitian Muslik (2009) diperoleh 30 aturan dengan 10 daftar pola kata kerja berdasarkan afiks dan maknanya.

Penambahan Modul Pembentukan Word Graph Kata Kerja

1. Praposes

Pada tahap ini ditentukan apakah kata kerja yang dimasukkan bersifat tunggal, mengandung numerik/karakter atau tidak. Jika tidak maka proses akan dilanjutkan ke tahap berikutnya. Selain itu, tahap ini juga bertujuan untuk memeriksa nilai masukan, dimana masukan yang akan dapat diproses harus berupa karakter.

2. Stemming

Pada tahap ini kata kerja akan dipecah untuk mendapatkan afiks (imbuhan) dan kata dasar. Program stemming dibuat dalam bahasa pemrograman MATLAB akan menghasilkan kata dasar serta imbuhan yang dapat berupa prefiks (awalan), sufiks (akhiran), atau infiks (sisipan).

Stemming ini mengacu pada Kamus Besar Bahasa Indonesia (KBBI) yang disesuaikan. Pada KBBI asli terdapat 3 (tiga) field yaitu, ‘Kata’, ‘Sifat’, dan ‘Subkata’. Field ‘Kata’ berisi kata dasar, field ‘Sifat’ berisi sifat kata seperti v (verba), n (nomina), dan sebagainya.

Field ‘Subkata’ berisi kata turunan yang terbentuk dari turunan kata dasar yang mengandung imbuhan. Satu kata dasar dapat memiliki lebih dari satu subkata. Untuk penelitian ini, basis data KBBI dibuat dalam tabel Entry.

Penentuan Pola Hasil (Pengujian)

(8)

5 yang sesuai dengan pola tersebut. Di lain pihak,

jika hasil dari stemming berupa pola kata dasar dan imbuhan yang tidak ada dalam pola kata kerja menurut Ahmad Muslik (2009) dan gagal dalam proses pengenalan, maka akan ditampilkan peringatan bahwa masukan bukan merupakan kata kerja. Tahapan penambahan kamus word graph kata kerja secara detail dapat dilihat pada Lampiran 1.

Analisis Hasil

Pada tahap ini pola kata kerja yang telah terbentuk akan dianalisis, apakah sudah sesuai dengan penelitian Muslik (2009) atau belum. Skenario pengujian dilakukan dengan memasukkan beberapa kata kerja kemudian dihitung akurasinya. Penghitungan akurasi dilakukan dengan cara menghitung berapa banyak kata yang dikenali dari beberapa masukkan kata kerja dan sesuai dengan pola

word graph.

=∑

∑ × 100%

Dokumentasi dan Laporan

Pada tahap ini akan dibahas hasil perhitungan keakuratan dari pengujian dari setiap pola. Jika didapati hasil akurasi yang rendah maka akan dicari sumber permasalahannya. Di lain pihak jika masalah yang dihadapi tidak dapat diatasi, maka akan dimasukkan ke dalam saran untuk penelitian selanjutnya.

HASIL DAN PEMBAHASAN

Pemahaman Bidang Kajian dan Identifikasi Masalah

Pengkajian mengenai pembentukan kamus

word graph kata sifat dan sistem aplikasi BogorDelftConstruct didapat dari penelitian sebelumnya, tesis Muslik (2009) dan skripsi Romadoni (2009). Berdasarkan penelitian Muslik (2009) didapat 10 pola word graph yang dibentuk dari 30 aturan kata kerja. Sepuluh pola tersebut diberi nama sesuai dengan nama variabel dalam sistem. Pola pembentukan word graph dapat dilihat pada Tabel 1 dan lebih detail pada Lampiran 2.

Pengidentifikasian masalah dalam penelitian ini mencakup keseluruhan yang dijelaskan bab metode penelitian, antara lain pembatasan penelitian berdasarkan ruang lingkup, program

stemming, penggunaan KBBI dalam penelitian,

pembentukan pola word graph, pengujian pola

word graph, analisis hasil pengujian.

Tabel 1 Pola pembentukan word graph kata kerja

Pola Pembentuk Kata Kerja

Nama Variabel Pola Dalam

Sistem Kata Kerja Dasar (KKD)

Ber-KK Pola-vdasar

Meng-/mem-/me-Kata Kerja (KK)

Meng-/mem-/me-KK-kan Meng-/mem-/me-Kata Benda (KB)-kan Meng-/mem-/me-Kata Sifat (KS)-kan Meng-/mem-/me-KK-I Meng-/mem-/me-KS-i Meng-/mem-/me-KB-i Memper-KB

Memper-KS

Memper-KK-kan/i

Pola-mekani

Di-KKtransitif-(-i/-kan) Ter-KKtransitif(-i)

Di-KB-i Diper-KS

Pola-diter

Meng-/mem-/me-Kata

Ulang (KU) Pola-meku

Ber-KB

Ber-KS

Ber-KKan

Pola-beran

Ber-KB-kan Ber-KK-an

Meng-/mem-/me-KS

Meng-/mem-/me-KB

Meng-/mem-/me-Kata Dasar Terikat

Ke-KK/KB/KS-an

Pola-bermeke

Ter-KKintransitif(-i) Pola-teri Kata Kerja Dasar Ulang Pola-kkdu KK-meng-/mem-/me-KK Pola-fixku

(9)

5 yang sesuai dengan pola tersebut. Di lain pihak,

jika hasil dari stemming berupa pola kata dasar dan imbuhan yang tidak ada dalam pola kata kerja menurut Ahmad Muslik (2009) dan gagal dalam proses pengenalan, maka akan ditampilkan peringatan bahwa masukan bukan merupakan kata kerja. Tahapan penambahan kamus word graph kata kerja secara detail dapat dilihat pada Lampiran 1.

Analisis Hasil

Pada tahap ini pola kata kerja yang telah terbentuk akan dianalisis, apakah sudah sesuai dengan penelitian Muslik (2009) atau belum. Skenario pengujian dilakukan dengan memasukkan beberapa kata kerja kemudian dihitung akurasinya. Penghitungan akurasi dilakukan dengan cara menghitung berapa banyak kata yang dikenali dari beberapa masukkan kata kerja dan sesuai dengan pola

word graph.

=∑

∑ × 100%

Dokumentasi dan Laporan

Pada tahap ini akan dibahas hasil perhitungan keakuratan dari pengujian dari setiap pola. Jika didapati hasil akurasi yang rendah maka akan dicari sumber permasalahannya. Di lain pihak jika masalah yang dihadapi tidak dapat diatasi, maka akan dimasukkan ke dalam saran untuk penelitian selanjutnya.

HASIL DAN PEMBAHASAN

Pemahaman Bidang Kajian dan Identifikasi Masalah

Pengkajian mengenai pembentukan kamus

word graph kata sifat dan sistem aplikasi BogorDelftConstruct didapat dari penelitian sebelumnya, tesis Muslik (2009) dan skripsi Romadoni (2009). Berdasarkan penelitian Muslik (2009) didapat 10 pola word graph yang dibentuk dari 30 aturan kata kerja. Sepuluh pola tersebut diberi nama sesuai dengan nama variabel dalam sistem. Pola pembentukan word graph dapat dilihat pada Tabel 1 dan lebih detail pada Lampiran 2.

Pengidentifikasian masalah dalam penelitian ini mencakup keseluruhan yang dijelaskan bab metode penelitian, antara lain pembatasan penelitian berdasarkan ruang lingkup, program

stemming, penggunaan KBBI dalam penelitian,

pembentukan pola word graph, pengujian pola

word graph, analisis hasil pengujian.

Tabel 1 Pola pembentukan word graph kata kerja

Pola Pembentuk Kata Kerja

Nama Variabel Pola Dalam

Sistem Kata Kerja Dasar (KKD)

Ber-KK Pola-vdasar

Meng-/mem-/me-Kata Kerja (KK)

Meng-/mem-/me-KK-kan Meng-/mem-/me-Kata Benda (KB)-kan Meng-/mem-/me-Kata Sifat (KS)-kan Meng-/mem-/me-KK-I Meng-/mem-/me-KS-i Meng-/mem-/me-KB-i Memper-KB

Memper-KS

Memper-KK-kan/i

Pola-mekani

Di-KKtransitif-(-i/-kan) Ter-KKtransitif(-i)

Di-KB-i Diper-KS

Pola-diter

Meng-/mem-/me-Kata

Ulang (KU) Pola-meku

Ber-KB

Ber-KS

Ber-KKan

Pola-beran

Ber-KB-kan Ber-KK-an

Meng-/mem-/me-KS

Meng-/mem-/me-KB

Meng-/mem-/me-Kata Dasar Terikat

Ke-KK/KB/KS-an

Pola-bermeke

Ter-KKintransitif(-i) Pola-teri Kata Kerja Dasar Ulang Pola-kkdu KK-meng-/mem-/me-KK Pola-fixku

(10)

6 Praproses

Praproses merupakan tahap awal pengembangan Kamus Word Graph Kata Kerja. Praproses dilakukan untuk membatasi nilai masukan pada sistem. Masukan harus berupa kata tunggal atau tidak mengandung spasi (‘ ’). Fungsi untuk memeriksa hal ini didokumentasikan pada checkPlural yang jika bernilai ‘benar’ maka proses tidak akan dilanjutkan pada tahap berikutnya. Selain itu, jika nilai masukan berupa numerik maka sistem akan menampilkan peringatan pada user untuk memasukkan input yang berupa kata bukan numerik. Untuk memeriksa apakah masukan kata berupa numerik atau bukan digunakan fungsi checkNum.

Stemming

Program stemming dibuat sesuai kebutuhan penelitian sehingga mampu membuang awalan, akhiran, sisipan atau gabungan antara awalan dan akhiran yang sesuai dengan pola pembentuk kata kerja dengan keluaran berupa kata dasar. Selain itu, keluaran dari program stemming juga berupa imbuhan yang terkandung dalam kata masukan.

Program stemming terdokumentasi dalam fungsi getStem yang terdiri atas fungsi stemFix

dan stemm. Fungsi stemFix untuk kata masukan yang mengandung imbuhan yang terdapat pada tabel Fixations. Fungsi stemm untuk imbuhan asing dan untuk menanggulangi kata yang tidak terdapat dalam KBBI yang disesuaikan.

Proses stemming dengan KBBI yang disesuaikan dilakukan dengan langkah-langkah berikut:

1.Kata masukan dicari apakah terdapat pada KBBI atau tidak.

2.Jika ada pada KBBI yang disesuaikan, kata masukan diperiksa apakah mengandung imbuhan yang terdapat pada tabel Fixations atau tidak. Jika ya, dilakukan proses pemotongan berurut sesuai imbuhan-imbuhan yang dikenali pada tabel Fixations. Jika tidak, untuk imbuhan asing akan dilakukan proses

stemming. Selainnya, kata masukan yang dikenali pada KBBI yang disesuaikan dikembalikan kata dasarnya dan langsung dicari sifat kata dasarnya dalam KBBI yang disesuaikan.

3.Jika tidak terdapat pada KBBI yang disesuaikan maka dilakukan proses

stemming.

4.Kata masukan diproses dengan pemotongan bertahap untuk setiap kondisi. Setiap yang menghasilkan hasil stemming

dimasukkan dalam daftar kandidat kata dan diperiksa apakah terdapat pada KBBI yang disesuaikan atau tidak. Jika tidak ada satu kata yang ditemukan maka dikembalikan kata sebelum di-stemm. Pengenalan Pola Word Graph Kata Kerja

Setelah didapat kata dasar, sifat kata dasar dan imbuhannya akan digunakan untuk mengenali pola word graph pembentuk kata kerja menggunakan fungsi checkPatternVerb. Untuk mengetahui sifat kata dasar hasil

stemming dilakukan pengecekan terhadap kata dasar pada database ‘kamus’ menggunakan fungsi cekKata.

Fungsi checkPatternVerb akan membandingkan apakah kata dasar dan alternatif kata dasar (jika ada) serta imbuhan yang terkandung dari kata masukan sesuai dengan pola word graph yang ada. Jika ya, maka fungsi akan mengembalikan salah satu nama pola dari 10 daftar pola word graph yang memenuhi kondisi. Misalnya, kata masukan ‘memulai’ jika dilakukan stemming akan menghasilkan kata dasar ‘mulai’, ‘pulai’ sebagai kata dasar alternatif dan imbuhan ‘mem’ dikenali sebagai pola word graph ‘mem-kata kerja’. Pola ‘mem-‘mem-kata kerja’ termasuk salah satu pola word graph kata kerja. Fungsi

checkPatternVerb akan memeriksa apakah kata dasar ‘mulai’ memiliki sifat kata kerja (verba) atau kata dasar alternatif ‘pulai’ yang bersifat sebagai kata kerja. Jika salah satunya terpenuhi maka kata tersebut dianggap sebagai kata dasar dari kata masukan ‘memulai’.

Pembentukan Pola Word Graph Kata Kerja Hasil tahap penentuan pola word graph kata kerja akan menampilkan word graph dari pola yang membentuknya. Kata masukan yang memenuhi kondisi pola word graph kata kerja tertentu akan memanggil fungsi yang membuat pola word graph kata masukan.

Jika kata masukan tidak memenuhi semua kondisi pola pembentukan word graph kata kerja, maka kata tersebut bukan kata kerja bentuk turunan dan akan dicari jenis kata dasar dari kata masukan serta akan menampilkan peringatan bahwa kata masukan bukan kata kerja.

(11)

7 membedakan kedua pola tersebut hanya dari

maknanya. Pembedaan kedua pola tersebut dapat dilakukan dengan melihat posisi kata kerja dengan pola word graph ‘ter-kata kerja’ intransitif ataupun transitif dalam kalimat. Pola

word graph ‘ter-kata kerja dasar’ intransitif dipilih untuk dimasukkan ke dalam modul Kamus Word Graph karena pola tersebut memiliki makna yang lebih umum serta tidak perlu membutuhkan objek dalam konteks kalimat. Semua tahapan mulai dari praproses hingga tahap ini digabung dalam sebuah modul

indVerbDict yang memproses pembentukan kamus word graph kata kerja.

Analisis Hasil Pengujian

Analisis hasil pengujian akan disajikan dalam bentuk persentase akurasi yang dihasilkan dari pengujian modul kamus word graph kata kerja dengan penjelasan untuk setiap variabel pola. Hasil akurasi pengujian secara umum disajikan pada Tabel 2.

Tabel 2 Akurasi hasil pengujian Variabel

Pola Word graph Kata

Kerja Jumlah Input Jumlah Input yang Sesuai Akurasi

Pola-vdasar 20 20 100,00 Pola-mekani 20 20 100,00 Pola-diter 25 25 100,00 Pola-meku 12 10 100,00 Pola-beran 12 10 83,33

Pola-bermeke 36 36 100,00 Pola-teri 12 12 100,00 Pola-kkdu 10 10 100,00 Pola-fixku 12 12 100,00 Pola-berku 12 12 100,00

Total 171 169 98,83

Pola-vdasar

Variabel pola-vdasar terdiri atas pola Kata Kerja Dasar (KKD) dengan 10 masukan dan pola ber-KKD dengan 10 masukan. Semua masukan menghasilkan stemming yang sesuai sehingga semua masukan dikenali dengan benar sesuai pola word graph kata kerja dengan variabel pola-vdasar. Hasil pengujian dapat dilihat pada Lampiran 3.

Pola-mekani

Variabel pola-mekani terdiri atas pola (meng/me/mem/memper)- Kata Kerja -(kan/i) dengan 10 masukan dan pola meng-/me-/mem-/memper-Kata Benda/Kata Sifat-kan/-i dengan 10 masukan. Semua masukan menghasilkan

stemming yang sesuai sehingga semua masukan dikenali dengan benar sesuai pola word graph

kata kerja dengan variabel pola-mekani. Hasil pengujian dapat dilihat pada Lampiran 4.

Pola-diter

Variabel pola-diter terdiri atas pola di-Kata Kerja/Kata Benda/Kata Sifat(-i/-kan) dengan 15 masukan dan pola diper-Kata Benda/Kata Sifat(-kan) dengan 10 masukan. Semua masukan menghasilkan stemming yang sesuai sehingga semua masukan dikenali dengan benar sesuai pola word graph kata kerja dengan variabel pola-mekani. Hasil pengujian dapat dilihat pada Lampiran 5 sedangkan contoh graf hasil pengujian untuk kata ‘digarami’ dapat dilihat pada Gambar 12.

Gambar 12 Graf hasil pengujian kata ‘digarami’

Pola-meku

Variabel pola-bermeku terdiri atas pola meng-/mem-/me-Kata Ulang dengan 12 masukan. Semua masukan menghasilkan

stemming yang sesuai sehingga semua masukan dikenali dengan benar sesuai pola word graph

kata kerja dengan variabel pola-bermeku. Hasil pengujian dapat dilihat pada Lampiran 6 sedangkan contoh hasil pengujian untuk kata ‘menari-nari’ dapat dilihat dalam Gambar 13.

(12)

8 Pola-beran

Variabel pola-beran terdiri atas pola ber-Kata Benda/ber-Kata Sifat dengan 12 masukan. Untuk pola ber-KKan (kata kerja yg sudah diimbuhi akhiran an, contoh: ‘hubungan’) tidak dapat ditampilkan pada pola-beran. Untuk aturan ber-KKan setelah di stemming

menghasilkan ber-kata kerja-an. Hal ini disebabkan oleh KBBI yang belum lengkap. Hasil pengujian dapat dilihat pada Lampiran 7.

Pola-bermeke

Variabel pola-bermeke terdiri atas pola ber-Kata Benda-kan dan ber-ber-Kata Kerja/ber-Kata Sifat-an dengSifat-an 12 masukSifat-an, pola meng-/mem-/me-Kata Benda/meng-/mem-/me-Kata Sifat dengan 12 masukan, dan pola ke-Kata Kerja/Kata Benda/Kata Sifat-an dengan 12 masukan. Semua masukan menghasilkan stemming yang sesuai sehingga semua masukan dikenali dengan benar sesuai pola word graph kata kerja dengan variabel pola-bermeke. Hasil pengujian dapat dilihat pada Lampiran 8.

Pola-teri

Variabel pola-teri terdiri atas pola ter-Kata Kerja Dasar(-i) dengan 12 masukan. Semua masukan menghasilkan stemming yang sesuai sehingga semua masukan dikenali dengan benar sesuai pola word graph kata kerja dengan variabel pola-teri. Hasil pengujian dapat dilihat pada Tabel 3 atau Lampiran 9 untuk lebih lengkap.

Pola-kkdu

Variabel pola-kkdu terdiri atas pola Kata Kerja Dasar Ulang dengan 10 masukan. Semua masukan menghasilkan stemming yang sesuai sehingga semua masukan dikenali dengan benar sesuai pola word graph kata kerja dengan variabel pola-kkdu. Hasil pengujian dapat dilihat pada Lampiran 10.

Pola-fixku

Variabel pola-fixku terdiri atas pola Kata Kerja-meng-/mem-/me-Kata Kerja dengan 12 masukan. Semua masukan menghasilkan

stemming yang sesuai sehingga semua masukan dikenali dengan benar sesuai pola word graph

kata kerja dengan variabel pola-fixku. Hasil pengujian dapat dilihat pada Lampiran 11.

Pola-berku

Variabel pola-berku terdiri atas pola ber-Kata Ulang dengan 12 masukan. Semua masukan menghasilkan stemming yang sesuai sehingga semua masukan dikenali dengan benar

sesuai pola word graph kata kerja dengan variabel pola-berku. Hasil pengujian dapat dilihat pada Lampiran 12.

Tabel 3 Hasil Pengujian word graph kata kerja Pola-teri

Kata

Masukan Hasil Pengujian Terduduk sesuai dengan variabel word

graph pola-teri

Terantuk sesuai dengan variabel word

graph pola-teri

Terbangun sesuai dengan variabel word

graph pola-teri

Tertidur sesuai dengan variabel word

graph pola-teri

Terbenam sesuai dengan variabel word

graph pola-teri

Terjatuh sesuai dengan variabel word

graph pola-teri

Terlampaui sesuai dengan variabel word

graph pola-teri

Tersaingi sesuai dengan variabel word

graph pola-teri

Tertanami sesuai dengan variabel word

graph pola-teri

Tersirami sesuai dengan variabel word

graph pola-teri

Teraliri sesuai dengan variabel word

graph pola-teri

Terhalangi sesuai dengan variabel word

graph pola-teri

Analisis Hasil Pengujian Keseluruhan Hasil pengujian untuk word graph kata kerja dengan masukan 171 kata kerja menghasilkan akurasi 98,83%. Secara umum modul pembentukan word graph kata kerja sudah cukup baik. Masalah utama dari pengembangan modul pembentukan word graph kata kerja adalah tidak lengkapnya KBBI.

Analisis Kekurangan dan Kelebihan Pengembangan Modul Pembentukan Word Graph Kata Kerja

(13)

9 intransitif. Di samping itu untuk beberapa pola

yang telah dibangkitkan, tidak ada keterangan pada antarmuka ketika mengklik token.

Beberapa pola word graph kata kerja yang telah berhasil dibuat dalam modul tidak persis sama dengan word graph yang ada pada penelitian Muslik (2009). Misalnya, pada pola-meku (kata ulang dengan imbuhan me-/meng-/mem-) menggunakan relasi ALI ke satu token secara berulang untuk menyatakan pengulangan kata, yang disimbolkan dengan . Pada sistem, word graph tidak menghasilkan relasi seperti simbol tersebut melainkan hanya menampilkan teks ‘ali’ pada token yang memiliki makna memunyai pengulangan kata.

Kelebihan pengembangan modul pembentukan word graph kata kerja adalah telah berhasil mengimplementasikan 10 pola

wordgraph kata kerja sesuai dengan penelitian Muslik (2009). Aplikasi BogorDelftConstruct telah mampu mengenali pola word graph kata kerja dengan tingkat akurasi 98,83%.

KESIMPULAN DAN SARAN

Kesimpulan

Pengembangan modul pembentukan word graph kata kerja telah mampu mengenali 10 pola aturan word graph kata kerja sesuai dengan penelitian Muslik (2009). Pola kata kerja yang menjadi masukan hanya satu kata sehingga setiap masukan diasumsikan kata kerja intransitif yang tidak perlu terikat dengan objek. Pengujian modul untuk pola word graph

kata kerja secara keseluruhan menghasilkan akurasi 98,83%. Meskipun memiliki akurasi yang cukup baik sistem ini masih memiliki kekurangan. Salah satunya adalah sistem ini hanya mampu mengenali masukan sepanjang 1 kata.

Di lain hal, sistem ini secara garis besar telah cukup berhasil karena telah mampu membangkitkan pola aturan word graph kata kerja yang sesuai dengan hasil penelitian yang dilakukan Muslik (2009).

Saran

Sebagai pengembangan dari penelitian ini beberapa hal yang dapat disarankan adalah:

1.Penambahan bagian atau fungsi dalam modul agar dapat membedakan pola kata kerja intransitif atau transitif.

2. Pengembangan modul serupa untuk aturan lain dalam Bahasa Indonesia selain kata kerja, seperti kata tugas, frasa kata, atau klausa.

(14)

9 intransitif. Di samping itu untuk beberapa pola

yang telah dibangkitkan, tidak ada keterangan pada antarmuka ketika mengklik token.

Beberapa pola word graph kata kerja yang telah berhasil dibuat dalam modul tidak persis sama dengan word graph yang ada pada penelitian Muslik (2009). Misalnya, pada pola-meku (kata ulang dengan imbuhan me-/meng-/mem-) menggunakan relasi ALI ke satu token secara berulang untuk menyatakan pengulangan kata, yang disimbolkan dengan . Pada sistem, word graph tidak menghasilkan relasi seperti simbol tersebut melainkan hanya menampilkan teks ‘ali’ pada token yang memiliki makna memunyai pengulangan kata.

Kelebihan pengembangan modul pembentukan word graph kata kerja adalah telah berhasil mengimplementasikan 10 pola

wordgraph kata kerja sesuai dengan penelitian Muslik (2009). Aplikasi BogorDelftConstruct telah mampu mengenali pola word graph kata kerja dengan tingkat akurasi 98,83%.

KESIMPULAN DAN SARAN

Kesimpulan

Pengembangan modul pembentukan word graph kata kerja telah mampu mengenali 10 pola aturan word graph kata kerja sesuai dengan penelitian Muslik (2009). Pola kata kerja yang menjadi masukan hanya satu kata sehingga setiap masukan diasumsikan kata kerja intransitif yang tidak perlu terikat dengan objek. Pengujian modul untuk pola word graph

kata kerja secara keseluruhan menghasilkan akurasi 98,83%. Meskipun memiliki akurasi yang cukup baik sistem ini masih memiliki kekurangan. Salah satunya adalah sistem ini hanya mampu mengenali masukan sepanjang 1 kata.

Di lain hal, sistem ini secara garis besar telah cukup berhasil karena telah mampu membangkitkan pola aturan word graph kata kerja yang sesuai dengan hasil penelitian yang dilakukan Muslik (2009).

Saran

Sebagai pengembangan dari penelitian ini beberapa hal yang dapat disarankan adalah:

1.Penambahan bagian atau fungsi dalam modul agar dapat membedakan pola kata kerja intransitif atau transitif.

2. Pengembangan modul serupa untuk aturan lain dalam Bahasa Indonesia selain kata kerja, seperti kata tugas, frasa kata, atau klausa.

(15)

CHRISTIAN HENRY

DEPARTEMEN ILMU KOMPUTER

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

INSTITUT PERTANIAN BOGOR

(16)

10

DAFTAR PUSTAKA

Alwi H, Dardjowidjojo S, Lapowila H, Moeliono AM. 2003. Tata Bahasa Baku Bahasa Indonesia. Ed ke-3. Jakarta: Balai Pustaka.

Muslik A. 2009. Analisis Pembentukan Word Graph Kata Kerja Menggunakan Metode Knowledge Graph. [tesis]. Bogor: Program Pascasarjana, Institut Pertanian Bogor. Nurdiati S, and C Hoede. 2009. Word Graph

Construction of Certain Aspects of Indonesian Language. Supplementary Proceedings of The 17th International Conference on Conceptual Structures. Moscow, Russia.

Rusiyamti. 2008. Analisis Teks Berbahasa Indonesia Menggunakan Metode

Knowledge Graph. [tesis]. Bogor: Sekolah Pascasarjana, Institut Pertanian Bogor. Romadoni D. 2009. Pengembangan Sistem

Pembentukan Word Graph Untuk Teks Berbahasa Indonesia. [skripsi]. Bogor: Program Sarjana, Institut Pertanian Bogor Zhang L. 2002. Knowledge Graph Theory and

(17)

CHRISTIAN HENRY

DEPARTEMEN ILMU KOMPUTER

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

INSTITUT PERTANIAN BOGOR

(18)

ii

ABSTRACT

CHRISTIAN HENRY. The development of verb word graph module in BogorDelftConstruct appplication. Directed by SRI NURDIATI.

Knowledge Graph (KG) is one of natural language processing methods that is able to represent the result of semantic analysis of a text in a graph form. Until now, there are only a few researches using KG to do semantic analysis for texts in Indonesian language. They were mainly focus on analyzing text, constructing rules to analyze text and engineering to understand the text. Some other researches have done semantic analysis from various part-of-speech. Nevertheless, the results of the research have not been implemented yet. To realize a long term goal of doing text abstraction automatically, BogorDelftConstruct has been developed as an early stage prototype. In line with that, this research implemented semantic analysis for one part-of-speech in BogorDelftConstruct.

The objective of the research is to develop a module dictionary of verb word graph taken from the result of previous research in BogorDelftConstruct system. The verb to be analyzed has 10 patterns of word graph which formed by affixation. Word graph pattern formation process begins by knowing the basic word and affix using stemming. This stemming process refers to the adjusted Kamus Besar Bahasa Indonesia (KBBI). Basic word and affixe from the result of stemming will be used to determine appropriate pattern of the verb word graph. Appropriate pattern of the verb word graph will be generated and displayed on the system.

Development of a verb word graph module has been able to identify 10 patterns of the verb word graph. The system however can only recognize one-word-verb so each entry is assumed to be intransitive verb that does not need to be followed by an object. The results of testing with 171 entries from overall yield was 98.83% accuracy. Despite of having a good accuracy, this system still has some short comings, such as could not process input with more than one words. This problem is expected to be the focus of the following research.

(19)

iii

PENAMBAHAN MODUL PEMBENTUKAN

WORD GRAPH

KATA KERJA

PADA APLIKASI BOGORDELFTCONSTRUCT

CHRISTIAN HENRY

Skripsi

Sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer pada

Program Studi Ilmu Komputer

DEPARTEMEN ILMU KOMPUTER

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

INSTITUT PERTANIAN BOGOR

(20)

iv Judul skripsi :Penambahan Modul Pembentukan Word Graph Kata Kerja pada Aplikasi

BogorDelftConstruct Nama : Christian Henry NRP : G64104103

Menyetujui,

Dr. Ir. Sri Nurdiati, M.Sc Pembimbing

Mengetahui, Ketua Departemen

Dr. Ir. Sri Nurdiati, M.Sc NIP: 196011261986012001

(21)

v

RIWAYAT HIDUP

Penulis dilahirkan di Tulungagung, Jawa Timur pada tanggal 21 Desember 1985 dari Bapak Enantius Prihantoro dan Ibu Wiwik Dwi Astuti. Penulis merupakan putra pertama dari dua bersaudara.

(22)

vi

PRAKATA

Puji dan hormat penulis panjatkan kepada Tuhan YME atas segala berkat dan kasih sayangNya sehingga karya ilmiah ini berhasil diselesaikan. Syukur juga penulis panjatkan kepada Yesus Kristus atas segala teladan dan penyertaan-Nya dalam setiap kehidupan penulis. Tema yang dipilih dalam penelitian ini adalah pengimplementasian metode Knowledge Graph pada pengembangan kamus kata kerja, dengan judul Penambahan Modul Pembentukan Word Graph Kata Kerja pada Aplikasi BogorDelftConstruct. Penelitian dilakukan sejak Januari 2010 sampai dengan Maret 2011.

Terima kasih penulis ucapkan kepada

1. Papi dan Mami untuk doa, kasih sayang dan dukungan motivasi yang tak terhingga. Ungkapan terima kasih juga penulis sampaikan untuk adik, Rizal atas diskusi dan dukungannya. Terima kasih juga tak lupa penulis sampaikan kepada keluarga besar penulis. 2. Ibu Dr. Ir. Sri Nurdiati M.Sc selaku pembimbing atas waktu, kesempatan, saran, bimbingan

dan pengertian yang selalu diberikan.

3. Bapak Ahmad Ridha, S.Kom, MS. dan Bapak Sony Hartono Wijaya, S.Kom, M.Kom. selaku penguji yang telah memberikan kritik dan saran selama penelitian ini hingga sidang tugas akhir.

4. Annissa untuk ilmu, diskusi dan dukungan bagi penulis.

5. Felly Iglesia untuk dukungan dan motivasi baik secara moral maupun spiritual.

6. Beberapa teman dari ILKOM S1 angkatan 41 yang selalu memberikan dukungan dan semangat.

7. Semua pihak yang tidak dapat penulis sebutkan satu persatu yang telah membantu penulis dalam menyelesaikan penelitian ini.

Karya ilmiah ini masih jauh dari sempurna, dengan segala kerendahan hati penulis mengharapkan kritik dan saran yang membangun bagi karya ilmiah ini. Penulis berharap semoga karya ilmiah ini dapat memberikan manfaat bagi sang pembaca.

Bogor, Mei 2011

(23)

vii

DAFTAR ISI

Halaman DAFTAR ISI ... vii DAFTAR GAMBAR... viii DAFTAR TABEL ... viii DAFTAR LAMPIRAN ... ix PENDAHULUAN ... 1 Latar Belakang ... 1 Tujuan... 1 Ruang Lingkup ... 1 Manfaat... 1 TINJAUAN PUSTAKA ... 1

Knowledge Graph (KG) ... 1

Concept (konsep) ... 2 Aspek Ontologi... 2 Verba (kata kerja) ... 3 METODE PENELITIAN ... 4 HASIL DAN PEMBAHASAN ... 5 KESIMPULAN DAN SARAN ... 9 Kesimpulan ... 9 Saran. ... 9 DAFTAR PUSTAKA ... 10 LAMPIRAN ... 11

(24)

viii

DAFTAR GAMBAR

Halaman Gambar 1 Contoh relasi ALI ... 2 Gambar 2 Contoh relasi CAU ... 2 Gambar 3 Contoh relasi EQU ... 2 Gambar 4 Contoh relasi SUB ... 2 Gambar 5 Contoh relasi DIS ... 2 Gambar 6 Contoh relasi PAR ... 2 Gambar 7 Contoh relasi ORD ... 3 Gambar 8 Contoh relasi SKO ... 3 Gambar 9 Contoh relasi Focus ... 3 Gambar 10 Frame relationship ... 3 Gambar 11 Tahapan penelitian ... 4 Gambar 12 Graf hasil pengujian kata ‘digarami’ ... 7 Gambar 13 Graf hasil pengujian kata ‘menari-nari’ ... 7

DAFTAR TABEL

(25)

ix

DAFTAR LAMPIRAN

Halaman

(26)

1

PENDAHULUAN

Latar Belakang

Bahasa alami yang digunakan manusia untuk berkomunikasi satu sama lain sangat bermanfaat dan penting dalam penyampaian informasi secara langsung. Di lain pihak, komputer masih sulit untuk memahami bahasa alami manusia. Dalam ilmu komputer bidang yang secara spesifik mempelajari cara komunikasi antara manusia dan komputer adalah Natural Language Processing (NLP). Sebuah kalimat dalam bahasa alami dapat dianalisis dari sudut pandang semantik atau sintaksis. Knowledge Graph merupakan salah satu metode dalam NLP yang menganalisis bahasa alami dengan lebih berfokus pada semantik daripada sintaksis.

Pengimplementasian metode Knowledge Graph pada bahasa alami diharapkan mampu memberikan abstraksi dari informasi atau pengetahuan yang terkandung di dalamnya ke dalam bentuk graf. Salah satu penelitian yang telah berhasil mengimplementasikan metode

Knowladge Graph pada suatu bahasa alami adalah DelftConstruct yang dikembangkan oleh Mark Van Koningsveld pada tahun 2003-2008.

DelfConStruct merupakan sebuah prototype

aplikasi untuk menganalisis Bahasa Inggris dan disajikan ke dalam bentuk graf dengan menggunakan metode Knowladge Graph. DelftConstruct dibangun menggunakan bahasa pemrograman MATLAB yang dapat membentuk suatu graf antara suatu kata dengan kata lainnya (word graph), namun belum sesuai dengan konsep Knowladge Graph (Romadoni 2009). Selain itu, DelftConstruct memiliki beberapa kekurangan antara lain:

• Belum memiliki fitur Dictionary untuk menyimpan, menampilkan dan mengubah graf.

• Ketidakjelasan arah relasi antar token, karena tidak adanya tanda panah yang menunjuk dari dan/atau ke suatu token.

• Belum memiliki kemampuan untuk membuat graf baru. Hanya mampu mengubah graf yang sedang ditampilkan.

• Belum mampu untuk menghapus token dan/atau teks.

• Tidak memiliki mekanisme untuk menampilkan graf lain yang sudah dibuat.

Dengan keterbatasan DelfConStruct yang hanya mampu menganalisis teks berbahasa Inggris maka dikembangkan BogorDelftConstruct yang nantinya mampu

menganalisis teks bahasa Indonesia dengan visualisasi graf sesuai yang dengan konsep

Knowledge Graph. Dengan pembentukan modul

word graph yang ada pada Bogor

DelfConStruct maka akan dikembangkan modul

word graph untuk kata kerja. Analisis bentuk dan makna dari kata kerja telah dilakukan pada penelitian sebelumnya oleh Ahmad Muslik (2009) yang menghasilkan pola aturan dari kata kerja. Penelitian ini mengembangkan modul pembentukan word graph kata kerja pada aplikasi BogorDelftConstruct berdasarkan aturan tersebut.

Tujuan

Penelitian ini bertujuan untuk menambahkan modul pembentukan word graph pada sistem aplikasi Bogor DelfConStruct. Hasil dari penelitian ini berupa word graph yang merepresentasikan kata kerja berdasarkan hasil analisis aturan dari penelitian sebelumnya. Ruang Lingkup

Penelitian ini dibatasi pada pengembangan modul pembentukan word graph untuk kata kerja pada sistem BogorDelftConstruct dengan menggunakan pola aturan dari hasil penelitian sebelumnya oleh Ahmad Muslik (2009). Berikut ini merupakan batasan-batasan sistem, pada pengembangan yang dilakukan:

a. Pada sistem ini yang menjadi masukan hanyalah kata dan posisi kata dalam kalimat tidak diperhatikan.

b. Makna semantik dari kata kerja tidak diperhatikan.

c. Pada saat proses pengecekan kata, sifat atau label dari kata dasar berdasarkan kamus. Manfaat

Manfaat jangka panjang penelitian ini adalah dibentuknya suatu sistem yang mampu membaca input berupa teks Bahasa Indonesia dan menghasilkan output berupa ringkasan atau informasi tentang teks tersebut secara otomatis. Selain itu dalam jangka pendek, sistem ini diharapkan mampu memberikan pengetahuan atau mengekspresikan makna kata kerja dalam bentuk word graph.

TINJAUAN PUSTAKA

Knowledge Graph (KG)

(27)

2 sintatik. KG memiliki beberapa keuntungan

yang sangat besar. KG memiliki kemampuan menyatakan lapisan semantik yang paling dalam dengan hanya menggunakan sejumlah terbatas jenis relasi yang berguna dalam pemahaman bahasa manusia.

Pada prinsipnya, komposisi dari KG mencakup concept (banyak token dan type) serta relationship (binary dan multivariate relation) (Zhang 2002).

Concept (konsep)

Token

Dalam KG, token dinyatakan dengan simbol . Token menyatakan segala sesuatu yang dialami di dunia nyata atau sebuah konsep yang dialami menurut cara pandang masing-masing (Zhang 2002).

Type

Type adalah sebuah konsep yang bersifat umum dan objektif. Type memberi pandangan yang bersifat objektif karena membagi token

yang berbeda ke dalam kelas yang sama. Aspek Ontologi

Menurut Zhang (2002), ontologi word graph

terdiri atas 8 binary relationships dan 4 frame relationships. Delapan binary relationships

tersebut adalah :

1. Similarity of sets, alikeness : ALI

2. Causality : CAU

3. Equality : EQU

4. Subset relationship : SUB

5. Disparateness : DIS

6. Attribution : PAR

7. Ordering : ORD

8. Information dependency : SKO

Berikut penjelasan dari masing-masing

binary relationship tersebut: 1.Relasi ALI

Digunakan di antara type dan token dengan panah ke arah token untuk penamaan konsep. Contoh: jeruk, dinyatakan dengan

word graph:

Gambar 1 Contoh relasi ALI 2.Relasi CAU

Dilambangkan dengan anak panah berlabel CAU antara dua token yang menyatakan hubungan sebab akibat atau sesuatu yang mempengaruhi sesuatu yang lain. Contoh:

adik beli jeruk, dinyatakan dengan word graph:

Gambar 2 Contoh relasi CAU 3.Relasi EQU

Ada dua macam relasi EQU. Relasi EQU antara dua token menyatakan bahwa kedudukan kedua token tersebut sama, contoh: jeruk adalah buah. Relasi EQU yang dilambangkan dengan arah panah dari type

menuju konsep dapat diartikan penetapan sesuatu, contoh: kuning adalah nilai yang ditetapkan untuk warna. Relasi EQU dapat dinyatakan dengan word graph:

Gambar 3 Contoh relasi EQU 4.Relasi SUB

Digunakan jika dua token dinyatakan berturut-turut serta token yang satu merupakan subset dari token yang lain. Contoh: daun merupakan bagian dari pohon, dinyatakan dengan word graph:

Gambar 4 Contoh relasi SUB 5.Relasi DIS

Digunakan untuk menyatakan dua token

yang berbeda satu sama lain. Contoh: air berbeda dengan api, dinyatakan dengan

word graph:

Gambar 5 Contoh relasi DIS 6.Relasi PAR

Digunakan untuk menyatakan sesuatu merupakan atribut dari sesuatu yang lain. Contoh: air dingin, dinyatakan dengan word graph:

(28)

3 7.Relasi ORD

Digunakan untuk menunjukkan dua hal yang saling berurutan dalam hal waktu dan tempat. Contoh: dari pagi hingga malam, dinyatakan dengan word graph:

pagi

ALI ORD ALI

malam Gambar 7 Contoh relasi ORD 8.Relasi SKO

Relasi SKO digunakan berdasarkan konsep tentang ketergantungan informasi. Contoh: besar gaji ditentukan dari pangkat, dinyatakan dengan word graph:

pangkat

ALI SKO ALI

gaji Gambar 8 Contoh relasi SKO Di samping 8 binary relationships, ada ontologi F (Focus) yang digunakan untuk menunjukkan fokus dari suatu graf (Nurdiati & Hoede 2009). Ontologi F untuk menunjukkan kata atau kalimat yang diterangkan dalam suatu pernyataan (inti). Contoh: gunung meletus, dinyatakan dengan word graph:

CAU ALI gunung meletus ALI F PAR

Gambar 9 Contoh relasi Focus

Kemudian empat frame relationships terdiri atas:

1. Focusing on a situation : FPAR

2. Negation on a situation : NEGPAR

3. Possibility on a situation : POSPAR

4. Necessityon a situation : NECPAR

Frame relationship merupakan verteks berlabel yang digunakan untuk mengelompokkan beberapa graf. Adakalanya suatu objek tidak cukup direpresentasikan dengan sebuah token, sehingga diperlukan sebuah frame untuk pengelompokan tersebut. Berikut penjelasan dari masing-masing frame relationship. Relasi FPAR menyatakan sesuatu memiliki properti dari sesuatu yang lain. Relasi NEGPAR menyatakan negasi dari isi frame. Relasi POSPAR menyatakan kemungkinan dari isi frame. Relasi NECPAR menyatakan keharusan terjadinya isi dari frame.

Gambar 10 Frame relationship Verba (kata kerja)

Kata kerja atau verba merupakan kelas kata yang menyatakan suatu tindakan, keberadaan, pengalaman, atau pengertian dinamis lainnya. Menurut Alwi et. al (2003) yang diacu dalam Ahmad Muslik (2009), ciri kata kerja dapat diketahui dengan mengamati perilaku semantis, perilaku sintaksis, dan bentuk morfologinya. Kata kerja secara umum mempunyai ciri sebagai berikut:

1.Kata kerja sebagai predikat atau inti predikat. Contoh : pencuri itu lari, adik

sedang belajar di kamar. Kata lari

merupakan predikat, sedangkan sedang belajar merupakan inti predikat.

2.Ada makna perbuatan (aksi), proses, atau keadaan yang bukan sifat atau kualitas. 3.Kata kerja yang bermakna keadaan tidak

dapat diberi prefiks ter yang artinya paling. Contoh: mati atau suka tidak dapat menjadi

termati atau tersuka.

4.Secara umum, kata kerja tidak dapat bersatu dengan kata-kata yang maknanya kesangatan seperti agak belajar, agak lari,

belanja sekali.

Kata Kerja dari segi bentuknya

Dari segi bentuk, kata kerja terbagi atas kata kerja dasar dan kata kerja turunan. Contoh kata kerja dasar: ada, bangun, cinta, naik, tamat, paham, rasa, yakin, dan sebagainya. Kata kerja turunan dibentuk dari transposisi, pengafiksan, pengulangan (reduplikasi), dan pemaduan dengan penjelasan sebagai berikut:

a.Transposisi

Transposisi merupakan suatu proses penurunan kata dari kategori sintaksis yang satu ke kategori sintaksis yang lain tanpa mengubah bentuknya (Alwi et al. 2003 dalam Muslik 2009). Contoh: telepon, cangkul, sikat.

b.Pengafiksan

(29)

4 c.Reduplikasi

Kata-kata yang mengalami proses ini disebut kata berulang, artinya kata kerja yang telah direduplikasi disebut juga kata kerja berulang. Contoh: lari-lari, makan-makan, tembak-menembak, menari-nari. d.Pemaduan

Pemaduan merupakan penggabungan dua kata dasar atau lebih sehingga menjadi beberapa kata yang memiliki satu makna. Contoh: jual beli, jatuh bangun, salah sangka.

METODE PENELITIAN

Pada penelitian ini akan ditambahkan modul pembentukan word graph untuk kata kerja. Tahapan yang dilakukan pada penelitian ini secara garis besar dapat dilihat pada Gambar 11.

Gambar 11 Tahapan penelitian

Studi Literatur

Pada tahap ini dilakukan pengumpulan materi-materi yang dapat digunakan sebagai bahan rujukan yang relevan dengan topik penelitian. Penelitian ini didasarkan pada

penelitian sebelumnya, yaitu tesis Ahmad Muslik (2009) “Analisis Pembentukan Word Graph Kata Kerja Menggunakan Metode

Knowledge Graph” serta skripsi Deni Romadoni (2009) “Pengembangan Sistem Pembentukan Word Graph Untuk Teks Berbahasa Indonesia”.

Pembentukan Pola Word Graph Kata Kerja Pembentukan pola word graph kata kerja harus sesuai dengan aturan-aturan pembentukan kata kerja dari hasil analisis Muslik (2009). Pada penelitian Muslik (2009) diperoleh 30 aturan dengan 10 daftar pola kata kerja berdasarkan afiks dan maknanya.

Penambahan Modul Pembentukan Word Graph Kata Kerja

1. Praposes

Pada tahap ini ditentukan apakah kata kerja yang dimasukkan bersifat tunggal, mengandung numerik/karakter atau tidak. Jika tidak maka proses akan dilanjutkan ke tahap berikutnya. Selain itu, tahap ini juga bertujuan untuk memeriksa nilai masukan, dimana masukan yang akan dapat diproses harus berupa karakter.

2. Stemming

Pada tahap ini kata kerja akan dipecah untuk mendapatkan afiks (imbuhan) dan kata dasar. Program stemming dibuat dalam bahasa pemrograman MATLAB akan menghasilkan kata dasar serta imbuhan yang dapat berupa prefiks (awalan), sufiks (akhiran), atau infiks (sisipan).

Stemming ini mengacu pada Kamus Besar Bahasa Indonesia (KBBI) yang disesuaikan. Pada KBBI asli terdapat 3 (tiga) field yaitu, ‘Kata’, ‘Sifat’, dan ‘Subkata’. Field ‘Kata’ berisi kata dasar, field ‘Sifat’ berisi sifat kata seperti v (verba), n (nomina), dan sebagainya.

Field ‘Subkata’ berisi kata turunan yang terbentuk dari turunan kata dasar yang mengandung imbuhan. Satu kata dasar dapat memiliki lebih dari satu subkata. Untuk penelitian ini, basis data KBBI dibuat dalam tabel Entry.

Penentuan Pola Hasil (Pengujian)

(30)

5 yang sesuai dengan pola tersebut. Di lain pihak,

jika hasil dari stemming berupa pola kata dasar dan imbuhan yang tidak ada dalam pola kata kerja menurut Ahmad Muslik (2009) dan gagal dalam proses pengenalan, maka akan ditampilkan peringatan bahwa masukan bukan merupakan kata kerja. Tahapan penambahan kamus word graph kata kerja secara detail dapat dilihat pada Lampiran 1.

Analisis Hasil

Pada tahap ini pola kata kerja yang telah terbentuk akan dianalisis, apakah sudah sesuai dengan penelitian Muslik (2009) atau belum. Skenario pengujian dilakukan dengan memasukkan beberapa kata kerja kemudian dihitung akurasinya. Penghitungan akurasi dilakukan dengan cara menghitung berapa banyak kata yang dikenali dari beberapa masukkan kata kerja dan sesuai dengan pola

word graph.

=∑

∑ × 100%

Dokumentasi dan Laporan

Pada tahap ini akan dibahas hasil perhitungan keakuratan dari pengujian dari setiap pola. Jika didapati hasil akurasi yang rendah maka akan dicari sumber permasalahannya. Di lain pihak jika masalah yang dihadapi tidak dapat diatasi, maka akan dimasukkan ke dalam saran untuk penelitian selanjutnya.

HASIL DAN PEMBAHASAN

Pemahaman Bidang Kajian dan Identifikasi Masalah

Pengkajian mengenai pembentukan kamus

word graph kata sifat dan sistem aplikasi BogorDelftConstruct didapat dari penelitian sebelumnya, tesis Muslik (2009) dan skripsi Romadoni (2009). Berdasarkan penelitian Muslik (2009) didapat 10 pola word graph yang dibentuk dari 30 aturan kata kerja. Sepuluh pola tersebut diberi nama sesuai dengan nama variabel dalam sistem. Pola pembentukan word graph dapat dilihat pada Tabel 1 dan lebih detail pada Lampiran 2.

Pengidentifikasian masalah dalam penelitian ini mencakup keseluruhan yang dijelaskan bab metode penelitian, antara lain pembatasan penelitian berdasarkan ruang lingkup, program

stemming, penggunaan KBBI dalam penelitian,

pembentukan pola word graph, pengujian pola

word graph, analisis hasil pengujian.

Tabel 1 Pola pembentukan word graph kata kerja

Pola Pembentuk Kata Kerja

Nama Variabel Pola Dalam

Sistem Kata Kerja Dasar (KKD)

Ber-KK Pola-vdasar

Meng-/mem-/me-Kata Kerja (KK)

Meng-/mem-/me-KK-kan Meng-/mem-/me-Kata Benda (KB)-kan Meng-/mem-/me-Kata Sifat (KS)-kan Meng-/mem-/me-KK-I Meng-/mem-/me-KS-i Meng-/mem-/me-KB-i Memper-KB

Memper-KS

Memper-KK-kan/i

Pola-mekani

Di-KKtransitif-(-i/-kan) Ter-KKtransitif(-i)

Di-KB-i Diper-KS

Pola-diter

Meng-/mem-/me-Kata

Ulang (KU) Pola-meku

Ber-KB

Ber-KS

Ber-KKan

Pola-beran

Ber-KB-kan Ber-KK-an

Meng-/mem-/me-KS

Meng-/mem-/me-KB

Meng-/mem-/me-Kata Dasar Terikat

Ke-KK/KB/KS-an

Pola-bermeke

Ter-KKintransitif(-i) Pola-teri Kata Kerja Dasar Ulang Pola-kkdu KK-meng-/mem-/me-KK Pola-fixku

[image:30.595.316.498.146.719.2]
(31)

6 Praproses

Praproses merupakan tahap awal pengembangan Kamus Word Graph Kata Kerja. Praproses dilakukan untuk membatasi nilai masukan pada sistem. Masukan harus berupa kata tunggal atau tidak mengandung spasi (‘ ’). Fungsi untuk memeriksa hal ini didokumentasikan

Gambar

Gambar 10 Frame relationship
Tabel 1 Pola pembentukan word graph kata kerja
Tabel 1 Pola pembentukan word graph kata kerja
Tabel 2 Akurasi hasil pengujian
+6

Referensi

Dokumen terkait

Spongebob Squarepants bukanlah serial kartun yang khusus bertemakan imajinasi bagi anak-anak, namun serial kartun ini dapat memberikan ajaran mengenai persahabatan yang

Manakah dari variabel bebas Dividend Per Share dan Earning Per Share yang memiliki pengaruh paling dominan terhadap harga saham pada industri perbankan yang teraftar di BEI

Lampiran 2 Diagram alir pembuatan modul word graph kata benda pada sistem KG_EDITOR.. Lampiran 3 Class diagram modul word graph kata benda 1 Class diagram

Hal ini terjadi karena sistem modul word graph kata benda belum dapat menampilkan word graph dari sejumlah kata yang tidak terdapat di dalam KBBI dan merupakan

Pada tahap ini, hasil dari stemming yang berupa kata dasar dan imbuhan (afiks) akan dicocokkan dengan pola word graph frasa kata yang telah disimpan.. Jika

Dari penelitian ini diperoleh dua puluh pola pembentukan word graph kata benda yang terdiri atas delapan belas pola pembentukan word graph berdasarkan afiksasi dan

Pada penambahan modul untuk pola pembentukan word graph pada frasa preposisional, peneliti membuat tabel baru dengan nama “pola_frasa_prep” pada database “wg”

Dalam hal ini perlu adanya objek karena bentuk menduduki juga transitif sehingga diperlukan token tambahan sebagai objek (meja). Contoh lain adalah kata mendatangi. Word graph