REPRESENTASI WORD GRAPH MENGGUNAKAN XML
UNTUK KATA SIFAT DALAM BAHASA INDONESIA
RIA ASTRIRATMA
DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
REPRESENTASI WORD GRAPH MENGGUNAKAN XML
UNTUK KATA SIFAT DALAM BAHASA INDONESIA
RIA ASTRIRATMA
DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2012
Skripsi
sebagai salah satu syarat untuk memperoleh gelar
Sarjana Komputer pada
RIA ASTRIRATMA. Representation of word graph using XML for adjective in Indonesian language. Supervised by SRI NURDIATI and AHMAD RIDHA.
Indonesia Nama : Ria Astriratma
NIM : G64070065
Menyetujui:
Pembimbing 1, Pembimbing 2,
Dr Ir Sri Nurdiati MSc Ahmad Ridha SKom MS
NIP. 19601126 198601 2 001 NIP. 19800507 200501 1 001
Mengetahui:
Ketua Departemen Ilmu Komputer,
Dr Ir Agus Buono MSi MKom NIP. 19660702 199302 1 001
Puji dan syukur penulis panjatkan kepada Allah subhanahu wa ta’ala atas segala nikmat, karunia dan pertolongan-Nya sehingga karya ilmiah ini berhasil diselesaikan. Selawat serta salam penulis sampaikan kepada Nabi Muhammad shalallaahu ‘alayhi wa sallam atas teladan beliau sebagai motivasi penulis. Penyusunan karya ilmiah ini juga tidak lepas dari bantuan berbagai pihak. Penulis mengucapkan terima kasih yang sebesar-besarnya kepada:
1 Ibu dan Bapak untuk doa, pengorbanan, nasihat, cinta, kasih sayang, dan kesabaran untuk menanti kelulusan penulis. Terima kasih untuk kakak-kakak tercinta, Mbak Ratih, Mas Arif, dan Mbak Retno atas dukungan, ancaman, dan kasih sayang yang diberikan. Thalita Ramaniya PS dan almarhumah Khansa Azkadina PS, keponakan yang selalu menjadi pacuan semangat bagi penulis;
2 Ibu Dr. Ir. Sri Nurdiati, M.Sc. selaku dosen pembimbing I (terima kasih atas semua ilmu, waktu, kesabaran, nasihat, dan bimbingan yang diberikan selama penulisan karya ilmiah ini); 3 Bapak Ahmad Ridha, S.Kom, MS. selaku dosen pembimbing II (terima kasih atas semua ilmu,
waktu, kesabaran, dan bimbingan yang diberikan selama penulisan karya ilmiah ini);
4 Bapak Sony Hartono Wijaya, S.Kom, M.Kom selaku dosen penguji (terima kasih atas semua kritik dan saran yang diberikan kepada penulis demi perbaikan karya ilmiah ini);
5 Semua staf pengajar Departemen Ilmu Komputer (terima kasih atas semua ilmu yang telah diberikan) dan semua staf karyawan (terima kasih atas bantuan dan dukungan yang diberikan); 6 Mbak Sulistya Anggraeni, sebagai sahabat yang selalu memberikan canda tawa dan kehangatan
serta menjadi inspirasi bagi penulis;
7 Syahrizal Andhika atas perhatian, bantuan, dan dukungan yang diberikan kepada penulis; 8 Penghuni Kosan Pondok Adinda atas perhatian dan dukungan yang diberikan kepada penulis; 9 Sahabat yang selalu memberikan semangat, motivasi, dan dukungan selama penulis menjalani
perkuliahan di Departemen Ilmu Komputer: Kristina dan Inne atas persahabatan yang begitu indah;
10 Teman-teman satu bimbingan: Nissa, Rani, Dean, Topa, dan Made atas bantuan dan motivasinya;
11 Teman-teman ilkomerz 44: Fani „Mate‟, Valerina, Isna, Windy, Chandra, Arizal, Fadly, dan teman-teman lainnya yang tak bisa disebutkan satu per satu atas semangat dan kebersamaannya;
12 Semua pihak yang tidak dapat penulis sebutkan satu per satu yang telah membantu penulis dalam menyelesaikan penelitian ini.
Penulis menyadari bahwa dalam tulisan ini masih terdapat kekurangan dan jauh dari kesempurnaan, namun penulis berharap semoga tulisan ini dapat bermanfaat.
Bogor, Februari 2012
Penulis yang dilahirkan di Jakarta pada tanggal 24 November 1989 merupakan anak ketiga dari tiga bersaudara dengan ayah bernama Slamet dan ibu bernama Suratmi.
Penulis merupakan lulusan SMA Negeri 38 Jakarta tahun ajaran 2004 – 2007 kemudian melanjutkan pendidikan di Institut Pertanian Bogor melalui jalur Undangan Seleksi Masuk IPB. Penulis diterima di Departemen Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam, IPB.
v
Halaman
DAFTAR GAMBAR ... vi
DAFTAR LAMPIRAN ... vi
PENDAHULUAN ... 1
Latar Belakang ... 1
Tujuan Penelitian ... 1
Ruang Lingkup ... 1
Manfaat ... 1
TINJAUAN PUSTAKA ... 2
Adjektiva (Kata Sifat) ... 2
Natural Language... 2
Knowledge Graph... 2
Concept ... 2
Word Graph ... 2
Aspek Ontologi ... 3
Ekspresi Semantis dengan KG ... 3
XML ... 3
Java ... 3
DOM (Document Object Model) ... 4
METODE PENELITIAN ... 4
Pemahaman Bidang Kajian dan Identifikasi Masalah ... 4
Perancangan Database ... 5
Perancangan XML ... 5
Implementasi Java ... 5
Analisis Hasil dan Pengujian... 5
Lingkungan Implementasi ... 5
HASIL DAN PEMBAHASAN ... 5
Hasil Pemahaman Bidang Kajian dan Identifikasi Masalah ... 5
Praproses ... 6
Perancangan Database ... 6
Implementasi Java ... 9
Analisis Hasil dan Pengujian... 10
Analisis Kekurangan dan Kelebihan Representasi Word Graph Kata Sifat ... 13
KESIMPULAN DAN SARAN ... 13
Kesimpulan ... 13
Saran ... 13
DAFTAR PUSTAKA ... 13
vi
Halaman
1 Contoh tree pada DOM XML. ... 4
2 Metode penelitian... 4
3 Pola aturan word graph kata sifat ber-Kata Bilangan. ... 7
4 Pola word graph bersatu. ... 8
5 Dokumen XML pola ber-Kata Bilangan. ... 8
6 Potongan kode program berkas XML pada Java. ... 9
7 Tampilan input dialog. ... 9
8 Tampilan kata masukan bersatu... 9
9 Kata masukan bersatu padu. ... 9
10 Pesan peringatan kata masukan lebih dari satu kata. ... 9
11 Tampilan pola word graph kata sifat... 10
DAFTAR LAMPIRAN
Halaman 1 Daftar kata sifat berimbuhan pada database ... 162 Diagram alir word graph kata sifat pada implementasi Java ... 23
3 Tampilan pesan peringatan ... 25
4 Dokumen XML Pola_1 ... 26
5 Dokumen XML Pola_2 ... 27
6 Dokumen XML Pola_3 ... 28
7 Dokumen XML Pola_4 ... 29
8 Dokumen XML Pola_5 ... 29
9 Dokumen XML Pola_6 ... 30
10 Dokumen XML Pola_7 ... 30
11 Dokumen XML Pola_8 ... 31
12 Dokumen XML Pola_9 ... 31
13 Dokumen XML Pola_10 ... 32
14 Dokumen XML Pola_11 ... 32
15 Dokumen XML Pola_12 ... 33
16 Dokumen XML Pola_13 ... 33
17 Dokumen XML Pola_14 ... 34
18 Dokumen XML Pola_15 ... 34
19 Dokumen XML Pola_16 ... 35
20 Dokumen XML Pola_17 ... 35
21 Dokumen XML Pola_18a ... 36
22 Dokumen XML Pola_18b ... 36
23 Dokumen XML Pola_19 ... 37
24 Dokumen XML Pola_20 ... 37
25 Dokumen XSD ... 38
Bahasa buatan merupakan salah satu bahasa komunikasi yang dapat dilakukan oleh manusia untuk berinteraksi dengan komputer. Bahasa buatan memerlukan perangkat lunak, yang disebut kompilator, yang berfungsi mengonversi bahasa buatan menjadi bahasa mesin. Akan tetapi, tidak semua orang dapat dengan mudah menggunakannya karena perlu waktu dan usaha untuk mempelajari bahasa tersebut. Oleh karena itu, diperlukan penelitian untuk mewujudkan bahasa alami sebagai bahasa yang dapat dikenali komputer yang kemudian dikenal dengan bidang ilmu natural language processing (NLP).
Adanya ambiguitas dalam bahasa alami menjadi tantangan terbesar bagi NLP. Hal ini membuat komputer tidak mampu memberikan keluaran yang diharapkan oleh pengguna secara tepat sehingga memungkinkan terjadinya subjektivitas pemahaman terhadap bahasa alami. Teks merupakan salah satu jenis bahasa alami berupa tulisan. Teks lebih mudah dipahami apabila divisualisasikan dalam bentuk gambar. Salah satu metode yang digunakan untuk merepresentasikan pengetahuan dalam teks ialah memunculkan graf kata dan hubungannya dengan kata lain. Metode ini dikenal dengan metode Knowledge Graph (KG). Menurut Zhang (2002), metode KG merupakan salah satu jenis dari representasi NLP, yang mengarahkan pada cara baru dalam menjelaskan dan memodelkan NLP dan juga sebagai langkah besar ke depan untuk pemahaman terhadap semantis kata.
Implementasi metode KG dalam analisis semantis diharapkan dapat membantu melakukan abstraksi teks secara otomatis. Diawali dengan menganalisis makna kata untuk satu jenis kata kemudian dikembangkan untuk jenis kata yang lain. Modul kamus word graph jenis kata sifat telah dikembangkan oleh Annissa Zahara pada tahun 2010 dengan menggunakan bahasa pemrograman MATLAB. Modul tersebut mengacu pada pola pembentukan kata sifat yang telah dilakukan pada penelitian sebelumnya oleh Rahmat (2009) yang menghasilkan pola word graph untuk jenis kata sifat. Namun, pengembangan modul yang dilakukan Zahara (2010) masih menggunakan perangkat lunak MATLAB. Aplikasi ini tidak dapat dinikmati oleh semua pengguna secara mudah karena
Dokumen yang merepresentasikan konsep KG dalam bentuk eXtensible Markup Language (XML) dibuat pada penelitian ini. Hal ini bertujuan untuk mempertukarkan data dan bukan didesain untuk menampilkan data yang selanjutnya dapat dimanfaatkan dalam jangka panjang (Sidik 2001). Bahasa pemrograman yang digunakan untuk menampilkan dokumen XML adalah Java, karena Java memiliki beberapa keunggulan dibandingkan bahasa pemrograman lainnya, di antaranya sederhana dan berorientasi objek. Hal ini memungkinkan program untuk dibuat secara modular dan digunakan kembali. Dokumen berformat XML dapat diimplementasikan ke dalam Java dengan menggunakan DOM (Document Object Model). Oleh karena itu, dibuat representasi word graph menggunakan XML untuk jenis kata sifat dalam bahasa Indonesia.
Tujuan Penelitian
Penelitian ini bertujuan untuk merepresentasikan konsep knowledge graph menggunakan XML berdasarkan aturan pembentukan word graph kata sifat dalam bahasa Indonesia.
Ruang Lingkup
Ruang lingkup penelitian ini meliputi: 1 Pola word graph kata sifat berdasarkan
hasil analisis yang terdapat pada tesis Rahmat (2009) dan skripsi Zahara (2010). 2 Daftar kata sifat dalam bahasa Indonesia
dalam bentuk kata tunggal, bukan paduan kata sifat dengan kata lain.
3 Dokumen yang dibentuk berformat XML.
Manfaat
Penelitian ini memiliki manfaat jangka pendek dan manfaat jangka panjang. Manfaat jangka pendek dari penelitian ini ialah dapat dibuat representasi word graph menggunakan XML untuk jenis kata sifat bentuk tunggal dalam bahasa Indonesia berdasarkan konsep KG.
Adjektiva (Kata Sifat)
Menurut Alwi et al. (2003), adjektiva disebut juga kata sifat atau kata keadaan yang memberikan keterangan yang lebih khusus dan dinyatakan oleh nomina dalam kalimat. Adjektiva dari segi bentuknya terbagi atas adjektiva dasar (monomorfemis) dan adjektiva turunan (polimorfemis). Contoh adjektiva monofemis, yaitu cantik, jelek, baik, buruk, jauh, dan dekat. Adjektiva turunan dibentuk dengan tiga cara, yaitu pengafiksan, pengulangan, dan pemaduan dengan kata lain. a Pengafiksan
Adjektiva ini menggunakan serapan adjektiva berafiks dari bahasa lain, seperti bahasa Arab, Belanda, dan Inggris dengan afiks serapan: -i, -iah, -wi, -wiah. Hasil pengafiksan tingkat ekuatif dengan prefiks atau awalan se- dan tingkat superlatif dengan prefiks ter-. Selain itu, beberapa nomina digunakan sebagai adjektiva dalam kalimat. b Pengulangan
Adjektiva ini berfungsi sebagai predikat dan adverbial. Adjektiva yang berfungsi predikat memiliki arti kejamakan, keanekaan, atau keintensifan. Perulangan dapat terjadi melalui perulangan penuh, perulangan sebagian, dan perulangan salin suara.
c Pemaduan dengan kata lain
Adjektiva dipadukan dengan nomina akan menghasilkan arti baru. Pemaduan adjektiva dengan adjektiva memberi arti menguatkan unsur pertama (Alwi et al. 2003).
Natural Language
Secara umum, natural language atau bahasa alami adalah metode yang paling banyak digunakan untuk mengekspresikan pikiran manusia dan pertukaran informasi. Terdapat sebuah pemisah antara bahasa formal atau bahasa buatan dan bahasa alami. Komunikasi antara komputer dan manusia hanya dimungkinkan ketika banyak penelitian yang bertujuan untuk menjembatani pemisah di antara keduanya (Zhang 2002).
Secara alami, menggambarkan dan memodelkan bahasa alami adalah dasar untuk perkembangan dari proses menganalisis dan memaknai bahasa alami, dan menentukan arah proses penelitian dari bahasa alami. Ada dua faktor yang diperhatikan dalam menganalisis sebuah kalimat, yaitu sintaksis dan semantis.
sintaksis melakukan analisis berdasarkan bentuk dari sebuah kalimat, sedangkan semantis menganalisis bagaimana mengartikan suatu kalimat.
Knowledge Graph
Metode KG adalah cara pandang baru yang digunakan untuk menggambarkan bahasa alami. Aspek ontologi menjadi perbedaan yang mendasar antara metode KG dengan metode representasi lain. KG memiliki kemampuan dalam menyatakan aspek semantis dengan lebih mendalam, menggunakan jenis relasi yang terbatas dan digunakan untuk meniru pemahaman manusia. Pada prinsipnya, komposisi dari KG mencakup concept (token dan type) dan relationships (binary dan multivariative relation) (Zhang 2002).
Concept
Representasi pemikiran dapat dimodelkan dengan KG yang disebut dengan mind graph. Concept merupakan komponen dari mind graph yang menerangkan persepsi mengenai sesuatu (Zhang 2002).
Token adalah sebuah node dalam KG yang disimbolkan dengan persegi “”. Token menyatakan sesuatu dalam dunia nyata atau sebuah konsep dari dalam persepsi manusia (Zhang 2002). Token bersifat subjektif, karena merupakan konsep yang dipahami oleh bahasa manusia menurut persepsi masing-masing. Contoh sebuah token menurut Rusiyamti (2008), misalkan seseorang
menemukan kata “apel” orang tersebut dapat
menghubungkan hal ini dengan informasi bentuk, warna, rasa, dan sebagainya. Demikian juga dengan orang lain yang menghubungkan dengan hal yang berbeda.
Type adalah suatu konsep yang masih bersifat umum. Type bersifat objektif karena merupakan hasil kesepakatan bersama (Zhang 2002). Contoh type misalnya buah, binatang, dan sebagainya.
Word Graph
(Hoede dan Nurdiati 2008).
Aspek Ontologi
Ontologi merupakan gambaran dari beberapa konsep dan relasi antar konsep yang bertujuan mendefinisikan ide-ide yang merepresentasikan konsep, relasi dan logika (Rusiyamti 2008). Ontologi word graph sampai saat ini direpresentasikan dengan sebuah node, delapan binary relationships, sebuah ontologi F, dan empat frame relationships (Hoede dan Nurdiati 2008).
Ontologi F digunakan untuk mewujudkan fokus dari suatu graf. Ontologi F juga digunakan untuk menunjukkan kata atau kalimat yang diterangkan dalam suatu pernyataan (inti). Berikut adalah gambaran dari delapan types relationship (Zhang 2002): 1 ALI (alikeness).
2 CAU (causality). 3 EQU (equality) . 4 SUB (subset). 5 DIS (dissparatness). 6 ORD (ordering). 7 PAR (attribute).
8 SKO (informational dependency).
Ekspresi Semantis dengan KG
Dibutuhkan kemampuan untuk menyatakan makna kata atau kalimat dalam metode KG untuk membangun model pemahaman bahasa alami, karena untuk dapat memahami makna kalimat harus lebih dahulu dapat memahami makna setiap kata. Kemudian, makna setiap kata disusun menjadi makna suatu kalimat secara keseluruhan (Zhang 2002). Pemaknaan setiap kata menjadi dasar pembentukan graf kata (word graph). Pemaknaan kata dinyatakan secara terhubung antar konsep. Makna kata dalam metode KG membangun struktur arti sehingga dapat mengatasi ambiguitas.
XML
XML merupakan bahasa markup yang direkomendasikan oleh World Wide Web Consortium (W3C). W3C merupakan sebuah organisasi yang mengatur standardisasi berbagai jenis bahasa dan perangkat lunak yang mendukung teknologi internet. XML direkomendasikan oleh W3C pada tahun 1998. XML sendiri merupakan turunan dari SGML (Standard Generalized Markup Language), yang juga merupakan bahasa yang extensible, namun sangat kompleks.
data yang memberikan kemudahan dalam publikasi dan pertukaran data (Benz 2003). Kemudahan tersebut terdapat pada sintaks sederhana yang digunakan XML, tidak seperti pada HTML. XML diharapkan dapat memenuhi kebutuhan manusia dalam pencarian informasi dan memenuhi kebutuhan komputer dalam pengolahan data (Dykes 2005). XML dapat memisahkan secara tegas antara kandungan informasi dan struktur informasi yang dimiliki.
Kelebihan XML di antaranya adalah penggunaan tag yang berfungsi sebagai user-defined yang digunakan untuk mendeskripsikan arti dari data dan tidak mendefinisikan bagaimana data akan terlihat. XML mampu memisahkan antara bagian yang berupa data dengan bagian yang bertugas untuk menampilkan data. Selain itu, XML tidak terbatas digunakan pada satu macam aplikasi saja. Sebuah dokumen XML dapat dirancang untuk banyak aplikasi berbeda tergantung dari informasi yang akan ditampilkan.
Java
Java adalah sebuah bahasa pemrograman object oriented dengan unsur-unsur seperti bahasa C++ dan bahasa-bahasa lainnya yang memiliki libraries yang cocok untuk lingkungan internet (Antonius 2004). Java dapat melakukan banyak hal dalam pemrograman, seperti membuat animasi halaman web dan aplikasi interaktif. Java juga dapat digunakan untuk handphone, internet, dan lain-lain. Berikut ini merupakan karakteristik yang dimiliki Java (Hermawan 2004), yaitu:
1 Sederhana
Bahasa pemrograman Java menggunakan sintaks mirip dengan bahasa C++, namun sintaks pada Java telah banyak diperbaiki. 2 Berorientasi Objek
Java merupakan bahasa pemrograman berorientasi objek yang memungkinkan program untuk dibuat secara modular dan digunakan kembali.
3 Terdistribusi
Java dibuat untuk memudahkan distribusi aplikasi dengan adanya networking libraries yang terintegrasi dalam Java.
4 Robust
Java memiliki beberapa mekanisme keamanan untuk menjaga agar aplikasi tidak digunakan untuk merusak sistem komputer yang menjalankan aplikasi tersebut.
6 Dynamic
Java didesain untuk dapat dijalankan pada lingkungan yang dinamis. Perubahan suatu kelas dengan menambahkan metode dapat dilakukan tanpa mengganggu program yang menggunakan kelas tersebut.
7 Portable
Source code maupun program Java dapat dengan mudah dibawa ke berbagai platform berbeda tanpa harus dikompilasi ulang.
DOM (Document Object Model)
Document Object Model (DOM) adalah rekomendasi dari W3C untuk melakukan proses terhadap dokumen terstruktur seperti XML dan HTML. DOM didefinisikan sebagai sebuah spesifikasi Application Programming Interface (API) yang bebas bahasa dan platform (Harold 2003). DOM mendefinisikan struktur logika dokumen serta cara untuk melakukan manipulasi dan akses terhadap dokumen tersebut.
Model standar untuk XML dokumen dinamakan DOM XML. DOM XML juga merupakan sebuah antarmuka pemrograman standar untuk XML, serta sebuah standar W3C. Dengan kata lain, DOM XML merupakan standar untuk mendapatkan, mengubah, menambah, atau menghapus elemen XML. XML dokumen dapat direpresentasikan sebagai sebuah tree. Tree terdiri atas beberapa node. Contoh tree pada DOM XML terlihat pada Gambar 1.
Tahapan merepresentasikan word graph menggunakan XML untuk kata sifat dalam bahasa Indonesia pada penelitian ini diilustrasikan pada Gambar 2.
Pemahaman Bidang Kajian dan Identifikasi Masalah
Penelitian diawali dengan mengumpulkan bahan-bahan pustaka yang relevan dengan topik kajian penelitian. Analisis pola pembentukan word graph kata sifat didasarkan pada penelitian sebelumnya, di antaranya tesis Usep Rahmat (2009) yang
berjudul “Analisis Pembentukan Word Graph Kata Sifat Menggunakan Metode Knowledge Graph“ dan skripsi Annissa Zahara (2010)
yang berjudul “Pengembangan Modul untuk
Kamus Word Graph Kata Sifat pada Sistem
Aplikasi BogorDelfConstruct“. Hasil analisis pola pembentukan word graph kata sifat tersebut kemudian akan digunakan untuk membuat dokumen berformat XML. Dokumen tersebut dapat merepresentasikan konsep KG pada pembentukan pola word graph untuk kata sifat dalam bahasa Indonesia.
Praproses
Tahapan praproses dilakukan untuk membatasi kata masukan yang digunakan pada penelitian. Pada tahapan ini, kata yang Root element:
<graph>
Element: <components>
Element: <relationships>
Element: <token>
Element: <relationid>
Element: <id>
Text: 1
Text: 1
Parent Child
Sibling
Perancangan XML
Analisis Pola Pembentukan Word Graph
Kata Sifat Mulai
Dokumentasi dan Laporan Analisis Hasil dan Pengujian
Implementasi Java
Selesai
Perancangan Database
Praproses
Gambar 1 Contoh tree pada DOM XML.
masukan dalam database yang digunakan. Jika kata yang dimasukkan bersifat tunggal dan terdapat di dalam database, kata tersebut akan diproses ke tahap selanjutnya. Selain itu, tahap praproses juga digunakan untuk memeriksa nilai kata masukan yakni kata masukan yang akan diproses hanya kata masukan yang berupa karakter.
Perancangan Database
Tahap perancangan database dilakukan untuk membatasi kata masukan dari kata sifat yang digunakan pada penelitian. Tahap ini diperlukan pada kata berimbuhan untuk memisahkan kata dasar dengan imbuhan yang dimiliki pada kata masukan guna memperoleh id pola pada aturan word graph kata sifat. Tahap ini juga dibutuhkan untuk mendapatkan kata sifat dasar yang diambil dari KBBI.
Perancangan XML
a Penamaan tag
Pada penggunaan XML, dibutuhkan penamaan tag yang dapat mendeskripsikan data yang digunakan. Hal ini dilakukan karena tag XML tidak didefiinisikan pada XML. Pada tahap ini, digunakan penamaan tag yang disesuaikan dengan konsep knowledge graph. b Pembentukan XML
Pembentukan XML dilakukan untuk mendapatkan format XML yang sesuai dengan konsep knowledge graph, yaitu berisi informasi mengenai komponen pembentuk pola word graph kata sifat. Pola word graph yang digunakan dari penelitian sebelumnya dianalisis komponennya terlebih dahulu kemudian dibentuk dokumen XML.
Implementasi Java
Bahasa pemrograman Java digunakan untuk menampilkan berkas XML. XML yang diimplementasikan dalam Java memberikan informasi berupa kata dasar dan id pola dari kata masuka. Id pola yang sesuai dengan kata masukan selanjutnya akan menentukan dokumen XML yang akan ditampilkan.
Analisis Hasil dan Pengujian
Proses analisis hasil dilakukan setelah tahap implementasi Java berhasil dikerjakan. Analisis hasil ini diperlukan untuk mengetahui kesesuaian berkas XML yang ditampilkan berdasarkan kata masukan yang diberikan. Pengujian dilakukan secara dua tahap. Tahap
Definition (XSD). Hal ini dilakukan untuk memberikan informasi mengenai kebutuhan bentuk dokumen XML yang digunakan. Pengujian kedua dilakukan menggunakan viewer pada sistem yang sedang dibangun Dean Apriana Ramadhan untuk mengetahui bentuk pola word graph kata sifat berdasarkan XML yang telah dibuat. Tingkat akurasi pada pengujian tahap kedua dihasilkan dari perhitungan sebagai berikut:
akurasi=∑ kata yang benar
∑ kata yang diujix 100%
Lingkungan Implementasi
Lingkungan implementasi yang digunakan adalah:
1 Perangkat lunak:
Windows 7 Professional sebagai sistem operasi.
NetBeans 6.9.1 sebagai IDE (Integrated Development Environment).
MySQL 5.0.21 sebagai tempat penyimpanan database.
Java 6.0.180.7 sebagai bahasa pemrograman.
XAMPP Version 2.3 sebagai server control panel.
Notepad++ sebagai editor.
Mozilla Firefox sebagai web browser. 2 Perangkat keras:
Processor Intel® Core™ i3 @2.13 GHz. RAM 2 GB.
Keyboard. Layar monitor.
HASIL DAN PEMBAHASAN
Hasil Pemahaman Bidang Kajian dan Identifikasi Masalah
sifat berdasarkan konsep KG dilakukan pada penelitian Zahara (2010), yaitu pola Kata Sifat Dasar. Identifikasi masalah dalam penelitian ini mencakup pembatasan penelitian berdasarkan ruang lingkup, penggunaan KBBI dalam penelitian, perancangan database, perancangan XML, implementasi Java, analisis hasil, dan pengujian.
Praproses
Praproses merupakan tahap awal representasi word graph menggunakan XML untuk kata sifat dalam bahasa Indonesia. Praproses dilakukan untuk membatasi kata masukan. Distribusi daftar kata sifat dapat dilihat pada Tabel 1.
Tabel 1 Distribusi daftar kata sifat
Aturan Pola Pola Kata Sifat
Jumlah Kata
Pola se-Kata Sifat Pola_1 18 Pola ter-Kata Sifat
dengan kualitas paling tinggi
Pola_2 25
Pola ter-Kata Sifat dengan kualitas paling rendah
Pola_3 15
Pola ber-Kata Bilangan
Pola_4 9 Pola me-Kata
Benda
Pola_5 12 Pola pe-Kata Sifat Pola_6 15 Pola Kata
Benda-em-
Pola_7 14 Pola Kata Benda-an Pola_8 11 Pola Kata Benda-al Pola_9 9 Pola Kata Benda-il Pola_10 5 Pola Kata
Benda-iah
Pola_11 10 Pola Kata Benda-i Pola_12 19 Pola Kata Benda-if Pola_13 24 Pola Kata Benda-ik Pola_14 12 Pola Kata Benda-is Pola_15 25 Pola Kata
Benda-istis
Pola_16 16 Pola ke-Kata
Sifat-an
Pola_17 14 Pola me-Kata Sifat
–kan
Pola_18a 9 Pola me-Kata
Kerja-kan
Pola_18b 4 Pola me-Kata
Benda-kan
Pola_19 6 Kata Sifat Dasar Pola_20 5281
Total 5353
dari penelitian sebelumnya milik Usep Rahmat (2009), yaitu daftar kata sifat yang diambil dari majalah Trubus nomor 474 (Mei 2009/XL), Trubus nomor 462 (Mei 2008/XXXIX), dan Trubus nomor 457 (Desember 2007/XXXVIII) dan daftar kata sifat dasar yang digunakan diambil dari Kamus Besar Bahasa Indonesia (KBBI) edisi ketiga yang juga digunakan oleh penelitian sebelumnya yaitu Annissa Zahara (2010).
Daftar kata tersebut sebelumnya disesuaikan kembali dengan daftar kata yang terdapat pada KBBI secara manual. Hal ini diperlukan karena terdapat jenis kata dasar yang diteliti Rahmat (2009) yang tidak sesuai dengan KBBI edisi ketiga dan agar tidak terjadi lagi kesalahan kata masukan pada data. Oleh karena itu, dilakukan perbaikan jenis kata dasar sesuai KBBI tersebut.
Perancangan Database
Hasil perancangan database ialah dibuat sebuah database yang diberi nama „kamus‟, terdiri atas tiga tabel, yaitu tabel „kata_sifat‟,
tabel „kata_sifat_dasar‟, dan tabel „pola_ks‟. Tabel „kata_sifat‟ berisi tujuh kolom, yaitu
„kata_masukan‟ yang berisi 272 daftar kata sifat berimbuhan, kolom „kata_dasar‟ yang berisi daftar kata dasar dari kata masukan, kolom „jenis_kata_dasar‟ yang berisi informasi jenis kata dasar, kolom „awalan‟ berisi imbuhan awal yang terdapat pada kata masukan, kolom „sisipan‟ berisi sisipan yang terdapat pada kata masukan, kolom „akhiran‟ berisi imbuhan akhir yang terdapat pada kata masukan, dan kolom „quality‟ berisi informasi yang diperlukan untuk membedakan pola ter-Kata Sifat dengan makna paling tinggi dan ter-Kata Sifat dengan makna paling rendah. Daftar kata sifat berimbuhan yang ada dalam database dapat dilihat pada Lampiran 1. Tabel
„kata_sifat_dasar„ juga berisi tujuh kolom yang sama. Tabel ini digunakan untuk memroses kata masukan yang berupa kata sifat dasar.
Tabel pola_ks‟ memiliki enam kolom, yaitu kolom „id_pola‟ yang berisi nomor id untuk setiap pola, kolom „jenis_kata_dasar‟ yang berisi informasi jenis kata dasar, kolom
„quality‟ berisi informasi yang diperlukan
Perancangan XML
a Penamaan tag
Hasil yang didapatkan dari proses penamaan tag ialah daftar tag yang diperlukan dalam pembentukan pola word graph secara umum. Penamaan tag disesuaikan dengan konsep KG agar dapat mendeskripsikan data sesuai tujuan penggunaan XML. Berikut ini daftar tag yang diperlukan pada pembentukan XML untuk pola word graph jenis kata sifat: <graph> </graph>, tag ini mewakili
keseluruhan dokumen pola. <graph> merupakan root element dari dokumen karena setiap dokumen XML harus memiliki sebuah elemen yang menampung seluruh elemen lain dan teks yang ada. <components> </components>, tag ini
mewakili keseluruhan komponen-komponen pembentuk pola.
<relationships> </relationships>,
tag ini mewakili keseluruhan arah yang menghubungkan suatu komponen dengan komponen lainnya sesuai pembentukan pola.
<id> </id>, tag ini menunjukkan id suatu tag.
<value> </value>, tag ini menunjukkan nilai dari suatu tag.
<replace> </replace>, tag ini menunjukkan suatu kebutuhan nilai yang dapat diubah atau tidak berdasarkan kata masukan dan pola pembentuk pola word graph.
<from> </from>, tag ini menunjukkan arah panah masuk.
<to> </to>, tag ini menunjukkan arah
panah keluar.
<token> </token>, tag ini menunjukkan
suatu token.
<focus> </focus>, tag ini menunjukkan suatu fokus.
<text> </text>, tag ini menunjukkan suatu kebutuhan yang berupa teks.
<relation> </relation>, tag ini menunjukkan tipe relasi yang digunakan. <frame> </frame>, tag ini menunjukkan
suatu frame.
<tokenid> </tokenid>, tag ini menunjukkan suatu token sesuai id yg digunakan.
digunakan.
<textid> </textid>, tag ini
menunjukkan suatu teks sesuai id yg digunakan.
<frameid> </frameid>, tag ini
menunjukkan suatu frame sesuai id yg digunakan.
<relationid> </relationid>, tag ini menunjukkan suatu tipe relasi sesuai id yg digunakan.
b Pembentukan XML
Pembentukan XML disesuaikan dengan konsep KG. Selain itu, format yang dibuat dari hasil penelitian ini diharapkan dapat digunakan kembali untuk penelitian selanjutnya, yaitu ketika kata masukan bertambah maka pada dokumen XML hanya akan ditambahkan komponen pembentuk pola pada tag <components> dan relasinya ditambahkan pada tag <relationships>.
Dihasilkan 21 dokumen berformat XML pada penelitian ini. Salah satu pola aturan word graph kata sifat yang sudah diteliti Rahmat (2009) ialah aturan ber-Kata Bilangan seperti terlihat pada Gambar 3.
Gambar 3 Pola aturan word graph kata sifat ber-Kata Bilangan.
Contoh kalimat yang diberikan Rahmat
(2009) ialah: “Para petani kita bersatu
membasmi hama”. Kata bersatu pada kalimat
tersebut memiliki makna menjadi satu atau berkumpul bergabung menjadi satu atau membentuk himpunan menjadi satu. Word graph kata sifat bersatu terdiri atas dua token. Token pertama menyatakan petani berkumpul atau bergabung yang mengakibatkan token kedua yang menyatakan satu. Gambar pola word graph untuk contoh kata masukan bersatu terlihat pada Gambar 4.
Ber-KBil CAU
EQU
ALI ALI
KBil
Gambar 4 Pola word graph bersatu. Analisis kebutuhan komponen yang terdapat pada masing-masing pola word graph kata sifat dilakukan pada pembentukan XML. Dari contoh di atas, analisis yang dilakukan ialah menentukan terlebih dahulu komponen-komponen yang terdapat pada masing-masing pola word graph tersebut. Pada penelitian ini, jenis tag token dan fokus dibedakan. Hal ini dilakukan agar dapat memudahkan pengguna untuk memperoleh informasi sesuai dengan pola yang telah digambarkan Rahmat (2009). Token, fokus, frame, dan jenis relasi yang terdapat pada setiap pola word graph diberi id secara manual agar dokumen XML yang dibentuk dapat mendeskripsikan data dengan jelas.
Berdasarkan contoh pola word graph kata sifat dengan aturan pola ber-Kata Bilangan, terdapat lima komponen yang diperlukan dalam pembentukan XML di antaranya tag
<token>, <fokus>, <text>, <relation>
dan <frame>. Kelima tag tersebut menjadi
elemen bagi tag <components> pada penelitian ini. Masing-masing tag yang menjadi elemen dari <components> memiliki tag <id>. Hal ini diperlukan untuk
mengetahui keterhubungan antarkomponen pada pembentukan pola word graph kata sifat. Dokumen XML yang dibentuk dari pola word graph ber-Kata Bilangan dapat dilihat pada Gambar 5. Terdapat sebuah tag
<token>, sebuah tag <fokus>, tiga buah tag <text>, empat buah tag <relation>, dan sebuah tag <frame> pada pembentukan pola
word graph dengan aturan ber-Kata Bilangan. Tag <token> memiliki elemen
<id> bernilai satu. Tag <fokus> memiliki tag
<id> bernilai satu. Tag <text> memiliki tiga
buah elemen, yakni <id>, <value> dan
<replace>. Tag <value> berisi teks yang terdapat pada aturan pola word graph kata sifat. Nilai dari tag <value> dapat diubah sesuai kebutuhan yang terdapat pada pola tersebut. Tag <replace> menandakan sebuah nilai pada tag <value> dapat diubah atau
bernilai satu memiliki tag yang
berisi „ber-Kbil‟ dan tag <replace> yang
berisi „YES‟ sehingga pada tampilan pola word graph kata sifat dengan aturan ber-Kata
Bilangan, teks „ber-Kbil‟ akan diganti dengan kata masukan yang diberikan. Hal yang sama terjadi pada teks dengan tag <value> berisi
„Kbil‟ yang memiliki tag <replace> berisi „YES‟. Tampilan pola word graph kata sifat akan berubah sesuai kata dasar dari kata masukan yang diberikan. Sedangkan untuk tag <text> yang memiliki tag <replace> berisi „NO‟, teks yang ditampilkan pada tampilan pola word graph kata sifat tidak akan berubah.
1 <?xml version="1.0"?>
2 <graph> <components>
3 <focus> <id>1</id> </focus>
4 <token> <id>1</id> </token>
5 <text> <id>1</id>
6 <value>ber-KBil</value>
7 <replace>YES</replace> </text>
8 <text> <id>2</id>
9 <value>sesuatu</value>
10 <replace>YES</replace> </text>
11 <text> <id>3</id>
12 <value>KBil</value>
13 <replace>YES</replace> </text>
14 <relation> <id>1</id>
15 <type>ALI</type></relation>
16 <relation> <id>2</id>
17 <type>EQU</type> </relation>
18 <relation> <id>3</id>
19 <type>ALI</type> </relation>
20 <relation> <id>4</id>
21 <type>CAU</type> </relation>
22 <frame> <id>1</id>
23 <focusid>1</focusid>
26 <textid>3</textid>
27 <relationid>2</relationid>
28 </frame>
29 </components>
30 <relationships>
31 <relationid> 1
32 <from> <textid>1</textid> </from>
33 <to> <frameid>1</frameid> </to>
34 </relationid>
35 <relationid> 2
36 <from> <textid>3</textid> </from>
37 <to> <focusid>1</focusid> </to>
38 </relationid>
39 <relationid> 3
40 <from> <textid>2</textid> </from>
41 <to> <tokenid>1</tokenid> </to>
42 </relationid>
43 <relationid> 4
44 <from> <tokenid>1</tokenid> </from>
45 <to> <focusid>1</focusid> </to>
46 </relationid>
47 </relationships>
48 </graph>
tag <id> dan tag <type>. Tag <type> berisi jenis relasi yang digunakan pada setiap pola. Komponen kelima yang terdapat pada aturan word graph ber-Kata Bilangan ialah frame. Tag <frame> tidak memiliki aturan elemen
baku, artinya yang elemen yang berada di dalam tag <frame> disesuaikan dengan komponen yang ada pada pola word graph kata sifat. Pada aturan pola word graph ber-Kata Bilangan, komponen-komponen yang terdapat di dalam frame ialah fokus, teks, dan relasi. Pembentukan XML yang berada di dalam frame ialah jenis komponen yang sudah diberi id. Berdasarkan contoh di atas, yang terdapat di dalam tag <frame> pada aturan
pola ber-Kata Bilangan ialah tag <id> yang memiliki nomor id 1, <focusid> dengan nomor id 1, tag <relationid> dengan nomor
id 2, dan tag <textid> dengan nomor id 3. Tidak terdapat aturan penomoran khusus pada tag <id>. Yang perlu diperhatikan hanyalah kesesuaian pembentukan XML dengan gambar aturan pola word graph kata sifat yang telah diteliti Rahmat (2009).
Implementasi Java
Tampilan pola word graph kata sifat dalam bentuk XML dihasilkan pada tahap implementasi Java. Representasi word graph kata sifat dalam bahasa Indonesia yang sudah dibentuk dalam dokumen berformat XML selanjutnya digunakan sebagai acuan pembuatan XML pada Java. Potongan kode program untuk pembentukan XML, berkas XML pada Java terlihat pada Gambar 6.
120 Element rootEle =
dom.createElement("graph"); 121 dom.appendChild(rootEle); 122 Element components =
dom.createElement("components"); 123 rootEle.appendChild(components); 124 Element token1 =
dom.createElement("token"); 125 Element id1 =
dom.createElement("id"); 126 Text id1txt =
dom.createTextNode("1"); 127 id1.appendChild(id1txt); 128 token1.appendChild(id1); 129 components.appendChild(token1);
Gambar 6 Potongan kode program berkas XML pada Java.
Diagram alir representasi word graph kata sifat pada penelitian ini dapat dilihat pada Lampiran 2. Pada tahap ini, yang diperlukan
pengguna dapat mengetahui pola yang dibentuk pada aturan word graph kata sifat. Tampilan input dialog pada implementasi Java terlihat pada Gambar 7. Tampilan kata masukan yang terdapat di dalam database dengan contoh kata bersatu (Gambar 8).
Gambar 7 Tampilan input dialog.
Gambar 8 Tampilan kata masukan bersatu. Tampilan kata masukan yang terdiri atas dua kata terlihat pada Gambar 9. Pesan peringatan yang ditampilkan dari kata masukan tersebut terlihat pada Gambar 10. Tampilan pesan peringatan lainnya dapat dilihat pada Lampiran 3.
Gambar 9 Kata masukan bersatu padu.
Gambar 10 Pesan peringatan kata masukan lebih dari satu kata.
Implementasi pada Java juga terletak pada saat menampilkan dokumen XML untuk setiap aturan pola word graph pada kata sifat. Pola kata sifat dengan aturan ber-Kata Bilangan akan memiliki tampilan XML seperti pada Gambar 11 setelah kata bersatu dimasukkan. Lingkaran yang diberi angka satu menandakan bahwa tag <text> memiliki
seperti yang telah dijelaskan pada tahap pembentukan XML. Begitu pula pada tag yang diberi lingkaran dengan angka dua.
Gambar 11 Tampilan pola word graph kata sifat.
Analisis Hasil dan Pengujian
Hasil representasi word graph kata sifat menggunakan XML sudah dapat dibuat sesuai dengan aturan KG yang dibentuk berdasarkan penelitian sebelumnya. Terdapat 21 dokumen XML pada hasil representasi word graph untuk kata sifat dalam bahasa Indonesia.
Pengujian dilakukan terhadap daftar kata sifat yang sudah dimasukkan ke dalam database. Pengujian yang dilakukan ialah dengan mengambil empat kata pada setiap pola yang terdapat pada database. Di bawah ini hasil pengujian dari setiap pola word graph untuk kata sifat dalam bahasa Indonesia:
1 Pola se-Kata Sifat
Terdapat 18 daftar kata sifat yang dimasukkan ke dalam database pada pola se-Kata Sifat. Empat kata masukan diambil sebagai pengujian, yaitu sebaik, secepat, secukup, dan sedingin. Representasi word graph kata sifat dengan menggunakan XML berhasil mengenali keempat kata tersebut sebagai pola se-Kata Sifat. Tampilan kata masukan dan kata dasar juga sesuai dengan aturan word graph kata sifat. Dokumen XML untuk pola se-Kata Sifat dapat dilihat pada Lampiran 4.
Terdapat 25 daftar kata sifat yang dimasukkan ke dalam database pada pola ter-Kata Sifat dengan makna paling tinggi. Empat kata masukan diambil sebagai pengujian, yaitu teradil, terbaik, terbanyak, dan terbaru. Representasi word graph kata sifat dengan menggunakan XML berhasil mengenali keempat kata tersebut sebagai pola ter-Kata Sifat dengan makna paling tinggi. Tampilan kata masukan juga sesuai dengan aturan word graph kata sifat. Dokumen XML untuk pola ter-Kata Sifat dengan makna paling tinggi dapat dilihat pada Lampiran 5.
3 Pola ter-Kata Sifat dengan makna paling rendah
Terdapat 15 daftar kata sifat yang dimasukkan ke dalam database pada pola ter-Kata Sifat dengan makna paling rendah. Empat kata masukan diambil sebagai pengujian, yaitu terburuk, terlemah, termuda, dan termurah. Representasi word graph kata sifat dengan menggunakan XML berhasil mengenali keempat kata tersebut sebagai pola ter-Kata Sifat dengan makna paling rendah. Tampilan kata masukan juga sesuai dengan aturan word graph kata sifat. Dokumen XML untuk pola ter-Kata Sifat dengan makna paling rendah dapat dilihat pada Lampiran 6.
4 Pola ber-Kata Bilangan
Terdapat sembilan daftar kata sifat yang dimasukkan ke dalam database pada pola ber-Kata Bilangan. Empat kata masukan diambil sebagai pengujian, yaitu bersatu, berdua, bertiga, dan berempat. Representasi word graph kata sifat dengan menggunakan XML berhasil mengenali keempat kata tersebut sebagai pola ber-Kata Bilangan. Tampilan kata masukan juga sesuai dengan aturan word graph kata sifat. Dokumen XML untuk pola ber-Kata Bilangan dapat dilihat pada Lampiran 7.
5 Pola me-Kata Benda
Terdapat 12 daftar kata sifat yang dimasukkan ke dalam database pada pola me-Kata Benda. Empat kata masukan diambil sebagai pengujian, yaitu melembaga, melepuh, merakyat, dan meradang. Representasi word graph kata sifat dengan menggunakan XML berhasil mengenali keempat kata tersebut sebagai pola me-Kata Benda. Tampilan kata masukan juga sesuai dengan aturan word graph kata sifat.
6 Pola pe-Kata Sifat
Terdapat 15 daftar kata sifat yang dimasukkan ke dalam database pada pola pe-Kata Sifat. Empat kata masukan diambil sebagai pengujian, yaitu pemalu, pemarah, pemurah, dan peramah. Representasi word graph kata sifat dengan menggunakan XML berhasil mengenali keempat kata tersebut sebagai pola pe-Kata Sifat. Tampilan kata masukan juga sesuai dengan aturan word graph kata sifat. Dokumen XML untuk pola pe-Kata Sifat dapat dilihat pada Lampiran 9.
7 Pola Kata Benda-em-
Terdapat 14 daftar kata sifat yang dimasukkan ke dalam database pada pola Kata Benda-em-. Empat kata masukan diambil sebagai pengujian, yaitu gemetar, gemuntur, gemunung, dan gemulung. Representasi word graph kata sifat dengan menggunakan XML berhasil mengenali keempat kata tersebut sebagai pola Kata Benda-em-. Tampilan kata masukan juga sesuai dengan aturan word graph kata sifat. Dokumen XML untuk pola Kata Benda-em- dapat dilihat pada Lampiran 10.
8 Pola Kata Benda-an
Terdapat 11 daftar kata sifat yang dimasukkan ke dalam database pada pola Kata Benda-an. Empat kata masukan diambil sebagai pengujian, yaitu belakangan, halimunan, kodian, dan sendirian. Representasi word graph kata sifat dengan menggunakan XML berhasil mengenali keempat kata tersebut sebagai pola Kata Benda-an. Tampilan kata masukan juga sesuai dengan aturan word graph kata sifat. Dokumen XML untuk pola Kata Benda-an dapat dilihat pada Lampiran 11.
9 Pola Kata Benda-al
Terdapat sembilan daftar kata sifat yang dimasukkan ke dalam database pada pola Kata Benda-al. Empat kata masukan diambil sebagai pengujian, yaitu fenomenal, struktural, regional, dan potensial. Representasi word graph kata sifat dengan menggunakan XML berhasil mengenali keempat kata tersebut sebagai pola Kata Benda-al. Tampilan kata masukan juga sesuai dengan aturan word graph kata sifat. Dokumen XML untuk pola Kata Benda-al dapat dilihat pada Lampiran 12.
dimasukkan ke dalam database pada pola Kata Benda-il. Empat kata masukan diambil sebagai pengujian, yaitu prinsipiil, materiil, moril, dan personil. Representasi word graph kata sifat dengan menggunakan XML berhasil mengenali keempat kata tersebut sebagai pola Kata Benda-il. Tampilan kata masukan juga sesuai dengan aturan word graph kata sifat. Dokumen XML untuk pola Kata Benda-il dapat dilihat pada Lampiran 13.
11 Pola Kata Benda-iah
Terdapat 10 daftar kata sifat yang dimasukkan ke dalam database pada pola Kata Benda-iah. Empat kata masukan diambil sebagai pengujian, yaitu alamiah, lahiriah, insaniah, dan jasmaniah. Representasi word graph kata sifat dengan menggunakan XML berhasil mengenali keempat kata tersebut sebagai pola Kata Benda-iah. Tampilan kata masukan juga sesuai dengan aturan word graph kata sifat. Dokumen XML untuk pola Kata Benda-iah dapat dilihat pada Lampiran 14.
12 Pola Kata Benda-i
Terdapat 19 daftar kata sifat yang dimasukkan ke dalam database pada pola Kata Benda-i. Empat kata masukan diambil sebagai pengujian, yaitu abadi, alami, hayati, dan hewani. Representasi word graph kata sifat dengan menggunakan XML berhasil mengenali keempat kata tersebut sebagai pola Kata Benda-i. Tampilan kata masukan juga sesuai dengan aturan word graph kata sifat. Dokumen XML untuk pola Kata Benda-i dapat dilihat pada Lampiran 15.
13 Pola Kata Benda-if
Terdapat 24 daftar kata sifat yang dimasukkan ke dalam database pada pola Kata Benda-if. Empat kata masukan diambil sebagai pengujian, yaitu agresif, akumulatif, edukatif, dan fluktuatif. Representasi word graph kata sifat dengan menggunakan XML berhasil mengenali keempat kata tersebut sebagai pola Kata Benda-if. Tampilan kata masukan juga sesuai dengan aturan word graph kata sifat. Dokumen XML untuk pola Kata Benda-if dapat dilihat pada Lampiran 16.
14 Pola Kata Benda-ik
pariotik, dan simpatik. Representasi word graph kata sifat dengan menggunakan XML berhasil mengenali keempat kata tersebut sebagai pola Kata Benda-ik. Tampilan kata masukan juga sesuai dengan aturan word graph kata sifat. Dokumen XML untuk pola Kata Benda-ik dapat dilihat pada Lampiran 17.
15 Pola Kata Benda-is
Terdapat 25 daftar kata sifat yang dimasukkan ke dalam database pada pola ber Kata Benda-is. Empat kata masukan diambil sebagai pengujian, yaitu magnetis, psikologis, strategis, dan sosiologis. Representasi word graph kata sifat dengan menggunakan XML berhasil mengenali keempat kata tersebut sebagai pola Kata Benda-is. Tampilan kata masukan juga sesuai dengan aturan word graph kata sifat. Dokumen XML untuk pola Kata Benda-is dapat dilihat pada Lampiran 18.
16 Pola Kata Benda-istis
Terdapat 16 daftar kata sifat yang dimasukkan ke dalam database pada pola Kata Benda-istis. Empat kata masukan diambil sebagai pengujian, yaitu humoristis, militeristis, optimistis, dan pesimistis. Representasi word graph kata sifat dengan menggunakan XML berhasil mengenali keempat kata tersebut sebagai pola Kata Benda-istis. Tampilan kata masukan juga sesuai dengan aturan word graph kata sifat. Dokumen XML untuk pola Kata Benda-istis dapat dilihat pada Lampiran 19.
17 Pola Ke-Kata Sifat-an
Terdapat 14 daftar kata sifat yang dimasukkan ke dalam database pada pola ke-Kata Sifat-an. Empat kata masukan diambil sebagai pengujian, yaitu kemiskinan, kepayahan, kesakitan, dan kepanasan. Representasi word graph kata sifat dengan menggunakan XML berhasil mengenali keempat kata tersebut sebagai pola ke-Kata Sifat-an. Tampilan kata masukan juga sesuai dengan aturan word graph kata sifat. Dokumen XML untuk pola ke-Kata Sifat-an dapat dilihat pada Lampiran 20.
18 Pola Me-Kata Sifat-kan
Terdapat sembilan daftar kata sifat yang dimasukkan ke dalam database pada pola me-Kata Sifat-kan. Empat kata masukan diambil sebagai pengujian, yaitu menguatkan, memalukan, menyedihkan, dan merugikan. Representasi word graph kata sifat dengan
keempat kata tersebut sebagai pola me-Kata Sifat-kan. Tampilan kata masukan juga sesuai dengan aturan word graph kata sifat. Dokumen XML untuk pola me-Kata Sifat-kan dapat dilihat pada Lampiran 21.
19 Pola Me-Kata Kerja-kan
Terdapat empat daftar kata sifat yang dimasukkan ke dalam database pada pola me-Kata Kerja-kan. Empat kata masukan diambil sebagai pengujian, yaitu memandikan, menaikkan, melemparkan, dan melukiskan. Representasi word graph kata sifat dengan menggunakan XML berhasil mengenali keempat kata tersebut sebagai pola me-Kata Kerja-kan. Tampilan kata masukan juga sesuai dengan aturan word graph kata sifat. Dokumen XML untuk pola me-Kata Kerja-kan dapat dilihat pada Lampiran 22.
20 Pola Me-Kata Benda-kan
Terdapat enam daftar kata sifat yang dimasukkan ke dalam database pada pola me-Kata Benda-kan. Empat kata masukan diambil sebagai pengujian, yaitu menguntungkan, mengejutkan, mengesankan, dan membahayakan. Representasi word graph kata sifat dengan menggunakan XML berhasil mengenali keempat kata tersebut sebagai pola me-Kata Benda-kan. Tampilan kata masukan juga sesuai dengan aturan word graph kata sifat. Dokumen XML untuk pola me-Kata Benda-kan dapat dilihat pada Lampiran 23.
21 Pola Kata Sifat Dasar
Daftar kata sifat dasar diambil dari Kamus Besar Bahasa Indonesia edisi ketiga untuk pola Kata Sifat Dasar. Empat kata masukan diambil sebagai pengujian, yaitu asam, manis, besar, dan tinggi. Representasi word graph kata sifat dengan menggunakan XML berhasil mengenali keempat kata tersebut sebagai pola Kata Sifat Dasar. Tampilan kata masukan juga sesuai dengan aturan word graph kata sifat. Dokumen XML untuk pola Kata Sifat Dasar dapat dilihat pada Lampiran 24.
Pengujian tahap kedua dilakukan dengan menghitung tingkat akurasi dari dokumen yang ditampilkan. Secara keseluruhan, pengujian yang dilakukan pada pola pembentukan word graph kata sifat menghasilkan akurasi 100%. Perhitungan pada pengujian sebagai berikut:
akurasi=∑ kata yang benar
∑ kata yang diujix 100%
akurasi=84
84x 100% = 100%
Analisis Kekurangan dan Kelebihan Representasi Word Graph Kata Sifat
Kekurangan dari representasi word graph menggunakan XML untuk kata sifat dalam bahasa Indonesia seperti yang telah disebutkan pada subbab ruang lingkup. Representasi word graph kata sifat hanya dilakukan untuk kata sifat bentuk tunggal dan hanya mampu menampilkan berkas XML dengan daftar kata yang sudah dimasukkan secara manual ke dalam database. Selain itu, pembuatan dokumen berformat XML memerlukan ruang percetakan yang lebih besar dibandingkan dengan hasil pola word graph dalam bentuk gambar.
Kelebihan dari hasil representasi word graph kata sifat ini ialah terbentuknya format penulisan dokumen XML sesuai dengan konsep KG yang selanjutnya dapat digunakan untuk mempermudah pertukaran data. Terbentuknya dokumen XML pada pola word graph kata sifat juga dapat membantu penelitian selanjutnya untuk membuat dokumen XML dari bentuk pola word graph yang baru.
KESIMPULAN DAN SARAN
Kesimpulan
Penelitian ini menggunakan format XML sebagai bentuk deskripsi data. Dihasilkan 21 dokumen XML yang dapat merepresentasikan konsep KG. Penelitian ini menghasilkan akurasi sebesar 100% pada tahap pengujian. Hal ini dikarenakan kata sifat dalam bahasa Indonesia sudah terdapat dalam database.
dilakukan berkaitan dengan representasi word graph menggunakan XML:
Pola pembentukan word graph kata sifat yang telah diteliti Rahmat (2009) masih memiliki kekurangan. Kekurangan tersebut terdapat pada pola me-Kata Benda-kan. Kata masukan yang terdapat pada pola itu merupakan kata kerja dan kata dasarnya merupakan kata benda sehingga tidak terdapat penurunan kata sifat dari pengafiksan yang menjadi batasan penelitian.
Daftar kata pada pola word graph kata sifat dapat ditambahkan menjadi lebih dari satu kata masukan.
Penggunaan KBBI dengan versi terbaru sehingga memperkaya daftar kata sifat yang dapat digunakan.
Pembuatan sistem word graph editor yang sudah dilengkapi dengan informasi konsep KG sehingga berkas XML lebih mudah untuk dipahami dan divisualisasikan. Penggabungan pola word graph dengan
graf kata yang lain sehingga berguna untuk menganalisis frasa, kalimat, bahkan teks.
DAFTAR PUSTAKA
Alwi H, Dardjowidjojo S, Lapoliwa H, Moeliono AM. 2003. Tata Bahasa Baku Bahasa Indonesia. Ed ke-3. Jakarta: Balai Pustaka.
Benz B, Durant JR. 2003. XML Programming Bible. New York: Wiley Publishing, Inc.
Dykes L. 2005. XML For Dummies. Ed ke-4. New York: Wiley Publishing, Inc. Harold ER. 2003. Processing XML with Java:
a Guide to SAX, DOM, JDOM, JAXP, and TrAX. USA: Pearson Education, Inc.
Hoede C, Nurdiati S. 2008. A Graph Theoritical Analysis of Certain Aspects of Bahasa Indonesia. Belanda: Departement of Applied Mathematics, University of Twente.
Indonesia menggunakan teori knowledge graph [tesis]. Bogor: Program Pascasarjana, Institut Pertanian Bogor. Sidik B. 2001. Pemrograman WEB dengan
HTML. Bandung: Informatika.
no kata_masukan kata_dasar jenis_kd awalan sisipan akhiran quality
1 setua setinggi setebal sependek sepanjang semudah seluas selebar sekecil sehebat seelok sedingin sedangkal secukup secepat sebesar seberat sebaik
tua tinggi tebal pendek panjang mudah luas lebar kecil hebat elok dingin dangkal cukup cepat besar berat baik
a se - - -
2 tertua tertinggi terpopular terpintar terpanjang terpanas termahal terlembut terlebar terkuat terkini terkenal terjauh terindah terenak tercepat tercantik terbesar terberat terbenar terbaru terbanyak terbaik teraman
tua tinggi popular pintar panjang panas mahal lembut lebar kuat kini kenal jauh indah enak cepat cantik besar berat benar baru banyak baik aman
no kata_masukan kata_dasar jenis_kd awalan sisipan akhiran quality
teradil adil
3 tersempit tersedikit teringan terendah terpendek termurah termuda terlemah terlambat terkecil terjelek terdingin terdekat terburuk terbodoh
sempit sedikit ringan rendah pendek murah muda lemah lambat kecil jelek dingin dekat buruk bodoh 4 bersatu
berdua bertiga berempat berlima berenam bertujuh berdelapan bersembilan
satu dua tiga empat lima enam tujuh delapan sembilan
bil ber - - -
5 menyemut menyemak merakyat meradang melepuh melembaga menguning mengijuk menggunung menggajah mendarah membudaya
semut semak rakyat radang lepuh lembaga kuning ijuk gunung gajah darah budaya
n me - - -
6 penakut penyayang penyabar periang
takut sayang sabar riang
no kata_masukan kata_dasar jenis_kd awalan sisipan akhiran quality
peramah pemurah pemarah pemalu pemalas pangacau pendengki pendendam pencemburu pemboros pemberani
ramah murah marah malu malas kacau dengki dendam cemburu boros berani 7 temaram
semantan kemuskus kemilau kemilap gemuruh gemunung gemuntur gemulung gemetar gemertak gemersik gemerincing gementam
teram santan kukus kilau kilap guruh gunung guntur gulung getar gertak gersik gerincing gentam
n - em - -
8 urbanan sendirian pengangguran musikan kudisan kotaan kodian kasidahan kampungan halimunan belakangan
urban sendiri penganggur musik kudis kota kodi kasidah kampung halimun belakang
n - - an -
9 struktural regional rasional proporsial propesial
struktur region rasio proporsi profesi
no kata_masukan kata_dasar jenis_kd awalan sisipan akhiran quality
potensial material individual fenomenal
potensi materi individu fenomena 10 prinsipiil
potensil personil moril materiil
prinsip potensi person moral materi
n - - il -
11 rohaniah naluriah lahiriah jasmaniah islamiah insaniah ilmiah harfiah amaliah alamiah
rohan naluri lahir jasmani islam insan ilmu harfi amal alam
n - - iah -
12 unsuri surgawi rohani ragawi manusiawi maknawi kodrati kimiawi jasadi islami insani indrawi hewani hayati duniawi badani alami agamawi abadi
unsur surga rohan raga manusia makna kodrat kimia jasad islam insan indra hewan hayat dunia badan alami agama abad
n - - i -
13 derivatif sportif reflektif produktif
derivasi sportivitas refleksi produk
no kata_masukan kata_dasar jenis_kd awalan sisipan akhiran quality
objektif normatif modifikatif kompetitif intentif inovatif induktif indikatif fluktuatif
objek norma modifikasi kompetisi intensi inovasi induksi indikasi fluktuasi fakultatif
edukatif diskriminatif deklaratif demonstratif asimilatif aplikatif akumulatif aktif agresif adaptif
fakultas edukasi diskriminasi deklarasi demonstrasi asimilasi aplikasi akumulasi aksi agresi adaptasi 14 sinematik
simpatik problematik periodik peodalistik patriotik motorik feodalistik eksotermik diplomatik autistik artistik
sinema simpati problem periode peodalis patriot motor feodalis eksoterm diplomasi autis artis
n - - ik -
15 vegetaris teologis tematis teknis sosiologis strategis sistemis psikologis praktis
vegetarian teologi tema teknik sosiologi strategi sistem psikologi praktik
no kata_masukan kata_dasar jenis_kd awalan sisipan akhiran quality
otomatis nasionalis morfemis matematis magnetis idiologis higienis genetis filosofis eksotis ekonomis derastis
otomatik nasional morfem matematika magnet idiologi higien genetik filosof eksotik ekonomi deras demografis
biologis astronomis anatomis
demografi biologi astronomi anatomi 16 verbalistis
spesialistis realistis rasialistis politeistis pesimistis optimistis militeristis materialistis komunistis kompromistis kapitalistis individualistis humoristis egoistis dualistis
verbalisasi spesialis realisasi rasial politeis pesimis optimis militer materi komunis kompromi kapitalis individual humoris egois dualisme
n - - istis -
17 ketinggian kepanasan kesakitan kerendahan kepayahan kemiskinan kelamaan kekumalan kekerasan
tinggi panas sakit rendah payah miskin lama kumal keras
no kata_masukan kata_dasar jenis_kd awalan sisipan akhiran quality
kegatalan kedinginan kecapaian kebetulan kebesaran
gatal dingin capai betul besar 18 menakutkan
menyusahkan merugikan menyejukkan menyedihkan memalukan menguatkan menggembirakan mencondongkan
takut susah rugi sejuk sedih malu kuat gembira condong 19 menaikkan
memandikan melemparkan melukiskan
naik mandi lempar lukis
v me - kan -
20 membahayakan menguntungkan mengesankan mengejutkan menjengkelkan menyenangkan
bahaya untung kesan kejut jengkel senang
n me - kan -
Keterangan: a = kata sifat. n = kata benda. v = kata kerja.
a Pesan peringatan jika kata masukan kosong
b Kata masukan berisi angka atau simbol
<?xml version="1.0" ?>
- <graph>
- <components>
- <focus> <id>1</id> </focus>
- <token> <id>1</id> </token>
- <token> <id>2</id> </token>
- <text> <id>1</id>
<value>se-KS</value> <replace>YES</replace> </text>
- <text> <id>2</id>
<value>ukuran</value> <replace>YES</replace> </text>
- <text> <id>3</id> <value>A</value> <replace>YES</replace> </text>
- <text> <id>4</id> <value>B</value> <replace>YES</replace> </text>
- <text> <id>5</id> <value>KS</value> <replace>YES</replace> </text>
- <relation> <id>1</id> <type>ALI</type> </relation>
- <relation> <id>2</id> <type>ALI</type> </relation>
- <relation> <id>3</id>
<type>ALI</type> </relation>
- <relation> <id>4</id> <type>PAR</type> </relation>
- <relation> <id>5</id> <type>PAR</type> </relation>
- <relation> <id>6</id> <type>ALI</type> </relation>
- <relation> <id>7</id> <type>ALI</type> </relation>
- <frame> <id>1</id> <textid>5</textid> <focusid>1</focusid> <relationid>2</relationid> <relationid>3</relationid> </frame>
</components>
- <relationships>
- <relationid>
1 - <from>
<textid>1</textid> </from>
- <to>
<frameid>1</frameid> </to>
</relationid>
- <relationid>
2 - <from>
<textid>5</textid> </from>
- <to>
<focusid>1</focusid> </to>
</relationid>
- <relationid>
3
- <from>
<textid>2</textid> </from>
- <to>
<focusid>1</focusid> </to>
</relationid>
- <relationid>
4 - <from>
<focusid>1</focusid> </from>
- <to>
<tokenid>1</tokenid> </to>
</relationid>
- <relationid>
5 - <from>
<focusid>1</focusid> </from>
- <to>
<tokenid>2</tokenid> </to>
</relationid>
- <relationid>
6 - <from>
<textid>3</textid> </from>
- <to>
<tokenid>1</tokenid> </to>
</relationid>
- <relationid>
7 - <from>
<textid>4</textid> </from>
- <to>
<tokenid>2</tokenid> </to>