ANALISIS PEMBENTUKAN WORD GRAPH
KATA SIFAT MENGGUNAKAN METODE
KNOWLEDGE GRAPH
USEP RAHMAT
SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2009
PERNYATAAN MENGENAI TESIS
DAN SUMBER INFORMASI
Dengan ini saya menyatakan bahwa tesis Analisis Pembentukan Word Graph Kata Sifat Menggunakan Metode Knowledge Graph adalah karya saya sendiri dengan arahan pembimbing dan belum diajukan dalam bentuk apapun kepada perguruan tinggi manapun. Sumber informasi dari karya yang diterbitkan maupun yang tidak diterbitkan dari penulis lain disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir tesis ini.
Bogor, September 2009
Usep Rahmat
NIM. G551070521
USEP RAHMAT. The Analysis of Word Graph Formation of Adjective Using Knowledge Graph Methods. Under Supervision of SRI NURDIATI and FARIDA HANUM.
Knowledge graph theory is a new way to describe natural language, which focuses on semantic aspect. In the theory, there are 9 binary and 4 frame relationships. A word is a basic unit in a natural language processing. In the theory of knowledge graph, every word is represented by a word graph, expressing the meaning of the word. This research mainly focuses on how to construct a word graph of adjective in Indonesian language. Adjective is a word which explains a noun. In this thesis, every adjective will be analyzed using Indonesian grammar. The result is systematic patterns of adjective word graphs.
Metode Knowledge Graph. Dibimbing oleh SRI NURDIATI dan FARIDA HANUM.
Bahasa alami adalah bahasa yang biasa digunakan oleh manusia yaitu suatu bentuk representasi dari suatu pesan yang ingin dikomunikasikan antarmanusia. Teknologi Natural Language Processing (NLP) adalah teknologi yang memungkinkan untuk melakukan berbagai macam pemrosesan bahasa alami yang biasa digunakan oleh manusia. Knowledge Graph (KG) adalah suatu metode baru dalam NLP yang digunakan untuk memahami bahasa manusia yang mengkaji secara luas pada tataran jaringan semantik berupa teks yang bersifat subjektif dan disajikan dalam bentuk graf. Metode KG sudah dipergunakan untuk dokumen berbahasa Inggris. Struktur bahasa Inggris tidak persis sama dengan bahasa Indonesia, untuk itu perlu dilakukan analisis terhadap struktur bahasa Indonesia, sehingga metode KG dapat digunakan untuk menganalisis dokumen berbahasa Indonesia. Penelitian penerapan teori KG pada bahasa Indonesia dalam jangka panjang bertujuan merancang sebuah software yang dapat membaca sembarang teks bahasa Indonesia serta menghasilkan informasi dalam bentuk graf. Teks graf yang dihasilkan diharapkan berupa intisari dari teks yang dipelajari. Salah satu tahapan yang dapat dilakukan untuk membangun software tersebut adalah membuat aturan pembentukan word graph untuk seluruh kata dalam bahasa Indonesia yang secara otomatis menganalisis teks berbahasa Indonesia. Saat ini aturan pembentukan word graph bahasa Indonesia dari berbagai jenis kata seperti kata benda, kata kerja, kata sifat dan lain-lain belum ada, maka penulis akan membangun aturan pembentukan word graph dengan membatasi ruang lingkupnya yaitu hanya pada kata sifat.
Penelitian ini bertujuan menganalisis struktur kata sifat dan membuat aturan pembentukan word graph kata sifat. Manfaat penelitian ini adalah menunjukkan bahwa metode KG mampu memberikan pengetahuan sebagai informasi penting yang dapat digunakan dalam menganalisis teks berbahasa Indonesia.
Dalam teori KG setiap kata berhubungan dengan sebuah word graph yang menyatakan arti dari kata dan disebut dengan semantic word graph. Word graph merupakan graf dari kata dan dapat dinyatakan sebagai graf yang diberi label.
KG adalah suatu metode yang digunakan untuk menganalisis teks dan merepresentasikan teks tersebut ke dalam bentuk graf. KG adalah suatu instrumen yang merepresentasikan struktur terkonsep yang sudah tertentu. Pada prinsipnya komposisi dari KG terdiri atas concept (token, name dan type) dan relationships. Concept merupakan sesuatu yang penting dalam membentuk suatu pengertian dari khusus ke umum atau sebaliknya. Concept dapat direpresentasikan menggunakan token, type, dan name. Token merupakan concept yang dipahami oleh seseorang menurut cara pandangnya masing-masing sehingga token bersifat subjektif. Token adalah suatu node yang diindikasikan oleh “ “, oleh karena itu pada teori KG segala sesuatu akan dihubungkan dengan token. Type adalah concept yang berupa informasi umum dan bersifat objektif karena merupakan kesepakatan yang dibuat sebelumnya. Name adalah sesuatu yang bersifat unique individual. Ontologi adalah gambaran beberapa concept dan relasi antarconcept yang bertujuan untuk
CAU, EQU, SUB, DIS, ORD, PAR, SKO, dan ontologi F. Empat frame relationships yang dimaksud adalah FPAR, NEGPAR, POSPAR, dan NECPAR. Relasi ALI digunakan untuk menghubungkan sebuah type dengan token. Relasi CAU digunakan untuk menghubungkan dua token yang memiliki hubungan sebab akibat dimana sesuatu mempengaruhi sesuatu yang lain. Relasi EQU digunakan untuk menghubungkan sebuah name dengan token. Relasi SUB digunakan untuk menyatakan bahwa sesuatu merupakan bagian dari sesuatu yang lain. Relasi DIS digunakan untuk menyatakan sesuatu yang berbeda. Relasi ORD digunakan untuk menyatakan sesuatu yang berurutan. Relasi PAR digunakan untuk menjelaskan bahwa satu elemen berkaitan dan memiliki sifat elemen lainnya. Relasi SKO digunakan untuk menyatakan informasi bergantung. Ontologi F digunakan untuk menunjukkan fokus dari suatu graph. Relasi FPAR digunakan untuk menghubungkan sebuah konsep dengan struktur di dalamnya, relasi NEGPAR digunakan untuk menyatakan negasi dari sesuatu, relasi POSPAR menyatakan kemungkinan sesuatu, dan relasi NECPAR untuk menyatakan suatu kebutuhan.
Metode penelitian yang akan dilaksanakan terdiri atas tiga tahap yaitu tahap pertama analisis struktur kata sifat, tahap kedua pembuatan aturan word graph kata sifat bahasa Indonesia dan tahap ketiga pengujian aturan word graph kata sifat bahasa Indonesia.
Dari hasil studi literature teks berhubungan dengan pertanian, penulis memilih kata sifat untuk dianalisis dari tiga majalah Trubus yang dipilih secara acak, kemudian mengelompokkan kata sifat berdasarkan pembentukan kata sifat yang menekankan kepada proses afiksasi. Selanjutnya penulis mempelajari jenis-jenis relasi dasar dalam KG yang akan diterapkan pada pembentukan word graph kata sifat. Setelah relasi diperoleh maka dibuat aturan pembentukan word graph kata sifat bahasa Indonesia, kemudian hasil aturan tersebut diuji, jika telah memenuhi aturan rancangan word graph kata sifat maka ditetapkan aturan pembentukan word graph kata sifat bahasa Indonesia.
Hasil penelitian ini berupa pembentukan word graph kata sifat bahasa Indonesia dari berbagai bentuk afiksasi. Hasil ini mengindikasikan adanya satu aturan yang dapat dibuat secara umum untuk setiap kata sifat yang ada meskipun tidak menutup kemungkinan beberapa aturan belum tertampung.
Kata kunci : knowledge graph, word graph, kata sifat, natural language processing.
©
Hak Cipta milik Institut Pertanian Bogor, tahun 2009
Hak Cipta dilindungi undang-undang
1. Dilarang mengutip sebagian atau seluruh hasil karya tulis ini tanpa mencantumkan atau menyebutkan sumber.
a. Pengutipan hanya untuk kepentingan pendidikan, penelitian, penulisan karya ilmiah, penyusunan laporan, penulisan kritik, atau tinjauan suatu masalah
b. Pengutipan tidak merugikan kepentingan yang wajar Institut Pertanian Bogor.
2. Dilarang mengumumkan dan memperbanyak sebagian atau seluruh karya tulis dalam bentuk apapun tanpa izin Institut Pertanian Bogor.
KNOWLEDGE GRAPH
USEP RAHMAT
Tesis
sebagai salah satu syarat untuk memperoleh gelar Magister Sains pada
Program Studi Matematika Terapan
SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2009
NIM : G551070521
Disetujui Komisi Pembimbing
Dr. Ir. Sri Nurdiati, M.Sc. Dra. Farida Hanum, M.Si. Ketua Anggota
Diketahui
Ketua Program Studi Dekan Sekolah Pascasarjana Matematika Terapan
Dr. Ir. Endar H. Nugrahani, M.S. Prof. Dr. Ir. Khairil A. Notodiputro, M.S.
Puji dan syukur penulis panjatkan kepada Allah SWT atas segala karunia-Nya sehingga karya ilmiah ini dapat diselesaikan. Judul yang dipilih dalam penelitian yang dilaksanakan sejak bulan Februari 2009 ini adalah Analisis Pembentukan Word Graph Kata Sifat Menggunakan Metode Knowledge Graph.
Terima kasih penulis ucapkan kepada Ibu Dr. Ir. Sri Nurdiati, M.Sc. dan Ibu Dra. Farida Hanum, M.Si. selaku pembimbing serta Bapak Drs. Prapto Tri Supriyo, M.Kom. selaku penguji yang telah banyak memberikan saran. Di samping itu, ungkapan terima kasih juga penulis sampaikan kepada Departemen Agama Republik Indonesia yang telah membiayai penelitian ini, kepada rekan-rekan mahasiswa atas diskusinya, serta pihak lain yang tidak bisa disebutkan satu per satu. Semoga atas semua kebaikan dapat bernilai ibadah dan dibalas oleh Allah SWT dengan kebaikan yang berlipat. Ucapan terima kasih yang tiada hingga kepada Ibunda, yang tercinta Istri dan keempat putra/i, dan seluruh keluarga yang memberikan motivasi, do’a dan kasih sayangnya.
Semoga karya ilmiah ini bermanfaat.
Bogor, September 2009
Penulis dilahirkan di Cianjur pada tanggal 12 Juni 1967 dari Ayah Alm. Acep Utom dan Ibu Siti Aminah. Penulis merupakan putra pertama dari tujuh bersaudara.
Tahun 1989 penulis lulus dari MAN Pacet Cipanas Cianjur Jawa Barat dan pada tahun yang sama lulus seleksi masuk IAIN Syarif Hidayatullah (UIN) Jakarta pada Fakultas Tarbiyah (Keguruan) Jurusan Tadris Matematika. Kesempatan untuk melanjutkan program magister pada Program Studi Matematika Fakultas MIPA IPB diperoleh pada tahun 2007.
Penulis adalah staf pengajar Bidang Studi Matematika sejak Juli 2001 di Madrasah Tsanawiyah (MTs) Negeri Tangerang 2 Pamulang Banten, yang sebelumnya bertugas sebagai staf pengajar di MTsN Rancagoong Cianjur sejak Juli 1997 sampai Juli 2001 dengan Bidang Studi yang sama.
x DAFTAR GAMBAR ………... DAFTAR LAMPIRAN ……….... 1 PENDAHULUAN ……….... 1.1 Latar Belakang .………... 1.2 Tujuan Penelitian …...………... 1.3 Perumusan Masalah .………... 1.4 Ruang Lingkup Masalah .……… 2 TINJAUAN PUSTAKA ………... 2.1 Adjektiva (Kata Sifat) …...………... 2.2 Graph …...……… 2.3 Knowledge Graph ……..………...….. 2.4 Concept ……..………...….. 2.5 Word Graph .…….………...………...….. 2.6 Ontologi …...………..………...…. 3 METODOLOGI PENELITIAN ………...
Tahap 1: Analisis Struktur Kata Sifat pada Bahasa Indonesia ………… Tahap 2: Pembuatan Aturan Word Graph Kata Sifat Bahasa Indonesia… Tahap 3: Pengujian Aturan Word Graph Kata Sifat Bahasa Indonesia ... 4 HASIL DAN PEMBAHASAN ……….…… 4.1 Analisis Struktur Kata Sifat ….………... 4.1.1 Kata Sifat Dasar ………...………... 4.1.2 Kata Sifat Turunan ……… 4.2 Pembuatan Aturan Word Graph Kata Sifat ..………...…... 4.2.1 Afiksasi Kata Sifat dengan Prefiks ………... 4.2.2 Afiksasi Kata Sifat dengan Infiks ……....………. 4.2.3 Afiksasi Kata Sifat dengan Sufiks ..……….. 4.2.4 Afiksasi Kata Sifat dengan Konfiks ………..…… 4.3 Perancangan Aturan Pembentukan Word Graph Kata Sifat ..……... 4.3.1 Pola Pembentukan Word Graph Kata Sifat ..……….... 4.3.2 Aturan Pembentukan Word Graph Kata Sifat ..…………... 4.4 Pengujian Aturan Pembentukan Word Graph Kata Sifat …………... 5 SIMPULAN DAN SARAN ……… 5.1 Simpulan ..………... 5.2 Saran ..……….. DAFTAR PUSTAKA ………... LAMPIRAN ……….. xi xiii 1 1 2 2 2 3 3 6 7 8 8 9 15 15 15 16 17 17 17 17 18 18 27 29 41 45 45 49 55 59 59 59 60 62
xi Halaman 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 Graph G= (V,E) ……….. Directed graph G= (V,A) ……… Contoh penggunaan relasi ALI ………... Contoh penggunaan relasi CAU ………. Contoh penggunaan relasi EQU ………. Contoh penggunaan relasi SUB ……….. Contoh penggunaan relasi DIS ………... Contoh penggunaan relasi ORD ………. Contoh penggunaan relasi PAR ……….. Contoh penggunaan relasi SKO ……….. Contoh penggunaan ontologi F ………... Contoh penggunaan 4 frame relationships ………. Flowchart metodologi aturan pembentukan word graph kata sifat pada bahasa Indonesia …………..……… Word graph kata sifat sebesar ………. Word graph kata sifat setinggi ………..………... Word graph kata sifat dengan pola se-KS …...……… Word graph kata sifat termahal ………….……….. Word graph kata sifat dengan pola ter-KS dengan tingkat bandingan tertinggi ………... Word graph kata sifat terendah ……….……….. Word graph kata sifat dengan pola ter-KS dengan tingkat bandingan terendah …………..………..………...……… Word graph kata sifat bersatu …………..………... Word graph kata sifat dengan pola ber-KBil ………..………… Word graph kata sifat merakyat …………...……… Word graph kata sifat dengan pola me-KB ..……… Word graph kata sifat pelupa …………...……… Word graph kata sifat dengan pola pe-KS ....….………..
7 7 9 10 10 11 11 12 12 13 13 14 16 19 19 20 21 22 23 24 24 25 26 26 27 27
xii 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48
Word graph kata sifat dengan pola KB-em- ………. Word graph kata sifat kudisan ……...………... Word graph kata sifat kampungan …………...………. Word graph kata sifat dengan pola KB-an ...………... Word graph kata sifat individual ………. Word graph kata sifat dengan pola KB-al …..……….. Word graph kata sifat prinsipiil ……….………... Word graph kata sifat ilmiah ……… Word graph kata sifat alami .……… Word graph kata sifat produktif ……… Word graph kata sifat patriotik ………. Word graph kata sifat praktis ………... Word graph kata sifat optimistis ………... Word graph kata sifat dengan pola KB-istis ………. Word graph kata sifat kepanasan ………. Word graph kata sifat dengan pola ke-KS-an ………... Word graph kata sifat menguntungkan ………. Word graph kata sifat dengan pola me-KD-kan ………. Word graph kata sifat mengesankan ………. Word graph kata sifat dengan pola me-KB-kan ………. Flowchart aturan pembentukan word graph kata sifat ……….
29 30 30 31 32 33 34 35 36 37 38 39 40 40 41 42 42 43 44 44 55
xiii Halaman 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Daftar kata sifat (Adjektiva) dari majalah TRUBUS nomor 474 (Mei 2009/XL), TRUBUS nomor 462 (Mei 2008/XXXIX), dan TRUBUS nomor 457 (Desember 2007/XXXVIII) ………. Daftar kata sifat pola se-KS ……….... Daftar kata sifat pola ter-KS mengacu ke tingkat kualitas yang paling tinggi ………... Daftar kata sifat pola ter-KS mengacu ke tingkat kualitas yang paling rendah ………. Daftar kata sifat pola ber-KBil ………...……… Daftar kata sifat pola me-KB …………...………... Daftar kata sifat pola pe-KS .………... Daftar kata sifat pola KB-em- ………. Daftar kata sifat pola KB-an ………..………. Daftar kata sifat pola KB-al ……… Daftar kata sifat pola KB-il ………. Daftar kata sifat pola KB-iah ……….. Daftar kata sifat pola KB-i ……….. Daftar kata sifat pola KB-if ………. Daftar kata sifat pola KB-ik ……… Daftar kata sifat pola KB-is ……… Daftar kata sifat pola KB-istis ……… Daftar kata sifat pola ke-KS-an ……….. Daftar kata sifat pola me-KD-kan ……..………. Daftar kata sifat pola me-KB-kan ……..……….
63 66 67 67 68 68 69 69 70 70 70 70 71 71 72 72 73 73 74 74
1.1 Latar Belakang
Bahasa alami adalah bahasa yang biasa digunakan oleh manusia yaitu suatu bentuk representasi dari suatu pesan yang ingin dikomunikasikan antarmanusia. Bentuk utama representasinya adalah berupa lisan tetapi sering pula dinyatakan dalam bentuk tulisan. Chomsky adalah orang yang pertama kali merepresentasikan bahasa sebagai simbol. Chomsky berhasil memperlihatkan bahwa bahasa apapun dapat direpresentasikan dengan suatu cara yang universal. Pemikiran Chomsky yang merepresentasikan bahasa sebagai kumpulan simbol-simbol tersebut telah membuka peluang untuk melakukan pemrosesan bahasa secara simbolik dengan teknologi komputer, sehingga melahirkan bidang ilmu Natural Language Processing (NLP). Teknologi NLP adalah teknologi yang memungkinkan untuk melakukan berbagai macam pemrosesan bahasa alami yang biasa digunakan oleh manusia. Sistem ini biasanya mempunyai masukan dan keluaran berupa bahasa tulisan (teks) (Arman 2004).
Salah satu metode yang dapat merepresentasikan bahasa alami adalah menggunakan teori Knowledge Graph (KG). KG adalah suatu metode baru dalam NLP yang merupakan sebuah tinjauan untuk menggambarkan atau menjelaskan bahasa dengan cara menganalisis teks secara harfiah dan diperkaya dengan latar belakang pengetahuannya sehingga menghasilkan sebuah pengetahuan baru (Zhang 2002). Teori KG merupakan metode baru yang digunakan untuk memahami bahasa manusia yang mengkaji secara luas pada tataran jaringan semantik berupa teks yang bersifat subjektif dan disajikan dalam bentuk graf.
Metode KG sudah dipergunakan untuk dokumen berbahasa Inggris. Struktur bahasa Inggris tidak persis sama dengan bahasa Indonesia, untuk itu perlu dilakukakan analisis terhadap struktur bahasa Indonesia, sehingga metode KG dapat digunakan untuk menganalisis dokumen berbahasa Indonesia.
Penelitian penerapan teori KG pada bahasa Indonesia dalam jangka panjang bertujuan untuk merancang sebuah software yang dapat membaca sembarang teks bahasa Indonesia serta menghasilkan informasi dalam bentuk graf, sehingga informasi tersebut merupakan intisari dari pengetahuan yang ada dalam teks yang dipelajari. Salah satu tahapan yang dapat dilakukan untuk membangun software
tersebut adalah membuat aturan pembentukan word graph untuk seluruh kata dalam bahasa Indonesia yang secara otomatis menganalisis teks bahasa Indonesia.
Saat ini aturan pembentukan word graph bahasa Indonesia dari berbagai jenis kata seperti kata benda, kata kerja, kata sifat dan lain-lain belum ada, maka penulis akan membangun aturan pembentukan word graph dengan membatasi ruang lingkupnya yaitu hanya pada kata sifat.
1.2 Tujuan Penelitian
1. Menganalisis struktur kata sifat pada bahasa Indonesia.
2. Membuat aturan pembentukan word graph kata sifat pada bahasa Indonesia.
3. Melakukan pengujian aturan pembentukan word graph kata sifat pada bahasa Indonesia.
1.3 Perumusan Masalah
Perumusan masalah pada penelitian ini adalah
1. Dapatkah metode KG digunakan sebagai instrumen untuk merancang pembentukan word graph kata sifat pada bahasa Indonesia.
2. Bagaimana metode KG mampu membuat aturan pembentukan word graph kata sifat pada bahasa Indonesia.
1.4 Ruang Lingkup Masalah
Ruang lingkup dari penelitian ini adalah teks yang berkaitan dengan bidang pertanian dan mengidentifikasi kata sifat dari teks tersebut. Informasi yang digunakan dalam penelitian ini diambil dari tiga majalah Trubus yang dipilih secara acak yaitu Trubus nomor 457 (Desember 2007/ XXXVII), Trubus nomor 462 (Mei 2008/ XXXIX) dan Trubus nomor 474 (Mei 2009/XL). Informasi yang diambil berupa kata sifat (adjektiva) yang terdapat pada ketiga majalah tersebut. Hasil dari pengklasifikasian adjektiva diperoleh adjektiva yang terdapat pada Lampiran 1.
Pada bab ini diberikan beberapa penjelasan yang akan digunakan dalam penelitian ini.
2.1 Adjektiva (Kata Sifat)
1. Batasan dan Ciri Adjektiva (Kata Sifat)
Adjektiva, yang juga disebut kata sifat atau kata keadaan, adalah kata yang memberikan keterangan yang lebih khusus tentang sesuatu yang dinyatakan oleh nomina dalam kalimat. Adjektiva yang memberikan keterangan terhadap nomina itu berfungsi atributif (Alwi et al. 2003), dan mempunyai ciri sebagai berikut:
1) Adjektiva dapat diberi keterangan penguat seperti lebih, kurang, dan paling: lebih besar, kurang baik, paling mahal.
2) Adjektiva dapat diberi keterangan penguat seperti sangat, amat, benar, sekali, dan terlalu: sangat indah, amat tinggi, pandai benar, murah sekali, terlalu murah.
3) Adjektiva dapat diingkari dengan kata ingkar tidak: tidak bodoh, tidak salah, tidak benar.
4) Adjektiva dapat diulang dengan awalan se- dan akhiran -nya: sebaik-baiknya, serendah-rendahnya, sejelek-jeleknya.
5) Adjektiva pada kata tertentu dapat berakhiran antara lain dengan -er,- (w)i, -iah, -if, -al dan -ik: honorer, duniawi, ilmiah, negatif, formal.
Menurut Gorys Keraf (1984) segala kata yang dapat mengambil bentuk se + reduplikasinya + nya, serta dapat diperluas dengan: paling, lebih, sekali, adalah kata sifat.
Umumnya sebuah adjektiva diletakkan di belakang kata yang diterangkan. 2. Adjektiva dari segi perilaku semantisnya
Kelas adjektiva menunjukkan adanya dua tipe pokok: adjektiva bertaraf yang mengungkapkan suatu kualitas dan adjektiva takbertaraf yang mengungkapkan keanggotaan dalam suatu golongan. Pembedaan adjektiva yang bertaraf dari adjektiva yang tidak bertaraf bertalian dengan mungkin tidaknya adjektiva itu menyatakan berbagai tingkat kualitas dan berbagai
tingkat bandingan. Untuk maksud itu dapat dipakai kata seperti sangat, agak, lebih dan paling. Adjektiva takbertaraf, sebaliknya tidak dapat diberi pewatas tersebut. Adjektiva bertaraf dapat dibagi atas: (1) adjektiva pemeri sifat, (2) adjektiva ukuran, (3) adjektiva warna, (4) adjektiva waktu, (5) adjektiva jarak, (6) adjektiva sikap batin, dan (7) adjektiva cerapan (Alwi et al. 2003).
3. Adjektiva dari segi perilaku sintaksisnya
Adjektiva yang merupakan pewatas dalam frasa nominal yang nominanya menjadi subjek, objek, atau pelengkap dikatakan dipakai secara atributif. tempatnya di sebelah kanan nomina. Adjektiva yang menjalankan fungsi predikat atau pelengkap dalam klausa dikatakan dipakai secara predikatif. Adjektiva yang mewatasi verba (atau adjektiva) yang menjadi predikat klausa dikatakan dipakai secara adverbial atau sebagai keterangan (Alwi et al. 2003). 4. Pertarafan adjektiva
Adjektiva bertaraf dapat menunjukkan berbagai tingkat kualitas atau intensitas dan berbagai tingkat bandingan. Pembedaan tingkat kualitas atau intensitas dinyatakan dengan pewatas seperti benar, sangat, terlalu, agak, dan makin. Pembedaan tingkat bandingan dinyatakan dengan pewatas seperti lebih, kurang, dan paling.
Pada tingkat bandingan, pembanding dua maujud atau lebih dapat disimpulkan bahwa tingkat kualitas atau intensitasnya dapat setara atau tidak setara. Tingkat setara disebut tingkat ekuatif, tingkat yang tak setara dibagi dua yaitu tingkat komparatif dan tingkat superlatif. Tiap-tiap tingkat itu secara sintaksis diungkapkan dengan bentuk yang khusus (Alwi et al. 2003).
5. Adjektiva dari segi bentuknya
Dari segi bentuknya, adjektiva terdiri atas adjektiva dasar yang selalu monomorfemis dan adjektiva turunan yang selalu polimorfemis. Sebagian besar adjektiva dasar merupakan bentuk yang monomorfemis. Contoh adjektiva yang monomerfemis adalah sebagai berikut:
asin cerah kecil matang
anggun ceria kurus murah
Adjektiva yang polimorfemis dibentuk dengan tiga cara : pengafiksan, pengulangan, dan pemaduan dengan kata lain.
1) Adjektiva polimorfemis yang dibentuk dengan pengafiksan di antaranya adalah:
Memakai afiks pungutan atau hasil penyerapan adjektiva berafiks dari bahasa lain seperti bahasa Arab, Belanda, dan Inggris, seperti yang berafiks -i, -iah, -wi, atau -wiah. Berikut adalah beberapa contoh:
alami ilmiah manusiawi insani surgawi hewani lahiriah duniawi nabati jasmaniah ragawi alamiah
Hasil pengafiksan dengan infiks atau sisipan -em- pada nomina, contoh:
gemetar gemerlap kemilau kemilap
gemuruh gemilang temaram gemilap
Pengafiksan tentang tingkat bandingan seperti tingkat ekuatif dengan prefiks se-, dan tingkat superlatif dengan prefiks ter-.
Adapula bentuk yang wujudnya nomina, namun sering dipakai dalam posisi adjektiva. Berikut adalah beberapa contohnya:
penakut pemarah keibuan
pemalas pengecut kebapaan pendendam
2) Cara kedua untuk menurunkan adjektiva adalah dengan bentuk berulang. Subkategori adjektiva turunan yang berupa bentuk berulang dapat muncul jika berfungsi predikat atau berfungsi adverbial. Predikat adjektival yang berbentuk ulang menandakan kejamakan, keanekaan, atau keintensifan. Perulangan itu terjadi melalui cara perulangan penuh, perulangan sebagian, dan perulangan salin suara. Contoh:
besar-besar besar-besaran compang-camping
merah-merah awur-awuran hiruk-pikuk
3) Cara ketiga pembentukan adjektiva adalah dengan memadukan adjektiva dengan kata lain, dapat berupa nomina atau adjektiva.
Jika adjektiva dipadukan dengan nomina dengan urutan adjektiva terlebih dahulu dan nomina di belakangnya, maka terbentuklah adjektiva baru dengan arti yang khusus. Contoh:
berat lidah buta huruf besar mulut tajam ingatan keras hati wajib fakultas keras kepala padat karya panjang tangan
Bentuk paduan yang lain adalah paduan antara adjektiva dan adjektiva yang lain. Perpaduan semacam ini umumnya memberikan arti yang memperkuat unsur pertama. Contoh:
lemah lembut terang benderang cantik jelita kacau balau aman tenteram sehat walafiat.
Adjektiva gabungan yang mirip dengan bentuk berulang adalah yang merupakan hasil penggabungan sinonim atau antonim.
Adjektiva yang merupakan bentuk majemuk ada yang merupakan gabungan morfem terikat dengan morfem bebas dan ada yang merupakan gabungan dua morfem bebas (atau lebih), termasuk di dalamnya bentuk-bentuk yang tergolong idiom, artinya makna bentuk-bentuk gabungan itu tidak dapat dijabarkan dari penjumlahan makna unsur-unsurnya (Alwi et al. 2003).
6. Frasa Adjektiva
Adjektiva yang menyatakan keadaan dapat pula diterangkan oleh kata, seperti sudah, harus, dan dapat.
Frasa adjektiva juga dapat dibuat ingkar dengan kata ingkar tidak, dan juga memiliki pewatas belakang seperti lagi dan kembali (Alwi et al. 2003). 7. Penurunan Kata dari Adjektiva
Seperti halnya dengan jenis kata yang lain, adjektiva dapat pula bertindak sebagai dasar kelas kata yang lain. Dari dasar adjektiva kita dapat memperoleh verba, nomina, dan adverbial (Alwi et al. 2003).
2.2 Graph
Suatu graph G adalah pasangan terurut (V, E), dengan V adalah himpunan simpul yang berhingga dan takkosong. Elemen V dinamakan simpul (node) atau vertex, dan E adalah himpunan sisi yang merupakan pasangan yang tidak terurut simpul p,q V, elemen E dinamakan sisi (edge) dinotasikan sebagai {i, j} yaitu sisi yang menghubungkan simpul i dengan simpul j, dengan i,j V (Foulds 1992).
Sebagai contoh gambar berikut menyatakan graph G(V,E) dengan: V = { , , , } dan E = { , , , , , , , , , }.
Gambar 1 Graph G= (V,E).
Suatu graph berarah (directed graph, atau disingkat digraph) adalah suatu pasangan terurut (V, A) dengan V himpunan takkosong dan berhingga dan A merupakan himpunan pasangan terurut dari elemen-elemen di V. Elemen dari A biasa disebut sisi berarah (arc) (Foulds 1992).
Sebagai contoh gambar berikut menyatakan graph berarah G(V,A) dengan:
V={ , , , } dan A = { , , , , , , , , , }
Gambar 2 Directed graph G= (V,A).
2.3 Knowledge Graph (KG)
Menurut Zhang dan Hoede (2000) KG adalah suatu metode yang digunakan untuk menganalisis teks dan merepresentasikan teks tersebut ke dalam bentuk graf, sedangkan menurut Kramer (1996) KG adalah suatu instrumen yang merepresentasikan struktur terkonsep yang sudah tertentu. Dengan instrumen ini relasi-relasi antara suatu rangkaian dapat diminimalisir dan terbatas. Tujuannya adalah secara sistematis mengekstrak relasi-relasi dari suatu teks yang menerangkan tentang suatu subjek pada bidang tertentu untuk dituangkan dalam suatu graf (Vries 1989).
Menurut Zhang (2002) teori KG adalah suatu pendekatan baru yang dapat digunakan untuk menyatakan bahasa manusia yang lebih memfokuskan pada aspek semantik daripada aspek sintatik. Teori KG mampu mengekspresikan dan
menggambarkan aspek semantik yang lebih mendasar dengan menggunakan jumlah relasi yang terbatas. Teori KG merupakan metode baru untuk memahami bahasa manusia dengan bantuan komputer. Perbedaan antara teori KG dengan teori representasi lain adalah bahwa teori KG menggunakan ontologi yang jumlahnya terbatas. Pada prinsipnya komposisi dari KG terdiri atas concept (token, name dan type) dan relationships.
KG terdiri atas suatu himpunan vertex V yang tidak berlabel disebut token dan dinyatakan dengan persegi. KG merupakan graph campuran dengan edge dan arcs yang diberi label dan dinyatakan dengan garis dan garis berarah (Hoede & Nurdiati 2008a).
2.4 Concept
Concept merupakan komponen terpenting dalam pemikiran manusia, concept merupakan sesuatu yang penting dalam membentuk suatu pengertian dari khusus ke umum atau sebaliknya (Zhang & Hoede 2000). Concept dalam KG bisa dinyatakan sebagai token, name, dan type (Van den Berg 1993).
Token merupakan concept yang dipahami oleh seseorang menurut cara pandangnya masing-masing sehingga token bersifat subjektif. Pada KG, token adalah suatu node yang diindikasikan oleh “ “. Token menyatakan suatu entitas di dalam dunia nyata. Misalnya kata apel dapat diasosiasikan secara subjektif mengenai bentuk, warna, rasa dan sebagainya.
Type adalah concept yang berupa informasi umum dan bersifat objektif karena merupakan kesepakatan yang dibuat sebelumnya. Contoh type misalnya buah, binatang, dan sebagainya.
Name adalah sesuatu yang bersifat unique individual, sebagai contoh John adalah sebuah name yaitu nama dari seorang laki-laki (Van den Berg 1993).
2.5 Word Graph
Dalam teori KG setiap kata berhubungan dengan sebuah word graph yang menyatakan makna dari kata dan disebut dengan semantic word grap. Word graph merupakan graf yang merepresentasikan kata dan dapat dinyatakan sebagai graf yang diberi label. Gabungan beberapa word graph dari beberapa kata dalam suatu kalimat menghasilkan sentence graph. Beberapa sentence graph yang digabung
dalam sebuah teks disebut text graph, dan memuat pengetahuan yang terkandung dalam suatu teks (Hoede & Nurdiati 2008a).
2.6 Ontologi
Ontologi adalah gambaran beberapa concept dan relasi antarconcept yang bertujuan untuk mendefinisikan beberapa ide yang merepresentasikan concept, relasi dan logikanya. Ontologi word graph terdiri atas token yang dinyatakan dengan node, 9 binary relationships dan 4 frame relationships.
Berikut ini adalah sembilan type binary relationships: 1. Similarity of set, alikeness : ALI
2. Causality : CAU
3. Equality : EQU
4. Subset relationships : SUB 5. Disparateness : DIS 6. Ordering : ORD 7. Attribution : PAR 8. Informational dependency : SKO 9. Ontologi F (Focus dari suatu graph), focus
Menurut Zhang (2002), penjelasan dari ontologi dalam teori KG tersebut dapat diberikan sebagai berikut:
1. Relasi ALI (alikeness)
Relasi ALI digunakan untuk menghubungkan sebuah type dengan token. Contoh “tumbuhan” adalah type, karena “tumbuhan” adalah concept yang berupa informasi umum, maka dapat dinyatakan dengan word graph berikut:
Gambar 3 Contoh penggunaan relasi ALI. 2. Relasi CAU (causality)
Relasi CAU antara dua token dinyatakan dengan anak panah berlabel sebagai berikut:
Relasi CAU ini digunakan untuk menghubungkan dua token yang memiliki hubungan sebab akibat dimana suatu token mempengaruhi token yang lain.
CAU ALI tumbuhan
Relasi CAU adalah relasi yang paling sering diungkapkan dalam metode-metode ilmiah terutama dalam mendiagnosis sesuatu. Menurut Hoede dan Nurdiati (2008a) relasi CAU dapat digunakan untuk menghubungkan dua concept yang terdiri atas kata benda dan kata kerja, yaitu untuk menghubungkan subjek dengan predikat atau predikat dengan objek. Contoh: “Ibu petik bunga” kalimat tersebut dapat dinyatakan sebagai berikut:
.
Gambar 4 Contoh penggunaan relasi CAU.
Gambar 4 Contoh penggunaan relasi CAU untuk menghubungkan token “Ibu” (subjek kalimat) dengan kata kerja “petik” (predikat kalimat) serta menghubungkan kata kerja “petik” dengan kata benda “bunga” (objek kalimat). Relasi CAU ini terdiri atas tiga token, token pertama merepresentasikan “ibu” sebagai subjek dihubungkan kepada token kedua yaitu “petik” sebagai predikat dan dihubungkan kepada token ketiga yaitu “bunga” sebagai objek.
3. Relasi EQU (equality)
Kata dasar relasi EQU adalah “EQUAL” (sama) dan direpresentasikan sebagai berikut:
Relasi EQU ini digunakan untuk menjelaskan concept yang sederajat atau sama, mengekspresikan dua hal yang dianggap sama atau setara. Relasi EQU dapat juga untuk menyatakan kata hubung seperti “adalah” dan “merupakan”. Relasi ini digunakan juga untuk menghubungkan sebuah name dengan token. Contoh: “salak Pondoh” maka word graph-nya seperti gambar berikut:
Gambar 5 Contoh penggunaan relasi EQU. EQU CAU CAU ibu bunga petik ALI ALI ALI EQU
Pada Gambar 5 Contoh penggunaan relasi EQU pada kata “salak Pondoh”, relasi ini menghubungkan name “Pondoh” ke concept “salak”.
4. Relasi SUB (subset)
Asal kata relasi SUB adalah IN (di dalam) dan dinyatakan dengan anak panah berlabel sebagai berikut:
Jika ada dua token yang menyatakan dua rangkaian secara bertautan, dan yang satu merupakan bagian dari yang lain maka kedua token dihubungkan dengan relasi SUB. Jika a SUB b maka dapat diinterpretasikan yaitu Concept a adalah bagian dari Concept b, sebagai contoh “ekor SUB kucing”, ini menyatakan bahwa “ekor kucing” adalah bagian dari “kucing”, karena molekul “ekor” merupakan bagian dari molekul “kucing”.
Gambar 6 Contoh penggunaan relasi SUB.
Dari Gambar 6 relasi SUB digunakan untuk menghubungkan kata benda “ekor” dengan kata “kucing” karena “ekor” merupakan bagian dari “kucing”. Relasi SUB pada dasarnya adalah menggambarkan satu bagian dari sebuah concept yang utuh sehingga fungsi SUB berkaitan erat dengan concept kepemilikan, artinya a adalah milik atau bagian dari b.
5. Relasi DIS (disparateness)
Contoh dua himpunan yang tidak beririsan atau saling lepas yaitu dengan menggunakan kata “DISPARATE” (tidak sama atau berbeda) yang dapat dinyatakan sebagai berikut:
Relasi DIS ini digunakan untuk menyatakan bila dua token tidak ada hubungan antara satu dengan yang lainnya.
Relasi DIS digunakan juga untuk menyatakan sesuatu yang berbeda, misalnya: “air” berbeda dengan “minyak” dapat dinyatakan dengan word graph berikut:
Gambar 7 Contoh penggunaan relasi DIS. SUB
SUB
ekor kucing ALI ALI
DIS
DIS
Pada gambar di atas relasi DIS digambarkan tanpa menggunakan tanda panah, hal ini dikarenakan relasi DIS tersebut bersifat simetris, a DIS b dapat dinyatakan dengan b DIS a.
6. Relasi ORD (ordering)
Relasi ORD menyatakan bahwa dua benda memiliki urutan tertentu satu sama lain, baik urutan waktu maupun urutan tempat. Relasi ini digunakan untuk membandingkan urutan dua benda dan dapat juga digunakan untuk mengungkapkan hubungan “ < ” yang dikenal dalam matematika. Misalnya “pagi (sebelum) sore” dapat dinyatakan dengan word graph berikut:
Gambar 8 Contoh penggunaan relasi ORD. 7. Relasi PAR (attribute)
Relasi PAR menyatakan bahwa sesuatu memiliki sifat sesuatu yang lainnya. Relasi ini digunakan untuk menjelaskan bahwa satu elemen berkaitan dan memiliki sifat elemen lainnya. Contoh “cabe merah” kata merah merupakan attribute dari “cabe” atau dengan kata lain “merah” merupakan warna dari “cabe”, maka contoh tersebut dapat dinyatakan oleh word graph sebagai berikut:
Gambar 9 Contoh penggunaan relasi PAR.
Relasi PAR juga dipergunakan untuk menghubungkan satuan seperti waktu, panjang, temperatur, berat, umur, dan lain-lain.
8. Relasi SKO (skolem)
Dua buah token dalam teori KG dihubungkan dengan relasi SKO jika token yang satu informasinya bergantung pada token yang lain. Menurut Van den Berg (1993), relasi SKO dalam teori KG menyatakan informasi bergantung dan mampu menggambarkan kuantifikasi. Relasi ini digunakan dalam logika predikat yang memuat existential quantifiers maupun universal quantifiers. Perhatikan pernyataan , yang memuat universal
ORD
pagi sore ALI ALI
PAR
quantifiers. Pada pernyataan tersebut pemilihan y bergantung pada x. Word graph-nya dapat dinyatakan sebagai berikut
Gambar 10 Contoh penggunaan relasi SKO. 9. Ontologi F (focus)
Ontologi F digunakan untuk menunjukkan fokus dari suatu graph (Hoede & Nurdiati 2008a). Focus untuk menunjukkan intisari dari suatu pernyataan, focus digambarkan dengan pemberian arsiran pada token. Penggunaan ontologi ini, misalnya untuk menyatakan word graph “longsor rusak persawahan” yang dapat dinyatakan sebagai berikut:
Gambar 11 Contoh penggunaan ontologi F.
Gambar 11 di atas menunjukkan bahwa focus dari “longsor rusak persawahan” terletak pada token “longsor”.
Frame merupakan verteks berlabel. Relasi frame menyatakan bahwa verteks berlabel tersebut sebenarnya suatu frame dari beberapa graf yang lebih kompleks. Relasi frame relationships pada KG ada empat macam (Zhang 2002):
1. Focusing on a situation : FPAR 2. Negation of a situation : NEGPAR 3. Possibility of a situation : POSPAR 4. Necessity of a situation : NECPAR.
Jika suatu graph merepresentasikan suatu pernyataan, misalkan p: “tanah ini gembur”, yang dinyatakan dengan frame, maka negasi dari p dengan graph yang sama dan diberi frame relasi NEGPAR (NEG), possibility dari p dinyatakan dengan graph yang sama dan diberi frame dengan relasi POSPAR (POS), necessity dari p dinyatakan dengan graph yang sama dan diberi frame dengan relasi NECPAR (NEC) (Zhang, 2002). Untuk lebih jelasnya dapat digambarkan sebagai berikut:
SKO
x ALI ALI y
CAU
longsor ALI CAU persawahan
ALI rusak
Gambar 12 Contoh penggunaan 4 frame relationships.
Gambar 12 secara berurutan menunjukkan graph dari pernyataan bahwa: “tanah ini gembur”, “tidak benar tanah ini gembur”, “mungkin tanah ini gembur”, dan “seharusnya tanah ini gembur”.
p p p p
Metodologi penelitian yang akan dilaksanakan terdiri atas tiga tahap yaitu tahap pertama analisis struktur kata sifat, tahap kedua pembuatan aturan word graph kata sifat bahasa Indonesia dan tahap ketiga pengujian aturan word graph kata sifat bahasa Indonesia.
Tahap 1: Analisis Struktur Kata Sifat pada Bahasa Indonesia
Hal-hal yang diperlukan dalam analisis struktur kata sifat pada bahasa Indonesia adalah mengidentifikasi kata sifat yaitu dengan cara menglasifikasi kata sifat berdasarkan bentuk kata sifat yaitu kata sifat dasar dan kata sifat turunan, sehingga pada tahapan ini akan diperoleh jumlah kata sifat bahasa Indonesia dan meminimalisir kata sifat yang terdapat hubungannya dengan pertanian. Daftar kata sifat yang diklasifikasikan diperoleh dari bentuk kata sifat dasar dan bentuk kata sifat turunan yang mengalami afiksasi. Langkah selanjutnya dari identifikasi adalah menganalisis makna kata sifat, berdasarkan kamus besar bahasa Indonesia dan mempergunakan referensi yang ada, sehingga akan dilakukan pengelompokan kata sifat berdasarkan makna yang dinyatakan setiap kata sifat.
Tahap 2: Pembuatan Aturan Word Graph Kata Sifat pada Bahasa Indonesia Tahap kedua dalam proses pembuatan aturan word graph kata sifat pada bahasa Indonesia adalah mempelajari jenis-jenis relasi dasar dalam KG yang akan diterapkan pada pembentukan word graph kata sifat, sehingga dapat ditentukan jenis-jenis relasi KG yang akan digunakan dalam penelitian ini. Jika relasi telah diperoleh maka dibuat aturan word graph kata sifat bahasa Indonesia. Jadi setiap kata sifat bahasa Indonesia akan diimplementasikan ke dalam bentuk word graph berdasarkan bentuk dan makna kata sifat. Langkah selanjutnya adalah mengelompokkan kata sifat berdasarkan bentuk word graphnya. Berdasarkan pengelompokan tersebut akan disusun aturan pembentukan word graph kata sifat bahasa Indonesia.
Tahap 3: Pengujian Aturan Word Graph Kata Sifat Pada Bahasa Indonesia Setelah didapatkan aturan pola pembentukan word graph kata sifat, selanjutnya dilakukan uji hasil aturan tersebut. Pengujian ini diberikan kepada kata sifat lain yang tidak termaktub dalam pembahasan, pengujian dilakukan secara berulang-ulang sehingga diperoleh aturan yang berlaku umum.
Tahapan metodologi di atas mengikuti alur seperti dalam flowchart berikut:
Gambar 13 Flowchart metodologi aturan pembentukan word graph kata sifat pada bahasa Indonesia.
Perbaiki aturan
pembentukan word
graph kata sifat
Finish Aturan pembentukan word graph kata sifat
Tidak
Tidak Start
Analisis kata sifat
Pembuatan aturan
pembentukan word
graph kata sifat
Pengujian hasil aturan pembentukan untuk kata sifat yang lain
Apakah hasil aturan sudah benar
Apakah aturan telah berlaku umum
Ya
4.1
Analisis Struktur Kata Sifat
Dari segi bentuknya, kata sifat terdiri atas kata sifat dasar yang selalu
monomorfemis dan kata sifat turunan yang selalu polimorfemis. Sebagian besar kata
sifat dasar merupakan bentuk monomorfemis. Kata sifat turunan yang selalu
polimorfemis dibentuk dengan tiga cara: pengafiksan, pengulangan, dan pemaduan
dengan kata lain.
Berdasarkan segi semantik, kata sifat dapat dibagi atas: deskripsi warna,
deskripsi ukuran, deskripsi waktu, deskripsi jarak, deskripsi suasana hati, deskripsi
kualitas, dan deskripsi pencerapan.
4.1.1