Salah satu metode yang berguna untuk meringkas teks yang saat ini sedang berkembang adalah knowledge graph atau KG. Metode ini pertama kali muncul pada tahun 1982 di Department of Sociology, Groningen, Belanda. Penelitian ini kemudian diteruskan oleh Prof. Dr. C. Hoede di Universitas Twente. KG adalah suatu metode yang digunakan untuk menganalisis teks dan merepresentasikan teks tersebut ke dalam bentuk graf (Zhang & Hoede 2000).
KG merupakan graf berarah yang terdiri atas vertex untuk merepresentasikan konsep dan link untuk merepresentasikan relasi antarkonsep dengan himpunan relasi yang terbatas (Lehmann 1992). KG merupakan kombinasi dan integrasi antargraf yang diekstrak dari berbagai teks sehingga dapat tergambarkan suatu konsep dan relasinya. Proses untuk mengekstrak informasi dari suatu teks disebut text analysis. Lebih lanjut Kramer (1996) mengatakan bahwa KG adalah suatu instrumen yang menggambarkan struktur terkonsep yang sudah tertentu sehingga relasi-relasi antara suatu rangkaian dapat diminimalkan dan terbatas. Tujuannya mengekstrak relasi-relasi dari sebuah teks yang menerangkan suatu subjek pada bidang tertentu untuk dituangkan dalam bentuk graf (Vries 1989). Pada dasarnya teori KG terdiri atas concept, binary relationship, dan multivariate relationship (Zhang 2002).
26
2.3.1 Konsep
Dalam graf, konsep diinterpretasikan dengan node. Menurut van den Berg (1993), konsep dapat dinyatakan sebagai token (simbol, tanda, karakteristik, dsb),
type, dan name.
Token adalah konsep yang dipahami oleh seseorang menurut cara pandangnya masing-masing, hal ini berakibat adanya unsur subjektivitas. Misalnya ketika berhadapan dengan kata rambutan maka akan muncul dalam pikiran tiap-tiap orang bisa rasa, bentuk, warna, dan sebagainya. Token dalam KG dinyatakan dengan , yang menandakan adanya sebuah konsep dan dapat disejajarkan dengan fungsi argumen dalam logika. Adapun type dan name
memiliki kondisi yang hampir sama, keduanya dapat dibedakan dari relasi yang menghubungkannya dengan token. Type merupakan konsep yang berupa informasi umum dan bersifat objektif karena ada kesepakatan sebelumnya, sedangkan name adalah sesuatu yang bersifat individual.
2.3.2 Word graph
Word graph adalah konsep dan relasi yang direpresentasikan dalam bentuk graf (Zhang & Hoede 2000). Dalam teori KG, pengetahuan baru akan terkandung dalam sebuah teks yang diringkas dari dokumen tertentu dan dinyatakan dengan
text graph. Text graph adalah gabungan beberapa sentence graph. Di bawah
sentence graph terdapat word graph yang merupakan graf kata dan menyatakan arti dari kata.
2.3.3 Relasi dan Aspek-aspek Ontologi
Relasi adalah suatu hubungan yang menghubungkan antara konsep yang satu dengan yang lain. Dalam teori KG terdapat aspek ontologi sebagai gambaran
Text graph
Sentence graph
Word graph
beberapa konsep dan relasi antarkonsep yang dimaksudkan untuk mendefinisikan ide-ide yang merepresentasikan konsep, relasi, dan logikanya. Dengan cara seperti ini sebuah model dapat dibangun untuk memahami bahasa alami.
Teori KG memperkenalkan ontologi word graph berupa token yang dinyatakan dengan node dengan simbol , 9 binary relationships, dan 4 frame relationships yang dapat dijelaskan sebagai berikut (Zhang 2002):
1. Relasi kesamaan (ALIKENESS/ALI)
Relasi ini digunakan untuk menghubungkan sebuah type dengan token. Contoh : “padi” adalah type
2. Relasi kausalitas (CAUSALITY/CAU)
Relasi ini menggambarkan hubungan sebab dan akibat antara sesuatu yang saling memengaruhi. Relasi ini dapat digunakan dalam menghubungkan dua konsep yang terdiri atas kata benda dan kata kerja, antara subjek
petani dan predikat (kata kerja tanam) maupun predikat dengan objek
padi. Contoh: Petani menanam padi.
3. Relasi kesederajatan (EQUALITY/EQU)
Relasi ini digunakan untuk menunjukkan konsep yang sederajat, mengungkapkan dua hal yang identik. Dapat pula dikatakan bahwa relasi ini untuk menghubungkan sebuah name dengan token. Kalimat yang menyatakan relasi EQU biasanya menggunakan kata adalah, merupakan, dan sebagainya. Contoh: Montong adalah nama duren, karena adalah
dapat direpresentasikan dengan relasi EQU maka gambar montong
sebagaimana terlihat pada Gambar 5 (kiri). Relasi EQU juga dapat digambarkan dengan tanda hubung seperti Gambar 5 (kanan) jika menunjukkan dua buah konsep yang sama.
padi ALI
Gambar 3 Contoh penggunaan relasi ALI.
CAU CAU ALI ALI ALI petani padi tanam
28
4. Relasi yang bertautan (SUBSET/SUB)
Relasi ini menggambarkan dua buah token yang mengekspresikan rangkaian secara bertautan, maksudnya sesuatu merupakan bagian dari sesuatu yang lain. Dalam relasi, jika diberikan dua buah konsep A dan B, maka terdapat dua kemungkinan, yaitu konsep A lebih luas dari B atau sebaliknya konsep B lebih luas dari A. Dasar relasi ini menggambarkan satu bagian dari sebuah konsep yang utuh sehingga fungsi SUB erat kaitannya dengan konsep kepemilikan. Contoh: Daun bagian dari pohon. Karena bagian merepresentasikan relasi SUB maka word graphnya sebagai berikut.
5. Relasi perbedaan (DISPARATNESS/DIS)
Relasi ini menggambarkan bahwa antara dua token tidak ada hubungannya. Logika matematikanya jika A DIS B, maka A B = . Contoh: Padi berbeda dengan ubi. berbeda merupakan satu contoh relasi DIS sehingga word graphnya sebagai berikut.
6. Relasi yang berurutan (ORDERING/ORD)
Relasi ini menjelaskan bahwa dua benda memiliki urutan satu sama lain, bisa urutan waktu maupun urutan tempat. Contoh: dari awal sampai akhir.
dari dan sampai menggambarkan relasi ORD sehingga contoh di atas dapat dibuat word graphya sebagai berikut.
montong EQU EQU
Gambar 5 Contoh penggunaan relasi EQU
daun ALI SUB ALI pohon
Gambar 6 Contoh penggunaan relasi SUB.
padi ALI DIS ALI ubi
Gambar 7 Contoh penggunaan relasi DIS.
awal ALI ORD ALI akhir
7. Relasi atribut (ATTRIBUTE/PAR)
Relasi PAR digunakan untuk menjelaskan satu elemen berkaitan dan memiliki sifat elemen lainnya. Misalnya daun hijau, kata hijau merupakan atribut dari daun. Karena hijau merupakan atribut dan merepresentasikan relasi PAR maka dapat dibuat word graph sebagai berikut.
8. Relasi kebergantungan informasi (SKOLEM/SKO)
Relasi ini berlaku jika konsep yang satu informasinya bergantung pada konsep yang lain. Relasi SKO dalam KG menyatakan informasi bergantung dan mampu menggambarkan kuantifikasi. Selain itu, digunakan juga dalam logika predikat yang memuat existential quantifiers
maupun universal quantifiers (van den Berg, 1993). Contoh: nilai a bergantung b
9. Ontologi FOCUS (F)
Ontologi F, di sini disimbolkan dengan , digunakan untuk menunjukkan fokus dari suatu graf. Contoh: Petani menanam padi, fokus dalam kalimat tersebut adalah tokenpetani yang digambarkan dengan token berarsir.
Kemudian 4 frame relationships, yaitu; 1) Focusing on a situation : FPAR 2) Negation of a situation : NEGPAR 3) Possibility of a situation : POSPAR 4) Necessity of a situation : NECPAR
CAU CAU ALI ALI ALI petani padi tanam
hijau ALI PAR ALI daun
Gambar 9 Contoh penggunaan relasi PAR.
a ALI SKO ALI b
Gambar 10 Contoh penggunaan relasi SKO.
30
Empat frame di atas dapat merepresentasikan sebuah pernyataan yang dibentuk dalam graf, misalnya p = bulan ini panen, dinyatakan dengan frame. Maka negasi dari p dapat dinyatakan dengan graf yang sama dan diberi frame
dengan relasi NEGPAR. Frame dengan relasi POSPAR dapat ditambahkan dalam graf p jika menjadi modal preposisi, hal itu juga berlaku untuk NECPAR. Berikut adalah gambarnya.
Gambar di atas secara berturut-turut dapat diartikan sebagai bulan ini panen, bulan ini tidak panen, mungkin bulan ini panen, dan seharusnya bulan ini panen.
2.3.4 Kata Kerja dan Ekspresinya dalam KG
Sebagaimana diuraikan pada bagian awal Bab 2, kata kerja adalah kelas kata yang menyatakan suatu tindakan, keberadaan, pengalaman, atau pengertian dinamis lainnya. Secara umum berdasarkan relasi predikatnya, kata kerja terbagi
menjadi dua yaitu kata kerja transitif dan kata kerja intransitif.
Hoede dan Nurdiati (2008a) memberi acuan contoh sentence graph kalimat aktif dan pasif yang dapat ditransformasi sebagai berikut: Petani mencangkul sawah dan Sawah dicangkul petani. Sentence graph kalimat tersebut adalah:
Gambar 13 menunjukkan bahwa kata kerja mencangkul merupakan proses pekerjaan sehingga word graphnya sebagaimana dibatasi garis putus-putus. Letak fokus (token berarsir) berada pada kata kerja yang satu frame dengan subjek
petani. Hal ini berbeda dengan kata kerja dicangkul yang fokusnya satu frame
p p p p
NEG POS NEC
Gambar 12 Contoh penggunaan 4 frame relationships.
sawah petani
mencangkul Cangkul
ALI CAU CAU ALI
ALI ALI
dengan objek sawah. Perbedaan ini karena posisi subjek memiliki makna tidak sama dalam kalimat aktif dan pasif. Berikut adalah word graph yang terbangun.
Contoh berikut juga memberikan penjelasan word graph kata kerja dengan penambahan prefiks ber-, misalnya kata berangkat yang berupa kata kerja aktif intransitif dan menggambarkan sebuah proses serta bermakna meninggalkan. Berikut adalah word graph dari kata kerja berangkat.
sawah petani
dicangkul cangkul
ALI CAU CAU ALI
ALI ALI
Gambar 14 Contoh word graph kata dicangkul.
angkat
ALI berangkat
ALI
BAB III
METODE PENELITIAN
Pada bagian ini disajikan beberapa tahapan yang dilaksanakan pada penelitian ini :