• Tidak ada hasil yang ditemukan

TINJAUAN PUSTAKA Natural Language Processing (NLP)

Secara umum, natural language atau bahasa alami (yang digunakan manusia) adalah metode dan sistem simbol yang paling banyak digunakan untuk mengekspresikan pikiran manusia dan pertukaran informasi. Terdapat sebuah pemisah antara bahasa formal atau bahasa buatan (yang digunakan oleh komputer) dan bahasa alami. Komunikasi antara komputer dan manusia hanya dimungkinkan ketika banyak penelitian yang bertujuan untuk menjembatani pemisah di antara keduanya (Zhang 2002). Secara alami menggambarkan dan memodelkan bahasa alami adalah dasar untuk perkembangan dari proses memaknai bahasa alami dan menentukan arah proses penelitian dari bahasa alami.

Proses memahami bahasa alami disebut parsing. Dalam melakukan parsing terhadap sebuah kalimat, diperlukan tata bahasa untuk menggambarkan bagian-bagian dari kalimat tersebut. Ada dua faktor yang diperhatikan dalam menganalisis sebuah kalimat, yaitu sintaksis dan semantik. Perbedaan sintaksis dan semantik adalah sintaksis melakukan analisis

berdasarkan bentuk dari sebuah kalimat sedangkan semantik menganalisis bagaimana mengartikan suatu kalimat (Hulliyah 2007). Stemming

Stemming merupakan proses menemukan kata dasar dari suatu kata berimbuhan dengan membuang awalan (prefiks) dan akhiran (sufiks). Tujuannya adalah untuk menghemat media penyimpanan dan mempercepat proses pencarian kata (Liddy 2001).

Knowledge Graph (KG)

Teori KG adalah jenis sudut pandang baru, yang digunakan untuk menggambarkan bahasa manusia saat lebih memfokuskan pada aspek semantik daripada aspek sintatik. KG mempunyai kemampuan lebih kuat untuk mengekspresikan dan menggambarkan lebih dalam semantic layers. KG juga dapat meminimumkan penggunaan relation set dan menirukan pengertian dari jalan pikiran manusia (Zhang 2002).

KG sebagai bagian dari metode baru yang merepresentasikan pengetahuan, tergolong pada kategori semantic network. Dalam prinsipnya, KG tersusun dari concept (tokens dan types) dan relationship (binary dan multivariate relation) (Zhang 2002).

Concept

Representasi pemikiran yang dapat dimodelkan dengan KG disebut dengan mind graph. Concept merupakan komponen dari mind graph yang menerangkan persepsi mengenai sesuatu (Zhang 2002).

Token

Token merupakan node dalam KG, yang dinyatakan dengan simbol

. Token menyatakan segala sesuatu yang kita alami dalam dunia nyata atau bahkan mengenai sebuah konsep dalam pikiran kita. Dalam metode KG segala sesuatu akan direpresentasikan atau digambarkan sebagai sebuah token (Zhang 2002) .

Type

Type adalah konsep yang berisi informasi umum. Type bersifat objektif karena merupakan hasil kesepakatan bersama (Zhang 2002). Word Graph

Word Graph adalah unit dasar dari NLP. Word graph dibangun dari kata depan dan kata tambahan (seperti kata sifat dan kata keterangan) (Zhang 2002). Word graph

Pluto EQU anjing

EQU ALI merupakan graph dari kata atau serangkaian

kata. Dalam metode KG, setiap kata berhubungan dengan sebuah word graph, menyatakan arti kata yang disebut dengan semantic word graph. Gabungan semantic word graph dalam sebuah kalimat akan membentuk sentence graph. Graf yang merepresentasikan gabungan dari sentence graph dalam sebuah teks disebut text graph yang terdapat pengetahuan di dalamnya (Hoede & Nurdiati 2008).

Aspek Ontologi

Ontologi adalah ilmu untuk menggambarkan beberapa konsep dan relasi-relasi diantaranya dengan maksud memberikan definisi yang cukup terhadap ide-ide yang dituangkan dengan komputer untuk merepresentasikan ide-ide tersebut dan logikanya (Hulliyah 2007). Berdasarkan ontologi yang dimiliki inilah KG dapat membangun sebuah model yang dapat digunakan untuk memahami bahasa alami. Hal ini diperlukan agar arti dari suatu kalimat dapat diekspresikan. Arti dari kata harus terlebih dahulu diketahui untuk dapat mengartikan sebuah kalimat (Rusiyamti 2008).

Ontologi word graph sampai saat ini direpresentasikan dengan sebuah node, 8 types binary relationship, dan 4 types n-ary relationship atau disebut juga frame relationship serta Ontologi F (Focus). Berikut ini adalah gambaran dari 8 types relationship (Zhang 2002) dan Ontologi F (Focus):

1 ALI (Alikeness)

Relasi ALI digunakan di antara dua token yang memilki unsur-unsur yang sama. Contoh penggunaan relasi ALI dapat dilihat pada Gambar 1.

Gambar 1 Contoh penggunaan relasi ALI. 2 CAU (Causality)

Relasi CAU mengekspresikan hubungan antara sebab dan akibat, atau sesuatu hal yang memengaruhi sesuatu yang lain. Contoh: “Ibu makan nasi”. Kalimat tersebut dapat dilihat pada Gambar 2.

Gambar 2 Contoh penggunaan relasi CAU.

3 EQU (Equality)

Relasi ini digunakan di antara dua token yang mengekspresikan keduanya adalah sama dan sederajat. Contoh: “anjing bernama Pluto”. Pernyataan tersebut dapat dilihat pada Gambar 3.

Gambar 3 Contoh penggunaan relasi EQU. 4 SUB (Subset)

Bila terdapat dua token yang mengekspresikan dua rangkaian secara berurutan dan satu token merupakan bagian dari token yang lainnya, di antara kedua token tersebut terdapat relasi SUB. Contoh: “ekor merupakan bagian dari kucing”. Pernyataan tersebut dapat dilihat pada Gambar 4.

Gambar 4 Contoh penggunaan relasi SUB. 5 DIS (Dissparatness)

Relasi DIS digunakan untuk mengekspresikan bahwa dua token tidak memiliki hubungan satu dengan yang lainnya. Contoh relasi DIS digunakan untuk menunjukan kata “berbeda”, misalnya: “air berbeda dengan minyak” dapat dinyatakan dengan graph yang diperlihatkan pada Gambar 5.

Gambar 5 Contoh penggunaan relasi DIS. 6 ORD (Ordering)

Relasi ORD mengekspresikan bahwa dua hal mempunyai urutan satu sama lain. Contoh penggunaan relasi ORD untuk menyatakan “pagi sampai sore”, ditunjukkan pada Gambar 6.

Gambar 6 Contoh penggunaan relasi ORD. ORD

sore

pagi ALI ALI

DIS

minyak

air ALI ALI

SUB

kucing

ekor ALI ALI

ALI tumbuhan nasi ALI makan ALI CAU CAU ALI ibu

7 PAR (Attribute)

Relasi PAR mengekspresikan bahwa sebuah token adalah sebuah atribut dari token yang lain. Contohnya untuk menyatakan frasa “apel merah” . Pernyataan tersebut dapat dilihat pada Gambar 7.

Gambar 7 Contoh penggunaan relasi PAR. 8 SKO (Informational Dependency)

Relasi skolem (SKO) digunakan jika suatu token informasinya bergantung pada token yang lainnya. Contoh: pernyataan

y)

(x

N

y

N,

x

=

2 yang memuat universal quantifiers. Pada pernyataan tersebut nilai y bergantung pada x. Bentuk grafnya dapat dilihat pada Gambar 8.

Gambar 8 Contoh penggunaan relasi SKO. 9 Ontologi F (Focus)

Ontologi F digunakan untuk menunjukkan fokus dari suatu graf (Nurdiati & Hoede 2009). Ontologi F digunakan untuk menunjukkan kata atau kalimat yang diterangkan dalam suatu pernyataan (inti).

Sebuah frame adalah sebuah node yang diberikan label (Zhang 2002). Adapun untuk empat frame relationship dapat dijelaskan sebagai berikut:

1 FPAR: Focusing on a situation

FPAR mengekspresikan bahwa sekumpulan subgraph dari graph adalah bagian dari seluruh graph yang telah dibentuk. Misalkan dinyatakan bahwa a: “Adik Bahagia”. Pernyataan tersebut dapat dilihat pada Gambar 9.

Gambar 9 Contoh penggunaan frame FPAR. 2 NEGPAR: Negation of a situation

NEGPAR mengekspresikan peniadaan atau pengingkaran terjadinya isi dari frame. Misalkan diketahui a: “Adik Bahagia”. Frame

pada Gambar 10 menunjukkan bahwa adik tidak bahagia.

Gambar 10 Contoh penggunaan frame NEGPAR.

3 POSPAR : Possibility of a situation

POSPAR mengekspresikan kemungkinan terjadi dari isi frame. Misalkan diketahui a: “Adik Bahagia”. Frame pada Gambar 11 menunjukkan bahwa mungkin saja adik bahagia.

Gambar 11 Contoh penggunaan frame POSPAR.

4 NECPAR : Necessity of a situation

NECPAR mengekspresikan perlu, butuh atau keharusan terjadi dari isi frame. Misalkan diketahui a: “Adik Bahagia”. Frame pada Gambar 12 menunjukkan bahwa seharusnya adik bahagia.

Gambar 12 Contoh penggunaan frame NECPAR.

Ekspresi Semantik dengan KG

Dalam metode KG untuk membangun model pemahaman bahasa alami dibutuhkan kemampuan untuk menyatakan makna kata atau kalimat. Kemampuan untuk memahami makna kalimat harus disertai pemahaman makna setiap kata. Kemudian makna setiap kata disusun menjadi makna suatu kalimat secara keseluruhan (Zhang 2002).

Pemaknaan setiap kata menjadi dasar pembentukan word graph. Pemaknaan kata dinyatakan dalam bentuk hubungan antar konsep. Makna kata dalam metode KG membangun struktur arti sehingga dapat mengatasi ambiguitas.

SKO

y

x

ALI ALI

PAR

merah

Frasa Kata

Pike (1977) menyatakan bahwa frasa adalah perluasan kata. Wujudnya dua kata atau lebih. Tataran frasa urutannya ada di bawah klausa dan di atas kata (Cook 1969). Frasa dibentuk dari beberapa kata dan mengisi gatra pada tataran klausa. Jadi, beda kata dari frasa hanyalah kenyataan bahwa frasa merupakan perluasan dari kata atau dengan kata lain frasa adalah bentuk bahasa dimana kata menjadi unsur pembentuknya. Dalam frasa tunggal, kata adalah unsur langsungnya.

Frasa adalah satuan gramatikal berupa gabungan kata dengan kata bersifat nonprediktif. Menurut hubungan unsur dalam strukturnya, frasa dapat dibedakan atas:

1 Frasa Eksosentris

Sebuah frasa bersifat eksosentris bila hasil gabungan itu berlainan kelasnya dari unsur yang membentuknya (Keraf 1991). Konstruksi ini dapat dibedakan atas :

• Frasa eksosentris direktif

Dalam bentuk semacam ini sebuah unsur pembentuk frasa akan bertindak sebagai partikel, sedang unsur lainnya merupakan sumbu (aksis). Misalnya: mengalami penurunan dan pemerasan kopra.

• Frasa eksosentris konektif

Dalam bentuk ini salah satu unsurnya adalah konektor yang berfungsi sebagai penghubung antar unsur pembentuk frasa yang menjadi atribut predikat dengan subjeknya (Keraf 1991). Dalam hal ini atribut predikat tidak menerangkan konektornya, tetapi menerangkan subjeknya. Misalnya: menjadi tepung dan adalah keberagaman.

2 Frasa Endosentris

Sebuah frasa bersifat endosentris bila gabungan dua kata atau lebih yang menunjukkan bahwa kelas kata dari perpaduan itu sama dengan kelas kata dari salah satu (atau lebih) unsur pembentuknya (Keraf 1991). Kata yang kelas katanya sama dengan kelas kata penggabungan itu disebut inti atau pusat. Frasa endosentris dapat dibedakan menjadi:

• Frasa atribut atau subordinatif

Frasa atribut atau subordinatif adalah frasa yang salah satu dari unsur pembentuknya bertindak sebagai inti. Adapun unsur yang lainnya bertindak sebagai atribut dari inti.

Misalnya: kebun petani dan pendapatan petani.

• Frasa koordinatif

Frasa koordinatif adalah frasa yang unsur-unsur pembentuknya sama kedudukannya. Dalam tipe frasa ini, kelas dari gabungan itu sama dengan kedua atau lebih unsurnya. Misalnya: masuk keluar dan manis pahit.

Di samping berdasarkan hubungan unsur dalam strukturnya, frasa juga dapat dibedakan berdasarkan kelas kata yang menjadi inti frasa (Keraf 1991). Jenis frasa koordinatif adalah: 1 Frasa Nominal (FN)

Frasa nominal atau frasa kata benda adalah kelompok kata yang menyatakan atau menunjuk suatu benda. Inti frasa nominal adalah kata benda. Misalnya: modal bersama dan mutu tepung jagung.

2 Frasa Verbal

Frasa verbal atau frasa kata kerja adalah kelompok kata yang menyatakan tindakan atau perbuatan. Inti frasa verbal adalah kata kerja. Misalnya: dihadapi petani dan meningkatkan biaya pengendalian.

3 Frasa Adjektival

Frasa adjektival atau frasa kata sifat adalah kelompok kata yang menyatakan sifat atau keadaan. Inti frasa adjektival adalah kata sifat. Misalnya: tahan kekeringan dan putih bening. 4 Frasa Preposisional

Frasa Preposisional atau frasa kata depan adalah kelompok kata yang terdiri dari preposisi sebagai inti diikuti oleh kata atau kelompok kata lain terutama kata benda. Fungsi frasa preposisi antara lain menunjuk arah, tempat, dan waktu. Misalnya: di lapangan dan dari pangkal daun.

Gabungan antara kata dengan kata yang membentuk sebuah frasa menimbulkan pengertian baru atau mendukung sebuah relasi tertentu (Keraf 1991). Hubungan makna antar unsur yang membentuk frasa dapat berupa: 1 Relasi posesif adalah relasi yang

menunjukkan hubungan pemilik. Kata kedua (pembatas) adalah pemilik kata pertama. Frasa ini dapat dipisahkan dengan kata milik dan kepunyaan. Misalnya: ”kemampuan petani” dan kandungan nutrisi jagung.

2 Relasi subjektif adalah relasi yang pembatasnya adalah pelaku dari kata yang

dibatasi. Frasa ini dapat dipecahkan dengan menyisipkan kata oleh dan yang dilakukan oleh. Misalnya: dihadapi petani dan ditampung pihak swasta.

3 Relasi objektif adalah relasi yang kata keduanya sebenarnya menjadi objek dari kata pertama. Frasa ini sebenarnya hasil substantivasi frasa objektif direktif. Frasa ini dapat dipecahkan dengan menggunakan kata akan, kepada, dan tentang. Misalnya: menghasilkan tekstur dan memenuhi kebutuhan pangan.

4 Relasi tujuan adalah relasi yang pembatasnya merupakan tujuan dari kata yang dibatasi. Frasa ini dapat dipecahkan dengan kata bagi, buat, guna, dan untuk. Misalnya: makanan rakyat dan untuk membeli solar.

5 Relasi keahlian adalah relasi yang pembatasnya merupakan keahlian dari kata yang dibatasi. Dapat digunakan kata dalam bidang untuk memisahkan frasa itu. Misalnya: petani kelapa dan dokter ahli saraf.

6 Relasi asal adalah relasi yang pembatasnya merupakan asal dari kata yang dibatasi. Frasa ini dapat dipecahkan dengan menyisipkan kata dari dan yang berasal dari. Misalnya: tenaga mesin dan dari pangkal daun.

7 Relasi partitif adalah relasi yang pembatasnya merupakan keseluruhan dari kata yang dibatasi atau kata yang dibatasi merupakan bagian dari pembatasnya. Parafrasa bentuk ini dapat dilakukan dengan menyisipkan kata dari. Misalnya: biji jagung.

8 Relasi material adalah relasi yang pembatasnya menyatakan materi yang dipakai untuk kata yang dibatasi. Dalam hal ini dapat digunakan kata dari dan dibuat dari untuk menyatakan hubungan itu secara eksplisit. Misalnya: tepung jagung dan minyak kelapa.

9 Relasi perbandingan adalah relasi yang pembatasnya merupakan perbandingan bagi kata yang dibatasi. Frasa ini dipisahkan dengan kata seperti dan bagaikan. Misalnya: berakar serabut dan putih susu.

10 Relasi instrumental adalah relasi yang pembatasnya merupakan alat bagi kata yang dibatasi. Relasi ini dapat dinyatakan dengan menggunakan kata dengan.

Misalnya: tumbuh baik dan dengan kehidupan masyarakat.

11 Relasi lokatif adalah relasi yang pembatasnya merupakan tempat atau tempat bekerja dari kata yang dibatasi. Kata yang dapat disisipkan untuk menyatakan hubungan ini secara eksplisit adalah di, pada, dan dalam. Misalnya: masyarakat Papua dan di kebun petani.

METODE PENELITIAN

Dokumen terkait