• Tidak ada hasil yang ditemukan

REKAYASA MEMAHAMI TEKS MENGGUNAKAN METODE KNOWLEDGE GRAPH KHODIJAH HULLIYAH

N/A
N/A
Protected

Academic year: 2022

Membagikan "REKAYASA MEMAHAMI TEKS MENGGUNAKAN METODE KNOWLEDGE GRAPH KHODIJAH HULLIYAH"

Copied!
110
0
0

Teks penuh

(1)

REKAYASA MEMAHAMI TEKS MENGGUNAKAN METODE KNOWLEDGE GRAPH

KHODIJAH HULLIYAH

SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR

BOGOR 2007

(2)

SURAT PERNYATAAN

Saya menyatakan dengan sebenar-benarnya bahwa segala pernyataan dalam tesis berjudul: Rekayasa Memahami Teks Menggunakan Metode Knowledge Graph, merupakan gagasan atau hasil penelitian tesis saya sendiri, dengan arahan Komisi Pembimbing, kecuali yang dengan jelas ditunjukkan rujukannya. Tesis ini belum pernah diajukan untuk memperoleh gelar atau pencapaian akademik lainnya pada program sejenis ini di perguruan tinggi lain. Semua data dan informasi yang digunakan telah dinyatakan secara jelas dan dapat diperiksa kebenarannya.

Jakarta, Januari 2007 Yang Membuat Pernyataan

Khodijah Hulliyah

(3)

ABSTRACT

One of the advanced characteristics of computer in the future is its ability to verbally interact with its users by using daily natural language instead of sophisticated language.The question then wheather the advance computer technology in the future deals with such expectation. Regarding the swift development of software technology, it could possible be. The determining component is its capacity to process language whose software element attribute to language verbally. Computing world acknowledges two languages; natural languages and programming languages.

The technology Natural Language Processing (NLP) is a technology enable natural language processing commonly delivered by human. The system generally processes input and output in text format. One of NLP applications is text summarization which is a system that summarizes or concludes hundred texts having similar things and produces a new knowledge. The system turns out to be important, especially if someone envisages a problem and aims to take a conclusion from several available texts. Knowledge Graph (KG) is a new method in this NLP application.

Hence, researcher conducts the research and uses KG method in reading a text to achieve a new summarized knowledge which is beneficial to decision making. In this research, researcher undertakes case study by analyzing text compilation dealing with National Education System (Sisdiknas). Concept and relation of the available text compilation is identified. The identification result is then formatted to textual summarized graph from previously rary graph. The textual summarized graph still requires process to get combined graph. After having the sequential fase, simplified graph will be accomplished. The simplified graph is the final result to acquire new information in comprehensing the text compilation.

Keyword: Knowledge Graph, Combined Graph, Simplified Graph, Text Analysis, Concept, Relationship, Text Transfornzation, Concept Identification and Link Iintegration.

(4)

RINGKASAN

KHODIJAH HULLIYAH Rekayasa Memahami Teks Menggunakan Metode Knowledge Graph. Dibimbing oleh JULIO ADISANTOSO dan SRI NURDIATI

Salah satu ciri komputer masa depan adalah kemampuan untuk berinteraksi secara lisan dengan pemakainya menggunakan ucapan sehari-hari dengan bahasa alami (natural language) bukan bahasa yang rumit. Pertanyaannya sekarang adalah mampukah teknologi komputer masa depan melakukan ha1 tersebut? Jika melihat perkembangan teknologi perangkat lunak yang pesat, ha1 tersebut bisa saja terjadi. Komponen yang sangat menentukan adalah kemampuan mengolah bahasa, dimana sebagian komponen perangkat lunaknya akan bersifat language dependent, yaitu perangkat lunak yang melakukan pemrosesan bahasa alami secara lisan. Dalam ilmu komputer kita mengenal ada dua bahasa, yaitu:

bahasa alami dan bahasa buatan.

. Teknologi Natural Language Processing (NLP) adalah teknologi yang memungkinkan untuk melakukan berbagai macam pemrosesan bahasa alami yang biasa digunakan oleh manusia. Sistem ini biasanya mempunyai masukan dan keluaran berupa bahasa tuiisan (teks). Salah satu dari aplikasi NLP adalah Text Summarization, yaitu suatu sistem yang akan melakukan ringkasan atau kesimpulan dari puluhan atau ratusan teks-teks dengan tema yang sama menjadi sebuah rangkuman yang menghasilkan sebuah pengetahuan baru. Sistem ini menjadi sangat penting keberadaannya apabila kita dihadapkan pada sebuah persoalan untuk mengambil sebuah kesimpulan dari berbagai macam teks yang ada. Metode Knowledge Graph (KG), adalah suatu metode baru dari aplikasi NLP ini.

Untuk itu, penulis melakukan penelitian untuk mengunakan metode KG dalam membaca suatu teks guna mendapatkan sebuah ringkasan (knowledge) baru yang dapat dijadikan pengetahuan dalam rangka pengambilan keputusan. Pada penelitian ini, penulis melakukan studi kasus dengan cara menganalisis kumpulan teks yang berhubungan dengan Sistem Pendidikan Nasional (Sisdiknas).

Kumpulan teks yang ada diidentifikasi konsep dan relasinya. Hasil identifikasi tersebut kemudian diformat dalam bentuk graf menjadi teks graf. Teks

(5)

graf yang dihasilkan masih harus diproses kembali untuk mendapatkan combined graph. Melalui tahapan selanjutnya, akan dihasilkan simplified graph. Graf yang sederhana tersebut merupakan hasil akhir untuk mendapatkan sebuah informasi baru dalam memahami kumpulan teks tersebut di atas.

Kata Kunci: Knowledge Graph, Combined Grsph, Simpl~Jed Graph, analisis teks, konsep, relasi, transformasi teks, identifikasi teks dan integrasi link.

(6)

REKAYASA MEMAHAMI TEKS MENGGUNAKAN METODE KNOWLEDGE GRAPH

KHODIJAH HULLIYAH G651024054

Tesis

Sebagai salah satu syarat untuk memperoleh gelar Magister Sains pada

Program Studi Ilmu Komputer

SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR

BOGOR 2007

(7)

Judul Tesis : Rekayasa Melnahalni Teks dengan Menggunakan Metode Knowledge Graph

Nama : Khodijah Hulliyah

NRP : G65 1024054

Program Studi : Ilmu Komputer

Disetujili, Komisi Penlbimbing

r. Ir. Sri Nurdiati, M.Sc Anggota

Diketahui.

Tanggal Ujian : 3 1 Januari 2007 Tanggal Lulus : 1 4 F E B 2007

v

(8)

PRAKATA

Alhamdulillahirabbil'alamin, puji dan syukur penulis panjatkan kepada Allah SWT atas hidayah dan karuniaNya sehingga penulis dapat menyelesaikan tugas penelitian ini dengan judul "Rekayasa Mernahami Teks Dengan Meiiggunakan Metode Knowledge Graph ". Penelitian ini dibuat untuk memenuhi salali satu persyaratan penyelesaian studi pada Progratii Studi Iltiiu Kornputer, Sekolah Pascasarjana lnstitut Pertanian Bogor (I PB).

Penelitian ini dapat terselesaikan atas bantuan dari berbagai pihak. Oleh karena itu penulis ingin menyampaikan teritna kasih yang sebesar-besarnya kepada:

I . Bapak Ir. Julio Adisantoso, M.Kom dan Ibu Dr. Ir. Sri Nurdiati, MSc, selaku dosen pembimbing yang telah banyak menibimbing dan tiiengarahkan penulis.

2. Bapak Dr. Sugi Guritman, selaku Ketua Prograin Studi Illnu IComputer, Sekolah Pascasarjana IPB.

3. Ayahanda dan Ibunda (Almh.) yang tak lienti-henti ~nemberikan do'a dan kasih sayangnya.

4. Suami beserta anak-anak tercinta yang me~iiberikan dorongan, niotivasi dan semangat kepada penulis untuk menyelesaikan tesis.

5 . Indah Mathar dan Nana yang banyak tne~iibantu daiam ~iienyelesaika~i penelitian ini.

6. Rekan-rakan mahasiswa yang telah banyak meniberikan masukan dan saran.

7. Semua pihak yang membantu namun tiak dapat penulis sebutkan satu-persatu.

Berbagai usaha telah penulis upayakan guna terselesaikannya tugas penelitian ini dengan baik, namun penulis menyadari akan kekurangan dan keterbatasan penulis. Oleh karena itu kritik dan saran yang membangun penulis harapkan. Akhir kata penulis berharap semoga tesis ini bermanfaat.

Bogor, Januari 2007 Penulis

(9)

RIWAYAT HIDUP

Penulis dilahirkan di Jakarta, pada tanggal 2 April 1973 sebagai anak ketiga dari ayah bernama Drs. HM. Nadjid Muchtar, MA dan ibu Asiyah Thohir (Almh).

Penulis menempuh pendidikan MI Pembangunan Ciputat, SMP Puteri Khadijah Surabaya, SMUN 34 Pondok Labu Jakarta dan kuliah di Universitas Gunadarma Depok Jurusan Manajemen Informatika (S-1) lulus tahun 1996. Setelah kuliah, penulis menjadi tenaga pengajar pada STMIK Husni Thamrin pada tahun 2000- 2001. Pada tahun 2001 hingga sekarang penulis bergabung sebagai Pegawai Negeri Sipil (PNS) yang ditempatkan di Universitas Islam Negeri (UIN) Syarif Hidayatullah Jakarta, sebagai Tenaga Pengajar pada Fakultas Sains dan Teknologi. Penulis memulai pendidikan pascasarjana di Program Studi llmu Komputer, Sekolah Pascasarjana IPB pada tahun 2002.

vii

(10)

DAFTAR IS1

DAFTAR TABEL

...

x

DAFTAR GAMBAR

...

xi

DAFTAR LAMPIRAN

...

xiv

BAB I PENDAHULUAN I

.

1

.

Latar Belakang Masalah

...

1

1.2. Identifikasi Masalah

...

4

1.3. Batasan Masalah

...

4

1.4. Perumusan Masalah

...

4

. ...

1.5. Tujuan dan Kegunaan Penelitian 5

...

1.6. Metodologi Penelitian 5 1.7. Sistematika Penelitian

...

6

BAB I1 TINJAUAN PUSTAKA

...

2.1. Pendahuluan 7 2.2. Graf

...

8

2.3. Knowledge Graph

...

8

2.3.1. Deskripsi Formal dari Knowledge Graph

...

10

2.3.2. Aspek-aspek Ontologi

...

10

2.3.3. Natural Language Processing (NLP)

...

16

2.3.4. Semantik dalam Natural Language Processing (NLP)

...

16

2.4. Struktural Parsing

...

18

2.5. Bagaimana Mengubah Teks Menggunakan Metode Knowledge Graph

...

18

2.5.1. Analisis Teks

...

19

2.5.2. Latar Belakang Pengetahuan

...

20

2.6. Contoh Transformasi Teks ke dalam Knowledge Graph

...

21

viii

(11)

BAB I11 METODOLOGI PENELITIAN

...

3.1. Kerangka Pe~nikiran 23

...

3.2. Analisis Knowledge Graph 25

...

3.2.1. Transfor~nasi Teks ke dalarn Knowledge Graph 26

3.2.2. Penyederhanaan Graf pada Knowledge Graph ... 27

... 3.3. lnterpretasi Knowledge Graph 30 3.3.1

.

Integrasi Link ... 30

3.3.2. Identifikasi Konsep-konsep Penting ... 31

3.3.3. Klasifikasi Konsep ... 32

3.3.4. Pengujian Konsep ... 32

... 3.4. Penyusunan Piranti Lunak 34 ... 3.4.1. Metode Penyusunan Piranti Lunak 34

...

3.4.2. Bahan dan Alat 34 BAB IV ANALISIS: STUD1 KASUS 4.1. Pendahuluan ... 36

...

4.2. Analisis: Translasi Teks Siste~n Pendidikan Nasional 38

...

4.3. Combined Gruph dari Sistem Pendidikan Nasional 51 ... 4.4. Penyederhanaan Graf (Siwiplified Graph) 52 4.4.1. Proses Penyederhanaan Graf I ... (Siniplified Gruph I) 52 4.4.2. Proses Penyederhanaan Graf I 1 ... (Sinlpllfied Gruph II) 53 4.5. Hasil dari lnterpretasi Knowledge Gruph ... 54

Sistem Pendidikan Nasional ... 54

4.5.1. Identifikasi Konsep yang Penting ... 54

. .

4.5.2. Penguj an Neighhour ... 55

BAB V PERANCANGAN DAN

...

IMPLEMENTASI SISTEM 61

...

5.1. Perancangan Siste~n 61

...

5.1

.

1 . Perancangan Proses 61

(12)

...

5.1.2. Perancangan Basis Data 63

...

5.1.3. Perancangan Menu 63

...

5.2. Implementasi Sistem 65

...

5.2.1. Dokumen Masukan 65

...

5.2.2. Modul Program 66

...

5.3. Hasil 69

BAB VI SIMPULAN DAN SARAN

.

5.1 Simpulan

...

69

...

5.2. Saran 70

(13)

DAFTAR TABEL

Halaman 1

.

Dua Belas Notasi Dasar pada Graf Ontologi menurut Kant

...

10 2

.

Simbol Relasi Dasar dari Metode KG

...

13

...

3

.

Serial Link Integration 30

...

4

.

Tabel yang Digunakan untuk Pengujian Neighbour 32 5

.

Contoh Pengujian Neighbour

...

33 6

.

Bahan dan Alat

...

35 7

.

Teks-teks Pendidikan yang akan diimplementasikan ke dalam teks 41

...

graf

8

.

Hasil Relasi dar Knowledge Gaph

...

59

(14)

DAFTAR GAMBAR

Halarnan

...

Ekspresi Semantik 17

...

Text Representation menggunakan frame 20

...

Terjemahan ke KG 21

Kerangka Pemikiran Analisis Teks dengan Metode KG

...

23

...

Metodologi Analisis Teks dengan Metode KG 25 Proses Analisis Teks

...

26

...

Proses Penyederhanaan Graf 27

...

Contoh sebuah Konstruksi (construct) 28

Serial Link Integration

...

30

...

Parellel Link Integration 30

Neighbours

...

32 Contoh Pengujian Neighbours

...

33

.

Subgraf Tabel no 1

...

46

. ...

Combined Graph dari Subgraf Tabel no 1 46

Subgraf Tabel no.2

...

46

...

Subgraf Tabel no.3 47

. ...

Combined Graph dari Subgraf Tabel no 1 47

...

Subgraf Tabel no.4 47

...

Subgraf Tabel 110.5 48

...

Subgraf Tabel no.6 48

...

Subgraf Tabel no.7 48

...

Subgraf Tabel no.8 49

...

Subgraf Tabel no.9 49

...

.

Subgraf Tabel no 10 49

Subgraf Tabel no

.

11

...

50 Subgraf Tabel no.12

...

50 Subgraf Tabel no

.

13

...

50

xii

(15)

...

.

Subgraf Tabel no 1 I

...

Subgraf Tabel no . 12

...

Subgraf Tabel no . 13

...

Subgraf Tabel no . 14

...

Combined Graph Sisdiknas

...

Simpl$ed Graph 1 Sisdiknas

...

Simplified Graph I1 Sisdiknas

...

I"' Degree Neighbours Sisdiknas

...

I"'

.

2'ld dan 3rd ~ e ~ r e e Neighbours Sisdiknas

...

Terjemahan Tabel 17 ke dalam bentuk Graf

...

Diagram alur Perancangan Proses

...

Perancangan Menu

...

Urutan Proses Tiga Modul

...

Tainpilan menu manajemen teks

...

Tampilan Memasukkan data vertex-detuil

Tampilan Vertex-Detail

...

...

Tabel Count VertexDetail

...

Hasil Akl~ir linpleinentasi Sistein berupa Graf

(16)

BAB I

PENDAHULUAN

1. LATAR BELAKANG MASALAH

llmu komputer memiliki dua komponen utama; pertama, model dan gagasan mendasar mengenai komputasi, kzdua, teknik rekayasa untuk perancangan sistem komputasi yang meliputi piranti keras dan piranti lunak, khususnya penerapan rancangan dan teori. Secara teoritis ilmu komputer diawali dari sejumlah disiplin ilmu yang berbeda, ahli biologi mempelajari neural network, ahli elektro mengembangkan switching sebagai alat untuk mendesain piranti keras, ahli matematika bekerja berdasarkan logika, dan ahli bahasa menyelidiki bahasa untuk natural language [Utdirartatmo, 200 11.

Dalam teknologi komputer, telah dikenal ada teknologi komputer analog dan teknologi komputer digital. Saat ini teknologi komputer telah mampu memanfaatkan keduanya sehingga menjadi teknologi handal, yang mampu menggantikan sebagian pekerjaan manusia atau bahkan pekerjaan yang tidak mampu dilakukan oleh manusia. Dalam konteks penggolongan generasi komputer, diprediksi akan lahir komputer berbasis masa depan yang memiliki memori tanpa batas, kompatibel dengan teknologi lain, memiliki kemampuan analisis dan teknis yang luar biasa yang memberikan kemudahan dan kenyamanan bagi manusia.

Salah satu ciri komputer masa depan adalah memiliki kemampuan berinteraksi secara lisan dengan pemakainya dengan menggunakan ucapan sehari- hari dalam bahasa alami (natural language), bukan bahasa yang rumit'.

Pertanyaannya sekarang, mampukah teknologi komputer masa depan melakukan ha1 tersebut? Jika melihat perkembangan teknologi piranti lunak yang pesat, ha1 tersebut bisa saja terjadi. Komponen yang sangat menentukan adalah kemampuan mengolah bahasa, dimana sebagian koinponen piranti lunaknya akan bersifat language dependent, yaitu piranti lunak yang melakukan pemrosesan bahasa

I Orasi ilmiah DR. Arry Akhmad Arman, Fakultas Teknologi Industri, ITB, 23 Agustus 2004

(17)

alami secara lisan. Dalam ilmu komputer dikenal ada dua bahasa, yaitu bahasa alami2 dan bahasa buatan3.

Chomsky adalah orang yang pertama kali merepresentasikan bahasa dalam rangkaian simbol. Chomsky berhasil memperlihatkan bahwa bahasa apapun dapat direpresentasikan dalam bentuk yang universal. Pemikiran Chomsky yang merepresentasikan bahasa sebagai kumpulan simbol-simbol dan aturan yang mengatur susunan simbol-simbol tersebut telah membuka peluang untuk melakukan pemrosesan bahasa secara simbolik dengan teknologi komputer, sehingga melahirkan bidang ilmu Natural Language Processing (NLP) dalam cabang ilmu bahasa komputasi (computational linguistic) [Arman, 20041.

Teknologi N L P adalah teknologi yang memungkinkan untuk melakukan berbagai macam pemrosesan bahasa alami yang biasa digunakan oleh manusia.

Sistem ini biasanya mempunyai masukan dan keluaran berupa bahasa tulisan (teks). Beberapa di antara berbagai kategori aplikasi NLP adalah [Arman, 20041:

1. Natural Language Translator, yaitu translator dari bahasa alami ke bahasa alami lainnya.

2. Translator dari bahasa alami ke bahasa buatan, yaitu translator yang mengubah perintah-perintah dalam bahasa alami menjadi bahasa buatan yang dilakukan oleh mesin atau komputer.

3. Text Summarization, yaitu sistem yang dapat "membuat ringkasan" hal- ha1 yang penting dari suatu wacana yang diberikan.

Text Summarization menarik untuk diteliti lebih lanjut karena sangat berkaitan erat dengan proses analisis teks dalam ilmu computational linguistic.

Text Summerization adalah suatu sistern yang akan melakukan ringkasan atau kesimpulan dari puluhan atau ratusan teks-teks dengan tema yang sama menjadi sebuah rangkuman yang menghasilkan sebuah pengetahuan baru. Sistem ini menjadi sangat penting keberadaannya apabila kita dihadapkan pada sebuah persoalan untuk mengambil sebuah kesimpulan dari berbagai macam teks yang ada.

2 Bahasa alami adalah suatu bentuk representasi dari pesan yang ingin dikomunikasikan antar manusia

Bahasa buatan adalah bahasa yang dibuat secara khusus untuk memenuhi kebutuhan tertentu misalnya bahasa pemodelan atau bahasa pemrograman tertentu.

(18)

Menganalisis teks menjadi sebuah persoalan tersendiri bagi setiap orang, karena bisa jadi masing-masing akan memiliki pemahaman sendiri terhadap teks tersebut, sehingga bisa jadi akan muncul ambiguitashalam mengartikan kalimat5.

Suatu masalah akan mudah dipahami apabila kita mampu membahasakannya dalam format redaksi penulisan dengan bahasa jelas. Penulisan redaksi tentu akan bersifat subjektif tergantung dari masing-masing orang yang menulis dan menganalisisnya. Titik pandang masalah sangat subjektif bagi setiap individu, orang yang berbeda akan menggambarkan pengalaman yang ditemui ke dalam konsep yang berbeda pula [Zhang, 20021. Dengan kata lain, konsep dengan bahasa yang sama bisa jadi akan diinterpretasikan dengan arti yang berbeda-beda. Hal ini akan melahirkan beragam konsep, yang kemudian akan direlasikan dengan masalah-masalah yang ada, sehingga melahirkan sebuah pengetahuan. Menurut Suriasumantri [1995], pengetahuan mampu dikembangkan manusia disebabkan dua ha1 yaitu, manusia mempunyai bahasa yang mampu mengkomunikasikan informasi, dan jalan pikiran yang melatarbelakangi informasi tersebut

.

Pada beberapa penelitian sebelumnya banyak dibahas tentang ekstraksi teks, antara lain bagaimana melakukan pemangkasan teks yang panjang dalam satu paragraf sehingga menjadi lebih sederhana, tanpa menghilangkan informasi yang terkandung di dalamnya. Hasil penelitian ini sangat berarti bagi pengguna dalam memahami sebuah teks. Jika ingin merangkum banyak teks yang ada sehingga menjadi sederhana dan mudah dipahami perlu dilakukan penelitian lanjutan.

Metode Knowledge Graph (KG) adalah suatu metode baru dari NLP yang merupakan sebuah tinjauan untuk menggambarkan atau menjelaskan bahasa dengan cara menganalisis teks secara harfiah dan diperkaya dengan latar belakang pengetahuannya sehingga menghasilkan sebuah pengetahuan baru [Zhang,2002].

Pengembangan metode KG yang akan diteliti lebih lanjut apakah dia mampu menjawab persoalan-persoalan tersebut.

Untuk itu, penulis melakukan penelitian untuk menganalisis dan mengembangkan metode KG dalam membaca suatu teks untuk mendapatkan

4 keraguan dalam mengartikan sesuatu, memiliki kemiripan arti

Dalam natural language, terdapat beberapa kasus yang memiliki ambiguitas dalam arti sebuah kalimat (Lei Zhang, h.37)

(19)

sebuah ringkasan (knowledge) baru yang dapat dijadikan pengetahuan dalam rangka pengambilan keputusan. Pada penelitian ini, penulis melakukan studi kasus dengan cara menganalisis teks-teks yang berhubungan dengan Sistem Pendidikan Nasional (Sisdiknas). Hal ini karena pendidikan sangat erat kaitannya dengan sumber daya manusia (SDM). SDM yang berkualitas menjadi suatu yang harus dimiliki sebagai aset negara jika tidak ingin menjadi tamu di rumah sendiri di era globalisasi ini.

1.2. IDENTIFIKASI MASALAH

Metode KG bertujuan agar mampu merepresentasikan seluruh pengetahuan yang dapat diekspresikan ke dalam bahasa alami. Dalam ha1 ini penulis akan mengumpulkan data berupa teks yang berkaitan dengan Sisdiknas.

Teks-teks tersebut memiliki konsep-konsep dan link yang merelasikan antar konsep. Proses mendapatkan konsep dan relasi dilakukan dengan cara menganalisis teks sesuai aturan main dari metode tersebut. Dengan cara demikian akan didapat sebuah graf sederhana yang mampu memberikan informasi penting yang menjadi sebuah pengetahuan.

1.3. BATASAN MASALAH

Batasan masalah dari penelitian ini adalah menganalisis teks-teks yang dipilih6 yang berkaitan dengan sisdiknas di Indonesia untuk menentukan konsep dan link-nya, menentukan relasi yang sesuai dengan aturan (rule) dari metode KG dalam bentuk graf berarah. Kemudian graf tersebut diolah menjadi combined graph sampai didapatkan graf yang sederhana (simpl?fied graph).

1.4. PERUMUSAN MASALAH

Penelitian ini melakukan pemetaan masalah pendidikan yang ada di Indonesia dengan menjelaskan relasi antara konsep dengan simbol dan obyeknya (triangle meaning), serta menguraikan keterkaitan konsep tersebut dengan konsep lainnya. Dengan kata lain, pemetaan tersebut memposisikan sebuah konsep umum (generale concepts) untuk dianalisis menjadi beberapa konsep turunan (sub

Teks-teks yang dipilih terlampir

(20)

concepts) dalam satu bagian, serta menunjukkan hubungan konsep turunan tersebut dengan konsep turunan yang lain dalam bagian lain sehingga muncul pengertian baru.

Perumusan masalah pada penelitian adalah:

1. Dapatkah metode KG digunakan sebagai instrumen untuk menganalisis bagaimana memahami banyak teks sehingga mampu memberikan suatu informasi baru?

2. Bagaimana metode KG mampu menyederhanakan masalah yang ada dalam bentuk graf?

1.5. TUJUAN DAN MANFAAT PENELITIAN

Tujuan penelitian ini adalah mengembangkan metode KG sebagai instrumen yang berdayaguna untuk menganalisis teks-teks dengan tema yang sama dalam jumlah yang besar yang kemudian hasilnya menjadi sederhana dalam bentuk graf sehingga dapat dijadikan sebagai pengetahuan baru.

Kegunaan penelitian ini adalah dapat mensosialisasikan dan menunjukkan bahwa metode KG mampu memberikan tambahan pengetahuan sebagai informasi penting yang dapat digunakan dalam pengambilan keputusan.

1.6. METODOLOGI PENELITIAN Metodologi penelitian ini meliputi:

1. Identifikasi Konsep (concept ident~jcation).

Pada tahapan ini dilakukan pengumpulan data yang berupa teks dengan mengkombinasikan konsep-konsep yang mirip, kemudian konsep-konsep tersebut didefinisikan untuk mencari konsep mana yang lebih penting dan layak untuk dipilih.

2. Integrasi Link (link integration).

Tahapan ini digunakan untuk melakukan penambahan atau penggandaan relasi-relasi dari hasil kombinasi dari hubungan antar konsep.

3. Penggabungan graf (Merging of Graphs).

(21)

Tahapan ini melakukan pemetaan masalah-masalah dengan acuan aturan yang ada pada metode KG. Apabila ada dua atau lebih kombinasi graf, dapat dijadikan satu graf baru (combined graph).

4. Pembagian graf menjadi subgraph.

Tahapan ini melakukan penajaman dari graf yang paling penting untuk mendapatkan graf yang sederhana (simplified graph) agar lebih mudah untuk diinterpretasikan.

1.7. SISTEMATIKA PENULISAN

Tulisan sebagai dokumentasi pada penelitian in dibagi ke dalam beberapa bagian dengan susunan sebagai berikut:

Bab I, membahas hal-ha1 yang menjadi latar belakang sampai pada tujuan yang diinginkan pada penelitian ini.

Bab 11, berisi landasan teori yang menjadi rujukan untuk melakukan penelitian ini.

Bab 111, menguraikan metodologi yang dilakukan dalam penelitian ini.

Bab IV, berisi tentang pembahasan proses analisis teks, studi kasus analisis teks dengan tema sistem pendidikan nasional.

Bab V, berisi tentang penjabaran perancangan sistem dan implementasinya.

Bab V1, berisi kesimpulan dari penelitian yang merupakan jawaban dari hasil pembahasan dan saran.

(22)

BAB I1

TINJAUAN PUSTAKA

2.1. PENDAHULUAN

Metode KG merupakan suatu metode barn dalarn bidang ilmu NLP. Penelitian tentang metode ini diawali oleh para peneliti yang berbasis di Universitas Twente dan Universitas Groningen sekitar lima belas tahun yang lalu, yang kemudian dilanjutkan oleh Prof.dr.C.Hoede (Universitas Twente) dengan fokus utamanya adalah aplikasi knowledge graph untuk menganalisis sebuah teks [Blok, 19971.

KG adalah salah satu dari beberapa metode yang ada dalam Knowledge

~e~resentation' (KR), dimana KR ini merupakan topik sentral dari Artijkial Intelligence (AI), salah satu cabang ilmu komputer yang digunakan untuk memecahkan masalah berbasis pengetahuan [Zhang, 20021.

Tujuan KG digunakan untuk merepresentasikan sebuah pengetahuan yang dapat diekspresikan dalam bahasa natural [Kramer, 19961. KG dibangun untuk menjelaskan persepsi manusia ke dalam model semantik dan pemrosesan informasi [Zhang, 20021. Semantik lebih dekat dengan logika dan merupakan bagian dari formal language (sama dengan natural language) dan sebagai langkah besar untuk memahami semantik menjadi "know it and know why" dan bagaimana menggambarkan "thinking and linking something " [Hoede, 20051.

Metode KG melakukan ekstraksi sebuah teks dimana hasil yang dikeluarkan dalam bentuk graf berarah2 [Hoede, 20051. Ekstraksi teks ini melalui proses analisis teks bahasa dengan menitikberatkan lebih pada aspek semantik3 daripada sintaksis4.

I Sebuah jalurlpath atau berupa graf yang berisi inforrnasi-informasi yang telah disepakati '~ipakai untuk rnelukiskan ketergantungan antara atribut-atribut

'~ilsafat bahasa lebih berkenaan dengan arti kata atau arti bahasa (semantic). Salliyanti: Peranan Filsafat Bahasa Dalam Pengembangan llmu Bahasa, 2004, USU Repository 2006

4 Sintaksis diartikan sebagai bidang ilmu bahasa yang mengkaji bentuk, struktur, dan binaan atau konstruksi ayat. la juga ialah kajian mengenai hukum atau rumus tatabahasa yang mendasari kaedah penggabungan dan penyusunan perkataan atau kelompok perkataan untuk membentuk ayat dalam bahasa.

(23)

Teori ini secara luas biasa diaplikasikan pada information sistem modeling, natural language processing, information retrieval dan case base reasoning serta pembelajaran teknik dan kasus-kasus yang berhubungan dengan logika [Sowa,

19921.

KG merupakan sebuah instrumen untuk mewakili Conceptual Structure tertentu dan dengan KG, relasi-relasi antar suatu rangkaian dapat diminimalisir karena sifatnya terbatas [Kramer, 19961.

2.2. GRAF

Suatu graf yang dinotasikan dengan G = (V

,

E) adalah himpunan vertex- vertex V dan himpunan edge E, dimana E dibentuk dari VxV. Dengan kata lain graf adalah kumpulan vertex dan edge yang menghubungkan vertex tersebut [Cormen, et.al, 19901. Ditinjau dari arahnya, graf dibagi menjadi dua yaitu, graf berarah (directed graph) dan graf tidak berarah (undirected graph).

Dalam graf, lintasan (path) adalah urutan vertex ata edge yang dibentuk untuk bergerak dari satu vertex ke vertex yang lain. Pada graf berarah, arah sisi atau urutan ikut diperhatikan. Titik akhir dari suatu lintasan akan menjadi titik awal dari lintasan berikutnya [Utdirartatmo, 200 1 1.

2.3. KNOWLEDGE GRAPH

Metode KG muncul pada tahun 1982 di Departement of Sosiology di Groningen dan the Departemen of Applied Mathematics di Enschede, Belanda, yang kemudian penelitian ini diteruskan oleh Prof.dr.C.Hoede pada Universitas Twente. KG berupa graf berarah yang terdiri dari vertex untuk merepresentasikan konsep dan link untuk merepresentasikan relasi antar konsep dengan himpunan relasi yang terbatas [Lehmann, 19921. Tujuan metode KG adalah untuk mendapatkan gambaran berbagai informasi atau pengetahuan dengan konsep dan relasi-relasi yang saling terhubung, sehingga dapat dibuat sebuah tafsiran baru dan diperoleh pengetahuan lebih lanjut untuk ditarik sebuah kesimpulan. KG diperoleh dengan cara mengkombinasikan berbagai variasi graf dengan berbagai teks yang

(24)

berbeda ke dalam sebuah graf yang terintegrasi, yang mampu menggambarkan konsep dan relasinya dengan cara disederhanakan atau diekstrak kembali. Informasi yang diekstrak dari teksnya disebut text analysis [Vries, 19891.

Ada beberapa prinsip penting dalam KG untuk dibangun ke dalam bentuk tipe relasi yang sederhana, yaitu:

Relasi par, digunakan untuk menyatakan bahwa konsep A sama dengan konsep B

Relasi sub, digunakan untuk menyatakan bahwa konsep A adalah contoh dari atau bagian dari konsep B

Relasi cau, digunakan untuk menyatakan bahwa ada hubungan sebab akibat dari konsep A dengan konsep B. Relasi cau ini ada yang cau+ (korelasi positif) ada juga cau- (korelasi negatif)

Salah satu konsep yang paling penting dari teori KG ini adalah kemiripan.

Jika ada dua persepsi yang mirip, bisa digunakan satu simbol yang sama untuk mengekspresikan persepsi yang mirip itu, atau kedua ha1 itu dapat merupakan bagian dari simbol tersebut sehingga membentuk sebuah struktur. Struktur-struktur dari gabungan simbol itu disebutframe.

2.3.1. DISKRIPSI FORMAL DARI KNOWLEDGE GRAPH

Pada prinsipnya komposisi dari KG terdiri dari Concept (tokens dan types) dan relationship (binary dan multivariate relution) [Zhang, 20021. Dalam KG, seluruh ha1 mengenai konsep memiliki keterkaitan dengan ha1 lainnya.

Konsep dalam graf dinyatakan sebagai node, dan konsep bisa sebagai token (simbol, tanda, karakteristik, dsb) atau sebagai type. Token adalah konsep yang dipahami oleh seseorang menurut cara pandangnya masing-masing sehingga token bersifat sangat subjektif. Di sisi lain, type adalah konsep yang berupa informasi urnum dan bersifat objektif karena merupakan suatu kesepakatan yang dibuat sebelumnya.

(25)

Dalam KG kita bisa membedakan tiga tanda:

3. ~ i m b o l u menandakan adanya sebuah konsep dan dapat disejajarkan dengan fungsi argument dalam logika.

4. Tipe digunakan untuk memberikan nama pada sebuah konsep yang umum.

5. Instantiation (pemberian contoh) digunakan untuk menambahkan model/contoh untuk memperjelas sebuah konsep.

Untuk memahami pengertian suatu pernyataan, perlu dibedakan relasi-relasi yang mungkin terjadi antara beberapa konsep. Relasi mengekspresikan hubungan yang memiliki sebab akibat dan efek dari hubungan keduanya, atau yang saling mempengaruhi satu dengan yang lainnya. Relasi dasar dari KG adalah relasi cause (cau) yang merelasikan tipe yang memiliki daya tarik di dalamnya

2.3.2. ASPEK-ASPEK ONTOLOGI

Ontologi adalah untuk menggambarkan beberapa konsep dan relasi-relasi di antaranya, dengan maksud untuk memberikan definisi yang cukup terhadap ide- ide yang dituangkan dengan komputer untuk merepresentasikan ide-ide tersebut dan logikanya.

Ontologi Kant

Menurut Kant [Zhang, 20021, ada 12 notasi dasar pada graph ontology yang difokuskan pada aspek logika, yaitu:

Tabel 1. Dua Belas Notasi IDasar pada graph ontology menurut Kant

Peirce

Konsep Peirce menggambarkan logika dengan graph, yang disebut existential graph. Ide awalnya dengan menyederhanakan notasi and (A) dan

QUANTITY Unity

Plurality Totality

QUALITY Reality Negation Limitation

RELATION Inherence Causality Commonness

MODALITY Possibility Existence Necessity

(26)

notasi negation (1)untuk dua .frume atau type yang berbeda. Konsep Peirce sebenarnya bisa dijadikan "guide" untuk ontologi Kant, dengan memperkenalkan tiga notasi, yaitu: konsep Jirstness, secondness dan thirdness. Menurut Sowa [1994], definisi Pierce tersebut dapat dijelaskan sebagai berikut:

Firstness : konsepsi yang ada secara independen atas sesuatu yang lain Secondness : konsepsi relatif ada atas dasar reaksi dengan sesuatu

Thidness : konsepsi mediasi, konsep satu dengan yang lain memiliki hubungan

Hubungan ontologi Kant dan Peirce, menimbulkan suatu triple atas metode KG, yaitu: concept, foreground knowledge dan background knowledge.

Berdasarkan kedua ontologi tersebut di atas, maka didapat ontologi yang dijadikan simbol dalam merode KG, yang terdiri dari delapan type binary relationship dan empat type n-ary relationship (yang juga disebutframe relationship).

Delapan binary type relationship adalah:

1 . Equality : equ

2. Subset relationship : sub 3. Similarityofsets, alikeness : ali

4. Disparateness : dis

5. Causality : cau

6 . Ordering : ord

7. Attribution : par

8. Informational dependency : sko Empat n-ary relationship terdiri dari:

1. Focusing on a situation : fpar 2. Negation of a situation : negpar 3. Possibility of a situation : pospar 4. Necessity of a situation : negpar

Berikut penjelasan dari ontologi yang digunakan sebagai simbol dalam metode KG adalah sebagai berikut:

(27)

1. Relasi Kausalitas (CAUSALITY)

Dalam relasi causalitas (cau) selalu terdapat sebab dan akibat dimana sesuatu mempengaruhi sesuatu yang lain. Relasi ini adalah hubungan yang paling sering diungkapkan dalam metode-metode ilmiah terutama dalam mendiagnosis sesuatu.

2. Relasi Kesederajatan (EQUALITY)

Relasi equality (equ) digunakan untuk menjelaskan konsep yang sederajatlsama, mengekspresikan 2 ha1 yang identik. Logika matematika equ diformulasikan dengan: jika A equ B, maka A = B. Equ digunakan untuk menghubungkan A &

B.

3. Relasi yang Bertautan (SUBSET)

Relasi subset (sub) bila digambarkan adalah sebagai berikut, bila ada dua token yang mengekspresikan dua rangkaian secara bertautan yaitu sesuatu yang merupakan bagian dari sesuatu yang lain, maka dapat digunakan relasi sub.

logika matematika sub diformulasikan dengan: jika A sub B, maka A C B Dalarn relasi, ada 2 tipe relasi sub yang penting diingat:

a. Konsep A lebih luas daripada konsep B, contoh: "Mamalia sub kucing"

b. Konsep B lebih luas daripada konsep A, contoh: "Ekor sub Kucing

Relasi sub pada dasarnya adalah menggambarkan satu bagian dari sebuah konsep yang utuh sehingga fungsi sub berkaitan erat dengan konsep kepemilikan, artinya A adalah milik atau bagian dari B.

4. Relasi KemiripanIKesamaan (ALIKENESS)

Relasi alikeness (ali) digunakan bila antara dua token terdapat elemen-elemen yang sama. Logika matematika ali diformulasikan dengan: jika A ali B, maka A

n B # O .

5. Relasi PerbedaanIKetidaksamaan (DISPARATENESS)

+

DIS

Relasi dispareteness (dis) digunakan untuk menggambarkan bahwa antara 2 token tidak ada hubungannya. Logika matematika dis diformulasikan dengan:

jika A dis B, maka A fl B = 0.

(28)

6. Relasi Attributive

Relasi attributive (par) ini digunakan untuk menjelaskan bahwa satu elemen berkaitan dan memiliki sifat elemen lainnya.

7. Relasi yang berurutan (ORDERING)

Hubungan relasi ordering (ord) menjelaskan bahwa 2 benda memiliki urutan satu sama lain. Umumnya urutan ini berkaitan dengan waktu dan tempat, tapi juga bisa digunakan untuk mengungkapkan hubungan "<" yang dikenal dalanl

matematika A < B (A lebih kecil dari pada B).

8. Relasi Ketergantungan lnformasi (SKOLEN)

R'elasi skolen (sko) adalah, bila konsep-konsep di atas tidak bisa digunakan dalam menghubungkan hal-hal, diperlukan satu ha1 lagi hubungan yang disebut dengan hubungan yang lebih mengacu pada hubungan sintaksis dari pada semantik.

Secara lengkap, simbol-simbol tersebut disajikan pada Tabel 2 berikut ini:

Tabel 2. Simbol relasi dasar dari metode KG

EQL

41 I

DIS

PAR

TOKEN

equ

sub

ali

dis

Par

Vertex primitives Sesuatu

Link Primitive

Sama (memiliki kesamaan)

Bagian Dari

Sama dengan

Tidak sama dengan

Pemberian sifat eksternal dari sesuatu ke sesuatu yang lain (dalamfrume)

(29)

FPAR

ASS

ORD

SKO

NFPAR

POSPAR

fpar

ass

ord

cau

sko

sko

nfpar

pospar

necpar

Pemberian sifat internal dari sesuatu ke sesuatu yang lain (dalam frame)

Dua ha1 yang berbeda diasosiasikan satu sama lain Sesuatu diurutkan berdasarkan perbandingan dengan sesuatu yang lain

Sesuatu mempengaruhi sesuatu yang lain

Sesuatu yang tergantung pada dirinya sendiri (kuantifikasi universal)

Informasi mengenai sesuatu tergantung kepada sesuatu yang lain

Pemberian sifat internal sesuatu ke sesuatu yang lain tetapi dalam bentuk negasilnegatiflpenolakan (dalam frame)

Pemberian sifat internal sesuatu ke objek yang lain sebagai sebuah kemungkinan (dalam frame)

Pemberian sifat internal sesuatu ke objek yang lain sebagai sebuah kemungkinan (dalam frame)

(30)

LOGIKA

Logika, berasal dari kata logos dari bahasa Yunani, yang berarti kata, dasar, makna. Cabang filsafat yang memberi kaidah bagaimana harus berfikir lurus, isi konsep sangat dipentingkan [Hartono, 19951

Dalam KG, fpar-frame dan neg-frume dapat dihubungkan dengan struktur pada graf Peirce. Frume-frume itu mengekspresikan modal logika seperti

"possibility ", "necessity ", "and ", "or ", "not " dan

"if

then " dan lain sebagainya.

Simbol-simbol ini nantinya akan banyak digunakan dalam membangun struktur KG.

2.3.3. NATURAL LANGUAGE PROCESSING (NLP)

Bahasa alami (yang digunakan manusia) adalah suatu bahasa yang paling mudah dan popular digunakan dalam memberi dan menerima informasi. Di sisi lain, komputer hanya mengerti bahasa formal (yang dipahami oleh komputer), sehingga terjadi gap di antara keduanya. NLP adalah suatu proses yang mampu menjembatani antara bahasa alami dan bahasa formal [Zhang,2002].

Proses memahami antar bahasa tersebut di atas disebut parsing. Dalam melakukan parsing sebuah kalimat, diperlukan tata bahasa untuk menggambarkan bagian-bagian dari kalimat tersebut. Ada dua faktor yang diperhatikan dalam menganalisis kalimat,yaitu: sintaksis dan semantik. Perbedaan sintaksis dan semantik adalah sintaksis melakukan analisis berdasarkan bentuk dari suatu kalimat, sedangkan semantik melakukan analisis bagaimana mengartikan suatu kalimat.

2.3.4. SEMANTIK DALAM NATURAL LANGUAGE PROCESSING (NLP) Semantik dalam NLP memiliki persoalan yakni masalah ambiguitas (keraguan dalam mengartikan sesuatu, memiliki kemiripan arti). Metode KG merupakan metode baru dalam memahami nuturul lunguage, yang akan mengekspresikan suatu arti semantik dengan struktur yang mampu mengurangi ambiguitas tersebut [Zhang,2002]..

(31)

Konsep merupakan komponen terpenting dalam pemikiran manusia. Konsep mampu menjadi prosedur dalam membentuk suatu pengertian dari khusus ke umum atau bahkan sebaliknya.

Grammar Fillmore 's Case

Dalam memahami natural language, bagaimana menggambarkan struktur semantik dalam sebuah kalimat? Grammar Fillmore's Case memiliki beberapa kelompok konsep untuk mengkomposisikan bagian proposisi dalam menggambarkan struktur semantik tersebut, yaitu [Zhang,2002]:

TENSE (Past, Present, Future) ASPECT (Per-ct, Imperfect)

MOOD (Declurutive, Interrogative, Imperative) FORM (Simple, Emphatic, Progressive)

MODAL (Can, May, Must)

ESSENCE (Positive, Negative, Indeterminate) TIME (Adverbial)

M N N E R (Adverbial)

Bagian proposisi ini dibentuk oleh sebuah phrase kata kerja dan beberapa kata benda. Tiap phrase kata benda yang terhubung dengan kata kerja membentuk suatu relasi, maka hubungan itu disebut sebagai "Cuse".

Ekspresi Semantik Dengan KG

Dengan ontologi-ontologi yang dimiliki oleh KG, maka ia dapat membangun sebuah model untuk memahami natural language. Hal ini diperlukan agar dapat diekspresikan arti suatu kata atau kalimat. Untuk mengartikan suatu kalimat pertama kali hams diketahui terlebih dahulu arti masing-masing kata.

Contoh ekspresi semantik dengan KG, terdapat kata "gadis cantik", dari dua kata tersebut dapat dihubungkan dengan dua konsep yaitu, pria dan tidak menikah.

Dengan struktur KG dapat dibangun struktur yang mengekspresikan arti dari "gadis cantik" tersebut, seperti gambar di bawah ini:

(32)

Gambarl. Contoh Ekspresi Seinantik dengan KG

Dalam bahasa semantik, pengertian . a n g sama dalam sebuah teks dapat diekspresikan dengan berbagai ekspresi kalimat, meskipun tampak kalimat-kalimat tersebut berbeda, namun memiliki pengertian yang sama. Metode KG akan membangun suatu struktur arti. Mengartikan kata akan dioperasikan dengan word graph, mengartikan kalimat dioperasikan dengan sentence graph.

2.4. STRUCTURAL PARSING

Parsing merupakan bagian penting dari NLP. Parsing adalah suatu proses dari representasi struktur dari kalinlat nuturul language yang selalu diakurasikan dengan tata bahasa. Ada dua ha1 pentiilg di sini, satu; pursing membutilhkan sebuah perwakilan atas interlingua (inter-transmitrul lunguagc), dimana dia berada di antara narural languuge sentence dan struktur yang dapat diakses oleh komputer, dan kedila; pursing membutuhkan grainar dari naturul lunguge tersebut. Pursing metode KG berada pada interlinguu, yang merupakan metode pursing baru yang dikenal dengan istilah Srrucrurul Pursing. Structural Pursing adalah pemetaan atas kalimat dengan semantic sentence graph [Zhang, 20021.

Structural Parsing terdiri diri word gruph dan sentence graph. Sebuah word graph mzngekspresikan arti kata dengan struktur kata dan sentence graph mengekspresikan arti kalimat dengan struktur kalimat pula. Word graph merupakan unit dasar dari NLP, sedangkan sentence gruph terbentuk dari word graph yang tersebut di kalimat/teks. Prinsip dari structural pcrrsing adalah:

Grumrnur digunakan untuk membangun satu atau lebih purse tree untuk kalimat-kalimat

(33)

Prinsip dari structural parsing adalah:

Grammar digunakan untuk membangun satu atau lebih parse tree untuk kalimat-kalimat

Graf kalimat sintaksis diturunkan dari word graph sintaksis menggunakan parse tree

Graf kalimat semantik diturunkan dari sentence graph sintaksis yang ada.

2.5. BAGAIMANA MELAKUKAN TRANSFORMASI TEKS KE DALAM KNOWLEDGE GRAPH

Langkah-langkah melakukan transforrnasi teks ke dalarn KG adalah:

1. Menganalisis teks secara harfiah, sambil menganalisis konsep dan relasi yang ada di dalamnya.

2. Menambahkan pengetahuan latar (background knowledge) ke graflpemetaan latar (background graph). Background knowledge diperlukan untuk mengetahui konsep dan relasi yang ada dalam teks.

3. Menggabungkan relasi-relasi yang diperoleh dari analisis teks dengan background knowledge.

4. Memasukkan konsep dan relasi ke dalam piranti lunak.

2.5.1. ANALISIS TEKS

Menganalisis teks ke dalam konsep-konsep dan relasinya, merupakan proses secara subyektif, artinya sangat tergantung pada interpretasi seseorang yang melakukannya. Dalam menentukan konsep, kemungkinan besar akan banyak memiliki kemiripan antara satu orang dengan yang lainnya, karena secara harfiah masing-masing definisi dari konsep sudah baku. Namun penentuan relasi antar konsep sangat tergantung dengan pengetahuan masing-masing, dalam penggunaan basic relation.

Relasi cau (sebab-akibat) mudah diidentifikasi, hanya saja untuk menentukan apakah itu cau+ (berkorelasi positif) atau cau- (berkorelasi negatif) yang akan berbeda-beda, tergantung situasi dan kondisi pada saat membuatnya. Relasi sub dan

(34)

par juga kurang begitu jelas membedakannya. Sebagai gambaran, relasi sub digunakan untuk sesuatu yang merupakan salah satu bagian dari konsep lainnya, sedangkan relasi par digunakan untuk sesuatu dimana sebagian atribut dari sesuatu tersebut adalah bagian dari konsep lainnya. Relasi ali, dis dan equ lebih mudah menjelaskannya. Empat relasi lainnya (fpar, negpar, pospar, negpar) adalah relasi yang digunakan jika lebih dari dua relasi yang dihubungkannya.

Seperti dijelaskan sebelumnya bahwa menerjemahkan teks dengan metode KG, memiliki batasan. Keterbatasan itu meliputi [Vries, 19891:

Batasan menganalisis dengan menggunakan komputer Batasan sejumlah himpunan konsep

Batasan sejumlah himpunan relasi

Batasan sejumlah himpunan isullatar belakang informasi

Pada batasan pertama, komputer memiliki keterbatasan dalam mernberikan kriteria untuk mendefinisikan konsep dan relasinya, karena terkait dengan logikalpikiran orang.

Batasan kedua, himpunan konsep relatif lebih muda diimplementasikan yakni dengan membatasinya dengan cara menentukan konsep dengan konsep-konsep yang berdekatan dengannya (neighbours) dengan tiga tingkat kederajatan (first degree neighbour, second degree neighbour, third degree neighbour). Konsep derajat pertarna adalah konsep yang sudah didefinisikan sebelum melalui analisis, jadi subyek yang dipahami pada teks langsung dijadikan sebagai konsep. Konsep derajat kedua adalah konsep yang memiliki hubungan langsung dengan konsep derajat pertama. Konsep derajat ketiga adalah konsep yang berelasi dengan konsep derajat pertarna dengan melalui konsep derajat kedua.

Batasan ketiga, jumlah relasi sudah sangat jelas dengan adanya relasi-relasi yang termasuk dalarn KG, yang tergabung dalam 8 relasi binari dan 4 relasi n-ary.

Batasan keempat, adalah mencoba meyakinkan bahwa teks yang dianalisis adalah sudah jelas dalam teks pada sebuah paragraph. Hal tersebut sangat sebanding dengan keterbatasan pada konsep-konsep pada teks tersebut.

(35)

2.5.2.' LATAR BELAKANG PENGETAHUAN

Dalam Filsafat Ilmu, Pengetahuan mampu dikembangkan manusia disebabkan dua ha1 yaitu [Suriasumantri, 19951:

1. Manusia mempunyai bahasa yang mampu mengkomunikasikan informasi 2. Jalan pikiran yang melatarbelakangi informasi tersbut

Untuk itu, jika user ingin menggunakan komputer untuk menganalisis suatu teks, maka perlu juga mempertimbangkan beberapa latar belakang pengetahuan, dengan tujuan memperkaya pengertian sebuah teks.

2.6. CONTOH TRANSFORMASI TEKS KE DALAM KNOWLEDGE GRAPH Suatu teks: "Pemerintah membuat undang-undang untuk mengatur sistem pendidikan nasional dengan tujuan mencerdaskan bangsa". Teks tersebut memiliki beberapa konsep, yaitu: Penlerintah, Undang-undang, sistem pendidikan nasional dan mencerdaskan bangsa. Konsep-konsep itu kemudian direlasikan sebagai berikut:

Undang-undang mengatur sistem Pendidikan Nasional -3 Undang-undang ord sistem pendidikan nasional

Pemerintah yang membuat Undang-undang Sistem Pendidikan Nasional bertujuan mencerdaskan bangsa

+

Pemerintah cau mencerdaskan bangsa

3 Undang-undang dan sistenl pendidikan nasional fpar Pemerintah

Apabila teks tersebut akan ditransformasikan ke dalam KG, sebelumnya bisa diganibarkan terlebih dahulu seperti pada Gambar 2.

Gambar 2. Text Represenfutioi~ menggunakanfiume

Pemerintah

cau

Undang-undang Mencerdaskan

Bangsa

i

-

ord r Sistem Pendidikan

-

Nasional vana baik

(36)

Gambar 2 belum merupakan sebuah graf tetapi masih dalam bentuk konsep yang digambarkan dengan relasinya sesuai dengan arti dari teks tersebut. Dari gambar tersebut kemudian diterjemahkan ke dalam bentuk graf menjadi teks graf dalam konsep metode KG, seperti pada Gambar 3.

fpar

Undang-undang

/

ord

\\

Sistem Pendidikan Nasional yang baik

-

Pemerintah

Gambar 3 Terjemahan ke KG

cau Mencerdaskan Bangsa

(37)

BAB 111

METODOLOGI PENELITIAN

3.1. KERANGKA PEMIKIRAN

Memahami teks menggunakan metode KG, merupakan salah satu cara untuk mendapatkan informasilpengetahuan baru. Metode KG, merupakan salah satu metode yang digunakan untuk membantu mengartikan sebuah teks bahasa dengan menitikberatkan pada analisis semantik. Dalam parsing, analisis semantik agak rumit dilakukan karena ini berkaitan dengan subjektifitas seseorang yang melakukannya, namun ternyata, menerima informasi dalam pengambilan keputusan sangat membutuhkan analisis tersebut'. Dalam penelitian ini proses parsing yang dilakukan adalah melakukan pemisahan tiap-tiap kata dalam teks yang dipisahkan oleh spasi dan kata tersebut akan menjadi konsep kecuali kata-kata yang termasuk dalam kata buangan (kata yang tidak penting).

Analisis semantik yang dilakukan, harus melalui beberapa tahapan. Tahapan pertama melakukan identifikasi konsep dan relasi di dalam teks yang akan dianalisis.

Penentuan Relasi antar konsep sangat dipengaruhi oleh user, berdasarkan pengetahuan yang dimilikinya. Oleh karena itu, tahapan identifikasi konsep dan relasi membutuhkan waktu dan pemikiran yang serius agar diperoleh relasi antar konsep yang baik. Tahapan ini menentukan tahapan selanjutnya, yaitu pembentukan graf relasi antar konsep menjadi text graph. Text graph pada tahapan ini masih berdiri sendiri sesuai dari masing-masing teks yang dianalisis. Gabungan text graph menjadi combined graph dari seluruh teks, membentuk formasi graf yang utuh, namun menjadi sangat kompleks dan rumit dalam membacanya. Untuk itu diperlukan perangkat lunak untuk membantu menyederhanakan combined graph tersebut.

'

Pada perkembangan aplikasi teknik bahasa, sistern inforrnasi rnewakili kebutuhan dan kernampuan untuk mernanipulasi dan rnenganalisis informasi secara otomatis yang kernudian akan diintegrasikan variasi tersebut dengan teknik NLP. Mernang sistern Pengekstrakkan lnforrnasi ini belurn populer di rnasyarakat, namun sebenarnya menjadi sangat siknifikan bagi industri pengguna akhir inforrnasi (end user), seperti, bank, perusahaan keuangan serta agen-agen pengelola dokurnen lainnya. (L.Zhang & C.Hoede, 2002)

(38)

Perangkat lunak dibuat untuk kebutuhan menginput data berupa konsep dan relasi; ontologi yang digunakan serta rule untuk melakukan proses penyederhanaan sehingga menjadi simplified graph. Kerangka pemikiran ini bisa dilihat dalam Garnbar 4 ini.

I

Pengumpulan data berupa teks dengall tenia yang sama

Analisis Teks dengan mengidentifikasi konsep dan relasinya, berdasarkan :

teks harfiah teks latar belakang

.(

I

Konsep dan relasi diformat dalam bentuk graf menjadi rext graph, dengail menggunakan 8 jenis relasi KG

+ I

Kedua text graph dikoinbinasikan menjadi

combined graph dengan bantuan pi rant i l unak yang mengoperasikan concept identification

Combined graph disederhanakan melijadi sitnpl~jied graph berdasarkan rtike dalain KG, dengan bantuan piranti lunak, untuk

mengoperasikan:

-

link infegra/ion - tnerging ofgt-uph

- purlilioning ofgruph inio subgrclph

Hasil analisis teks dengan metode KG

Gambar 4. Kerangka Pemikiran Analisis Teks dengan Metode KG

(39)

3.2. ANALISIS MEMAHAMI TEKS DENGAN METODE KNOWLEDGE GRAPH

Dalam pembahasan dalam bab selanjutnya, peneliti akan melakukan analisis beberapa teks dengan satu tema, yaitu tentang penyelenggaraan sistem pendidikan nasiopal yang bertujuan mencetak manusia-manusia unggulan (berkualitas) demi kemajuan bangsa.

Dengan KG, teks-teks tersebut, dianalisis dengan cara:

1. Menentukan konsep-konsep yang tertulis dalarn teks 2. Menentukan relasi antar konsep tersebut di atas.

3. Konsep dan relasi yang terbentuk, diterjemahkan secara harfiah dalam bentuk graf yang disebut text graph

4. Dalam KG, perlu juga mengartikan teks itu berdasarkan latar belakang informasi yang dimiliki sesorang tersebut (background knowledge), dan diterjemahkan pula dalam bentuk graf menjadi text graph pula.

5. Dari kedua graf itu (graf harfiah dan graf latar), dikombinasikan menjadi sebuah graf baru (combined gruph) menjadi new rext graph.

6. Teks graph yang baru, tentu masih sangat rumit untuk dibaca dan dipahami, karena melibatkan banyak konsep, untuk itu perlu melakukan penyederhanaan graf (simplijied graph).

7. Dengan terbentuknya simplrfied graph, maka konsep-konsep yang paling penting dalam teks dapat teridentifikasi, sehingga menghasilkan sebuah kesimpulan.

(40)

Analisis Analisis

harfiah Latar

Pemindahan subkonsep menjadi konsep umuln

Teks graf

1

ldentifikasi Konstr~ksi

Combined Graph

1

Pe~nbentukan Subgraf ~nandiri

Sinlplifikasi

1

Pen~hilangan causal chuins

Penyatuan relasi-relasi Pengkategorisasian Konsep

Hasil Penelitian

Secara Kuantitatif ldentifikasi Konsep-konsep yang paling penting Pengullan Konsep

r

Gambar 5. Metodologi Analisis Memahami Teks dengan Metode Knowledge Graph

3.2.1. TRANSFORMASI TEKS KE DA LAM KNOWLEDGE GRAPH

Prosedur melakukan transformasi teks ke dalarn KG, adalah sebagai berikut:

1. Analisis teks, teks dibaca dengan teliti untuk mengidentifkasi konsep dan relasi secara harfiah sesuai teksnya, menjadi texf concepfs und elutions 2. Penambahan latar belakang pengetahuan, menjadi background concept

and relations.

3. Kedua teks (teks harfiah dan teks latar) dikombinasikan membentuk combined graph.

4. Teks yang dikombinasi diimplementasikan ke dalam perangkat lunak yang dibuat.

(41)

Gambar 6. Proses analisis teks

Langkah pertama dalam proses ini adalah melakukan analisis teks, dimana teks-teks yang ada dicari konsep dan relasinya untuk diterjemahkan ke dalam graf yang berupa teks gruph. Dalam analisis teks, relasi Tcxl Gruph yang sangat berpengaruh adalah relasi cau yang terdiri dari cau+ dan cau-, dalam membaca statemen apakah ia membawa pengaruh positif atau pengaruh negatif. Selain itu background knowledge sangat diperlukan dalam menginterpretasikan teks, dari situlah kernudian muncul con~bincd gruph, yaitu gabungan dari text gruph dan background gruph.

Konsep teks dan

\

relasi-relasinya

3.2.2. PENYEDERHANAAN GRAF PADA hWOWLEDGE GRAPH

Satu ha1 yang paling mendasar dalam pembuatan graf, adalah bagaimana agar permasalahan yang ada jika telah diterjemahkan dalam bentuk graf, menjadi lebih mudah dimengerti atau lebih mudah dibaca. Oleh karena itu Iangkah selanjutnya adalah melakukan penyederhanaan graph (Simpl~fied Graph)

Penyederhanaan graf tidak hanya berguna dalam membatasi jumlah konsep dan relasinya, tetapi juga membantu memecahkan masalah yang berhubungan dengan sinonim dan spesialisasi atas konsep-konsep tersebut [Kramer, 19961.

Proses penyederhanaan graf, yaitu meliputi:

1. Pembentukan konsep-konsep umum (general concept) 2. Identifikasi konstruksi (identrfiing constructs)

3. Pembentukan subgraf mandiri (ident~fiing idenpendent subgraphs) 4. Penghilangan causal chains (reducing causal chains)

+ Text Graph

Combined Graph Konsep latar . . . . . . . . . . . . .

belakang & relasinya + Text Graph

(42)

Proses penyederhanaan

Gambar 7. Proses Penyederhanaan Graf

Simplified Graph

Pembentukan General Concept

Dalanl melakukan penyederhanaan graf, ha1 yang paling penting untuk tetap dijaga adalah tidak terjadinya kehilangan informasi, artinya konsep dan relasi yang disederhanakan tidak mengubah arti dan tidak menghilangkan informasi penting di dalarnnya. Yang berhubungan dengan penyederhanaan graph adalah subconcept2 dan general concept 3

Ide melakukan proses ini adalah mengurangi adanya graf dengan tingkat yang sangat detil, karena ini akan sangat rumit dalam membacanya. Proses ini terutama memfokuskan pada relasi sub, par, ali dan equ, dengan ketentuan:

1. Konsep yang dihubungkan oleh relasi ali atau equ, dapat dijadikan dalam satu konsep menjadi generul concept.

2. Konsep yang merupakan bagian dari konsep lain, yang berarti terdapat relasi sub atau par, dapat dijadikan satu konsep yang mengakomodir keduanya.

Dari dua ketentuan tersebut, maka langkah pertama yang dilakukan adalah melihat relasi-relasi tersebut dalam graf, lten~udian mencari subgruph yang terhubung setelah itu dicoba adakah subgrcrph tersebut yang dapat dipindah-tempatkan berubah

Pembentukan konse~-konse~ umum

I

ldentifikasi konstruksi

I I

Pembentukan subnraf mandiri

Pennhilannan causal chains Combined

Graph

2 Suatu konsep yang merupakan bagian dari general concept

Suatu Konsep yang bukan merupakan bagian dari atau atribut dari konsep yang lainnya

+

(43)

menjadi satu atau dua konsep umum. Konsep yang merupakan bagian dari subgraph yang telah dirubah menjadi konsep umum, disebut sebagai subconcept.

Sebagai contoh:

1 . Subconcept pendidikan formal, pendidikan nonformal, pendidikan infornlal . dilebur, ditempatkan pada satu konsep umum yaitu jalur pendidikan

2. Subconcept pendidikan diniyah, pendidikan pesantren, pendidikan pasraman, pendidikan pabhaja pendidikan samanera, dilebur, ditempatkan pada satu konsep umum yaitu pendidikan kcagamaan.

Dengan demikian graf yang berasal dari subkonsep yang dibangun menjadi konsep umum itulah yang dikatakan sebagai penyederhanaan graf.

Identifikasi Konstruksi

Himpunan konsep-konsep yang memiliki hubungan dekat (neighbours) yang secara langsung memiliki parh di antara konsep-konsep itu dikenal dengan istilah construct.

Gambar berikut adalah contoh sebuah konstruksi.

SDM cau

cau

\

v cau

Sistern Pendidikan yang baik A

cau Sumber ekonorni vana kuat

Gambar 8. Contoh Sebuah Konstruksi (construct) Independent Subgraplt

Jika terdapat subgraf yang dapat berdiri sendiri, tidak tergantung dengan subgraf lainnya disebut dengan indenpendent subgraph. Dengan demikian subgrapl~

(44)

tersebut dapat dipisahkan saja, ha1 ini memudahkan analisis keseluruhan graf yang ada.

Causal Chains

Sebuah konsep yang secara tidak langsung dipengaruhi oleh konsep lain, ia dikenal dengan causal chain (misal: konsep A cau Konsep B dan Konsep B cau konsep C).

jika tidak ada relasi lain yang mengakibatkan konsep A menjadi penting, maka konsep B dapat dihilangkan saja.

3.3. INTERPRETASI KG

Setelah melakukan penyederhanaan graf, langkah selanjutnya adalah melakukan interpretasi dari KG tersebut. Proses interpretasi ini meliputi:

1. Interpretasi secara kualitatif, yang terdiri dari: I ) Integrasi Link (Penyatuan

' Relasi-relasi), 2). Klasifikasi Konsep dan 3). Pengujian Konsep.

2. Interpretasi secara kuantitatif, yaitu mengidentifikasikan konsep-konsep yang penting.

3.3.1. INTEGRASI LINK

Integrasi link adalah melakukan pengurangan atau penambahan hubungan- hubungan relasi antar konsep, dimana ha1 ini digunakan untuk melakukan ekstraksi informasi lebih lanjut dari graf. Adanya penambahan dan pengurangan ini disebabkan adanya dua tipe integrasi link, yaitu Serial link integration dan Parallel link integration.

Serial link integration dihasilkan dari adanya dua hubungan antara konsep A dengan konsep B dan hubungan antara konsep B dengan konsep C, yang rnenghasilkan satu hubungan baru antara konsep A dengan konsep C, tidak ada relasi yang dapat dihilangkan.

(45)

Parallel link integration, jika antara konsep A dengan konsep B terdapat dua relasi yang menghubungkannya, maka mungkin saja dua relasi tersebut dapat dilebur menjadi satu relasi saja antar keduanya.

Gambar 9. Serial link integration Gambar 10. Parellel Link Integration

Menurut Kramer [1996], aturan main sel-iul link integration dari relufion.ship atas 4 relasi (ali, cau+, cau-. equ, par, sub) adalah sebagai berikut:

Tabel 3. Seriul Link Integration

Cau-

Cau- Cau- Cau- Cau+

Cau+

Cau- Cauf Ali

Ali Cau+

Cau- Equ

Par sub

Equ

Ali Cau+

Cau- Equ Par Sub Ali

Ali

Par

Cau+

Cau-

Par Par

sub

Cau+

Cau- Sub Par Sub

Gambar

Diagram alur Perancangan Proses
Tabel 2. Simbol relasi dasar dari metode KG
Gambar  2.  Text Represenfutioi~  menggunakanfiume
Gambar  2  belum  merupakan  sebuah  graf  tetapi  masih  dalam  bentuk  konsep  yang digambarkan dengan relasinya  sesuai dengan arti dari teks tersebut
+7

Referensi

Dokumen terkait

Gambar 10 Jumlah obyek hasil segmentasi masing- masing metode yang dikembangkan Sementara itu, jumlah obyek hasil segmentasi yang ditampilkan dalam Tabel 1 serta representasi data

Bilamana anda membuka sebuah file tersimpan, prompt MapSource mena tidak segera melakukan nyakan untuk menyimpan data yang terbuka saat itu, jika anda tidak

Identification In Comprehensiveness Of Information And The Accuracy Code Medical Record Document Related To The Determination Patients BPJS Cost In RSUD Pandan

EFEKTIVITAS MODEL PEMBELAJARAN MISSOURI MATHEMATICS PROJECT (MMP) TERHADAP KEMAMPUAN BERPIKIR KREATIF MATEMATIS DAN PRESTASI BELAJAR PESERTA DIDIK PADA MATERI HIMPUNAN KELAS

Upaya pencegahan awal yang dapat dilakukan untuk menghindari kecacingan pada murid Sekolah Dasar di Kelurahan Tanjung Johor yakni dengan meningkatkan

Apakah sebelum bekerja sebagai pekerja bangunan anda pernah mengalami keluhan kulit seperti yang anda rasakan ketika bekerja di proyek bangunan

Mendeskripsikan peran komponan ekosistem dalam aliran energi dan daur biogeokimia serta peman- faatan komponen ekosistem bagi

hanya sebanyak 11 siswa atau 34,375%. 2) Kemampuan siswa memberikan contoh dan bukan contoh dari suatu konsep hanya sebanyak 10 siswa atau sebesar 31,25%. 3) Kemampuan siswa