REKAYASA MEMAHAMI TEKS MENGGUNAKAN
METODE
KNOWLEDGE GRAPHKHODIJAH HULLIYAH
SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
SURAT PERNYATAAN
Saya menyatakan dengan sebenar-benarnya bahwa segala pernyataan dalam tesis berjudul: Rekayasa Memahami Teks Menggunakan Metode Knowledge
Graph, merupakan gagasan atau hasil penelitian tesis saya sendiri, dengan arahan Komisi Pembimbing, kecuali yang dengan jelas ditunjukkan rujukannya. Tesis ini belum pernah diajukan untuk memperoleh gelar atau pencapaian akademik lainnya pada program sejenis ini di perguruan tinggi lain. Semua data dan informasi yang digunakan telah dinyatakan secara jelas dan dapat diperiksa kebenarannya.
Jakarta, Januari 2007
Yang Membuat Pernyataan
ABSTRACT
One of the advanced characteristics of computer in the future is its ability to verbally interact with its users by using daily natural language instead of sophisticated language.The question then wheather the advance computer technology in the future deals with such expectation. Regarding the swift development of software technology, it could possible be. The determining component is its capacity to process language whose software element attribute to language verbally. Computing world acknowledges two languages; natural languages and programming languages.
The technology Natural Language Processing (NLP) is a technology enable natural language processing commonly delivered by human. The system generally processes input and output in text format. One of NLP applications is text summarization which is a system that summarizes or concludes hundred texts having similar things and produces a new knowledge. The system turns out to be important, especially if someone envisages a problem and aims to take a conclusion from several available texts. Knowledge Graph (KG) is a new method in this NLP application.
Hence, researcher conducts the research and uses KG method in reading a text to achieve a new summarized knowledge which is beneficial to decision making. In this research, researcher undertakes case study by analyzing text compilation dealing with National Education System (Sisdiknas). Concept and relation of the available text compilation is identified. The identification result is then formatted to textual summarized graph from previously rary graph. The textual summarized graph still requires process to get combined graph. After having the sequential fase, simplified graph will be accomplished. The simplified graph is the final result to acquire new information in comprehensing the text compilation.
Keyword: Knowledge Graph, Combined Graph, Simplified Graph, Text Analysis, Concept, Relationship, Text Transfornzation, Concept Identification
RINGKASAN
KHODIJAH HULLIYAH Rekayasa Memahami Teks Menggunakan Metode Knowledge Graph. Dibimbing oleh JULIO ADISANTOSO dan SRI NURDIATI
Salah satu ciri komputer masa depan adalah kemampuan untuk berinteraksi secara lisan dengan pemakainya menggunakan ucapan sehari-hari dengan bahasa alami (natural language) bukan bahasa yang rumit. Pertanyaannya sekarang adalah mampukah teknologi komputer masa depan melakukan ha1 tersebut? Jika melihat perkembangan teknologi perangkat lunak yang pesat, ha1 tersebut bisa saja terjadi. Komponen yang sangat menentukan adalah kemampuan mengolah bahasa, dimana sebagian komponen perangkat lunaknya akan bersifat language dependent, yaitu perangkat lunak yang melakukan pemrosesan bahasa alami secara lisan. Dalam ilmu komputer kita mengenal ada dua bahasa, yaitu: bahasa alami dan bahasa buatan.
. Teknologi Natural Language Processing (NLP) adalah teknologi yang memungkinkan untuk melakukan berbagai macam pemrosesan bahasa alami yang biasa digunakan oleh manusia. Sistem ini biasanya mempunyai masukan dan keluaran berupa bahasa tuiisan (teks). Salah satu dari aplikasi NLP adalah Text Summarization, yaitu suatu sistem yang akan melakukan ringkasan atau kesimpulan dari puluhan atau ratusan teks-teks dengan tema yang sama menjadi sebuah rangkuman yang menghasilkan sebuah pengetahuan baru. Sistem ini menjadi sangat penting keberadaannya apabila kita dihadapkan pada sebuah persoalan untuk mengambil sebuah kesimpulan dari berbagai macam teks yang ada. Metode Knowledge Graph (KG), adalah suatu metode baru dari aplikasi NLP ini.
Untuk itu, penulis melakukan penelitian untuk mengunakan metode KG dalam membaca suatu teks guna mendapatkan sebuah ringkasan (knowledge) baru yang dapat dijadikan pengetahuan dalam rangka pengambilan keputusan. Pada penelitian ini, penulis melakukan studi kasus dengan cara menganalisis kumpulan teks yang berhubungan dengan Sistem Pendidikan Nasional (Sisdiknas).
graf yang dihasilkan masih harus diproses kembali untuk mendapatkan combined graph. Melalui tahapan selanjutnya, akan dihasilkan simplified graph. Graf yang sederhana tersebut merupakan hasil akhir untuk mendapatkan sebuah informasi baru dalam memahami kumpulan teks tersebut di atas.
REKAYASA MEMAHAMI TEKS MENGGUNAKAN
METODE KNOWLEDGE GRAPH
KHODIJAH HULLIYAH G651024054
Tesis
Sebagai salah satu syarat untuk memperoleh gelar Magister Sains pada
Program Studi Ilmu Komputer
SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
Judul Tesis : Rekayasa Melnahalni Teks dengan Menggunakan Metode Knowledge Graph
Nama : Khodijah Hulliyah
NRP : G65 1024054
Program Studi : Ilmu Komputer
Disetujili,
Komisi Penlbimbing
r. Ir. Sri Nurdiati, M.Sc Anggota
Diketahui.
Tanggal Ujian : 3 1 Januari 2007 Tanggal Lulus : 1 4 FEB 2007
PRAKATA
Alhamdulillahirabbil'alamin, puji dan syukur penulis panjatkan kepada Allah SWT atas hidayah dan karuniaNya sehingga penulis dapat menyelesaikan tugas penelitian ini dengan judul "Rekayasa Mernahami Teks Dengan Meiiggunakan Metode Knowledge Graph ". Penelitian ini dibuat untuk memenuhi salali satu persyaratan penyelesaian studi pada Progratii Studi Iltiiu Kornputer, Sekolah Pascasarjana lnstitut Pertanian Bogor (I PB).
Penelitian ini dapat terselesaikan atas bantuan dari berbagai pihak. Oleh karena itu penulis ingin menyampaikan teritna kasih yang sebesar-besarnya kepada:
I . Bapak Ir. Julio Adisantoso, M.Kom dan Ibu Dr. Ir. Sri Nurdiati, MSc, selaku dosen pembimbing yang telah banyak menibimbing dan tiiengarahkan penulis.
2. Bapak Dr. Sugi Guritman, selaku Ketua Prograin Studi Illnu IComputer, Sekolah Pascasarjana IPB.
3. Ayahanda dan Ibunda (Almh.) yang tak lienti-henti ~nemberikan do'a dan kasih sayangnya.
4. Suami beserta anak-anak tercinta yang me~iiberikan dorongan, niotivasi dan semangat kepada penulis untuk menyelesaikan tesis.
5 . Indah Mathar dan Nana yang banyak tne~iibantu daiam ~iienyelesaika~i penelitian ini.
6. Rekan-rakan mahasiswa yang telah banyak meniberikan masukan dan saran. 7. Semua pihak yang membantu namun tiak dapat penulis sebutkan satu-persatu.
Berbagai usaha telah penulis upayakan guna terselesaikannya tugas penelitian ini dengan baik, namun penulis menyadari akan kekurangan dan keterbatasan penulis. Oleh karena itu kritik dan saran yang membangun penulis harapkan. Akhir kata penulis berharap semoga tesis ini bermanfaat.
RIWAYAT HIDUP
Penulis dilahirkan di Jakarta, pada tanggal 2 April 1973 sebagai anak ketiga dari ayah bernama Drs. HM. Nadjid Muchtar, MA dan ibu Asiyah Thohir (Almh). Penulis menempuh pendidikan MI Pembangunan Ciputat, SMP Puteri Khadijah Surabaya, SMUN 34 Pondok Labu Jakarta dan kuliah di Universitas Gunadarma Depok Jurusan Manajemen Informatika (S-1) lulus tahun 1996. Setelah kuliah, penulis menjadi tenaga pengajar pada STMIK Husni Thamrin pada tahun 2000- 2001. Pada tahun 2001 hingga sekarang penulis bergabung sebagai Pegawai Negeri Sipil (PNS) yang ditempatkan di Universitas Islam Negeri (UIN) Syarif Hidayatullah Jakarta, sebagai Tenaga Pengajar pada Fakultas Sains dan Teknologi. Penulis memulai pendidikan pascasarjana di Program Studi llmu Komputer, Sekolah Pascasarjana IPB pada tahun 2002.
DAFTAR IS1
DAFTAR TABEL
...
xDAFTAR GAMBAR
...
xiDAFTAR LAMPIRAN
...
xivBAB I PENDAHULUAN I
.
1.
Latar Belakang Masalah...
11.2. Identifikasi Masalah
...
41.3. Batasan Masalah
...
41.4. Perumusan Masalah ... 4
.
...
1.5. Tujuan dan Kegunaan Penelitian 5...
1.6. Metodologi Penelitian 5 1.7. Sistematika Penelitian...
6BAB I1 TINJAUAN PUSTAKA
...
2.1. Pendahuluan 7 2.2. Graf...
82.3. Knowledge Graph
...
82.3.1. Deskripsi Formal dari Knowledge Graph
...
102.3.2. Aspek-aspek Ontologi
...
102.3.3. Natural Language Processing (NLP)
...
162.3.4. Semantik dalam Natural Language Processing (NLP)
...
162.4. Struktural Parsing
...
182.5. Bagaimana Mengubah Teks Menggunakan Metode Knowledge Graph
...
182.5.1. Analisis Teks
...
192.5.2. Latar Belakang Pengetahuan
...
202.6. Contoh Transformasi Teks ke dalam Knowledge Graph
...
21BAB I11 METODOLOGI PENELITIAN
...
3.1. Kerangka Pe~nikiran 23
...
3.2. Analisis Knowledge Graph 25
...
3.2.1. Transfor~nasi Teks ke dalarn Knowledge Graph 263.2.2. Penyederhanaan Graf pada Knowledge Graph
...
27... 3.3. lnterpretasi Knowledge Graph 30 3.3.1
.
Integrasi Link ... 303.3.2. Identifikasi Konsep-konsep Penting ... 31
3.3.3. Klasifikasi Konsep ... 32
3.3.4. Pengujian Konsep ... 32
... 3.4. Penyusunan Piranti Lunak 34
...
3.4.1. Metode Penyusunan Piranti Lunak 34...
3.4.2. Bahan dan Alat 34 BAB IV ANALISIS: STUD1 KASUS 4.1. Pendahuluan...
36...
4.2. Analisis: Translasi Teks Siste~n Pendidikan Nasional 38...
4.3. Combined Gruph dari Sistem Pendidikan Nasional 51...
4.4. Penyederhanaan Graf (Siwiplified Graph) 52 4.4.1. Proses Penyederhanaan Graf I ... (Siniplified Gruph I) 52 4.4.2. Proses Penyederhanaan Graf I 1 ... (Sinlpllfied Gruph II) 53 4.5. Hasil dari lnterpretasi Knowledge Gruph...
54Sistem Pendidikan Nasional
...
544.5.1. Identifikasi Konsep yang Penting
...
54.
.
4.5.2. Penguj an Neighhour...
55BAB V PERANCANGAN DAN
...
IMPLEMENTASI SISTEM 61
...
5.1. Perancangan Siste~n 61
...
...
5.1.2. Perancangan Basis Data 63
...
5.1.3. Perancangan Menu 63
...
5.2. Implementasi Sistem 65
...
5.2.1. Dokumen Masukan 65
...
5.2.2. Modul Program 66
...
5.3. Hasil 69
BAB VI SIMPULAN DAN SARAN
.
5.1 Simpulan
...
69...
DAFTAR TABEL
Halaman
[image:13.549.63.524.67.769.2]1
.
Dua Belas Notasi Dasar pada Graf Ontologi menurut Kant...
10 2.
Simbol Relasi Dasar dari Metode KG ... 13...
3
.
Serial Link Integration 30...
4.
Tabel yang Digunakan untuk Pengujian Neighbour 32 5.
Contoh Pengujian Neighbour...
336
.
Bahan dan Alat...
35 7.
Teks-teks Pendidikan yang akan diimplementasikan ke dalam teks 41...
grafDAFTAR GAMBAR
Halarnan
...
Ekspresi Semantik 17
...
Text Representation menggunakan frame 20
...
Terjemahan ke KG 21
Kerangka Pemikiran Analisis Teks dengan Metode KG
...
23...
Metodologi Analisis Teks dengan Metode KG 25 Proses Analisis Teks ... 26...
Proses Penyederhanaan Graf 27
...
Contoh sebuah Konstruksi (construct) 28
Serial Link Integration
...
30...
Parellel Link Integration 30
Neighbours
...
32 Contoh Pengujian Neighbours...
33.
Subgraf Tabel no 1
...
46.
...
Combined Graph dari Subgraf Tabel no 1 46 Subgraf Tabel no.2
...
46...
Subgraf Tabel no.3 47
.
...
Combined Graph dari Subgraf Tabel no 1 47
...
Subgraf Tabel no.4 47
...
Subgraf Tabel 110.5 48
...
Subgraf Tabel no.6 48
...
Subgraf Tabel no.7 48
...
Subgraf Tabel no.8 49
...
Subgraf Tabel no.9 49
...
.
Subgraf Tabel no 10 49
Subgraf Tabel no
.
11...
50 Subgraf Tabel no.12...
50 Subgraf Tabel no.
13...
50...
.
Subgraf Tabel no 1 I
...
Subgraf Tabel no . 12
...
Subgraf Tabel no . 13...
Subgraf Tabel no . 14...
Combined Graph Sisdiknas
...
Simpl$ed Graph 1 Sisdiknas
...
Simplified Graph I1 Sisdiknas
... I"' Degree Neighbours Sisdiknas
...
I"'
.
2'ld dan 3rd ~ e ~ r e e Neighbours Sisdiknas...
Terjemahan Tabel 17 ke dalam bentuk Graf...
Diagram alur Perancangan Proses...
Perancangan Menu... Urutan Proses Tiga Modul
...
Tainpilan menu manajemen teks...
Tampilan Memasukkan data vertex-detuilTampilan Vertex-Detail
...
...
Tabel Count VertexDetailBAB I
PENDAHULUAN
1. LATAR BELAKANG MASALAH
llmu komputer memiliki dua komponen utama; pertama, model dan gagasan mendasar mengenai komputasi, kzdua, teknik rekayasa untuk perancangan sistem komputasi yang meliputi piranti keras dan piranti lunak, khususnya penerapan rancangan dan teori. Secara teoritis ilmu komputer diawali dari sejumlah disiplin ilmu yang berbeda, ahli biologi mempelajari neural network, ahli elektro mengembangkan switching sebagai alat untuk mendesain piranti keras, ahli matematika bekerja berdasarkan logika, dan ahli bahasa menyelidiki bahasa untuk natural language [Utdirartatmo, 200 11.
Dalam teknologi komputer, telah dikenal ada teknologi komputer analog dan teknologi komputer digital. Saat ini teknologi komputer telah mampu memanfaatkan keduanya sehingga menjadi teknologi handal, yang mampu menggantikan sebagian pekerjaan manusia atau bahkan pekerjaan yang tidak mampu dilakukan oleh manusia. Dalam konteks penggolongan generasi komputer, diprediksi akan lahir komputer berbasis masa depan yang memiliki memori tanpa batas, kompatibel dengan teknologi lain, memiliki kemampuan analisis dan teknis yang luar biasa yang memberikan kemudahan dan kenyamanan bagi manusia.
Salah satu ciri komputer masa depan adalah memiliki kemampuan berinteraksi secara lisan dengan pemakainya dengan menggunakan ucapan sehari- hari dalam bahasa alami (natural language), bukan bahasa yang rumit'. Pertanyaannya sekarang, mampukah teknologi komputer masa depan melakukan ha1 tersebut? Jika melihat perkembangan teknologi piranti lunak yang pesat, ha1 tersebut bisa saja terjadi. Komponen yang sangat menentukan adalah kemampuan mengolah bahasa, dimana sebagian koinponen piranti lunaknya akan bersifat language dependent, yaitu piranti lunak yang melakukan pemrosesan bahasa
I
alami secara lisan. Dalam ilmu komputer dikenal ada dua bahasa, yaitu bahasa alami2 dan bahasa buatan3.
Chomsky adalah orang yang pertama kali merepresentasikan bahasa dalam rangkaian simbol. Chomsky berhasil memperlihatkan bahwa bahasa apapun dapat direpresentasikan dalam bentuk yang universal. Pemikiran Chomsky yang merepresentasikan bahasa sebagai kumpulan simbol-simbol dan aturan yang mengatur susunan simbol-simbol tersebut telah membuka peluang untuk melakukan pemrosesan bahasa secara simbolik dengan teknologi komputer, sehingga melahirkan bidang ilmu Natural Language Processing (NLP) dalam cabang ilmu bahasa komputasi (computational linguistic) [Arman, 20041.
Teknologi N L P adalah teknologi yang memungkinkan untuk melakukan berbagai macam pemrosesan bahasa alami yang biasa digunakan oleh manusia. Sistem ini biasanya mempunyai masukan dan keluaran berupa bahasa tulisan (teks). Beberapa di antara berbagai kategori aplikasi NLP adalah [Arman, 20041:
1. Natural Language Translator, yaitu translator dari bahasa alami ke bahasa alami lainnya.
2. Translator dari bahasa alami ke bahasa buatan, yaitu translator yang mengubah perintah-perintah dalam bahasa alami menjadi bahasa buatan yang dilakukan oleh mesin atau komputer.
3. Text Summarization, yaitu sistem yang dapat "membuat ringkasan" hal- ha1 yang penting dari suatu wacana yang diberikan.
Text Summarization menarik untuk diteliti lebih lanjut karena sangat berkaitan erat dengan proses analisis teks dalam ilmu computational linguistic. Text Summerization adalah suatu sistern yang akan melakukan ringkasan atau kesimpulan dari puluhan atau ratusan teks-teks dengan tema yang sama menjadi sebuah rangkuman yang menghasilkan sebuah pengetahuan baru. Sistem ini menjadi sangat penting keberadaannya apabila kita dihadapkan pada sebuah persoalan untuk mengambil sebuah kesimpulan dari berbagai macam teks yang ada.
2
Bahasa alami adalah suatu bentuk representasi dari pesan yang ingin dikomunikasikan antar manusia
Menganalisis teks menjadi sebuah persoalan tersendiri bagi setiap orang, karena bisa jadi masing-masing akan memiliki pemahaman sendiri terhadap teks tersebut, sehingga bisa jadi akan muncul ambiguitashalam mengartikan kalimat5. Suatu masalah akan mudah dipahami apabila kita mampu membahasakannya dalam format redaksi penulisan dengan bahasa jelas. Penulisan redaksi tentu akan bersifat subjektif tergantung dari masing-masing orang yang menulis dan menganalisisnya. Titik pandang masalah sangat subjektif bagi setiap individu, orang yang berbeda akan menggambarkan pengalaman yang ditemui ke dalam konsep yang berbeda pula [Zhang, 20021. Dengan kata lain, konsep dengan bahasa yang sama bisa jadi akan diinterpretasikan dengan arti yang berbeda-beda. Hal ini akan melahirkan beragam konsep, yang kemudian akan direlasikan dengan masalah-masalah yang ada, sehingga melahirkan sebuah pengetahuan. Menurut Suriasumantri [1995], pengetahuan mampu dikembangkan manusia disebabkan dua ha1 yaitu, manusia mempunyai bahasa yang mampu mengkomunikasikan informasi, dan jalan pikiran yang melatarbelakangi informasi tersebut
.
Pada beberapa penelitian sebelumnya banyak dibahas tentang ekstraksi teks, antara lain bagaimana melakukan pemangkasan teks yang panjang dalam satu paragraf sehingga menjadi lebih sederhana, tanpa menghilangkan informasi yang terkandung di dalamnya. Hasil penelitian ini sangat berarti bagi pengguna dalam memahami sebuah teks. Jika ingin merangkum banyak teks yang ada sehingga menjadi sederhana dan mudah dipahami perlu dilakukan penelitian lanjutan.
Metode Knowledge Graph (KG) adalah suatu metode baru dari NLP yang merupakan sebuah tinjauan untuk menggambarkan atau menjelaskan bahasa dengan cara menganalisis teks secara harfiah dan diperkaya dengan latar belakang pengetahuannya sehingga menghasilkan sebuah pengetahuan baru [Zhang,2002]. Pengembangan metode KG yang akan diteliti lebih lanjut apakah dia mampu menjawab persoalan-persoalan tersebut.
Untuk itu, penulis melakukan penelitian untuk menganalisis dan mengembangkan metode KG dalam membaca suatu teks untuk mendapatkan
4 keraguan dalam mengartikan sesuatu, memiliki kemiripan arti
sebuah ringkasan (knowledge) baru yang dapat dijadikan pengetahuan dalam rangka pengambilan keputusan. Pada penelitian ini, penulis melakukan studi kasus dengan cara menganalisis teks-teks yang berhubungan dengan Sistem Pendidikan Nasional (Sisdiknas). Hal ini karena pendidikan sangat erat kaitannya dengan sumber daya manusia (SDM). SDM yang berkualitas menjadi suatu yang harus dimiliki sebagai aset negara jika tidak ingin menjadi tamu di rumah sendiri di era globalisasi ini.
1.2. IDENTIFIKASI MASALAH
Metode KG bertujuan agar mampu merepresentasikan seluruh pengetahuan yang dapat diekspresikan ke dalam bahasa alami. Dalam ha1 ini penulis akan mengumpulkan data berupa teks yang berkaitan dengan Sisdiknas. Teks-teks tersebut memiliki konsep-konsep dan link yang merelasikan antar konsep. Proses mendapatkan konsep dan relasi dilakukan dengan cara menganalisis teks sesuai aturan main dari metode tersebut. Dengan cara demikian akan didapat sebuah graf sederhana yang mampu memberikan informasi penting yang menjadi sebuah pengetahuan.
1.3. BATASAN MASALAH
Batasan masalah dari penelitian ini adalah menganalisis teks-teks yang dipilih6 yang berkaitan dengan sisdiknas di Indonesia untuk menentukan konsep dan link-nya, menentukan relasi yang sesuai dengan aturan (rule) dari metode KG dalam bentuk graf berarah. Kemudian graf tersebut diolah menjadi combined graph sampai didapatkan graf yang sederhana (simpl?fied graph).
1.4. PERUMUSAN MASALAH
Penelitian ini melakukan pemetaan masalah pendidikan yang ada di Indonesia dengan menjelaskan relasi antara konsep dengan simbol dan obyeknya (triangle meaning), serta menguraikan keterkaitan konsep tersebut dengan konsep lainnya. Dengan kata lain, pemetaan tersebut memposisikan sebuah konsep umum (generale concepts) untuk dianalisis menjadi beberapa konsep turunan (sub
concepts) dalam satu bagian, serta menunjukkan hubungan konsep turunan tersebut dengan konsep turunan yang lain dalam bagian lain sehingga muncul pengertian baru.
Perumusan masalah pada penelitian adalah:
1. Dapatkah metode KG digunakan sebagai instrumen untuk menganalisis bagaimana memahami banyak teks sehingga mampu memberikan suatu informasi baru?
2. Bagaimana metode KG mampu menyederhanakan masalah yang ada dalam bentuk graf?
1.5. TUJUAN DAN MANFAAT PENELITIAN
Tujuan penelitian ini adalah mengembangkan metode KG sebagai instrumen yang berdayaguna untuk menganalisis teks-teks dengan tema yang sama dalam jumlah yang besar yang kemudian hasilnya menjadi sederhana dalam bentuk graf sehingga dapat dijadikan sebagai pengetahuan baru.
Kegunaan penelitian ini adalah dapat mensosialisasikan dan menunjukkan bahwa metode KG mampu memberikan tambahan pengetahuan sebagai informasi penting yang dapat digunakan dalam pengambilan keputusan.
1.6. METODOLOGI PENELITIAN Metodologi penelitian ini meliputi:
1. Identifikasi Konsep (concept ident~jcation).
Pada tahapan ini dilakukan pengumpulan data yang berupa teks dengan mengkombinasikan konsep-konsep yang mirip, kemudian konsep-konsep tersebut didefinisikan untuk mencari konsep mana yang lebih penting dan layak untuk dipilih.
2. Integrasi Link (link integration).
Tahapan ini digunakan untuk melakukan penambahan atau penggandaan relasi-relasi dari hasil kombinasi dari hubungan antar konsep.
Tahapan ini melakukan pemetaan masalah-masalah dengan acuan aturan yang ada pada metode KG. Apabila ada dua atau lebih kombinasi graf, dapat dijadikan satu graf baru (combined graph).
4. Pembagian graf menjadi subgraph.
Tahapan ini melakukan penajaman dari graf yang paling penting untuk mendapatkan graf yang sederhana (simplified graph) agar lebih mudah untuk diinterpretasikan.
1.7. SISTEMATIKA PENULISAN
Tulisan sebagai dokumentasi pada penelitian in dibagi ke dalam beberapa bagian dengan susunan sebagai berikut:
Bab I, membahas hal-ha1 yang menjadi latar belakang sampai pada tujuan yang diinginkan pada penelitian ini.
Bab 11, berisi landasan teori yang menjadi rujukan untuk melakukan penelitian ini.
Bab 111, menguraikan metodologi yang dilakukan dalam penelitian ini. Bab IV, berisi tentang pembahasan proses analisis teks, studi kasus analisis teks dengan tema sistem pendidikan nasional.
Bab V, berisi tentang penjabaran perancangan sistem dan implementasinya.
BAB I1
TINJAUAN PUSTAKA
2.1. PENDAHULUAN
Metode KG merupakan suatu metode barn dalarn bidang ilmu NLP. Penelitian tentang metode ini diawali oleh para peneliti yang berbasis di Universitas Twente dan Universitas Groningen sekitar lima belas tahun yang lalu, yang kemudian dilanjutkan oleh Prof.dr.C.Hoede (Universitas Twente) dengan fokus utamanya adalah aplikasi
knowledge graph untuk menganalisis sebuah teks [Blok, 19971.
KG adalah salah satu dari beberapa metode yang ada dalam Knowledge ~e~resentation' (KR), dimana KR ini merupakan topik sentral dari Artijkial Intelligence (AI), salah satu cabang ilmu komputer yang digunakan untuk memecahkan masalah berbasis pengetahuan [Zhang, 20021.
Tujuan KG digunakan untuk merepresentasikan sebuah pengetahuan yang dapat diekspresikan dalam bahasa natural [Kramer, 19961. KG dibangun untuk menjelaskan persepsi manusia ke dalam model semantik dan pemrosesan informasi [Zhang, 20021. Semantik lebih dekat dengan logika dan merupakan bagian dari
formal language (sama dengan natural language) dan sebagai langkah besar untuk memahami semantik menjadi "know it and know why" dan bagaimana menggambarkan "thinking and linking something " [Hoede, 20051.
Metode KG melakukan ekstraksi sebuah teks dimana hasil yang dikeluarkan dalam bentuk graf berarah2 [Hoede, 20051. Ekstraksi teks ini melalui proses analisis teks bahasa dengan menitikberatkan lebih pada aspek semantik3 daripada sintaksis4.
I Sebuah jalurlpath atau berupa graf yang berisi inforrnasi-informasi yang telah disepakati
'~ipakai untuk rnelukiskan ketergantungan antara atribut-atribut
'~ilsafat bahasa lebih berkenaan dengan arti kata atau arti bahasa (semantic). Salliyanti: Peranan Filsafat Bahasa Dalam Pengembangan llmu Bahasa, 2004, USU Repository 2006
4
Teori ini secara luas biasa diaplikasikan pada information sistem modeling, natural language processing, information retrieval dan case base reasoning serta pembelajaran teknik dan kasus-kasus yang berhubungan dengan logika [Sowa,
19921.
KG merupakan sebuah instrumen untuk mewakili Conceptual Structure
tertentu dan dengan KG, relasi-relasi antar suatu rangkaian dapat diminimalisir karena sifatnya terbatas [Kramer, 19961.
2.2. GRAF
Suatu graf yang dinotasikan dengan G = (V
,
E) adalah himpunan vertex- vertex V dan himpunan edge E, dimana E dibentuk dari VxV. Dengan kata lain graf adalah kumpulan vertex dan edge yang menghubungkan vertex tersebut [Cormen, et.al, 19901. Ditinjau dari arahnya, graf dibagi menjadi dua yaitu, graf berarah(directed graph) dan graf tidak berarah (undirected graph).
Dalam graf, lintasan (path) adalah urutan vertex ata edge yang dibentuk untuk bergerak dari satu vertex ke vertex yang lain. Pada graf berarah, arah sisi atau urutan ikut diperhatikan. Titik akhir dari suatu lintasan akan menjadi titik awal dari lintasan berikutnya [Utdirartatmo, 200 1 1.
2.3. KNOWLEDGE GRAPH
Metode KG muncul pada tahun 1982 di Departement of Sosiology di
berbeda ke dalam sebuah graf yang terintegrasi, yang mampu menggambarkan konsep dan relasinya dengan cara disederhanakan atau diekstrak kembali. Informasi yang diekstrak dari teksnya disebut text analysis [Vries, 19891.
Ada beberapa prinsip penting dalam KG untuk dibangun ke dalam bentuk tipe relasi yang sederhana, yaitu:
Relasi par, digunakan untuk menyatakan bahwa konsep A sama dengan konsep B
Relasi sub, digunakan untuk menyatakan bahwa konsep A adalah contoh dari atau bagian dari konsep B
Relasi cau, digunakan untuk menyatakan bahwa ada hubungan sebab akibat dari konsep A dengan konsep B. Relasi cau ini ada yang cau+ (korelasi positif) ada juga cau- (korelasi negatif)
Salah satu konsep yang paling penting dari teori KG ini adalah kemiripan. Jika ada dua persepsi yang mirip, bisa digunakan satu simbol yang sama untuk mengekspresikan persepsi yang mirip itu, atau kedua ha1 itu dapat merupakan bagian dari simbol tersebut sehingga membentuk sebuah struktur. Struktur-struktur dari gabungan simbol itu disebutframe.
2.3.1. DISKRIPSI FORMAL DARI KNOWLEDGE GRAPH
Pada prinsipnya komposisi dari KG terdiri dari Concept (tokens dan types) dan relationship (binary dan multivariate relution) [Zhang, 20021. Dalam KG, seluruh ha1 mengenai konsep memiliki keterkaitan dengan ha1 lainnya.
Dalam KG kita bisa membedakan tiga tanda:
3. ~ i m b o l u menandakan adanya sebuah konsep dan dapat disejajarkan dengan fungsi argument dalam logika.
4. Tipe digunakan untuk memberikan nama pada sebuah konsep yang umum. 5. Instantiation (pemberian contoh) digunakan untuk menambahkan
model/contoh untuk memperjelas sebuah konsep.
Untuk memahami pengertian suatu pernyataan, perlu dibedakan relasi-relasi yang mungkin terjadi antara beberapa konsep. Relasi mengekspresikan hubungan yang memiliki sebab akibat dan efek dari hubungan keduanya, atau yang saling mempengaruhi satu dengan yang lainnya. Relasi dasar dari KG adalah relasi cause (cau) yang merelasikan tipe yang memiliki daya tarik di dalamnya
2.3.2. ASPEK-ASPEK ONTOLOGI
Ontologi adalah untuk menggambarkan beberapa konsep dan relasi-relasi di antaranya, dengan maksud untuk memberikan definisi yang cukup terhadap ide- ide yang dituangkan dengan komputer untuk merepresentasikan ide-ide tersebut dan logikanya.
Ontologi Kant
Menurut Kant [Zhang, 20021, ada 12 notasi dasar pada graph ontology yang difokuskan pada aspek logika, yaitu:
Tabel 1. Dua Belas Notasi IDasar pada graph ontology menurut Kant
Peirce
Konsep Peirce menggambarkan logika dengan graph, yang disebut
existential graph. Ide awalnya dengan menyederhanakan notasi and (A) dan QUANTITY
Unity Plurality Totality
QUALITY
Reality
Negation Limitation
RELATION
Inherence
Causality Commonness
MODALITY
Possibility
notasi negation (1)untuk dua .frume atau type yang berbeda. Konsep Peirce
sebenarnya bisa dijadikan "guide" untuk ontologi Kant, dengan memperkenalkan tiga notasi, yaitu: konsep Jirstness, secondness dan thirdness. Menurut Sowa [1994], definisi Pierce tersebut dapat dijelaskan sebagai berikut:
Firstness : konsepsi yang ada secara independen atas sesuatu yang lain
Secondness : konsepsi relatif ada atas dasar reaksi dengan sesuatu
Thidness : konsepsi mediasi, konsep satu dengan yang lain memiliki hubungan
Hubungan ontologi Kant dan Peirce, menimbulkan suatu triple atas metode KG, yaitu: concept, foreground knowledge dan background knowledge.
Berdasarkan kedua ontologi tersebut di atas, maka didapat ontologi yang dijadikan simbol dalam merode KG, yang terdiri dari delapan type binary relationship dan empat type n-ary relationship (yang juga disebutframe relationship).
Delapan binary type relationship adalah:
1 . Equality : equ
2. Subset relationship : sub
3. Similarityofsets, alikeness : ali
4. Disparateness : dis
5. Causality : cau
6 . Ordering : ord
7. Attribution : par
8. Informational dependency : sko
Empat n-ary relationship terdiri dari:
1. Focusing on a situation : fpar
2. Negation of a situation : negpar
3. Possibility of a situation : pospar
4. Necessity of a situation : negpar
1. Relasi Kausalitas (CAUSALITY)
Dalam relasi causalitas (cau) selalu terdapat sebab dan akibat dimana sesuatu mempengaruhi sesuatu yang lain. Relasi ini adalah hubungan yang paling sering diungkapkan dalam metode-metode ilmiah terutama dalam mendiagnosis sesuatu.
2. Relasi Kesederajatan (EQUALITY)
Relasi equality (equ) digunakan untuk menjelaskan konsep yang sederajatlsama, mengekspresikan 2 ha1 yang identik. Logika matematika equ diformulasikan dengan: jika A equ B, maka A = B. Equ digunakan untuk menghubungkan A & B.
3. Relasi yang Bertautan (SUBSET)
Relasi subset (sub) bila digambarkan adalah sebagai berikut, bila ada dua token yang mengekspresikan dua rangkaian secara bertautan yaitu sesuatu yang merupakan bagian dari sesuatu yang lain, maka dapat digunakan relasi sub. logika matematika sub diformulasikan dengan: jika A sub B, maka A C B Dalarn relasi, ada 2 tipe relasi sub yang penting diingat:
a. Konsep A lebih luas daripada konsep B, contoh: "Mamalia sub kucing" b. Konsep B lebih luas daripada konsep A, contoh: "Ekor sub Kucing
Relasi sub pada dasarnya adalah menggambarkan satu bagian dari sebuah konsep yang utuh sehingga fungsi sub berkaitan erat dengan konsep kepemilikan, artinya A adalah milik atau bagian dari B.
4. Relasi KemiripanIKesamaan (ALIKENESS)
Relasi alikeness (ali) digunakan bila antara dua token terdapat elemen-elemen yang sama. Logika matematika ali diformulasikan dengan: jika A ali B, maka A
n B # O .
5. Relasi PerbedaanIKetidaksamaan (DISPARATENESS)
+
DIS6. Relasi Attributive
Relasi attributive (par) ini digunakan untuk menjelaskan bahwa satu elemen berkaitan dan memiliki sifat elemen lainnya.
7. Relasi yang berurutan (ORDERING)
Hubungan relasi ordering (ord) menjelaskan bahwa 2 benda memiliki urutan satu sama lain. Umumnya urutan ini berkaitan dengan waktu dan tempat, tapi juga bisa digunakan untuk mengungkapkan hubungan "<" yang dikenal dalanl
matematika A < B (A lebih kecil dari pada B). 8. Relasi Ketergantungan lnformasi (SKOLEN)
R'elasi skolen (sko) adalah, bila konsep-konsep di atas tidak bisa digunakan dalam menghubungkan hal-hal, diperlukan satu ha1 lagi hubungan yang disebut dengan hubungan yang lebih mengacu pada hubungan sintaksis dari pada semantik.
Secara lengkap, simbol-simbol tersebut disajikan pada Tabel 2 berikut ini: Tabel 2. Simbol relasi dasar dari metode KG
EQL
41 I
DIS
PAR
TOKEN
equ
sub
ali
dis
Par
Vertex primitives
Sesuatu
Link Primitive
Sama (memiliki kesamaan)
Bagian Dari
Sama dengan
Tidak sama dengan
FPAR
ASS
ORD
SKO
NFPAR
POSPAR
fpar
ass
ord
cau
sko
sko
nfpar
pospar
necpar
Pemberian sifat internal dari sesuatu ke sesuatu yang lain (dalam frame)
Dua ha1 yang berbeda diasosiasikan satu sama lain Sesuatu diurutkan berdasarkan perbandingan dengan sesuatu yang lain
Sesuatu mempengaruhi sesuatu yang lain
Sesuatu yang tergantung pada dirinya sendiri (kuantifikasi universal)
Informasi mengenai sesuatu tergantung kepada sesuatu yang lain
Pemberian sifat internal sesuatu ke sesuatu yang lain tetapi dalam bentuk negasilnegatiflpenolakan (dalam frame)
Pemberian sifat internal sesuatu ke objek yang lain sebagai sebuah kemungkinan (dalam frame)
LOGIKA
Logika, berasal dari kata logos dari bahasa Yunani, yang berarti kata, dasar, makna. Cabang filsafat yang memberi kaidah bagaimana harus berfikir lurus, isi konsep sangat dipentingkan [Hartono, 19951
Dalam KG, fpar-frame dan neg-frume dapat dihubungkan dengan struktur pada graf Peirce. Frume-frume itu mengekspresikan modal logika seperti "possibility ", "necessity ", "and ", "or ", "not " dan
"if
then " dan lain sebagainya. Simbol-simbol ini nantinya akan banyak digunakan dalam membangun struktur KG.2.3.3. NATURAL LANGUAGE PROCESSING (NLP)
Bahasa alami (yang digunakan manusia) adalah suatu bahasa yang paling mudah dan popular digunakan dalam memberi dan menerima informasi. Di sisi lain, komputer hanya mengerti bahasa formal (yang dipahami oleh komputer), sehingga terjadi gap di antara keduanya. NLP adalah suatu proses yang mampu menjembatani antara bahasa alami dan bahasa formal [Zhang,2002].
Proses memahami antar bahasa tersebut di atas disebut parsing. Dalam melakukan parsing sebuah kalimat, diperlukan tata bahasa untuk menggambarkan bagian-bagian dari kalimat tersebut. Ada dua faktor yang diperhatikan dalam menganalisis kalimat,yaitu: sintaksis dan semantik. Perbedaan sintaksis dan semantik adalah sintaksis melakukan analisis berdasarkan bentuk dari suatu kalimat, sedangkan semantik melakukan analisis bagaimana mengartikan suatu kalimat.
Konsep merupakan komponen terpenting dalam pemikiran manusia. Konsep mampu menjadi prosedur dalam membentuk suatu pengertian dari khusus ke umum atau bahkan sebaliknya.
Grammar Fillmore 's Case
Dalam memahami natural language, bagaimana menggambarkan struktur semantik dalam sebuah kalimat? Grammar Fillmore's Case memiliki beberapa kelompok konsep untuk mengkomposisikan bagian proposisi dalam menggambarkan struktur semantik tersebut, yaitu [Zhang,2002]:
TENSE (Past, Present, Future) ASPECT (Per-ct, Imperfect)
MOOD (Declurutive, Interrogative, Imperative) FORM (Simple, Emphatic, Progressive)
MODAL (Can, May, Must)
ESSENCE (Positive, Negative, Indeterminate) TIME (Adverbial)
M N N E R (Adverbial)
Bagian proposisi ini dibentuk oleh sebuah phrase kata kerja dan beberapa kata benda. Tiap phrase kata benda yang terhubung dengan kata kerja membentuk suatu relasi, maka hubungan itu disebut sebagai "Cuse".
Ekspresi Semantik Dengan KG
Gambarl. Contoh Ekspresi Seinantik dengan KG
Dalam bahasa semantik, pengertian . a n g sama dalam sebuah teks dapat diekspresikan dengan berbagai ekspresi kalimat, meskipun tampak kalimat-kalimat tersebut berbeda, namun memiliki pengertian yang sama. Metode KG akan membangun suatu struktur arti. Mengartikan kata akan dioperasikan dengan word graph, mengartikan kalimat dioperasikan dengan sentence graph.
2.4. STRUCTURAL PARSING
Parsing merupakan bagian penting dari NLP. Parsing adalah suatu proses dari representasi struktur dari kalinlat nuturul language yang selalu diakurasikan dengan tata bahasa. Ada dua ha1 pentiilg di sini, satu; pursing membutilhkan sebuah perwakilan atas interlingua (inter-transmitrul lunguagc), dimana dia berada di antara narural languuge sentence dan struktur yang dapat diakses oleh komputer, dan kedila; pursing membutuhkan grainar dari naturul lunguge tersebut. Pursing
metode KG berada pada interlinguu, yang merupakan metode pursing baru yang dikenal dengan istilah Srrucrurul Pursing. Structural Pursing adalah pemetaan atas kalimat dengan semantic sentence graph [Zhang, 20021.
Structural Parsing terdiri diri word gruph dan sentence graph. Sebuah word graph mzngekspresikan arti kata dengan struktur kata dan sentence graph
mengekspresikan arti kalimat dengan struktur kalimat pula. Word graph merupakan unit dasar dari NLP, sedangkan sentence gruph terbentuk dari word graph yang tersebut di kalimat/teks. Prinsip dari structural pcrrsing adalah:
Prinsip dari structural parsing adalah:
Grammar digunakan untuk membangun satu atau lebih parse tree untuk kalimat-kalimat
Graf kalimat sintaksis diturunkan dari word graph sintaksis menggunakan
parse tree
Graf kalimat semantik diturunkan dari sentence graph sintaksis yang ada.
2.5. BAGAIMANA MELAKUKAN TRANSFORMASI TEKS KE DALAM
KNOWLEDGE GRAPH
Langkah-langkah melakukan transforrnasi teks ke dalarn KG adalah:
1. Menganalisis teks secara harfiah, sambil menganalisis konsep dan relasi yang ada di dalamnya.
2. Menambahkan pengetahuan latar (background knowledge) ke graflpemetaan latar (background graph). Background knowledge diperlukan untuk mengetahui konsep dan relasi yang ada dalam teks.
3. Menggabungkan relasi-relasi yang diperoleh dari analisis teks dengan
background knowledge.
4. Memasukkan konsep dan relasi ke dalam piranti lunak.
2.5.1. ANALISIS TEKS
Menganalisis teks ke dalam konsep-konsep dan relasinya, merupakan proses secara subyektif, artinya sangat tergantung pada interpretasi seseorang yang melakukannya. Dalam menentukan konsep, kemungkinan besar akan banyak memiliki kemiripan antara satu orang dengan yang lainnya, karena secara harfiah masing-masing definisi dari konsep sudah baku. Namun penentuan relasi antar konsep sangat tergantung dengan pengetahuan masing-masing, dalam penggunaan
basic relation.
par juga kurang begitu jelas membedakannya. Sebagai gambaran, relasi sub digunakan untuk sesuatu yang merupakan salah satu bagian dari konsep lainnya, sedangkan relasi par digunakan untuk sesuatu dimana sebagian atribut dari sesuatu tersebut adalah bagian dari konsep lainnya. Relasi ali, dis dan equ lebih mudah menjelaskannya. Empat relasi lainnya (fpar, negpar, pospar, negpar) adalah relasi yang digunakan jika lebih dari dua relasi yang dihubungkannya.
Seperti dijelaskan sebelumnya bahwa menerjemahkan teks dengan metode KG, memiliki batasan. Keterbatasan itu meliputi [Vries, 19891:
Batasan menganalisis dengan menggunakan komputer Batasan sejumlah himpunan konsep
Batasan sejumlah himpunan relasi
Batasan sejumlah himpunan isullatar belakang informasi
Pada batasan pertama, komputer memiliki keterbatasan dalam mernberikan kriteria untuk mendefinisikan konsep dan relasinya, karena terkait dengan logikalpikiran orang.
Batasan kedua, himpunan konsep relatif lebih muda diimplementasikan yakni dengan membatasinya dengan cara menentukan konsep dengan konsep-konsep yang berdekatan dengannya (neighbours) dengan tiga tingkat kederajatan (first degree neighbour, second degree neighbour, third degree neighbour). Konsep derajat pertarna adalah konsep yang sudah didefinisikan sebelum melalui analisis, jadi subyek yang dipahami pada teks langsung dijadikan sebagai konsep. Konsep derajat kedua adalah konsep yang memiliki hubungan langsung dengan konsep derajat pertama. Konsep derajat ketiga adalah konsep yang berelasi dengan konsep derajat pertarna dengan melalui konsep derajat kedua.
Batasan ketiga, jumlah relasi sudah sangat jelas dengan adanya relasi-relasi yang termasuk dalarn KG, yang tergabung dalam 8 relasi binari dan 4 relasi n-ary.
2.5.2.' LATAR BELAKANG PENGETAHUAN
Dalam Filsafat Ilmu, Pengetahuan mampu dikembangkan manusia disebabkan dua ha1 yaitu [Suriasumantri, 19951:
1. Manusia mempunyai bahasa yang mampu mengkomunikasikan informasi 2. Jalan pikiran yang melatarbelakangi informasi tersbut
Untuk itu, jika user ingin menggunakan komputer untuk menganalisis suatu teks, maka perlu juga mempertimbangkan beberapa latar belakang pengetahuan, dengan tujuan memperkaya pengertian sebuah teks.
2.6. CONTOH TRANSFORMASI TEKS KE DALAM KNOWLEDGE GRAPH
Suatu teks: "Pemerintah membuat undang-undang untuk mengatur sistem pendidikan nasional dengan tujuan mencerdaskan bangsa". Teks tersebut memiliki beberapa konsep, yaitu: Penlerintah, Undang-undang, sistem pendidikan nasional dan mencerdaskan bangsa. Konsep-konsep itu kemudian direlasikan sebagai berikut:
Undang-undang mengatur sistem Pendidikan Nasional
-3 Undang-undang ord sistem pendidikan nasional
Pemerintah yang membuat Undang-undang Sistem Pendidikan Nasional bertujuan mencerdaskan bangsa
+
Pemerintah cau mencerdaskan bangsa3
Undang-undang dan sistenl pendidikan nasional fpar PemerintahApabila teks tersebut akan ditransformasikan ke dalam KG, sebelumnya bisa diganibarkan terlebih dahulu seperti pada Gambar 2.
Gambar 2. Text Represenfutioi~ menggunakanfiume Pemerintah
cau
Undang-undang Mencerdaskan Bangsa
i
ord
-
r-
Gambar 2 belum merupakan sebuah graf tetapi masih dalam bentuk konsep yang digambarkan dengan relasinya sesuai dengan arti dari teks tersebut. Dari gambar tersebut kemudian diterjemahkan ke dalam bentuk graf menjadi teks graf dalam konsep metode KG, seperti pada Gambar 3.
fpar
Undang-undang
/
ord\\
Sistem Pendidikan Nasional yang baik-
[image:36.547.44.477.99.748.2]Pemerintah
Gambar 3 Terjemahan ke KG
BAB 111
METODOLOGI PENELITIAN
3.1. KERANGKA PEMIKIRAN
Memahami teks menggunakan metode KG, merupakan salah satu cara untuk mendapatkan informasilpengetahuan baru. Metode KG, merupakan salah satu metode yang digunakan untuk membantu mengartikan sebuah teks bahasa dengan menitikberatkan pada analisis semantik. Dalam parsing, analisis semantik agak rumit dilakukan karena ini berkaitan dengan subjektifitas seseorang yang melakukannya, namun ternyata, menerima informasi dalam pengambilan keputusan sangat membutuhkan analisis tersebut'. Dalam penelitian ini proses parsing yang dilakukan adalah melakukan pemisahan tiap-tiap kata dalam teks yang dipisahkan oleh spasi dan kata tersebut akan menjadi konsep kecuali kata-kata yang termasuk dalam kata buangan (kata yang tidak penting).
Analisis semantik yang dilakukan, harus melalui beberapa tahapan. Tahapan pertama melakukan identifikasi konsep dan relasi di dalam teks yang akan dianalisis. Penentuan Relasi antar konsep sangat dipengaruhi oleh user, berdasarkan pengetahuan yang dimilikinya. Oleh karena itu, tahapan identifikasi konsep dan relasi membutuhkan waktu dan pemikiran yang serius agar diperoleh relasi antar konsep yang baik. Tahapan ini menentukan tahapan selanjutnya, yaitu pembentukan graf relasi antar konsep menjadi text graph. Text graph pada tahapan ini masih berdiri sendiri sesuai dari masing-masing teks yang dianalisis. Gabungan text graph menjadi combined graph dari seluruh teks, membentuk formasi graf yang utuh, namun menjadi sangat kompleks dan rumit dalam membacanya. Untuk itu diperlukan perangkat lunak untuk membantu menyederhanakan combined graph tersebut.
Perangkat lunak dibuat untuk kebutuhan menginput data berupa konsep dan relasi; ontologi yang digunakan serta rule untuk melakukan proses penyederhanaan sehingga menjadi simplified graph. Kerangka pemikiran ini bisa dilihat dalam Garnbar 4 ini.
I
Pengumpulan data berupa teks dengall tenia yang samaAnalisis Teks dengan mengidentifikasi konsep dan relasinya, berdasarkan :
teks harfiah teks latar belakang
I
.(
Konsep dan relasi diformat dalam bentuk graf menjadi rext graph, dengail menggunakan 8
jenis relasi KG
I
+
Kedua text graph dikoinbinasikan menjadi
combined graph dengan bantuan pi rant i l unak yang mengoperasikan concept identification
Combined graph disederhanakan melijadi
sitnpl~jied graph berdasarkan rtike dalain KG,
dengan bantuan piranti lunak, untuk mengoperasikan:
-
link infegra/ion- tnerging ofgt-uph
- purlilioning ofgruph inio subgrclph
[image:38.553.52.417.54.686.2]Hasil analisis teks dengan metode KG
3.2. ANALISIS MEMAHAMI TEKS DENGAN METODE KNOWLEDGE GRAPH
Dalam pembahasan dalam bab selanjutnya, peneliti akan melakukan analisis beberapa teks dengan satu tema, yaitu tentang penyelenggaraan sistem pendidikan nasiopal yang bertujuan mencetak manusia-manusia unggulan (berkualitas) demi kemajuan bangsa.
Dengan KG, teks-teks tersebut, dianalisis dengan cara: 1. Menentukan konsep-konsep yang tertulis dalarn teks 2. Menentukan relasi antar konsep tersebut di atas.
3. Konsep dan relasi yang terbentuk, diterjemahkan secara harfiah dalam bentuk graf yang disebut text graph
4. Dalam KG, perlu juga mengartikan teks itu berdasarkan latar belakang informasi yang dimiliki sesorang tersebut (background knowledge), dan diterjemahkan pula dalam bentuk graf menjadi text graph pula.
5. Dari kedua graf itu (graf harfiah dan graf latar), dikombinasikan menjadi sebuah graf baru (combined gruph) menjadi new rext graph.
6. Teks graph yang baru, tentu masih sangat rumit untuk dibaca dan dipahami, karena melibatkan banyak konsep, untuk itu perlu melakukan penyederhanaan graf (simplijied graph).
Analisis Analisis harfiah Latar
Pemindahan subkonsep menjadi konsep umuln
Teks graf
1
ldentifikasi Konstr~ksi Combined Graph1
Pe~nbentukan Subgraf ~nandiri Sinlplifikasi1
Pen~hilangan causal chuinsPenyatuan relasi-relasi
Pengkategorisasian Konsep
Hasil Penelitian
Secara Kuantitatif ldentifikasi Konsep-konsep yang paling penting Pengullan Konsep
[image:40.549.51.473.54.546.2]r
Gambar 5. Metodologi Analisis Memahami Teks dengan Metode Knowledge Graph
3.2.1. TRANSFORMASI TEKS KE DA LAM KNOWLEDGE GRAPH
Prosedur melakukan transformasi teks ke dalarn KG, adalah sebagai berikut: 1. Analisis teks, teks dibaca dengan teliti untuk mengidentifkasi konsep dan
relasi secara harfiah sesuai teksnya, menjadi texf concepfs und elutions
2. Penambahan latar belakang pengetahuan, menjadi background concept and relations.
3. Kedua teks (teks harfiah dan teks latar) dikombinasikan membentuk
combined graph.
Gambar 6. Proses analisis teks
Langkah pertama dalam proses ini adalah melakukan analisis teks, dimana teks-teks yang ada dicari konsep dan relasinya untuk diterjemahkan ke dalam graf yang berupa teks gruph. Dalam analisis teks, relasi Tcxl Gruph yang sangat berpengaruh adalah relasi cau yang terdiri dari cau+ dan cau-, dalam membaca statemen apakah ia membawa pengaruh positif atau pengaruh negatif. Selain itu
background knowledge sangat diperlukan dalam menginterpretasikan teks, dari situlah kernudian muncul con~bincd gruph, yaitu gabungan dari text gruph dan
background gruph.
Konsep teks dan
\
relasi-relasinya3.2.2. PENYEDERHANAAN GRAF PADA hWOWLEDGE GRAPH
Satu ha1 yang paling mendasar dalam pembuatan graf, adalah bagaimana agar permasalahan yang ada jika telah diterjemahkan dalam bentuk graf, menjadi lebih mudah dimengerti atau lebih mudah dibaca. Oleh karena itu Iangkah selanjutnya adalah melakukan penyederhanaan graph (Simpl~fied Graph)
Penyederhanaan graf tidak hanya berguna dalam membatasi jumlah konsep dan relasinya, tetapi juga membantu memecahkan masalah yang berhubungan dengan sinonim dan spesialisasi atas konsep-konsep tersebut [Kramer, 19961.
Proses penyederhanaan graf, yaitu meliputi:
1. Pembentukan konsep-konsep umum (general concept)
2. Identifikasi konstruksi (identrfiing constructs)
3. Pembentukan subgraf mandiri (ident~fiing idenpendent subgraphs)
4. Penghilangan causal chains (reducing causal chains)
+ Text Graph
Combined Graph
Konsep latar . . . . . . . . . . . . .
Proses penyederhanaan
Gambar 7. Proses Penyederhanaan Graf
Simplified Graph
Pembentukan General Concept
Dalanl melakukan penyederhanaan graf, ha1 yang paling penting untuk tetap dijaga adalah tidak terjadinya kehilangan informasi, artinya konsep dan relasi yang disederhanakan tidak mengubah arti dan tidak menghilangkan informasi penting di dalarnnya. Yang berhubungan dengan penyederhanaan graph adalah subconcept2 dan
general concept 3
Ide melakukan proses ini adalah mengurangi adanya graf dengan tingkat yang sangat detil, karena ini akan sangat rumit dalam membacanya. Proses ini terutama memfokuskan pada relasi sub, par, ali dan equ, dengan ketentuan:
1. Konsep yang dihubungkan oleh relasi ali atau equ, dapat dijadikan dalam satu konsep menjadi generul concept.
2. Konsep yang merupakan bagian dari konsep lain, yang berarti terdapat relasi
sub atau par, dapat dijadikan satu konsep yang mengakomodir keduanya. Dari dua ketentuan tersebut, maka langkah pertama yang dilakukan adalah melihat relasi-relasi tersebut dalam graf, lten~udian mencari subgruph yang terhubung setelah itu dicoba adakah subgrcrph tersebut yang dapat dipindah-tempatkan berubah
Pembentukan konse~-konse~ umum
I
ldentifikasi konstruksi
I
I
Pembentukan subnraf mandiriPennhilannan causal chains
Combined Graph
2
Suatu konsep yang merupakan bagian dari general concept
Suatu Konsep yang bukan merupakan bagian dari atau atribut dari konsep yang lainnya
menjadi satu atau dua konsep umum. Konsep yang merupakan bagian dari subgraph yang telah dirubah menjadi konsep umum, disebut sebagai subconcept.
Sebagai contoh:
1. Subconcept pendidikan formal, pendidikan nonformal, pendidikan infornlal
. dilebur, ditempatkan pada satu konsep umum yaitu jalur pendidikan
2. Subconcept pendidikan diniyah, pendidikan pesantren, pendidikan pasraman, pendidikan pabhaja pendidikan samanera, dilebur, ditempatkan pada satu konsep umum yaitu pendidikan kcagamaan.
Dengan demikian graf yang berasal dari subkonsep yang dibangun menjadi konsep umum itulah yang dikatakan sebagai penyederhanaan graf.
Identifikasi Konstruksi
Himpunan konsep-konsep yang memiliki hubungan dekat (neighbours) yang secara langsung memiliki parh di antara konsep-konsep itu dikenal dengan istilah construct. Gambar berikut adalah contoh sebuah konstruksi.
SDM
cau
cau
\
v
cauSistern Pendidikan yang baik
A
cau
Sumber ekonorni vana kuat
Gambar 8. Contoh Sebuah Konstruksi (construct) Independent Subgraplt
tersebut dapat dipisahkan saja, ha1 ini memudahkan analisis keseluruhan graf yang ada.
Causal Chains
Sebuah konsep yang secara tidak langsung dipengaruhi oleh konsep lain, ia dikenal dengan causal chain (misal: konsep A cau Konsep B dan Konsep B cau konsep C). jika tidak ada relasi lain yang mengakibatkan konsep A menjadi penting, maka konsep B dapat dihilangkan saja.
3.3. INTERPRETASI KG
Setelah melakukan penyederhanaan graf, langkah selanjutnya adalah melakukan interpretasi dari KG tersebut. Proses interpretasi ini meliputi:
1. Interpretasi secara kualitatif, yang terdiri dari: I ) Integrasi Link (Penyatuan
'
Relasi-relasi), 2). Klasifikasi Konsep dan 3). Pengujian Konsep.
2. Interpretasi secara kuantitatif, yaitu mengidentifikasikan konsep-konsep yang penting.
3.3.1. INTEGRASI LINK
Integrasi link adalah melakukan pengurangan atau penambahan hubungan- hubungan relasi antar konsep, dimana ha1 ini digunakan untuk melakukan ekstraksi informasi lebih lanjut dari graf. Adanya penambahan dan pengurangan ini disebabkan adanya dua tipe integrasi link, yaitu Serial link integration dan Parallel link integration.
Parallel link integration, jika antara konsep A dengan konsep B terdapat dua relasi yang menghubungkannya, maka mungkin saja dua relasi tersebut dapat dilebur menjadi satu relasi saja antar keduanya.
Gambar 9. Serial link integration Gambar 10. Parellel Link Integration
Menurut Kramer [1996], aturan main sel-iul link integration dari relufion.ship atas 4 relasi (ali, cau+, cau-. equ, par, sub) adalah sebagai berikut:
Tabel 3. Seriul Link Integration
Cau-
Cau- Cau- Cau- Cau+
Cau+ Cau- Cauf
Ali
Ali Cau+
Cau- Equ
Par sub
Equ
Ali Cau+ Cau- Equ Par Sub Ali
Ali
Par
Cau+ Cau-
Par Par
sub
3.3.2. IDENTIFIKASI KONSEP-KONSEP PENTING
Konsep-konsep yang sering muncul di dalam teks atau konsep-konsep yang menjadi superconcept4 untuk beberapa konsep, dan ia selalu ada dalarn graf, maka ia merupakan konsep yang penting.
Instrumen yang dapat digunakan untuk mengidentifikasi konsep yang penting yaitu:
1. Jumlah relasi yang terelasikan dengan sebuah konsep tersebut 2. Jumlah konsep yang dipengaruhi oleh konsep tersebut
3. Jumlah konsep yang mempengaruhi konsep tersebut
4. Jumlah konsep yang dapat dipindahkan oleh konsep tersebut.
Untuk menentukan konsep mana yang paling penting, terlebih dahulu dilihat berapa banyak jumlah konsep yang dipengaruhinya (weightl), berapa banyak jumlah konsep yang mempengaruhinya (weight2) dan jumlah konsep yang merupakan bagian darinya (weight3). Jika berdasarkan pertimbangan bahwa weightl merupakan konsep yang paling penting dan weight3 adalah konsep yang paling tidak penting, maka urutan dari konsep penting itu menjadi weightl >weight2>weight3 (1 :2:3). Begitu juga sebaliknya, maka urutan tersebut menjadi weight3>weight2>weight3 (3:2:1).
3.3.3. KLASIFIKASI KONSEP
Terdapat tiga faktor dalam mengklasifikasikan konsep, yaitu input, output dan esensial konsep. Konsep input dapat terlihat apabila konsep itu menjadi faktor-faktor yang secara otomatis menjadi persepsi di dalarn mewakili informasi pada graf. Konsep output dapat terlihat pada konsep yang menjadi faktor-faktor yang tergantung pada konsep lain pada persepsi itu. Konsep esensial adalah konsep input dan konpsep output yang bergantung pada konsep lain tetapi juga mempengaruhi konsep lainnya dalam graf itu.
4
Jika hubungan konsep A SUB konsep B, dan A adalah superconcept dari B dan B adalah subconcept
3.3.4. PENGUJIAN KONSEP
Pengujian konsep sebenarnya adalah untuk mengetahui seberapa besar pengaruh konsep tersebut dalam sebuah graf dalam rnemperoleh informasi yang akurat. Hal ini dapat dilihat dengan nlenganalisis graf tersebut dengan:
I . Neighbour exanzination
Neighbour examination, merupakan penguj ian secara kualitatif. Penguj ian ini
. memperlihatkan konsep-konsep mana yang menjadi relasi terdekat (I" degree neighbours) dengan konsep yang penting, dan mana yang menjadi indirect neighbour5 (2nd degree neighbors dan 3rddegree neighborn)
.
Examining set
0
Is' degree neighbours2
. degree neighbours
1-1
3"dceree neighbours [image:47.545.52.490.46.744.2]Ganlbarl 1. Neighbours
Tabel 4. Tabel yang digunakan untuk pengujian neighbour
5
Konsep yang menjadi neighbour dari neighbour. Dalam ha1 ini dikenal istilah degree neighbour yaitu, (first, second, third,. .)neighhour.
Pengujian konsep Konsep A
Relasi
A l l - A 1 1 1 A2 1 -A2 1 1 A22-A22 1
A22-A222 A22-A223
3rd
KonsepAlII Konsep A2 1 1 Konsep A22 1
Konsep A222 Konsep A223 - A2-A22 Relasi A-A1 A-A2 Konsep A22 Relasi
A I - A l l A2-A2 I
1''
KonsepAl Konsep A2
2"d
KonsepAll Konsep A2 1
A-A3 A-A4
Konsep A3
Untuk menjelaskan Ganlbar 1 1 dan Tabel 4, dibawah ini akan diberikan contoh pengujian konsep dengan cara neighbour examination, untuk melihat konsep- konsep yang menjadi konsep terdekat dengan konsep yang penting.
Pemerintah- undang-undang
1
subf
pendidikan --bsisdiknas-mencerdaskan bangsa ---+ kesadaran
keagamaan sub cau tanggung jawab
Keimanan ketakwaan akhlak mulia
Gambar 12. Contoh Pengujian Neighbour
Kemudian dari Gambar 12 bisa pula dijeiaskan dengan nlenggunkan tabel sepeiti pada Tabel 5 ini.
Tabel 5. Contoh Pengujian neighbour
2. Tabel Input-Output
Merupakan cara lain dalam pengiljian Itonsep, sama seperti nomor 1, tetapi diterjemahkan dalam bentuk tabel, dengan tujuan untuk mengetahui pula neighbour examination.
Pengujian konsep Sisdiknas
Relasi 3rd Relasi
Ord Sub
Par
1 st
pemerintah pendidikan keagamaan
kekuatan spiritual
Relasi
sub par
2nd
3.4. PENYUSUNAN PIRANTI LUNAK
Pada tahapan combined graph dan simpliJied graph, dibutuhkan penulisan untuk menghasilkan keluaran yang diinginkan. Program yang ditulis meliputi:
1. Program untuk memasukkan data
2. Program mengkombinasikan text graph dan background graph 3. Program penyederhanaan graf
3.4.1. METODE DALAM MENYUSUN PIRANTI LUNAK
Metode dalam pembuatan piranti lunak, menggunakan pendekatan Object Oriented Programming (OOP), dengan bahasa pemrograman Borland Delphi 6.0. Pengembangan sistem untuk rekayasa memahami teks ini dilakukan dengan menggunakan metode pengembangan model Rapid Application Development (RAD) [Kendall, 20031.
Tiga tahap siklus pengembangan sistem model RAD, adalah sebagai berikut:
1. Tahap Perencanaan, digunakan untuk mengidentifikasi tujuan aplikasi dan informasi-informasi yang dibutuhkan.
2. Tahap Konstruksi/Workshop Desain, digunakan untuk melakukan perancangan proses-proses yang akan terjadi dalam sistem, perancangan basis data dan perancangan antarmuka yaitu antarmuka masukan dan antarmuka keluaran.
3. Tahap Pelaksanaan, tahapan ini dilakukan untuk implementasi sistem dan melakukan pengenalan terhadap sistem.
3.4.2. BAHAN DAN ALAT
Tabel 6. Bahan dan Alat
Alat
Perangkat Komputer
-
Prosesor Intel Pentium 1,7GHz-
Memori: 256 MB RAM-
Harddisk: 60GB-
V G A 3 2 M b-
Monitor dengan resolusi 1024x768 Windows XP2003Borland Delphi 6.0 Microsoft Access 2000
Fungsi
Piranti keras untuk menjalankan sistem rekayasa memahami teks
Sistem Operasi
Membuat sorce codc analisis teks
BAB
IV
ANALISIS: STUD1 KASUS
4.1. PENDAHULUAN
Bab sebelumnya berisi penjelasan bagaimana proses transformasi teks dan analisis teks. Pada bab 4 ini akan dibahas satu studi kasus: analisis teks tentang Sistem Pendidikan Nasional (Sisdiknas) yang diambil dari UUD 1945 Bab XI11
' tentang Pendidikan dan Kebudayaan pada pasal 31 ayat 3, UU No. 20 Tahun 2003
tentang Sistem Pendidikan Nasional Tahun 2003 dan UU Sisdiknas No. 20 Tahun 2003 Pasal 30 tentang pendidikan keagamaan, yang terangkum dalam beberapa teks, yaitu:
1. Pendidikan bertugas mengembangkan kesadaran atas tanggung jawab setiap warga negara terhadap kelanjutan hidupnya [Tilaar, 20011.
2. Pemerintah mengusahakan dan menyelenggarakan satu sistem pendidikan nasional (sisdiknas) yang meningkatkan keimanan dan ketakwaan serta akhlak mulia dalam rangka mencerdaskan bangsa, yang diatur dengan undang- undang (UUD 1945 ps.3 1 ayat 3).
3. Pendidikan adalah usaha sadar dan terencana untuk mewujudkan suasana belajar dan proses pembelajaran agar peserta didik secara aktif mengembangkan potensi dirinya untuk memiliki kekuatan spiritual, keagamaan, pengendalian diri, kepribadian, kecerdasan, akhlak mulia, serta keterampilan yang diperlukan untuk dirinya (Pasal 1 UU Sisdiknas No. 20 Tahun 2003).
4. Tujuan pendidikan mengangkat martabat manusia kepada hidup yang lebih layak, melalui pendekatan: penempatan guru, pengelolaan pendidikan, kurikulum dan keterkaitan dengan sektor-sektor lain.
6. Dua dampak dari akselerasi pembangunan sektor pendidikan, yaitu masalah: kualitas pendidikan yang masih kurang dan relevansi hasil pendidikan yang dengan tuntutan pembangunan akan tersedianya tenaga kerja yang terampil [Tilaar, 200 1
1.
7. Menurut Tilaar, dewasa ini dunia pendidikan kita mengalami 4 krisis pokok, yaitu: kualitas pendidikan, relevansi atau efisiensi eksternal, elitisme dan manajemen [Tilaar, 200 1
1.
8. Kualitas pendidikan dipengaruhi oleh mutu tenaga pengajar dan alat bantu proses belajar mengajar [Tilaar, 20011.
9. Relevansi pendidikan sangat dipengaruhi oleh isi kurikulum yang sesuai dengan tuntutan zaman, dimana akan terlihat dari banyaknya jumlah penganguran [Tilaar, 200 11.
10. Elitisme pendidikan terlihat dari kesenjangan pemberian subsidi terhadap siswa [Tilaar, 20011.
11. Manajemen pendidikan harus dikelola secara profesional dengan cara mampu melihat peta permasalahan pendidikan seperti teknis pendidikan, perencanaan, pendanaan, efisiensi dari sistem itu sendiri [Tilaar, 20011.
12. Pendidikan moral dan pendidikan agama memperoleh prioritas tinggi pada pendidikan dasar [Tilaar, 200 I].
13. Komponen SISDIKNAS yang menunjang menjadi masyarakat industri modern, yaitu, pendidikan dasar, kurikulum, proses belajar, tenaga kependidikan, pendidikan dan pelatihan, pembiayaan pendidikan, desentralisasi pendidikan dan manajemen pendidikan [Tilaar, 20011.
14. Pendidikan keagamaan berfungsi mempersiapkan peserta didik menjadi anggota masyarakat yang memahami dan mengamalkan nilai-nilai ajaran agarnanya danlatau menjadi ilmu agama (UU Sisdiknas No. 20 Tahun 2003 ps.30 ayat 3).
4.2. ANALISIS: TRANSLASI TEKS SISTEM PENDIDIKAN NASIONAL
Dari ke-14 teks tersebut, akan diberikan contoh yang diuraikan secara detail dalam melakukan proses menerjemahkan konsep dan relasi pada teks no.2 dan no.3 dalam kalimat yang tercantum pada UUD 1945 Bab XI11 tentang Pendidikan dan Kebudayaan pada pasal 31 ayat 3, yang berbunyi: "Pemerintah mengusahakan dan menyelenggarakan satu sistem pendidikan nasional yang meningkatkan keimanan dan ketakwaan serta akhlak mulia dalarn rangka mencerdaskan bangsa, yang diatur dengan undang-undang."
Analisis teks tersebut di atas, secara harfiah menurut KG adalah sebagai berikut: Teks t