ONTOLOGI POPULASI TEKS TENTANG
PENYAKIT TANAMAN
TESIS
SUFIANTO
117038084
PROGRAM STUDI (S2) TEKNIK INFORMATIKA
FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI
UNIVERSITAS SUMATERA UTARA
ONTOLOGI POPULASI TEKS TENTANG
PENYAKIT TANAMAN
TESIS
Diajukan untuk melengkapi tugas dan memenuhi syarat memperoleh ijazah Magister Teknik Informatika
SUFIANTO
117038084
PROGRAM STUDI (S2) TEKNIK INFORMATIKA
FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI
UNIVERSITAS SUMATERA UTARA
PERSETUJUAN
Judul Tesis : Ontologi Populasi Teks Tentang Penyakit Tanaman
Kategori : Tesis
Nama Mahasiswa : Sufianto
NIM : 117038084
Program Studi : Magister Teknik Informatika
Fakultas : ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA
Pembimbing 2 Pembimbing 1
(Dr. Mahyuddin K.M. Nasution, M.IT) (Prof. Dr. Tulus,M.Si)
Diketahui/disetujui oleh:
Program Studi S2 Teknik Informatika Ketua,
PERNYATAAN ORIGINALITAS
ONTOLOGI POPULASI TEKS TENTANG PENYAKIT TANAMAN
TESIS
Saya mengakui bahwa tesis ini adalah hasil karya saya sendiri, kecuali beberapa kutipan dan ringkasan yang masing-masing telah disebutkan sumbernya.
Medan, 3 Januari 2014
PERNYATAAN PERSETUJUAN PUBLIKASI
KARYA ILMIAH UNTUK KEPENTINGAN
AKADEMIS
Sebagai sivitas akademika Universitas Sumatera Utara, saya yang bertanda tangan dibawah ini:
Nama : Sufianto
NIM : 117038084
Program Studi : Teknik Informatika
Demi pengembangan ilmu pengetahuan, menyetujui untuk memberikan kepada Universitas Sumatera Utara Hak Bebas Royalti Non-Eksklusif (Non-Exclusive Royalty Free Right) atas tesis saya yang berjudul:
ONTOLOGI POPULASI TEKS TENTANG PENYAKIT TANAMAN
Beserta perangkat yang ada (jika diperlukan). Dengan Hak Bebas Royalti Non-Eksklusif ini, Universitas Sumatera Utara berhak menyimpan, mengalih media, memformat, mengelola dalam bentuk database, merawat dan mempublikasikan tesis saya tanpa meminta izin dari saya selama tetap mencantumkan nama saya sebagai penulis dan sebagai pemegang dan/ atau sebagai pemilik hak cipta.
Demikian pernyataan ini dibuat dengan sebenarnya.
Medan, 3 Januari 2014
Telah diuji pada
Tanggal : 3 Januari 2014
PANITIA PENGUJI TESIS
Ketua : Prof. Dr. Tulus, M.Si.
RIWAYAT HIDUP
DATA PRIBADI
Nama Lengkap (berikut gelar): Ir. Sufianto
Tempat dan Tanggal Lahir : Medan, 10 Nopember 1957
Alamat Rumah : Jl. Kemenyan II No. 1 Blok-H, P. Simalingkar Kel. Mangga, Kec. Medan Tuntungan – 20141 Telepon/HP : (061)-8362916 – 0852.6201.2345
Email : sufi_anto@yahoo.com
Instansi Tempat Bekerja : Sekolah Tinggi Teknik Harapan Alamt Kantor : Jl. HM Joni No.70 Medan
DATA PENDIDIKAN
SD : SD Neg 2/36 Medan TAMAT: tahun 1971 SLTP : SMP Tamansiswa Medan, TAMAT: tahun 1974 SLTA : SMA Tamansiswa Medan, TAMAT: tahun 1977
S1 : FP UISU TAMAT: tahun 1986
KATA PENGANTAR
Syukur Alhamdulillah penulis persembahkan kepada Tuhan Yang Maha Suci dan Maha Tinggi atas segala limpahan Rahmat dan Hidayah-Nya, sehingga penulis dapat mempersiapkan tesis Magister (S2) Teknik Informatika sebagaimana yang telah ditentukan. Tesis ini berjudul: “ONTOLOGI POPULASI TEKS TENTANG PENYAKIT TANAMAN”. Tesis ini merupakan persyaratan tugas akhir pada Program Studi Magister (S2) Teknik Informatika - Fakultas Ilmu Komputer dan Teknologi Informasi (Fasilkom-TI) - Universitas Sumatera Utara (USU).
Pada kesempatan ini, penulis menyampaikan ucapan terimakasih dan penghargaan yang setinggi-tingginya kepada:
1. Prof. Dr. Syahril Pasaribu, DTM&H, M.Sc.(CTM), Sp.A(K), selaku Rektor Universitas Sumatera Utara.
2. Prof. Dr. Muhammad Zarlis, selaku Dekan Fakultas Ilmu Komputer dan Teknologi Informasi (Fasilkom-TI) - Universitas Sumatera Utara (USU), yang juga sebagai Ketua Program Studi Magister (S2) Teknik Informatika di Fasilkom-TI USU.
3. Prof. Dr. Tulus, M.Si., selaku dosen pembimbing I dalam penyelesaian tesis ini, penulis mengucapkan terimakasih yang setinggi-tingginya atas bimbingan yang telah diberikan kepada penulis. Semoga Allah SWT, memberikan balasan yang tiada batasnya.
4. Dr. Mahyuddin K.M. Nasution, M.IT, selaku dosen pembimbing II dalam penyelesaian tesis ini, penulis menyampaikan terimakasih yang tiada berhingga. Semoga pula Allah SWT, memberikan kemurahanNya kepada beliau dalam segala hal.
sangat baik kepada penulis. Mudah-mudah Allah SWT memberikan ganjaran yang berlipat ganda. Amin.
6. Kepada teman-teman sekelas di Kom-C angkatan 2011/2012 yang telah demikian akrab, penulis mengucapkan terimakasih yang sebesar-besarnya atas kerjasama yang diberikan kepada penulis. Mudah-mudahan keakraban ini terus berlanjut.
7. Kepada istri dan keluargaku tercinta semua, yang senantiasa setia memberikan spirit dalam menyelesaikan pendidikan di Program Studi Magister (S2) Teknik Informatika di Fasilkom-TI USU, penulis mengucapkan terimakasih yang tiada berhingga. Semoga Allah SWT, memberikan ganjaran yang berlipat ganda. Amin.
Demikian hal ini penulis sampaikan, semoga tesis ini bermanfaat kelak bagi kita semua khususnya bagi penulis.
Medan, 3 Januari 2014 Penulis,
ABSTRAK
Populasi teks adalah sekumpulan teks atau kata yang mempunyai sifat yang sama dan menjadi obyek konsep pengetahuan dan berperan sebagai inferensi. Ontologi merupakan jenis metode pemodelan yang digunakan untuk menguraikan antara hubungan kata dengan melibatkan penyusunan aturan hubungan dengan melibatkan perlengkapan grafis yang dikenali sebagai TBox. Enam jenis dokumen yang memiliki hubungan semantik dan rule baru berasal dari hubungan semantik awal. Studi ini sangat membantu untuk memiliki latar belakang pengetahuan tentang domain sebelum menemukan pola word. Dengan memetakan enam hubungan semantik dan aturan-aturan (rule) untuk dokumen lainnya dalam corpus (teks) untuk mengekstrak pengetahuan pada penyakit tanaman kakao yang relevan yang dilakukan secara manual akan berkurang. Pendekatan pada penyakit busuk buah pada tanaman kakao mempunyai word ke- 6 di dalam dokumen uji nilai indeks semantik web 0.09677419, penyakit vascular streak dieback (VSD) pada tanaman kakao mempunyai word ke-8 di dalam dokumen uji nilai indeks semantik web 0.00428571, penyakit antraknosa pada tanaman kakao mempunyai word ke-5 uji nilai indeks semantik web 0.0003139, penyakit jamur upas pada tanaman kakao mempunyai word ke-6 uji nilai indeks semantik web 0.00061798, penyakit busuk akar mempunyai word ke-6 uji nilai indeks semantik web 0.99044586, sedangkan penyakit layu pentil buah word ke 217 uji nilai indeks semantik web 0.05882353. Penelitian selanjutnya diharapkan jumlah kapasitas pada sebuah dokumen uji dapat lebih besar di dalam pendekatan untuk uji dokumen lainnya.
ONTOLOGY POPULATION TEXT
OF PLANT DISEASE
ABSTRACT
The population is a set of text or text the word which has the same properties and become the object of the concept of knowledge and serve as inference . Ontology is a kind of modeling method is used to describe the relationship between words by involving the preparation of equipment rules involving graphical relationships that are recognized as TBox . Study domain is a plant cacao (chocolate) and diseases related to it . Six types of documents that have semantic relations and the new rule is derived from the initial semantic relationships. By mapping six semantic relationships and rules (rule) to other documents in the corpus (text) to extract knowledge on cocoa plant diseases relevant is done manually will be reduced . Approach to fruit rot disease on cocoa crops have the 6th word in the test document semantic web index value 0.09677419 , vascular disease streak dieback (VSD) in cocoa plant has the 8th word in the test document semantic web index value 0.00428571 , anthracnose disease the cocoa plant has the 5th word test semantic web index value 0.0003139 , fungal diseases in plants policeman cocoa - 6 has a word to test the semantic web index value 0.00061798 , word root rot has the 6th test semantic web index value 0.99044586 , whereas disease withered teat pieces to 217 word test semantic web index value 0.05882353 . Future studies are expected to total capacity on a test document can be greater in the approach to test other documents
DAFTAR ISI
Halaman
HALAMAN JUDUL i
PERSETUJUAN ii
PERNYATAAN ORIGINALITAS iii
PERSETUJUAN PUBLIKASI iv
PANITIA PENGUJI v
1.4 Batasan Masalah/Ruang Lingkup Kajian 5
BAB 2 TINJAUAN PUSTAKA 6
2.1 Ontologi 6
2.1.1 TBox dan ABox 7
2.3 Pemaknaan Teks 9
2.3.1 Korpus 9
2.3.2 Sampel dan Populasi teks 10
2.4 Text Mining 10
3.2.2 Flowchat pemotongan kata demi kata 16 3.2.3 Flowchat Mencari vocabulary kata 17
3.2.4 Pemilihan dokumen 21
4.1 Indeks semantic web dari mesin pencarian yahoo 24 4.1.1 Indeks Populasi teks dengan kata “Penyakit” 24
4.1.2 Indeks Populasi teks dengan kata “busuk buah” 25 4.1.3 Indeks Populasi teks dengan kata “penyakit busuk buah pada
tanaman kakao” 26
4.1.4 Indeks Populasi teks dengan kata "vascular streak dieback" 26 4.1.5 Indeks Populasi teks dengan kata "penyakit vascular streak
dieback pada tanaman kakao" 27
4.1.9 Indeks Populasi teks dengan kata "penyakit antraknosa pada
tanaman kakao" 29
4.1.10 Indeks Populasi teks dengan kata "jamur upas" 29
4.2 Pengujian dokumen populasi teks 30
4.2.1 Tampilan Hasil pencarian kata pada populasi teks 30 4.2.2 Hasil penemuan kata penyakit pada tanaman kakao 31 Tabel 4. 2 Hasil penemuan kata penyakit pada tanaman kakao 31 4.2.3 Hasil pencarian populasi teks dari indeks semantik web 31
BAB 5 KESIMPULAN DAN SARAN 33
5.1 Kesimpulan 33
5.2 Saran 34
DAFTAR PUSTAKA 35
LAMPIRAN 1 Daftar Publikasi Ilmiah 38
DAFTAR GAMBAR
Gambar 3. 1 Ilustrasi Proses Penelitian Secara Garis Besar 13 Gambar 3. 2 Tahap Pemotongan String Input Kata Yang Menyusunnya 16
Gambar 3. 3 Pemotongan Data Demi Kata 17
Gambar 3. 4 Mencari Vocabulary Kata 18
Gambar 3. 5 Tbox Ontologi Penyakit Pada Tanaman Kakao 19 Gambar 3. 6 Step Pada Semantic Identifikasi Relasi 20
Gambar 3. 7 Total Dokumen Uji Yang Dilakukan 21
DAFTAR TABEL
Tabel 4. 1 Populasi teks 24