IMPLEMENTASI MODEL ONTOLOGY UNTUK PENCARIAN
INFORMASI BERITA BERBASIS SEMANTIK
TUGAS AKHIR
Untuk Memenuhi
Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah Malang
Oleh :
M. BAHTERA SEPTIAN 09560349
JURUSAN TEKNIK INFORMATIKA
FAKULTAS TEKNIK
UNIVERSITAS MUHAMMADIYAH MALANG
2014
LEMBAR PENGESAHAN
IMPLEMENTASI MODEL ONTOLOGY UNTUK PENCARIAN
INFORMASI BERITA BERBASIS SEMANTIK
TUGAS AKHIR
Untuk Memenuhi
Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah Malang
Disusun Oleh :
M. BAHTERA SEPTIAN 09560349
Tugas Akhir ini telah diuji dan dinyatakan lulus melalui sidang majelis penguji pada tanggal 11 April 2014
Menyetujui, Penguji I Ir. M.Irfan, M.T. NIP. 10892030255 Penguji II Zamah Sari, M.T. NIDN. 0708087701 Mengetahui,
Ketua Jurusan Teknik Informatika
Yuda Munarko, S.Kom, M.Sc NIP. 108.0611.0443
KATA PENGANTAR
Dengan mengucap puji syukur kehadirat Allah SWT atas segala rahmat dan ridho-Nya yang telah memberikan berkah dan hidayah-Nya sehingga peneliti dapat menyelesaikan tugas akhir yang berjudul :
“IMPLEMENTASI MODEL ONTOLOGY UNTUK PENCARIAN INFORMASI
BERITA BERBASIS SEMANTIK”
Di dalam tulisan ini disajikan pokok – pokok bahasan yang meliputi latar belakang penelitian, landasan teori penelitian, analisa dan perancangan aplikasi, implementasi dan pengujian aplikasi, kesimpulan dan saran serta daftar pustaka.
Peneliti menyadari sepenuhnya bahwa dalam penulisan tugas akhir ini masih banyak kekurangan dan keterbatasan. Oleh karena itu peneliti mengharapkan saran yang membangun agar tulisan ini bermanfaat bagi perkembangan ilmu pengetahuan kedepan.
Malang, 3 April 2014 Penulis
DAFTAR ISI
Halaman
HALAMAN PERSETUJUAN……… i
HALAMAN PENGESAHAN………. ii
LEMBAR PERNYATAAN ORISINALITAS………... iii
ABSTRAK ………... iv
ABSTRACT………. v
LEMBAR PERSEMBAHAN……… vi
KATA PENGANTAR ……… vii
DAFTAR ISI……… viii
DAFTAR TABEL……… xi
DAFTAR GAMBAR……… xii
DAFTAR RUMUS……….. xiv
BAB I. PENDAHULUAN………... 1 1.1 Latar Belakang………...……….. 1 1.2 Rumusan Masalah……… 2 1.3 Tujuan Penelitian………. 2 1.4 Batasan Penelitian……… 2 1.5 Metodologi Penelitian……….. 2 1.6 Sistematika Penulisan……….. 5
BAB II. LANDASAN TEORI………. 6
2.1 Definisi Berita……….. 6
2.2 Ontology………... 7
2.2.1 Pengertian Ontology……… 7
2.2.2 Tipe Ontology………... 9
2.2.3 Kegunaan Ontology……… 10
2.3 Pencarian Dengan Menghitung Kedekatan (Semantic Similarity)………... 11
2.4 Persiapan Dokumen Berita……….. 13
2.4.1 Eliminasi Tag HTML……….. 13
2.4.2 Tokenizing………... 14
2.4.3 Stopword Removal……….. 14
2.4.4 Perancangan Eksekusi Query……….. 15
2.4.5 Fast Heuristic………..16
2.5 Pembobotan Dokumen………. 16
2.5.1 Term frequency-inverse document frequency………. 16
2.5.2 Menghitung TF (Term Frequency)………. 16
2.5.3 Menghitung Document Frequency (DF)………. 18
2.5.3 Menghitung Inverse Document Frequency (IDF) ………..19
2.5.3 Menghitung Bobot Setiap Kata (TF*DF)………... 21
2.6 RDF (Resource Description Framework)……… 22
2.6.2 Sintaks RDF……… 25
2.6.3 RDF Schema………... 25
2.6.4 RDF Query……….. 27
2.7 OWL (Ontology Web Language)………. 27
2.7.1 Sub Bahasa OWL……… 27
2.7.2 Elemen OWL……….. 28
2.8 Java……….. 29
2.9 Library Java………. 30
2.9.1 Apache Jena……… 30
BAB III. ANALISA DAN PERANCANGAN SISTEM………... 32
3.1 Gambaran Pencarian Berita………. 32
3.2 Data……….. 32
3.3 Domain Ontology………. 32
3.4 Persiapan Dokumen………. 32
3.4.1 Filtering……….. 33
3.5 Alur Sistem……….. 33
3.6 Analisa Use Case………. 36
3.7 Diagram Activity……….. 37
3.7.1 Diagram Activity Pre-processing Dokumen Berita………..…. 37
3.7.1 Diagram Activity Pencarian Semantic Similarity………... 38
3.8 Squence Diagram………. 39
3.9 Class Diagram……….. 42
3.10 Desain Database……… 44
3.11 Perancangan Interface……… 43
BAB IV. IMPLEMENTASI DAN PENGUJIAN………. 47
4.1 Spesifikasi Hardware dan Software……….47
4.2 Implementasi Interface……… 47
4.2.1 Interface……….. 48
4.2.2 Menu Manajemen Berita………. 48
4.3 Implementasi Proses Sistem……… 49
4.3.1 Tokenizing………... 49
4.3.2 Stopword Removal……….. 49
4.3.3 Proses Perhitungan TF-IDF………..……….. 50
4.3.4 Proses Pengambilan Data……… 50
4.3.5 Perhitungan Jarak……… 51
4.3.6 Proses Eksekusi Query……… 53
4.3.7 Proses Pencarian………. 55
4.3.2 Koneksi Database………... 57
4.4 Pengujian Sistem……….. 58
4.4.1 Pengujian Fungsional……….. 58
4.4.2 Perhitungan Bobot Dokumen Relevan Dengan Fast Heuristic……….. 59
4.4.3 Hasil Pencarian Dengan Urutan………. 61
4.4.5 Grafik Precision……….. 64
BAB V. KESIMPULAN DAN SARAN……….. 67
5.1 Kesimpulan……….. 67
5.2 Saran……… 67
DAFTAR PUSTAKA LAMPIRAN
DAFTAR TABEL
Halaman
Tabel 1. Ilustrasi Perhitungan Frekuensi Kata Setiap Dokumen……….. 17
Tabel 2. Ilustrasi Menghitung DF ……… 18
Tabel 3. Ilustrasi Menghitung IDF ………... 20
Tabel 4. Ilustrasi Menghitung TF-IDF ……… 21
Tabel 5. RDF Classes……… 25
Tabel 6. RDF Properties………... 26
Tabel 7. Pengujian Fungsional Sistem……….. 58
Tabel 8. Hasil Perhitungan Bobot Dokumen……… 60
Tabel 9. Hasil Perhitungan Bobot Dokumen……… 60
Tabel 10. Hasil Pencarian Dengan Urutan……… 61
Tabel 11. Hasil Pencarian Dengan Urutan……… 62
DAFTAR GAMBAR
Halaman
Gambar 1. Contoh Ontologi Berita……….. 8
Gambar 2. Inter-Operabilitas Sistem……….. 10
Gambar 3. Contoh Perhitungan Semantik Similarity……….. 12
Gambar 4. Proses Tokenizing………... 14
Gambar 5. Proses Stopword Removal………. 14
Gambar 6. Proses Pemecahan Kata………..15
Gambar 7. Proses Penggabungan Kata ………15
Gambar 8. Statement RDF ………...23
Gambar 9. Sintaks RDF ……….. 25
Gambar 10. Proses Compiling dan Executing Pada Program Java………. 30
Gambar 11. Arsitektur Jena……….. 31
Gambar 13. Proses memasukkan data ke database ………. 33
Gambar 14. Flowchart Preprocessing Dokumen Berita ………. 34
Gambar 15. Diagram Use Case ………... 35
Gambar 16. Diagram Activity Preprocessing Dokumen Berita………... 37
Gambar 17. Diagram Activity Pencarian semantic similarity……….. 38
Gambar 18. Squence Diagram Persiapan Dokumen……… 40
Gambar 19. Sequence Diagram Pencarian Berita……… 41
Gambar 20. Class Diagram ………. 42
Gambar 21. Gambar Tabel Database Berita ……….. 44
Gambar 22. Tabel Stopword ……… 44
Gambar 23. Form Pencarian Dokumen Berita………. 45
Gambar 24. Manajemen Data Berita ………... 46
Gambar 25. Antarmuka Sistem Pencarian ……….. 48
Gambar 26. Tampilan Menu Manajemen Data Berita ……… 48
Gambar 27. Code Proses Tokenizing ……….. 49
Gambar 28. Code Proses Stopword Removal ……….. 49
Gambar 29. Code Proses Perhitungan TF-IDF ………... 50
Gambar 30. Code Eliminasi Tag HTML ………. 51
Gambar 31. Code Proses Membaca Ontologi……….. 51
Gambar 32. Code Menentukan Jarak ……….. 52
Gambar 33. Code Menghitung Jarak ……….. 53
Gambar 34. Code Proses Penggabungan Kata Kunci ………. 54
Gambar 35. Code Proses Memecah Kata Kunci Menjadi Perkata ……….. 54
Gambar 36. Code Proses Pencarian ……… 55
Gambar 37. Proses Perhitungan Nilai Maksimum Baris Dan Kolom……….. 56
Gambar 38. Code Proses Perhitungan Bobot Fast Heuristic ……….. 56
Gambar 39. Code Koneksi Dengan Database ……….57
Gambar 40. Code Hasil Pencarian………... 57
Gambar 42. Grafik Precision 5 Teratas………64 Gambar 43. Grafik Precision 10 Teratas………..65
DAFTAR RUMUS
Halaman
Rumus 1. Rumus Menghitung Persamaan Semantik……… 13
Rumus 2. Menghitung Rata-Rata Kedekatan Setiap Dokumen………... 16
Rumus 3. Rumus Menghitung IDF ……….. 19
Rumus 4. Rumus Perhitungan TF-IDF.……… 13
DAFTAR PUSTAKA
Jurnal:
[1] Amato, C. 2007. Ontologies, An Introduction. Campus Universitario, Via Orabona 4, 70125 Bari, Italy.
[2] Brickley, D., Guha, R.V. 2004. RDF Vocabulary Description Language 1.0: RDF
Schema, W3C Recommendation. http://www.w3.org/TR/rdf-schema. Diakses tanggal
20-11-2013.
[3] Daconta, M.C. Obrst, L.J. & Smith, K.T. 2003. The Semantic Web “A Guide to the Future of XML, Web Services, and Knowledge Management”. Indianapolis: John
Wiley & Sons.
[4] Fensel, D., Hendler, J., Lieberman, H., & Wahlseet, W. 2003. Spinning the Semantic
Web. London: MIT Press.
[5] Gruber. T. 1993. Toward Principles for the Design of Ontologies Used for Knowledge
Sharing. Stanford Knowledge Systems Laboratory.
[6] Guarino, N. Oberle, D. & Staab, S. 2009. What is an ontology?, ITSC-CNR, Laboratory for Applied Ontology, 38100 Trento, Italy.
[7] Jeremy J. Carroll, Ian Dickinson, Chris Dollin, Dave Reynolds, Andy Seaborne, Kevin Wilkinson. 2003. Jena: Implementing the Semantic Web Recommendations. HP Laboratories Bristol. Inggris.
[8] McGuinness, D.L. & Harmelan, F. 2004. OWL Web Ontology Language Overview,
W3C Recommendation. http://www.w3.org/TR/owl-feature. Diakses tanggal 24
November 2013.
[9] Ngoc Dao, T. & Simpson T. Measuring Similarity Between Sentences. [10] Setyo Denny. Cosine Similarity (tf-idf). Universitas Trunojoyo.
[11] Uschold, M. & Gruninger, M. 1996. ONTOLOGIES: Principles, Methods, and
Applications, Universitas Edinburgh.
Buku :