• Tidak ada hasil yang ditemukan

OTOMATISASI PEMILIHAN KALIMAT UTAMA DALAM DOKUMEN TUNGGAL BAHASA INDONESIA DENGAN METODE MAXIMUM MARGINAL RELEVANCE TUGAS AKHIR

N/A
N/A
Protected

Academic year: 2021

Membagikan "OTOMATISASI PEMILIHAN KALIMAT UTAMA DALAM DOKUMEN TUNGGAL BAHASA INDONESIA DENGAN METODE MAXIMUM MARGINAL RELEVANCE TUGAS AKHIR"

Copied!
12
0
0

Teks penuh

(1)

1

OTOMATISASI PEMILIHAN KALIMAT UTAMA

DALAM DOKUMEN TUNGGAL BAHASA

INDONESIA DENGAN METODE MAXIMUM

MARGINAL RELEVANCE

TUGAS AKHIR

Diajukan Untuk Memenuhi

Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah Malang

Disusun oleh :

MUHAMMAD YUDHA AMRIAL 201110370311406

PROGRAM STUDI TEKNIK INFORMATIKA

FAKULTAS TEKNIK

UNIVERSITAS MUHAMMADIYAH MALANG

2016

(2)

ii

LEMBAR PERSETUJUAN

(3)

iii

OTOMATISASI PEMILIHAN KALIMAT UTAMA

DALAM DOKUMEN TUNGGAL BAHASA

INDONESIA DENGAN METODE MAXIMUM

MARGINAL RELEVANCE

Muhammad Yudha Amrial

201110370311406

TUGAS AKHIR

Sebagai Persyaratan Guna Meraih Gelar Strata I Teknik Informatika Universitas Muhammadiyah Malang

Menyetujui,

Pembimbing I Pembimbing II

Yufis Azhar, S.Kom., M.Kom. NIP : 108.1410.0544

Yuda Munarko, S.Kom., M.Sc. NIP : 108.0611.0443

MATISASI PEMILIHAN KALIMAT UTAMA DALAM

(4)

iv

DOKUMEN TUNGGAL BAHASA INDONESIA

DENGAN METODE MAXIMUM MARGINAL

RELEVANCE

TUGAS AKHIR

Sebagai Persyaratan Guna Meraih Gelar Strata I Teknik Informatika Universitas Muhammadiyah Malang

Disusun Oleh :

Muhammad Yudha Amrial

201110370311406

Tugas Akhir ini telah diuji dan dinyatakan lulus melalui sidang majelis penguji Pada : 20 Januari 2016

Menyetujui,

Penguji I

Mahar Faiqurahman, S.Kom., M.T. NIP : 108.0811.0462

Penguji II

Setio Basuki, S.T., M.T. NIP : 108.0907.0477

Mengetahui,

Ketua Jurusan Informatika

Yuda Munarko, S.Kom., M.Sc. NIP : 108.0611.0443

(5)

vii

LEMBAR PERSEMBAHAN

Syukur Alhamdulillah atas kehadirat Allah SWT dengan limpahan hidayah dan rahmad-Nya, shalawat serta salam senantiasa tercurahkan kepada junjungan Nabi besar Rasullullah Muhammad SAW sang revolusioner. Tiada kata selain puji syukur dan terima kasih karena penulis dapat menyelesaikan Tugas Akhir ini. Oleh karena itu, dengan rendah hati penulis menyampaikan ucapan terima kasih yang sebesar-besarnya kepada:

1. Kedua orang tua tercinta Bapak Said Mansur dan Ibu Yuswantini,

serta adek tercinta Agung Prasetyo SM dan Azza Nurina SM, yang senantiasa tanpa lelah mendo’akan dan memberi dukungan, semoga berkah dan rahmad-Nya selalu menyertai beliau setiap waktu;

2. Bapak Yufis Azhar, S.Kom., M.Kom. dan bapak Yuda Munarko,

S.Kom., M.Sc. selaku dosen pembimbing dalam tugas akhir. yang selalu membimbing dengan kesabaran dan mengarahkan pemahaman;

3. Bapak Yuda Munarko, S. Kom, M.Sc selaku Ketua Jurusan Teknik

Informatika, Fakultas Teknik, Universitas Muhammadiyah Malang;

4. Bapak/Ibu Dosen Fakultas Teknik, Universitas Muhammadiyah

Malang yang senantiasa menjadi pendidik tanpa tanda jasa;

5. Teman-Teman Mahasiswa Teknik Informatika angkatan 2011;

6. Sahabat, teman dekat, kakak tingkat dan kerabat-kerabat yang selalu

mendoakan dan memberi semangat.

7. Dan seluruh pihak yang tidak bisa disebutkan satu persatu, yang telah

banyak membantu selama ini.

Semoga segala bantuan, motivasi, dan do’a yang diberikan kepada penulis diridhoi dan mendapat imbalan yang berlipat ganda dari Allah SWT, Amiin ya Rabbal’alamin.

(6)

viii KATA PENGANTAR

Alhamdulillah, puji syukur kehadirat Allah SWT, yang telah melimpahkan rahmat dan karunia-Nya, sehingga penulis dapat menyelesaikan tugas akhir yang menjadi salah satu syarat untuk menyelesaikan program studi Teknik Informatika jenjang Strata-1 Universitas Muhammadiyah Malang (UMM). Sholawat serta salam semoga tetap tercurah kepada Nabi besar Muhammad saw, keluarga, sahabat dan para pengikutnya hingga akhir jaman.

Penulis menyadari bahwa dalam menyelesaikan tugas akhir ini tidak lepas dari peran berbagai pihak yang telah banyak memberi bantuan, nasehat, bimbingan dan dukungan. Dalam kesempatan ini penulis ingin mengucapkan terima kasih yang tak terhingga khususnya kepada :

1. Bapak Drs. H. Fauzan, M.Pd, selaku Ketua Rektor Universitas Muhammadiyah Malang.

2. Bapak Ir. Sudarman, M.T., selaku Dekan Fakultas Teknik Universitas Muhammadiyah Malang.

3. Bapak Yuda Munarko, S.Kom, M.Sc., selaku Ketua Jurusan Teknik Informatika Universitas Muhammadiyah Malang.

4. Bapak Yufis Azhar, S.Kom., M.Kom., selaku Dosen Pembimbing I tugas akhir. Terima kasih atas pengarahan yang telah di berikan sehingga dapat menyelesaikan laporan tugas akhir ini dengan benar adanya.

5. Bapak Yuda Munarko, S.Kom, M.Sc., selaku Dosen Pembimbing II tugas akhir. Terima kasih atas pengarahan yang telah di berikan sehingga dapat menyelesaikan laporan tugas akhir ini dengan benar adanya.

6. Bapak Ali Sofyan Kholimi, S.Kom., M.Kom., selaku Dosen Wali.

7. Orang Tua dan Adik Penulis atas segala do’a restu dan dukungannya baik material atau spiritual kepada penulis dalam penyelesaian tugas akhir ini.

8. Teman-teman yang membantu dalam proses penulisan tugas akhir ini, yang tidak mungkin penulis sebutkan satu-persatu.

Penulis menyadari bahwa dalam penyusunan tugas akhir ini banyak kekurangannya. Oleh karena itu, penulis mengharapkan kritik dan saran yang dapat menyempurnakan penulisan ini sehingga dapat bermanfaat untuk pengembangan ilmu.

Malang, 16 januari 2016

(7)

ix DAFTAR ISI

HALAMAN JUDUL ... i

LEMBAR PERSETUJUAN ... ii

LEMBAR PENGESAHAN ... iii

LEMBAR PERNYATAAN ... iv

ABSTRAKSI...v

ABSTRACT ... vi

LEMBAR PERSEMBAHAN ... vii

KATA PENGANTAR ... viii

DAFTAR ISI ... ix

DAFTAR GAMBAR ... xi

DAFTAR TABEL ... xiii

BAB I PENDAHULUAN ...1 1.1 Latar Belakang ...1 1.2 Rumusan Masalah ...2 1.3 Batasan Masalah ...2 1.4 Tujuan ...2 1.5 Metodologi ...3 a. Studi Pustaka ... 3 b. Pengumpulan Data ... 3

c. Analisa dan Desain Sistem ... 4

d. Implementasi ... 3

e. Pengujian ... 3

1.6 Sistematika Penulisan ...4

BAB II LANDASAN TEORI ...6

2.1 Maximum Marginal Relevance ...6

2.2 Pengertian Ide Pokok...8

2.3 Pengertian Kata ...9

(8)

x

2.5 Paragraf Dalam Bahasa Indonesia ...14

2.6 Data Mining ...18

2.7 Text Mining ...19

2.8 Preprocessing...20

2.9 Pembobotan TFIDF ...23

BAB III ANALISA DAN PERANCANGAN SISTEM ...27

3.1 Teknologi yang digunakan ...27

3.2 Analisis dan Penyelesaian ...27

3.3 Perancangan Sistem ...28

3.4 Alur Rancangan Sistem ...31

a. Alur kerja Sistem Aplikasi ... 31

b. Alur kerja Metode Hitung Bobot ... 33

c. Alur Kerja Metode MMR ... 34

3.5 Contoh Kasus ...38

3.6 Desain Interface ...48

BAB IV IMPLEMENTASI DAN PENGUJIAN ...49

4.1 Implementasi Software ...50

a. Implementasi Preprocessing ... 50

b. Implementasi Hitung Bobot ... 54

c. Implementasi Maximum Marginal Relevance (MMR)... 57

d. Implementasi Interface Sistem ... 62

4.2 Pengujian ...67 BAB V PENUTUP ...78 5.1 Kesimpulan ...79 5.2 Saran ...79 DAFTAR PUSTAKA ... 80 LAMPIRAN-LAMPIRAN ...81

(9)

xi DAFTAR GAMBAR

Gambar 2.1 Proses KDD Data Mining ... 17

Gambar 2.2 Tahapan Text Mining ... 19

Gambar 3.1. Use Case Diagram ... 30

Gambar 3.2. Alur kerja Sistem Aplikasi ... 33

Gambar 3.3. Alur kerja Metode Hitung Bobot ... 33

Gambar 3.4. Alur Kerja MMR ... 34

Gambar 3.5. Alur Query Relevance ... 34

Gambar 3.6. Alur Similarity Kalimat ... 35

Gambar 3.7. Alur MMR ... 36

Gambar 4.1 Pemecahan Kalimat ... 50

Gambar 4.2 Case Folding ... 50

Gambar 4.3 Tokenizing ... 50

Gambar 4.4 Filtering ... 51

Gambar 4.5 Stemming ... 52

Gambar 4.6 Inisialisasi hitung bobot ... 53

Gambar 4.7 Set keyword ... 53

Gambar 4.8 Implementasi W1 ... 53

Gambar 4.9 Implementasi W2 ... 54

Gambar 4.10 Implementasi W3 ... 54

Gambar 4.11 Implementasi W4 ... 54

Gambar 4.13 Implementasi IDF ... 55

Gambar 4.14 Implementasi ISF ... 55

Gambar 4.15 Implementasi AVG - ISF... 55

Gambar 4.16 Implementasi Wtot ... 56

Gambar 4.17 Implementasi Database ... 56

Gambar 4.18 Inisialisasi Algoritma MMR ... 56

Gambar 4.19 Menghitung banyak Kalimat ... 56

Gambar 4.20 Implementasi Query Relevance ... 57

Gambar 4.21 Implementasi Similirity Kalimat ... 58

Gambar 4.22 Implementasi MMR... 59

(10)

xii

Gambar 4.24 Menu Browse ... 62

Gambar 4.25 Menu Proses ... 62

Gambar 4.26 Menu Panel Ekstrak Paragraf ... 63

Gambar 4.27 Menu Panel Preprocessin ... 63

Gambar 4.28 Menu Panel Hitung Bobot ... 64

Gambar 4.29 Menu Panel MMR ... 64

Gambar 4.29 Menu Pengujian ... 65

(11)

xiii

DAFTAR TABEL

Tabel 2.1. Kata Baku dan tidak Baku ...8

Tabel 3.1. Activity Diagram Memilihan Kalimat Utama Dokumen ...31

Tabel 3.2. Activity Diagram Load Dokumen ...31

Tabel 3.3. Activity Diagram Save Dokumen ...32

Tabel 3.4. Tabel Perbandingan Query Dengan Kalimat 1,2 Dan 3 ...43

Tabel.4.1. Hasil Kalimat Utama Berita Futsal Batang Kalahkan Kota Pekalongan ...66

Tabel.4.2. Hasil Kalimat Utama Berita “Menuju Poros Maritim Dunia Rokhmin Dahuri Guru Besar Manajemen Pembangunan Pesisir dan Lautan IPB” ...66

Tabel.4.3. Hasil Kalimat Utama Berita “Mengatasi Diabetes Dengan Diet” ...67

Tabel.4.4. Hasil Kalimat Utama Berita “Masih Banyak Permainan di PPDB” .68 Tabel.4.5. Hasil Kalimat Utama Berita “Mahasiswa Singapura Gali Edukasi Perbankan dari Indonesia” ...68

Tabel.4.6. Hasil Kalimat Utama Berita “KPPU Implementasi Perpres Pengendalian Harga Barang Pokok Rumit” ...70

Tabel.4.7. Hasil Kalimat Utama Berita “Kandungan Antioksidan pada Kaktus” ...70

Tabel.4.8. Hasil Kalimat Utama Berita “Hipertensi dan Bawang Putih” ...71

Tabel.4.9. Hasil Kalimat Utama Berita “Dirut BCA Diperiksa tentang Bank Persepsi dalam Kasus Payment Gateway” ...72

Tabel.4.10. Hasil Kalimat Utama Berita “Revisi UU KPK, Anggota DPR Anggap Menkum HAM Permainkan Parlemen” ...73

Tabel.4.11. Pengujian Sistem ...74

Tabel.4.12. Rumus dari precision, recall f-measure dan accuracy . ...75

Tabel.4.13. Pengujian Precision, Recall, F-measure dan Accuracy Hitung Bobot dengan Pemilihan Kalimat Utama Manual ...76

Tabel.4.14. Pengujian Precision, Recall, F-measure dan Accuracy MMR dengan Pemilihan Kalimat Utama Manual ...77

(12)

80 DAFTAR PUSTAKA

[1] Purwasih, Nurzaitun. “Sistem Peringkas Teks Otomatis untuk

Dokumen Tunggal Berita Berhasa Indonesia dengan

menggunakan Graph-based Summarization Algorithm dan

Similirity”.

[2] Firdayana, Mardhatillah. “Automated Text Summarization

Dokumen Tunggal Bahasa Indonesia dengan Metode Ekstraksi”.

[3] Mustaghiri, Muchammad, Zainal Abidin dan Ririen Kusumawati.

“Peringkas Teks Otomatis Berita Berbahasa Indonesia Menggunakan Maximum Marginal Relevance”.

[4] Prasetyo, Eko. 2012. “Data Mining – Konsep dan Aplikasi

menggunakan Matlab”. Yogyakarta: Andi.

[5] Hilman Fauzi, Yana, Beny Pribadi, Dewan Teguh H, Makalah

Dokumen Mining Mata Kuliah : Kecerdasan Buatan.

[6] Ari Wibowo, Pengujian Kerelevanan Sistem Temu Kembali

Informasi.

[7] Hermawati Fajar A. 2013. Data Mining. Yogyakarta: Andi.

Dr. Taufik Fuadi Abidin, S.Si., M.Tech, Accuracy Measure Precision Recall & F-Measure.

[8] Wayan Gede Suka Parwita, Edi Winarko, “Hybrid

Recommendation System Memanfaatkan Penggalian Frequent Itemset dan Perbandingan Keyword”

Referensi

Dokumen terkait

Puji syukur kepada Allah SWT yang selalu melimpahkan rahmat dan hidayah-Nya kepada kita semua, sehingga saya sampai pada akhir penulisan Skripsi saya yang berjudul

Definisi multimedia menurut Suyanto (2003) dalam bukunya “Multimedia Alat Untuk Meningkatkan Keunggulan Bersaing”, Multimedia adalah pemanfaatan komputer untuk membuat

Pengawasan ujian sepenuhnya menjadi tanggungjawab dosen penguji (tim pengajar mata kuliah). Demikian, atas perhatian dan kerjasamanya kami ucapkan terima kasih. di lingkungan Unud.

Mengenai kebenaran beliau, Hadrat Masih Mau'ud ‘alaihis salaam menulis: 'Aku melihat bahwa orang yang mau mengikuti alam dan hukum alam telah diberikan kesempatan bagus oleh

P SURABAYA 03-05-1977 III/b DOKTER SPESIALIS JANTUNG DAN PEMBULUH DARAH RSUD Dr.. DEDI SUSILA, Sp.An.KMN L SURABAYA 20-03-1977 III/b ANESTESIOLOGI DAN

Faktor yang kedua, lama trauma sebelum masuk rumah sakit, sesuai pada penelitian Champion (1981) menyatakan bahwa semakin cepat tindakan perawatan maka kejadian

Penelitian berjudul Bingkai Pemberitaan Headline Penilaian Setahun Kinerja SBY-Boediono Kabinet Indonesia Bersatu II di Harian Kompas dan Jawa Pos ini akan dibatasi pada

Apalagi kayak orang yang telah mengalami penyakit keras kayak yang dialami suami saya kemaren kanker darah (leukemia) hampir Frustasi dek, habis itu saya ada