SISTEM PENCARIAN KATA PADA MEDIA MASSA ONLINE MENGGUNAKAN ALGORITMA RABIN-KARP
SKRIPSI
ADNAN BUYUNG NASUTION
091402029
PROGRAM STUDI TEKNOLOGI INFORMASI
FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA
SISTEM PENCARIAN KATA PADA MEDIA MASSA ONLINE MENGGUNAKAN
ALGORITMA RABIN-KARP
SKRIPSI
Diajukan untuk melengkapi tugas dan memenuhi syarat memperoleh ijazah
Sarjana Teknologi Informasi
ADNAN BUYUNG NASUTION
091402029
PROGRAM STUDI TEKNOLOGI INFORMASI
FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI
UNIVERSITAS SUMATERA UTARA
MEDAN
PERSETUJUAN
Judul : SISTEM PENCARIAN KATA PADA MEDIA
MASSA ONLINE MENGGUNAKAN ALGORITMA
RABIN-KARP
Kategori : SKRIPSI
Nama : ADNAN BUYUNG NASUTION
Nomor Induk Mahasiswa : 091402029
Program Studi : SARJANA (S1) TEKNOLOGI INFORMASI
Departemen : TEKNOLOGI INFORMASI
Fakultas : ILMU KOMPUTER DAN TEKNOLOGI
INFORMASI
Diluluskan di
Medan, 21 Agustus 2015
Komisi Pembimbing :
Pembimbing 2 Pembimbing 1
Sarah Purnamawati,ST.,M.SC M. Andri Budiman,ST.,M.Comp.Sc.,M.E.M
NIP. 19830226 201012 2 003 NIP. 19751008 200801 1 011
Diketahui/ Disetujui Oleh
Program Studi Teknologi Informasi
Ketua,
PERNYATAAN
SISTEM PENCARIAN KATA PADA MEDIA MASSA ONLINE
MENGGUNAKAN ALGORITMA RABIN-KARP
SKRIPSI
Saya mengakui bahwa skripsi ini adalah hasil kerja saya sendiri, kecuali beberapa
kutipan dan ringkasan yang masing-masing disebutkan sumbernya.
Medan, 21 Agustus 2015
ADNAN BUYUNG NASUTION
PENGHARGAAN
Puji dan syukur penulis panjatkan kepada Allah SWT Yang Maha Pengasih dan Maha Penyayang, dengan segala rahmat dan karuniaNya penulisan tugas akhir ini berhasil diselesaikan dalam waktu yang telah ditetapkan. Selama penyelesaian tugas akhir ini, banyak bantuan dan kerja sama serta doa dan dukungan dari berbagai pihak, oleh karena itu penulis sampaikan ucapan terima kasih sedalam-dalamnya dan penghargaan kepada :
1. Kedua orang tua dan sanak saudara penulis yang telah memberikan dukungan dan motivasi baik materil dan spiritual, Ayahanda Drs. H. Sangkot Nasution, MA. dan Ibunda Dra. Hj. Siti Wasitah yang selalu sabar dalam mendidik dan membesarkan penulis. Untuk kakak dan abang penulis Buhairoh Mutiara Nasution, S.Farm., Apt. dan M. Kurnia Illahi Nasution, S.Pd yang selalu memberikan semangat kepada penulis.
2. Bapak Mohammad Andri Budiman, S.T., M.Comp.Sc., M.E.M dan Ibu Sarah Purnamawati, S.T., M.Sc. selaku pembimbing yang telah banyak meluangkan waktu dan pikiran beliau, memotivasi, memberikan arahan, kritik dan saran kepada penulis.
3. Bapak Dani Gunawan, S.T.,M.T. dan Dedy Arisandi, S.T., M.Kom yang telah bersedia menjadi dosen pembanding yang telah memberikan kritik dan saran kepada penulis.
4. Ketua dan Sekretaris Program Studi Teknologi Informasi, Bapak M. Anggia Muchtar, ST.,MM.IT dan Bapak M. Fadly Syahputra, B.Sc.,M.Sc.IT. Dekan dan Pembantu Dekan Fakultas Ilmu Komputer dan Teknologi Informasi Universitas Sumatera Utara, semua dosen di Fakultas Ilmu Komputer dan Teknologi Informasi.
5. Kepada Bang Manap, Kakak Umi, dan Ibu Mega dan semua staff dan pegawai di Fakultas Ilmu Komputer dan Teknologi Informasi yang tidak dapat saya sebutkan satu-persatu.
6. Kepada sahabat seperjuangan di kampus, Rian Harris Nasution, Upik Purnamawati, Yayuk Anggraini, Desi Fitriani, Fuji Frilla Kurnia, Anggreiny W.A.F Ginting, M. Rozy Lubis, Irwansyah Putra Siregar, Bagus Setiadi , Arif Hamied Nababan, M. Santana dan semua teman-teman di Teknologi Informasi lainnya yang tidak dapat saya sebutkan satu-persatu yang selalu memberikan dukungan dan semangat untuk saya.
ABSTRAK
Banyaknya situs-situs yang terdaftar di mesin pencari dan selalu ada situ-situs yang
bermunculan setiap harinya mengakibatkan pengguna sulit menemukan informasi
yang diinginkannya terutama dalam mencari berita. Oleh karena itu, dibutuhkan
sebuah sistem str ing matching yang menampilkan berita. Penelitian ini menggunakan
algoritma Rabin-Karp untuk melakukan pencocokan kata yang ingin dicari dengan
berita yang ada di database. Berita-berita tersebut sebelumnya di-download dari
halaman beberapa media massa online dan tersimpan di database. Pada penelitian ini
juga terdapat jumlah kemiripan yang dibutuhkan untuk mengetahui berita yang
memiliki nilai terdekat dengan keyword. Hasil pengujian menyimpulkan bahwa
semakin besar jumlah kemiripannya maka semakin besar kemungkinan berita tersebut
berhubungan dengan keyword yang dimasukkan.
Kata kunci: Rabin-Karp, mesin pencari, str ing matching, berita, media massa online,
WORD SEARCHINGS SYSTEM FOR THE ONLINE MASS MEDIA USING
RABIN-KARP ALGORITHM
ABSTRACT
Search engine has tremendously registered sites within and it is for sure incressing in
numbers every single day which effecting all users hard to look for some
indispensable sources of information especially in finding news. Therefore, it is
necessary to gain string matching system that display news. In this study author
proposed Rabin-Karp algoritm as the matching tool for the words within the database.
The news had been previously downloaded from some online mass media and been
saved to the database. In this study also has the numbers of similarity needed to know
news has the closest value to keyword. Base on the testing that had been done, it can
be implied that more the numbers of similarity, the more possibility for the news
having keyword relation that have been submitted before.
Keyword: Rabin-Karp, search engine, string matchig, news, online mass media,
DAFTAR ISI
Halaman
PERSETUJUAN i
PERNYATAAN ii
PENGHARGAAN iii
ABSTRAK iv
ABSTRACT v
DAFTAR ISI vi
DAFTAR TABEL ix
DAFTAR GAMBAR x
BAB 1 PENDAHULUAN 1
1.1Latar Belakang 1
1.2Rumusan Masalah 2
1.3Batasan Masalah 2
1.4Tujuan Masalah 3
1.5Manfaat Masalah 3
1.6Metodologi Penelitian 3
1.7Sistematika Penelitian 4
BAB 2 TINJAUAN PUSTAKA 6
2.1 Search Engine 6
2.1.1 Cara Kerja Search Engine 6
2.1.3 Sifat Search Engine 7
2.2 Media Massa 8
2.2.1 Ciri-Ciri Media Massa 8
2.2.2 Jenis Media Massa 8
2.2.3 Peran Media Massa 9
2.3 Algoritma Pencarian Kata 9
2.4 Penelitian Terdahulu 12
Halaman
BAB 3 ANALISIS DAN PERANCANGAN SISTEM 14
3.1 Arsitektur Umum (General Architecture) 14
3.2 Analisis Data 15
3.2.1 Tabel Feed 15
3.2.2 Tabel Konten 16
3.3 Analisis Sistem 17
3.3.1 Admin 17
3.3.1.1 Penyimpanan Feed Media Massa 18
3.3.1.2 Penyimpanan Judul Berita 19
3.3.1.3 Penyimpanan Konten Berita 20
3.3.1.4 Text Preprocessing 21
3.3.1.5 Algoritma Rabin-Karp 22
3.3.2 User 23
3.3.2.1 Pembentukan nilai gram dan pencocokan gram 24
3.4 Perangcangan Sistem 26
3.4.1 Diagram use case 26
3.4.2 Definisi use case 26
BAB 4 IMPLEMENTASI DAN PENGUJIAN 28
4.1 Implmentasi Sistem 28
4.1.1. Spesifikasi perangkat keras dan prangkat lunak 28
4.1.2. Implementasi perancangan sistem 28
a . Tampilan Halaman Utama User 28
b. Tampilan Hasil Pencarian User 29
c. Tampilan Halaman Berita User 30
d. Tampilan Halaman Home Admin 30
e. Tampilan Halaman Hasil Pencarian Admin 31
h. Tampilan Halaman Tambah 32
Halaman
i. Tampilan Halaman Url 33
k. Tampilan Halaman Konten 34
4.2 Pengujian Sistem 35
4.2.1 Pengujian Sistem Pengambilan Berita 35
4.2.2 Pengujian Sistem Pencarian 37
BAB 5 KESIMPULAN DAN SARAN 40
5.1 Kesimpulan 40
5.2 Saran 40
DAFTAR PUSTAKA 41
LAMPIRAN A : Tabel Konten 42
LAMPIRAN B : Pencocokan Gram 45
DAFTAR TABEL
Halaman
Tabel 2.1 Pebandingan Kompleksitas Beberapa Algoritma Pencocokan String 10
Tabel 2.2 Penelitian Terdahulu 13
Tabel 3.1 Tabel Feed 16
Tabel 3.2 Tabel Konten 16
Tabel 3.3 Pencocokan Gram 25
Tabel 3.4 Definisi Use Case 27
DAFTAR GAMBAR
Halaman
Gambar 2.1 Arsitektur Search Engine 7
Gambar 3.1 Arsitektur Umum 15
Gambar 3.2 Proses Sistem 17
Gambar 3.3 Proses Penyimpanan Feed Media Massa 18
Gambar 3.4 Proses Penyimpanan Judul Berita 19
Gambar 3.5 Proses Penyimpanan Konten Berita 20
Gambar 3.6 Text Preprocssing 21
Gambar 3.7 Algoritma Rabin-Karp 22
Gambar 3.8 User 23
Gambar 3.9 Diagram Use Case 27
Gambar 4.1 Tampilan Halaman Utama User 29
Gambar 4.2 Tampilan Hasil Pencarian User 29
Gambar 4.3 Tampilan Halaman Berita User 30
Gambar 4.4 Tampilan Halama Home Admin 31
Gambar 4.5 Tampilan Halaman Hasil Pncarian Admin 31
Gambar 4.6 Tampilan Halaman Berita Admin 32
Gambar 4.7 Tampilan Halaman Feed 33
Gambar 4.8 Tampilan Halaman Tambah 33
Gambar 4.9 Tampilan Halaman Url 34
Gambar 4.10 Tampilan Halaman Url Setelah Proses Men-download 34
Gambar 4.11 Tampilan Halaman Konten 35
Gambar 4.12 Tampilan Halaman Konten Saat Proses Men-download 35
ABSTRAK
Banyaknya situs-situs yang terdaftar di mesin pencari dan selalu ada situ-situs yang
bermunculan setiap harinya mengakibatkan pengguna sulit menemukan informasi
yang diinginkannya terutama dalam mencari berita. Oleh karena itu, dibutuhkan
sebuah sistem str ing matching yang menampilkan berita. Penelitian ini menggunakan
algoritma Rabin-Karp untuk melakukan pencocokan kata yang ingin dicari dengan
berita yang ada di database. Berita-berita tersebut sebelumnya di-download dari
halaman beberapa media massa online dan tersimpan di database. Pada penelitian ini
juga terdapat jumlah kemiripan yang dibutuhkan untuk mengetahui berita yang
memiliki nilai terdekat dengan keyword. Hasil pengujian menyimpulkan bahwa
semakin besar jumlah kemiripannya maka semakin besar kemungkinan berita tersebut
berhubungan dengan keyword yang dimasukkan.
Kata kunci: Rabin-Karp, mesin pencari, str ing matching, berita, media massa online,
WORD SEARCHINGS SYSTEM FOR THE ONLINE MASS MEDIA USING
RABIN-KARP ALGORITHM
ABSTRACT
Search engine has tremendously registered sites within and it is for sure incressing in
numbers every single day which effecting all users hard to look for some
indispensable sources of information especially in finding news. Therefore, it is
necessary to gain string matching system that display news. In this study author
proposed Rabin-Karp algoritm as the matching tool for the words within the database.
The news had been previously downloaded from some online mass media and been
saved to the database. In this study also has the numbers of similarity needed to know
news has the closest value to keyword. Base on the testing that had been done, it can
be implied that more the numbers of similarity, the more possibility for the news
having keyword relation that have been submitted before.
Keyword: Rabin-Karp, search engine, string matchig, news, online mass media,
BAB 1 PENDAHULUAN
1.1Latar Belakang
Perkembangan ilmu pengetahuan dan teknologi dimasa sekarang semakin pesat
terutama dibidang media massa. Persaingan yang begitu ketat diantara media massa
telah mendorong penggunaan sarana media massa yang semakin canggih seperti
media massa online. Media massa online semakin terasa sangat penting dalam
memberikan informasi secara cepat tentang kejadian-kejadian yang pada saat ini
seperti mencari informasi tentang cuaca, mencari informasi pemerintahan, dan
lain-lain. Jika informasi yang disajikan dalam jumlah sedikit maka pencarian dapat
dilakukan secara manual. Akan tetapi jika informasi yang disajikan dalam jumlah
banyak maka pengguna akan kesulitan memperoleh informasi yang diinginkan oleh
pengguna. Untuk memperoleh informasi dengan cepat dan mudah dari banyaknya
kumpulan informasi maka dapat menggunakan mesin pencari.
Mesin pencari merupakan program komputer yang dirancang agar mampu
menemukan informasi yang dicari dari banyaknya kumpulan informasi yang tersedia.
Mesin pencari adalah program berbasis web yang halaman indeks dari seluruh web
yang memungkinkan orang untuk menemukan apa yang mereka butuhkan
(Pabitha,2013). Dengan adanya mesin pencari setiap orang dapat mudah memperoleh
informasi yang diinginkan. Pengguna mengetikkan kata yang ingin dicari pada mesin
pencari maka seluruh informasi yang diinginkan akan ditampilkan (Primadani, 2014).
Dewasa ini, mesin pencari sangat populer digunakan dalam mencari informasi
yang pengguna diinginkan. Akan tetapi, banyaknya situs-situs yang terdaftar di mesin
pencari dan selalu ada situ-situs yang bermunculan setiap harinya mengakibatkan
pengguna sulit menemukan informasi yang diinginkannya terutama dalam mencari
berita. Untuk itu, diperlukan suatu sistem pencarian kata yang menggunakan suatu
Salah satu algoritma yang dapat digunakan dalam perancangan sistem
pencarian adalah algoritma Rabin-Karp. Algoritma Rabin-Karp adalah suatu
algoritma pencarian string yang ditemukan oleh Michael Rabin dan Richard Karp.
Algoritma ini memberikan waktu mencari rata-rata yang lebih baik dari algoritma
pencocokan string tunggal lainnya. Hal ini dapat digunakan untuk pencocokan pola
dari teks sumber dengan rincian mengabaikan seperti tanda baca dan kasus dengan
pre-processing waktu yang konstan dan waktu pencocokan dan juga dengan
perhitungan sangat kurang (Sunita,2014).
Algoritma Rabin-Karp akan membandingkan nilai gram dari string masukan
dan substring pada teks. Kunci utama performa algoritma ini adalah perhitungan yang
efisien terhadap nilai gram substring pada saat penggeseran dilakukan (Firdaus,
2003).
Beberapa penelitian tentang pencarian adalah Focus Crawler Untuk
Mengoptimalkan Pencarian Jurnal Menggunakan Metode Porter Stemmer (Sembiring,
2014), Implementasi dan Analisis Konsep Web 3.0 Pada Search Engine Toko
Komputer Online (Putranto, 2010), Aplikasi Panduan Kata Dalam Mencari Ayat Al-Qur’an Juz 30 Berbasis Java mobile (Tataran, 2010), Perbandingan Kecepatan Sistem Pencarian Kata Pada Database Simple-O (Haifa,2011).
1.2 Rumusan Masalah
Banyaknya situs-situs yang terdaftar di mesin pencari dan selalu ada situ-situs yang
bermunculan setiap harinya mengakibatkan pengguna sulit menemukan informasi
yang diinginkannya terutama dalam mencari berita. Oleh karena itu, dibutuhkan
sistem yang dapat memberikan informasi berita dari beberapa media massa online.
1.3 Batasan Masalah
Adapun batasan masalah dalam penelitian ini yaitu:
1. Khusus untuk berita berbahasa Indonesia.
2. Sumber data diambil dari 3 media massa online yang memiliki kategori seperti
bisinis, nasional, olahraga, kesehatan, lifestyle, teknologi, otomotif, selebriti dan
1.4 Tujuan Penelitian
Tujuan dari penelitian tugas akhir ini adalah dapat menghasilkan informasi berita yang
hanya terdapat di beberapa situs media massa online dengan menggunakan Algoritma
Rabin-Karp.
1.5 Manfaat Penelitian
Penulis berharap penelitian ini dapat memberikan manfaat kepada penulis sendiri dan
para pembaca. Adapun manfaat dari penelitian ini adalah sebagai berikut:
1. Dapat membantu pengguna mendapatkan informasi berita dari beberapa media
massa online,
2. Penelitian dapat menjadi bahan rujukan untuk pengembangan penelitian lebih
lanjut.
1.6 Metodologi Penelitian
Metodologi yang digunakan penulis adalah:
1. Sudi Literatur
Pada tahap ini, penulis mengumpulkan bahan-bahan yang terkait dengan
sistem pencarian dan algoritma Rabin-Karp dari berbagai sumber sebagai
referensi.
2. Analisis dan Desain Sistem
Pada tahap ini, penulis melakukan analisis hasil studi literatur sehingga
mendapatkan pemahaman mengenai algoritma Rabin-Karp dalam melakukan
proses pencarian. Pada tahap ini pula penulis membuat flowchart, use case,
dan arsitektur umum dari sistem yang akan dibuat.
3. Pembuatan Sistem
Pada tahap ini, penulis mulai melakukan pengkodean sistem yang akan dibuat
4. Pengujian Sistem
Pada tahap ini, penulis mulai melakukan proses pengujian sistem yang telah
dibuat. Pengujian akan menampilkan judul berita yang terdapat pada media
massa online yang kemungkinan berhubungan dengan keyword yang
dimasukkan oleh user.
5. Dokumentasi
Pada tahap ini, penulis melakukan pembuatan dokumentasi dan penulisan
laporan seluruh pngerjaan dari penilitian pencarian kata menggunakan
algoritma Rabin-Karp untuk menunjukkan hasil dari penelitian ini.
1.7 Sistematika Penulisan
Bagian utama dari penulisan skripsi ini terdiri dari lima bab yang akan dijelaskan
secara singkat sebagai berikut:
Bab 1 Pendahuluan
Bab ini berisi tentang latar belakang permasalahan yang mendasari judul skripsi ini,
perumusan masalah yang diambil dari permasalahan tersebut, batasan-batasan
masalahnya, tujuan, dan manfaat dari penelitian ini, metodologi penelitian serta
sistematika penulisan dari skripsi ini.
Bab 2 Tinjauan Pustaka
Bab ini menjelaskan tentang teori-teori yang mendukung dan berhubungan dengan
perancangan dan pembuatan sistem. Kemudian bab ini menjelaskan mengenai
penelitian terdahulu yang berhubungan dengan penelitian ini.
Bab 3 Analisis dan Perancangan Sistem
Bab ini menjelaskan tentang langkah-langkah penelitian akan dilakukan dalam
menyelesaikan permasalahan terhadap algoritma Rabin-Karp pada sistem pencarian
Bab 4 Implementasi dan Pengujian
Bab ini menjelaskan implementasi dan analisis yang dilakukan dan pengujian terhadap
sistem.
Bab 5 Kesimpulan dan Saran
Bab ini menjelakan kesimpulan yang didapatkan terhadap hasil penenlitian skripsi dan
saran untuk mengembangkan lebih lanjut tentang topik terkait yang dibahas pada
Tabel 2.2 Penelitian Terdahulu
Nama Judul Penelitian Tahun
Kurniawan Adi
Putranto
Implementasi dan Analisis Konsep Web 3.0 Pada
Search Engine Toko Komputer Online
2010
Cynthia Arilla
Sembiring
Focus Cra wler Untuk Mengoptimalkan Pencarian
Jurnal Menggunakan Metode Porter Stemmer
2014
Rizkia Haifa Perbandingan Kecepatan Sistem Pencarian Kata
Pada Database Simple-O
2011
Faruq Tataran Aplikasi Panduan Kata Dalam Mencari Ayat Al-Qur’an Juz 30 Berbasis Java Mobile
BAB 3
ANALISIS DAN PERANCANGAN SISTEM
3.1 Arsitektur Umum
Arsitektur umum merupakan desain arsitektur sebuah sistem berjalan. Pada desain ini
digambarkan bahwa sistem memiliki 2 proses utama yaitu user dan admin.
Proses yang dilakukan oleh user adalah sebagai berikut.
1. User menginput keyword
2. Sistem melakukan proses text preprocessing.
3. Proses pembentukan gram yang terdapat pada keyword.
4. Lalu sistem akan mencocokan gram keyword dengan gram dalam informasi
database. Kemudian menghitung jumlah kemiripan gram yang sama.
5. Jika jumlah kemiripan antara gram keyword dengan gram yang ada di database
melebihi dari 3 maka data akan ditampilkan. Jika jumlah kemiripan kurang atau
sama dengan 3 maka data tidak akan ditampilkan.
6. Pada akhirnya sistem menampilkan data-data yang ada di database.
Proses yang dilakukan oleh admin adalah sebagai berikut.
1. Admin memasukkan feed media massa online berupa nama media massa, alamat
media massa dan kategorinya.
2. Sistem akan melakukan penyimpanan feed media massa.
3. Lalu feed yang disimpan akan digunakan untuk men-download judul berita dan
alamat berita.
4. Kemudian alamat berita akan digunakan untuk men-download konten. Pada saat
itu juga, judul berita dan konten akan ditentukan nilai gram-nya.
5. Data-data yang telah di-download akan tersimpan ke database.
BAB 3
ANALISIS DAN PERANCANGAN SISTEM
3.1 Arsitektur Umum
Arsitektur umum merupakan desain arsitektur sebuah sistem berjalan. Pada desain ini
digambarkan bahwa sistem memiliki 2 proses utama yaitu user dan admin.
Proses yang dilakukan oleh user adalah sebagai berikut.
1. User menginput keyword
2. Sistem melakukan proses text preprocessing.
3. Proses pembentukan gram yang terdapat pada keyword.
4. Lalu sistem akan mencocokan gram keyword dengan gram dalam informasi
database. Kemudian menghitung jumlah kemiripan gram yang sama.
5. Jika jumlah kemiripan antara gram keyword dengan gram yang ada di database
melebihi dari 3 maka data akan ditampilkan. Jika jumlah kemiripan kurang atau
sama dengan 3 maka data tidak akan ditampilkan.
6. Pada akhirnya sistem menampilkan data-data yang ada di database.
Proses yang dilakukan oleh admin adalah sebagai berikut.
1. Admin memasukkan feed media massa online berupa nama media massa, alamat
media massa dan kategorinya.
2. Sistem akan melakukan penyimpanan feed media massa.
3. Lalu feed yang disimpan akan digunakan untuk men-download judul berita dan
alamat berita.
4. Kemudian alamat berita akan digunakan untuk men-download konten. Pada saat
itu juga, judul berita dan konten akan ditentukan nilai gram-nya.
5. Data-data yang telah di-download akan tersimpan ke database.
Masukkan
Keyword
Text Preprocessing
Masukkan feed
media
Simpan feed
Download judul berita
Download konten Pembentukan
gram
Berhasil masuk
database
Hasil Pencocokan
antar gram
Jumlah kemiripan > 3
Admin
User
Rabin-Karp
Gambar 3.1 Arsitektur Umum
3.2 Analisis Data
Sumber data dalam penelitian ini diperoleh dari berbagai situs media massa online
yang akan dimasukkan ke dalam database. Data-data tersebut disimpan ke dalam 2
tabel data utama yaitu tabel feed dan tabel konten.
3.2.1 Tabel Feed
Tabel feed merupakan tabel yang menyimpan data alamat situs media massa online.
Data tersebut digunakan dalam proses pengambilan berita-berita secara online yang
alamat media massa yang digunakan sebanyak 11 alamat. Tabel feed terdiri dari 4
field yaitu id, media, kategori dan url. Rancangan tabel dapat dilihat pada tabel 3.1.
Tabel 3.1 Tabel Feed
id media kategori url
1 Liputan6 Bisnis http://bisnis.liputan6.com/feed/rss
2 Liputan6 Nasional http://indonesia-baru.liputan6.com/feed/rss 3 Liputan6 Olah Raga http://bola.liputan6.com/feed/rss
4 Liputan6 Kesehatan http://health.liputan6.com/feed/rss 5 Liputan6 Lifestyle http://lifestyle.liputan6.com/feed/rss 6 Liputan6 Teknologi http://tekno.liputan6.com/feed/rss 7 Liputan6 Otomotif http://otomotif.liputan6.com/feed/rss
8 OkeZone selebriti
http://sindikasi.okezone.com/index.php/celebrity /RSS2.0
9 Detik Olah Raga http://rss.detik.com/index.php/sport 10 Detik Otomotif http://rss.detik.com/index.php/otomotif 11 Detik Makanan http://rss.detik.com/index.php/food
3.2.2 Tabel Konten
Tabel konten memiliki 7 field yaitu id, id_feed, judul, gram_judul, konten,
gram_konten dan url. Tabel konten memiliki 2 kali proses penyimpanan. Proses
penyimpanan pertama yaitu penyimpanan data pada field id, id_feed, judul dan url.
Sedangkan proses penyimpanan kedua yaitu penyimpanan data pada field gram_judul,
konten, gram_konten. Rancangan tabel dapat dilihat pada tabel 3.2. Untuk tabel
konten secara rinci dapat dilihat pada halaman lampiran a.
Tabel 3.2 Tabel Konten id id_f
eed judul gram_judul konten gram_konten url 1 1 Jakarta Great
Sale 2015 Targetkan Transaksi Rp 14,... a:39:{i:0;s: 5:"jakar";i: 1;s:5:"akart ";i:2;s:5:"ka r... <div class="text-detail" itemprop="descr iption" da... a:2549:{i:0;s :5:"divcl";i:1 ;s:5:"ivcla";i: 2;s:5:"v... http://bisnis.lip utan6.com/rea d/2246980/jak arta-gr... 2 1 Keberadaan
3.3 Analisis Sistem
Analisis sistem bertujuan untuk mngidentifikasi sistem yang akan diteliti. Proses
analisis ini diperlukan sebagai dasar perancangan sistem. Pada penelitian ini, sistem
dibagi menjadi 2 proses utama, yaitu proses yang dilakukan admin dan proses yang
dilakukan user. Algoritma yang dipakai pada penelitian ini adalah Algoritma
Rabin-Karp.
3.3.1 Admin
Tahapan-tahapan yang dilakukan admin adalah sebagai berikut.
1. Masukkan nama media, kategori dan alamat media massa online ke dalam textbox yang ada pada halaman feed.
2. Kemudian dilakukan penyimpanan nama, kategori dan alamat media massa.
3. Data alamat media massa yang disimpan akan digunakan untuk men-download
judul berita dan alamat berita kemudian disimpan ke database.
4. Data alamat berita yang disimpan akan digunakan untuk men-download konten
dan disimpan ke database. Selanjutnya judul berita dan konten akan dibentuk
menjadi gram dan disimpan ke database. Proses sistem dapat dilihat pada
Gambar 3.2.
Mulai
Masukkan nama, kategori dan alamat
media
Penyimpanan feed
media
Penyimpanan judul berita
Penyimpanan
3.3.1.1 Penyimpanan Feed Media Massa
Proses penyimpanan feed media massa bertujuan untuk menyimpan data tentang
media massa online. Tahapan-tahapan yang dilakukan dalam penyimpanan feed
diantaranya yaitu:
1. Masukkan nama media, kategori dan alamat media massa ke dalam textbox
yang ada pada halaman feed.
2. Kemudian dilakukan penyimpanan nama, kategori dan alamat media massa
pada database feed.
3. Semua data yang sudah diproses ditampilkan ke halaman feed. Proses
penyimpanan feed media dapat dilihat pada Gambar 3.3.
Penyimpanan data Mulai
Masukkan media, kategori dan alamat
media
Data media yang tersimpan
Selesai
3.3.1.2 Penyimpanan Judul Berita
Proses penyimpanan judul berita bertujuan untuk menyimpan data judul dan alamat
berita media massa online dengan cara men-download-nya. Tahapan-tahapan yang
dilakukan dalam penyimpanan judul berita diantaranya yaitu:
1. Yang diproses adalah data alamat media massa yang ada di database feed.
2. Judul berita dan alamat berita yang ada akan di download.
3. Cek judul berita apakah sudah ada di database konten atau tidak.
4. Jika judul berita sama dengan yang ada di database konten maka judul dan
alamat berita tidak disimpan ke database konten. Sedangkan jika judul dan
alamat berita tidak sama maka judul dan alamat berita akan disimpan ke
database konten.
5. Menampilkan judul dan alamat berita yang baru tersimpan ke database konten.
Proses penyimpanan judul berita dapat dilihat pada Gambar 3.4.
Mulai
Data alamat
media massa
Download judul dan alamat
berita
Sama?
Judul berita dan alamat
berita
Selesai
Simpan Cek judul
berita
Tidak
3.3.1.3 Penyimpanan Konten Berita
Proses konten berita bertujuan untuk menyimpan data isi berita dari judul berita yang
telah di-download sebelumnya. Proses penyimpanan konten dilakukan dengan cara
men-download. Pada tahapan ini juga, judul berita dan konten berita akan dibentuk
gram kemudian disimpan ke database konten. Tahapan-tahapan yang dilakukan dalam konten diantaranya yaitu:
1. Yang diproses adalah data judul berita yang ada di database konten.
2. Jika konten pada judul berita kosong maka lanjut ke proses text preprocessing
jika konten pada judul berita tidak kosong maka kembali mengambil data judul
berita yang ada di database konten.
3. Proses dilanjutkan dengan tahapan text preprocessing judul.
4. Setelah proses text preprocessing, judul berita dibentuk menjadi gram.
5. Kemudian konten akan di-download dari halaman website media massa online.
6. Proses dilanjutkan dengan tahapan text preprocessing konten.
7. Setelah proses text preprocessing, konten dibentuk menjadi gram.
8. Database konten di-update sehingga gram judul, konten dan gram konten
tersimpan ke database konten.
9. Menampilkan judul dan alamat berita dari konten berita yang baru tersimpan ke
database konten. Proses penyimpanan konten berita dapat dilihat pada gambar
3.5.
Mulai Data judul
Proses text preprocessing
judul
Data gram judul, konten,
gram konten Selesai
Mengambil data konten Pembentukan
gram judul
Proses text preprocessing
konten Pembentukan
gram konten Apakah konten
kosong? Ya
tidak
Update
database
konten
3.3.1.4 Text preprocessing
Tahapan-tahapan yang dilakukan dalam text preprocessing yaitu sebagai berikut.
1. Data kata / judul/ konten yang akan diproses.
2. Pengubahan semua huruf menjadi huruf kecil.
3. Selanjutnya tanda pemisah, angka dan simbol dihapus.
4. Lalu spasi dihapus.
5. Semua kata yang sudah diproses akan dilanjutkan ke proses berikutnya.
Flowchart dapat dilihat pada gambar 3.6.
Mulai
Data kata/ judul/konten
toLowerCase
Penghapusan spasi
Data berita yang sudah mengalami proses text preprocessing
Selesai Penghapusan tanda pemisah,
angka dan simbol
3.3.1.5 Algoritma Rabin-Karp
Pada penelitian ini, algoritma Rabin-Karp digunakan saat melakukan proses text
preprocessing, pembentukan nilai gram dan melakukan pencocok gram. Pada proses
admin algoritma Rabin-Karp digunakan sampai proses pembentukan nilai gram.
Sedangkan pada proses user algoritma Rabin-Karp digunakan sampai proses
pencocokan gram dan jumlah kemiripan. Tahapan proses yang dilakukan user adalah
sebagai berikut:
1. Data kata / judul/ konten yang akan diproses.
2. Proses dilanjutkan dengan tahapan text preprocessing.
3. Setelah proses text preprocessing, kata dibentuk menjadi gram.
4. Gram kata yang telah dibentuk dicocokkan kemiripannya dengan gram judul
dan gram konten yang tersimpan di database. Pada proses ini juga dilakukan
proses perhitungan jumlah kemiripan. Jika gram kata dengan gram judul atau
gram konten sama maka jumlah kemiripan akan ditambah 1. Proses algoritma
Rabin-Karp dapat dilihat pada Gambar 3.7.
Mulai
Data kata/ judul/ konten yang
akan diproses
Proses text preprocessing
Pembentukan gram
Pencocokan antar gram
[image:30.595.265.363.416.744.2]Selesai
3.3.2 User
Pada sistem ini, user akan melakukan pencarian dengan memasukkan keyword berupa
kata-kata pada halaman pencarian. Tahapan proses yang dilakukan user adalah
sebagai berikut:
1. User memasukkan keyword berupa kata ke textbox pencarian.
2. Ketika user mengklik tombol proses, maka sistem akan melakukan tahapan 2 -4
yang dilakukan pada proses algoritma Rabin-Karp.
3. Jika jumlah kemiripan antara gram kata dengan gram judul dan gram konten
melebihi 3 gram maka judul berita. Dan jika jumlah kemiripan antara gram kata
dengan gram judul dan gram konten kurang atau sama dengan 3 gram maka
judul berita tidak ditampilkan.
4. Sistem menampilkan judul berita dari judul berita yang memiliki jumlah
kemiripan yang paling tinggi sampai jumlah kemiripan yang paling rendah.
Proses user dapat dilihat pada gambar 3.8.
Mulai
Masukkan
keyword
Proses text preprocessing
Pembentukan gram
Pencocokan antar gram
Jumlah kemiripan > 3
Berita tidak ditemukan Tampilkan
judul berita
Selesai
[image:31.595.199.436.378.743.2]3.3.2.1 Pembentukan nilai gram dan pencocokan gram
Untuk pembentukan nilai gram dan pencocokan gram, penulis menggunakan
algoritma Rabin-Karp seperti yang telah dijelaskan pada bab sebelumnya. Setiap kata
yang terkandung dalam keyword, judul dan konten diubah terlebih dahulu menjadi
sebuah kumpulan gram. Kemudian gram keyword akan dicocokkan dengan gram
judul dan gram konten. Selanjutnya, menghitung jumlah kemiripan gram yang sama.
Penentuan nilai:
Gram : 5 Jumlah kemiripan > 3
Untuk pembentukan nilai gram dan pencocokan gram, penulis mengambil
contoh kata yng dimasukkan di keyword dan contoh judul berita yang akan dijadikan
sample pembanding dan akan dijabarkan dibawah ini.
Contoh proses user:
Keyword yang dimasukkan user: Jakarta Great
Judul berita yang ada di database : Jakarta Great Sale 2015 Targetkan Transaksi Rp
14,3 Triliun
Keyword: Jakarta Great
Proses text preprocessing: jakartagreat
Pembentukan nilai gram:
Tabel 3.3 Pembentukan Nilai Gram Keyword
jakar akart karta artag rtagr tagre agrea great
Judul : Jakarta Great Sale 2015 Targetkan Transaksi Rp 14,3 Triliun Proses text preprocessing: jakartagreatsaletargetkantransaksirptriliun
[image:32.595.100.525.665.741.2]Pembentukan nilai gram:
Tabel 3.4 Pembentukan Nilai Gram Judul
Setelah pembentukan gram pada keyword dengan gram pada judul maka proses
selanjutnya pencocokan antara gram keyword dengan gram judul. Proses pencocokan
gram dapat dilihat pada tabel 3.5. Untuk proses pencocokan gram secara rinci dapat
dilihat pada halaman lampiran b.
[image:33.595.108.497.215.592.2]Pencocokan gram keyword “ jakar “ dengan gram judul:
Tabel 3.5 Pencocokan Gram
Gram keyword
Gram
Judul Hasil
Gram keyword
Gram
Judul Hasil
jakar jakar sama jakar etkan tidak
jakar akart tidak jakar tkant tidak
jakar karta tidak jakar kantr tidak
jakar artag tidak jakar antra tidak
jakar rtagr tidak jakar ntran tidak
jakar tagre tidak jakar trans tidak
jakar agrea tidak jakar ransa tidak
jakar great tidak jakar ansak tidak
jakar reats tidak jakar nsaks tidak
jakar eatsa tidak jakar saksi tidak
jakar atsal tidak jakar aksir tidak
jakar tsale tidak jakar ksirp tidak
jakar salet tidak jakar sirpt tidak
jakar aleta tidak jakar irptr tidak
jakar letar tidak jakar rptri tidak
jakar etarg tidak jakar ptril tidak
jakar targe tidak jakar trili tidak
jakar arget tidak jakar riliu tidak
jakar rgetk tidak jakar iliun tidak
jakar getka tidak
Pada pencocokan gram diatas dapat disimpulkan bahwa jumlah kemiripan gram
keyword dengan gram judul yang sama sebanyak 8 (delapan). Karena jumlah
3.4 Perancangan Sistem 3.4.1 Diagram use case
Use case merupakan sebuah model pergerakan suatu sistem perangkat lunak secara
fungsional. Dengan ditampilkannya use ca se dapat membantu pengguna atau penulis
selanjutnya dapat mengetahui alur kerja sistem sehingga sistem dapat digunakan
dengan sebaik-baiknya. Sistem yang dibangun dengan menggunakan 2 aktor yang
[image:34.595.132.498.277.587.2]berperan yaitu sebagai user dan admin. Rancangan use case sistem dapat dilihat pada
Gambar 3.9.
Admin
Login Logout
Home
Feed
Url
Konten
Pencarian
Tambah «extends»
«uses»
«uses»
User
Halaman Utama
Hasil Pencarian «extends»
Pencarian «uses»
Hasil Pencarian «extends»
Gambar 3.9 Diagram Use Case
3.4.3. Definisi use case
Definisi use case merupakan penjelasan dari setiap kegiatan yang dilakukan aktor
dalam use case. Terdapat kegiatan use case uses yang berarti aktor dapat melakukan
kegiatan yang dituju arah panah. Dan kegiatan use case extend yang berarti aktor
Tabel 3.6 Definisi Use Case
No Use case Deskripsi
1. Halaman Utama Menampilakan halaman utama dari sistem pencarian dapat digunakan oleh user
2. Pencarian Proses pencarian berita yang berhubungan dengan keyword, dapat digunakan oleh user
3. Hasil Pencarian Menampilkan judul berita yang berhubungan dengan keyword , dapat digunakan oleh user
4. Login Proses masuk ke sistem dan melakukan pngolahan data, hanya digunakan oleh admin
5. Home Menampilkan halaman utama admin 6. Feed Menampilkan halaman tabel database feed
7. Url Proses tambah judul dan alamat berita dengan cara men-download.
8. Konten Proses pengambilan konten berita
9. Logout Proses Keluar dari sistem hanya jika sudah login
10. Pencarian Proses pencarian berita yang berhubungan dengan keyword dapat digunakan oleh admin
11. Tambah Proses tambah url feed
BAB 4
IMPLEMENTASI DAN PENGUJIAN
4.1 Implementasi Sistem
Setelah analisis dan perancangan sistem pada bab sebelumnya, maka dapat dilakukan
pengimplementasian sistem pencarian kata dengan menggunakan bahasa PHP dan
database MySQL.
4.1.1. Spesifikasi perangkat keras dan prangkat lunak
Sistem dibangun dengan spesifikasi perangkat keras sebagai berikut:
1. Processor Intel® Atom™ CPU N2800 @1.86 GHz
2. RAM yang digunakan 2.00 GB
3. Kapasitas Harddisk 290 GB
Sistem juga dibangun dengan spesifikasi perangkat lunak sebagai berikut:
1. Windows 7 Starter 32-bit
2. XAMPP 1.8.1
4.1.2. Implementasi perancangan sistem
Implementasi perancangan sistem menjelaskan tentang proses implementasi
perancangan sistem dengan menyertakan tampilan-tampilan halaman sistem pada
setiap proses dalam bentuk gambar.
a. Tampilan halaman utama user
Halaman utama ini digunakan untuk user melakukan pencarian kata. User dapat
meng-input kata pada field textboxt kemudian mengklik tombol cari untuk memproses
Gambar 4.1 Halaman Utama User
b. Tampilan hasil pencarian user
Pada halaman hasil pencarian menampilkan judul-judul berita yang kemungkinan
berhubungan dengan kata yang dicari oleh user. User dapat mendapat mengklik judul
untuk mengetahui isi berita pada judul tersebut. Pada halaman ini juga terdapat
textbox pencarian yang memudahkkan user untuk mencari kata yang lainnya.
c. Tampilan halaman berita user
Pada halaman berita menampilkan isi berita dari judul yang diklik user. Pada halaman
ini juga terdapat textbox pencarian yang memudahkkan user untuk mencari kata yang
lainnya. Tampilan halaman berita user dapat dilihat di Gambar 4.3.
Gambar 4.3 Tampilan Halaman Berita User
d. Tampilan halaman home admin
Pada halaman home admin digunakan untuk admin melakukan pencarian kata. Admin
dapat meng-input kata pada field textboxt kemudian mengklik tombol cari untuk
memproses pencarian. Pada halaman ini juga dilengkapi dengan menu home, feed, url,
konten dan keluar. Untuk masuk ke halaman home admin, admin terlebih daluhu login
dengan memasukkan username dan password pada halaman login yang telah tersedia.
Gambar 4.4 Tampilan Halaman Home Admin
e. Tampilan halaman hasil pencarian admin
Pada halaman hasil pencarian admin menampilkan judul-judul berita yang
kemungkinan berhubungan dengan kata yang dicari oleh admin. Judul-judul berita
ditampilkan dalam bentuk tabel dengan informasi jumlah kemiripan kata antara
keyword dengan berita. Admin juga dapat mendapat mengklik judul untuk mengetahui
isi berita pada judul tersebut. Pada halaman ini juga terdapat textbox pencarian yang
memudahkkan admin untuk mencari kata yang lainnya. Tampilan halaman hasil
[image:39.595.110.524.561.715.2]pencarian admin dapat dilihat di Gambar 4.5.
f. Tampilan halaman berita admin
Pada halaman berita menampilkan isi berita dari judul yang diklik admin. Pada
halaman ini juga terdapat textbox pencarian yang memudahkkan user untuk mencari
[image:40.595.108.523.185.449.2]kata yang lainnya. Tampilan halaman berita admin dapat dilihat di Gambar 4.6.
Gambar 4.6 Tampilan Halaman Berita Admin
g. Tampilan halaman feed
Pada halaman feed menampilkan tabel yang berisi no, nama media massa online,
kategori dan alamat media massa. Pada halaman ini terdapat menu home, feed, tambah
dan keluar. Tampilan halaman feed dapat dilihat di Gambar 4.7.
h. Tampilan halaman tambah
Pada halaman tambah menampilkan textboxt media, kategori dan url sehingga admin
dapat menambah media massa online. Hasil dari proses dari penambahan media massa
online akan ditampilkan pada halaman feed sehingga admin dapat mengetahui bahwa
data media massa online yang ditambahkan telah masuk ke database. Tampilan
Gambar 4.7 Tampilan Halaman Feed
Gambar 4.8 Tampilan Halaman Tambah
i. Tampilan halaman url
Pada halaman url menampilkan proses pengambilan judul berita dan alamat berita
dengan cara di-download. Pada halaman url terdapat tombol proses untuk melakukan
proses men-download judul berita dan alamat berita. Tampilan halaman url dapat
Gambar 4.9 Tampilan Halaman Ur l
Saat meng-klik tombol proses maka judul berita dan alamat berita akan
di-download dan akan ditampilkan di halaman url no, media, kategori, judul berita dan
alamat berita yang baru tersimpan dalam database. Tampilan halaman url setelah
men-download dapat dilihat pada gambar 4.10.
Gambar 4.10 Tampilan Halaman Url Setelah Proses Men-download
j. Tampilan halaman konten
Pada halaman konten menampilkan proses pengambilan konten berita dengan cara
di-download. Pada halaman ambil terdapat tombol proses untuk melakukan proses
[image:42.595.111.525.326.653.2]Gambar 4.11 Tampilan Halaman Konten
Saat meng-klik tombol proses maka akan ditampilkan judul berita dan alamat
berita. Judul berita dan alamat berita yang tampil menyatakan bahwa isi konten dari
judul tersebut telah selesai di-download dan disimpan di database. Pada halaman
konten juga terjadi pembentukan nilai gram judul dan nilai gram konten. Tampilan
halaman konten saat proses men-dowload dapat dilihat pada Gambar 4.12.
Gambar 4.12 Tampilan Halaman Konten Saat ProsesMen-download
4.2 Pengujian Sistem
Setelah implementasi sistem telah selesai dilakukan, maka proses selanjutnya adalah
pengujian sistem. Hal ini dilakukan untuk mengetahui apakah sistem yang dibuat
berjalan sesuai dengan rancangan sebelumnya.
4.2.1 Pengujian sistem pengambilan berita
Proses pengambilan berita dilakukan secara online. Data berita yang ada pada media
massa online akan diunduh dan disimpan secara otomatis ke dalam database konten.
[image:43.595.107.527.367.473.2]36 url. Dari Gambar 4.13 dapat dilihat isi dari database konten.
Gambar 4.13 Database Konten
3
4.2.2 Pengujian sistem pencarian
Pada penelitian ini, terdapat 7 keyword yang akan dilakukan proses pencarian. Berikut
keyword yang akan dimasukkan :
- OC Kaligis
- Pertalite
- Pilkada Serentak
- Kekeringan daerah
- International champions
- Muktamar Nahdlatul Ulama
- Rio haryanto
Proses pencarian kata telah dijelaskan pada bab sebelumnya, terdiri dari
langkah-langkah sebagai berikut.
1. Masukkan input keyword.
2. Langkah berikutnya proses text preprocessing untuk mengubah huruf keyword
menjadi huruf kecil semua, penghapusan tanda pemisah, angka dan simbol
serta menghapus spasi.
3. Langkah berikutnya proses pembentukan gram dimana keyword akan diubah
menjadi gram dengan syarat nilai gram sebesar 5.
4. Langkah berikutnya proses pencocokan gram keyword dengan gram judul dan
gram konten yang ada di database konten. Jika gram kata dengan gram judul
dan gram konten sama maka jumlah kemiripan akan ditambah 1.
5. Langkah berikutnya menentukan jumlah kemiripan yaitu jika jumlah
kemiripan gram lebih besar dari 3 maka judul berita akan ditampilkan jika
jumlah kemiripan kurang atau sama dengan 3 maka judul berita tidak akan
ditampilkan.
Hasil pengujian sistem pencarian dapat dilihat pada tabel 4.1. Untuk hasil
Tabel 4.1 Hasil Pengujian Sistem Pencarian
No. Keyword Judul berita yang bersangkutan Jlh
kemiripan
1. OC kaligis Gubernur Gatot dan Istri Ditahan KPK 5
KPK: Gubernur Gatot Pujo dan Istri Ditahan
20 Hari ke Depan 5
Ketua MA: Kami Capek Selalu Ingatkan
Hakim Jangan Langgar Sumpah 5
KPK Izinkan Velove Vexia Bertemu OC
Kaligis 5
Jenguk OC Kaligis, Ini yang Akan Dilakukan
Velove Vexia 5
OC Kaligis Segera Ajukan Praperadilan dan
Lapor ke Komnas HAM 5
Raffi Ahmad Prihatin Ayah Mantan Pacar
Ditahan KPK 5
Pengacara Gatot Minta KPK Usut Korupsi
Bansos Pemprov Sumut 5
Mendagri Bebastugaskan Gatot dari Tugas
Gubernur Sumut 5
News Flash: KPK Kembali Periksa OC
Kaligis dan Anak Buahnya 5
14 Jam Diperiksa KPK, Gubernur Gatot Pujo
Dicecar 27 Pertanyaan 5
Jadi Pengacara Batak, Acha Septriasa Takut
Tak Lucu 5
Pengacara Gerry: Ada Uang dari Istri
Gubernur Sumut ke OC Kaligis 5
Sikap Komnas HAM Usai Terima Aduan OC
Kaligis 5
Sakit Darah Tinggi, OC Kaligis Dirujuk ke
Pada hasil pengujian di atas dapat disimpulkan bahwa proses pengujian sistem
berhasil dilakukan. Judul berita yang ditampilkan merupakan judul berita yang
kemungkinan berhubungan dengan keyword dan memiliki jumlah kemiripan lebih dari
3 dan judul berita yang ditampilkan di sorting dari jumlah kemiripan yang paling
besar ke paling sedikit.
BAB 5
KESIMPULAN DAN SARAN
5.1 Kesimpulan
Berdasarkan hasil penelitian yang telah diuraikan pada bab sebelumnya, maka dapat
disimpulkan bahwa:
1. Algoritma Rabin-Karp dapat menghasilkan informasi berita yang
kemungkinan berhubungan dengan keyword yang dimasukkan.
2. Dengan menggunakan pembentukan gram, proses pencocokan akan lebih baik
dikarenakan kata pada keyword dengan kata yang ada di database telah
memiliki panjang string yang sama.
3. Pada proses pencocokan gram, semakin besar jumlah kemiripannya maka
semakin besar pula kemungkinan berita tersebut berhubungan dengan keyword
yang dimasukkan.
5.2 Saran
Pada penelitian berikutnya, penulis menyarankan:
1. Waktu pada pencarian kata memakan waktu lama sehingga penulis
meyarankan agar menggunakan metode lain yang dapat membuat proses
sistem belangsung dengan cepat dan efisien seperti Knuth-Morris-Pratt dan
Boyer-Moore.
2. Penyimpanan feed media massa ke database masih dilakukan secara manual
sehingga penulis menyarankan agar kedepannya penyimpanan feed media
DAFTAR PUSTAKA
Dewandono, R.D., Sahputra, F.A., Rochimah, S. 2013. Clone Detection Using Rabin-Karp Parallel Algorithm. In Proceedings of The 7th International Confrence on Information & Communication Technology and Systems, Bali, May 15th -16th, 2013 : 21-26.
Farizi, S.A. 2015. Rekomendasi Tag Pada Berita Online Menggunakan TF-IDF dan Collaborative Tagging. Skripsi. Universitas Sumatera Utara.
Fauziah, Ririn. 2012. Minat Masyarakat Dalam Menggunakan Media Massa. Skripsi. Universitas Sultan Agung Tirtayasa.
Firdaus, H.B.2003.Deteksi Plagiat Dokumen Menggunakan Algoritma Rabin-Karp. Jurnal Teknik Informatika Sekolah Teknik Elektro dan Informatika, Institut Teknologi Bandung (Online) http://informatika.stei.itb.ac.id/~rinaldi.munir/ Stmik/2007-2008/Makalah2008/MakalahIF2251-2008-076.pdf.
Haifa, Rizka. 2011. Perbandingan Kecepatan Sistem Pencarian Kata Pada Database Simple-O. Skripsi. Universitas Indonesia.
Lisa, A.E., 2012. Fungsi Media Massa Dalam Pembentukan Opini Publik. Skripsi. Universitas Sumatera Utara.
Kassim, J.M., Rahmany, M. 2009. Introduction to Semantic Search Engine. International Confrence on Electrical Engineering and Informatic, Selangor, Malaysia, August 5th - 7th, 2009 : 380-386.
Mesran.2014. Implementasi Algoritma Brute Force Dalam Pencarian Data Katalog Buku Perpustakaan. Majalah Ilmiah Informasi dan Teknologi Ilmiah (INTI) Volume: III, No.1, Mei 2014 : 100-104.
Nugroho, Eko. 2011. Perancangan Sistem Deteksi Plagiarisme Dokumen Teks Dengan Menggunakan Algoritma Rabin-Karp. Skripsi. Universitas Brawijaya.
Pabitha,C.,Sangeetha, G.2013. Refining Serp – Search Engine Result Page for Enhamced Information Retrival. International Journal of Data Mining Techniques and Aplications. Volume 02, Issue 01, June 2013 : 126-136. Primadani, Yuli. 2014. Simulasi Algoritma Levenshtein Distance Untuk Fitur
Autocomplete Pada Aplikasi Katalog Perpustakaan. Skripsi. Universitas Sumatera Utara.
Putranto, K.A. 2010. Implentasi Dan Analisis Konsep Web 3.0 Pada Search Engine Toko Komputer Online. Skripsi. Universitas Indonesia.
Sembiring, C.A. 2014. Focused Crawler Untuk Mengoptimalkan Pencarian Jurnal Menggunakan Metode Porter Stemmer. Skripsi. Universitas Sumatera Utara. Sunita, Ms., Malik, Ms Ritu., Gulia, Ms Mamta. 2014. Rabin-Karp Algorithm with
Hashing a String Matching Tool. International Journal of Advanced Research in Computer Science and Software Engineering. Volume 4, Issue 3, March 2014 : 389-392.
Tataran, Faruq. 2010. Aplikasi Panduan Kata Dalam Mencari Ayat Al-Qur’an Juz 30 Berbasis Java Mobile. Skripsi. Universitas Islam Negeri Syarif Hidayatullah. Yazidanyastuti. 2011. Aplikasi Analisis Halaman Website Pada Mesin Pencari Google
LAMPIRAN A : Tabel Konten
Lampiran A : Tabel Konten
id id_feed judul gram_judul konten gram_konten url 3 1 Catat 78 Mal
yang Ikut Serta Ajang Jakarta Great S... a:38:{i:0;s: 5:"catat";i:1 ;s:5:"atatm" ;i:2;s:5:"tat. .. <div class="text-detail" itemprop="des cription" da... a:1623:{i:0;s:5 :"divcl";i:1;s:5 :"ivcla";i:2;s:5: "v... http://bisnis.l iputan6.com/ read/224695 5/catat-78-m... 4 1 Indonesia
Akan Jadi Importir Gas a:24:{i:0;s: 5:"indon";i: 1;s:5:"ndon e";i:2;s:5:"d on... <div class="text-detail" itemprop="des cription" da... a:2103:{i:0;s:5 :"divcl";i:1;s:5 :"ivcla";i:2;s:5: "v... http://bisnis.l iputan6.com/ read/224694 9/indonesia-...
6 1 PLTA
Saguling, Penolong Listrik Jawa dan Bali a:34:{i:0;s: 5:"pltas";i:1 ;s:5:"ltasa"; i:2;s:5:"tas.. . <div class="text-detail" itemprop="des cription" da... a:2134:{i:0;s:5 :"divcl";i:1;s:5 :"ivcla";i:2;s:5: "v... http://bisnis.l iputan6.com/ read/224691 0/plta-sagul... 7 1 Organda
Protes Keberadaan Taksi Uber a:28:{i:0;s: 5:"organ";i: 1;s:5:"rgan d";i:2;s:5:" gan... <div class="text-detail" itemprop="des cription" da... a:2456:{i:0;s:5 :"divcl";i:1;s:5 :"ivcla";i:2;s:5: "v... http://bisnis.l iputan6.com/ read/224690 5/organda-pr... 8 1 Pertamina
Ingin Kuasai Pasar Gas Indonesia a:33:{i:0;s: 5:"perta";i: 1;s:5:"erta m";i:2;s:5:" rta. <div class="text-detail" itemprop="des cription" da... a:2093:{i:0;s:5 :"divcl";i:1;s:5 :"ivcla";i:2;s:5: "v... http://bisnis.l iputan6.com/ read/224690 1/pertamina-...
9 1 Mengapa Banyak Orang Kaya Tinggal di Monako? a:33:{i:0;s: 5:"menga";i :1;s:5:"enga p";i:2;s:5:" nga... <div class="text-detail" itemprop="des cription" da... a:2119:{i:0;s:5 :"divcl";i:1;s:5 :"ivcla";i:2;s:5: "v... http://bisnis.l iputan6.com/ read/224689 6/mengapa-ba... 10 1 Gitar John
Lennon Ditaksir Terjual Rp 10 Miliar a:34:{i:0;s: 5:"gitar";i:1 ;s:5:"itarj";i :2;s:5:"tar... <div class="text-detail" itemprop="des cription" da... a:1546:{i:0;s:5 :"divcl";i:1;s:5 :"ivcla";i:2;s:5: "v... http://bisnis.l iputan6.com/ read/224659 1/gitar-john... 11 1 Siap-siap!
Lampiran A : Tabel Konten (Lanjutan)
id id_f
eed judul gram_judul konten gram_konten url 12 1 Negara Ini
Ingin Timbun Lebih Banyak Emas a:31:{i:0;s: 5:"negar";i: 1;s:5:"egara ";i:2;s:5:"ga r... <div class="text-detail" itemprop="des cription" da... a:1440:{i:0;s:5 :"divcl";i:1;s:5 :"ivcla";i:2;s:5: "v... http://bisnis.l iputan6.com/ read/224662 0/negara-ini... 13 1 Ini Sebab
Midnight Sale Kerap Diburu Konsumen a:35:{i:0;s: 5:"inise";i:1 ;s:5:"niseb" ;i:2;s:5:"ise ... <div class="text-detail" itemprop="des cription" da... a:1636:{i:0;s:5 :"divcl";i:1;s:5 :"ivcla";i:2;s:5: "v... http://bisnis.l iputan6.com/ read/224656 9/ini-sebab-...
14 1 BKPM Inisiasi Perizinan Investasi Terintegrasi di ... a:43:{i:0;s: 5:"bkpmi";i :1;s:5:"kpm in";i:2;s:5:" pmi... <div class="text-detail" itemprop="des cription" da... a:2197:{i:0;s:5 :"divcl";i:1;s:5 :"ivcla";i:2;s:5: "v... http://bisnis.l iputan6.com/ read/224662 6/bkpm-inisi... 15 1 Data Tenaga
Kerja Positif, The Fed Segera Naikkan ... a:46:{i:0;s: 5:"datat";i: 1;s:5:"atate ";i:2;s:5:"ta t... <div class="text-detail" itemprop="des cription" da... a:1889:{i:0;s:5 :"divcl";i:1;s:5 :"ivcla";i:2;s:5: "v... http://bisnis.l iputan6.com/ read/224649 7/data-tenag... 16 1 Ini
Keuntungan Belanja Saat Grand Midnight Sale a:37:{i:0;s: 5:"inike";i: 1;s:5:"nike u";i:2;s:5:"i ke... <div class="text-detail" itemprop="des cription" da... a:1806:{i:0;s:5 :"divcl";i:1;s:5 :"ivcla";i:2;s:5: "v... http://bisnis.l iputan6.com/ read/224654 3/ini-keuntu...
17 1 Pertahankan Total Produk -si, OPEC Ramal Harga Minya… a:51:{i:0;s: 5:"perta";i: 1;s:5:"ertah ";i:2;s:5:"rt a... <div class="text-detail" itemprop="des cription" da... a:2123:{i:0;s:5 :"divcl";i:1;s:5 :"ivcla";i:2;s:5: "v... http://bisnis.l iputan6.com/ read/224646 7/pertahanka. ..
18 1 Kawasan Industri JIIPE Ditargetkan Beroperasi pada... a:41:{i:0;s: 5:"kawas";i :1;s:5:"awa sa";i:2;s:5:" was... <div class="text-detail" itemprop="des cription" da... a:1722:{i:0;s:5 :"divcl";i:1;s:5 :"ivcla";i:2;s:5: "v... http://bisnis.l iputan6.com/ read/224651 7/kawasan-in...
Lampiran A : Tabel Konten (Lanjutan)
id id_feed judul gram_judul konten gram_konten url 20 1 Jelang
Muktamar, Muhammadi yah Siapkan Konsep Baru a:50:{i:0;s: 5:"jelan";i: 1;s:5:"elang ";i:2;s:5:"la n... <div class="text-detail" itemprop="des cription" da... a:1758:{i:0;s:5 :"divcl";i:1;s:5 :"ivcla";i:2;s:5: "v... http://bisnis.l iputan6.com/ read/224645 3/jelang-muk... 21 1 Pengembang
Sepakat Nama Tol Cikampek-Palimana… a:43:{i:0;s: 5:"penge";i: 1;s:5:"enge m";i:2;s:5:" nge... <div class="text-detail" itemprop="des cription" da... a:2149:{i:0;s:5 :"divcl";i:1;s:5 :"ivcla";i:2;s:5: "v... http://bisnis.l iputan6.com/ read/224644 3/pengemban g...
22 1 Ingat, Festival Jakarta Great Sale 2015 Dimulai Ha... a:39:{i:0;s: 5:"ingat";i: 1;s:5:"ngatf ";i:2;s:5:"ga t... <div class="text-detail" itemprop="des cription" da... a:1561:{i:0;s:5 :"divcl";i:1;s:5 :"ivcla";i:2;s:5: "v... http://bisnis.l iputan6.com/ read/224642 5/ingat-fest...
23 1 Top 5 Bisnis: Rapor Merah 7 Kementerian Sedot Perh... a:40:{i:0;s: 5:"topbi";i: 1;s:5:"opbis ";i:2;s:5:"p bi... <div class="text-detail" itemprop="des cription" da... a:3475:{i:0;s:5 :"divcl";i:1;s:5 :"ivcla";i:2;s:5: "v... http://bisnis.l iputan6.com/ read/224643 6/top-5-bisn...
24 1 Harga Emas Susut ke Posisi Terendah dalam 3 Bulan a:36:{i:0;s: 5:"harga";i: 1;s:5:"argae ";i:2;s:5:"rg a... <div class="text-detail" itemprop="des cription" da... a:2133:{i:0;s:5 :"divcl";i:1;s:5 :"ivcla";i:2;s:5: "v... http://bisnis.l iputan6.com/ read/224642 3/harga-emas...
25 1 Harga Minyak Naik di Akhir Pekan a:23:{i:0;s: 5:"harga";i: 1;s:5:"arga m";i:2;s:5:" rga... <div class="text-detail" itemprop="des cription" da... a:2609:{i:0;s:5 :"divcl";i:1;s:5 :"ivcla";i:2;s:5: "v... http://bisnis.l iputan6.com/ read/224642 0/harga-miny... 26 1 Hati-hati!
LAMPIRAN B : Pencocokan Gram
Pencocokan gram keyword “ akart “ dengan gram judul:
Lampiran B : Pencocokan Gram
Gram keyword
Gram
Judul Hasil
Gram keyword
Gram
Judul Hasil
akart jakar tidak akart etkan tidak
akart akart sama akart tkant tidak
akart karta tidak akart kantr tidak
akart artag tidak akart antra tidak
akart rtagr tidak akart ntran tidak
akart tagre tidak akart trans tidak
akart agrea tidak akart ransa tidak
akart great tidak akart ansak tidak
akart reats tidak akart nsaks tidak
akart eatsa tidak akart saksi tidak
akart atsal tidak akart aksir tidak
akart tsale tidak akart ksirp tidak
akart salet tidak akart sirpt tidak
akart aleta tidak akart irptr tidak
akart letar tidak akart rptri tidak
akart etarg tidak akart ptril tidak
akart targe tidak akart trili tidak
akart arget tidak akart riliu tidak
akart rgetk tidak akart iliun tidak
akart getka tidak
Pencocokan gram keyword “ karta “ dengan gram judul:
Lampiran B : Pencocokan Gram (Lanjutan)
Gram keyword
Gram
Judul Hasil
Gram keyword
Gram
Judul Hasil
karta jakar tidak karta etkan tidak
karta akart tidak karta tkant tidak
karta karta sama karta kantr tidak
karta artag tidak karta antra tidak
karta rtagr tidak karta ntran tidak
karta tagre tidak karta trans tidak
karta agrea tidak karta ransa tidak
karta eatsa tidak karta saksi tidak
karta atsal tidak karta aksir tidak
karta tsale tidak karta ksirp tidak
karta salet tidak karta sirpt tidak
karta aleta tidak karta irptr tidak
karta letar tidak karta rptri tidak
karta etarg tidak karta ptril tidak
karta targe tidak karta trili tidak
karta arget tidak karta riliu tidak
karta rgetk tidak karta iliun tidak
karta getka tidak
Pencocokan gram keyword “ artag “ dengan gram judul:
Lampiran B : Pencocokan Gram (Lanjutan)
Gram keyword
Gram
Judul Hasil
Gram keyword
Gram
Judul Hasil
artag jakar tidak artag etkan tidak
artag akart tidak artag tkant tidak
artag karta tidak artag kantr tidak
artag artag sama artag antra tidak
artag rtagr tidak artag ntran tidak
artag tagre tidak artag trans tidak
artag agrea tidak artag ransa tidak
artag great tidak artag ansak tidak
artag reats tidak artag nsaks tidak
artag eatsa tidak artag saksi tidak
artag atsal tidak artag aksir tidak
artag tsale tidak artag ksirp tidak
artag salet tidak artag sirpt tidak
artag aleta tidak artag irptr tidak
artag letar tidak artag rptri tidak
artag etarg tidak artag ptril tidak
artag targe tidak artag trili tidak
artag arget tidak artag riliu tidak
artag rgetk tidak artag iliun tidak
Pencocokan gram keyword “rtagr “ dengan gram judul:
Lampiran B : Pencocokan Gram (Lanjutan)
Gram keyword
Gram
Judul Hasil
Gram keyword
Gram
Judul Hasil
rtagr jakar tidak rtagr etkan tidak
rtagr akart tidak rtagr tkant tidak
rtagr karta tidak rtagr kantr tidak
rtagr artag tidak rtagr antra tidak
rtagr rtagr sama rtagr ntran tidak
rtagr tagre tidak rtagr trans tidak
rtagr agrea tidak rtagr ransa tidak
rtagr great tidak rtagr ansak tidak
rtagr reats tidak rtagr nsaks tidak
rtagr eatsa tidak rtagr saksi tidak
rtagr atsal tidak rtagr aksir tidak
rtagr tsale tidak rtagr ksirp tidak
rtagr salet tidak rtagr sirpt tidak
rtagr aleta tidak rtagr irptr tidak
rtagr letar tidak rtagr rptri tidak
rtagr etarg tidak rtagr ptril tidak
rtagr targe tidak rtagr trili tidak
rtagr arget tidak rtagr riliu tidak
rtagr rgetk tidak rtagr iliun tidak
rtagr getka tidak
Pencocokan gram keyword “tagre “ dengan gram judul:
Lampiran B : Pencocokan Gram (Lanjutan)
Gram keyword
Gram
Judul Hasil
Gram keyword
Gram
Judul Hasil
tagre jakar tidak rtagr etkan tidak
tagre akart tidak rtagr tkant tidak
tagre karta tidak rtagr kantr tidak
tagre artag tidak rtagr antra tidak
tagre rtagr tidak rtagr ntran tidak
tagre tagre sama rtagr trans tidak
tagre agrea tidak rtagr ransa tidak
tagre great tidak rtagr ansak tidak
tagre tsale tidak rtagr ksirp tidak
tagre salet tidak rtagr sirpt tidak
tagre aleta tidak rtagr irptr tidak
tagre letar tidak rtagr rptri tidak
tagre etarg tidak rtagr ptril tidak
tagre targe tidak rtagr trili tidak
tagre arget tidak rtagr riliu tidak
tagre rgetk tidak rtagr iliun tidak
tagre getka tidak
Pencocokan gram keyword “agrea “ dengan gram judul:
Lampiran B : Pencocokan Gram (Lanjutan)
Gram keyword
Gram
Judul Hasil
Gram keyword
Gram
Judul Hasil
agrea jakar tidak agrea etkan tidak
agrea akart tidak agrea tkant tidak
agrea karta tidak agrea kantr tidak
agrea artag tidak agrea antra tidak
agrea rtagr tidak agrea ntran tidak
agrea tagre tidak agrea trans tidak
agrea agrea sama agrea ransa tidak
agrea great tidak agrea ansak tidak
agrea reats tidak agrea nsaks tidak
agrea eatsa tidak agrea saksi tidak
agrea atsal tidak agrea aksir tidak
agrea tsale tidak agrea ksirp tidak
agrea salet tidak agrea sirpt tidak
agrea aleta tidak agrea irptr tidak
agrea letar tidak agrea rptri tidak
agrea etarg tidak agrea ptril tidak
agrea targe tidak agrea trili tidak
agrea arget tidak agrea riliu tidak
agrea rgetk tidak agrea iliun tidak
Pencocokan gram keyword “great “ dengan gram judul:
Lampiran B : Pencocokan Gram (Lanjutan)
Gram keyword
Gram
Judul Hasil
Gram keyword
Gram
Judul Hasil
great jakar tidak great etkan tidak
great akart tidak great tkant tidak
great karta tidak great kantr tidak
great artag tidak great antra tidak
great rtagr tidak great ntran tidak
great tagre tidak great trans tidak
great agrea tidak great ransa tidak
great great sama great ansak tidak
great reats tidak great nsaks tidak
great eatsa tidak great saksi tidak
great atsal tidak great aksir tidak
great tsale tidak great ksirp tidak
great salet tidak great sirpt tidak
great aleta tidak great irptr tidak
great letar tidak great rptri tidak
great etarg tidak great ptril tidak
great targe tidak great trili tidak
great arget tidak great riliu tidak
great rgetk tidak great iliun tidak
LAMPIRAN C : Hasil Pengujian Sistem
Lampiran C : Hasil Pengujian Sistem Pencarian
No. Keyword Judul berita yang bersangkutan Jlh
kemiripan
2. Pertalite Pertamina Yakin Pertalite Laris Manis 5
Pertamina Jual Pertalite dengan Harga
Promo Saat Peluncuran 5
Pasarkan Pertalite, Pertamina Tak Kurangi
Premium 5
Ini Daftar Lengkap 101 SPBU yang Jual
Pertalite 5
Pertamina Incar Konsumen Premium
Pindah ke Pertalite 5
Pertalite Resmi Dijual Seharga Rp 8.400 per
Liter 5
Saat Peluncuran, Ada Hadiah untuk Pembeli
Pertalite 5
Diluncurkan 24 Juli, Ini Kelebihan Pertalite 5
Ini Persiapan Pertamina Sebelum
Luncurkan Pertalite 5
Bocoran Eksterior dan Interior Toyota
Fortuner Terbaru 5
Pertamina Bakal Kerahkan Go-Jek untuk
Suplai BBM Saat Mudik 5
Nekat Tenggak Pertalite, Ini Dampak Buruk
Bagi Kendaraan 5
Pertalite Meluncur Picu Impor BBM RI
Melonjak 5
Keberadaan Pertalite Bakal Lenyapkan
Lampiran C : Hasil Pengujian Sistem Pencarian (Lanjutan)
No. Keyword Judul berita yang bersangkutan Jlh kemiripan
Ada Pertalite, Pertamina Ingin Penjualan
Pertamax Tetap Tinggi 5
Pertalite Diserbu Pengendara Kendaraan
Bermotor di Surabaya 5
Top 5 Bisnis: Harga Promo Pertalite Saat
Peluncuran Jadi Hits 5
Pengusaha Lebih Untung Jual Pertalite
Ketimbang Premium 5
Wapres JK Yakin Pertalite Mampu Geser
Premium 5
33 SPBU di Jawa Timur Sudah Jual
Pertalite 5
Premium Bakal Dihapus 2 Tahun Lagi 5
Pertalite RON 90 Siap Dijual di 103
SPBU, Ini Penampakannya 5
Pertamina Yakin Pertalite Laris Manis 5
Ada Pertalite, Pertamina Ingin Penjualan
Pertamax Tetap Tinggi 5
3. Pilkada serentak JK: Bahaya Kalau Pilkada Hanya Calon
Tunggal 11
Usai Bertemu JK, Pemerintah-KPU-Parpol
Sepakati 2 Hal 11
BIN Deteksi Daerah Rawan Rusuh Saat
Pilkada Serentak 11
Ikut Pilkada Serentak, Saan Mustopa
Disokong Eks Bupati Karawang 11
Populi: Perppu Calon Tunggal Pilkada
Lampiran C : Hasil Pengujian Sistem Pencarian (Lanjutan)
No. Keyword Judul berita yang bersangkutan Jlh kemiripan
2 Kubu Golkar Sepakat Minta
Perpanjangan Waktu Pendaftaran 11
Bakal Calon Boneka Muncul di Pilkada
Kabupaten Serang? 11
Cagub Pertama di Bengkulu Resmi
Mendaftar di KPU 11
Pilkada Kota Semarang Diikuti 3 Pasang
Calon 11
Tingginya Elektabilitas Tokoh Daerah,
Sebab Adanya Calon Tunggal? 11
Pengamat: Calon Tunggal di Pilkada 2015
Bukti Parpol Ingkar Janji 11
PDIP Yakin Bisa Menangkan Pilkada 2015
di 3 Wilayah Ini 11
Tambah 1 Pasangan, Pilkada Kabupaten
Serang Batal Mundur 11
Ahok: Nara Maju J