TF-IDF
DAN
COLLABORATIVE TAGGING
SKRIPSI
SALMAN ALL FARIZI
091402007
PROGRAM STUDI S1 TEKNOLOGI INFORMASI
FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI
UNIVERSITAS SUMATERA UTARA
MEDAN
REKOMENDASI TAG PADA BERITA ONLINE MENGGUNAKAN
TF-IDF DAN COLLABORATIVE TAGGING
SKRIPSI
Diajukan untuk melengkapi tugas dan memenuhi syarat memperoleh ijazah Sarjana Teknologi Informasi
SALMAN ALL FARIZI 091402007
PROGRAM STUDI S1 TEKNOLOGI INFORMASI
FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA
PERSETUJUAN
Judul : REKOMENDASI TAG PADA BERITA ONLINE
MENGGUNAKAN TF-IDF DAN COLLABORATIVE TAGGING
Kategori : SKRIPSI
Nama : SALMAN AL FARIZI Nomor Induk Mahasiswa : 091402007
Program Studi : SARJANA (S1) TEKNOLOGI INFORMASI Departemen : TEKNOLOGI INFORMASI
Fakultas : ILMU KOMPUTER DAN TEKNOLOGI INFORMASI (FASILKOM-TI) UNIVERSITAS SUMATERA UTARA
Diluluskan di Medan, April 2015 Komisi Pembimbing :
Pembimbing 2 Pembimbing 1
Dr. Erna Budhiarti Nababan, M.IT Mohammad Fadly Syahputra, B.Sc, M.Sc.IT NIP- NIP 198301292009121003
Diketahui/Disetujui oleh
Program Studi S1 Teknologi Informasi Ketua,
ii
PERNYATAAN
REKOMENDASI TAG PADA BERITA ONLINE MENGGUNAKAN
TF-IDF DAN COLLABORATIVE TAGGING
SKRIPSI
Saya mengakui bahwa skripsi ini adalah hasil karya sendiri, kecuali beberapa kutipan dan ringkasan yang masing-masing disebutkan sumbernya.
Medan, April 2015
UCAPAN TERIMA KASIH
Puji dan syukur penulis sampaikan kehadirat Allah SWT yang telah memberikan rahmat dan hidayah-Nya sehingga penulis dapat menyelesaikan skripsi ini sebagai syarat untuk memperoleh gelar Sarjana Teknologi Informasi, Program Studi S1 Teknologi Informasi Universitas Sumatera Utara.
Ucapan terima kasih penulis sampaikan kepada Bapak Mohammad Fadly Syahputra, B.Sc, M.Sc.IT selaku pembimbing satu dan Ibu Dr. Erna Budhiarti Nababan, M.IT selaku pembimbing dua yang telah banyak meluangkan waktu dan pikirannya, memotivasi dan memberikan kritik dan saran kepada penulis. Ucapan terima kasih juga ditujukan kepada Bapak Dani Gunawan ST.,M.T dan Ibu Sarah Purnamawati ST.,M.Sc yang telah bersedia menjadi dosen pembanding. Ucapan terima kasih juga ditujukan kepada Ketua dan Sekretaris Program Studi Teknologi Informasi, Muhammad Anggia Muchtar, S.T., MM.IT dan Mohammad Fadly Syahputra, B.Sc, M.Sc.IT, Dekan dan Pembantu Dekan Fakultas Ilmu Komputer dan Teknologi Informasi Universitas Sumatera Utara, semua dosen serta pegawai di Program Studi S1 Teknologi Informasi.
iv
ABSTRAK
Perkembangan teknologi internet yang sangat pesat menyebabkan semakin tingginya arus informasi dan semakin meningkatkannya jumlah berita yang terpublikasikan secara online. Teknologi social tagging hadir untuk mempermudah proses pencarian berita online dan pengaturan arsip berita berdasarkan kesamaan informasi tag. Untuk mempermudah pemberian tag, sistem autotag terus dikembangkan. Dalam penelitian ini, sistem autotag dikembangkan menggunakan metode TF-IDF dan Collaborative tagging dimana tahapannya diawali dengan text preprocessing kemudian feature selection dan proses menghitung bobot TF-IDF. Kemudian diterapkan metode
Collaborative tagging yaitu pengukuran kesamaan dengan menghitung persentase kemiripan tag hasil ekstraksi TF-IDF dengan tag -tag berita yang telah dipublikasikan sebelumnya. Hasil dari penelitian ini menunjukkan bahwa metode TF-IDF dapat digunakan untuk memberikan rekomendasi tag secara otomatis dengan relevansi tag
terhadap isi berita yaitu 79,97% dan 80,6% untuk relevansi rata – rata menggunakan
Collaborative Tagging.
TAG RECOMMENDATIONS ON NEWS ONLINE
USING TF-IDF AND COLLABRORATIVE TAGGING
ABSTRACT
The rapid development of internet technology leads to increase the flow of information and further increase the amount of published news online. Social tagging techonology exists to simplyfy the search process of news online and news archive settings based on tag infomation similarity. To facilitate tagging process, autotag system is developed. In this study, the autotag system is developed by using TF-IDF and Collaborative Tagging where the process begins with text preprocessing until feature selection and the TF-IDF weight calculating process. The Collaborative tagging method is used for measuring the tag similarity by calculating the similarity tag percentage which is the result of TF-IDF extraction with news' tag that has been published beforehand. The result of this study shows that TF-IDF method can be used to provide tag recommendation automatically with the tag relevance of news' content is 79,97% and 80,6% for the average relevance using Collaborative Tagging.
vi
DAFTAR ISI
Hal.
Persetujuan i
Pernyataan ii
Ucapan Terima Kasih iii
Abstrak iv
1.4 Tujuan Penelitian 3
1.5 Manfaat Penelitian 3
1.6 Metode Penelitian 3
1.7 Sistematika Penulisan 4
Bab 2 Landasan Teori 6
2.1 Rekomendasi Tag 6
2.2 Text Mining 7
2.2.1 Pre-Processing 8
2.2.2 Processing 10
2.3 Algoritma Nazief & Adriani 10 2.4 Term Frequency-Invers Document Frequency (TF-IDF) 13
2.5 Collaborative Tagging 15
2.6 Penerapan TF-IDF dan Collaborative Tagging pada Rekomendasi Tag 16 2.7 Teknik Rekomendasi Tag Terdahulu 18
Bab 3 Analisa Dan Perancangan Sistem 23 3.1 Identifikasi Masalah 23 3.2 Data yang Digunakan 24 3.3 Rekomendasi Tag Menggunakan TF-IDF dan Collaborative Tagging 30
3.4 Perancangan Sistem 34
Bab 4 Implementasi dan Pengujian Sistem 58 4.1 Implementasi Sistem 58 4.1.1 Spesifikasi Perangkat Keras dan Lunak yang Digunakan 58 4.1.2 Implementasi Perancangan Antarmuka 58 4.2 Pengujian Kinerja Sistem 65
Bab 5 Kesimpulan dan Saran 87
5.1 Kesimpulan 87
5.2 Saran 87
viii
DAFTAR TABEL
Hal. Tabel 2.1 Tabel kombinasi awalan akhiran tidak diijinkan (Adriani, et al. 2007) 12 Tabel 2.2 Tabel aturan peluruhan kata dasar (Adriani, et al. 2007) 12 Tabel 2.3 Penelitian Sebelumnya 21
Tabel 3.1 Data Testing 24
Tabel 3.2 Data Berita yang Telah Dipublikasikan 25 Tabel 3.3 Tahap Tokenizing 31
Tabel 3.4 Stopword 31
Tabel 3.5 Hasil Tahap Filtering 31
Tabel 3.6 Tahap Stemming 32
DAFTAR GAMBAR
Hal. Gambar 2.1 Representasi Grafik Triplet (u, d, t) (Song et al, 2008) 6 Gambar 2.2 Flow Chart Algoritma Nazief & Adriani (Nazief et al, 1996) 11 Gambar 3.1 General Architecture Rekomendasi tag 30 Gambar 3.2 Input Text Berita pada Kategori Teknologi 30 Gambar 3.3 Use Case Diagram Sistem Rekomendasi Tag 35 Gambar 3.4 Diagram Aktivitas untuk Menampilkan Berita 43 Gambar 3.5 Diagram Aktivitas untuk Memberikan Pesan dan Saran 44 Gambar 3.6 Diagram Aktivitas untuk Sign Up 44 Gambar 3.7 Diagram Aktivitas untuk Manajemen Modul 45 Gambar 3.8 Diagram Aktivitas untuk Memberikan Identitas Web 45 Gambar 3.9 Diagram Aktivitas untuk Manajemen User 46 Gambar 3.10 Diagram Aktivitas untuk Manajemen Template 46 Gambar 3.11 Diagram Aktivitas untuk Menu Utama 47 Gambar 3.12 Diagram Aktivitas untuk Sub Menu 47 Gambar 3.13 Diagram Aktivitas untuk Pengaturan Pesan dan Saran 48 Gambar 3.14 Diagram Aktivitas untuk Kategori Berita 48 Gambar 3.15 Diagram Aktivitas untuk Manajemen Berita 49 Gambar 3.16 Diagram Aktivitas untuk Tag/Label 49 Gambar 3.17 Diagram Aktivitas untuk Kategori Berita 50
Gambar 3.18 Database 51
Gambar 3.19 Struktur Menu Sistem 52 Gambar 3.20 Rancangan Halaman Utama 52 Gambar 3.21 Rancangan Halaman Hubungi Kami 53 Gambar 3.22 Rancangan Halaman Sign up 54 Gambar 3.23 Rancangan Halaman Manajemen User 55 Gambar 3.24 Rancangan Halaman Setting menu Utama 56 Gambar 3.25 Rancangan Halaman Manajemen Isi Berita 56 Gambar 3.26 Rancangan Halaman Manajemen Hubungi Kami 57
Gambar 4.1 Halaman Berita 59
Gambar 4.2 Halaman Hubungi Kami 60 Gambar 4.3 Halaman Sign up 60 Gambar 4.4 Halaman Manajemen User 61 Gambar 4.5 Halaman Menu Utama 61 Gambar 4.6 Halaman Kategori Berita 62
Gambar 4.7 Halaman Berita 62
Gambar 4.8 Halaman Tambah Berita 63
Gambar 4.9 Halaman Tag 64