• Tidak ada hasil yang ditemukan

RANCANG BANGUN SISTEM REKOMENDASI ARTIKEL BERITA MENGGUNAKAN TEKNIK CONTENT-BASED FILTERING DAN TF-IDF TUGAS AKHIR

N/A
N/A
Protected

Academic year: 2022

Membagikan "RANCANG BANGUN SISTEM REKOMENDASI ARTIKEL BERITA MENGGUNAKAN TEKNIK CONTENT-BASED FILTERING DAN TF-IDF TUGAS AKHIR"

Copied!
11
0
0

Teks penuh

(1)

RANCANG BANGUN SISTEM REKOMENDASI ARTIKEL BERITA MENGGUNAKAN

TEKNIK CONTENT-BASED FILTERING DAN TF-IDF

TUGAS AKHIR

Diajukan Sebagai Salah Satu Syarat Untuk Memperoleh Gelar Sarjana Teknik

Michael Wijaya 00000014498

PROGRAM STUDI TEKNIK KOMPUTER FAKULTAS TEKNIK DAN INFORMATIKA UNIVERSITAS MULTIMEDIA NUSANTARA

TANGERANG 2020

(2)

PERNYATAAN TIDAK MELAKUKAN PLAGIAT

Dengan ini saya :

Nama : Michael Wijaya NIM : 00000014498

Fakultas : Teknik dan Informatika Program Studi : Teknik Komputer

menyatakan bahwa tugas akhir yang berjudul “Rancang Bangun Sistem Rekomendasi Artikel Berita Menggunakan Teknik Content-Based Filtering dan TF-IDF” ini adalah karya ilmiah saya sendiri, bukan plagiat dari karya ilmiah yang ditulis oleh orang lain atau lembaga lain, dan semua karya ilmiah orang lain atau lembaga lain yang dirujuk dalam laporan skripsi ini telah disebutkan sumber kutipannya serta dicantumkan di Daftar Acuan.

Jika di kemudian hari terbukti ditemukan kecurangan / penyimpangan, baik dalam pelaksanaan tugas akhir maupun dalam penulisan laporan tugas akhir, saya bersedia menerima konsekuensi dinyatakan TIDAK LULUS untuk mata kuliah Tugas Akhir yang telah saya tempuh.

Tangerang, 15 Juni 2020

(Michael Wijaya)

(3)

HALAMAN PENGESAHAN TUGAS AKHIR

RANCANG BANGUN SISTEM IMAGE RECOGNITION, TEXT PROCESSING, DAN ETL

Oleh

Nama : Michael Wijaya

NIM : 00000014498

Fakultas : Teknik dan Informatika Program Studi : Teknik Komputer

Telah diujikan pada hari Senin, tanggal 22 Juni 2020 dan dinyatakan LULUS dengan susunan Tim Penguji sebagai berikut,

Ketua Sidang Dosen Pembimbing Dosen Penguji

(Dareen K. H., (Nabila H. S., (Aminuddin R., S.Kom., M.Eng.Sc.) S.T., M.T.) S.T., M.Sc.)

Disahkan Oleh,

Ketua Program Studi Teknik Komputer

(Samuel, M.T.I.)

(4)

KATA PENGANTAR

Puji dan syukur kepada Tuhan Yang Maha Esa karena dengan rahmat dan karunia-Nya penulis dapat menyelesaikan laporan kerja magang berjudul “Rancang Bangun Sistem Rekomendasi Artikel Berita Menggunakan Teknik Content-Based Filtering dan TF-IDF”. Laporan ini disusun untuk memenuhi salah satu persyaratan dalam menyelesaikan Program Strata I bagi para Mahasiswa dari Program Studi Teknik Komputer Universitas Multimedia Nusantara.

Terselesaikannya laporan skripsi ini tentunya tidak terlepas dari kerja sama, dukungan, dan bimbingan yang telah diberikan kepada penulis selama menjalankan tugas akhir, maka dari itu penulis mengucapkan terima kasih kepada:

1. Dr. Ninok Leksono, Rektor Universitas Multimedia Nusantara, yang memberi inspirasi bagi penulis untuk berprestasi,

2. Dr. Eng. Niki Prastomo, S.T., M.Sc., Dekan Fakultas Teknik dan Informatika Universitas Multimedia Nusantara,

3. Samuel, M.T.I., Ketua Program Studi Teknik Komputer Universitas Multimedia Nusantara, yang menerima penulis dengan baik untuk berkonsultasi,

4. Nabila Husna Shabrina, S.T., M.T., yang membimbing pembuatan tugas akhir dan yang telah mengajarkan penulis tata cara menulis karya ilmiah dengan benar,

5. Alexander Gunardi, Wilbert Suthradarma, Vincent Kurnia U., Elisa Belinda J., Ishmah Aida S., dan Dennis yang telah mendukung dan memberi semangat serta bantuan dalam menyelesaikan laporan ini,

6. Bapak Sumpono Banuardi Nugroho sebagai Head of IT Digital Subscription PT Kompas Media Nusantara, yang telah membantu dan memberikan semangat,

7. Teman-teman dari PT Kompas Media Nusantara, yang telah membantu dan memberikan semangat, dan

8. Semua pihak yang tidak dapat disebutkan satu per satu yang telah banyak membantu segala kesulitan yang penulis alami selama pembuatan laporan ini sehingga dapat terselesaikan tepat waktu.

(5)

Penulis juga mengucapkan terima kasih kepada keluarga: ibunda dan ayahanda.

Semoga tugas akhir ini dapat bermanfaat, baik sebagai sumber informasi maupun sumber inspirasi, bagi para pembaca.

Tangerang, 15 Juni 2020

Penulis

(6)

RANCANG BANGUN SISTEM REKOMENDASI ARTIKEL BERITA MENGGUNAKAN TEKNIK CONTENT-BASED

FILTERING DAN TF-IDF ABSTRAK

Dengan berkembangnya industri media dan teknologi internet, mencari artikel berita di internet yang sesuai dan diinginkan memerlukan waktu yang lama.

Hal ini dikarenakan banyaknya berita yang dipublikasikan dalam waktu singkat, sehingga terjadinya masalah kelebihan informasi atau information overload.

Informasi yang berlebihan menyebabkan kita sulit untuk mencari informasi yang kita inginkan. Paper ini bertujuan untuk mengajukan sistem yang dapat mempermudah pembaca situs Kompas.Id dengan mengatasi masalah information overload. Sistem yang diajukan pada paper ini akan menyaring aliran informasi dengan menggunakan teknik content-based filtering dan algoritma TF-IDF sesuai dengan preferensi pengguna untuk menghasilkan personalized news content untuk merekomendasi berita yang sesuai ke pengguna lain sehingga meningkatkan rasa ingin membaca artikel berita dan hubungan antara pembaca dan redaksi berita.

Kata kunci: Artikel berita, Content-based filtering, Information overload, TF-IDF.

(7)

RANCANG BANGUN SISTEM REKOMENDASI ARTIKEL BERITA MENGGUNAKAN TEKNIK CONTENT-BASED

FILTERING DAN TF-IDF ABSTRACT

With the development of the media industry and internet technology, searching for a desired and specific news article takes a long time. This is due to the increasing amount of news information published in a short amount of time, therefore caused a problem called information overload. Information overload makes it difficult for us to find information that we want. This paper aims to propose a system that can facilitate users of Kompas.Id website by overcoming the problem of infomation overload. The system proposed in this paper will filter the flow of information using TF-IDF and content-based filtering techniques according to user preferences to produce personalized news content to recommend appropriate news to users thereby increasing the desire to read news article and the relationship between the readers and the news editor.

Keywords: News article, Content-based filtering, Information overload, TF-IDF.

(8)

DAFTAR ISI

PERNYATAAN TIDAK MELAKUKAN PLAGIAT ... ii

HALAMAN PERSETUJUAN ... iii

HALAMAN PENGESAHAN TUGAS AKHIR ... iv

KATA PENGANTAR ... v

ABSTRAK ... vii

ABSTRACT ... viii

DAFTAR ISI ... ix

DAFTAR TABEL ... xi

DAFTAR GAMBAR ... xii

BAB I PENDAHULUAN ... 1

1.1 Latar Belakang ... 1

1.2 Identifikasi Masalah ... 3

1.3 Batasan Penelitian ... 3

1.4 Tujuan Penelitian ... 4

1.5 Manfaat Penelitian ... 4

BAB II TINJAUAN PUSTAKA ... 5

2.1 Penilitian Terkait ... 5

2.2 Content-Based Filtering (CBF) ... 6

2.3 Term Frequency-Inverse Document Frequency (TF-IDF) ... 7

2.4 Cosine Similarity ... 8

BAB III ANALISIS DAN PERANCANGAN SISTEM ... 9

3.1 Metodologi Penelitian ... 9

3.2 Perancangan Sistem ... 10

3.2.1 Data Preparation ... 11

3.2.2 Data Cleansing ... 12

3.2.3 Content-Based Filtering (CBF) ... 14

3.2.4 TF-IDF ... 16

3.2.5 Cosine Similarity... 17

3.2.6 Top N Recommendation ... 17

BAB IV IMPLEMENTASI DAN PENGUJIAN SISTEM ... 18

4.1 Spesifikasi Sistem ... 18

(9)

4.1.1 Spesifikasi Software ... 18

4.1.2 Spesifikasi Hardware ... 18

4.2 Implementasi Sistem ... 18

4.3 Skenario Pengujian ... 22

4.4 Metrik Pengujian ... 23

4.5 Hasil ... 24

BAB V SIMPULAN DAN SARAN ... 32

5.1 Simpulan ... 32

5.2 Saran ... 33

DAFTAR PUSTAKA ... 34

LAMPIRAN ... 36

DAFTAR RIWAYAT HIDUP ... 38

(10)

DAFTAR TABEL

Tabel 4.1 Skor precision@k, recall@k, dan F1 Top 5 Recommendation

menggunakan dataset Kompas.id ... 24 Tabel 4.2 Skor precision@k, recall@k, dan F1 Top 10 Recommendation

menggunakan dataset Kompas.id ... 25 Tabel 4.3 Skor precision@k, recall@k, dan F1 Top 5 Recommendation

menggunakan Microsoft News Dataset ... 25 Tabel 4.4 Skor precision@k, recall@k, dan F1 Top 10 Recommendation

menggunakan Microsoft News Dataset ... 26

(11)

DAFTAR GAMBAR

Gambar 3.1 Flowchart Sistem ... 11

Gambar 3.2 Contoh data yang digunakan ... 12

Gambar 3.3 Scroll depth yang telah diubah menjadi rating ... 13

Gambar 3.4 Token stopwords ... 15

Gambar 3.5 Flowchart CBF ... 16

Gambar 4.1 Library yang digunakan ... 19

Gambar 4.2 Pseudo code untuk membaca file CSV dengan pandas ... 19

Gambar 4.3 Pseudo code untuk stopword, stemming, dan scroll depth ... 20

Gambar 4.4 Pseudo code untuk menyusun data... 21

Gambar 4.5 Pseudo code TF-IDF, user rating, dan cosine similarity ... 21

Gambar 4.6 Pseudo code untuk menampilkan hasil rekomendasi ... 22

Gambar 4.7 Hasil proses tokenizing ... 26

Gambar 4.8 Hasil TF-IDF ... 27

Gambar 4.9 Vector TF-IDF ... 28

Gambar 4.10 Vector TF-IDF yang telah dikalikan rating pengguna ... 29

Gambar 4.11 Hasil cosine similarity ... 30

Gambar 4.12 Hasil Top 5 Recommendation ... 30

Gambar 4.13 Hasil Top 10 Recommendation ... 31

Referensi

Dokumen terkait

Tugas Akhir berjudul “Rancang Bangun Alat Pencekam Benda Kerja Semi-Otomatis Mesin Pilin”, telah disetujui oleh Pembimbing dan diterima untuk memenuhi

Tugas Akhir yang berjudul “ Rancang Bangun Sistem Kontrol Roboviscometer Berbasis Microcontroller ”, ini dimaksudkan sebagai salah satu syarat untuk penyelesaian studi pada

Puji Syukur kepada Tuhan Yang Maha Esa atas keanugrahan inspirasiNya yang telah menjadi kekuatan dalam pembuatan laporan skripsi yang berjudul “Rancang Bangun Aplikasi

Menyatakan bahwa laporan skripsi yang berjudul “Rancang Bangun Sistem Rekomendasi Motor Custom Klasik Menggunakan Metode Fuzzy Topsis” ini adalah karya ilmiah saya

menyatakan bahwa Skripsi yang berjudul “Rancang Bangun Sistem Rekomendasi Pemilihan Sepatu Bola Untuk Pemain Dengan Metode Weighted Product” ini adalah karya ilmiah

Selanjutnya dokumen yang telah melalui tahapan preprocessing, dilakukan perhitungan menggunakan pembobotan TF-IDF, kemudian setelah hasilnya didapatkan, maka proses

Segala puji syukur penulis panjatkan kepada Allah SWT berkat rahmat dan hidayahnya penulis dapat menyelesaikan tugas akhir yang berjudul “RANCANG BANGUN PROTOTYPE SMART LUGGAGE

Laporan tugas akhir yang berjudul “Rancang Bangun Sistem Rekomendasi Resep Masakan Khas Indonesia Menggunakan Metode Collaboration Collective Intelligence dan Slope One” yang