FILTERING PADA RECOMMENDER SSYSTEM STUDI KASUS PADA DATA MOVIELENS
Edittyo Prasojo¹, Warih Maharani², Yanuar Firdaus A.w.³
¹Teknik Informatika, Fakultas Teknik Informatika, Universitas Telkom
Abstrak
Recommender system merupakan sebuah sistem yang dapat digunakan untuk memprediksi sebuah items berdasarkan informasi yang diperoleh dari user, sehingga didapatkan rekomendasi berdasarkan profil penggunanya. Collaborative filtering merupakan teknik yang umum digunakan dalam recommender system akan tetapi hanya sedikit yang membahas tentang concept drift.
Recent rating dari user lebih mencerminkan preferensi yang akan datang dibandingkan data rating yang lama
Tugas akhir ini menganalisis akurasi prediksi rating yang dihasilkan oleh recommender system setelah diimplementasikan algoritma recency-based collaborative filtering yang menggunakan pembobotan berdasarkan recent rating. Data yang digunakan adalah data set movielens.
Parameter yang digunakan dalam analisis adalah parameter Alpha dan jumlah neighborhood.
Selain itu, tugas akhir ini juga menganalisis kesesuaian hasil rekomendasi dengan genre dari items yang direkomendasikan.
Akurasi prediksi yang dihasilkan oleh algoritma recency-based collaborative filtering lebih besar dibandingkan dengan classic collaborative filtering. Performansi terbaik terjadi saat jumlah neighborhood sama dengan jumlah kecenderungan user dalam merating items. Hasil
rekomendasi pada algoritma recency-based collaborative filtering pada recommender system menunjukkan ketidaksesuaian antara genre items hasil rekomendasi dengan genre items yang telah diberi rating oleh active user.
Kata Kunci : recommender system, collaborative filtering, concept drift, recent
Abstract
Recommender System is a system that can be used to predict items-based on information
obtained from users. Collaborative filtering is a common technique used in recommender system, but few of it are discussing about the concept drift. Recent rating reflect user preferences more than older rating.
This final task analyzing the prediction ratings generated by the recommender system was implemented recency-based collaborative filtering using a weighting based on the recent rating.
Data is used data from movielens. The parameter used in analysis is alpha and number of neighborhood. In addition, this final task is to analyze the suitability of recommendations to genre of the recommended items.
Accuracy of prediction algorithms generated by the recency-based collaborative filtering larger than the classic collaborative filtering. The best performance occurs when the number of
neighborhood equal with the number of trends in user rate the items. Result of recommendations with recency algorithmbased collaborative filtering in recommender systems showed a
discrepancy between the recommended items genres with genres items that have been rated by the active user.
Keywords : recommender system, collaborative filtering, concept drift, recent
Powered by TCPDF (www.tcpdf.org)
Fakultas Teknik Informatika Program Studi S1 Teknik Informatika
1
BAB I 1. Pendahuluan
1.1 Latar belakang
Perkembangan Internet yang sangat cepat akhir-akhir ini menimbulkan fenomena penerimaan informasi yang berlebih oleh pengguna atau lebih dikenal dengan information overload. Dalam dekade ini banyak riset yang berkonsentrasi dalam membangun atau menentukan teknik yang optimal untuk menghasilkan rekomendasi yang akurat pada domain dengan puluhan ribu produk (seperti film, buku atau musik) dan jumlah pengguna/pelanggan yang banyak. Recommender system merupakan sebuah sistem yang dapat digunakan untuk memprediksi sebuah items berdasarkan informasi yang diperoleh dari user sehingga didapatkan rekomendasi berdasarkan profil penggunanya[10]. Collaborative filtering merupakan algoritma yang telah banyak digunakan dalam melakukan proses filtering[12].
Banyak teknik yang telah di teliti dalam collaborative filtering. Secara umum dapat dikategorikan menjadi 2 yaitu memory-based algorithms dan model- based algorithm. Dalam Memory-based algorithms, prediksi dan rekomendasi dihasilkan dengan mencari kesamaan pada matriks user items. Dalam Model- based algorithm, prediksi dan rekomendasi dihasilkan dengan membuat sebuah model yang berisi rating dari user.[5]
Banyak penelitian tentang collaborative filtering yang tidak memperhatikan masalah concept drift. Berdasarkan penelitian yang sudah ada, concept drift mempengaruhi hasil prediksi pilihan user selanjutnya[3]. Concept drift berarti bahwa pilihan user yang akan kita prediksi selalu berubah dan perubahan itu tidak dapat diperkirakan, karena ketertarikan user terhadap sesuatu tidak bersifat permanen dan dapat berubah seiring waktu[9]. Misalnya seorang pria sebelumnya menyukai film bergenre drama sehingga dia memberikan rating tinggi pada film bergenre drama. Akan tetapi beberapa waktu kemudian dia berubah dengan memberikan rating yang rendah pada film bergenre drama.
Actual rating dari user mencerminkan preferensi user pada saat itu[3].
Dalam tugas akhir ini penulis mengimplementasikan dan menganalisis recommender system dengan recency-based collaborative filtering algorithms.
Metode ini dapat menangani masalah concept drift dan merupakan pengembangan dari items-based collaborative filtering. Dalam metode ini dibangun sebuah metode similarity baru yang lebih mencerminkan kenyataan. Untuk mengatasi masalah concept drift, metode ini menggunakan pembobotan yang didasarkan pada akurasi dari items yang lain dengan mengasumsikan bahwa rating terbaru di semua peringkat tetangga terdekat mewakili tren saat ini dan yang mewakili pilihan masa depan. Diharapkan dengan menggunakan algoritma tersebut dapat meningkatkan ketepatan prediksi dibandingkan dengan menggunakan traditional collaborative filtering.
Fakultas Teknik Informatika Program Studi S1 Teknik Informatika
2
1.2 Perumusan masalah
Dalam pengerjaan Tugas Akhir ini, ada beberapa rumusan masalah yang ingin diselesaikan, yaitu:
1. Bagaimana menerapkan metode Recency-Based Collaborative Filtering pada Recommender System.
2. Bagaimana pengaruh concept drift antara proses pembobotan berdasarkan recent rating dengan yang tidak menggunakan proses pembobotan pada metode Recency-Based Collaborative Filtering terhadap ketepatan menentukan prediksi rating berdasarkan training user size.
3. Bagaimana pengaruh parameter α pada Recency-Based Collaborative System terhadap ketepatan prediksi rating yang dihasilkan berdasarkan training user size.
4. Bagaimana hasil rekomendasi yang dihasilkan menggunakan Recency-Based Collaborative System.
5. Bagaimana membandingkan Recency-Based Collaborative System dengan Classic Collaborative System terhadap kualitas rekomendasi yang dihasilkan berdasarkan training user size.
Adapun batasan masalah tugas akhir ini adalah sebagai berikut :
1. Metode yang digunakan dalam penentuan rekomendasi adalah metode Recency-Based Collaborative Filtering.
2. Dataset yang direkomendasikan adalah dataset film yang berasal dari MovieLens.org.
3. Items yang dijadikan objek rekomendasi adalah items yang telah dirating oleh user.
4. Content yang digunakan adalah genre items.
1.3 Tujuan
Tujuan yang ingin dicapai dari Tugas Akhir ini yaitu :
1. Mengimplementasikan metode Recency-Based Collaborative Filtering pada Recommender System.
2. Menganalisis pengaruh concept drift antara proses pembobotan berdasarkan recent rating dengan yang tidak menggunakan proses pembobotan pada metode Recency-Based Collaborative Filtering terhadap ketepatan menentukan prediksi rating berdasarkan training user size menggunakan Mean Absolute Error(MAE).
3. Menganalisis pengaruh parameter α pada Recency-Based Collaborative System terhadap ketepatan prediksi rating yang dihasilkan berdasarkan training user size.
4. Menganalisis hasil rekomendasi yang dihasilkan menggunakan Recency-Based Collaborative System
5. Membandingkan dan menganalisis Recency-Based Collaborative Filtering dengan Classic Collaborative System terhadap kualitas rekomendasi yang dihasilkan berdasarkan training user size, jumlah neighborhood, dan parameter α menggunakan Mean Absolute Erorr (MAE).
Fakultas Teknik Informatika Program Studi S1 Teknik Informatika
3
1.4 Metodologi penyelesaian masalah
Metodologi yang digunakan dalam memecahkan masalah di atas adalah dengan menggunakan langkah-langkah berikut:
1. Studi Literatur
Pencarian referensi dan sumber-sumber yang berhubungan dengan Recommender System, Collaborative Filtering, Concept Drift dan metode Recency-Based Collaborative Filtering dalam menyelesaikan tugas akhir ini.
2. Pengumpulan data
Mengumpulkan data-data items yang diperlukan sebagai training set dan test set.
3. Analisis dan Perancangan Perangkat Lunak
Melakukan analisis dan perancangan terhadap perangkat yang akan dibangun, menganalisis metode yang akan digunakan untuk menyelesaikan permasalahan, termasuk menentukan bahasa pemrograman yang digunakan, arsitektur, fungsionalitas, dan antarmuka sistem.
4. Implementasi dan Pembangunan Perangkat Lunak
Implementasi diawali dengan pembuatan basis data untuk menyimpan data yang berasal dari movielens.org. Lalu dilakukan pembuatan perangkat lunak dengan menerapkan metode Recency-Based Collaborative Filtering.
Metode ini terdiri dari 2 proses utama yaitu menghitung nilai similarity dengan new similarity dan pembobotan yang didasarkan pada akurasi dari items yang lain dengan mengasumsikan bahwa rating terbaru di semua peringkat tetangga terdekat mewakili tren saat ini. Kemudian membuat interface aplikasi untuk memudahkan user dalam mengakses perangkat lunak.
5. Testing & Analisis
Pengujian perangkat lunak dibagi menjadi 2 macam yaitu :
a. Pengujian terhadap hasil rekomendasi yang dihasilkan dengan Recency- Based Collaborative Filtering berdasarkan genre items.
b. Pengujian ketepatan hasil prediksi rating dengan Recency-Based Collaborative Filtering dibandingkan dengan Classic Items Based Algoritm berdasarkan training user size, dan parameter α.
Setelah itu dilakukan analisis terhadap perbandingan nilai MAE yang diperoleh berdasarkan pengujian.
6. Pengambilan Kesimpulan dan penyusunan laporan Tugas Akhir.
Menyusun laporan tertulis berdasarkan hasil penelitian yang dilakukan dan memberikan kesimpulan mengenai hasil dari penelitian yang dilakukan, pemberian saran untuk pengembangan perangkat lunak yang dibangun ke depannya.
Powered by TCPDF (www.tcpdf.org)
Fakultas Teknik Informatika Program Studi S1 Teknik Informatika
39
BAB V
5. Penutup
Pada bab ini disimpulkan hasil pengerjaan Tugas Akhir ini dan beberapa saran yang dapat mengembangkan Tugas Akhir ini.
5.1 Kesimpulan
Berdasarkan hasil uji coba dan analisis yang telah dilakukan, maka dapat diambil kesimpulan sebagai berikut:
1. Hasil prediksi rating dengan menggunakan pembobotan berdasarkan recent rating lebih baik dibandingkan dengan tanpa pembobotan karena recent rating dari active user lebih mencerminkan tren terkini dari user.
2. Semakin besar nilai variable alpha, maka ketepatan prediksi rating semakin baik. Karena jika nilai alpha semakin besar, maka semakin besar juga nilai pembobotan yang digunakan dalam perhitungan nilai prediksi. Sedangkan, jika nilai Alpha = 0 maka nilai pembobotan adalah 1, sehingga perhitungan prediksi rating hanya dipengaruhi oleh nilai similarity
3. Ketepatan prediksi rating menggunakan recency-based collaborative filtering lebih baik dibandingkan dengan menggunakan Classic items-based collaborative filtering. Hal ini disebabkan karena pada recency-based collaborative filtering menggunakan pembobotan berdasarkan recent rating.
4. Performansi terbaik terjadi saat jumlah neighborhood sama dengan jumlah kecenderungan user dalam merating items.
5. Algoritma recency-based collaborative filtering bagus digunakan ketika banyak user merating items yang sama dan memiliki pola rating yang sama.
6. Kelebihan recency-based collaborative filtering dapat menangani masalah concept-drift, sedangkan kekurangannya adalah tidak dapat memprediksi items baru.
5.2 Saran
Setelah tugas akhir ini selesai dilakukan dan telah dilakukan analisis, penulis memiliki beberapa saran sebagai berikut:
1. Untuk menghasilkan rekomendasi yang sesuai dengan dengan genre atau konten dari items yang direkomendasikan, sebaiknya menggunakan pendekatan content-based filtering.
2. Dapat dikembangkan dengan menggunakan teknik similarity lainnya.
Powered by TCPDF (www.tcpdf.org)
Fakultas Teknik Informatika Program Studi S1 Teknik Informatika
40
Referensi
[1] Ding, Yi., Li, Xue., Orlowska, E. Recency-based collaborative filtering.
Diunduh pada : http://crpit.com/confpapers/CRPITV49Ding.pdf.
30 Agustus 2009
[2] Ding, Yi., Li, Xue., Time Weight Collaborative Filtering. 2005. Diunduh pada : http://portal.acm.org/citation.cfm?id=1099689. 25 Desember 2009
[3] Fan, W, . Systematic Data Selection To Mine Concept-Drifting Data
Streams. 2004. Diunduh pada :
www.weifan.info/PPT/ICDM04stream.ppt. 26 Desember 2009 [4] Gipp, B., Beel, J., Hentschel, C. A research paper recommendation
system. Diunduh pada: http://www.sciplore.org/publications/2009 Scienstein__A_Research_Paper_Recommender_System.pdf. 30 Agustus 2009
[5] Jin, R., Sie, L., A Study Methods For Normalizing User Ratings In Collaborative Filtering. 2004. Diunduh pada : http://www- 2.cs.cmu.edu/~lsi/sigir04-cf-norm.pdf 25 Desember 2009
[6] Koychev, Ivan., Schwab, Ingo. Adaptation to Drifting User's Interests.
Diunduh pada :
http://www.math.bas.bg/~koychev/papers/ECML2000_WMLNIA.
pdf 30 Agustus 2009
[7] Maharani, W., Yanuar, Firdaus. Analisis Semantic Similarity Pada Items Based Recommender System. Diunduh pada : http://journal.uii.ac.id/index.php/Snati/article/view/551/475. 30 Agustus 2009
[8] Purwanto, Ari. Metode analisis rekomendasi pada system rekomendasi.
Diunduh pada :
http://aripurwanto.blog.upi.edu/files/2009/07/ilmiah.pdf. 30 Agustus 2009
[9] Sarwar, B., Karypis,G., Konstan, J., Riedl, J. Items-based Collaborative Filtering Recommendation Algorithm. 2001. Diunduh pada:
http://www.grouplens.org/papers/pdf/www10_sarwar.pdf, 29 Agustus2009.
[10] Terveen, L., McMackin, J., Amento, B., dan Hill, W. Specifying Preferences Based On User History. 2002. Diunduh pada
Fakultas Teknik Informatika Program Studi S1 Teknik Informatika
41
:http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.5.7872
&rep=rep1&type=pdf. 26 Desember 2009
[11] Vozalis, E., Margaritis, K. Analysis Recommender System Algorithms.
Diunduh pada : http://users.uom.gr/~mans/papiria/hercma2003.pdf.
25 Desember 2009
[12] W. Cohen, William. Collaborative Filtering: A Tutorial. Diunduh pada : http://www-2.cs.cmu.edu/~wcohen/collab-filtering-tutorial.ppt 30 Agustus 2009
Powered by TCPDF (www.tcpdf.org)
Fakultas Teknik Informatika Program Studi S1 Teknik Informatika