ANALISIS DAN IMPLEMENTASI ASSOCIATION RULE MINING PADA COLLABORATION RECOMMENDER SYSTEM MENGGUNAKAN ALGORITMA
ASSOCIATION RULES FOR RECOMMENDER SYSTEM (AR-CRS)
Royes Otpin S¹, Arie Ardiyanti Suryani², Warih Maharani³
¹Teknik Informatika, Fakultas Teknik Informatika, Universitas Telkom
Abstrak
Ada banyak informasi yang bisa diolah dalam satu kumpulan data. Association rule mining merupakan salah satu cara untuk mencari informasi dari kumpulan data tersebut. Association rule mining yang umumnya digunakan dalam analisis keranjang belanja ternyata bisa
diaplikasikan dalam area recommender system. Recommender system merupakan sebuah aplikasi yang merekomendasikan beberapa item yang mungkin sesuai dengan karakteristik pengguna. Sistem ini telah dipakai luas dalam bidang komersil saat ini.
Tugas akhir ini mencoba melakukan analisis terhadap implementasi association rule mining pada recommender system dengan mengambil data EachMovie sebagai data uji. Hasil pengujian menunjukkan performansi parameter precision yang cukup baik jika rule yang digunakan adalah rule dengan 2-antecedent, sedangkan parameter performansi recall sangat baik jika rekomendasi menggunakan 1-antecedent.
Kata Kunci : association rule mining, recommender system, Recall, Precision, FMeasure
Abstract
There are many information that can be processed in a data collection. Association rule mining is one of the method used for discovering hiding information of data. Association rule mining which commonly used in market basket analysis actually can be implemented in recommender system area. Recommender system is an engine which recommends items that users may like and match to their profile. This application has been widely used in commercial site nowadays.
This project try to analyse implementation of association rule mining in recommender system and using EachMovie dataset as a data testing. Testing result shows good precision when
recommendation process use 2-antecedent rules, but recall will have good results when using 1-antecedent rules.
Keywords : association rule mining, recommender system, Recall, Precision,
Powered by TCPDF (www.tcpdf.org)
1
1. Pendahuluan
1.1 Latar Belakang Masalah
Di dalam sekumpulan data banyak informasi yang bisa diperoleh. Informasi yang didapat mungkin saja membentuk satu pola yang bisa digunakan untuk keperluan tertentu, misalnya prediksi dan rekomendasi. Metode yang digunakan juga bisa bermacam-macam, misalnya pada area data mining metode klasifikasi, clustering, dan asosiasi sudah sangat sering digunakan untuk keperluan penggalian informasi dari satu kumpulan dataset. Aplikasi-aplikasi seperti search engine dan recommender system adalah sedikit dari sekian banyak aplikasi untuk keperluan tersebut di atas. Pada tugas akhir ini akan diimplementasikan sebuah recommender system yang menghasilkan rekomendasi kepada satu target user.
Recommender system bisa diimplementasikan melalui dua pendekatan,
yaitu pendekatan content-based recommendation dan collaborative
recommendation. Content-based recommendation memberikan rekomendasi
kepada sorang user sesuai sifat objek yang diinginkan user itu sendiri, sedangkan pendekatan collaborative recommendation memberikan rekomendasi kepada seorang user berdasarkan kesamaan sifat dengan user lain. Kedua pendekatan ini memiliki kelebihan masing-masing. Namun, pendekatan collaborative
recommendation lebih umum dipakai karena lebih efisien, tidak membutuhkan
pengetahuan awal tentang sifat-sifat item yang ingin dicari[3]. Beberapa algoritma yang sering dipakai pada recommender system misalnya Neural Network, Bayesian, dan algoritma Genetika[11]. Ketiga algoritma di atas kurang efektif jika diterapkan pada data yang sangat besar. Oleh karena itu pada tugas akhir ini akan digunakan algoritma Association Rule yang lebih sederhana dan bisa menangani data yang besar.
Kendala yang sering ditemukan dalam sistem rekomendasi berbasis
association rule collaborative filtering adalah sulitnya menemukan pola yang baik
untuk keperluan rekomendasi. Oleh karena itu perlu diterapkan penanganan yang tepat untuk proses pencarian rule. Sebagai solusi akan digunakan algoritma Assosiation Rule for Collaboration Recommender system (AR-CRS) yang mengadaptasi prinsip-prinsip Apriori pada data mining untuk mencari pola data. Algoritma ini memiliki kelebihan karena efisien jika diterapkan dalam data dengan jumlah besar, system hanya perlu mencari association antar user untuk keperluan rekomendasi[10]. Pencarian rule juga akan semakin cepat karena metode ini hanya mencari rule yang sesuai dengan satu target user.
1.2 Perumusan Masalah
Berdasarkan uraian diatas maka permasalahan yang muncul dan yang menjadi objek penelitian pada Tugas Akhir ini :
1. Bagaimana mengimplementasikan association rule mining pada collaboration
recommender system menggunakan algoritma AR-CRS.
2. Bagaimana menganalisis performansi algoritma AR-CRS dengan menghitung
Recall, Precision, dan FMeasure.
2
Batasan masalah pada Tugas Akhir ini :
1. Data yang digunakan adalah data set EachMovie yang bisa didapat di http://www.research.digital.com/SRC/eachmovie.
2. Item yang dijadikan objek rekomendasi adalah film dan user yang terdapat dalam dataset.
1.3 Tujuan
Tujuan dari penulisan Tugas Akhir ini adalah :
1. Mengimplementasikan association rule mining pada collaboration
recommender system menggunakan algoritma AR-CRS.
2. Menganalisis performansi AR-CRS pada collaboration recommender system dengan mengamati Recall, Precision, dan FMeasure.
1.4 Metodologi Penyelesaian Masalah
Metodologi yang digunakan untuk menyelesaikan masalah dalam Tugas Akhir ini adalah :
1. Studi Literatur
Studi literatur dari beberapa buku, jurnal, artikel yang membahas tentang
association rule, recommender system, collaboration filtering dan algoritma
AR-CRS.
2. Perancangan Sistem dan Implementasi sistem
Merancang sistem dan mengimplementasikannya dengan bahasa pemrograman Java berdasarkan hasil analisis yang didokumentasikan dalam suatu spesifikasi.
3. Analisis dan Pengujian
Melakukan pengujian terhadap sistem yang telah dibangun dengan menggunakan data set yang ada serta melakukan analisis terhadap performansi sistem tersebut.
4. Penyusunan Laporan
Hasil penelitian akan disusun menjadi suatu laporan yang meliputi aspek-aspek dalam penelitian yaitu teori, perancangan dan implementasinya.
Powered by TCPDF (www.tcpdf.org)
38
5. Kesimpulan dan Saran
5.1 Kesimpulan
1. Algoritma association rule pada data mining bisa diterapkan dalam area
recommender system dengan performansi yang baik. Algoritma AR-CRS
memungkinkan target user memperoleh rekomendasi berdasarkan user collaborative yang didapat dari association rule.
2. Nilai performansi Recall, Precision, dan FMeasure sangat ditentukan oleh besarnya nilai minimum transaksi dan minimum confidence karena kedua parameter ini menentukan berapa banyak rule yang bisa dihasilkan. Dari percobaan untuk dataset EachMovie diketahui bahwa hasil terbaik didapat pada range minimum transaksi 15-20 dan minimum confidence 30%-40% 3. Rule dengan 2 antecedent menghasilkan precision yang lebih baik
daripada rule yang hanya memiliki 1 antecedent. Ini disebabkan krena rekomendasi yang diberikan didukung oleh 2 collaborative user secara bersamaan. Sebaliknya recall yang dihasilkan rekomendasi rule 2-antecedent lebih kecil dari rekomendasi dengan 1-2-antecedent.
5.2 Saran
1. Melakukan metode fold cross validation dalam melakukan testing.
2. Untuk mengoptimalkan kecepatan proses, penggunaan database dinamis (struktur data tree) bisa dipertimbangkan.
3. Menggabungkan algoritma association rule dengan algoritma item based collaborative filtering, misalnya dengan memeriksa genre film (horror,action,drama, dan lain-lain).
4. Melakukan pengujian pada dataset yang lain.
Powered by TCPDF (www.tcpdf.org)
39
6. Daftar Pustaka
1. Agrawal, Rakesh and Ramakrishnan Srikant. Fast algorithms for mining
association rules. In Proc. of the 20th VLDB Conference, pages 487–499.
Santiago,Chile. 1994.
2. Agrawal, Rakesh, Tomasz Imielinski, and Arun Swami. Mining association
rules between sets of items in large database. In Proc. Of the ACM SIGMOD
Conference on Management of Data, pages 207-216. Washington, D.C. May 1993.
3. Balabanovic, Marko and Yoav Shoham. Fab: Content-based, collaborative
recommendation. Communications of the ACM, 40(3):66-72. March 1997.
4. Billsus, Daniel and Michael J. Pazzani. Learning collaborative information
filters. In Proc. Of the Fifteenth International Conference on Machine
Learning. Morgan Kaufmann Publishers. Madison, Wisconsin. 1998. 5. Collaborative filtering
http://www.en.wikipedia.org/wiki/Collaborative_filtering.htm. Akses : 20 Maret 2008.
6. Dharmantoro, Dhinta. Data Mining Course at STT Telkom. Institute Teknologi Telkom. Februari 2006.
7. Gunawan. Kuliah #7: Association rule mining (bagian 1). Jurusan Teknik Informatika, Sekolah Tinggi Teknik Surabaya.
8. Jorge, Alipio. Recommendation with Association Rules: A Web Mining
Aplication. Laboratório de Inteligência Artificial e Ciência de Computadores.
2002.
9. Kusrini. M Kom. Konsep dan Aplikasi Sistem Pendukung Keputusan. Penerbit Andi. 2007
10. Lin, Weiyang. Association Rule Mining for Collaborative Recommender
Systems. Worcester Polytechnic Institute. May 2000.
11. Liu, Bing, Wynne Hsu, and Yiming Ma. Integrating classification and
association rule mining. In Proceedings of the Fourth International
Conference on Knowledge Discovery and Data mining, pages 80-86. New York. August 1998.
12. McJones, P. Eachmovie collaborative filtering data set.
http://ww.research.digital.com/SRC/eachmovie. DEC Systems Research
Center. 1997.
13. Recommendation system
http://www.en.wikipedia.org/wiki/Recommendation_system.htm. Akses : 20 Maret 2008.
14. Resnick P., N. Iacovou, M. Scuchak, P. Bergstrom, and J. Riedl. Grouplens:
an open architecture for collaborative filtering of netnews. In Proceedings of
the Conference on Computer Supported Cooperative Work (CSCW94), pages 175-186. 1994.
15. Sarwar, B., Karypis, G., Konstan, J., and Riedl, J. Analysis of recommendation
algorithms for e-commerce. In Proceedings of ACM E-Commerce, 2000.
16. Satrya, Erwin Nugraha. Implementasi dan Analisis Semantic Similarity pada
Recommender System berbasis Item-based Collaborative Filtering. Tugas akhir pada Intitut Teknologi Telkom. 2008
40
17. Putra, Dedy Simangunsong. Pengelompokan Data Trafik Internet
Berdasarkan Layer Transport dengan Teknik Clustering. Tugas Akhir pada
Intitute Teknologi Telkom. 2009
Powered by TCPDF (www.tcpdf.org)