• Tidak ada hasil yang ditemukan

Aplikasi Rekomendasi Film menggunakan Pendekatan Collaborative Filtering dan Euclidean Distance sebagai ukuran kemiripan rating

N/A
N/A
Protected

Academic year: 2021

Membagikan "Aplikasi Rekomendasi Film menggunakan Pendekatan Collaborative Filtering dan Euclidean Distance sebagai ukuran kemiripan rating"

Copied!
6
0
0

Teks penuh

(1)

Aplikasi Rekomendasi Film menggunakan Pendekatan Collaborative Filtering dan

Euclidean Distance sebagai ukuran kemiripan rating

Syandra Sari*), Defry Tri Hendra**) Teknik Informatika, Universitas Trisakti

E-Mail: *syandra_sari@trisakti.ac.id, **defrytrihendra@gmail.com Abstrak

Film telah menjadi salah satu hiburan favorit utama masyarakat. Film terbagi atas berbagai macam genre. Jumlah film pertahun yang terhitung mencapai ribuan mengundang kesulitan dalam memilih film yang sesuai dengan kriteria penggemar film. Salah satu solusi dari permasalahan ini adalah sistem rekomendasi yang memanfaatkan opini atau rating orang lain terhadap suatu film. Collaborative Filtering adalah salah satu pendekatan untuk sistem rekomendasi yang mengevaluasi item menggunakan opini orang lain. Euclidean distance digunakan dalam pendekatan ini untuk menghitung kemiripan dan nilai rekomendasi berdasarkan rating yang di berikan oleh penggemar film lain. Hasil evaluasi aplikasi menunjukkan rekomendasi dengan pendekatan ini dapat memberikan rekomendasi sesuai dengan keinginan seorang penggemar film dengan nilai Kendall Rank Correlation Coefficient sebesar 0,66 .

Kata kunci: sistem rekomendasi, collaborative filtering, euclidean distance.

1. PENDAHULUAN

Pada masa sekarang ini internet telah menjadi sumber informasi dan tempat untuk penjualan barang-barang secara online (e-commerce). Jumlah Informasi yang berlimpah di Internet menyebabkan para pengguna internet mendapat kesulitan bagaimana memilih informasi yang didapat sehingga sesuai dengan kebutuhannya. Salah satu solusi untuk hal tersebut adalah penggunaan sistem rekomendasi [1]. Begitu juga pada penjualan barang secara online (e-commerce), konsumen mendapat informasi yang sangat banyak tentang barang-barang yang dapat dibeli. Pemilihan barang mana yang tepat dan sesuai dengan kebutuhan konsumen menjadi hal yang sulit. Untuk membantu konsumen dalam memilih barang mana yang akan dibeli maka situs-situs penjualan online telah menggunakan sistem rekomendasi. Produk atau barang direkomendasikan berdasarkan penjualan yang terbanyak, demografi pelanggan atau berdasarkan analisis perilaku pembelian yang telah dilakukan konsumen sebelumnya [2]. Sistem rekomendasi yang bersifat khusus/pribadi ini akan memberikan kenyamanan pada konsumen, daftar produk atau jasa yang menarik bagi konsumen tersedia dengan cepat dan mudah dilihat. Berbagai teknologi rekomendasi telah dikembangkan dan diterapkan, seperti Collaborative filtering

[3], Content-based filtering [4], proses data mining [5], dan model Bayesian [6].

Pada paper ini akan dijelaskan penelitian kami tentang sistem rekomendasi untuk toko film online dengan menggunakan pendekatan collaborative filtering dan euclidean distance sebagai ukuran kemiripan rating para pelanggan toko. Bagian kedua dari paper ini berisi tinjauan pustaka yang berhubungan dengan penelitian ini, bagian ketiga berisi metoda perhitungan rekomendasi, bagian keempat berisi hasil dan analisanya. Kesimpulan pada bagian kelima sebagai penutup.

2. TINJAUAN PUSTAKA

Pada bagian ini akan dijelaskan tinjauan pustaka yang berhubungan dengan penelitian ini yaitu sistem rekomendasi, collaborative filtering dan euclidean distance.

2.1. Sistem Rekomendasi (Recommender System)

Sistem Rekomendasi adalah perangkat lunak dan teknik-teknik yang memberikan rekomendasi atau saran tentang item (barang) yang akan berguna untuk konsumen atau pelanggan [7][8]. Saran tersebut biasanya berkaitan dengan proses penentuan keputusan seperti barang apa yang akan dibeli, musik apa yang akan didengar atau berita apa yang akan dibaca dll. Sebagai contoh sistem rekomendasi untuk pemilihan buku, maka akan membantu

(2)

pelanggan memilih buku yang akan dibaca. Pada situs yang populer seperti Amazon.com, terdapat sistem rekomendasi yang memilihkan buku-buku yang sesuai untuk pelanggan secara personal/pribadi sehingga dengan sistem rekomendasi ini pelanggan yang berbeda akan menerima saran yang berbeda.

Sebagai perbandingan ada juga bentuk rekomendasi yang non personal. Rekomendasi ini jauh lebih sederhana untuk menghasilkannya dan biasanya ditampilkan di majalah atau koran, contohnya sepuluh buku pilihan atau sepuluh novel terlaris dll. Rekomendasi seperti ini tetap berguna dan efektif dalam situasi tertentu.

Rekomendasi personal secara sederhana ditawarkan dalam bentuk sejumlah item terurut (ranking). Untuk menentukan urutan atau ranking tersebut, sistem rekomendasi akan melakukan prediksi berdasarkan preferensi pelanggan tersebut dan juga preferensi pelanggan lain, berupa rating atau hal lain.

Sistem rekomendasi pada awal perkembangannya menjalankan algoritma yang menggunakan rekomendasi-rekomendasi yang diberikan oleh sekelompok pelanggan untuk memperoleh rekomendasi bagi seorang pelanggan tertentu. Pendekatan ini disebut

collaborative filtering. Prinsip dari collaborative filtering adalah jika seorang pelanggan A bersepakat pada sekelompok pelanggan lain tentang barang-barang maka dari kelompok pelanggan tersebut dapat diperoleh informasi: barang apa yang akan relevan dan menarik bagi pelanggan A, inilah yang akan menjadi rekomendasi.

Ketika situs e-commerce mulai berkembang, penawaran berbagai barang semakin banyak tersedia di Internet. Pilihan yang sangat beragam ditambah ketersediaan informasi yang sangat banyak tidak selalu mengantarkan pembeli pada pilihan barang yang paling sesuai dengan kebutuhannya, namun kadang kadang justru membawa pembeli pada pilihan barang yang kurang tepat. Kemunculan sistem rekomendasi menjadi sarana yang bermanfaat untuk mengatasi situasi tersebut. Sistem rekomendasi memberikan masukan pada pembeli barang-barang apa yang mungkin sesuai dengan kebutuhan mereka. Sistem rekomendasi akan menyimpan semua data dan respon pembeli sehingga dapat bermanfaat untuk perhitungan

rekomendasi yang akan datang. Kini sistem rekomendasi memainkan peranan yang penting dalam situs terkenal seperti: Amazon.com, YouTube,Yahoo, Tripadvisor.

Sistem rekomendasi dapat dibagi dalam tiga kelompok besar berdasarkan pendekatan yang digunakan untuk menghasilkan rekomendasi [9], yaitu pendekatan

content-based filtering, pendekatan collaborative filtering dan pendekatan hibrid.

Pada pendekatan content-based filtering kemiripan antar produk atau barang diambil dari properti semua atribut barang. Kemiripan dua barang diambil dari kemiripan nilai-nilai atributnya [3]. Keuntungan dari content-based filtering adalah diperolehnya hubungan yang jelas antar barang. Namun keuntungan ini bisa didapat jika pendefinisian setiap atribut telah diberikan dengan jelas dan umumnya proses untuk menghasilkan rekomendasi memerlukan teknik data mining yang cukup kompleks. Pada pendekatan collaborative filtering informasi yang diperlukan untuk menghasilkan rekomendasi adalah interaksi pelanggan, transaksi pelanggan seperti rating produk, pemesanan barang, informasi arus click [10]. Informasi ini biasanya akan didapat ketika pelanggan menelusuri situs, membeli atau memberikan rating pada barang. Pendekatan ini berdasarkan informasi dari pelanggan yang dapat diperoleh secara otomatis. Namun pendekatan ini memerlukan sejumlah data awal untuk mendapatkan hasil yang benar (sejumlah data pelanggan dan data transaksinya). Sedangkan untuk pendekatan yang ketiga, dilakukan pendekatan gabungan yang mengkombinasikan content-based filtering dan collaborative filtering [8]. Pendekatan ini memanfaatkan keunggulan definisi hubungan yang jelas antar barang pada content-based filtering dan informasi interaksi pelanggan pada collaborative filtering. Selain itu rekomendasi akan terus diperbaiki dengan semakin bertambahnya informasi dari para pelanggan.

2.2 Collaborative Filtering

Pada pendekatan collaborative (social) filtering perhitungan perkiraan rating suatu barang untuk seorang pelanggan u dilakukan berdasarkan rating dari pelanggan yang lain. Rating dari seorang pelanggan u untuk barang baru i akan mirip dengan pengguna lain v, jika

u dan v telah memberikan rating yang mirip

(3)

kemungkinan akan memberikan rating barang

i dan j dengan nilai yang sama, jika pelanggan

lain telah memberikan penilaian setara pada dua barang ini. Dengan pendekatan ini barang yang propertinya tidak tersedia tetap dapat direkomendasikan, dimana hal ini tidak dapat dilakukan dengan pendekatan content based filtering. Rekomendasi dari pendekatan collaborative filtering berdasarkan kualitas barang yang telah dievaluasi oleh pelanggan lain, bukan mengandalkan content atau isi yang mungkin menjadi indikator yang kurang tepat untuk masalah kualitas. Selain itu, tidak seperti content based filtering, collaborative filtering dapat merekomendasikan barang dengan isi yang sangat berbeda, asalkan pelanggan lain telah menunjukkan minat untuk barang-barang tersebut.

2.3 Euclidean distance

Pada pendekatan collaborative filtering, dilakukan perhitungan jarak rating yang telah diketahui, antara pelanggan dengan pelanggan yang ingin diberikan rekomendasi. Salah satu ukuran jarak yang dapat dipakai adalah Euclidean distance. Berikut rumus euclidean distance untuk ruang berdimensi n [11]:

(1) Pada permasalahan sistem rekomendasi maka x dan y adalah nilai rating dari dua orang pelanggan berbeda untuk n buah barang, sehingga dengan persamaan (1) dapat diketahui jarak rating antara dua pelanggan. Semakin besar nilai euclidean distance-nya menunjukkan semakin besar perbedaan rating yang diberikan oleh dua orang pelanggan tsb, dan sebaliknya bila nilai euclidean distance nya semakin kecil berarti rating yang diberikan oleh kedua pelanggan tersebut semakin mirip.

3. METODE PERHITUNGAN

REKOMENDASI

Pada bagian ini akan dijelaskan contoh metode atau skenario perhitungan rekomendasi menggunakan pendekatan collaborative filtering dengan euclidean distance sebagai ukuran kemiripan rating user. Skenario ini kemudian diimplementasikan pada aplikasi toko film online.

Tabel 1 adalah tabel yang memperlihatkan rating dari tujuh pelanggan untuk enam judul film, dimana pelanggan

ke-tujuh (user 1) hanya memberi rating pada tiga film saja. Nilai rating adalah 1 sampai dengan 10. Berdasarkan Tabel 1 akan dicari rekomendasi untuk user 1 dari tiga film yang belum diratingnya.

Langkah pertama adalah menghitung jarak antar pelanggan dengan user 1, berdasarkan rating-rating yang telah diberikan. Jarak dihitung menggunakan persamaan (1). Berikut adalah contoh penghitungan jarak menggunakan euclidean distance antara Defry dan user 1. Persamaan (2) adalah persamaan (1) dengan n adalah 3 buah film.

√∑ (2)

d(x,y) adalah Euclidean distance rating Defry dan user 1, xi adalah nilai rating film yg diberikan Defry pada film i, yi adalah nilai rating film yg di berikan user 1 pada film i

Tabel 1. Rating enam buah film oleh tujuh orang pelanggan Pelang gan Rating Film A B C D E F Defry 3 7 4 9 9 7 Dondi 7 5 5 3 8 8 Dina 7 5 5 0 8 4 Dea 5 6 8 5 9 8 Dendy 5 8 8 8 10 9 Didi 7 7 8 4 7 8 user 1 ? 6 9 ? ? 6

Euclidean distance antara rating Defri & user1 =√

= √ = 5.2

Tabel 2. Euclidean distance rating antara enam pelanggan dan user 1

User 1 Defry 5.2 Dondi 4.6 Dina 4.6 Dea 2.2 Dendy 3.7 Didi 2.4

Tabel 2 memperlihat Euclidean distance rating antara enam pelanggan dengan user 1 berdasarkan tiga rating yang telah diberikan user 1.

(4)

Langkah berikutnya adalah menghitung nilai kemiripan antar enam pelanggan dengan user 1 berdasarkan Euclidean distance rating pada tabel 2. Semakin besar nilai kemiripan seorang pelanggan dengan user 1 maka semakin mirip rating yang diberikan oleh mereka berdua. Persamaan (3) digunakan untuk menghitung nilai kemiripan antar pengguna.

(3)

Dengan sim(x,y) adalah nilai kemiripan rating pelanggan x dan pelanggan y, d(x,y) adalah Euclidean distance rating antara pelanggan x dan pelanggan y seperti yang tertera di Tabel 2.

Contoh nilai kemiripan rating Defry dan user 1, adalah 1/(1+5.2) = 0.16

Tabel 3 memperlihatkan nilai kemiripan rating antara enam pelanggan dengan user 1.

Tabel 3. Nilai Kemiripan rating antara enam pelanggan dan user 1

User 1 Defry 0.16 Dondi 0.18 Dina 0.18 Dea 0.31 Dendy 0.21 Didi 0.29

Langkah selanjutnya adalah menggunakan nilai kemiripan pada tabel 3 untuk membuat urutan rekomendasi dengan cara mengalikan nilai kemiripan setiap pelanggan dengan rating setiap buku.

Tabel 4a. Nilai Rekomendasi user 1 untuk buku A Pelanggan Nilai kemiripan dgn user 1 Rating utk bukuA Nilai rekomendasi Defry 0.16 3 0.48 Dondi 0.18 7 1.26 Dina 0.18 7 1.26 Dea 0.31 5 1.55 Dendy 0.21 5 1.05 Didi 0.29 7 2.03

Total nilai rekomendasi 7.63

Tabel 4b. Nilai Rekomendasi user 1 untuk buku D Pelanggan Nilai kemiripan dgn user 1 Rating utk bukuD Nilai rekomendasi Defry 0.16 9 1.44 Dondi 0.18 3 0.54 Dina 0.18 0 0 Dea 0.31 9 1.55 Dendy 0.21 8 1.68 Didi 0.29 4 1.16

Total nilai rekomendasi 6.37 Dari perhitungan nilai rekomendasi pada tabel 4a, 4b dan 4c, dapat disimpulkan bahwa urutan rekomendasi buku untuk user 1 adalah: buku E, buku A dan buku D.

Tabel 4c. Nilai Rekomendasi user 1 untuk buku E Pelanggan Nilai kemiripan dgn user 1 Rating utk bukuE Nilai rekomendasi Defry 0.16 9 1.44 Dondi 0.18 8 1.44 Dina 0.18 8 1.44 Dea 0.31 9 2.79 Dendy 0.21 10 2.10 Didi 0.29 7 2.03

Total nilai rekomendasi 11.24

4. HASIL DAN PEMBAHASAN

Pada bagian ini akan dijelaskan hasil dari penelitian dalam bentuk aplikasi toko film online dilanjutkan dengan pembahasan evaluasi sistem rekomendasi menggunakan aplikasi tersebut serta analisanya pada bagian 4.2.

4.1 Aplikasi Toko Film Online

Seperti yang telah disebutkan pada bagian pendahuluan dan bagian ke tiga, skenario sistem rekomendasi ini diimplementasikan pada aplikasi toko film online. Pada aplikasi

Gambar 1. Halaman daftar film ini setiap pelanggan akan mendapat rekomendasi film berdasarkan data rating yang

(5)

pernah diberikan dan data rating dari pelanggan lainnya. Oleh karena itu setiap

Gambar 2. Halaman pengisian rating pelanggan harus melakukan pendaftaran terlebih dahulu sedangkan bila pelanggan belum pernah memberikan rating maka rekomendasi buku diberikan berdasarkan pilihan random saja.

Gambar 1 dan gambar 2 memperlihatkan tampilan aplikasi toko film online untuk halaman daftar film dan pengisian rating. 4.2 Evaluasi dan Analisa

Evaluasi pertama yang dilakukan adalah evaluasi kebenaran perhitungan rekomendasi oleh program aplikasi. Dengan kondisi data rating seperti tabel 1 dan Buku A berjudul Australia, Buku D berjudul Hancook dan Buku E berjudul Milk, maka rekomendasi yang diberikan untuk pelanggan user 1 pada aplikasi ditunjukkan pada gambar 3. Kita lihat hasil dari aplikasi telah benar, sesuai dengan perhitungan manual dibagian 3.

Gambar 3. Rekomendasi untuk user 1 dari aplikasi

Evaluasi berikutnya adalah evaluasi untuk melihat tingkat kesamaan rekomendasi aplikasi dengan keinginan pelanggan yang sebenarnya. Untuk evaluasi ini kami menjalankan survey ke 20 orang pelanggan, dengan kondisi data rating awal tertentu. Hasil survey dibandingkan dengan hasil dari aplikasi. Perbandingan hasil survey dan hasil aplikasi dinilai menggunakan Kendall Rank Correlation Coefficient. Persamaan (4) memperlihatkan rumus dari

Kendall Rank Correlation Coefficient [12]. Tabel 5 memperlihatkan arti atau interpretasi hasil perhitungan Kendall Rank Correlation Coefficien. Dari data survey 20 pelanggan dan hasil aplikasi diperoleh rata-rata nilai Kendall Rank Correlation Coefficien adalah 0.66. Hasil ini termasuk Kuat menurut table 5, hal ini menunjukan bahwa kemiripan rekomendasi aplikasi dengan keinginan user cukup mirip.

(4)

Dengan, T adalah Kendall Rank Correlation Coefficien (besarnya antara -1 s/d 1), S adalah selisih jumlah pasangan dengan urutan berbeda di daftar X dan daftar Y, N adalah jumlah item dalam daftar, X adalah daftar item menurut rekomendasi Aplikasi, Y adalah daftar item menurut pelanggan (Hasil kuesioner).

Tabel 5. Interpretasi hasil Kendall Rank

Correlation Coefficien Nilai KRCC Interpretasi 0.000 – 0.199 Sangat Lemah 0.200 – 0.399 Lemah 0.400 – 0.599 Sedang 0.600 – 0.799 Kuat 0.800 - 1.000 Sangat Kuat

5. KESIMPULAN

Pada masa kini sistem rekomendasi telah memainkan peranan yang penting dalam dunia e-commerce. Penelitian pengembangan sistem rekomendasi telah memuculkan berbagai cara dalam menghasilkan rekomendasi untuk pelanggan e-commerce. Pada paper ini kami telah menunjukkan bahwa pendekatan collaborative filtering dengan euclidean distance sebagai ukuran kemiripan rating user dapat memberikan rekomendasi bagi pelanggan pada toko film online. Hasil evaluasi menggunakan Kendall Rank Correlation Coefficient dengan nilai 0.66, menunjukkan pendekatan ini memberikan rekomendasi yang cukup mirip dengan keinginan pelanggan.

Penggunaan ukuran kemiripan rating user yang berbeda dan cara evaluasi yang lebih stabil dapat menjadi hal yang menarik untuk ditelusuri pada penelitian yang akan datang.

(6)

6. DAFTAR PUSTAKA

[1] Resnick, P. dan Varian, H.R. Recommender Systems. Communications of the ACM. 40: 56 – 58. 1997.

[2] Shafer, J.B., Konstan, J.A., dan Riedl, J. Recommender Systems in E-Commerce. ACM Conference on Electronic Commerce (EC-99). Hal 158-166. 1999. [3] Basu, C., Hirsh, H., dan Cohen, W.

Recommendation as classification: Using social and content-based information in recommendation. Proceeding of the 1998 workshop on recommender systems, Menlo Park, CA. Hal. 11–15. 1998. [4] Billsus, D., dan Pazzani, M. J. A hybrid

user model for news story classification. Proceeding of the seventh international conference on user modeling. 1999. [5] Adomavicius, G., dan Tuzhilin, A. Using

data mining methods to build customer profiles. IEEE Computer, 34(2):74–82. 2001.

[6] Ansari, A., Essegaier, S., dan Kohli, R. Internet recommendation systems. Journal of Marketing Research, 37(3) : 363–375. 2000.

[7] Mahmood, T., dan Ricci, F. Improving recommender systems with adaptive conversational strategies. Dalam C. Cattuto, G. Ruffo, F. Menczer (eds.) Hypertext. Hal. 73–82. ACM 2009.

[8] Burke, R. Hybrid web recommender systems. DalamThe AdaptiveWeb. Hal 377–408. Springer Berlin / Heidelberg. 2007.

[9] Adomavicius, Gediminas dan Alexander Tuzhilin. Towards the next generation of recommender systems: A survey of the state-of-the-art and possible extentions. IEEE Transactions on Knowledge and Data Engineering, 17(6):734–749, 2005. [10] Leimstoll, Uwe dan Henrik Stormer.

Collaborative Recommender Systems for Online Shops. Proceeding of AMCIS 2007 (Americas Conference on Information Systems). 2007.

[11] Rajaraman, Anand, Jeffrey David Ullman. Mining of Massive Datasets. Cambridge university press, New York, USA. 2012. [12] Abdi, Hervé. The Kendall Rank

Correlation Coefficient. Dalam Encyclopedia of measurement and statistics, ed Neil J. Salkind. Hal. 508 – 511. SAGE Publications, Inc. California, USA. 2007.

Gambar

Tabel  3  memperlihatkan  nilai  kemiripan  rating antara enam pelanggan dengan user 1
Gambar  1  dan  gambar  2  memperlihatkan  tampilan  aplikasi  toko  film    online  untuk  halaman daftar film dan  pengisian rating

Referensi

Dokumen terkait

Kondisi mangrove di desa Timbul Sloko, Kecamatan Sayung, Kabupaten Demak telah mengalami kerusakan akibat abrasi. Hutan mangrove di Kabupaten Demak merupakan salah

Dengan kata lain, terjadi tambahan biaya umum akibat kemacetan yang terjadi sebesar Rp 638,82 per kendaraan (SMP) per km perjalanan. Dengan kata lain, terjadi tambahan

Penelitian tindakan kelas ini bertujuan untuk mengetahui peningkatan kemampuan berpikir kritis dan hasil belajar siswa kelas VIII SMPN 2 Ciwaru dalam pembelajaran

Seseorang menjalankan suatu pekerjaan merupakan hasil dari cara berpikir mereka, dan karena didorong oleh keinginan atau kebutuhan dalam dirinya, khususnya ibu rumah

Tujuan penelitian ini adalah untuk mengetahui peningkatan kemampuan kognitif dan pemecahan masalah siswa, level pemecahan masalah siswa, hubungan antara kemampuan kognitif

Pembelajaran musik di sekolah mempunyai tujuan untuk: (1) memupuk rasa seni pada tingkat tertentu dalam diri tiap anak melalui perkembangan kesadaran musik, tanggapan

 Biji kacang (dapat diganti dengan potongan kertas atau yang lain) sejumlah sasaran peserta  Data cakupan praktik pemberian makan pada bayi dan anak di masing-masing posyandu

Judul Skripsi : Analisis Return On Investment dengan Pendekatan Du Pont Sebagai Alat Perbandingan untuk Menilai Kinerja Keuangan Perusahaan (Studi Pada PT. Indocement