1 BAB I PENDAHULUAN
BAB 1. PENDAHULUAN
1.1 Latar Belakang
Transaksi perdagangan merupakan salah satu kegiatan yang sering kita jumpai pada kehidupan sehari-hari. Transaksi perdagangan tidak hanya menggunakan cara yang konvensional akan tetapi telah memanfaatkan teknologi informasi dan jaringan internet. Beberapa contoh transaksi online diantaranya adalah buku online, toko elektronik dan toko handphone, sudah banyak dimanfaatkan oleh pengguna dari berbagai tempat dan waktu.
Dengan bervariasinya jenis produk yang ada di toko online, maka pengguna akan kesulitan untuk memilih produk yang diinginkan oleh pengguna tersebut, dengan sedikitnya waktu pengguna untuk memilih produk yang tepat atau yang pengguna inginkan. Beberapa peneliti telah banyak mengusulkan beberapa cara untuk meningkatkan kinerja system aplikasi online tersebut sedemikian rupa semakin mudah, cepat untuk digunakan bagi pengguna. Misalnya sistem-sistem online yang dikembangkan dengan menggunakan teknik-teknik komputasi cerdas (Wanarsup et.al, 2008; Sun dan Zhao, 2009), data mining (Liu et.al, 2009), prediksi dan rekomendasi (Sarwar et al., 2001).
Metode collaborative filtering telah banyak dipakai pada sistem rekomendasi perdagangan online (Shambour dan Lu, 2011). Metode collaborative filtering pada prinsipnya adalah proses penyaringan data berdasarkan kemiripan informasi, karakteristik atau profil dari para pembeli. Algoritma collaborative filtering dapat dibedakan dalam dua bentuk, yaitu probabilistic dan non-probabilistic. Suatu algoritma dianggap probabilistic bila algoritma tersebut berdasarkan suatu model probabilistic. Sebagai contoh probabilitas untuk memprediksi kartu memori handphone. Algoritma non-probabilistic didasarkan pada suatu persamaan matematis tertentu misalnya persamaan nearest neighbours.
Metode collaborative filtering menggunakan nearest neighbours dapat dibedakan menjadi user-based dan item-based (Schafer et al., 2007). User-based collaborative filtering algorithm menggunakan teknik statistika untuk
menemukan sekumpulan user pembeli tetangga yang berdekatan (neighbour). Dengan kata lain, pembeli berdekatan adalah para pengguna yang sama-sama merating produk yang mirip, atau memiliki kecenderungan membeli sekumpulan produk yang sama. Item-based collaborative filtering algorithm menggunakan teknik statistika untuk menemukan kesamaan produk. Sebagai contoh adalah kesamaan produk headphone dengan produk speaker yang diberi nilai menggunakan range dari -1 sampai 1 (-1 berarti tidak sama dan 1 berarti sama). Item-based collaborative filtering algorithm lebih efisien dibandingkan dengan dengan user-based collaborative filtering karena memiliki performa prediksi yang lebih tinggi (Sarwar et al., 2001).
Menurut Montiel dan Montes (2009) metode colllaborative filtering masih mempunyai kelemahan sparsity (keterbatasan) dan the cold-start item. Sparsity akan terjadi jika rating yang didapat dari user dengan penyebaran yang tidak merata dan pasangan user yang memiliki rating produk yang sama sangat sedikit, sehingga tidak memenuhi kuota untuk penghitungan nilai similaritas. Sedangkan cold-start item mempengaruhi produk yang tidak mempunyai rating karena produk tersebut baru saja ditambahkan, hal tersebut menyebabkan sistem tidak bisa tepat menemukan tetangga yang similar untuk produk baru (Sarwar et al., 2001; Adomavicius dan Tuzhilin, 2005; Schafer et al., 2007).
Kesamaan dari produk-produk yang berbeda, dapat dispesifikasikan dalam bentuk informasi semantik yaitu kesamaan semantik dari beberapa produk yang didasarkan pada sumber pengetahuan (ontology). Dalam konteks sistem atau aplikasi rekomendasi online dapat juga dikombinasikan dengan menambahkan semantic information dari item, yang berguna untuk memberikan informasi sebagai model rekomendasi berdasarkan sumber pengetahuan (Shambour dan Lu, 2011). Berdasarkan permasalahan pada metode collaborative filtering, penelitian ini mencoba mengkombinasikan antara semantic similarity dan collaborative filtering yang diharapkan dapat mengurangi masalah sparsity dan cold-start item. Studi kasus pada penelitian ini menggunakan data sistem toko aksesoris handphone online berbasis web.
1.2 Rumusan Masalah
Berdasarkan latar belakang masalah dan motivasi yang telah dikemukakan di atas, rumusan permasalahan yang menjadi fokus penelitian ini adalah bagaimana mengembangkan sistem rekomendasi dengan mengkombinasikan semantic similarity dan collaborative filtering dan menguji dengan sampel data aksesoris
handphone.
1.3 Batasan Masalah
Untuk mendapatkan hasil penelitian seperti yang diharapkan dan penelitian yang terarah, maka permasalahan dalam penelitian ini akan dibatasi sebagai berikut:
1. Permasalahan yang dibahas hanya sebatas untuk mendapatkan rekomendasi yang diberikan kepada pengguna sistem.
2. Metode yang digunakan untuk mendapatkan rekomendasi dengan menggunakan algoritma collaborative filtering dan semantic similarity
dengan metode leacock chodorow.
3. Rekomendasi dalam sistem ini hanya menggunakan rating berdasarkan aksesoris handphone dan atribut nama kategori dari aksesoris
handphone, sedangkan nama merk diabaikan.
4. Similaritas semantik berdasarkan taksonomi dari wordnet 2.1 berbahasa inggris.
1.4 Tujuan dan Manfaat Penelitian
Tujuan yang ingin dicapai dari penelitian ini adalah mengkombinasikan metode collaborative filtering dengan semantic similarity yang diharapkan dapat mengurangi masalah sparsity dan cold-start item.
Adapun manfaat dari penelitian ini diharapkan dapat digunakan sebagai penerus dari beberapa metode sebelumnya pada penelitian tentang sistem rekomendasi sebelumnya.
1.5 Kontribusi
Penelitian ini memberikan kontribusi kepada peneliti sistem rekomendasi dengan menggabungkan algoritma collaborative filtering dengan semantic similarity.
Diharapkan dengan pengintegrasian dua model algoritma ini akan dapat meningkatkan akurasi rekomendasi (Sarwar et al., 2001; Montiel dan Montes, 2009).
1.6 Metodologi Penelitian
Metode pengembangan dalam penelitian ini menggunakan metode systems development life cycle (SDLC), yaitu suatu metode untuk merancang aplikasi perangkat lunak. Nama lain dari sistem ini adalah metode waterfall (Hartono, 2007).
1. Studi literatur dan pengumpulan data
Dalam studi literatur ini dilakukan untuk mempelajari literatur-literatur berupa informasi dari berbagai sumber yang berkaitan dengan penelitian literatur yang dipelajari berkaitan dengan sistes rekomendasi dan penerapan metode-metode yang dipakai pada sistem rekomendasi. Literatur diperoleh dari berbagai sumber antara lain laporan hasil penelitian ilmial (skripsi, tesis, disertasi atau jurnal), buku, majalah ilmiah, surat kabar, dokumen paten atau dari publikasi menggunakan media internet.
2. Analisis dan pendefinisian kebutuhan
Pendefinisian kebutuhan dilakukan untuk mengumpulkan kebutuhan yang digunakan dalam penelitian berdasarkan teori yang telah dipelajari secara lengkap. Proses ini juga mengumpulkan data yang diguanakan pada sistem rekomendasi baik berupa data internal seperti data produk aksesoris handphone, data spesifikasi dan data kategori aksesoris handphone maupun data eksternal seperti data pengguna sistem, data harga, dan data rating pengguna terhadap produk aksesoris handphone.
3. Desain sistem dan perangkat lunak
Tahap desain sistem dan perangkat lunak dilakukan untuk membuat rancangan yang siap diimplementasikan, yang berupa pengubahan kebutuhan-kebutuhan tersebut ke dalam struktur data dengan menggunakan DFD (Data Flow Diagram) dan ERD (Entity Relationship Diagram). Rancangan arsitektur sistem rekomendasi juga dijelaskan pada bagian ini.
DFD menggambarkan proses –proses yang dilakukan oleh sistem seperti proses authentifikasi, transaksi, generate rekomendasi dan proses lainnya. Sedangkan ERD menjelaskan gambaran besar tentang sistem yang akan dibangun. 4. Implementasi sistem
Merupakan tahap untuk mengimplementasikan hasil analisis dan rancangan sistem menjadi aplikasi sistem rekomendasi. Tools yang digunakan untuk mengimplementasikan penelitian ini terdiri dari dua jenis yaitu perangkat lunak sistem manajemen basis data (Database Management System / DBMS) dan perangkat lunak pemrograman. DBMS yang digunakan pada penelitian ini adalah
MySQL versi 5.0.5.51b. Sedangkan perangkat lunak pemrograman menggunakan perangkat lunak berbasis web menggunakan bahasa pemrograman PHP karena dapat diakses oleh pengguna dimanapun dan kapanpun jika terhubung dengan internet.
5. Pengujian
Penelitian ini menggunakan standart Mean Absolute Error (MAE) pada pengujiannya. MAE digunakan untuk menghitung tingkat akurasi atau nilai kesalahan hasil prediksi rating dari sistem terhadap rating sebenarnya yang diberikan oleh terhadap produk (Herlocker et. al, 2004; Vozalis dan Margaritis, 2003). MAE diperoleh dengan menghitung error absolut dari N pasang rating asli dan prediksi, kemudian menghitung rata-ratanya, seperti pada rumus :
𝑀𝐴𝐸 =
𝑛𝑖=1 𝑞𝑖−𝑝𝑖𝑛 (1.1)
Keterangan :
- pi = rating yang diprediksi - qi = rating yang sebenarnya
Pada rumus (1.1), rating yang diprediksi berasal dari output prediksi dari sistem dan rating sebenarnya berasal dari penilaian yang diberikan pengguna sistem terhadap aksesoris handphone. Data hasil prediksi dan rekomendasi yang digunakan pada toko aksessoris handphone dengan menggunakan metode kombinasi akan dibandingkan dengan collaborative filtering standart. Perbandingan hasil rekomendasi akan dilakukan oleh 10 sampai 50 pengguna. Tingkat validasi rekomendasi dari penelitian ini diharapkan nilai MAE akan lebih kecil jika dibandingkan dengan collaborative filtering standart. Semakin kecil nilai MAE maka berarti nilai prediksi dan rekomendasi yang dihasilkan semakin tinggi.
1.1 Sistematika Penulisan
Penulisan tesis ini dibagi menjadi 7 bab. Pembagian tersebut dapat dijelaskan dengan struktur sebagai berikut :
BAB I PENDAHULUAN
Bab ini akan menguraikan secara singkat mengenai latar belakang masalah, batasan masalah, perumusan masalah, manfaat dan tujuan penelitian, kontribusi, metodologi penelitian dan sistematika penulisan.
BAB II TINJAUAN PUSTAKA
Bab ini berisi tentang sumber-sumber teori yang dijadikan acuan dalam penulisan tesis ini, yang memuat uraian sistematis tentang informasi hasil penelitian yang disajikan dalam pustaka dan menghubungkannya dengan masalah penelitian yang sedang diteliti.
BAB III LANDASAN TEORI
Bab ini menguraikan teori dasar yang berkaitan dengan penelitian yang dilakukan dan akan menjadi dasar dalam pemecahan masalah.
BAB IV ANALISIS DAN RANCANGAN SISTEM
Bab ini akan menguraikan spesifikasi kebutuhan sistem dan perancangan sistem rekomendasi, pembuatan aturan untuk proses generate rekomendasi serta perancangan antarmuka sistem.
BAB V IMPLEMENTASI
Bab ini membahas tentang implementasi sistem rekomendasi aksesoris handphone untuk memberikan rekomendasi kepada pelanggan menggunakan metode collaborative filtering dan semantic similarity.
BAB VI HASIL PENELITIAN DAN PEMBAHASAN
Bab ini menyajikan informasi ilmiah yang diperoleh dalam penelitian yang disusun secara sistematis dan disertai alasan yang rasional tentang masalah penelitian.
BAB VII KESIMPULAN DAN SARAN
Berisikan kesimpulan berdasarkan dari implementasi dan uraian-uraian yang diperoleh sebelumnya serta saran untuk perbaikan dan pengembangan lebih lanjut.
8 BAB II
TINJAUAN PUSTAKA
BAB 2. TINJAUAN PUSTAKA
Beberapa penelitian yang telah dilakukan tentang sistem rekomendasi menggunakan pendekatan collaborative filtering yang telah dikembangkan antara lain penelitian yang dilakukan Xia,et al. (2008) menggunakan collaborative filtering menggunakan item yang populer untuk menentukan nearest neighbor. Algoritma item-based collaborative filtering dengan pendekatan one scheme smoothing, yaitu memprediksi nilai rating item yang masih kosong nilai ratingnya berdasarkan deviasi rata-rata dari dua item yang berhubungan juga digunakan (Zhang, 2009). Angka rating yang besar, maka menunjukkan suatu item tersebut populer. Item yang belum dirating akan dapat diprediksi ratingnya jika masuk ke dalam kategori dari item yang dirating oleh user aktif pada item yang populer (Xia,et al., 2008). Tan dan Ye (2009) menggunakan algoritma user-based collaborative filtering dengan melibatkan klasifikasi item untuk memprediksi nilai rating item yang masih kosong (belum dirating oleh pengguna). Kemudian menggunakan algoritma item-based collaborative filtering untuk menentukan rekomendasi yang diberikan kepada pengguna. Collaborative filtering dengan menggunakan perhitungan similaritas yang baru untuk memprediksi rating yang kosong juga diterapkan (Rongfei,et al.,2010), yaitu menggunakan similaritas dasar, cosine similarity dan collaborative filtering. Mereka memprediksi nilai rating item yang masih kosong nilai ratingnya berdasarkan pendekatan masing-masing. Hasil eksperimen menunjukkan bagaimana pendekatan-pendekatan mereka berhasil mengurangi kasus keterbatasan data (sparsity).
Pendekatan yang lain, Gong dan Cheng (2008) menggunakan collaborative filtering dengan menggabungkan waktu dari item untuk mendeteksi perubahan minat pengguna serta collaborative filtering dengan location based filtering (Arief, 2012). Peneliti mencatat waktu pada saat peratingan, menggunakan algoritma Pearson‘s Correlation untuk meningkatkan kinerja, menentukan tetangga terdekat dan generate rekomendasi (Gong dan Cheng, 2008). Arief (2012) juga menggunakan collaborative filtering dan location based filtering
untuk membantu merekomendasikan tempat/spot wisata yang sesuai dengan pereferensi pengguna dan menggunakan pendekatan berbasis lokasi.
Selain collaborative filtering, sebagian peneliti sistem rekomendasi juga melibatkan web semantik untuk men-generate rekomendasi. Dari penelitian mereka, kumpulan informasi dari pengguna yang berasal dari data pengguna dan dari history terkait kegiatan pengguna saat menggunakan system, digunakan untuk membuat model pengguna yang akan menjadi dasar saat memberikan rekomendasi pada e-learning dan e-commerce (Paryudi dan Andiani, 2010; Embarak dan Corne, 2011). Data rekomendasi berasal dari data di luar sistem (Paryudi dan Andiani, 2010) dan data dari dalam sistem (Embarak dan Corne, 2011) yang kemudian disimpan secara manual di sistem yaitu berupa pencarian artikel di halaman web yang dicocokkan dengan model pengguna. Ringkasan perbedaan di antara penelitian-penelitian tersebut disajikan pada Tabel 2.1. Pada Tabel 2.1 juga dijelaskan beberapa pendekatan yang digunakan oleh para peneliti beserta data dan hasil pengujian dari masing-masing penelitian.
No Peneliti Pendekatan yang digunakan Pengujian Data yang digunakan Keterangan
1. Xia et al. (2008)
Collaborative filtering dengan pendekatan item populer
Mean Absolute Error (MAE) metrics
MovieLens Nilai MAE dari penelitian ini lebih kecil jika
dibandingkan dengan metode lain (item-based
collaborative filtering,user-based collaborative filtering dan missing prediction collaborative filtering), yang berarti nilai presisi prediksi dan rekomendasi lebih tinggi dari metode lain, dan berhasil mengurangi masalah keterbatasan data.
2. Gong dan
Cheng (2008)
Collaborative filtering dengan time-related data
Mean Absolute Error (MAE) metrics
MovieLens Nilai MAE dari penelitian ini lebih kecil jika
dibandingkan dengan metode traditional collaborative
filtering yang berarti nilai presisi prediksi dan rekomendasi lebih tinggi.
3. Zhang (2009) Collaborative filtering dengan
Algoritma Using slope one scheme
smoothing
Mean Absolute Error (MAE) metrics
MovieLens Nilai MAE dari penelitian ini lebih kecil jika
dibandingkan dengan metode traditional collaborative
filtering yang berarti nilai presisi prediksi dan rekomendasi lebih tinggi, dan berhasil mengurangi masalah keterbatasan data.
4. Tan dan Ye
(2009)
Collaborative filtering dengan menggunakan klasifikasi item
Mean Absolute Error (MAE) metrics
MovieLens Algoritma pada penelitian ini lebih baik daripada
traditional collaborative filtering dan berhasil mengurangi masalah keterbatasan data.
5. Rongfei et. al
(2010)
Collaborative filtering dengan metode klasterisasi baru
Mean Absolute Error (MAE) metrics
Grouplens Movie Hasil pengujian, menghasilkan hasil terbaik dengan nilai MAE terkecil, yang berarti nilai presisi prediksi dan rekomendasi lebih tinggi.
6. Paryudi dan
Andiani (2010)
Semantic based recommendation Tidak dijelaskan E-learning Data rekomendasi berasal dari data di luar sistem yang kemudian disimpan secara manual di sistem yaitu berupa pencarian artikel di halaman web yang dicocokkan dengan model pengguna.
7. Embarak dan
Corne (2011)
Semantic based recommendation Novelty, coverage dan
precission
E-Commerce Data rekomendasi berasal dari data internal pada sistem yang dicocokkan dengan model pengguna.
10
8. Arief (2012) Collaborative filtering dengan
location based filtering
Pengujian fungsionalitas, pengujian kompabilitas dan pengujian sistem
E-Tourism Dari proses pengujian fungsionalitas, pengujian kompabilitas dan pengujian sistem rekomendasi dapat terlihat bahwa rancangan sistem rekomendasi pariwisata sudah dapat memberikan rekomendasi wisata sesuai
dengan metode collaborative filtering dan
location-based filtering yang dirancang.
9. Fahrurrozi
(2013)
Collaborative filtering dengan
semantic based recommendation
Mean Absolute Error (MAE) metrics
E-Commerce Diharapkan dengan pengintegrasian dua model algoritma ini akan dapat mengurangi kelemahan-kelemahan yang ada pada algoritma collaborative filtering tradisional yaitu sparsity (keterbatasan) dan the cold-start item.