4.2 Tahap Design System
4.2.1 Tahap Perancangan Proses
Sistem rekomendasi berbasis Hybrid ini dibangun dengan menggunakan dua metode dalam satu sistem, yang mana pada metode ini
80
menggunakan teknik Switching dalam menerapkan hasil rekomendasinya.
Sebagaimana yang telah dijelaskan pada bab sebelumnya, teknik Switching akan memberikan hasil rekomendasi dengan cara memilih salah satu metode yang digunakan sesuai dengan kebutuhan yang tersedia, dan tidak akan menampilkan metode lainnya. Misal, pada metode Content Based Filtering, sistem akan merekomendasikan produk kepada User berdasarkan kriteria yang sesuai dengan item/produk yang ada. Dan pada metode Collaborative Filtering dengan pendekatan item-based, sistem akan menampilkan hasil rekomendasi berdasarkan penghitungan rating jika User sudah me-rating item tersebut.
Skenario pertama dalam proses ini sistem hanya bisa menampilkan rekomendasi berdasarkan metode Content Based Filtering yaitu dengan menyesuaikan kriteria suatu item yang sedang pengguna lihat untuk menghasilkan rekomendasi item baru yang sejenis. Dengan menggunakan algoritma TF-IDF sebagai penghitungan dalam mencari rekomendasi berdasarkan kriteria yang sama. Pada skenario kedua, jika User telah memberikan rating pada suatu item maka sistem akan menampilkan hasil rekomendasi lagi berdasarkan rating dengan metode Collaborative Filtering. Penghitungan dengan metode Collavorative Filtering dilakukan dengan dua tahap, yaitu similarity dan prediksi. Similarity dihitung dengan menggunakan algoritma Pearson Correlation Based Similarity untuk mencari korelasi terbaik antar item dan algoritma Weighted Sum digunakan menghitung hasil prediksi. Hasil prediksi adalah hasil yang akan dijadikan rekomendasi untuk User.
Pada gambar 4.1 terdapat flowchart alur proses sistem. Dari awal seorang pengguna ditampilkan seluruh produk yang tersedia, hingga mendapatkan hasil rekomendasinya. Pada proses ini terdapat dua bagian, yaitu saat menerapkan metode Content Based Filtering dan metode Collaborative Filtering, yang akan dibahas satu persatu.
81
Gambar 4. 1 Alur Proses
4.2.1.1 Proses penghitungan dengan metode Content Based Filtering Seperti yang sudah dijelaskan pada bab sebelumnya, Content Based Filtering merupakan metode rekomendasi yang mempunyai teknik dengan menyamakan atribut item dan merekomendasikan item baru yang mempunyai karakteristik atau kemiripan atribut yang dimiliki item tersebut.
Tahapan pada proses dalam metode Content Based Filtering dapat dijelaskan sebagai berikut:
1. Menentukan query.
2. Bandingkan atribut item
3. Penghitungan Algoritma TF-IDF.
4. Hasil rekomendasi, didapat dari nilai bobot paling tertinggi- terendah.
82
Gambar 4. 2 Alur Proses Metode Content Based Filtering
Dalam tahap ini, atribut yang menjadi pertimbangan dalam menentukan kriteria kemiripan antar produk adalah jenis kulit (skin type) dan kategori produk, yang dapat dilihat pada tabel berikut:
Tabel 4. 1 Atribut Item
Kategori Produk Jenis Kulit (Skin Type)
Facial Wash Normal
Toner Kering
Moisturizer Berminyak
Mask Sensitif
Sunscreen
Sebagai contoh penghitungan, dengan mengambil sampel 1 data produk skin care yang menjadi query dari penghitung yang akan dicari rekomendasinya sesuai dengan kemiripan antar atribut produk tersebut.
Dalam hal ini, penulis akan mengambil skenario contoh data dengan menggunakan 20 data produk skin care sebagai data penghitungan.
Tabel 4. 2 Data Produk Skin care
83 Kode
Produk Brand Produk Nama Produk Kategori Skin Type
P1 COSRX
AC Collection Calming Foam Cleanser
Facial
Wash Berminyak
P2 ELSHESKIN Oily Cleanser Wash Facial
Wash Berminyak
P3 SAFI Acne Clarifying
2in1 Cleanser
Facial
Wash Berminyak
P4 SAFI White Expert 2in1
Cleanser & Toner
Facial
Wash Kering
P5
BIO BEAUTY
LAB Luxurious Face Oil Moisturizer Berminyak P6 ELSHESKIN Hydra Boost Oil
Free Moisturizer Moisturizer Berminyak
P7 POND'S
PONDS BRIGHT BEAUTY PERF CRM OILY
Moisturizer Berminyak
P8 BIODERMA Hydrabio Gel-
Creme 40 ml Moisturizer Kering
P9 NPURE Cica Chocomint
Clay Mask Mask Berminyak
P10 SNP
Charcoal Mineral Black Ampoule Mask
Mask Berminyak
P11 WHITELAB Mugwort Pore
Clarifying Mask Mask Berminyak P12
PHILOCALY SKIN
Peel Off Mask
Peach Mask Kering
P13 NPURE Noni Probiotics Toner Sensitif
84
"Balance Me" Fine Toner
P14 INNISFREE Blueberry
Rebalancing Skin Toner Kering P15
JARTE
BEAUTY CICA Care Toner Toner Normal
P16
PURIVERA BOTANICALS
White Willow Toner Essence - Centella BHA Willow Bark 2% As Salicylic Acid Alternative
Toner Normal
P17 ERHA
Perfect Shield Sunscreen Normal to Dry Skin
Sunscreen Kering
P18 NEUTROGENA
Ultra Sheer Dry - Touch Sunscreen SPF 50+
Sunscreen Kering
P19 POND'S
Bright Beauty Skin Perfecting Cream SPF30
Sunscreen Kering
P20 AZARINE Hydrasoothe
Sunscreen Mist Sunscreen Normal
1. Menentukan query
Contoh pengambilan data dalam penghitungan pembobotan kata pada penelitian ini, penulis akan mengambil skenario data pada produk-1 yang dijadikan sebagai query yang akan dicari rekomendasi produk nya berdasarkan penghitungan algoritma TF-IDF. Adapun profile yang ada pada produk-1 adalah sebagai berikut:
Kode Produk : P1
85 Brand : COSRX
Nama Produk : AC Collection Calming Foam Cleanser Kategori : Facial Wash
Skin Type : Berminyak
2. Bandingkan Atribut Item
Atribut yang dibandingkan adalah kategori dan jenis kulit (skin type).
Didapatkan hasil sebagai berikut:
Tabel 4. 3 Atribut Item Pereferensi Pengguna Kode Produk Kategori Skin Type
Q P1 Facial Wash Berminyak
P2 Facial Wash Berminyak
P3 Facial Wash Berminyak
P4 Facial Wash Kering
P5 Moisturizer Berminyak
P6 Moisturizer Berminyak
P7 Moisturizer Berminyak
P8 Moisturizer Kering
P9 Mask Berminyak
P10 Mask Berminyak
P11 Mask Berminyak
P12 Mask Kering
P13 Toner Sensitif
P14 Toner Kering
P15 Toner Normal
P16 Toner Normal
P17 Sunscreen Kering
P18 Sunscreen Kering
P19 Sunscreen Kering
P20 Sunscreen Normal
86 3. Penghitungan Algoritma TF-IDF
Berdasarkan penentuan atribut item yang terdapat pada Tabel 4.4, maka langkah pertama dalam penghitungan algoritma TF-IDF adalah dengan melakukan pembobotan kata atau term frequency (tf) antara query dengan produk lain (rumus persamaan 2.1) maka hasilnya:
Tabel 4. 4 Term Frequency (TF)
Kode Produk Kategori Skin Type
Q P1 Facial Wash Berminyak
P2 1 1
P3 1 1
P4 1 0
P5 0 1
P6 0 1
P7 0 1
P8 0 0
P9 0 1
P10 0 1
P11 0 1
P12 0 0
P13 0 0
P14 0 0
P15 0 0
P16 0 0
P17 0 0
P18 0 0
P19 0 0
P20 0 0
87
Berdasarkan tabel 4.4, hasil dari pembobotan kata atau term frequency (tf) adalah nilai kemunculan atribut item yang menjadi term pada masing- masing produk. Tahap selanjutnya adalah menghitung nilai inverse document frequency (IDF), dengan menggunakan rumus persamaan 2.2.
Tabel 4. 5 Penghitungan IDF
Q Kode Kategori Skintype
P1 Facial Wash Berminyak
TF 1+1+1 1+1+1+1+1+1+1+1
DF 3 8
ππππ = πππ ( π
πππ) πππ (20
3) πππ (20 8)
IDF 0.82 0.39
IDF + 1 1.82 1.39
Berdasarkan tabel 4.5, didapat hasil IDF dari masing-masing atribut.
Di mana nilai DF adalah jumlah keseluruhan data pada kemunculan TF, dan n/df adalah jumlah data dibagi dengan nilai df. Kemudian, nilai IDF adalah log dari n/df. Selanjutnya adalah penghitungan bobot (W) pada masing- masing produk dengan menggunakan rumus persamaan 2.3 untuk mencari hasil rekomendasi terbaik. Berikut tabel untuk nilai bobot (W):
Tabel 4. 6 Nilai Bobot (W) Kode Produk Kategori Skin Type
Jumlah Bobot
Q P1 Facial Wash Berminyak
P2 1.82 1.39 3.21
P3 1.82 1.39 3.21
P4 1.82 0 1.82
P5 0 1.39 1.39
P6 0 1.39 1.39
P7 0 1.39 1.39
P8 0 0 0
88
P9 0 1.39 1.39
P10 0 1.39 1.39
P11 0 1.39 1.39
P12 0 0 0
P13 0 0 0
P14 0 0 0
P15 0 0 0
P16 0 0 0
P17 0 0 0
P18 0 0 0
P19 0 0 0
P20 0 0 0
4. Hasil Rekomendasi
Berdasarkan tabel 4.6 maka rekomendasi dapat diurutkan dari nilai paling tertinggi β terendah, yaitu didapatkan hasil 3.21, 1.82, dan 1.39
Dari hasil penghitungan di atas didapatkan hasil untuk rekomendasi berdasarkan metode Content Based Filtering dengan menggunakan algoritma TF-IDF dengan bobot tertinggi terdapat pada P2 βELSHESKIN Oily Cleanser Washβ dan P3 βSAFI Acne Clarifying 2in1 Cleanserβ
dengan nilai masing-masing 3.21. Maka dapat disimpulkan bahwa rekomendasi yang akan muncul paling pertama saat pengguna memilih P1 adalah P2 dan P3.
89
4.2.1.2 Proses penghitungan dengan metode Collaborative Filtering Sistem rekomendasi dengan menggunakan metode Collaborative Filtering melakukan penghitungan dengan memanfaatkan rating yang diberikan pengguna pada suatu item. Metode ini memiliki dua pendekatan, yaitu User-based dan item-based. Pendekatan User-based berfokus pada tingkat kemiripan rating antar pengguna aktif dengan pengguna lain, sedangkan pendekatan item-based berfokus pada kemiripan antar item yang telah di rating oleh User. Pada penelitian ini, penulis menggunakan metode Collaborative Filtering dengan pendekatan berdasarkan item-based untuk proses rekomendasi produk skin care berdasarkan rating.
Pemberian skala rating menggunakan skala likert dengan nilai 1 sampai 5. Skala dengan penilaian 1 artinya produk sangat jelek, 2 jelek, 3 biasa, 4 bagus, dan 5 sangat bagus. Skala ini dipilih dikarenakan penggunaannya yang sangat umum dalam menggambarkan pemberian nilai tertinggi terhadap suatu produk/item.
Proses pemberian rating dilakukan secara eksplisit, artinya User secara sadar memberikan rating pada suatu item yang ada pada sistem.
Tahapan pada proses ini adalah sebagai berikut:
1. Similarity
Mencari nilai kesamaan antar item dengan menggunakan algoritma Pearson Correlation Based Similarity.
2. Prediksi
Menghitung nilai prediksi item yang akan direkomendasikan pada User dengan menggunakan algoritma Weight Sum.
90
Gambar 4. 3 Alur Proses Metode Collaborative Filtering
Sebagai contoh penghitung, pada proses ini penulis akan memberikan tabel skenario User dan rating item produk skin care. Tabel berisi 5 produk skin care, dan 5 User yang telah me-rating item.
Tabel 4. 7 Skenario Rating Item
Produk 1 Produk 2 Produk 3 Produk 4 Produk 5
Nadhila 4 5 4
April 3 3
Hafshah 3 3 4
Ulfa 3 4 4
91 1. Similarity
Proses similarity merupakan proses penghitungan nilai korelasi antar item. Pada penelitian ini penulis melakukan penghitungan dengan pendekatan item-based yang artinya mencari kesamaan antara 2 item yang telah sama-sama di rating oleh User. Pada penelitian ini, similarity dipakai untuk menghitung kemiripan nilai antara satu produk dengan produk lainnya.
Sebelum menghitung nilai similarity, langkah pertama yang dilakukan adalah mencari nilai rata-rata rating yang diberikan oleh User rata-rata rating dapat dilihat pada tabel berikut:
Tabel 4. 8 Rata-rata Rating User
Produk1 Produk2 Produk3 Produk4 Produk5 Rata-rata
Nadhila 4 5 4 4,3
April 3 3 3
Hafshah 3 3 4 3,3
Ulfa 3 4 4 3,6
Setelah nilai rata-rata rating telah di dapat, selanjutnya adalah menghitung nilai similarity menggunakan algoritma Pearson Correlation Based Similarity (rumus persamaan 2.4). Sebagai contoh, peneliti akan menghitung korelasi antara Produk-1 dan Produk-2.
π ππ (π, π) = β π’ β π(π π’,πβ π Μ π)(π π’,πβ π Μ π)
ββ π’ β π(π π’,πβ π Μ π)2ββ π’ β π(π π’,πβ π Μ π)2
π ππ (π1, π2) = (3 β 3,3)(3 β 3,3) + (3 β 3,6)(4 β 3.6)
β(3 β 3,3)2+(3 β 3,6)2 π₯ β(3 β 3,3)2+ (4 β 3,6)2
= (β0,3)(β0,3) + (β0,6)(0,4)
β(β0,3)2+(β0,6)2 π₯ β(β0,3)2+ (0,4)2
= 0,09 + (β0,24)
β(0,09) + (0,36)π₯ β(0,09) + (0,16)
= 0,09 + (β0,24)
β (0,45) π₯ β(0,25)
= 0,09 + (β0,24) 0,67π₯ 0,5
92
= β0,15
0,33 = β0,44
Setelah melakukan penghitungan korelasi antar item dengan menggunakan algoritma Pearson Correlation, maka didapatkan hasil similarity pada tabel 4.8. Hasil pengukuran Pearson Correlation berupa klasifikasi kriteria similarity dengan rentang nilai -1 (sangat tidak mirip) sampai 1 (sangat mirip) dengan 0 sebagai nilai tengah (netral).
Tabel 4. 9 Similarity Item
Produk 1 Produk 2 Produk 3 Produk 4 Produk 5
Produk 1 1 -0,44 -0,83 -1 1
Produk 2 -0,44 1 1 -0,1 0
Produk 3 -0,83 1 1 0 -1
Produk 4 -1 -0,1 0 1 0
Produk 5 1 0 -1 0 1
2. Prediksi
Rating Prediction merupakan proses menentukan nilai prediksi dengan memanfaatkan rating item yang telah di rating oleh User pada suatu item yang akan direkomendasikan kepada User. Setelah mendapatkan nilai similarity antar item, proses selanjutnya adalah menentukan nilai prediksi pada item yang akan direkomendasikan. Dengan menggunakan penghitungan pada algoritma Weighted Sum (rumus persamaan 2.5).
Menurut (Lubis et al., 2020) kriteria similarity dikatakan mirip apabila nilainya lebih dari 0 atau 1. Maka dalam penghitungan nilai prediksi menggunakan Algoritma Weighted Sum, nilai similarity yang dipakai harus lebih besar dari 0, artinya nilai similarity yang digunakan hanyalah nilai yang mempunyai kriteria mirip dan sangat mirip.
Pada skenario ini, penulis akan menghitung nilai prediksi item yang belum di rating oleh User, yang nantinya akan dijadikan item rekomendasi untuk User. Contoh dapat dilihat pada tabel rating item 4.7 terdapat 2 pengguna yang belum me-rating pada Produk 3 yakni April dan Hafshah.
Selanjutnya, penulis akan menghitung nilai prediksi untuk Produk 3
93
terhadap kedua pengguna tersebut. Berikut cara penghitungan prediksi menggunakan penghitungan algoritma Weighted Sum (rumus persamaan 2.5):
Prediksi Produk-3 pada April:
π(π’, π) = βπβπππ’,πβ π ππ(π, π)
βπβππ ππ(π, π) π(π΄ππππ, π3) = 3π₯1
1 = 3
Prediksi Produk-3 pada Hafshah:
π(π’, π) = βπβπππ’,πβ π ππ(π, π)
βπβππ ππ(π, π) π(π΄ππππ, π3) = 3π₯1
1 = 3
Setelah dilakukan penghitungan prediksi dengan persamaan Weighted Sum, maka didapatkan hasil rekomendasi Produk 3 untuk User April pada dengan prediksi rating bernilai 3 dan User Hafshah pada Produk 3 dengan prediksi rating bernilai 3.