Tahap Perancangan Proses - Tahap Design System

4.2 Tahap Design System

4.2.1 Tahap Perancangan Proses

Sistem rekomendasi berbasis Hybrid ini dibangun dengan menggunakan dua metode dalam satu sistem, yang mana pada metode ini

menggunakan teknik Switching dalam menerapkan hasil rekomendasinya.

Sebagaimana yang telah dijelaskan pada bab sebelumnya, teknik Switching akan memberikan hasil rekomendasi dengan cara memilih salah satu metode yang digunakan sesuai dengan kebutuhan yang tersedia, dan tidak akan menampilkan metode lainnya. Misal, pada metode Content Based Filtering, sistem akan merekomendasikan produk kepada User berdasarkan kriteria yang sesuai dengan item/produk yang ada. Dan pada metode Collaborative Filtering dengan pendekatan item-based, sistem akan menampilkan hasil rekomendasi berdasarkan penghitungan rating jika User sudah me-rating item tersebut.

Skenario pertama dalam proses ini sistem hanya bisa menampilkan rekomendasi berdasarkan metode Content Based Filtering yaitu dengan menyesuaikan kriteria suatu item yang sedang pengguna lihat untuk menghasilkan rekomendasi item baru yang sejenis. Dengan menggunakan algoritma TF-IDF sebagai penghitungan dalam mencari rekomendasi berdasarkan kriteria yang sama. Pada skenario kedua, jika User telah memberikan rating pada suatu item maka sistem akan menampilkan hasil rekomendasi lagi berdasarkan rating dengan metode Collaborative Filtering. Penghitungan dengan metode Collavorative Filtering dilakukan dengan dua tahap, yaitu similarity dan prediksi. Similarity dihitung dengan menggunakan algoritma Pearson Correlation Based Similarity untuk mencari korelasi terbaik antar item dan algoritma Weighted Sum digunakan menghitung hasil prediksi. Hasil prediksi adalah hasil yang akan dijadikan rekomendasi untuk User.

Pada gambar 4.1 terdapat flowchart alur proses sistem. Dari awal seorang pengguna ditampilkan seluruh produk yang tersedia, hingga mendapatkan hasil rekomendasinya. Pada proses ini terdapat dua bagian, yaitu saat menerapkan metode Content Based Filtering dan metode Collaborative Filtering, yang akan dibahas satu persatu.

Gambar 4. 1 Alur Proses

4.2.1.1 Proses penghitungan dengan metode Content Based Filtering Seperti yang sudah dijelaskan pada bab sebelumnya, Content Based Filtering merupakan metode rekomendasi yang mempunyai teknik dengan menyamakan atribut item dan merekomendasikan item baru yang mempunyai karakteristik atau kemiripan atribut yang dimiliki item tersebut.

Tahapan pada proses dalam metode Content Based Filtering dapat dijelaskan sebagai berikut:

1. Menentukan query.

2. Bandingkan atribut item

3. Penghitungan Algoritma TF-IDF.

4. Hasil rekomendasi, didapat dari nilai bobot paling tertinggi- terendah.

Gambar 4. 2 Alur Proses Metode Content Based Filtering

Dalam tahap ini, atribut yang menjadi pertimbangan dalam menentukan kriteria kemiripan antar produk adalah jenis kulit (skin type) dan kategori produk, yang dapat dilihat pada tabel berikut:

Tabel 4. 1 Atribut Item

Kategori Produk Jenis Kulit (Skin Type)

Facial Wash Normal

Toner Kering

Moisturizer Berminyak

Mask Sensitif

Sunscreen

Sebagai contoh penghitungan, dengan mengambil sampel 1 data produk skin care yang menjadi query dari penghitung yang akan dicari rekomendasinya sesuai dengan kemiripan antar atribut produk tersebut.

Dalam hal ini, penulis akan mengambil skenario contoh data dengan menggunakan 20 data produk skin care sebagai data penghitungan.

Tabel 4. 2 Data Produk Skin care

83 Kode

Produk Brand Produk Nama Produk Kategori Skin Type

P1 COSRX

AC Collection Calming Foam Cleanser

Facial

Wash Berminyak

P2 ELSHESKIN Oily Cleanser Wash Facial

Wash Berminyak

P3 SAFI Acne Clarifying

2in1 Cleanser

Facial

Wash Berminyak

P4 SAFI White Expert 2in1

Cleanser & Toner

Facial

Wash Kering

BIO BEAUTY

LAB Luxurious Face Oil Moisturizer Berminyak P6 ELSHESKIN Hydra Boost Oil

Free Moisturizer Moisturizer Berminyak

P7 POND'S

PONDS BRIGHT BEAUTY PERF CRM OILY

Moisturizer Berminyak

P8 BIODERMA Hydrabio Gel-

Creme 40 ml Moisturizer Kering

P9 NPURE Cica Chocomint

Clay Mask Mask Berminyak

P10 SNP

Charcoal Mineral Black Ampoule Mask

Mask Berminyak

P11 WHITELAB Mugwort Pore

Clarifying Mask Mask Berminyak P12

PHILOCALY SKIN

Peel Off Mask

Peach Mask Kering

P13 NPURE Noni Probiotics Toner Sensitif

"Balance Me" Fine Toner

P14 INNISFREE Blueberry

Rebalancing Skin Toner Kering P15

JARTE

BEAUTY CICA Care Toner Toner Normal

P16

PURIVERA BOTANICALS

White Willow Toner Essence - Centella BHA Willow Bark 2% As Salicylic Acid Alternative

Toner Normal

P17 ERHA

Perfect Shield Sunscreen Normal to Dry Skin

Sunscreen Kering

P18 NEUTROGENA

Ultra Sheer Dry - Touch Sunscreen SPF 50+

Sunscreen Kering

P19 POND'S

Bright Beauty Skin Perfecting Cream SPF30

Sunscreen Kering

P20 AZARINE Hydrasoothe

Sunscreen Mist Sunscreen Normal

1. Menentukan query

Contoh pengambilan data dalam penghitungan pembobotan kata pada penelitian ini, penulis akan mengambil skenario data pada produk-1 yang dijadikan sebagai query yang akan dicari rekomendasi produk nya berdasarkan penghitungan algoritma TF-IDF. Adapun profile yang ada pada produk-1 adalah sebagai berikut:

Kode Produk : P1

85 Brand : COSRX

Nama Produk : AC Collection Calming Foam Cleanser Kategori : Facial Wash

Skin Type : Berminyak

2. Bandingkan Atribut Item

Atribut yang dibandingkan adalah kategori dan jenis kulit (skin type).

Didapatkan hasil sebagai berikut:

Tabel 4. 3 Atribut Item Pereferensi Pengguna Kode Produk Kategori Skin Type

Q P1 Facial Wash Berminyak

P2 Facial Wash Berminyak

P3 Facial Wash Berminyak

P4 Facial Wash Kering

P5 Moisturizer Berminyak

P6 Moisturizer Berminyak

P7 Moisturizer Berminyak

P8 Moisturizer Kering

P9 Mask Berminyak

P10 Mask Berminyak

P11 Mask Berminyak

P12 Mask Kering

P13 Toner Sensitif

P14 Toner Kering

P15 Toner Normal

P16 Toner Normal

P17 Sunscreen Kering

P18 Sunscreen Kering

P19 Sunscreen Kering

P20 Sunscreen Normal

86 3. Penghitungan Algoritma TF-IDF

Berdasarkan penentuan atribut item yang terdapat pada Tabel 4.4, maka langkah pertama dalam penghitungan algoritma TF-IDF adalah dengan melakukan pembobotan kata atau term frequency (tf) antara query dengan produk lain (rumus persamaan 2.1) maka hasilnya:

Tabel 4. 4 Term Frequency (TF)

Kode Produk Kategori Skin Type

Q P1 Facial Wash Berminyak

P2 1 1

P3 1 1

P4 1 0

P5 0 1

P6 0 1

P7 0 1

P8 0 0

P9 0 1

P10 0 1

P11 0 1

P12 0 0

P13 0 0

P14 0 0

P15 0 0

P16 0 0

P17 0 0

P18 0 0

P19 0 0

P20 0 0

Berdasarkan tabel 4.4, hasil dari pembobotan kata atau term frequency (tf) adalah nilai kemunculan atribut item yang menjadi term pada masing- masing produk. Tahap selanjutnya adalah menghitung nilai inverse document frequency (IDF), dengan menggunakan rumus persamaan 2.2.

Tabel 4. 5 Penghitungan IDF

Q Kode Kategori Skintype

P1 Facial Wash Berminyak

TF 1+1+1 1+1+1+1+1+1+1+1

DF 3 8

𝑖𝑑𝑓_𝑖 = 𝑙𝑜𝑔 ( 𝑛

𝑑𝑓_𝑖) 𝑙𝑜𝑔 (20

3) 𝑙𝑜𝑔 (20 8)

IDF 0.82 0.39

IDF + 1 1.82 1.39

Berdasarkan tabel 4.5, didapat hasil IDF dari masing-masing atribut.

Di mana nilai DF adalah jumlah keseluruhan data pada kemunculan TF, dan n/df adalah jumlah data dibagi dengan nilai df. Kemudian, nilai IDF adalah log dari n/df. Selanjutnya adalah penghitungan bobot (W) pada masing- masing produk dengan menggunakan rumus persamaan 2.3 untuk mencari hasil rekomendasi terbaik. Berikut tabel untuk nilai bobot (W):

Tabel 4. 6 Nilai Bobot (W) Kode Produk Kategori Skin Type

Jumlah Bobot

Q P1 Facial Wash Berminyak

P2 1.82 1.39 3.21

P3 1.82 1.39 3.21

P4 1.82 0 1.82

P5 0 1.39 1.39

P6 0 1.39 1.39

P7 0 1.39 1.39

P8 0 0 0

P9 0 1.39 1.39

P10 0 1.39 1.39

P11 0 1.39 1.39

P12 0 0 0

P13 0 0 0

P14 0 0 0

P15 0 0 0

P16 0 0 0

P17 0 0 0

P18 0 0 0

P19 0 0 0

P20 0 0 0

4. Hasil Rekomendasi

Berdasarkan tabel 4.6 maka rekomendasi dapat diurutkan dari nilai paling tertinggi – terendah, yaitu didapatkan hasil 3.21, 1.82, dan 1.39

Dari hasil penghitungan di atas didapatkan hasil untuk rekomendasi berdasarkan metode Content Based Filtering dengan menggunakan algoritma TF-IDF dengan bobot tertinggi terdapat pada P2 “ELSHESKIN Oily Cleanser Wash” dan P3 “SAFI Acne Clarifying 2in1 Cleanser”

dengan nilai masing-masing 3.21. Maka dapat disimpulkan bahwa rekomendasi yang akan muncul paling pertama saat pengguna memilih P1 adalah P2 dan P3.

4.2.1.2 Proses penghitungan dengan metode Collaborative Filtering Sistem rekomendasi dengan menggunakan metode Collaborative Filtering melakukan penghitungan dengan memanfaatkan rating yang diberikan pengguna pada suatu item. Metode ini memiliki dua pendekatan, yaitu User-based dan item-based. Pendekatan User-based berfokus pada tingkat kemiripan rating antar pengguna aktif dengan pengguna lain, sedangkan pendekatan item-based berfokus pada kemiripan antar item yang telah di rating oleh User. Pada penelitian ini, penulis menggunakan metode Collaborative Filtering dengan pendekatan berdasarkan item-based untuk proses rekomendasi produk skin care berdasarkan rating.

Pemberian skala rating menggunakan skala likert dengan nilai 1 sampai 5. Skala dengan penilaian 1 artinya produk sangat jelek, 2 jelek, 3 biasa, 4 bagus, dan 5 sangat bagus. Skala ini dipilih dikarenakan penggunaannya yang sangat umum dalam menggambarkan pemberian nilai tertinggi terhadap suatu produk/item.

Proses pemberian rating dilakukan secara eksplisit, artinya User secara sadar memberikan rating pada suatu item yang ada pada sistem.

Tahapan pada proses ini adalah sebagai berikut:

1. Similarity

Mencari nilai kesamaan antar item dengan menggunakan algoritma Pearson Correlation Based Similarity.

2. Prediksi

Menghitung nilai prediksi item yang akan direkomendasikan pada User dengan menggunakan algoritma Weight Sum.

Gambar 4. 3 Alur Proses Metode Collaborative Filtering

Sebagai contoh penghitung, pada proses ini penulis akan memberikan tabel skenario User dan rating item produk skin care. Tabel berisi 5 produk skin care, dan 5 User yang telah me-rating item.

Tabel 4. 7 Skenario Rating Item

Produk 1 Produk 2 Produk 3 Produk 4 Produk 5

Nadhila 4 5 4

April 3 3

Hafshah 3 3 4

Ulfa 3 4 4

91 1. Similarity

Proses similarity merupakan proses penghitungan nilai korelasi antar item. Pada penelitian ini penulis melakukan penghitungan dengan pendekatan item-based yang artinya mencari kesamaan antara 2 item yang telah sama-sama di rating oleh User. Pada penelitian ini, similarity dipakai untuk menghitung kemiripan nilai antara satu produk dengan produk lainnya.

Sebelum menghitung nilai similarity, langkah pertama yang dilakukan adalah mencari nilai rata-rata rating yang diberikan oleh User rata-rata rating dapat dilihat pada tabel berikut:

Tabel 4. 8 Rata-rata Rating User

Produk1 Produk2 Produk3 Produk4 Produk5 Rata-rata

Nadhila 4 5 4 4,3

April 3 3 3

Hafshah 3 3 4 3,3

Ulfa 3 4 4 3,6

Setelah nilai rata-rata rating telah di dapat, selanjutnya adalah menghitung nilai similarity menggunakan algoritma Pearson Correlation Based Similarity (rumus persamaan 2.4). Sebagai contoh, peneliti akan menghitung korelasi antara Produk-1 dan Produk-2.

𝑠𝑖𝑚 (𝑘, 𝑙) = ∑ 𝑢 ∈ 𝑈(𝑅_𝑢,𝑘− 𝑅̅𝑘)(𝑅𝑢,𝑙− 𝑅̅𝑙)

√∑ 𝑢 ∈ 𝑈(𝑅_𝑢,𝑘− 𝑅̅𝑘)²√∑ 𝑢 ∈ 𝑈(𝑅_𝑢,𝑙− 𝑅̅𝑙)²

𝑠𝑖𝑚 (𝑃1, 𝑃2) = (3 − 3,3)(3 − 3,3) + (3 − 3,6)(4 − 3.6)

√(3 − 3,3)²+(3 − 3,6)² 𝑥 √(3 − 3,3)²+ (4 − 3,6)²

= (−0,3)(−0,3) + (−0,6)(0,4)

√(−0,3)²+(−0,6)² 𝑥 √(−0,3)²+ (0,4)²

= 0,09 + (−0,24)

√(0,09) + (0,36)𝑥 √(0,09) + (0,16)

= 0,09 + (−0,24)

√ (0,45) 𝑥 √(0,25)

= 0,09 + (−0,24) 0,67𝑥 0,5

= −0,15

0,33 = −0,44

Setelah melakukan penghitungan korelasi antar item dengan menggunakan algoritma Pearson Correlation, maka didapatkan hasil similarity pada tabel 4.8. Hasil pengukuran Pearson Correlation berupa klasifikasi kriteria similarity dengan rentang nilai -1 (sangat tidak mirip) sampai 1 (sangat mirip) dengan 0 sebagai nilai tengah (netral).

Tabel 4. 9 Similarity Item

Produk 1 Produk 2 Produk 3 Produk 4 Produk 5

Produk 1 1 -0,44 -0,83 -1 1

Produk 2 -0,44 1 1 -0,1 0

Produk 3 -0,83 1 1 0 -1

Produk 4 -1 -0,1 0 1 0

Produk 5 1 0 -1 0 1

2. Prediksi

Rating Prediction merupakan proses menentukan nilai prediksi dengan memanfaatkan rating item yang telah di rating oleh User pada suatu item yang akan direkomendasikan kepada User. Setelah mendapatkan nilai similarity antar item, proses selanjutnya adalah menentukan nilai prediksi pada item yang akan direkomendasikan. Dengan menggunakan penghitungan pada algoritma Weighted Sum (rumus persamaan 2.5).

Menurut (Lubis et al., 2020) kriteria similarity dikatakan mirip apabila nilainya lebih dari 0 atau 1. Maka dalam penghitungan nilai prediksi menggunakan Algoritma Weighted Sum, nilai similarity yang dipakai harus lebih besar dari 0, artinya nilai similarity yang digunakan hanyalah nilai yang mempunyai kriteria mirip dan sangat mirip.

Pada skenario ini, penulis akan menghitung nilai prediksi item yang belum di rating oleh User, yang nantinya akan dijadikan item rekomendasi untuk User. Contoh dapat dilihat pada tabel rating item 4.7 terdapat 2 pengguna yang belum me-rating pada Produk 3 yakni April dan Hafshah.

Selanjutnya, penulis akan menghitung nilai prediksi untuk Produk 3

terhadap kedua pengguna tersebut. Berikut cara penghitungan prediksi menggunakan penghitungan algoritma Weighted Sum (rumus persamaan 2.5):

Prediksi Produk-3 pada April:

𝑃(𝑢, 𝑗) = ∑𝑖∈𝑗𝑟𝑢,𝑖∗ 𝑠𝑖𝑚(𝑖, 𝑗)

∑_𝑖∈𝑗𝑠𝑖𝑚(𝑖, 𝑗) 𝑃(𝐴𝑝𝑟𝑖𝑙, 𝑃3) = 3𝑥1

1 = 3

Prediksi Produk-3 pada Hafshah:

𝑃(𝑢, 𝑗) = ∑𝑖∈𝑗𝑟𝑢,𝑖∗ 𝑠𝑖𝑚(𝑖, 𝑗)

∑𝑖∈𝑗𝑠𝑖𝑚(𝑖, 𝑗) 𝑃(𝐴𝑝𝑟𝑖𝑙, 𝑃3) = 3𝑥1

1 = 3

Setelah dilakukan penghitungan prediksi dengan persamaan Weighted Sum, maka didapatkan hasil rekomendasi Produk 3 untuk User April pada dengan prediksi rating bernilai 3 dan User Hafshah pada Produk 3 dengan prediksi rating bernilai 3.

Dalam dokumen SISTEM REKOMENDASI PRODUK SKIN CARE MENGGUNAKAN METODE HYBRID (Halaman 76-90)