PENDAHULUAN
Latar Belakang Masalah
Rumusan Masalah
Batasan Masalah
Tujuan Penelitian
Manfaat Penelitian
TINJAUAN PUSTAKA
Penelitian pertama yang dilakukan oleh (Putri, Muchayan, & Kamisutara, 2020) membahas tentang sistem rekomendasi pemilihan pena yang dapat digunakan sebagai alat pemilihan pena bagi calon konsumen dan dapat meminimalisir terjadinya out-of-stock. Penelitian ini menggunakan metode content-based filtering dan term-frekuensi inverse document-frekuensi (TF-IDF) dari model information retrieval (IR). Penelitian lainnya dari (Larasati & Henry, 2021) membahas tentang sistem rekomendasi produk Emina Cosmetics sesuai minat dan kebutuhan pelanggan.
Tujuan dari penelitian ini adalah untuk merancang sebuah aplikasi yang dapat memberikan rekomendasi kosmetik Emina kepada pelanggan berdasarkan produk yang dicari sebelumnya. Penelitian ini menggunakan metode content based filtering, dimana metode ini digunakan untuk merekomendasikan produk berdasarkan ketersediaan konten atau deskripsi produk. Penelitian ketiga yang dilakukan oleh (Alkaff, Khatimi, & Eriady, 2020) membahas tentang penggunaan sistem rekomendasi dengan metode content-based filtering untuk memberikan rekomendasi buku berdasarkan kesamaan item, dianalisis fitur-fitur yang terdapat pada item berbobot kesamaan. pohon. .
Penelitian ini bertujuan untuk memudahkan pengunjung Perpustakaan Daerah Kalimantan Selatan dalam mendapatkan buku sesuai keinginannya. Penelitian keempat (Fiarni, Maharani, & Calista, 2019) tentang sistem rekomendasi pada perusahaan pewarna tekstil PT. Metode yang digunakan dalam penelitian ini adalah cosine-similarity untuk menghitung skor kemiripan produk dan content-based filtering untuk menghitung skor model rekomendasi pelanggan.
Penelitian ini menggunakan metode content-based filtering yang memberikan rata-rata tingkat kemiripan hingga 0,6684, dan diperoleh hasil pengujian kinerja dan pengujian sistem menunjukkan bahwa sistem pemberi rekomendasi dapat berjalan dengan baik dengan waktu respon rata-rata 3,5 detik. Menghasilkan sistem rekomendasi pemilihan pulpen yang dapat digunakan sebagai alat untuk memilih pulpen oleh calon konsumen dan dapat meminimalisir terjadinya out-of-stock. Sistem rekomendasi yang dibuat memberikan akurasi sebesar 96,5% sehingga dapat dikatakan sangat akurat dan sesuai dengan kebutuhan pelanggan.
Menghasilkan sistem rekomendasi musik yang memenuhi preferensi pengguna dengan nilai rata-rata derajat kesamaan musik hingga 0,6684. Selain itu, terdapat penelitian sebelumnya yang menggunakan kesamaan pohon tertimbang untuk mengukur kesamaan teks, sedangkan penelitian ini menggunakan kesamaan kosinus.
LANDASAN TEORI
- E-Commerce
- Female Daily
- Skincare
- Text Mining
- Vektorisasi Kata
- Text Pre-processing
- TF-IDF
- Cosine Similarity
- Sistem Rekomendasi
- Collaborative Filtering
- Content-Based Filtering
Kesamaan Kosinus adalah ukuran kesamaan yang lebih umum digunakan dalam pengambilan informasi dan merupakan ukuran sudut antara vektor dokumen Da (titik (ax, bx)) dan Db (titik (ay, by)). Cosine kesamaan juga merupakan algoritma dalam text mining yang berfungsi untuk mengklasifikasikan suatu dokumen atau teks dengan konsep normalisasi panjang vektor dengan membandingkan dokumen A dan B. Sebaliknya jika nilai cosine kemiripannya mendekati 1 maka teks A dan B semakin mirip dengan B (Samuel, Natan, Fitria, & Syafiqoh, 2018).
Metode penyaringan berbasis konten menghasilkan rekomendasi berdasarkan hasil analisis kemiripan item yang telah dinilai oleh pengguna. Setelah menghitung skor TF-IDF, peneliti menentukan topik mana yang mendekati topik yang dipilih dengan menggunakan metode cosine kemiripan. Metode analisis yang digunakan dalam penelitian ini adalah metode content-based filtering yang menggunakan konsep perhitungan vektor pada teks, yang kemudian dilakukan pembobotan TF-IDF, kemudian dicari nilai kemiripan dokumen pembanding dengan tes. dokumen menggunakan metode Cosine Miripity untuk membuat rekomendasi produk yang mirip dengan produk, apa yang diinginkan berdasarkan konten produk yaitu merek dan review.
Perhitungan cosine kemiripan digunakan untuk mencari nilai kemiripan antara review produk yang satu dengan review produk lainnya dengan menghasilkan rekomendasi yang sesuai dengan spesifikasi. Disini peneliti akan mencari 5 dokumen yang paling mirip dengan dokumen ke 14716 dengan cara mencari nilai cosine kemiripan yang diurutkan dari nilai terbesar seperti pada Tabel 5.7. Berdasarkan hasil nilai cosine kemiripan diperoleh rekomendasi produk yang mempunyai nilai cosine kemiripan terbesar.
Antioxidant Serum”, akan muncul 5 rekomendasi produk perawatan kulit serupa dengan produk tersebut, berdasarkan perhitungan menggunakan metode content based filtering. Berdasarkan Tabel 5.9 terlihat bahwa produk “Serum Antioksidan” dan produk “Busa Pembersih Antioksidan” memiliki kesamaan review dari pengguna, hal ini sesuai dengan nilai cosine samerity yang cukup tinggi yaitu 87%. Untuk merekomendasikan produk perawatan kulit berdasarkan review Female Daily menggunakan pendekatan content-based filtering, dimulai dari pra-pemrosesan data hingga pembersihan data, kemudian dilakukan pembobotan Term Frekuensi-Inverse Document Frekuensi (TF-IDF) yang berfungsi untuk mencari mengetahui seberapa penting suatu kata dalam sekelompok kata atau dokumen, kemudian berdasarkan hasil pembobotan TF-IDF dilakukan perhitungan cosine kemiripan untuk menentukan nilai kemiripan antara kedua dokumen tersebut.
Hasil rekomendasi yang diperoleh memberikan lima rekomendasi produk kepada pengguna sebagai contoh, berdasarkan review produk “Antioxidant Serum” yaitu “Antioxidant Cleansing Foam”, “Antioxidant Toner”, “Antioxidant Soothing Gel”, “Antioxidant Night Cream” dan “Antioxidant Night Cream” Krim Pagi” dengan nilai cosinus-similarity masing-masing. Sistem rekomendasi mata kuliah yang dipilih menggunakan metode penyaringan kolaboratif berbasis pengguna berdasarkan algoritma cosine kesamaan yang dimodifikasi.
METODOLOGI PENELITIAN
Populasi dan Sampel Data
Populasi dalam penelitian ini adalah seluruh pengguna produk perawatan kulit dan review pengguna produk pada website https://femaledaily.com/.
Variabel Penelitian
Metode Pengambilan Data
Sampel yang digunakan adalah data dari empat kategori skin care yaitu pelembab, perawatan, masker dan pembersih dengan total 22 subkategori (face wash, oil, toner, dll). Data berisi empat kategori perawatan kulit, 22 sub-perawatan. kategori, dan jumlah produk, pada setiap subkategori dengan jumlah total 26915 produk.
Metode Analisis Data
Diagram Alir Penelitian
Analisis deskriptif digunakan untuk menunjukkan gambaran keseluruhan data yang diperoleh dari review produk perawatan kulit bekas di Femaledail. Gambar 5.2 menunjukkan rata-rata jumlah review produk perawatan kulit berdasarkan kategori dan subkategori perawatan kulit. Hal ini menunjukkan rata-rata skor produk perawatan kulit cukup baik, lebih dari 3 pada rentang 0-4.
Hal ini membuktikan bahwa sebagian besar produk perawatan kulit yang beredar di pasaran saat ini memiliki kualitas yang cukup baik dan tentunya telah melalui beberapa penelitian sehingga dapat menarik perhatian banyak orang. Dokumen 14726, produk serum dan esens Raiku Beauty bernama "Serum Antioksidan", akan menampilkan 5 produk serupa dengan dokumen ini. Berdasarkan hasil pada Tabel 5.7, 5 hasil teratas berikutnya direkomendasikan untuk produk yang tercantum pada Tabel 5.8.
Misalnya saja pengguna produk “Serum Antioksidan” menulis review yang berisi kesan menggunakan produk tersebut atau kondisi kulit yang cocok dengan produk tersebut, maka hasil rekomendasi produk tersebut akan memiliki ulasan pengguna yang mirip dengan produk “Serum Antioksidan” . . Pengguna kemudian akan diarahkan ke halaman berikutnya yang berisi rekomendasi perawatan kulit yang sesuai untuk produk tersebut, yakni lima produk perawatan kulit.
HASIL DAN PEMBAHASAN
Analisis Deskriptif
Berdasarkan Gambar 5.1, Anda dapat melihat 10 merek perawatan kulit teratas yang paling banyak diulas oleh pengguna Femaledaily. Sumbu x (horizontal) menjelaskan nama merek perawatan kulit, sedangkan sumbu y (vertikal) menjelaskan jumlah ulasan pengguna perawatan kulit di Femaledaily. Dari total 502 brand skincare yang masuk dalam data, brand Innisfree memiliki jumlah review terbanyak yakni 660 review, disusul brand The Body Shop dengan 654 review, dan seterusnya.
Banyaknya review yang dimiliki suatu brand dapat menunjukkan bahwa popularitas brand tersebut cukup tinggi. Peringkat rata-rata tertinggi diberikan kepada produk pada subkategori minyak, lembaran masker, dan serum.
Pre-processing Data
- Case Folding
- Tokenizing
- Filtering
- Stemming
Recomended banget, awalnya aku pakai ini karena mau coba exfoliate kulitku, tapi karena belum pernah pakai, efeknya banget, hidungku jadi lebih mulus, komedo di hidung berkurang dan wajah jadi lebih halus, bukan berminyak juga dan gak bikin mukaku kering. Selama aku pakai ini mukaku gak ada jerawat berlebih dan mukaku baik-baik saja itu lebih bagus lagi. Rekomendasinya dipakai dua hari sekali kalau malam, tapi bisa juga dipakai sehari sekali kalau malam, dan biasanya saya pakai kalau malam, kadang sehari sekali, kadang dua hari sekali.
Pada tahap tokenisasi, dilakukan proses pemisahan teks menjadi bagian-bagian yang disebut token, atau dengan kata lain membagi kalimat menjadi kata-kata untuk kemudian dianalisis. Pada tahap ini juga dilakukan proses penghilangan spasi yaitu penghilangan spasi dan proses penghilangan tanda baca yaitu penghilangan simbol atau tanda baca seperti titik, koma, tanda tanya, tanda seru dan lain sebagainya, karena tanda baca mempunyai tidak ada artinya dalam analisis teks. 29 bahkan di malam hari dan biasanya saya pakai di malam hari, kadang sehari sekali, kadang sehari sekali.
Pada tahap filtering dilakukan proses penghilangan kata-kata umum yang biasanya muncul dalam jumlah besar dan dianggap tidak mempunyai arti. Pada tahap akhir yaitu stemming, dilakukan proses pencarian kata dasar atau kata dasar dari setiap kata hasil proses normalisasi. Pada tahap ini dilakukan proses pengambilan berbagai bentuk kata dalam representasi yang sama dan menghilangkan imbuhan (prefiks dan sufiks).
Term Frekuensi Inverse Document Frekuensi (TF-IDF) Bobot Bobot TF-IDF merupakan proporsi kata (istilah) dalam suatu dokumen yang akan diberi nilai bobot. Metode ini menggabungkan dua konsep penghitungan bobot, yaitu frekuensi kemunculan suatu kata dalam suatu dokumen yang disebut Term Frekuensi (TF) dan frekuensi invers dokumen yang mengandung kata yang disebut Inverse Document Frekuensi (IDF). Peneliti mengambil beberapa kata dari dokumen tersebut seperti “bersih”, “cocok”, “wajah”, “jerawat”, “kering” dan “kulit”.
IDF merupakan nilai ln dari jumlah seluruh dokumen dibagi dengan jumlah dokumen yang mengandung kata terpilih (df) seperti pada Persamaan 3.2. Misalnya untuk kata “wajah”, ketika nilai df dihitung maka akan ditampilkan jumlah dokumen yang mengandung kata tersebut.
Cosine Similarity
Semakin sering sebuah kata muncul dalam sebuah dokumen, semakin tinggi bobot hubungan antara sebuah kata dan sebuah dokumen. Sebaliknya, jika kemunculan suatu kata dalam suatu dokumen sedikit, maka bobot hubungan antara suatu kata dengan suatu dokumen akan semakin rendah.
Hasil Rekomendasi
Tampilan Website
Dapat menambahkan analisis sentimen pada ulasan untuk mengklasifikasikan ulasan positif dan negatif suatu produk. Perancangan dan pengembangan aplikasi rekomendasi wisata museum di Jakarta menggunakan metode Collaborative Filtering berbasis elemen berbasis Android. Tapi saat pertama kali pakai bingung banget kenapa gak boleh karena menurutku sabun mukanya oke kalau di mattify tapi ternyata malah membantu menghilangkan jerawat, aku pakai dari bulan April 2019, belum pernah.
PENUTUP
Kesimpulan
Saran