Market Basket Analysis Menggunakan Algoritma Apriori dan FP Growth untuk Menentukan Pola Pembelian Konsumen
Reski Noviana1,*, Arief Hermawan1, Donny Avianto2
1Fakultas Pascasarjana, Program Studi Magister Teknologi Informasi, Universitas Teknologi Yogyakarta, Sleman, Indonesia
2Fakultas Sains dan Teknologi, Program Studi Informatika, Universitas Teknologi Yogyakarta, Sleman, Indonesia Email: 1,*[email protected], 2[email protected], 3[email protected]
Email Penulis Korespondensi: [email protected]
Abstrak−Peningkatan data transaksi penjualan setiap hari akan menyebabkan penyimpanan data transaksi penjualan produk dalam jumlah yang sangat besar. Dalam kebanyakan kasus, data yang berkaitan dengan transaksi penjualan yang sangat besar hanya disimpan dan digunakan untuk arsip, tidak dieksploitasi secara memadai. Dalam pemasaran ritel, data mining asosiasi digunakan untuk menyelidiki pola pembelian produk. Namun, jika perusahaan tidak mengetahui pola pembelian pelanggan dapat berdampak seperti strategi pemasaran tidak tepat, penurunan retensi pelanggan, kehilangan peluang bisnis, kurang personalisasi, persaingan sulit, inefisiensi stok/produksi, kehilangan kepercayaan pelanggan. Mengetahui pola pembelian konsumen, maka perusahaan dapat menyusun strategi penjualan dan membuat keputusan dengan tepat Pada penelitian ini menggunakan Market Basket Analysis menggunakan Algoritma Apriori dan FP-Growth untuk menentukan pola pembelian konsumen. Hasil penelitian ini menghasilkan dua kombinasi itemset. Kombinasi yang pertama yaitu jika pembeli membeli yogurt dan sausage (sosis) maka pembeli juga membeli whole milk (susu). Nilai support yang dihasilkan yaitu 0.00147 (0.0147%), nilai confidence 0.255814 (25.58%) dan nilai liftnya 1.61986. kombinasi yang kedua yaitu jika pembeli membeli sausage (sosis), dan rools/buns (roti gulungan), maka juga membeli whole milk (susu), kombinasi ini menghasilkan nilai support 0.001136 (0.0113%), confidence 0.2125 (21.25%) dan lift 1.34559. Selain kombinasi itemset yang dihasilkan pada penelitian ini juga mengukur kecepatan komputasi pada pengolahan data Groceries untuk Market Basket Analysis. Kecepatan komputasi yang dihasilkan oleh Algoritma Apriori yaitu 3.1765 detik, sedangkan algoritma FP-Growth adalah 0.15892 detik.
Selisih kecepatan komputasi antara Algoritma Apriori dan FP-Growth adalah 3.0176 detik.
Kata Kunci: Market Basket Analysis; Apriori; FP-Growth
Abstract-An increase in sales transaction data every day will cause a very large amount of product sales transaction data to be stored. In most cases, data relating to very large sales transactions are only stored and used for archival purposes, not exploited adequately. In retail marketing, association data mining is used to investigate product purchasing patterns. However, if the company does not know the customer's purchasing patterns, it can have impacts such as inappropriate marketing strategies, decreased customer retention, lost business opportunities, lack of personalization, tough competition, stock/production inefficiencies, loss of customer trust. Knowing consumer purchasing patterns, the company can develop sales strategies and make the right decisions. In this study using Market Basket Analysis using the Apriori Algorithm and FP-Growth to determine consumer buying patterns. The results of this study resulted in two itemset combinations. The first combination is that if th e buyer buys yogurt and sausage, the buyer also buys whole milk. The resulting support value is 0.00147 (0.0147%), the confidence value is 0.255814 (25.58%) and the lift value is 1.61986. the second combination, namely if the buyer buys sausage (sausages) and rolls/buns (bread rolls), then also buys whole milk (milk), this combination produces a support value of 0.001136 (0.0113%), a confidence of 0.2125 (21.25%) and a lift of 1.34559 . In addition to the combination of the itemset produced in this study, it also measures computational speed in processing Groceries data for Market Basket Analysis. The computational speed produced by the Apriori Algorithm is 3.1765 seconds, while the FP-Growth algorithm is 0.15892 seconds. The difference in computational speed between the Apriori Algorithm and FP-Growth is 3.0176 seconds.
Keywords: Market Basket Analysis; Apriori; FP-Growth
1. PENDAHULUAN
Teknologi informasi memasuki dunia bisnis untuk menciptakan persaingan bisnis dalam perdagangan global dengan ekonomi pasar bebas, hal ini memaksa para pelaku bisnis untuk selalu mempertimbangkan strategi dan terobosan terbaru untuk dapat memenuhi permintaan pelanggan yang terus meningkat sehingga dapat mempertahankan dan mengembangkan bisnisnya [1]. Keadaan industri ritel saat ini membuat persaingan semakin sengit dari sebelumnya. Sektor retail belum mampu menangani permasalahan yang sering berdampak pada bisnis karena pertumbuhannya yang pesat, termasuk sistem yang mengatur penataan produk. Kenyamanan konsumen ditingkatkan dengan sistem yang mengatur tata letak produk selama proses pembelian. Sejumlah pelaku usaha juga tidak mengetahui pola perilaku konsumen, seperti ketika pelanggan membeli beragam produk secara bersamaan [2].
Peningkatan data transaksi penjualan setiap hari akan menyebabkan penyimpanan data transaksi penjualan produk dalam jumlah yang sangat besar. Dalam kebanyakan kasus, data yang berkaitan dengan transaksi penjualan yang sangat besar hanya disimpan dan digunakan untuk arsip, tidak dieksploitasi secara memadai. Meskipun dimungkinkan untuk menggali lebih dalam data transaksi penjualan yang sangat besar yang dapat menghasilkan informasi yang bermanfaat. Manusia tidak dapat membaca dan menganalisis volume transaksi penjualan yang sangat besar secara manual. Pola pembelian produk konsumen tercermin dari data mengenai transaksi penjualan yang sangat besar, dan informasi tersebut dapat dikumpulkan melalui proses Data mining [3]. Tidak mengetahui pola pembelian pelanggan dapat berdampak seperti strategi pemasaran tidak tepat, penurunan retensi pelanggan,
kehilangan peluang bisnis, kurang personalisasi, persaingan sulit, inefisiensi stok/produksi, kehilangan kepercayaan pelanggan. Mengetahui pola pembelian konsumen, maka perusahaan dapat mempelajari pola dan barang yang sering di beli konsumen, sehingga perusahaan dapat menyusun strategi penjualan dan membuat keputusan dengan tepat [4].
Data mining asosiasi digunakan dalam pemasaran ritel untuk melihat kapan pelanggan membeli produk serta keterkaitan antar produk yang lebih mungkin dibeli pelanggan. Misalnya, saat pelanggan membeli mie, dalam banyak kasus, pelanggan juga membeli telur. Data mining dengan menggunakan aturan asosiasi antara produk di pasar ritel berperan penting untuk menciptakan strategi bisnis baru, strategi penawaran produk, kupon diskon, desain tata letak toko dan lainnya serta untuk membuat keputusan yang dapat mencapai tujuan perusaahaan serta dapat meningkatkan kepuasan pelanggan [5]. Pada penelitian ini, dilakukan perbandingan algoritma apriori dan FP-Growth untuk mengetahui asosiasi produk dan pola pembelian pelanggan. Perbandingan algoritma asosiasi ini dilakukan untuk melihat pola asosiasi yang terebntuk dan kecepatan pembentukan aturan asosiasi. Algoritma yang memiliki aturan asosiasi yang tepat dengan nilai confidence yang terbaik dan komputasi yang cepat dapat dimanfaatkan dalam mengetahui pola pelanggan.
Penelitian sebelumnya oleh [6] menyatakan Market Basket Analysis, juga dikenal sebagai analisis keranjang pasar, adalah studi tentang perilaku konsumen dalam hubungannya dengan kelompok-kelompok tertentu. Ketika mencoba untuk memahami sekumpulan data transaksi tetapi tidak yakin dengan pola yang tepat yang dicari, analisis keranjang pasar sering digunakan sebagai titik awal. Market Basket Analysis pada penelitian ini diterapkan pada pencarian pola pembelian sembako di toko sembako kemudian dianalisis berdasarkan musim.
Penelitian ini bertujuan untuk membandingkan metode Apriori, Apriori TID dan FP-Growth dalam menentukan perilaku transaksi konsumen dan menghitung kuantitas transaksi konsumen pada beberapa musim berdasarkan data yang diperoleh dari database Market Basket Analysis. Pada hasil penelitian ini diketahui bahwa FP-Growth memiliki performa terbaik diantara kedua algoritma lainnya, namun menggunakan memori yang lebih banyak dibandingkan algoritma lainnya. Algoritma Apriori-TID menggunakan memori yang lebih ringan dan lebih cepat daripada Algoritma Apriori.
Penelitian lain oleh [7] yang menggunakan asosiasi Data mining untuk menentukan paket sembako.
Menurut analisis 1805 transaksi dengan parameter minimal support = 0.06 dan confidence = 0.01, Algoritma Apriori menghasilkan 8 rule dalam waktu 0.03 detik yang lebih cepat dari algoritma lainnya. Hanya 2 kombinasi item yang dihasilkan, dengan kekuatan aturan 0,034326834 dan akurasi 35%, digabungkan. Metode FP-Growth, sebaliknya, membutuhkan waktu 0,09 detik lebih lama untuk dijalankan, menghasilkan 14 aturan asosiasi, dan dapat menggabungkan 3 kombinasi item dengan kekuatan aturan asosiasi lebih tinggi 0,198149889 dan nilai akurasi lebih tinggi 284%. Dua paket yang dihasilkan yaitu . Indomie Goreng Spesial, Indomie Ayam Bawang, dan Gula Pasir adalah paket satu. Mie Ayam Bawang Lezat, Mie Goreng Lezat, dan Gula Pasir merupakan paket kedua.
Penelitian oleh [8] menyatakan dengan menerapkan temuan Market Basket Analysis dari perhitungan asosiasi yang dibuat menggunakan teknik Frequent Pattern Growth, produk ditempatkan dalam relasi satu sama lain berdasarkan relasi antara produk yang sering dibeli. Penempatan produk di minimarket dapat dikontrol dengan hati-hati, yang akan meningkatkan kepuasan pelanggan dan meningkatkan penjualan. Secara keseluruhan, 152 aturan ditemukan dari data sampel penjualan, termasuk 24 aturan asosiasi yang cocok dengan minimum support 60% dan 108 aturan dengan tingkat confidence 90%.
Perbedaan penelitian ini dengan penelitian sebelumnya yaitu, pada penelitian sebelumnya hanya dilakukan analisis pola pembelian menggunakan algoitma asosiasi seperti Apriori, FP-Growth dan lain-lain. Pada penelitian ini, dilakukan perbandingan untuk melihat seberapa baik kinerja metode Apriori dan FP-Growth serta dilakukan Analisa waktu penjualan yang tepat dan produk yang populer.
Harapan dengan dilakukaknnya penelitian ini yaitu perusahaan dapat mengidentifikasi pola belanja pelanggan yang terjadi di toko serta perusahaan akan mendapatkan keuntungan, mengembangkan strategi penjualan yang tepat, dan mengelola persediaan dengan baik.
2. METODOLOGI PENELITIAN
2.1 Data mining
Data mining dapat mengambil informasi berguna dan pengetahuan terkait menggunakan teknik dari statistik, matematika, kecerdasan buatan, dan pembelajaran mesin dari basis data yang besar [9]. Metode untuk mengekstrak informasi dari repositori basis data besar, Data mining adalah pembelajaran mesin, identifikasi pola, basis data, statistik, dan teknik visualisasi. Saat mengekstraksi informasi secara manual dalam bentuk pengetahuan yang tidak dapat diketahui dari kumpulan data, penambangan data sangat penting [10]. Data mining dapat membantu pemilik bisnis membuat keputusan dan menawarkan solusi yang akan membantu mengembangkan perusahaan [11].
Data mining adalah teknik untuk mengungkap data rahasia dalam database dan merupakan langkah dalam prosedur Knowledge Discovery in Databases (KDD) untuk mengidentifikasi data dan tren penting. Metode Knowledge Discovery in Databases (KDD) memiliki tahapan sebagai berikut [12]:
1. Pemilihan data
Sebelum tahap penambangan informasi KDD dimulai, pemilihan data dari sekumpulan data operasional harus diselesaikan. Prosedur Data mining akan menggunakan data yang dipilih.
2. Pembersihan data dan pra-pemrosesan
Data yang menjadi fokus KDD harus terlebih dahulu menjalani proses pembersihan guna mempersiapkannya untuk data mining. Duplikat data harus dihilangkan, data yang tidak konsisten harus diperiksa, dan kesalahan data harus diperbaiki.
3. Transformasi Data
Transformasi data melibatkan perubahan atau modifikasi data agar sesuai format untuk proses data mining.
4. Data Mining
Penambangan data atau Data mining adalah proses menggunakan alat atau teknik khusus untuk mencari pola atau informasi menarik dalam sekumpulan data.
5. Interpretasi dan Evaluasi
Pola dan hasil data mining harus bisa dikomunikasikan kepada pihak yang berkepentingan dengan cara yang mudah dipahami, seperti menggunakan visualisasi atau tampilan yang dapat menjelaskan keluaran sistem.
2.2 Association Rule
Aturan asosiasi atau association rule, adalah salah satu pendekatan data mining yang dapat digunakan untuk menemukan aturan asosiatif item. Aturan asosiasi ini dibuat dengan mengidentifikasi hubungan yang paling signifikan dari pola data yang sering terjadi (frequent pattern) dengan menggunakan parameter support dan confidence. Support adalah indikasi metrik yang mengungkapkan seberapa sering item database muncul.
Sementara confidence menunjukkan seberapa sering suatu pernyataan tersebut akurat [13].
𝑆𝑢𝑝𝑝𝑜𝑟𝑡 𝑃(𝑋 ∩𝑌) = ΣTransaksi X dan Y
Total Transaksi (1)
𝐶𝑜𝑛𝑓𝑖𝑑𝑒𝑛𝑐𝑒 𝑃(𝑌/ 𝑋) = Nilai Support
ΣTransaksi X (2)
2.3 Market Basket Analysis
Market Basket Analysis atau analisis keranjang pasar bertujuan untuk menetapkan barang apa yang paling sering dibeli atau barang yang sering digunakan konsumen [14]. Analisis Keranjang Pasar menganalisis kebiasaan pembelian dari konsumen dan untuk mendapatkan keterkaitan antara berbagai produk yang konsumen tempatkan dalam keranjang belanja [15]. Analisis keranjang pasar adalah proses yang menganalisis kebiasaan pembeli untuk menemukan hubungan antara berbagai item dalam keranjang belanja mereka[16]. Hasil temuan dapat dimanfaatkan oleh perusahaan ritel seperti minimarket dalam menyusun strategi pemasaran untuk melihat barang yang dapat dibeli secara bersamaan oleh konsumen dan memberikan dukungan untuk proses pengambilan keputusan untuk minimarket melalui hubungan asosiasi dalam Data mining antara barang yang dibeli [17].
2.4 Algoritma Apriori
Algoritma Apriori adalah metode untuk mencari tahu bagaimana dua kumpulan data saling terkait satu sama lain dengan menggunakan aturan asosiatif dari kumpulan data tersebut. Nilai support dan confidence dari suatu item relasi ditentukan oleh metode yang digunakan untuk menerapkan aturan asosiasi yang relevan. Aturan asosiasi dianggap menarik jika nilai support dan confidence melebihi nilai minimal support dan confidence. [18].
Menurut [19]Ada dua komponen utama dalam teknik dasar analisis asosiasi, yaitu : 1. Analisis Pola Frekuensi Tinggi
Tahap ini mencari database untuk kombinasi item yang memenuhi persyaratan minimal dari nilai support.
Rumus berikut dapat digunakan untuk menentukan nilai support item:
Support A = Jumlah Transaksi (A)
Transaksi x 100% (3)
Nilai support dua item menggunakan rumus:
Support (A, B) = P(A → B) = Jumlah Transaksi (A→B)
Transaksi x 100% (4)
2. Membangun Aturan Asosiatif
Mengikuti penemuan pola frekuensi tinggi, aturan asosiatif yang memenuhi persyaratan confidence minimum kemudian ditentukan dengan menghitung confidence aturan asosiatif A → B.
Nilai confidence dari aturan A→B diperoleh dari rumus:
Confidence (A, B) = P(A → B) = Jumlah Transaksi (A→B)
Transaksi A x 100% (5)
2.5 Algoritma FP-Growth
Algoritma yang dapat mengidentifikasi kumpulan data yang paling sering (frequent itemset) dalam database adalah frequent pattern growth (FP-Growth) [20]. Algoritma Apriori dikembangkan menjadi algoritma FP-Growth.
Algoritma FP-Growth tidak membutuhkan generate candidate, karena FP-Growth mencari frequent itemset menggunakan ide membangun tree. Karena itu, algoritma FP-Growth berjalan lebih cepat daripada pendekatan Apriori. Dalam FP-Growth dilakukan perhitungan Lift Ratio [16]. Berdasarkan pentingnya support dan confidence, lift ratio menghitung signifikansi dari rule yang telah ditetapkan. Lift ratio adalah angka yang menunjukkan apakah transaksi tersebut benar bahwa suatu barang dibeli bersamaan dengan barang lain. [21].
Berikut persamaan untuk menghitung lift ratio.
Lift Ratio = Confidence (A,B)
Nilai Patokan Confidence (A,B) (6)
2.6 Tahapan Penelitian
Metodologi penelitian memberikan ringkasan langkah-langkah yang diambil untuk melakukan penelitian menggunakan Algoritma Apriori dan FP-Growth dalam Market Basket Analysis untuk menentukan pola pembelian konsumen. Tahapan pada penelitian ini terdiri dari identifikasi masalah, pengumpulan data, preprocessing data, pengolahan data menggunakan algoritma apriori dan FP-Growth, kemudian dilakukan analisis dan evaluasi terhadap hasil penelitian. Gambar 1 mengilustrasikan tahapan dalam penelitian ini.
Gambar 1. Tahapan Penelitian
Tahapan dalam penelitian pada gambar 1 yaitu, dilakukan identifikasi masalah, kemudian pengumpulan data yaitu data penjualan produk. Data penjualan kemudian di preprocessing untuk membersihkan data dari missing value dan noise. Kemudian data yang telah bersih, dilakukan pengolahan data menggunakan algoritma Apriori dan FP-Growth, kemudian dilakukan analisis dan evaluasi hasil pengolahan data.
a. Identifikasi Masalah
Masalah yang akan dipelajari perlu didefinisikan terlebih dahulu. Tentukan parameter masalah yang akan diteliti untuk menggambarkan masalah dalam penelitian dengan cara yang akan membantu untuk menemukan jawaban terbaik.
b. Pengumpulan Data
Data diperoleh melalui data publik mengenai Groceries yang dipublikasi melalui website Kaggle yang dapat diakses melalui https://www.kaggle.com/datasets/heeraldedhia/Groceries -dataset. Dataset ini terdiri dari 38765 baris pesanan pembelian konsumen dari toko kelontong. Pesanan ini dapat dianalisis dan aturan asosiasi dapat dihasilkan menggunakan Analisis Keranjang Pasar. Tabel 1 merupakan dataset Groceries yang akan digunakan dalam penelitian ini.
Tabel 1. Dataset Groceries
No Member_numberi Datei Item Descriptioni 0i 1808i 21-07-2015i tropical fruiti
1i 2552i 05/01/2015 whole milk
2i 2300i 19/09/2015 pip fruiti
3 1187i 12/12/2015i otheri vegetables
4 3037i 1/2/2015i whole milki
... ... ... ...
38764 1521i 26/12/2014 cati foodi
Pada tabel 1, merupakan dataset groceries yang digunakan dalam penelitian. Dataset groceries terdiri dari id member, tanggal pembelian dan deskripsi item
c. Preprocessing Data
Preprocessing Data atau pembersihan data dilakukan dalam penelitian ini. Preprocessing dilakukan untuk menghilangkan missing value dan data noise serta menghilangkan data ganda. Setelah dilakukan pengecekan missing value, pada dataset yang digunakan tidak terdapat missing value, namun terdapat data ganda sebanyak 759 data, kemudian data ganda tersebut dihapus sehingga data yang digunakan dalam penelitian ini sebanyak 38006 baris data. Setelah dilakukan preprocessing data, dilakukan transformasi data yaitu merubah data menjadi format boolean untuk mempermudah dalam pengolahan data. Satuan dan Nol dalam matriks adalah nilai boolean, masing-masing dapat diganti dengan true dan false, di mana True artinya barang tersebut ada dalam transaksi False berarti tidak. Berikut pada tabel 2. Data yang telah ditransformasi menjadi Boolean dengan Transaction encoder.
Tabel 2. Data Transformation
Instant food products UHT-milk turkey whole milk yogurt
0 FALSEi ... i TRUEi TRUEi
1 FALSEi ... i TRUEi FALSEi
2 FALSEi ... i FALSEi FALSEi
3 FALSEi ... i FALSEi FALSEi
4 FALSEi ... i FALSEi FALSEi
Tabel 2 di atas, merupakan tabel data groceries yang telah di transformasikan menjadi Boolean dengan transaction encoder. Transaction encoder adalah alat yang mengubah data transaksi menjadi format yang sesuai untuk analisis data. Transaction encoder mempersiapkan data untuk berbagai analisis data seperti Association Rule Mining dan Frequent Itemset Mining. Pada dataset, terdapat produk yang bernilai False dan True yang artinya barang tersebut ada yang berada dalam transaksi dan ada yang tidak.
d. Pengolahan Data
Dalam penelitian ini peneliti menggunakan dan tools Jupyter Nootbook dengan menggunakan Bahasa pemrograman Python. Dalam memperoleh nilai support dan confidence serta membuat aturan pola Market Basket Analysis pada data transaksi penjualan atau pembelian konsumen, dalam penelitian ini mengolah data menggunakan Algoritma Apriori dan FP-Growth. Pada penelitian ini ditentukan nilai minimal support adalah 0.001 berarti bahwa itemset yang muncul paling sedikit 0.1% dari total transaksi akan dianggap sebagai itemset yang signifikan dan relevan untuk dianalisis lebih lanjut dalam Algoritma Apriori dan FP-Growth. Sedangkan untuk nilai ambang batas atau threshold confidence adalah 0.2, itu berarti bahwa hanya aturan yang memiliki confidence setidaknya 0.2 (20%) yang akan dipertimbangkan sebagai aturan yang valid. Dengan kata lain, hanya aturan yang terbukti benar setidaknya 20% dari waktu akan dianggap cukup penting untuk dipertimbangkan. Aturan yang memiliki confidence di bawah ambang batas ini akan diabaikan.
e. Analisis dan Evaluasi Hasil
Penelitian ini menghasilkan frequent itemset dan association rules serta lift ratio. Penelitian ini juga akan membandingkan hasil association rule dan nilai support serta confidence yang dihasilkan serta kecepatan komputasi antara Algoritma Apriori dan FP-Growth. Setelah mengetahui kombinasi itemset yang dihasilkan, dilakukan juga analisis produk yang banyak terjual serta analisis waktu penjualan terbanyak. Hal ini bertujuan untuk meningkatkan strategi penjualan dan melihat pola pembelian konsumen.
3. HASIL DAN PEMBAHASAN
3.1 Association Rule Apriori
Dalam analisis hasil Market Basket Analysis setelah ditentukan nilai minimum support dan confidence, akan dilakukan analisis menggunakan Algoritma Apriori untuk melihat aturan asosiasi yang dihasilkan. Berikut tabel 3 merupakan satu itemset yang dihasilkan menggunakan Algoritma Apriori.
Tabel 3. Data 1 Itemset Apriori
support itemsets number_of_items
0.021386 (UHT-milk) 1
0.008087 (baking powder) 1
0.00401 (Instant food products) 1 0.001938 (artif. sweetener) 1 0.00147 (abrasive cleaner) 1
Tabel 3. Diatas merupakan data dengan 1 itemset, dengan nilai support paling tinggi 0.02 (2%) yaitu itemset susu UHT. Setelah itu dilakukan perhitungan Apriori Matrix Tail yang digunakan untuk menghitung frekuensi
kemunculan itemset dalam database. Algoritma Apriori menghitung frekuensi kemunculan itemset dengan melakukan perhitungan pada matriks ini dan menghasilkan aturan asosiasi berdasarkan frekuensi tersebut. Berikut pada tabel 4 hasil apriori matrix tail.
Tabel 4. Dataset 3 Itemset Apriori
support itemsets number_of_items
0.00147 (whole milk, sausage, yogurt) 3 0.001337 (whole milk, yogurt, rolls/buns) 3 0.001136 (whole milk, sausage, rolls/buns) 3 0.001069 (whole milk, sausage, soda) 3 0.001002 (soda, whole milk, rolls/buns) 3
Berdasarkan tabel 4 di atas, dihasilkan 3 kombinasi itemset dengan nilai support paling tinggi yaitu 0.00147 dengan kombinasi whole milk, sausage dan yogurt yang sering dibeli secara bersamaan. Kemudian dihitung Apriori rule lift yaitu salah satu metrik yang digunakan dalam analisis asosiasi untuk mengevaluasi seberapa kuatnya keterkaitan antara dua item dalam sebuah transaksi. Metrik ini menunjukkan seberapa banyak kemunculan kedua item tersebut yang terjadi bersamaan dibandingkan dengan kemunculan keduanya secara independen. Lift memiliki nilai minimum 1 yang menunjukkan keterkaitan acak antara dua item, nilai lift yang lebih besar dari 1 menunjukkan keterkaitan yang lebih tinggi antara item-item tersebut, sedangkan nilai lift yang lebih kecil dari 1 menunjukkan bahwa item-item tersebut cenderung saling menghindar. Pada tabel 5 merupakan apriori rule lift yang dihasilkan.
Tabel 5. Apriori Rule Lift
Antecedents Consequents Support Confidence lift (brown bread) (beef) 0.001537 0.040853 1.203.301 (beef) (brown bread) 0.001537 0.045276 1.203.301 (UHT-milk) (tropical fruit) 0.001537 0.071875 1.060.617 (tropical fruit) (UHT-milk) 0.001537 0.022682 1.060.617 (citrus fruit) (beef) 0.001804 0.033962 1.000.349
Pada Tabel 5 di atas item brown bread dan beef memiliki nilai keterkaitan paling tinggi dengan nilai lift 1.20330. namun aturan asosiasi yang dihasilkan merupakan keterkaitan secara acak, untuk itu perlu dihitung nilai confidence yang sesungguhnya. Berikut pada tabel 6 merupakan nilai confidence yang dihasilkan dengan ambang batas yang ditentukan adalah 0.2 (20%).
Tabel 6. Kombinasi Itemset Apriori
Antecedents Consequents Support Confidence Lift (yogurt, sausage) (whole milk) 0.00147 0.255814 1.619866 (sausage, rolls/buns) (whole milk) 0.001136 0.2125 1.345594
Pada tabel 6, kombinasi itemset yang dihasilkan dari Algoritma Apriori yaitu terdapat 2 kombinasi.
Kombinasi yang pertama yaitu jika pembeli membeli yogurt dan sausage (sosis) maka pembeli juga membeli whole milk (susu). Nilai support yang dihasilkan yaitu 0.00147, nilai confidence 0.255814 dan nilai liftnya 1.61986. kombinasi yang kedua yaitu jika pembeli membeli sausage (sosis), dan rools/buns (gulungan roti), maka juga membeli whole milk (susu), kombinasi ini menghasilkan nilai support 0.001136, confidence 0.2125 dan lift 1.34559.
3.2 Association Rule FP Growth
Algoritma Apriori juga menghitung nilai support, confidence, lift dan menghasilkan kombinasi itemset dengan aturan asosiasi. Untuk nilai minimal support dan nilai ambang batas confidence yang digunakan untuk pengolahan algoritma FP-Growth sama dengan yang digunakan saat menggunakan Algoritma Apriori. Berikut pada tabel 7 merupakan satu itemset yang dihasilkan menggunakan algoritma FP-Growth.
Tabel 7. Dataset 1 itemset FP-Growth support itemsets number_of_items
0.15792 (whole milk) 1
0.08587 (yogurt) 1
0.06034 (sausage) 1
0.05172 (pastry) 1
0.00949 (semi-finished bread) 1
Pada tabel 7 diatas, dihasilkan itemset dengan nilai support paling tinggi yaitu item whole milk dengan nilai 0.15. Algoritma FP-Growth menghitung frekuensi kemunculan itemset dengan melakukan perhitungan pada
matriks ini dan menghasilkan aturan asosiasi berdasarkan frekuensi tersebut. Berikut pada tabel 8 hasil FP-Growth matrix tail.
Tabel 8. Dataset 2 Itemset FP-Growth
support itemsets number_of_items
0.001403 (chewing gum, yogurt) 2
0.001069 (other vegetables, chewing gum) 2
0.001069 (pasta, whole milk) 2
0.001002 (chewing gum, soda) 2
0.001002 (seasonal products, rolls/buns) 2
Pada tabel 8, algoritma FP-Growth menghasilkan kombinasi 2 itemset. Sedangkan sebelumnya dengan Algoritma Apriori menghasilkan 3 kombinasi itemset. Itemset dengan nilai support tertinggi pada FP-Growth yaitu item chewing gum dan yogurt dengan nilai support 0.001403. Setelah itu dilakukan perhitungan FP-Growth rule lift untuk melihat angka keterkaitan antar item. Tabel 9 merupakan tabel FP-Growth rule lift.
Tabel 9. FP-Growth Rule Lift
Antecedents Consequents Support Confidence Lift (whole milk, rolls/buns) (yogurt) 0.001337 0.095694 1.114293 (yogurt) (whole milk, rolls/buns) 0.001337 0.015564 1.114293 (whole milk, yogurt) (rolls/buns) 0.001337 0.11976 1.088685 (yogurt, rolls/buns) (whole milk) 0.001337 0.17094 1.082428 (whole milk) (yogurt, rolls/buns) 0.001337 0.008464 1.082428
Pada tabel 9 di atas, whole milk (susu) dan rolls/buns (roti gulung) memiliki keterkaitan tinggi dengan yogurt, hal ini dibuktikan dengan nilai Lift yang tinggi yaitu 1.1142, nilai support 0.001337, dan nilai confidence 0.095694. Kemudian pada tabel 10 merupakan nilai confidence yang dihasilkan dengan ambang batas yang ditentukan adalah 0.2 (20%).
Tabel 10. Kombinasi Itemset FP-Growth
Antecedents Consequents Support Confidence Lift (yogurt, sausage) (whole milk) 0.00147 0.255814 1.619866 (sausage, rolls/buns) (whole milk) 0.001136 0.2125 1.345594
Pada tabel 10, kombinasi itemset yang dihasilkan dari Algoritma Apriori yaitu terdapat 2 kombinasi.
Kombinasi yang pertama yaitu jika pembeli membeli yogurt dan sausage (sosis) maka pembeli juga membeli whole milk (susu). Nilai support yang dihasilkan yaitu 0.00147, nilai confidence 0.255814 dan nilai liftnya 1.61986. kombinasi yang kedua yaitu jika pembeli membeli sausage (sosis), dan rools/buns (gulungan roti), maka juga membeli whole milk (susu), kombinasi ini menghasilkan nilai support 0.001136, confidence 0.2125 dan lift 1.34559. hasil kombinasi antara FP-Growth dan Apriori adalah sama.
3.3 Pembahasan
Kombinasi itemset dengan aturan asosiasi yang dihasilkan oleh Algoritma Apriori dan FP-Growth bernilai sama yaitu terdapat 2 kombinasi yang dihasilkan. Kombinasi yang pertama yaitu jika pembeli membeli yogurt dan sausage (sosis) maka pembeli juga membeli whole milk (susu). Nilai support yang dihasilkan yaitu 0.00147 (0.0147%), nilai confidence 0.255814 (25.58%) dan nilai liftnya 1.61986. kombinasi yang kedua yaitu jika pembeli membeli sausage (sosis), dan rools/buns (roti gulungan), maka juga membeli whole milk (susu), kombinasi ini menghasilkan nilai support 0.001136 (0.0113%), confidence 0.2125 (21.25%) dan lift 1.34559. Selain kombinasi itemset yang dihasilkan pada penelitian ini juga mengukur kecepatan komputasi pada pengolahan data Groceries untuk Market Basket Analysis. Kecepatan komputasi yang dihasilkan oleh Algoritma Apriori yaitu 3.1765 detik, sedangkan algoritma FP-Growth adalah 0.15892 detik. Selisih kecepatan komputasi antara Algoritma Apriori dan FP-Growth adalah 3.0176 detik. Algoritma FP-Growth lebih cepat dalam memproses data Groceries untuk Market Basket Analysis. Kemudian pada penelitian ini juga dilakukan Analisa produk yang paling popular atau paling banyak terjual serta waktu penjualan terbanyak pada bulan apa juga di Analisa. Berikut gambar 2. Merupakan ilustrasi produk yang paling banyak terjual.
Gambar 2. Produk Populer
Gambar 2 menunjukkan produk popular atau produk yang paling banyak terjual, produk yang paling banyak terjual yaitu whole milk, other vegetable, rolls/buns, soda, yogurt, root vegetable, tropical fruit, bottled water, sausage, dan citrus fruit. Waktu penjualan terbanyak diilustrasikan pada gambar 3.
Gambar 3. Jumlah Penjualan Terbanyak
Pada gambar 3, jumlah penjualan terbanyak yaitu pada bulan agustus 2015, yaitu terjadi penjualan sebanyak 2000 penjualan dalam waktu sebulan. Dari hasil kombinasi itemset yang dihasilkan dari aturan asosiasi Algoritma Apriori dan FP-Growth, serta produk popular dan waktu penjualan terbanyak dapat dimanfaatkan perusahaan untuk melihat pola pembelian konsumen dan dapat digunakan untuk mengambil keputusan dalam meningkatkan strategi penjualan serta pengelolaan persediaan produk.
4. KESIMPULAN
Market Basket Analysis adalah teknik analisis data yang digunakan untuk memahami hubungan antara produk yang dibeli secara bersamaan oleh konsumen. Berdasarkan penelitian yang telah dilakukan yaitu Market Basket Analysis menggunakan Algoritma Apriori dan FP-Growth untuk dataset Groceries , menghasilkan 2 kombinasi itemset. Kombinasi yang pertama yaitu jika pembeli membeli yogurt dan sausage (sosis) maka pembeli juga membeli whole milk (susu). Nilai support yang dihasilkan yaitu 0.00147 (0.0147%), nilai confidence 0.255814 (25.58%) dan nilai liftnya 1.61986. kombinasi yang kedua yaitu jika pembeli membeli sausage (sosis), dan rools/buns (roti gulungan), maka juga membeli whole milk (susu), kombinasi ini menghasilkan nilai support 0.001136 (0.0113%), confidence 0.2125 (21.25%) dan lift 1.34559. Selain kombinasi itemset yang dihasilkan pada penelitian ini juga mengukur kecepatan komputasi pada pengolahan data Groceries untuk Market Basket Analysis.
Kecepatan komputasi yang dihasilkan oleh Algoritma Apriori yaitu 3.1765 detik, sedangkan algoritma FP-Growth adalah 0.15892 detik. Selisih kecepatan komputasi antara Algoritma Apriori dan FP-Growth adalah 3.0176 detik.
Algoritma FP-Growth lebih cepat dalam memproses data Groceries untuk Market Basket Analysis. Kombinasi ini sesuai dengan produk yang paling banyak terjual yaitu whole milk, other vegetable, rolls/buns, soda, yogurt, root vegetable, tropical fruit, bottled water, sausage, dan citrus fruit. Hasil penelitian ini dapat dimanfaatkan perusahaan untuk melihat pola pembelian konsumen dan dapat digunakan untuk mengambil keputusan dalam meningkatkan strategi penjualan serta pengelolaan persediaan produk.
REFERENCES
[1] I. Syukra, A. Hidayat, and M. Z. Fauzi, “Implementation of K-Medoids and FP-Growth Algorithms for Grouping and Product Offering Recommendations,” Indonesian Journal of Artificial Intelligence and Data Mining, vol. 2, no. 2, p. 107, Nov. 2019, doi: 10.24014/ijaidm.v2i2.8326.
[2] J. L. Putra, M. Raharjo, T. A. A. Sandi, R. Ridwan, and R. Prasetyo, “Implementasi Algoritma Apriori Terhadap Data Penjualan Pada Perusahaan Retail,” Jurnal Pilar Nusa Mandiri, vol. 15, no. 1, pp. 85–90, Mar. 2019, doi:
10.33480/pilar.v15i1.113.
[3] Y. Cahyono, “Rancang Bangun Aplikasi Data Mining untuk Market Basket Analysis dengan Algoritma Apriori,” Jurnal Informatika Universitas Pamulang, vol. 7, no. 2, pp. 262–270, Aug. 2022, Accessed: Apr. 30, 2023. [Online]. Available:
http://openjournal.unpam.ac.id/index.php/informatika/article/view/13400/pdf
[4] Moch. D. Febrianto and A. Supriyanto, “Implementasi Algoritma Apriori Untuk Menentukan Pola Pembelian Produk,”
JURIKOM (Jurnal Riset Komputer), vol. 9, no. 6, p. 2010, Dec. 2022, doi: 10.30865/jurikom.v9i6.5230.
[5] S. Rana and M. N. I. Mondal, “Seasonal and Multilevel Association Based Approach for Market Basket Analysis in Retail Supermarket,” European Journal of Information Technologies and Computer Science, vol. 1, no. 4, pp. 9–15, Oct. 2021, doi: 10.24018/compute.2021.1.4.31.
[6] A. I. Idris et al., “Comparison of Apriori, Apriori-TID and FP-Growth Algorithms in Market Basket Analysis at Grocery Stores,” The IJICS (International Journal of Informatics and Computer Science), vol. 6, no. 2, p. 107, Jul. 2022, doi:
10.30865/ijics.v6i2.4535.
[7] H. Maulidiya and A. Jananto, “Asosiasi Data Mining Menggunakan Algoritma Apriori Dan Fp-Growth Sebagai Dasar Pertimbangan Penentuan Paket Sembako,” in Proceeding SENDI_U, Semarang: Unversitas Stikubank, Jul. 2020, pp. 36–
42. Accessed: Apr. 04, 2023. [Online]. Available: https://www.unisbank.ac.id/ojs/index.php/sendi_u/article/view/7957 [8] A. Junaidi, “Implementasi Algoritma Apriori dan FP-Growth Untuk Menentukan Persediaan Barang,” Jurnal Sisfokom
(Sistem Informasi dan Komputer), vol. 8, no. 1, pp. 61–67, Mar. 2019, doi: 10.32736/sisfokom.v8i1.604.
[9] A. A. Susilo, “Penerapan Algoritma Apriori pada Pengolahan Data Transaksi Penjualan di Minimarket Priyo Kota Lubuklinggau,” Jurnal Teknologi Komputer dan Sistem Informasi (JTKSI), vol. 1, no. 3, pp. 39–46, May 2018, Accessed:
May 01, 2023. [Online]. Available: https://ojs.stmikpringsewu.ac.id/index.php/jtksi/article/view/657
[10] A. Alfani W.P.R., F. Rozi, and F. Sukmana, “Prediksi Penjualan Produk Unilever Menggunakan Metode K-Nearest Neighbor,” JIPI (Jurnal Ilmiah Penelitian dan Pembelajaran Informatika), vol. 6, no. 1, pp. 155–160, Jun. 2021, doi:
10.29100/jipi.v6i1.1910.
[11] S. Listanto and Y. M. Kristania, “Implementasi Data Mining Terhadap Data Penjualan Dengan Algoritma Apriori Pada PT. Duta Kencana Swaguna,” Jurnal TEKNOINFO, vol. 16, no. 2, pp. 364–372, Jul. 2022, Accessed: May 01, 2023.
[Online]. Available: https://ejurnal.teknokrat.ac.id/index.php/teknoinfo/article/view/1973/899
[12] K. Karsito and W. M. Sari, “Prediksi Potensi Penjualan Produk Delifrance Dengan Metode Naive Bayes Di Pt. Pangan Lestari,” SIGMA Information Technology Journal, vol. 9, no. 1, pp. 67–78, Jun. 2018, Accessed: May 01, 2023. [Online].
Available: https://www.jurnal.pelitabangsa.ac.id/index.php/sigma/article/view/465
[13] I. Qoniah and A. T. Priandika, “Analisis Market Basket Untuk Menentukan Asossiasi Rule Dengan Algoritma Apriori (Studi Kasus: TB. Menara),” Jurnal Teknologi dan Sistem Informasi, vol. 1, no. 2, pp. 26–33, Dec. 2020, doi:
10.33365/jtsi.v1i2.368.
[14] D. Alcan, K. Ozdemir, B. Ozkan, A. Y. Mucan, and T. Ozcan, “A Comparative Analysis of Apriori and FP-Growth Algorithms for Market Basket Analysis Using Multi-level Association Rule Mining,” 2023, pp. 128–137. doi:
10.1007/978-3-031-25847-3_13.
[15] L. Samboteng, R. Rulinawaty, K. Rachmat, M. Basit, and R. Rahim, “Market basket analysis of administrative patterns data of consumer purchases using data mining technology,” Journal of Applied Engineering Science, vol. 20, no. 2, pp.
339–345, 2022, doi: 10.5937/jaes0-32019.
[16] A. H. Patwary, M. T. Eshan, P. Debnath, and A. Sattar, “Market Basket Analysis Approach to Machine Learning,” in 2021 12th International Conference on Computing Communication and Networking Technologies (ICCCNT), IEEE, Jul.
2021, pp. 1–9. doi: 10.1109/ICCCNT51525.2021.9580175.
[17] A. R. Efrat, R. Gernowo, and Farikhin, “Consumer purchase patterns based on market basket analysis using apriori algorithms,” J Phys Conf Ser, vol. 1524, no. 1, p. 012109, Apr. 2020, doi: 10.1088/1742-6596/1524/1/012109.
[18] A. J. P. Sibarani, “Implementasi Data Mining Menggunakan Algoritma Apriori Untuk Meningkatkan Pola Penjualan Obat,” JATISI (Jurnal Teknik Informatika dan Sistem Informasi), vol. 7, no. 2, pp. 262–276, Aug. 2020, doi:
10.35957/jatisi.v7i2.195.
[19] C. H. Sihotang, M. Syaifudin, and I. Mariami, “Penerapan Data Mining Dalam Penjualan Alat Kerja Cleaning Service Menggunakan Metode Apriori,” Jurnal Sistem Informasi Triguna Dharma, vol. 2, no. 2, pp. 249–259, Mar. 2023, Accessed: May 01, 2023. [Online]. Available: http://ojs.trigunadharma.ac.id/index.php/jsi/article/view/7212
[20] N. N. A. Sjarif, N. F. M. Azmi, S. S. Yuhaniz, and D. H. Ten Wong, “A review of market basket analysis on business intelligence and data mining,” International Journal of Business Intelligence and Data Mining, vol. 18, no. 3, p. 383, 2021, doi: 10.1504/IJBIDM.2021.114475.
[21] F. Achmad, O. Nurdiawan, and Y. A. Wijaya, “Analisa Pola Transaksi Pembelian Konsumen Pada Toko Ritel Kesehatan Menggunakan Algoritma FP-Growth,” JATI (Jurnal Mahasiswa Teknik Informatika), vol. 7, no. 1, pp. 168–175, Feb.
2023, Accessed: May 01, 2023. [Online]. Available: https://ejournal.itn.ac.id/index.php/jati/article/view/6210/3656