Copyright © 2023 Rahmat Fauzi, Page 436
Implementasi Data Mining Pada Penjualan Pakaian dengan Algoritma FP-Growth
Rahmat Fauzi1,*, Alvendo Wahyu Aranski2, Nopriadi1, Ellbert Hutabri1
1Program Studi Teknik Informatika, Fakultas Teknik Dan Komputer, Universitas Putera Batam, Batam, Indonesia
2Program Studi Sistem Informasi, Institut Teknologi Batam, Batam, Indonesia
Email: 1,*[email protected], 2[email protected], 1[email protected], 1[email protected] Email Penulis Korespondensi: [email protected]
Submitted 08-02-2023; Accepted 27-03-2023; Published 30-04-2023 Abstrak
Banyaknya persaingan dalam dunia bisnis khususnya dalam industri penjualan, menuntut para pengembang untuk menemukan suatu strategi yang dapat meningkatkan penjualan dan pemasaran produk yang dijual, salah satunya adalah dengan pemanfaatan data penjualan pakaian dengan data mining. Data Mining merupakan proses iteratif dan interaktif untuk menemukan pola atau model baru yang dapat digeneralisasi untuk masa yang akan datang, bermanfaat dan dapat dimengerti dalam suatu database yang sangat besar (massive database). Toko HAS dalam pengaturan tata letak barang masih menempatkan barang menurut kelompok dan jenis barang, sehingga berdampak terhadap pelayanan dan pencarian item ketika konsumen ingin membeli lebih dari satu barang dan letaknya berjauhan. Oleh karena itu, penelitian ini bertujuan menerapkan Algoritma FP-Growth untuk mengetahui penjualan pakaian yang paling banyak terjual di Toko HAS kota Batam. Penelitian ini menggunakan metoda Association Rule dengan memanfaatkan Algoritma FP-Growth. Melalui proses mining dengan algoritma FP-Growth (Frequent Pattern Growth) ini maka akan di peroleh jenis pakaian mana yang lebih banyak terjual, dan berapa banyak persediaan yang diperlukan toko untuk menyediakan stok pakaian tersebut. Hasil penelitian menunjukkan produk pakaian yang paling banyak terjual adalah Gamis dan Jilbab melalui penghitungan support 53,33%
dan confidence 100%. Terkait hasil ini, strategi pemasaran bisa difokuskan pada produk tersebut dan mengatur tata letak yang dapat mudah dilihat pelanggan.
Kata Kunci: Data Mining; Pakaian; FP-Growth; Penjualan; Rapid Miner Abstract
The amount of competition in the business world, especially in the sales industry, required developers to find a strategy that could increase sales and marketing of products sold, one of which was using clothing sales data with data mining. Data Mining was an iterative and interactive process to find new patterns or models that can be generalized for the future, valuable, and understandable in a massive database. HAS Stores in the arrangement of goods layout still place goods according to groups and types of goods, so that it has an impact on service and item search when consumers want to buy more than one item and are located far apart. Therefore, this study aims to apply the FP-Growth Algorithm to find out the most sold clothing sales at HAS Stores in Batam city. This study uses the Association Rule method by utilizing the FP-Growth Algorithm. This study aimed to apply the FP-Growth Algorithm to determine the most sold clothing sales at HAS Stores in Batam city. Through the mining process with the FP-Growth (Frequent Pattern Growth) algorithm, the types of clothes sold will be obtained, and how much inventory the store needs to provide the clothing stock. The results showed that the most sold clothing products were Gamis and Jilbab through the calculation of support 53,33% and confidence 100%.
Regarding these results, marketing strategies can be focused on the product and set a layout that customers can easily see.
Keywords: Data Mining; Clothes; FP-Growth; Rapid Miner
1. PENDAHULUAN
Banyaknya persaingan dalam dunia bisnis khususnya dalam industri penjualan, menuntut para pengembang untuk menemukan suatu strategi yang dapat meningkatkan penjualan dan pemasaran produk yang dijual, salah satunya adalah dengan pemanfaatan data penjualan. Dengan adanya kegiatan penjualan setiap hari, data semakin lama akan semakin bertambah banyak. Data tersebut tidak hanya berfungsi sebagai arsip bagi perusahaan, data tersebut juga dapat dimanfaatkan dan diolah menjadi informasi yang berguna untuk peningkatan penjualan dan promosi produk[1]
Kementerian Perindutrian Republik Indonesia pada tahun 2019 juga melaporkan bahwa industri pakai pernah mencatat pertumbuhan paling tinggi dibandingkan sektor industri lainnya termasuk industri furnitur [2]. Pakaian menjadi salah satu kebutuhan pokok bagi manusia.
Dari sumber data penjualan toko pakaian, menunjukkan permintaan pakaian semakin meningkat. Hal inilah yang dijadikan sebagai dasar pengolahan Data Mining pada penjualan toko pakaian. Untuk mengelola data tersebut, dibutuhkan metode yang bisa digunakan untuk menggali informasi dari data tersebut. Metode tersebut dikenal dengan Data Mining.
Data mining adalah proses iterative dan interaktif, untuk menemukan pola atau model baru dalam basis data yang sangat besar (massive database) yang berguna, dapat dipahami, dan dapat digeneralisasikan untuk masa depan [3]. Data mining melibatkan pencarian database besar untuk tren dan pola minat untuk membuat keputusan di masa depan[4]. Pola-pola ini dapat dikenali dengan alat khusus yang dapat memberikan analisis data yang berguna dan berwawasan, dan kemudian dapat dieksplorasi lebih detail, mungkin menggunakan alat pendukung keputusan lainnya [5], [6].
Data Mining adalah metode penggalian informasi yang berguna dari database yang dapat digunakan dalam menganalisis data yang dapat membantu dalam mengambil beberapa keputusan berdasarkan data. Teknik ini dapat memainkan peran penting dalam memahami data dan dalam menangkap hubungan mendasar antara contoh data. Data Mining berarti Ekstraksi non implisit, yang sebelumnya tidak diketahui dan berpotensi memiliki informasi yang berguna dari sejumlah data yang besar. Pola yang ditemukan ditetapkan item yang paling sering dalam database. Data Mining,
juga dikenal sebagai Knowledge Discovery in Database (KDD). KDD mengacu pada ekstraksi informasi implisit, yang sebelumnya tidak diketahui dan berpotensi berguna dari data dalam database [7]. Analisis data mining sudah banyak dimanfaat dengan memnggunakan bebrapa metode seperti: Menggunakan Algoritma Naive Bayes [8], Algoritma K- Means [9], Algoritma J48 [10], Algoritma Nearest Neighbor [11], dan Algoritma FP-Growth [12].
Penelitian sebelumnya pada sistem persediaan menggunakan Algoritma FP-Growth menyimpulkan teknik data mining dengan Algoritma FP-Growth dapat diimplementasikan pada sistem persediaan produk rempah-rempah [12].
Dengan aplikasi yang berbasis teknologi informasi dihasilkan sebuah metode yang bisa meningkatkan pengetahuan untuk menyediakan barang dengan cara memberikan saran kepada perusahaan atas keterkaitan konsumen terhadap suatu barang yang dibeli oleh konsumen bisa dihitung dengan teknik Algoritma FP-Growth [13]. Dalam penelitian lainnya menyatakan algoritma FP-Growth menghasilkan rule yang lebih baik dibandingkan dengan algoritma apriori pada tata letak barang pada toko aksesoris [14]. Penelitian yang dilakukan pada penjualan oleh-oleh juga menerapkan algoritma FP-Growth, menambahkan penerapan data mining menggunakan Algoritma FP-Growth dapat digunakan untuk menganalisis pola belanja konsumen, dan dapat menjadi rekomendasi dalam tata letak produk pada rak persiapan [15]. Oleh karena itu, penerapan Algoritma FP-Growth dapat dinyatakan memberikan manfaat terhadap bidang usaha perdagangan.
Algoritma FP-Growth termasuk jenis aturan asosiasi pada Data Mining, Algoritma FP-Growth yang bertujuan untuk menemukan frequent item sets dijalankan pada sekumpulan data[16]. Analisis FP-Growth didefinisikan suatu proses untuk menemukan semua aturan FP-Growth yang memenuhi syarat minimum untuk support dan syarat minimum untuk confidence[17].
Toko HAS adalah toko yang menjual berbagai jenis pakaian, sperti Gamis, Jilbab, Pasmina, Inner, dan Mukena.
Toko HAS atau dikenal juga sebagai Kadai HAS dalam pengaturan tata letak barang masih menempatkan barang menurut kelompok dan jenis barang. Tata letak saat ini dianggap telah efisien karena telah berkelompok-kelompok, tetapi ada kalanya konsumen sulit menemukan item yang lainnya saat ingin membeli lebih dari satu jenis barang. Hal tersebut dikarenakan kelompok barang tersebut letaknya berjauhan. Oleh karena itu, tata letak tersebut berdampak terhadap pelayanan dan pencarian item ketika konsumen ingin membeli lebih dari satu barang dan letaknya berjauhan.
Tata letak (layout) sangat menentukan terhadap efisiensi operasional perusahaan dalam jangka panjang yang dinyatakan sebagai salah satu keputusan strategis operasional [18]. Strategi operasional yang tepat diterapkan pada tata letak barang jualan adalah dengan memperhatikan kebiasaan berbelanja pengunjung atau konsumen. Tindakan tepat terhadap strategis operasional tersebut akan memberikan kontribusi terhadap peningkatan produktivitas perusahaan [19].
Penataan layout barang jualan yang sesuai dengan pola atau kebiasaan pembelian oleh konsumen dapat meningkatkan pelayanan yang diberikan oleh toko pakaian HAS terhadap pelanggan.
Berdasarkan latar belakang yang telah dipaparkan, maka studi ini akan mempelajari penerapan data mining pada penjualan pakaian dengan menggunakan algoritma FP-growth.
2. METODOLOGI PENELITIAN
Penelitian ini menggunakan metode Association Rule dengan memanfaatkan Algoritma FP-Growth. Algoritma FP- Growth merupakan bagian dari alternatif algoritma yang digunakan untuk menentukan himpunan data yang paling sering muncul (frequent itemset) dalam sebuah kumpulan data. Algoritma FP-Growth memanfaatkan konsep pembangunan tree, yang dikenal dengan FP-Tree. Pencarian frequent item set pada algoritma FP-Growth bukan menggunakan generate candidate, seperti yang dilakukan pada penerapan Algoritma Apriori. Dengan memanfaatkan konsep tersebut, algoritma FP-Growth menjadi lebih cepat dari pada penerapan algoritma Apriori [20]. Untuk pelaksanaan tahapan penelitian ini dapat pada Gambar 1.
Gambar 1. Kerangka Konseptual 2.1 Pengumpulan Data
Pengumpulan data dilakukan dengan dengan melakukan observasi, wawancara dan meminta data transaksi penjualan pakaian di Toko HAS kota Batam dari bulan Desember 2021 sampai dengan bulan Agustus 2022. Tujuan dari pengumpulan data adalah memperoleh data hasil penjualan pakaian yang akan digunakan sebagai data mining. Data transaksi tersebut memiliki Tanggal, Kode Barang, Nama Barang, Kode Satuan , Jumlah , Harga, Total. Data sampel yang digunakan adalah berjumlah 15 buah transaksi.
2.2 Analisis Data
Data yang diperoleh dari tempat penelitian selanjutnya dilakukan analisa dan pengolahan menggunakan Algoritma FP- Growth.
2.3 Implementasi
Implementasi Algoritma FP-Growth menggunakan software Rapid Miner yang akan dipakai nantinya dalam melakukan pengujian terhadap data yang telah ada. Di sini penulis menggunakan komputer dengan prosesor Intel Celeron N2840,
DATA PENJUALAN ALGORITMA
FP-GROWTH
HUBUNGAN DATA PENJUALAN
Copyright © 2023 Rahmat Fauzi, Page 438 RAM 2GB, dan sofware yang dipakai adalah Rapid Miner.
2.4 Pengujian
Pada tahap ini, penulis mengimplementasikan model dan hasil perancangan system menggunakan software Data Mining Mechine Tools Rapid Miner. Sistem diuji dengan prosedur-prosedur untuk melakukan eksplorasi dan permodelan dari data-data yang ada sehingga mendapatkan suatu hubungan tersembunyi dari data tersebut.
Mekanisme yang digunakan saat pengujian sistem adalah:
a. Menyimpan data pada Microsoft Excel b. Menjalankan software Rapid Miner
c. Untuk proses data klik Explore lalu pilih new proses
d. Setelah tampil pilih tab Assosiate lalu pilih pada menu operator sub modeling, lalu pilih asosiation and itemset mining lalu tarik Algoritma FP-Growth ke field proses
3. HASIL DAN PEMBAHASAN
3.1 Pengumpulan Data
Data Mining yang diterapkan dalam penelitian ini adalah berbentuk aturan asosiasi dengan menggunakan algoritma FP- Growth dalam melakukan penambangan aturan asosiasi terhadap data transaksi penjualan pada toko pakaian, data yang diambil adalah data pembelian pakaian wanita yang dilakukan oleh konsumen. Data tersebut berupa data penjuala Kadai HAS. Hal ini dimaksudkan untuk memberi gambaran bagaimana melakukan data mining sehingga menghasilkan aturan asosiasi.
Oleh sebab itu Kadai HAS memerlukan sistem untuk mengolah data yang dapat menghasilkan data penjualan produk yang paling sering dibeli, sehingga produk yang paling sering dibeli tersebut dapat menjadi acuan untuk mengembangkan strategi pemasaran produk tersebut kepada konsumen.
Pada penelitian ini proses pencarian aturan asosiasi penjualan pakaian, semua itemsets yang ada dianggap sebagi input pada pengolahan Data Mining ini. Kemudian seluruh itemsets tersebut ditambang dengan menggunakan algoritma FP-Growth, sehingga nantinya diharapkan terbentuk hubungan asosiasi antar itemsets dengan memenuhi minimum support dan minimum confidence untuk penetapan aturan yang valid sebagai output. Output yang dihasilkan akan dianalisa dan dibahas dengan menajabarkan hubungan “if” - “then”. Untuk mencapai tujuan dari penelitian ini, maka dilakukan pengumpulan data. Data sampel yang digunakan adalah berjumlah 15 buah transaksi yang dapat dilihat pada Tabel 1.
Tabel 1. Transaksi Penjualan No Barang yang dibeli
1 Gamis, Jilbab, Pasmina, Inner, Mukena 2 Gamis, Jilbab
3 Inner, Mukena 4 Jilbabt, Pasmina 5 Gamis, Jilbab
6 Gamis, Jilbab, Pasmina 7 Inner, Mukena
8 Gamis, Jilbab
9 Gamis, Jilbab, Pasmina 10 Gamis, Jilbab, Pasmina 11 Jilbab, Pasmina 12 Inner, Mukena 13 Inner, Mukena
14 Gamis, Jilbab, Pasmina, Inner, Mukena 15 Pasmina, Inner, Mukena
Untuk melakukan penggalian dari data transaksi pembelian pakaian, penulis sebelumnya menghitung frekuensi kemunculan setiap item. Frekuensi kemunculan tiap item dari data transaksi dapat dilihat pada Tabel 2.
Tabel 2. Frekuensi Kemunculan Item No Itemset Frekuensi
1 (Gamis) 8
2 (Jilbab) 10
3 (Pasmina) 8
4 (Inner) 7
5 (Mukena) 7
Dari frekuensi kemunculan Tabel 2 dapat dilihat berapa banyak jumlah kemuculan tiap item dari seluruh transaksi, setelah didapatkan frekuensi kemunculan maka tahap selanjutnya adalah menentukan nilai support count. Support Count yang diberikan adalah ξ = 20%, maka item yang berpengaruh dan akan dimasukkan ke dalam FP-Tree, selebihnya untuk item yang frekuensi kemunculannya di bawah 20% maka dapat dibuang karena tidak berpengaruh signifikan.
3.2 Pembangkitan FP-Tree
Pembangkitan FP-Tree dilakukan sebelum didapatkan item-item yang frequent atau memenuhi nilai support count, yang mana item-item diproses dari item-item transaksi [21]. FP-Tree dibuat sebelum tahapan pencarian frequent item di proses.
Agar memudahkan dalam menggambarkan struktur FP-Tree maka peneliti memberikan inisial terhadap masing- masing item agar label pada setiap cabang yang terdiri dari item-item tidak terlalu panjang. Adapun inisial dari tiap-tiap item dapat dilihat pada Tabel 3.
Tabel 3. Inisial Item No Itemset Support
1 Gamis a
2 Jilbab b
3 Pasmina c
4 Inner d
5 Mukena e
Adapun tabel daftar data transaksi setelah diberikan inisial menjadi seperti yang terlihat pada Tabel 4.
Tabel 4. Daftar Transaksi Setelah Diberikan Inisial No Dataset Pembelian
1 {a,b,c,d,e}
2 {a,b}
3 {d,e}
4 {b,c}
5 {a,b}
6 {a,b,c}
7 {d,e}
8 {a,b}
9 {a,b,c}
10 {a,b,c}
11 {b,c}
12 {d,e}
13 {d,e}
14 {a,b,c,d,e}
15 {c,d,e}
Proses dalam pembangkitan FP-Tree dimulai dengan pembacaan transaksi yang pertama, kemudian dilanjutkan dengan transaksi kedua, dan diteruskan dengan transaksi berikutnya sampai transaksi terakhir.
3.3 Penerapan FP-Growth
Setelah tahap pembangunan FP-tree dari sekumpulan data transaksi yang sudah ada, selanjutnya akan diterapkan algoritma FP-Growth untuk mencari frequent itemset yang memenuhi syarat. Algoritma FP-Growth dibagi menjadi tiga langkah atau 3 tahap utama, yaitu pembangkitan Conditional Pattern Base, pembangkitan Conditional FP-Tree, dan Pencarian Frequent Itemset.
a. Tahap Pembangkitan Conditional Pattern Base
Conditional Pattern Base merupakan subdatabase yang berisi prefix path (lintasan prefix) dan suffix pattern (pola akhiran). Pembangkitan conditional pattern base didapatkan melalui FP-tree yang telah dibangun sebelumnya.
Pembentukan FP-Tree dapat dilihat pada Gambar 2.
x
Gambar 2. Pembentukan Suffix
Suffix null a:8 d:4 b:2 c:1 b:8 e:4 c:2 d:1 c:5 e:1 d:2
e:2 a
b c d e
Copyright © 2023 Rahmat Fauzi, Page 440 Setelah FP-Tree terbentuk, maka langkah selanjutnya adalah tahap pembangkitan conditional pattern base. Pada tahap ini dapat dilakukan dengan melihat kembali FP-Tree yang sudah dibuat sebelumnya. Untuk menemukan frequent itemset dari data training yang telah tersedia maka perlu ditentukan cabang pohon dengan lintasan yang berakhiran dengan support count terkecil, yaitu e. Berturut-turut ditentukan juga yang berakhiran d,c,dan b. Conditional Pattern Base Seperti ditampilkan dalam Tabel 5 dibawah ini.
Tabel 5. Hasil Conditional Pattern Base Suffix Conditional Pattern Base
e {(a, b, c, d:2), (d:4), (c, d:1)}
d {(a, b, c:2), (c:1)}
c {(a, b:5), (b:2)}
b {(a:8)}
a Empty
b. Tahap Pebangkitan Conditional FP-Tree
Pada tahap ini, support count dari setiap item pada setiap conditional pattern base dijumlahkan, lalu setiap item yang memiliki jumlah support count lebih besar sama dengan minimum support count ξ akan dibangkitkan dengan conditional FP-tree.
Setelah tahap pembangkitan conditional pattern base dilakukan, maka langkah selanjutnya adalah tahap pembangkitan conditional FP-Tree. Pada tahap ini juga dapat dilakukan dengan melihat kembali FP-Tree yang sudah dibuat sebelumnya. Conditional FP-Tree mirip dengan FP-Tree biasa, namun conditional FP-Tree dimaksudkan untuk mencari frequent itemset yang berakhiran item tertentu atau mengandung suffix (akhiran) yang sama (Tabel 6). Jika nilai support count pada simpul item memenuhi minimum support maka item tersebut merupakan frequent[22].
Tabel 6. Hasil Conditional FP-Tree
Suffix Conditional Pattern Base Conditional FP-Tree
E {(a,b,c,d:2),(d:4),(c,d:1)} {(a:2),(b:2),(c:3),(d:7),(a,b:2),(a,c:2),(a,d:2)(b,c:2),(b,d:2),(c,d:3),(a,b,c:2), (a,b,d:2),(a,b,c,d:2)}
D {(a,b,c:2),(c:1)} {(a:2),(b:2),(c:3),(a,b:2)(a,c:2),(b,c:2),(a,b,c:2)}
C {(a,b:5),(b:2)} {(a:5),(b:7),(a,b:5)}
B {(a:8)} {(a:8)}
A Empty Empty
c. Tahap pencarian Frequent Itemset
Apabila Conditional FP-Tree merupakan lintasan tunggal (single path), maka didapatkan frequent itemset dengan melakukan kombinasi item untuk setiap conditional FP-Tree. Jika bukan lintasan tunggal, maka dilakukan pembangkitan FP-Growth secara rekursif.
Dari pembangkitan conditional FP-Tree telah dilakukan sebelumnya maka, didapatkan hasil conditional FP-Tree dan hasil frequent itemset yang dapat dilihat pada Tabel 7.
Tabel 7. Hasil Frequent Itemset
Suffix Conditional FP-Tree Frequent Itemset
e {(a:2),(b:2),(c:3),(d:7),(a,b:2),(a,c:2),
(a,d:2), (b,c:2), (b,d:2), (c,d:3), (a,b,c:2), (a,b,d:2), (a,b,c,d:2)}
(a→e:2), (b→e:2), (c→e:3), (d→e:7), (a,b→e:2), (a,c→e:2), (a,d→e:2), (b,c→e:2), (b,d→e:2), (c,d→e:3), (a,b,c→e:2), (a,b,d→e:2), (a,b,c,d→e:2) d {(a:2),(b:2),(c:3),(a,b:2)(a,c:2),(b,c:2),(a,b,c:2)} (a→d:2), (b→d:2), (c→d:3), (a,b→d:2), (a,c→d:2),
(b,c→d:2), (a,b,c→d:2)
c {(a:5),(b:7),(a,b:5)} (a→c:5), (b→c:7), (a,b→c:5)
b {(a:8)} (a→b:8)
a Empty Empty
Setelah didapatkan frequent itemset, selanjutnya adalah membuat rule dengan cara menghitung nilai support dan confidence-nya. Dari 10 itemset yang dihasilkan pada Tabel 7, tidak semua dihitung karena rule yang dihasilkan adalah jika membeli barang A, maka akan membeli barang B, maka itemset yang dihitung minimal berisi dua item. Maka yang akan dihitung nilai support dan confidence-nya adalah 14 subsets, yaitu:
(a→e), (b→e), (c→e), (d→e), (a,b→e), (a,c→e), (a,d→e), (b,c→e), (b,d→e), (c,d→e), (a,b,c→e), (a,b,d→e), (a,b,c,d→e) (a→d), (b→d), (c→d), (a,b→d), (a,c→d), (b,c→d), (a,b,c→d) (a→c), (b→c), (a,b→c), (a→b).
Dari ke-14 subsets yang dihasilkan selanjutnya akan dihitung nilai support dan confidence-nya. Hanya kombinasi yang lebih besar atau sama dengan minimum support dan minimum confidence yang akan diambil atau strong association rule- nya saja[23].
Adapun hasil dari nilai support dan nilai confidence untuk lebih jelasnya dapat dilihat pada Tabel 8.
Tabel 8. Hasil Support dan Confidence
Jika Membeli Maka Akan Membeli Support Confidence
Gamis Mukena 13,33% 25%
Jilbab Mukena 13,33% 20%
Pasmina Mukena 20% 37,5%
Inner Mukena 46,67% 100%
Gamis Inner 13,33% 25%
Jilbab Inner 13,33% 20%
Pasmina Inner 20% 37,5%
Gamis Pasmina 33,33% 62,5%
Jilbab Pasmina 46,67% 70%
Gamis Jilbab 53,33% 100%
Mukena Gamis 13,33% 28,58%
Mukena Jilbab 13,33% 28,58%
Mukena Pasmina 20% 42,85%
Mukena Inner 46,67% 100%
Inner Gamis 13,33% 28,58%
Inner Jilbab 13,33% 28,58%
Inner Pasmina 20% 42,85%
Pasmina Gamis 33,33% 62,5%
Pasmina Jilbab 46,67% 87,5%
Jilbab Gamis 53,33% 80%
Jika dimisalkan minimum support adalah 20% dan minimum confidence adalah 80 %, maka yang termasuk strong association rule adalah (b→a), (c→b), (a→b), (d→e), (e→d), (a,c→b), (b,c→e), (c,e→d). Data strong association rule yang dapat dilihat pada Tabel 9.
Tabel 9. Strong Association Rule
Strong Rule Maka Akan Membeli Support Confidence Jika membeli Jilbab maka juga membeli Gamis 53,33% 80%
Jika membeli Pasmina maka juga membeli Jilbab 46,67% 87,5%
Jika membeli Gamis maka juga membeli Jilbab 53,33% 100%
Jika membeli Inner maka juga membeli Mukena 46,67% 100%
Jika membeli Mukena maka juga membeli Inner 46,67% 100%
Jika membeli Gamis dan Pasmina maka juga membeli Jilbab 33,33% 100%
Jika membeli Pasmina dan Inner maka juga membeli Mukena 20% 100%
Jika membeli Pasmina dan Mukena maka juga membeli Inner 20% 100%
Dari Tabel 9 di atas rule yang dihasilkan dapat disimpulkan bahwa. Strong Rule yang dihasilkan berjumlah 8 rule.
Rule tersebut antara lain:
Yang memiliki Confidence 80 %:
a. Jika pelanggan membeli item b (Jilbab) maka akan membeli item a (Gamis) dengan Support 53,33% Yang memiliki Confidence 87,5 %:
b. Jika pelanggan membeli item c (Pasmina) maka akan membeli item b (Jilbab) dengan Support 46,67% Yang memiliki Confidence 100 %:
c. Jika pelanggan membeli item a (Gamis) maka akan membeli item b (Jilbab) dengan Support 53,33%
d. Jika pelanggan membeli item d (Inner) maka akan membeli item e (Mukena) dengan Support 46,67%
e. Jika pelanggan membeli item e (Mukena) maka akan membeli item d (Inner) dengan Support 46,67%
f. Jika pelanggan membeli item a,c (Gamis,Pasmina) maka akan membeli item b (Jilbab) dengan Support 33,33%
g. Jika pelanggan membeli item c,d (Pasmina,Inner) maka akan membeli item e (Mukena) dengan Support 20%
h. Jika pelanggan membeli item c,e (Pasmina,Mukena) maka akan membeli item d (Inner) dengan Support 20%.
3.4 Pengujian Hasil 3.4.1 Rapid Miner
Implementasi Data Mining terhadap data transaksi pembelian pakaian menggunakan algoritma FP-Growth pada penelitian ini membutuhkan beberapa aplikasi pendukung, yaitu aplikasi Rapid Miner versi 5.3 sebagai aplikasi Data Mining untuk melakukan pengujian data, dan aplikasi Microsoft Excel 2013 yang digunakan sebagai data masukan pada aplikasi Rapid Miner.
Rapid Miner merupakan software untuk pengolahan Data Mining. Rapid Miner Sebuah lingkungan untuk machine learning, Data Mining, text mining dan predictive analytics. Machine learning Algoritma di mana perilaku
Copyright © 2023 Rahmat Fauzi, Page 442 komputer berevolusi berdasarkan data empiris, seperti sensor atau database. Data Mining Proses mengekstrak pola-pola dari data set yang besar dengan mengombinasikan metoda statistika, kecerdasan buatan dan database.
Rapid Miner Text mining mirip dengan text analytics, yaitu proses untuk mendapatkan informasi bermutu tinggi dari teks. Predictive analytics Teknik-teknik statistika yang menganalisa fakta masa kini dan masa lalu untuk memprediksi kejadian di masa depan.
Rapid Miner Menyediakan prosedur Data Mining dan machine learning termasuk: ETL (extraction, transformation, loading), data preprocessing, visualisasi, modelling dan evaluasi. Proses Data Mining tersusun atas operator-operator yang nestable, dideskripsikan dengan XML, dan dibuat dengan GUI. Ditulis dalam bahasa pemrograman Java. Mengintegrasikan proyek Data Mining Weka dan statistika R. Berikut fungsi menu pada Rapid Miner:
a. Process control: Untuk mengontrol aliran proses, seperti loop atau conditional branch.
b. Utility: Untuk mengelompokkan subprocess, juga macro dan logger.
c. Repository access: Untuk membaca dan menulis repository.
d. Import: Untuk membaca dari berbagai format eksternal.
e. Export: Untuk menulis data ke berbagai format eksternal.
f. Data transformation: Untuk transformasi data dan metadata.
g. Modelling: Untuk proses Data Mining yang sesungguhnya. Seperti klasifikasi, regresi, clustering, aturan asosiasi dll.
h. Evaluation: Untuk menghitung kualitas dari modeling.
Sebelum dapat melakukan pengujian terhadap data yang ada, maka langkah yang dilakukan adalah mempersiapkan data masukan, data yang digunakan bersumber dari data transaksi penjualan pakaian wanita Kadai HAS kota Batam, dengan jumlah data yang digunakan sebanyak 500 transaksi dan 5 atribut. Data masukan dibuat menggunakan aplikasi Microsoft Excel 2013 yang terdiri dari kolom No sebagai No.Transaksi dan kolom atribut sebagai nama dari setiap item.
Implementasi FP-Growth Dengan Rapid Miner
Implementasi Data Mining dengan algoritma FP-Growth dilakukan dengan aplikasi Data Mining yaitu Rapid Miner menggunakan komputer dengan spesifikasi perangkat keras dan perangkat lunak sebagai berikut :
a. Prosessor : Intel Celeron Procesor N2840 b. Memory : DDR3 2 Gb
c. Hardisk : 500 Gb
Sedangkan perangkat lunak yang digunakan antara lain adalah sebagai berikut : a. Sistem Operasi : Microsoft windows 7
b. Aplikasi : Rapid Miner 5.3 3.4.2 Pengujian
Pengujian terhadap data transaksi penjualan dilakukan untuk dapat membuktikan dari data yang telah tersedia dapat menghasilkan pola-pola hubungan kombinasi items sesuai dengan algoritma FP-Growth. Pengujian dilakukan menggunakan aplikasi Rapid Miner yang dapat dilihat pada gambar berikut.
Pada halaman utama Rapid Miner terdapat icon NewProcess, di mana fasilitas tersebut digunakan untuk melakukan proses kerja Data Mining. Setelah memilih fasilitas New Process maka akan muncul area kerja dari Rapid Miner yang dapat dilihat pada gambar berikut.
Adapun tahap-tahap yang dilakukan dalam pengujian ini dapat dilihat pada penjelasan berikut:
a. Import Data
Pada aplikasi Rapid Miner yang digunakan terdapat fasilitas repositories yang berguna untuk melakukan import data masukan yang telah dibuat sebelumnya menggunakan aplikasi Microsoft Excel 2013 ataupun fasilitas sebagai sumber data.
b. Proses Uji Data
Pada tahap ini akan dilakukan proses pengujian terhadap data yang terdiri dari beberapa tahap:
1. Retrieve Data
Di mana data yang akan diolah dimasukkan ke dalam jendela main process.
2. Data Transformation
Selanjutnya dilakukan konversi tipe data dengan menggunakan fasilitas operator Numerical to Binomial yang terdapat pada jendela Operators Rapid Miner.
3. Modeling
Tahap ini merupakan tahap pemodelan algoritma FP-Growth, dengan cara memasukkan operator FP-Growth yang terdapat pada jendela operators yang kemudian dihubungkan dengan operator Numerical to Binomial. Pada pengujian ini ditentukan nilai minimum support = 0.8 Adapun pemodelan FP-Growth dapat dilihat pada gambar berikut.
Gambar 8. Modeling Operator FP-Growth 4. Tahap pembentukann Association Rules
Selanjutnya digunakan operator Create Association Rules yang dihubungkan dengan operator FP-Growth sebelumnya untuk menghasilkan rule-rule dari proses yang dilakukan. Pada pengujian ini diberikan nilai minimum confidence=
0.8 Adapun pemodelan operator Create Association Rules dapat dilihat pada gambar 9.
Gambar 9. Create Association Rules 3.5 Hasil Pengujian
Dari pengujian yang telah dilakukan terhadap data transaksi penjualan yang berjumlah 500 transaksi dengan jumlah atribut sebanyak 5, dan dengan nilai minimum support = 0.2 dan minimum confidence = 0.8 telah dihasilkan sebanyak 5 rules. Hasil pengujian Association Rule (Table) yang dihasilkan oleh aplikasi Rapid Miner dapat dilihat pada Gambar 10.
Gambar 10. Hasil Association Rules (Table)
Hasil pengujian Association Rule Graph View yang dihasilkan oleh aplikasi Rapid Miner dapat dilihat pada gambar berikut.
Gambar 11. Hasil Association Rules (Graph View)
Copyright © 2023 Rahmat Fauzi, Page 444 Hasil pengujian Association Rule Text View yang dihasilkan oleh aplikasi Rapid Miner dapat dilihat pada gambar
Gambar 12. Hasil Association Rules (Text View)
Jadi rule Association Rules yang didapat dari perhitungan dengan software Data Mining yang dipakai yaitu Rapid Miner adalah:
a. Apabila pelanggan membeli Pasmina (c) maka pelanggan juga membeli Jilbab (b) dengan confidence 8,81%
b. Apabila pelanggan membeli Gamis (a) maka pelanggan juga membeli Jilbab (b) dengan confidence: 100%
c. Apabila pelanggan membeli Inner (d) dengan maka pelanggan juga membeli Mukena (e) dengan confidence: 100%
d. Apabila pelanggan membeli Mukena (e)] maka pelanggan juga membeli Inner (d) dengan confidence: 100%) e. Apabila pelanggan membeli Pasmina (c) dan Gamis (a) dengan maka pelanggan juga membeli Jilbab (b) dengan
confidence: 100%
4. KESIMPULAN
Penjualan produk pakaian paling banyak terjual pada Kadai HAS dapat diketahui dengan menggunakan algoritma FP- Growth, dengan melihat produk yang memenuhi minimal support dan minimal confidence, produk yang paling banyak terjual tersebut adalah Gamis dan Jilbab, dalam penghitungan support 53,3% dan confidence 100%. Algoritma FP-Growth dapat membantu mengembangkan strategi pemasaran dengan memberikan saran kepada toko dalam menyediakan barang yang diminati oleh konsumen, dan juga memberi saran kepada konsumen barang mana yang harus dibeli. Melakukan implementasi Algoritma FP-Growth pada aplikasi Rapid Miner dapat menghasilkan perhitungan support dan confidence, kemudian akan menghasilkan strong rule yang memenuhi support dan confidence. Strong rule ini dapat membantu toko untuk memprediksi kebutuhan konsumen.
REFERENCES
[1] Z. Allam and Z. A. Dhunny, “On big data, artificial intelligence and smart cities,” Cities, vol. 89, no. 1, pp. 80–91, Jun. 2019.
[2] Kemenperin RI, “Industri Pakaian Jadi Catatkan Pertumbuhan Paling Tinggi,” Kementerian Perindutrian Repulik Indonesia, 2019. [Online]. Available: https://kemenperin.go.id/artikel/20641/Industri-Pakaian-Jadi-Catatkan-Pertumbuhan-Paling-Tinggi.
[Accessed: 10-Dec-2022].
[3] Kumala Sari, M. Syahril, and Suharsil, “Penerapan Data Mining Untuk Pengelompokkan Data Member Restoran Dengan Menggunkan Metode Hierarki Agglomerative Single Lingkage Pada Restoran Al-Jazeerah Medan,” J. CyberTech, vol. 4, no. 2, pp. 1–8, 2022.
[4] J. R. Saura, “Using Data Sciences in Digital Marketing: Framework, methods, and performance metrics,” J. Innov. Knowl., vol.
6, no. 2, pp. 92–102, Apr. 2021.
[5] N. W. Wardani, Penerapan data mining dalam analytic CRM. Yogyakarta: Yayasan Kita Menulis, 2020.
[6] P. Brous, M. Janssen, and P. Herder, “The dual effects of the Internet of Things (IoT): A systematic review of the benefits and risks of IoT adoption by organizations,” Int. J. Inf. Manage., vol. 51, p. 101952, Apr. 2020.
[7] C. Zai, “Implementasi Data Mining Sebagai Pengolahan Data,” Portal Data, vol. 2, no. 3, pp. 1–12, 2022.
[8] M. R. Fanan, “Penggabungan Forward Selection Untuk Pemilihan Fitur Pada Prediksi Bimbingan Konseling Siswa Dengan Menggunakan Algoritma Naïve Bayes,” Smart Comp, vol. 9, no. 2, pp. 85–88, 2020.
[9] F. Nabyla and Mukrodin, “Data Mining Pengelompokan Biaya Pengeluaran Rumah Sakit Oleh BPJS Kesehatan Menggunakan Algoritma K-Means,” Smart Comp, vol. 10, no. 2, pp. 79–84, 2021.
[10] R. W. Suryaman and G. Wang, “Penerapan Data Mining Untuk Prediksi Slot Time di Bandara Internasional di Indonesia : Algoritma J48,” Smart Comp, vol. 11, no. 3, pp. 332–343, 2022.
[11] E. Bu’ulolo and R. Syahputra, “Pemanfaatan Pembobotan Kriteria Dalam Metode AHP Untuk Memprediksi Infeksi Covid-19 Dengan Algoritma Nearest Neighbor,” Smart Comp, vol. 11, no. 1, pp. 14–18, 2022.
[12] F. Kana, M. Ramadhan, and R. Mahyuni, “Implementasi Data Mining Menganalisa Pola Penjualan Rempah-Rempah Menggunakan Metode Fp-Growth,” J. Sist. Inf. Triguna Dharma (JURSI TGD), vol. 1, no. 4, pp. 557–564, 2022.
[13] N. Salu, A. Michael, S. Y. Padang, and M. S. Adda, “Prediksi Persediaan Sepeda Motor Pada Dealer Yamaha Jaya Baru Motor Mengunakan Metode Frequent Pattern (FF-Growth),” Infinity, vol. 2, no. 1, pp. 29–36, 2022.
[14] A. Anggrawan, M. Mayadi, and C. Satria, “Menentukan Akurasi Tata Letak Barang dengan Menggunakan Algoritma Apriori dan Algoritma FP-Growth,” MATRIK J. Manajemen, Tek. Inform. dan Rekayasa Komput., vol. 21, no. 1, pp. 125–138, Nov.
2021.
[15] Y. P. Bunda, “Algoritma FP-Growth untuk Menganalisa Pola Pembelian Oleh-Oleh,” RJoCS (Riau J. Comput. Sci., vol. 6, no.
1, pp. 34–44, 2020.
[16] Y. Wu and J. Zhang, “Retraction Note: Building the electronic evidence analysis model based on association rule mining and FP-growth algorithm,” Soft Comput., vol. 27, no. 1, pp. 621–621, Jan. 2023.
[17] M. Shawkat, M. Badawi, S. El-ghamrawy, R. Arnous, and A. El-desoky, “An optimized FP-growth algorithm for discovery of association rules,” J. Supercomput., vol. 78, no. 4, pp. 5479–5506, Mar. 2022.
[18] A. Fajri, “Perancangan Rrelokasi Tata Letak Gudang Dengan Metode Systematic Layout Planning Pada PT. MKM,” J. Tek. Ind.
J. Has. Penelit. dan Karya Ilm. dalam Bid. Tek. Ind., vol. 7, no. 1, p. 27, Jun. 2021.
[19] A. Soetara, M. Machfud, M. J. Affandi, and A. Maulana, “Rancang Bangun Model Strategi Operasional Implementasi Lean Manufacturing Berkesinambungan Untuk Peningkatan Produktivitas Industri Pengolahan Kayu di Indonesia,” J. Apl. Bisnis dan Manaj., vol. 5, no. 2, pp. 187–199, May 2019.
[20] E. Munanda and S. Monalisa, “Penerapan Algoritma FP-Growth pada Data Transaksi Penjualan Untuk Penentuan Tata letak Barang,” J. Ilm. Rekayasa dan Manaj. Sist. Inf., vol. 7, no. 2, pp. 173–184, 2021.
[21] Y. Li and S. Yin, “Mining Algorithm for Weighted FP-Growth Frequent Item Sets based on Ordered FP-Tree,” Int. J. Eng.
Manag. Res., vol. 09, no. 05, pp. 154–158, Oct. 2019.
[22] A. H. Nasyuha et al., “Frequent pattern growth algorithm for maximizing display items,” TELKOMNIKA (Telecommunication Comput. Electron. Control., vol. 19, no. 2, p. 390, Aug. 2020.
[23] M. A. Prabukusumo and N. Sidik, “Pemodelan Pola Belanja Pelanggan Produk Infrastruktur dan Security menggunakan Algoritma FP-Growth,” J. Ilm. Komputasi, vol. 21, no. 3, Sep. 2022.