Implementasi Algoritma Apriori untuk
Menganalisis Pola Pembelian Konsumen pada Produk SPA
I Gede Putu Megayasa1, I Komang Agus Ady Aryanto2, I Gede Surya Diputra3, I Nyoman Arianta4, Seftian Rusditya5, Gede Indrawan6
Universitas Pendidikan Ganesha1 2 3 4 5 6 Jl. Udayana No. 11, Singaraja, Kec. Buleleng, Bali
Email : [email protected], [email protected]
,
[email protected],
[email protected],
seftian.rusditya17.@gmail5, [email protected]Abstrak
—
Data merupakan aset yang sangat penting untuk jaga karena melalui data akan dapat digali sebuah informasi yang baru. Pada penelitian ini akan dikelolah sebuah data transaksi penjualan dimana akan dicari sebuah pola pembelian dari konsumen. Melalui pengolahan data ini akan dimungkinkan membuat sebuah keputusan dalam menetapkan sebuah kebijakan bisnis. Dalam mendukung penelitian ini, digunakan sebuah data primer atau data yang masih baru. Data ini kemudian dipilah berdasarkan kategori produknya yang selanjutnya diolah menggunakan sebuah aplikasi WEKA. Dalam pengolahannya dipilih algoritma Apriori yang sesuai untuk mencari kombinasi produk satu dengan yang lainnya. Hasil yang didapatkan berupa saran informasi untuk pembelian produk yang biasanya dikombinasikan pada setiap item lainnya. Dimana dalam penelitian ini, nilai frekuensi pola pembelian paling tinggi ditunjukan pada tiga item produk.Kata kunci: data mining, algoritma apriori, weka, pola pembelian, spa
I. PENDAHULUAN
Kegiatan perdagangan didalam dunia bisnis selalu mempunyai pola yang dinamis dengan penuh persaingan yang mengharuskan para pelaku bisnis harus menemukan suatu strategi yang dapat meningkatkan penjualan dan pemasaraan produk mereka. Dengan adanya kegiatan jual beli maka setiap perusahaan memiliki sebuah data transaksi pembeliaan dari masing-masing konsumennya. Kalau dihitung setiap harinya data transaksi penjualan akan terus meningkat. Oleh karena itu, untuk memanfaatkan data tersebut agar tidak hanya berfungsi sebagai arsip saja maka, diperlukan sebuah sistem yang dapat memberikan informasi yang bermanfaat untuk meningkatkan penjualan.
SPA Bali merupakan sebuah salon perawatan yang juga menjual produk-produk SPA. Dari sumber data transaksinya menunjukan permintaan akan produk SPA di Bali semakin meningkat. Hal inilah yang dijadikan sebagia dasar pengolahan data yang dimungkinkan membuat sebuah keputusan dalam menetapkan sebuah kebijakan bisnis. Proses untuk menguraikan data didalam database seperti mencari keterkaitan penjualan produk dengan produk yang lainnya merupakan suatu konsep yang disebut dengan data mining. Dalam melakukan pengalihan data untuk bidang bisnis biasanya digunakan sebuah algoritma Apriori dimana pola pengolahannya akan berkaitan dengan hubungan setiap produk serta persediaan barang. Ini berarti, data mining memberikan sebuah solusi pedoman untuk
melihat pola beli, pemakaian produk dari waktu ke waktu serta dapat menebak target pasar yang akan mendatang [1]. Oleh sebab itu, perlu implemetasi data mining yang dibangun dengan algoritma Apriori yang digunakan untuk mempelajari bagaimana pola beli dari konsumen dalam memilih produk sehingga nantinya bisa ditebak item-item yang dibeli konsumen. Dari penggalihan informasi ini akan dijadikan media patokan oleh SPA Bali dalam mempromosikan setiap produknya.
Dalam mendukung proses penelitian ini, diperlukan sebuah data transaksi yang dapat dijadikan sebagai acuan untuk mendapatkan pola transaksi atau informasi. Data yang digunakan merupakan data yang terbaru atau primer. Setelah mendapatkan data transaksi penjualan dilakukan pengolahan terhadap data tersebut mulai dari pengelompokan setiap jenisnya sampai pemilahan data berdasarkan transaksi. Kemudian dalam aplikasi pengolahan data yaitu WEKA ditentukan aturan atau Associate Rule dimana dihitung berdasarkan jumlah kemunculan item dalam setiap transaksi sehingga akan didapatkan pola pembelian produk apa saja yang biasanya konsumen akan beli.
II. LANDASAN TEORI 2.1 Data Mining
Data mining merupakan sebuah proses penggalihan informasi dengan menerapkan algoritma tertentu untuk mengahasilkan sebuah informasi yang baru. Data mining biasanya digunakan dalam basis data yang besar sehingga sering disebut Knowledge Discovery in Databases (KDD). Variasi pengolahan data sangat bergantung pada teknik, metode, atau algoritma. Pemilihan metode atau algoritma yang tepat sangat bergantung pada tujuan dan proses KDD secara keseluruhan.
Beberapa definisi awal dari data mining meyertakan fokus pada proses otomatisasi. Michael J.A Berry dan Gordon S. Linoff, (2004) dalam buku Data Mining Technique for Marketing, Sales, and Customer Support mendefinisikan data mining merupakan proses penggalihan data dengan melakukan analisis secara otomatis maupun semi otomatis terhadap data dalam jumlah besar untuk menemukan pola atau informasi yang dapat mendukung pengambilan sebuah keputusan [2].
2.2 Algoritma Apriori
Apriori merupakan algoritma untuk menemukan aturan asosiatif antara hubungan kombinasi produk satu dengan yang lainya. Algoritma ini termasuk dalam jenis aturan asosisasi pada data mining. Algoritma ini berkerja dengan mencari frequent itemset dengan menggunakan teknik association rule [3].
Bentuk dari aturan asosiasi dapat dilihat seperti berikut ini :
{kopi, gula} -> {roti} {support = 40 %, confidence =50 %}
Dimana artinya transaksi item kopi dan gula yang juga melakukan transaksi terhadap roti memiliki nilai
confidence 50% . Sedangkan nilai support 40% dari seluruh transaksi memuat ketiga item tersebut. Algoritma Apriori sangat memperhatikan nilai minimum dari support dan minimum confidence, itu artinya presentase kombinasi sebuah produk dalam database dan kuatnya hubungan antara produk menjadi kunci utama dalam algoritma ini. Nilai support sebuah produk diperoleh dengan mencari jumlah transaksi produk A kemudian dibagi dengan total keseluruhan transaksi seperti pada rumus 1 berikut :
𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆 (𝐴𝐴) = 𝐽𝐽𝑆𝑆𝐽𝐽𝐽𝐽𝐽𝐽ℎ𝑇𝑇𝑆𝑆𝑆𝑆𝐽𝐽𝐽𝐽𝑇𝑇𝑆𝑆𝐽𝐽𝑇𝑇𝑇𝑇𝐽𝐽𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑆𝑆𝐽𝐽𝑇𝑇𝑇𝑇𝐽𝐽𝑇𝑇𝑇𝑇𝑇𝑇𝑃𝑃𝑆𝑆𝑆𝑆𝑃𝑃𝑆𝑆𝑇𝑇𝐴𝐴
...[1] Sementara itu, untuk mencari nilai support dari dua item dilakukan dengan cara menjumlahkan data transaksi yang mengandung item A dan item B kemudian dibagi dengan total jumlah transaksi seperti yang ditunjukan pada rumus 2 berikut :
𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆 (𝐴𝐴,𝐵𝐵)
= 𝐽𝐽𝑆𝑆𝐽𝐽𝐽𝐽𝐽𝐽ℎ𝑇𝑇𝑆𝑆𝐽𝐽𝑇𝑇𝑇𝑇𝐽𝐽𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑆𝑆𝑆𝑆𝐽𝐽𝐽𝐽𝑇𝑇𝑆𝑆𝐽𝐽𝑇𝑇𝑇𝑇𝐽𝐽𝑇𝑇𝑇𝑇𝑇𝑇𝑃𝑃𝑆𝑆𝑆𝑆𝑃𝑃𝑆𝑆𝑇𝑇𝐴𝐴𝑃𝑃𝐽𝐽𝑇𝑇𝐵𝐵
...[2] Sedangkan untuk pencarian aturan asosiasi yang memenuhi syarat minimum nilai confidence agar mendapatkan hubungan antara produk A dengan produk Bdapat ditunjukan pada rumus 3 berikut ini :
𝐶𝐶𝑆𝑆𝑇𝑇𝐶𝐶𝑇𝑇𝑃𝑃𝐶𝐶𝑇𝑇𝐶𝐶𝐶𝐶 𝑃𝑃(𝐵𝐵|𝐴𝐴)
= 𝐽𝐽𝑆𝑆𝐽𝐽𝐽𝐽𝐽𝐽ℎ𝐽𝐽𝑆𝑆𝐽𝐽𝐽𝐽𝐽𝐽ℎ𝑇𝑇𝑆𝑆𝐽𝐽𝑇𝑇𝑇𝑇𝐽𝐽𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑆𝑆𝐽𝐽𝑇𝑇𝑇𝑇𝐽𝐽𝑇𝑇𝑇𝑇𝑇𝑇𝑃𝑃𝑆𝑆𝑆𝑆𝑃𝑃𝑆𝑆𝑇𝑇𝑃𝑃𝑆𝑆𝑆𝑆𝑃𝑃𝑆𝑆𝑇𝑇𝐴𝐴𝑃𝑃𝐽𝐽𝑇𝑇𝐴𝐴 𝐵𝐵
...[3] 2.3 Association Rule
Association Rule adalah teknik atau prosedur untuk mencari hubungan antara produk dalam sebuah database. Kegunaannya untuk menentukan sejauh mana ukuran batasan hasil keluaran data yang diinginkan oleh pengguna. Dimana nilai support menunjukan proporsi dari transaksi dalam database yang mengandung elemen A dan B, sedangkan nilai confidence
menunjukan ukuran presentase ketepatan suatu aturan yang mengandung elemen A dan B [4].
2.4 SPA
SPA (Solus Per Aqua) merupakan kegiatan perawatan diri untuk memberikan kenyamanan kepada tubuh maupun pikiran. Secara Etimologi menurut kamus bahasa Inggris Meriem-Webster, kata SPA berarti tempat yang berair di kota kecil provinsi Belgia. Di kota SPA ini, ada sebuah mata air terkenal yang mengandung mineral dan telah dikunjungi sejak abad ke-14. Pada tahun 1500 SM penggunaan SPA sebagai sarana pengobatan telah tercantum dalam suatu kepustakaan medis dengan judul Rig Veda yang berarti “perawatan air untuk penyembuhan demam” [5]. Manfaat yang dapat diberikan melalui SPA seperti memberikan detoksifikasi tubuh untuk meningkatkan sistem kekebalan tubuh, menggilangkan kecemasan, kemarahaan dan defresi.
III. METODE PENELITIAN 3.1 Objek Penelitian
Pada objek penelitian ini dilakukan ditempat salon SPA Bali. Dengan berfokus pada data transaksi yang akan dijadikan patokan dalam melakukan analisis. Dalam penelitian ini digunakan data dengan jumlah 44 transaksi dengan ketentuan harus memiliki lebih dari satu transaksi. Melalui data ini akan dipilih untuk dijadikan sebuah acuan kombinasi pengetahuan dengan menghasilkan kajian untuk menentukan pola beli konsumen terhadap produk SPA.
3.2 Jenis dan Metode Pengumpulan data 3.2.1 Jenis Data
a. Data Primer
Data yang diperoleh atau dikumpulkan langsung di lapangan oleh orang yang melakukan penelitian atau yang bersangkutan yang memerlukannya [6]. Data primer di dapat dari sumber informan yaitu individu atau perseorangan seperti hasil wawancara yang dilakukan oleh peneliti.
b. Data Sekunder
Data yang diperoleh atau dikumpulkan oleh orang yang melakukan penelitian dari sumber-sumber yang telah ada [6]. Data ini digunakan untuk mendukung informasi primer yang telah diperoleh yaitu dari bahan pustaka, literatur, penelitian terdahulu, buku, dan lain sebagainya.
3.2.2 Pengumulan Data
Pengumpulan data merupakan kegiatan mencari data yang akan digunakan dalam melakukan penelitian. Pengumpulan data adalah cara-cara yang dapat
digunakan oleh peneliti untuk mengumpulkan data. Instrumen sebagai alat bantu dalam menggunakan metode pengumpulan data merupakan sarana yang dapat diwujudkan dalam benda, misalnya angket, perangkat tes, pedoman wawancara, pedoman observasi, skala dan sebaginya.
a. Studi Literatur
Metode ini dilakukan dengan cara mempelajari konsep, pengumpulan pengetahuan berupa teori serta materi, bersumber dari buku ataupun literatur lainnya, khususnya mengenai hal-hal yang berhubungan dengan sistem data
warehouse yang mengarah kepada pemecahan masalah
b. Observasi
Observasi merupakan salah satu cara pengumpulan data dan informasi yang dilakukan dengan cara melakukan pengamatan langsung terhadap objek yang diteliti untuk memperoleh gambaran mengenai sistem yang berjalan atau prosedur yang ada pada objek penelitian tersebut. Observasi dilakukan di Salon SPA Bali.
c. Wawancara
Wawancara tatap muka merupakan suatu cara efektif untuk mengumpulkan informasi penelitian ataupun pekerjaan. Sehingga gerak dan mimik responden merupakan media yang diperlukan untuk melengkapi data-data untuk tercapainya tujuan penelitian. Wawancara dilakukan dalam bentuk tanya jawab dengan pihak yang terkait, pihak yang terkait pada penelitian ini diantaranya para pembeli dan penjual.
IV. HASIL DAN PEMBAHASAN 4.1 Penyeleksian Data
Dalam data transaksi terdapat banyak data yang harus diseleksi terlebih dahulu dimana data-data tersebut dipilah berdasarkan kategori produk. Adapun 14 kategori produk yang digunakan dalam penelitian ini antara lain :
Table 1. Penyeleksian Data No Kategori Produk 1 Jasmine_Lulur 2 Boreh_Spice 3 Vanilla_Coffee_Bean 4 Bali_Limau 5 Oil 6 Lotion 7 Essential 8 Fragrant 9 Cramic 10 Linen 11 Botol 12 Other 13 Scrub 14 Insence 4.2 Transformasi Data
Pengolahan data dalam penelitian ini menggunakan aplikasi Weka. Untuk bisa menggelolah data dengan aplikasi Weka dibutuhkan format data yang mendukung format file dengan aplikasi Weka. Format file yang dibutuhkan untuk penggolahan data harus ber-ekstensi ARFF. Berikut ini adalah data transaksi yang telah diubah menjadi bentuk yang mendukung aplikasi Weka, dimana jumlah data yang diperlihatkan hanya beberapa potong saja.
Gambar 1. Data Transaksi dalam dalam format .ARFF Berdasarkan data yang telah diubah kedalam format .ARFF didapatkan struktur penulisannya. Dimana dapat dijelaskan pada bagian paling atas merupakan relationnya dengan nama ‘data transaksi’ kemudian pada bagian 1 merupakan atribut kategori item sedangkan bagian 2 merupakan basis data dari transaksi.
4.3 Pengolahan Data
Setelah data sudah berbentuk ARFF berikutnya dilakukan pengolahan untuk mendapatkan informasi yang baru. Untuk mengelolahnya mengunakan aplikasi Weka seperti berikut ini.
Gambar 2. Aplikasi WEKA
Gambar 2 diatas adalah tampilan utama saat aplikasi Weka pertama kali dibuka. Kemudian untuk menguji data dengan berbagai algoritma menggunakan aplikasi ini dengen mengklik menu explore, dimana antarmuka dari halaman explore dapat dilihat seperti dibawah ini :
Gambar 3. Halaman Explore
Setelah antarmuka halaman explore muncul kemudian masukan data yang ingin dimasukan dengan cara klik open file (gambar 4), apabila data yang diinputkan sudah berhasil maka akan terlihat konfirmasi yang terlihat dalam antarmuka seperti gambar 5 dibawah ini :
Gambar 4. Open Dataset
Gambar 5. Dataset
Apabila data sudah dimasukan seperti yang terlihat pada gambar 5, maka selanjutnya dapat dilanjutkan dengan pengolahan data dengan menerapkan algortima apriori. Untuk melakukan pengolahan ini pilih menu associate yang terlihat seperti gambar 5. Untuk hasil pengolahannya dapat dilihat pada gambar 6.
Gambar 6. Hasil Pengolahan Data dengan Apriori Pengolahan data menerapkan algoritma apriori, dimana step pertama yang harus dilakukan dengan menentukan jumlah rule yang dilihat dari seberapa sering sebuah produk muncul pada transaksi. Dalam penelitian ini ditentukan jumlah rulenya sebesar lima yang dihitung berdasarkan jumlah kemunculan produk dalam setiap transaksi, sehingga hasil pola yang dikeluarkan oleh aplikasi ini sebanyak lima.
4.4 Hasil Analisis
Berdasarkan hasil dari pengolahan data dengan algoritma apriori seperti yang terlihat pada gambar 6 dapat dijelaskan pola pembelian yang terbentuk yaitu : 1. Jika membeli Jasmine Lulur Shampoo 1ltr maka
kemungkinan konsumen juga membeli Vanilla & Coffee Bean Body Scrub 1kg memiliki tingkat
confidence 1 yang artinya tingkat kepastian konsumen akan membeli Jasmine Lulur Shampoo 1ltr 4 dan Coffee Bean Body Scrub 1kg 4 sangat tinggi atau paling diminati.
2. Jika membeli Jasmine Lulur Shampoo 1ltr maka kemungkinan konsumen juga membeli Lavender Essential Oil 10ml memiliki tingkat confidence 1 yang artinya tingkat kepastian konsumen akan membeli Jasmine Lulur Shampoo 1ltr dan Lavender Essential Oil 10ml sangat tinggi atau paling diminati setelah pola pertama.
3. Jika membeli Vanilla & Coffee Bean Body Scrub 1kg dan Lavender Essential Oil 10ml maka kemungkinan konsumen juga membeli Jasmine Lulur Shampoo 1ltr memiliki tingkat confidence 1 yang artinya tingkat kepastian konsumen akan membeli pola ini tinggi.
4. Jika membeli Jasmine Lulur Shampoo 1ltr dan Lavender Essential Oil 10ml maka kemungkinan konsumen juga membeli Vanilla & Coffee Bean Body Scrub 1kg memiliki tingkat confidence 1 yang artinya tingkat kepastian konsumen akan membeli pola ini tinggi.
5. Jika membeli Jasmine Lulur Shampoo 1ltr dan Vanilla & Coffee Bean Body Scrub 1kg maka kemungkinan konsumen juga membeli Lavender Essential Oil 10ml memiliki tingkat confidence 1 yang artinya tingkat kepastian konsumen akan membeli pola ini tinggi.
V. KESIMPULAN
Berdasarkan dari penjelasan yang telah dipaparkan diatas dapat dismpulkan bahwa :
1. Digunakan algoritma apriori untuk mengetahui pola pembelian konsumen dengan memakai aplikasi Weka.
2. Melalui hasil yang didapatkan menunjukan pola pembelian yang memiliki frekuensi paling tinggi yaitu jika membeli produk Jasmine Lulur Shampoo 1ltr dan Vanilla & Coffee Bean Body Scrub 1kg maka konsumen juga akan membeli Lavender Essential Oil 10ml.
3. Dengan hasil ini akan memudahkan pemilik salon SPA untuk memasarkan produknya kepada konsumen.
REFERENSI
[1] Anggraini, Dyah. 2009. “Analisis Perubahan Kelompok Berdasarkan Perubahan Nilai Jual Pada Bloomberg Market Data dengan Menggunakan Formal Concept Analysis”. Gunadarman. Jakarta.
[2] Michael J.A. Berry dan Gordon S.Linoff. 2004. ”Data Mining Tecniques For Marketing, Sales, and Customer Relationship Management”. Penerbit Wiley Publishing Inc. Kanada.
[3] Erwin., 2009. “Analisis Market Basket Dengan Algoritma Apriori dan FP-Growth”.
[4] Larose, Daniel T. 2005. “Discovering Knowledge in Data. An Introduction to Data Mining”. John Wiley & Sons. New Jersey. [5] Hult, A. (2007). "Dricka brunn": Om gamla
tiders spa. Mjolby: Atremi.
[6] Hasan, M. Iqbal. 2002. “Pokok-pokok Materi Metodologi Penelitian dan Aplikasinya”, Ghalia Indonesia. Bogor.
[7] Kusrini, dan Emha Taufik Luthfi. 2009. “Algoritma Data Mining”. Penerbit Andi. Yogyakarta.