APLIKASI SEQUENTIAL PATTERN DISCOVERY USING EQUIVALENCE CLASSES (SPADE) PADA
DATA TRANSAKSI PENJUALAN
(Studi Kasus Produk Kecantikan dan Perawatan Tubuh)
ANISAH MUFIDATUSH SHALIHAH
DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR
BOGOR 2016
PERNYATAAN MENGENAI SKRIPSI DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA
Dengan ini saya menyatakan bahwa skripsi berjudul Aplikasi Sequential Pattern Discovery using Equivalence Classes (SPADE) pada Data Transaksi Penjualan (Studi Kasus Produk Kecantikan dan Perawatan Tubuh) adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir skripsi ini.
Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor.
Bogor, Juli 2016 Anisah Mufidatush Shalihah NIM G14120078
ABSTRAK
ANISAH MUFIDATUSH SHALIHAH. Aplikasi Sequential Pattern Discovery using Equivalence Classes (SPADE) pada Data Transaksi Penjualan (Studi Kasus Produk Kecantikan dan Perawatan Tubuh). Dibimbing oleh AGUS MOHAMAD SOLEH dan LA ODE ABDUL RAHMAN.
Setiap toko ritel memiliki data transaksi penjualan yang besar yang dihimpun setiap harinya. Data-data transaksi tersebut dapat diolah sehingga diperoleh informasi-informasi berguna, di antaranya pola belanja konsumen. Pola belanja konsumen dapat digunakan sebagai bahan untuk perancangan strategi pemasaran.
Analisis yang biasa digunakan yaitu analisis asosiasi pada transaksi penjualan.
Penelitian ini menggunakan metode pola sekuensial dengan algoritme SPADE
‘Sequential PAttern Discovery using Equivalence classes’. Data yang digunakan adalah data riil transaksi penjualan toko ritel produk kecantikan dan perawatan tubuh sejak 1 Januari-22 April 2015. Minimum support (batas minimum banyaknya pembeli) yang digunakan 0.01% dan minimum confidence (batas minimum peluang kejadian) sebesar 1%, kedua nilai tersebut ditentukan berdasarkan keadaan data.
Berdasarkan hasil yang diperoleh, menunjukkan item yang paling diminati adalah sabun pencuci muka dan minyak penghilang jerawat berbahan kayu putih, grup yang paling diminati adalah grup make up bibir dan make up dasar. Pada data latih dan data uji yang relatif seimbang, semakin panjang periode penjualan dan semakin banyak transaksi maka semakin baik pula akurasi pembelian kembali yang diduga.
Kata kunci: data transaksi, pola sekuensial, SPADE, strategi pemasaran.
ABSTRACT
ANISAH MUFIDATUSH SHALIHAH. Application of Sequential Pattern Discovery using Equivalence Classes (SPADE) on Sales Transaction Data (Case Study for Beauty and Body Treatment Product). Supervised by AGUS MOHAMAD SOLEH and LA ODE ABDUL RAHMAN.
Every retail store has a big transaction data which is collected everyday. It can be used to mining many informations, such as consumer shopping pattern.
Consumer shopping pattern will be useful for marketing strategy making. The analysis that commonly used is association rule mining. In order to mine better pattern, this research use sequential pattern mining using SPADE algorithm. This research use real transaction data at beauty and treatment retail store from January 1st until April 22nd 2015. This research use 0.01% minimum support and 1%
minimum confidence, both of these values were determined based on the data condition. Based on the results of this research, the items that costumer likely to buy are teatree facewash and teatree oil. The groups that costumer likely to buy are lip make up and base make up. For the training and test data that have a balance length of selling period and transactions, the longer selling period and the more transaction, the better prediction can be made.
Keywords: marketing strategy, sequential pattern, SPADE, transactional data.
Skripsi
sebagai salah satu syarat untuk memperoleh gelar Sarjana Statistika
pada
Departemen Statistika
APLIKASI SEQUENTIAL PATTERN DISCOVERY USING EQUIVALENCE CLASSES (SPADE) PADA
DATA TRANSAKSI PENJUALAN
(Studi Kasus Produk Kecantikan dan Perawatan Tubuh)
DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR
BOGOR 2016
ANISAH MUFIDATUSH SHALIHAH
PRAKATA
Puji dan syukur penulis panjatkan kepada Allah SWT karena berkat rahmat dan karunia-Nya lah penulis dapat menyelesaikan karya ilmiah yang berjudul Aplikasi Sequential Pattern Discovery using Equivalence Classes (SPADE) pada Data Transaksi Penjualan (Studi Kasus Produk Kecantikan dan Perawatan Tubuh).
Terselesaikannya penyusunan karya ilmiah ini tentunya tidak terlepas dari bantuan, motivasi, saran, dan kerja sama dari berbagai pihak. Oleh karena itu, penulis mengucapkan terima kasih kepada:
1. Bapak Agus Mohamad Soleh, SSi, MT selaku ketua komisi pembimbing atas kesempatan yang telah diberikan kepada penulis untuk dapat mengembangkan diri pada topik yang penulis teliti, serta masukan dan nasihat kepada penulis untuk dapat menghasilkan karya ilmiah yang baik.
2. Bapak La Ode Abdul Rahman, SSi, MSi selaku anggota komisi pembimbing yang sangat sabar dan teliti dalam memberikan masukan dan nasihat kepada penulis untuk dapat menghasilkan karya ilmiah yang baik.
3. Ibu Pika Silvianti, SSi, MSi selaku penguji yang sangat baik dan teliti dalam memberikan saran-saran untuk perbaikan.
4. Ibu, nenek, adik-adik serta seluruh keluarga atas segala motivasi, nasihat, dan doanya yang selalu ditujukan kepada penulis sehingga penulis selalu bersemangat untuk menyelesaikan karya ilmiah ini.
5. Seluruh Dosen Departemen Statistika IPB atas ilmunya yang tak ternilai sehingga penulis dapat menerapkan ilmu Statistika dengan baik dan benar.
6. Seluruh Staf Tata Usaha Departemen Statistika IPB yang selalu bersedia direpotkan sehingga segala proses administrasi berjalan dengan lancar.
7. Teman-teman bertukar pikiran dan berkeluh kesah (Adam Muhammad Ridwan, Lani Ulung Imuno, dan Muhammad Fauzan SN) atas bantuan, motivasi, dan doa mereka sehingga penulis dapat menyelesaikan karya ilmiah ini.
8. Teman-teman Statistika 49, GSB IPB (terutama departemen DBC), Ayumas IPB, dan Lorong 1 Asrama A2 (2012/2013) atas kesediaannya untuk saling bekerja sama, berbagi keceriaan, berbagi pengetahuan, dan berbagi pengalaman kepada penulis selama penulis menempuh pendidikan S1 di IPB.
Semoga karya ilmiah ini bermanfaat.
Bogor, Juli 2016 Anisah Mufidatush Shalihah
DAFTAR ISI
DAFTAR TABEL vi
DAFTAR GAMBAR vi
DAFTAR LAMPIRAN vi
DAFTAR ISTILAH vii
PENDAHULUAN 1
METODE 2
Data 2
Tahapan Penelitian 2
HASIL DAN PEMBAHASAN 7
Gambaran Umum Data 7
Penentuan Pola Sekuensial 8
Pembentukan Aturan 14
SIMPULAN 17
DAFTAR PUSTAKA 18
LAMPIRAN 19
RIWAYAT HIDUP 24
DAFTAR TABEL
1 Rancangan pembagian periode penjualan untuk data latih dan data uji 6 2 Notasi keluaran cSPADE pada package ‘arulesSequences’ di program
R 7
3 Dasar pembagian grup dalam kategori 8
4 Beberapa aturan yang terbentuk (data per item) 15 5 Beberapa aturan yang terbentuk (data per grup) 16
DAFTAR GAMBAR
1 Tahapan penelitian seperti pada proses KDD 2
2 Distribusi item dalam tiap kategori 7
3 Sekuens berukuran 1-3 dengan nilai support terbesar (Train1.1) 9 4 Sekuens berukuran 1-3 dengan nilai support terbesar (Train1.2) 10 5 Sekuens berukuran 1-3 dengan nilai support terbesar (Train1.3) 10 6 Sekuens berukuran 1-3 dengan nilai support terbesar (Train2.1) 11 7 Sekuens berukuran 1-3 dengan nilai support terbesar (Train2.2) 12 8 Sekuens berukuran 1-3 dengan nilai support terbesar (Train2.3) 12 9 Sekuens berukuran 1-3 dengan nilai support terbesar (T31) 13 10 Sekuens berukuran 1-3 dengan nilai support terbesar (T32) 14 11 Sekuens berukuran 1-3 dengan nilai support terbesar (T33) 14
DAFTAR LAMPIRAN
1 Daftar kategori dan grup serta jumlah item yang termasuk di
dalamnya 19
2 Daftar grup dan item 20
3 Aturan dengan nilai support terbesar tiap kelompok panjang sekuens
(data per item) 21
4 Aturan dengan nilai support terbesar tiap kelompok panjang sekuens
(data per grup) 22
DAFTAR ISTILAH
1 Antecedent : kejadian awal; pembelian sebelumnya
2 Confidence : peluang consequent terjadi jika antecedent terjadi (pada suatu aturan); nilainya berkisar antara 0 sampai 1 3 Consequent : kejadian akhir; pembelian berikutnya
4 Frequent : memenuhi kriteria
5 Lift : ukuran korelasi antecedent dan consequent; nilainya berkisar antara 0 sampai tak hingga
6 Prefix : awalan suatu sekuens; (k-1)-sekuens pada k-sekuens 7 Sekuens : satu set kejadian berurutan; sekuens berukuran k
dinotasikan sebagai k-sekuens
8 Support : frekuensi relatif terjadinya suatu kejadian; nilainya berkisar antara 0 sampai 1
PENDAHULUAN
Berkembangnya zaman menyebabkan kebutuhan masyarakat berkembang dan semakin banyak pula. Toko ritel pun banyak dibangun untuk memenuhi kebutuhan masyarakat. Menjamurnya toko ritel menimbulkan persaingan yang luar biasa bagi para pemilik ritel sehingga diperlukan suatu strategi pemasaran untuk meningkatkan penjualan maupun pelayanan terhadap konsumen. Setiap toko ritel memiliki data transaksi penjualan yang besar yang dihimpun setiap harinya. Namun belum banyak yang mengetahui apa yang bisa digali dari banyaknya himpunan data tersebut. Data-data tersebut dapat sangat berguna untuk menentukan strategi pemasaran apabila diolah dengan baik. Salah satu analisis yang sering digunakan yaitu dengan analisis asosiasi pada transaksi penjualan.
Analisis asosiasi atau biasa disebut Association Rule Mining (ARM) adalah suatu metode deskriptif lain pada teknik penambangan data (data mining) yang dapat digunakan untuk menganalisis produk-produk yang dibeli pada sekali transaksi (Tuffery 2011). Algoritme yang biasa digunakan pada ARM dalam penelitian-penelitian sebelumnya adalah apriori (Han et al. 2011), karena merupakan algoritme yang paling sederhana dan mudah. Pada perkembangannya mulai digunakan analisis pola sekuensial atau Sequential Pattern Mining, yaitu suatu teknik menambang data yang membentuk pola dari suatu rentetan data yang berulang. Penelitian mengenai penentuan pola pada data transaksi menggunakan metode pola sekuensial sudah banyak dilakukan terutama dari ranah studi ilmu komputer. Seperti penelitian Sijabat (2011), menggunakan algoritme SPADE untuk menentukan pola sekuensial dari transaksi penjualan pada suatu toko ritel yang berhasil menemukan pola yang paling diminati yakni snack dan susu. Penelitian serupa juga dilakukan oleh Juliastio dan Gunawan (2015) untuk menentukan pola sekuensial dari transaksi penjualan suatu toko spare part dan aksesori komputer.
Metode pola sekuensial untuk prediksi juga digunakan oleh Wright et al. (2015) mengenai prediksi obat yang diresepkan berikutnya bagi penderita diabetes.
Penelitian Wright et al. (2015) menghasilkan kesimpulan bahwa metode pola sekuensial sangat berguna dalam mengidentifikasi hubungan sementara antar obat- obatan dan hubungan sementara ini berguna untuk membuat prediksi mengenai obat yang diresepkan berikutnya.
Tujuan dari penelitian ini adalah menemukan pola belanja konsumen sekaligus memprediksi item yang cenderung dibeli berikutnya selama periode penjualan yang ditentukan. Oleh karena itu metode pola sekuensial sangat cocok digunakan dalam penelitian ini. Algoritme yang digunakan dalam penelitian ini adalah Sequential PAttern Discovery using Equivalence classes (SPADE) karena SPADE merupakan algoritme yang efisien untuk menambang sekuens berulang (Zaki 2001).
2
METODE
Data
Data yang digunakan pada penelitian ini merupakan data riil transaksi penjualan suatu perusahaan toko ritel produk kecantikan dan perawatan tubuh yang direkam setiap harinya sejak tanggal 1 Januari sampai 22 April 2015. Tidak semua data akan digunakan dalam penelitian ini, namun hanya transaksi yang dilakukan oleh member toko ritel saja, sehingga terdapat 1216849 baris data. Peubah yang digunakan dalam analisis ialah EID (kode tanggal transaksi), SID (kode pembeli), dan ITEM (item yang dibeli). Format data berupa numerik untuk peubah EID dan SID, sedangkan untuk peubah ITEM berupa karakter. Pada penelitian ini penentuan pola sekuensial tidak hanya dilakukan pada data per item namun juga dilakukan pada data per grup untuk melihat potensi pemasaran di kedua tingkatan item.
Tahapan Penelitian
Tahapan penelitian yang akan dilakukan seperti pada proses knowledge discovery in database (KDD). KDD merupakan suatu proses memperoleh ilmu pengetahuan yang berasal dari sekumpulan data besar (Han et al. 2011). Tahapan penelitian seperti pada Gambar 1.
Gambar 1 Tahapan penelitian seperti pada proses KDD 1. Praproses data
a. Pembersihan data
Data yang langsung berasal dari mesin kasir harus disesuaikan dengan format yang digunakan pada program analisis. Pada tahap ini peubah pada data sudah direduksi sehingga tersisa peubah SID, EID, ITEM.
b. Pemilihan data
Pemilihan data dilakukan berdasarkan kebutuhan untuk melakukan analisis. Pada penelitian ini analisis pola sekuensial dilakukan pada data member (anggota) agar sekaligus dapat diketahui
Mulai Praproses data Data target
Penentuan pola sekuensial
Pola sekuensial belanja konsumen
Interprestasi hasil
Selesai
3 pembelian kembalinya. Kemudian item pada transaksi juga diseleksi.
Item yang merupakan hadiah atau bonus dihilangkan dari daftar.
c. Manajemen data
Manajemen data diperlukan untuk menyiapkan data agar siap untuk dianalisis. Manajemen data yang dilakukan pada penelitian ini adalah membentuk data sedemikian rupa sehingga dapat langsung diproses oleh program, serta pembuatan kode untuk tiap item dan grup barang agar lebih efisien.
2. Penentuan pola sekuensial a. Association Rule Mining
Pada kasus toko ritel dapat diketahui item apa saja yang berulang kali (sering) dibeli secara bersamaan. Association Rule Mining (ARM) atau dalam hal ini biasa disebut Market Basket Analysis merupakan suatu analisis, yang sesuai namanya digunakan untuk menghasilkan rule (aturan) frequent itemset. Frequent itemset dapat diartikan sebagai satu set item yang berulang dengan support lebih dari atau sama dengan minimum support. Penentuan aturan asosiasi yang baik dilihat berdasarkan nilai support, confidence, dan lift. Semakin tinggi nilainya semakin baik aturan tersebut, karena pada dasarnya nilai support, confidence, dan lift diperoleh dari nilai peluang.
Misalkan A dan B adalah item yang dibeli, maka : i) Support
Support merupakan peluang bersama item dalam sekuens.
Support menunjukkan frekuensi atau banyaknya pembeli yang membeli item tersebut dalam semua transaksi. Minimum support adalah nilai support terkecil yang ditetapkan oleh peneliti untuk memotong daftar sekuens sehingga hanya sekuens yang sesuai kriteria peneliti saja yang digunakan. Support dinotasikan sebagai berikut:
Support(𝐴 ⇒ 𝐵) = 𝑃(𝐴 ∩ 𝐵), artinya support asosiasi item A dan B adalah peluang A irisan B (Han et al. 2011).
ii) Confidence
Confidence menunjukkan peluang item pada lajur kiri dibeli bersamaan dengan item pada lajur kanan. Minimum confidence adalah nilai confidence terkecil yang ditetapkan oleh peneliti untuk memotong daftar aturan sehingga hanya aturan terbaik dan terkuat yang digunakan. Confidence dinotasikan sebagai berikut:
Confidence(𝐴 ⇒ 𝐵) = 𝑃(𝐵|𝐴), artinya confidence asosiasi item A dan B adalah peluang B syarat A (Han et al. 2011).
iii) Lift
Lift merupakan peluang rasio peluang bersama item dalam sekuens dengan peluang bersama item apabila item saling bebas.
Lift menunjukkan kekuatan aturan yang dihasilkan. Apabila nilai lift lebih dari 1 artinya item pada lajur kanan dan kiri berkorelasi positif. Apabila nilai lift kurang dari 1 artinya item pada lajur kanan dan kiri berkorelasi negatif, dan jika bernilai 1 maka item pada lajur kanan dan kiri saling bebas (Zaki dan Meira 2014). Lift dinotasikan sebagai berikut:
4
Lift(𝐴 ⇒ 𝐵) = 𝑃(𝐴∩𝐵)
𝑃(𝐴) 𝑃(𝐵)=𝑃(𝐵|𝐴)
𝑃(𝐵) , artinya lift asosiasi item A dan B adalah peluang B syarat A dibagi peluang B (Ledolter 2013).
b. Algoritme Apriori
Apriori adalah algoritme pada ARM yang paling sering digunakan karena sederhana dan mudah. Sesuai namanya apriori menggunakan prior itemset untuk menentukan aturan. Apriori memiliki beberapa kelebihan diantaranya cepat, meminimalkan pembacaan basis data, dan menggunakan format data vertikal.
c. Sequential Pattern Mining
Penentuan pola sekuensial menggunakan metode Sequential Pattern Mining (SPM). SPM pertama kali dikenalkan oleh Agrawal dan Srikant pada tahun 1995 berdasarkan studinya mengenai sekuens pembelian oleh pembeli. SPM adalah metode yang digunakan untuk mencari pola yang berulang dengan urutan waktu dalam suatu data besar. Istilah dan notasi yang digunakan pada penelitian ini adalah sebagai berikut (Han et al. 2011):
i) 𝐼 = {𝐼1, 𝐼2, … , 𝐼𝑝} adalah semua itemset, itemset adalah suatu set yang berisi item.
ii) 𝑠 = 〈𝑒1𝑒2… 𝑒𝑙〉 adalah sekuens, sekuens yaitu daftar kejadian yang berurutan dimana 𝑒1 terjadi sebelum 𝑒2 dan seterusnya.
iii) (𝑥1𝑥2… 𝑥𝑞) adalah sekumpulan item, 𝑥𝑘 adalah sebuah item.
Jumlah item dalam sebuah sekuens disebut panjang sekuens, sekuens dengan panjang 𝑙 disebut 𝑙-sekuens.
iv) 𝛼 = 〈𝑎1𝑎2… 𝑎𝑛〉 adalah subskuens dari suatu supersekuens.
v) 𝛽 = 〈𝑏1𝑏2… 𝑏𝑚〉 adalah supersekuens dari 𝛼 , dimana 𝛼 adalah himpunan bagian dari 𝛽.
vi) 𝑆 adalah basisdata sekuens, yaitu satu set ID sekuens (SID) dan sekuens (𝑠) dinotasikan sebagai 〈𝑆𝐼𝐷, 𝑠〉.
vii) Support dari suatu sekuens 𝛼 dalam basisdata 𝑆 adalah jumlah baris pada basisdata yang mengandung 𝛼 , dinotasikan sebagai supportS(𝛼) = |{〈𝑆𝐼𝐷, 𝑠〉|(〈𝑆𝐼𝐷, 𝑠〉 ∈ 𝑆)𝛼⊑𝑠}|.
viii) minimum support threshold (min_sup) adalah nilai batas yang ditentukan untuk membentuk pola sehingga sekuens 𝛼 frequent (berulang) dalam basisdata 𝑆 jika supportS(𝛼) ≥ min_sup , sekuens yang frequent disebut pola sekuensial.
d. Algoritme SPADE
Penelitian ini menggunakan algoritme SPADE, yaitu algoritme dengan pendekatan seperti apriori pada analisis asosiasi. Algoritme SPADE menggunakan format data vertikal, kemudian akan menghasilkan sepasang set (SID, EID) yang membentuk ID list.
Kelebihan penggunaan algoritme SPADE adalah dapat meminimalkan penggunaan I/O dengan pengurangan database scan, meminimalkan penggunaan komputasi dengan menggunakan skema pencarian yang lebih efisien, serta dapat menentukan support dari k- sekuens dengan menggabungkan ID list dari dua atau lebih (k-1)- subsekuensnya (Han et al. 2011). Berikut langkah-langkah mencari
5 sekuens yang frequent kemudian menentukan aturan menggunakan algoritme SPADE (Zaki 2001):
i) Frequent 1-sekuens
Sejatinya frequent 1-sekuens adalah daftar item yang frequent. Sekuens dikatakan frequent apabila nilai supportnya lebih dari minimum support. Menentukan frequent 1-sekuens adalah dengan memeriksa setiap itemset basisdata sekuens.
Pasangan SID dan EID (ID list) dari setiap itemset disimpan terlebih dahulu, dilanjutkan memeriksa masing-masing ID list.
Nilai support bertambah ketika ditemukan SID baru pada ID list.
ii) Frequent 2-sekuens
Frequent 2-sekuens diperoleh dengan menggabungkan tiap- tiap frequent 1-sekuens. Kemudian pada penggabungan tersebut diperiksa masing-masing ID list dari frequent 1-sekuens. Pada SID yang sama, jika EID pada kedua sekuens sama maka hubungan kedua item dinotasikan dengan koma. Contohnya {A, B}, artinya item A dan B dibeli pada waktu yang sama atau 1 transaksi yang sama. Jika EID item A lebih besar daripada EID item B (dinotasikan sebagai {B ⟶ A}) maka item B dibeli lebih dulu kemudian membeli item A. Jika EID item B lebih besar daripada EID item A (dinotasikan sebagai {A ⟶ B}) maka item A dibeli lebih dulu kemudian membeli item B. Nilai support bertambah ketika ditemukan SID baru untuk EID yang sama pada ID list.
iii) Frequent k-sekuens
Penggabungan tiap-tiap (k-1)-sekuens dengan prefix yang sama akan membentuk k-sekuens. Prefix ialah item ke-1 sampai ke-(n-1) dalam n-sekuens. Terdapat tiga kemungkinan hasil pembentukan k-sekuens. Misalnya untuk membentuk 3-sekuens digabungkan 2-sekuens {A,B} dan {A,C} maka hasilnya adalah {A,B,C}. Jika menggabungkan 2-sekuens {A,B} dan {A⟶C}
maka hasilnya adalah {{A,B}⟶ C}. Jika menggabungkan 2- sekuens {A⟶B} dan {A⟶C} maka terdapat tiga kemungkinan hasilnya, yaitu: {A⟶{B,C}}, {A⟶B⟶C}, atau {A⟶C⟶B}.
Pencarian frequent k-sekuens dihentikan ketika tidak ada lagi (k- 1)-sekuens yang dapat digabungkan.
iv) Rule
Rule atau aturan dibentuk dari sekuens dengan panjang sekuens lebih dari 1. Pada rule atau aturan terdapat istilah antecedent (penyebab) dan consequent (akibat). 1-sekuens hanya terdiri dari 1 item oleh karena itu tidak dapat membentuk aturan.
Lain halnya dengan 2-sekuens dengan elemen berbeda waktu, item pertama sebagai antecedent sedangkan item kedua sebagai consequent. Pada 3-sekuens, item pertama dan kedua sebagai antecedent sedangkan item ketiga sebagai consequent. Untuk k- sekuens, item pertama sampai item ke-(k-1) sebagai antecedent dan item ke-k sebagai consequent. Jika ukuran kebaikan sekuens adalah support maka selain itu ukuran kebaikan untuk aturan adalah confidence.
6
e. Uji coba
Pada penelitian ini dilakukan uji coba penentuan pola sekuensial dan pembentukan rule atau aturan dari data latih lalu dibandingkan dengan hasil dari data uji. Data dibagi menjadi data latih (Trainx.y) dan data uji (Testx.y). Indeks x menyatakan data per item (1) atau data per grup (2), sedangkan indeks y menyatakan periode penjualan yang digunakan. Rancangan pembagian data untuk data latih dan data uji disajikan dalam Tabel 1. Masing-masing indeks berlaku untuk 2 versi kode barang, yaitu berdasarkan item dan grup. Sehingga terdapat 6 set data latih dan 6 set data uji. Contoh penulisan notasi set data yang digunakan sebagai berikut: Train1.1 (set data latih untuk data per item dengan periode penjualan 1-15 Januari 2015), Train2.1 (set data latih untuk data per grup dengan periode penjualan 1-15 Januari 2015).
Tabel 1 Rancangan pembagian periode penjualan untuk data latih dan data uji
Notasi Periode Penjualan Keterangan
Trainx.1 1-15 Januari 2015 70393 transaksi
Trainx.2 1-31 Januari 2015 142162 transaksi
Trainx.3 1 Januari-28 Februari 2015 280683 transaksi
Testx.1 16-31 Januari 2015 71769 transaksi
Testx.2 1-28 Februari 2015 138521 transaksi
Testx.3 1 Maret-22 April 2015 281904 transaksi
Uji coba ini untuk mengetahui karakteristik data latih yang paling baik untuk menduga pembelian berikutnya. Selain itu, melalui uji coba ini juga dapat diketahui item yang paling populer pada periode penjualan yang digunakan. Penentuan karakteristik data latih yang baik dilihat dari banyaknya aturan frequent (memiliki nilai confidence lebih dari sama dengan minimum confidence) berdasarkan data latih yang frequent pada data uji, semakin banyak maka semakin baik data latih tersebut. Karena meskipun terbukti, jika confidence pada data latih kurang dari minimum confidence yang digunakan maka banyaknya pembeli yang berperilaku seperti aturan tersebut kurang dari yang diharapkan oleh peneliti.
3. Interpretasi hasil
Interprestasi hasil yaitu menerjemahkan keluaran program menjadi informasi yang bermakna. Keluaran program berupa pola sekuensial item-item yang dibeli konsumen (dalam hal ini member). Pola sekuensial hasil uji coba lalu dianalis kemudian dirancang strategi pemasaran, seperti penempatan rak item, diskon, dan sebagainya. Pada tahap ini pula dihasilkan simpulan penelitian. Praproses data, penentuan pola sekuensial dan pembuatan aturan pada penelitian ini menggunakan perangkat lunak R 3.1.2 dengan package ‘arulesSequences’. Pada Tabel 2 disajikan contoh notasi pada keluaran program.
7 Tabel 2 Notasi keluaran cSPADE pada package ‘arulesSequences’ di program R
Notasi Ukuran Keterangan
< ⋯ > 1 sekuens 1 set kejadian
< {… } > 1 elemen,
panjang sekuens 1 1 objek terjadi dalam satu waktu
< {… , … } > 1 elemen,
panjang sekuens 2
2 objek terjadi dalam waktu bersamaan
< {… }, {… } > 2 elemen,
panjang sekuens 2
2 objek terjadi dalam waktu saling berurutan
< {… } >⇒< {… } > 1 aturan 2 kejadian terjadi berurutan
HASIL DAN PEMBAHASAN
Gambaran Umum Data
Terdapat sebanyak 562587 transaksi oleh 369335 member pada periode penjualan 1 Januari sampai 22 April 2015. Terdapat 1032 item dengan berbagai merek, ukuran, warna, dan aroma. Item-item tersebut terbagi dalam 9 kategori, yaitu kategori Aksesori (peralatan perawatan), Khusus (item edisi terbatas), Make up, Perawatan Kulit, Perawatan Rambut, Perawatan Tubuh, Wewangian Pria, Wewangian Rumah, dan Wewangian Wanita. Distribusi 1032 item ke dalam 9 grup dapat dilihat pada Gambar 2. Selain itu, item-item tersebut juga terbagi dalam 92 grup (dapat dilihat pada Lampiran 1).
Gambar 2 Distribusi item dalam tiap kategori
Pembagian grup dalam kategori dapat dilihat pada Tabel 3. Grup dalam kategori Aksesori dibagi berdasarkan penggunaannya, seperti aksesori untuk mandi, perawatan kulit, dan sebagainya. Kategori dan grup pada penelitian ini berdasarkan kategori dan grup oleh toko dengan sedikit penyesuaian.
10%
10%
31%
11%
2%
23%
2%2% 9%
Aksesori Khusus Make up
Perawatan Kulit Perawatan Rambut Perawatan Tubuh Wewangian Pria Wewangian Rumah Wewangian Wanita
8
Tabel 3 Dasar pembagian grup dalam kategori
Kategori Dasar pembagian grup
Aksesori Penggunaan aksesori (alat mandi, alat-alat penunjang perawatan, dan sebagainya)
Khusus Reguler dan event
Make up Penggunaan make up (untuk mata, bibir, base, dan sebagainya)
Perawatan Kulit Bahan kandungan dalam produk (Vitamin C, Vitamin E, dan lain-lain)
Perawatan Rambut Merek
Perawatan Tubuh Bahan kandungan atau aroma dalam produk (Stroberi, Coklat, dan lain-lain)
Wewangian Pria Aroma Wewangian Rumah Aroma Wewangian Wanita Aroma
Penentuan Pola Sekuensial
Penentuan pola sekuensial pada penelitian ini menggunakan minimum support sebesar 0.0001 atau 0.01%. Data transaksi yang cukup besar, produk yang sangat beragam, serta pembelian kembali produk dalam jangka waktu yang tidak sebentar, support yang kecil secara subjektif dianggap wajar sehingga digunakan minimum support yang sangat kecil untuk menjaring pola sekuensial yang menarik namun memiliki support yang kecil.
Pola berdasarkan data per item
Pembentukan pola dengan data latih tanggal 1-15 Januari 2015 per item (Train1.1) dihasilkan sebanyak 4235 sekuens yang frequent, yaitu memiliki nilai support lebih dari atau sama dengan 0.0001. Terdapat 754 sekuens yang memiliki panjang sekuens (banyaknya item dalam sekuens) 1. Hal ini menunjukkan bahwa dari 1032 item, 754 di antaranya memiliki support lebih dari atau sama dengan 0.0001, artinya 754 item tersebut merupakan item yang diminati oleh pembeli pada periode penjualan 1-15 Januari 2015. Sekuens dengan panjang lebih dari 1 merupakan gabungan sekuens dengan panjang 1. Terdapat 3481 sekuens dengan panjang lebih 1. Support terbesar yang dihasilkan sebesar 3.77% yaitu item bubuk pembersih wajah berbahan daun perilla (I102). Hal ini menunjukkan bahwa item bubuk pembersih wajah berbahan daun perilla merupakan item paling diminati yang dibeli oleh 3.77% pembeli selama periode penjualan tersebut. Pada Gambar 3 dapat dilihat 5 sekuens berukuran 1, 5 sekuens berukuran 2, dan 5 sekuens berukuran 3 yang memiliki nilai support terbesar. Selain item bubuk pembersih wajah berbahan daun perilla (I102), terdapat item sabun pencuci wajah berbahan kayu putih (I41), minyak penghilang jerawat berbahan kayu putih (I37), wewangian wanita beraroma kasturi putih (I419), dan sabun pencuci wajah bervitamin E (I16).
Berdasarkan Gambar 3 diketahui 0.38% pembeli pada periode penjualan 1-15 Januari 2015 lebih suka membeli item bubuk pembersih wajah berbahan daun perilla (I102) bersama item serum wajah merek “N” (I99). Hal tersebut dapat
9 dikatakan sekitar 10% dari pembeli item bubuk pembersih wajah berbahan daun perilla (I102) membeli item bubuk pembersih wajah berbahan daun perilla bersama item serum wajah merek “N” (I99). Sebanyak 13.26% pembeli item sabun pencuci muka berbahan kayu putih (I41) juga membeli item minyak penghilang jerawat berbahan kayu putih (I37). Selain itu terdapat sekuens yang mengandung item dalam satu grup seperti sekuens <{I124,I125}> dan <{I32,I33}> yang menunjukkan bahwa pembeli cenderung membeli suatu produk bersama produk yang lain dalam satu grup. Pola pembelian 3 item yang paling banyak dilakukan oleh pembeli pada periode ini didominasi oleh sekuens pembelian bersama item serum mata (I124) dan masker malam (I125) merek “D” serta sekuens pembelian bersama item losion pembersih (I32) dan losion penghilang noda (I33) berbahan kayu putih. Hal ini dapat dilihat pada sekuens berukuran 3 yang mana prefixnya adalah kedua sekuens tersebut. Keterangan mengenai item lain dalam penelitian ini dapat dilihat pada Lampiran 2.
Gambar 3 Sekuens berukuran 1-3 dengan nilai support terbesar (Train1.1) Pola yang terbentuk dengan data latih Train1.2 sebanyak 4656 sekuens yang frequent. Sama seperti pada data latih Train1.1, terdapat 754 sekuens yang memiliki panjang sekuens 1. Sekuens berukuran 1-3 dengan support terbesar pada periode penjualan 1-31 Januari 2015 dapat dilihat pada Gambar 4. Pada periode penjualan 16-31 Januari 2015 pembeli yang melakukan pembelian item krim penghalus wajah merek “D” (I126) bersama bubuk pembersih wajah berbahan daun perilla (I102) meningkat sehingga supportnya meningkat pula dan masuk dalam 5 besar support terbesar pada periode penjualan 1-31 Januari 2016. Hal yang sama terjadi pada sekuens pembelian bersama item serum mata merek “D” (I124) dengan bubuk pembersih wajah berbahan daun perilla (I102). Pola pembelian yang paling banyak dilakukan oleh pembeli pada periode ini didominasi oleh sekuens pembelian item bubuk pembersih wajah berbahan daun perilla (I102) bersama item serum wajah merek “N” (I99) serta sekuens pembelian bersama item sabun pencuci muka berbahan kayu putih (I41) dan minyak penghilang jerawat berbahan kayu putih (I37). Pola pembelian 3 item didominasi oleh sekuens pembelian bersama item losion pembersih (I32) dan losion penghilang noda (I33) berbahan kayu putih.
Berdasarkan hal-hal tersebut dapat dikatakan tren penjualan 2 minggu pertama dan
3.77
2.79 2.55
2.16 2.00
0.38 0.37 0.35 0.33 0.33
0.13 0.11 0.11 0.10 0.09
Support (%)
10
2 minggu kedua bulan Januari 2015 masih sama. Item-item dalam sekuens pada Gambar 4 didominasi oleh item dalam grup perawatan kulit berbahan kayu putih (T3) dan perawatan kulit bermerek “D” (T12). Semua item pada Gambar 3 dan 4 merupakan item perawatan kulit (khususnya kulit wajah) kecuali item wewangian wanita beraroma kasturi putih (I419).
Gambar 4 Sekuens berukuran 1-3 dengan nilai support terbesar (Train1.2)
Gambar 5 Sekuens berukuran 1-3 dengan nilai support terbesar (Train1.3) Pembentukan pola dengan data latih Train1.3 menghasilkan 4732 sekuens dengan nilai support terbesar 3.41%. Terdapat 811 item dibeli oleh lebih dari 0.01%
pembeli pada periode penjualan 1 Januari-28 Februari 2015. Sekuens berukuran 1 dan 2 dengan nilai support terbesar dapat dilihat pada Gambar 5. Gambar 5 dan berdasarkan hasil sekuens data latih sebelumnya terlihat beberapa perbedaan, seperti item yang paling banyak diminati bukan lagi bubuk pembersih wajah berbahan daun perilla (I102) namun sabun pencuci wajah berbahan kayu putih (I41). Pada pola pembelian dengan item lebih dari 1, sekuens pembelian bersama
4.07
3.15 2.84
2.29 2.28
0.58 0.47 0.46 0.43 0.41
0.20 0.13 0.12 0.11 0.11
Support (%)
3.41 2.97
2.71
2.46 2.36
0.47 0.38 0.37 0.34 0.34
0.13 0.13 0.12 0.10 0.10
Support (%)
11 item sabun pencuci muka berbahan kayu putih (I41) dan minyak penghilang jerawat (I37) serta item losion pembersih (I32) dan losion penghilang noda (I33) berbahan kayu putih masih mendominasi. Sekuens pada Gambar 5 didominasi oleh item- item dalam grup perawatan kulit berbahan kayu putih (T3). Tren pola pembelian mulai berubah memasuki bulan Februari.
Pola berdasarkan data per grup
Pembentukan pola juga dilakukan pada data per grup. Menggunakan data latih Train2.1, dihasilkan sebanyak 5323 sekuens yang frequent. Terdapat 75 sekuens yang memiliki panjang sekuens 1, artinya item-item dalam 75 grup tersebut lebih diminati oleh pembeli. Sekuens frequent yang dihasilkan dengan data per grup lebih banyak daripada dengan data per item. Hal ini dapat terjadi karena objek unik yang dianalisis pada data per grup lebih sedikit daripada pada data per item, sehingga support yang dihasilkan lebih besar dan menyebabkan lebih banyak sekuens yang frequent dengan minimal support yang sama, yaitu 0.0001.
Berdasarkan Gambar 6, sebanyak 10.58% pembeli membeli item dalam grup make up bibir (T61). Lebih dari 7.33% pembeli membeli item dalam grup make up dasar (T62), perawatan kulit berbahan kayu putih (T3), wewangian wanita beraroma kasturi putih (T44), maupun item edisi khusus Natal (T43). Lebih dari 10% pembeli item dalam grup make up bibir turut membeli item dalam grup make up dasar, make up mata (T65), maupun edisi khusus Natal dalam satu transaksi. Lebih dari 9.67%
pembeli item dalam grup make up dasar membeli item dalam grup make up mata (T65) maupun item dalam grup aksesori make up (T58) dalam transaksi yang sama.
Selain itu, sekuens berukuran 3 dengan nilai support terbesar terdiri dari grup make up bibir (T61), make up dasar (T62), make up mata (T65), dan grup item edisi khusus Natal (T43) sehingga dapat dikatakan pola pembelian pada periode penjualan 1-15 Januari 2015 didominasi keempat grup tersebut.
Gambar 6 Sekuens berukuran 1-3 dengan nilai support terbesar (Train2.1) Gambar 7 menunjukkan sekuens berukuran 1-3 dengan support terbesar yang dihasilkan menggunakan data latih Train2.2. Terdapat 6927 sekuens dan 77 di antaranya merupakan sekuens berukuran 1. Tren pada 2 minggu kedua Januari nampaknya sedikit berubah, grup make up dasar lebih diminati oleh mayoritas
10.58
9.92 9.51 8.16
7.33
1.50 1.43 1.06 1.06 0.96
0.38 0.33 0.32 0.29 0.26
Support(%)
12
pembeli (11.39% dari seluruh pembeli). Pada periode penjualan ini pula lebih banyak pembeli item dalam grup perawatan kulit bervitamin E (T2) daripada item dalam grup edisi khusus Natal (T43). Meskipun item dalam grup edisi khusus reguler (T22) maupun Natal tidak masuk dalam 5 besar yang paling diminati, kombinasi item dalam kedua grup tersebut dengan grup lain memiliki nilai support yang cukup besar, seperti 1.36% dari seluruh pembeli membeli item dalam grup edisi khusus Natal (T43) bersama dengan item dalam grup perawatan kulit bermerek “D” (T12), dan 1.16% dari seluruh pembeli membeli item dalam grup edisi khusus reguler (T22) bersama dengan item dalam grup make up dasar (T62).
Pola pembelian berdasarkan grup pada periode penjualan 1-31 Januari 2015 didominasi pembelian bersama dengan item dalam grup make up bibir (T61), make up dasar (T62), dan grup item edisi khusus Natal (T43).
Gambar 7 Sekuens berukuran 1-3 dengan nilai support terbesar (Train2.2)
Gambar 8 Sekuens berukuran 1-3 dengan nilai support terbesar (Train2.3)
11.39 11.11 9.80
8.59 7.75
1.68 1.56 1.36 1.19 1.16
0.42 0.36 0.34 0.31 0.31
Support(%)
11.85 11.60
9.82 9.03 8.20
1.67 1.67 1.28 1.17 1.06
0.42 0.33 0.31 0.28 0.25
Support(%)
13 Item dalam grup make up bibir masih menjadi tren selama periode penjualan Januari-Februari 2015. Sebanyak 7865 sekuens terbentuk pada pembentukan pola dengan data latih Train2.3. Terdapat 79 grup yang peminatnya lebih dari 0.01% dari seluruh pembeli pada periode penjualan tersebut. Selain grup make up bibir, grup make up dasar, perawatan kulit berbahan kayu putih, dan wewangian wanita beraroma kasturi putih selalu menjadi grup dengan pembeli terbanyak pada setiap periode penjualan yang digunakan. Pada Gambar 8 terlihat 2 grup yang paling banyak dibeli bersamaan merupakan kombinasi dari grup make up bibir, make up dasar, make up mata, dan aksesori make up dengan nilai support lebih dari 1%.
Begitu pula pada sekuens berukuran 3, keempat grup tersebut masih mendominasi.
Pola pembelian pada periode Januari-Februari 2015 dapat dikatakan merupakan kombinasi dari 4 grup berkategori make up, yaitu grup make up bibir, make up dasar, make up mata, dan aksesori make up. Terdapat perbedaan tren pola pembelian bulan Januari dan Februari 2015 ditandai dengan tidak masuknya grup item edisi khusus Natal (T43) maupun grup item edisi khusus reguler (T22) dalam sekuens pada Gambar 8.
Pola berdasarkan data per item (dalam grup T3)
Pencarian pola berdasarkan item dalam grup T3 dilandasi kesimpulan bahwa setiap periode penjualan didominasi item perawatan kulit berbahan kayu putih (T3), untuk dapat melihat pola item dalam grup. Terdapat 19 item di dalam grup perawatan kulit berbahan kayu putih (T3). Data per item dalam grup T3 pada periode penjualan y dinotasikan sebagai T3y dengan nilai y adalah 1, 2, dan 3.
Gambar 9 menunjukkan sekuens berukuran 1-3 dengan nilai support terbesar pada periode penjualan 1-15 Januari 2015. Item-item yang paling banyak diminati dari 19 item dalam grup tersebut adalah item sabun pencuci muka (I41) dengan sekitar 29% pembeli, 26.77% pembeli membeli minyak penghilang jerawat (I37), dan 12.09% pembeli losion pembersih (I32). Pembeli banyak membeli kombinasi ketiga item bersama-sama, namun item sabun pencuci muka (I41) dan minyak penghilang jerawat (I37) lebih banyak dibeli satuan atau bersama item dari grup lain.
Gambar 9 Sekuens berukuran 1-3 dengan nilai support terbesar (T31)
29.30 26.77 12.09
3.93 3.52 2.88 1.11 1.10 0.95
<{I41}>
<{I37}>
<{I32}>
<{I41,I37}>
<{I32,I33}>
<{I41,I32}>
<{I41,I32,I33}>
<{I32,I33,I37}>
<{I31,I32,I33}>
Support (%)
14
Gambar 10 Sekuens berukuran 1-3 dengan nilai support terbesar (T32) Gambar 10 menunjukkan sekuens berukuran 1-3 dengan nilai support terbesar pada periode penjualan 1-31 Januari 2015, dan Gambar 11 menunjukkan sekuens berukuran 1-3 dengan nilai support terbesar pada periode penjualan Januari-Februari 2015. Pola sekuensial yang paling banyak terjadi pada ketiga periode penjualan secara umum sama. Item-item yang paling banyak diminati pun masih sama, yaitu item sabun pencuci muka (I41), minyak penghilang jerawat (I37), dan losion pembersih (I32). Item sabun pencuci muka (I41) paling banyak dibeli bersama item minyak penghilang jerawat (I37).
Gambar 11 Sekuens berukuran 1-3 dengan nilai support terbesar (T33)
Pembentukan Aturan
Setelah penentuan pola sekuensial lalu dibentuk aturan yang dapat menunjukkan pola pembelian dari satu waktu ke waktu berikutnya. Aturan terdiri dari antecedent dan consequent. Misal antecedent adalah suatu kejadian, maka
32.14 28.97 12.01
4.41 3.55 2.86 1.23 1.17 1.01
<{I41}>
<{I37}>
<{I32}>
<{I41,I37}>
<{I32,I33}>
<{I41,I31}>
<{I32,I33,I37}>
<{I41,I32,I33}>
<{I41,I32,I37}>
Support (%)
34.70 30.30
12.81 4.76
3.83 3.10 1.37 1.23 1.05
<{I41}>
<{I37}>
<{I32}>
<{I41,I37}>
<{I32,I33}>
<{I33,I37}>
<{I32,I33,I37}>
<{I41,I32,I33}>
<{I31,I32,I33}>
Support (%)
15 consequent dapat diartikan suatu kejadian berikutnya jika antecedent terjadi.
Aturan dibentuk dari pola sekuensial yang memiliki panjang lebih dari 1. Pada pembentukan aturan ini digunakan minimum confidence sebesar 0.01 atau 1%.
Confidence adalah peluang terjadinya consequent jika antecedent terjadi.
Confidence dapat pula diartikan sebagai nilai rasio banyaknya pembeli yang berperilaku sesuai aturan dengan banyaknya pembeli yang membeli barang sesuai antecedent. Pembentukan aturan dengan data latih menghasilkan 33-1286 aturan.
Aturan yang dihasilkan dengan data per grup lebih banyak karena sekuens yang dihasilkan dengan data per grup pun lebih banyak. Beberapa aturan dengan nilai support terbesar dapat dilihat pada Lampiran 3 dan 4. Aturan dengan nilai support yang besar menunjukkan bahwa banyak pembeli berperilaku sesuai aturan tersebut.
Pada penelitian ini aturan dengan consequent yang sama digabung membentuk 1 aturan saja, nilai supportnya merupakan penjumlahan support begitu pula nilai confidencenya merupakan penjumlahan confidence.
Aturan berdasarkan data per item
Pada Tabel 4 disajikan aturan dengan nilai support terbesar yang memiliki antecedent sekuens berukuran lebih dari 1, dalam hal ini sekuens dapat berupa pembelian lebih dari 1 produk atau pembelian lebih dari 1 waktu. Aturan seperti itu cenderung memiliki nilai confidence yang lebih besar atau lebih akurat. Terlihat pada Tabel 4 nilai confidence data uji cenderung lebih besar menandakan aturan tersebut terbukti dengan baik. Berdasarkan contoh aturan yang dibentuk pula terlihat dominasi item dalam grup perawatan kulit berbahan kayu putih (T3). Item- item yang terdapat pada Tabel 4 yaitu toner (I31), losion pembersih (I32), losion penghilang noda (I33), minyak penghilang jerawat (I37), dan sabun pencuci muka (I41) berbahan kayu putih. Item-item tersebut memang item yang sering muncul seperti dijelaskan pada penentuan pola item dalam grup perawatan kulit berbahan kayu putih (T3) sebelumnya.
Tabel 4 Beberapa aturan yang terbentuk (data per item) Periode
Penjualan Antecedent Consequent Support Confidence
Lift Train Test
1 I32,I41 I37 0.00011 0.01447 0.03922 1.51959 2 I32,I33 I37 0.00029 0.06594 0.09211 1.78487
I41 1.02366
I31,I32,I33 I37 0.00011 0.01164 0.03883 4.14244 3 I32,I33 I37 0.00066 0.17548 0.18258 2.62653
I41 1.51759
I31 4.12351
I31,I32,I33 I37 0.00013 0.12174 0.12778 4.09282 Berdasarkan Tabel 4 dapat disimpulkan tren pola pembelian kembali pada bulan Januari dan Februari 2015 sama. Pola tersebut yaitu pembelian minyak penghilang jerawat (I37) atau sabun pencuci muka (I41) berbahan kayu putih setelah pada kedatangan sebelumnya membeli losion pembersih (I32) dan losion penghilang noda (I33) berbahan kayu putih, serta pembelian minyak penghilang
16
jerawat berbahan kayu putih (I37) setelah pada kedatangan sebelumnya membeli toner (I31), losion pembersih (I32) dan losion penghilang noda (I33) berbahan kayu putih.
Lift menunjukkan ukuran nilai korelasi antar pembelian pada 2 waktu yang berurutan. Contohnya nilai lift aturan pembelian minyak penghilang jerawat berbahan kayu putih (I37) setelah membeli losion pembersih (I32) dan sabun pencuci muka (I41) berbahan kayu putih pada periode penjualan 1-15 Januari 2015 ialah 1.51959. Nilai tersebut berarti kedua pembelian tersebut berkorelasi positif atau dapat pula dikatakan kejadian bersama kedua pembelian lebih banyak daripada kejadian yang diharapkan (dalam hal ini diartikan sebagai kejadian bersama dengan kedua pembelian saling bebas). Nilai lift juga mengindikasikan kemampuan aturan untuk memprediksi pembelian berikutnya. Pada Tabel 4 semua lift bernilai lebih dari 1 sehingga aturan-aturan tersebut dapat dikatakan mampu untuk memprediksi pembelian berikutnya.
Aturan berdasarkan data per grup
Sama halnya dengan Tabel 4 yang menyajikan aturan dengan nilai support terbesar yang memiliki antecedent sekuens berukuran lebih dari 1, Tabel 5 pun menyajikan hal serupa berdasarkan data per grup.
Tabel 5 Beberapa aturan yang terbentuk (data per grup) Periode
Penjualan Antecedent Consequent Support Confidence
Lift Train Test
1 T61,T65 T62 0.00038 0.02643 0.03058 0.14921
T65 0.17783
2 T61,T62 T61 0.00151 0.09004 0.09506 0.17153
T65 0.23696
T62 0.13387
T58 0.36029
T3 0.13121
T12 0.19203
T43,T12,T14 T14 0.00012 0.03827 0.00000 0.88872 3 T3=>T3 T3 0.00090 0.12796 0.21386 0.63879
T62 0.15989
T61 0.14575
T58 0.30327
T23 0.17936
T61,T62,T65 T65 0.00062 0.14759 0.15566 0.46624
T62 0.28572
T61 0.22560
T57 0.52894
T58 0.52901
17 Seperti telah disebutkan di atas bahwa aturan dengan antecedent berupa sekuens yang berukuran lebih dari 1 cenderung memiliki nilai confidence yang lebih besar atau lebih akurat. Namun pada Tabel 5 terdapat 1 aturan yang nilai confidence pada data latihnya cukup besar namun nilai confidence pada data uji justru nol, atau tidak ada pembeli yang melakukan pembelian sesuai aturan tersebut, yaitu aturan ke-3 yang menunjukkan pembelian item dalam grup perawatan kulit berbahan daun perilla (T14) setelah pembelian item dalam grup edisi khusus Natal bersama (T43) dengan item dalam grup perawatan kulit merek “D” (T12) dan grup perawatan kulit berbahan daun perilla (T14). Hal tersebut dapat terjadi apabila terjadi perubahan tren pada periode penjualan data uji, atau pembeli tersebut belum melakukan pembelian kembali.
Pada Tabel 5 terdapat aturan yang menarik yaitu pembelian kembali hingga 3 waktu pembelian. Aturan tersebut diawali dengan pembelian ulang item dalam grup perawatan kulit berbahan kayu putih (T3) kemudian pada kedatangan berikutnya membeli lagi item dalam grup perawatan kulit berbahan kayu putih (T3).
Berdasarkan Tabel 5 diketahui banyak pembeli yang membeli produk make up bibir (T61) bersama dengan produk make up dasar (T62) dan pada kedatangan berikutnya berpeluang besar membeli ulang produk dalam grup tersebut maupun membeli produk make up jenis lainnya seperti make up mata (T65) dan aksesori (T58).
Nampak pula pada Tabel 5 semua lift bernilai kurang dari 1, sehingga dapat diartikan bahwa semua aturan pada Tabel 5 berkolerasi negatif.
Uji coba pada penelitian ini juga bertujuan untuk mengetahui karakteristik data latih yang baik untuk menduga pola dengan menghitung banyaknya aturan yang terbukti dan frequent pada data uji. Sehingga meskipun aturan tersebut terbukti namun nilai confidencenya kurang dari minimum confidence maka aturan tersebut dianggap gagal terprediksi karena jumlah kejadian tidak sesuai yang diharapkan. Berdasarkan uji coba yang dilakukan dengan periode penjualan dan jumlah transaksi untuk masing-masing data latih dan data uji yang relatif sama, diketahui banyaknya aturan yang terbukti dan frequent pada data uji untuk data periode 1-15 Januari 2015 ialah 66.67% (data per item) dan 77.27% (data per grup).
Sedangkan untuk periode 1-31 Januari 2015 adalah 74.36% (data per item) dan 92.59% (data per grup), serta untuk periode 1 Januari-28 Februari 2015 adalah 90%
(data per item) dan 98.25% (data per grup). Nilai akurasi pada data per grup yang lebih besar, menunjukkan bahwa objek yang lebih sedikit memiliki akurasi lebih tinggi dengan minimum confidence yang sama. Dapat disimpulkan semakin panjang periode dan semakin banyak transaksi yang terjadi maka semakin banyak aturan yang dapat dibentuk. Semakin banyak aturan yang terbentuk pada data latih, semakin banyak pula aturan yang terbukti dan frequent pada data uji.
SIMPULAN
Item yang paling diminati dengan nilai support lebih dari 2% pada semua periode penjualan dari toko ritel tersebut adalah produk sabun pencuci muka (I41) dan minyak penghilang jerawat berbahan kayu putih (I37) yang ternyata juga banyak dibeli secara bersamaan oleh sekitar 0.4% pembeli. Tren pembelian mulai berubah memasuki bulan Februari, namun tren pembelian kembali masih sama
18
yaitu pembelian minyak penghilang jerawat (I37) atau sabun pencuci muka (I41) berbahan kayu putih setelah pada kedatangan sebelumnya membeli losion pembersih (I32) dan losion penghilang noda (I33) berbahan kayu putih, serta pembelian minyak penghilang jerawat berbahan kayu putih (I37) setelah pada kedatangan sebelumnya membeli toner (I31), losion pembersih (I32) dan losion penghilang noda (I33) berbahan kayu putih.
Sedangkan grup yang paling diminati pada semua periode penjualan adalah grup make up bibir (T61) dan make up dasar (T62), keduanya berpeluang paling besar ditemui dalam satu transaksi. Tren pola berdasarkan data per grup juga mulai mengalami perubahan memasuki bulan Januari, namun secara keseluruhan masih didominasi grup dari kategori make up. Tren pembelian kembali berdasarkan grup yaitu banyak pembeli yang membeli produk make up bibir (T61) bersama dengan produk make up dasar (T62) dan pada kedatangan berikutnya berpeluang besar membeli ulang produk dalam grup tersebut maupun membeli produk make up jenis lainnya seperti make up mata (T65) dan aksesori (T58).
Karakteristik data yang memiliki akurasi pendugaan pembelian berikutnya yang baik adalah semakin panjang periode penjualan dan semakin banyak transaksi yang terjadi. Namun hal tersebut tentu saja disesuaikan sesuai kebutuhan penelitian.
DAFTAR PUSTAKA
Han J, Kamber M, Pei J. 2011. Data Mining: Concepts and Techniques, 3rd Ed.
San Francisco (US): Morgan Kaufmann.
Juliastio R, Gunawan. 2015. Sequential Pattern Mining dengan SPADE untuk Prediksi Pembelian Spare Part dan Aksesori Komputer pada Kedatangan Kembali Konsumen. Seminar Nasional Inovasi dalam Desain dan Teknologi – IdeaTech. 314:325.
Ledolter J. 2013. Data Mining and Business Analytics with R. West Sussex (GB): J Wiley.
Sijabat R. 2011. Penentuan Pola Sekuensial Data Transaksi Pembelian Menggunakan Algoritme SPADE [skripsi]. Bogor (ID): Institut Pertanian Bogor.
Tuffery S. 2011. Data Mining and Statistics for Decision Making 2nd Edition. West Sussex (GB): J Wiley.
Wright AP, Wright AT, McCoy AB, Sittig DF. 2015. The use of sequential pattern mining to predict next prescribed medications. Journal of Biomedical Informatics. 53:73-80.
Zaki, MJ. 2001. SPADE: An efficient algorithm for mining frequent sequences.
Machine Learning. 42:31-60.
Zaki MJ, Meira W. 2014. Data Mining and Analysis: Fundamental Concepts and Algorithms. New York (US): Cambridge Univ Pr.
19 Lampiran 1 Daftar kategori dan grup serta jumlah item yang termasuk di dalamnya
Kategori Grup Item
(jumlah) Kategori Grup Item (jumlah)
Aksesori T87 6 Perawatan Tubuh T4 10
T88 49 T5 4
T89 10 T16 10
T90 21 T17 16
T91 13 T18 7
T92 3 T19 9
Khusus T22 42 T20 2
T43 63 T21 15
Make up T58 25 T23 18
T59 13 T24 12
T60 3 T25 14
T61 89 T26 13
T62 39 T27 14
T63 5 T28 8
T64 13 T29 9
T65 81 T30 2
T66 30 T31 9
T67 17 T32 10
T68 6 T33 6
Perawatan Kulit T1 8 T34 5
T2 21 T35 6
T3 19 T36 4
T6 5 T37 1
T7 14 T38 1
T8 9 T39 3
T9 1 T40 4
T10 1 T41 4
T11 7 T42 5
T12 5 T83 4
T13 1 T84 3
T14 16 T85 2
T15 8 T86 5
Perawatan Rambut
T76 1 Wewangian
Wanita
T44 17
T77 4 T45 2
T78 2 T46 10
T79 14 T47 1
Wewangian Pria T69 2 T48 5
T70 2 T49 1
T71 1 T50 11
T72 4 T51 6
T73 8 T52 8
T74 3 T53 7
T75 3 T54 5
Wewangian Rumah
T80 8 T55 7
T81 3 T56 6
T82 4 T57 9
20
Lampiran 2 Daftar grup dan item
Item Keterangan Grup Keterangan Grup Keterangan
I16 Sabun pencuci muka
Vitamin E T1 Perawatan Kulit
Vitamin C T44 Wewangian Wanita
Kasturi putih I20 Toner Vitamin E T2 Perawatan
Kulit
Vitamin E T46 Wewangian Wanita
Sakura Jepang I27 Pelembab
wajah
Vitamin E T3 Perawatan Kulit
Kayu putih T50 Wewangian Wanita
Kasturi putih (khusus) I30 Busa
pembersih wajah
Kayu putih T4 Perawatan Tubuh
Merek "B" T56 Wewangian Wanita
Teratai air Fijian I31 Toner Kayu putih T6 Perawatan
Kulit
Merek
"NC"
T57 Wewangian Wanita
Kasturi merah I32 Losion
pembersih wajah
Kayu putih T7 Perawatan Kulit
Lidah buaya T58 Make up Aksesori
I33 Losion penghilang noda
Kayu putih T8 Perawatan Kulit
Rumput laut
T61 Make up Bibir
I37 Minyak penghilang jerawat
Kayu putih T11 Perawatan Kulit
Merek "N" T62 Make up Base
I41 Sabun pencuci muka
Kayu putih T12 Perawatan Kulit
Merek "D" T64 Make up Pipi
I43 Pembersih wajah
Kayu putih T14 Perawatan Kulit
Daun Perilla
T65 Make up Mata I44 Daily
Scrub
Kayu putih T15 Perawatan Kulit
Buah delima
T66 Make up Kuku I46 BB Cream
Light
Kayu putih T16 Perawatan Tubuh
Zaitun T79 Perawatan Rambut
Merek
"R"
I99 Serum wajah
Merek "D" T17 Perawatan Tubuh
Shea T88 Aksesori Bath &
Body I102 Bubuk
pembersih wajah
Daun perilla
T21 Perawatan Tubuh
Mangga
I124 Serum mata
Merek "D" T22 Khusus Regular I125 Masker
malam
Merek "D" T23 Perawatan Tubuh
Strawberry
I126 Krim penghalus wajah
Merek "D" T27 Perawatan Tubuh
Kelor
I419 Wewangian wanita
Kasturi putih
T30 Perawatan Tubuh
Panili
I650 BB Cream shade 02
Merek "A" T31 Perawatan Tubuh
Madu I652 BB Cream
shade 01
Merek "A" T43 Khusus Natal
21 Lampiran 3 Aturan dengan nilai support terbesar tiap kelompok panjang sekuens
(data per item) Periode
Penjualan Antecedent Consequent Support Confidence Train Test
1
I33 I37/I32/I41/I31 0.00074 0.09076 0.07535
I41 I37/I32 0.00071 0.04980 0.01871
I32 I37/I31/I33/I41 0.00065 0.06436 0.06860
I32,I41 I37 0.00011 0.01447 0.03922
2
I37 I37/I41/I33/I32 /I31
0.00226 0.14980 0.07882 I41 I37/I31/I32/I33 0.00197 0.06397 0.04520 I33 I37/I41/I32/I31
/I44/I99/I30
0.00182 0.18934 0.15721 I32,I33 I37/I41 0.00029 0.06594 0.09211 I124,I125 I126/I99 0.00022 0.02430 0.05882 I37,I41 I32/I31 0.00021 0.02062 0.03711 I31,I32,I33 I37 0.00011 0.01164 0.03883
3
I37 I37/I41/I33/I32 /I31/I44/I30
0.00485 0.16302 0.20317 I41 I37/I31/I41/I33
/I32
0.00412 0.12102 0.11489 I33 I37/I41/I32/I31
/I44/I43/I47/I3 0/I99/I36/I46/I 33/I37,I41
0.00395 0.33772 0.27618
I32,I33 I37/I41/I31 0.00066 0.17548 0.18258 I37,I41 I37/I31/I33/I32 0.00065 0.13926 0.16302 I33,I37 I37/I41/I32/I31 0.00064 0.20982 0.20287 I31,I32,I33 I37 0.00013 0.12174 0.12778 I32,I33,I37 I37 0.00012 0.09091 0.11416