atau tahapan, proses yang pertama dilakukan untuk mendapatkan itemset yang dicari. Kemudian proses berikutnya ialah proses perhitungan support serta confidence-nya untuk memperoleh aturan asosiasi yang lengkap dan terpercaya.
Proses cleaning tidak dilakukan kembali pada penelitian ini, hal ini disebabkan proses tersebut telah dilakukan pada penelitian sebelumnya. Dengan demikain yang dilakukan dalam penelitian ini hanya proses transformasi data transaksi yang berjumlah 23.361 transaksi kedalam format text yang dapat dibaca oleh program. Hal ini perlu dilakukan karena data yang diperoleh masih berupa transaksi biner (Lampiran 1). Data biner akan ditransformasikan kedalam kode tertentu yang merepresentasikan kelompok barang yang dibeli (Lampiran 2).
Tahap Pembentukan Large Itemset
Pembentukan large itemset dilakukan dengan menjalankan algoritme algoritme FOLD – Growth. Algoritme tersebut akan menghasilkan kumpulan itemset dengan batas support tertentu. Pada penelitian ini digunakan 5 (lima) buah nilai minimum support yaitu sebesar 1% sampai 5% dari keseluruhan transaksi yang berjumlah 23.631 transaksi.
Pembentukan Large Itemset dengan Minimum Support Sebesar 1% - 5%
Dengan menggunakan minimum support sebesar 1 % didapatkan hasil sebagai berikut untuk algoritme penggalian yang digunakan
6 ini secara keseluruhan dibagi menjadi dua
bagian, bagian pertama ialah pembentukan Large Itemset dengan menggunakan algoritme FOLD – Growth, dan tahap selanjutnya ialah proses pembentukan aturan asosiasi dengan perhitungan support serta confidence dari masing – masing itemset.
Tahap Penggalian L1 dan L2 Dengan Menggunakan SOTrieIT
SOTrieIT yang digunakan akan melakukan scanning basis data sebanyak 1 (satu) kali. Hal ini berbeda saat kita mencoba melakukan dengan FP –Tree karena pada FP – Tree scanning basis data dilakukan sebanyak 2 (dua) kali. Pada scanning yang dilakukan ini akan dicoba membaca transaksi yang terdapat di dalam basis data. Untuk setiap transaksi akan dibangkitkan semua kemungkinan 1 – itemset dan 2 –itemset dan ditransformasikan kedalam bentuk tree.
Tahap Pemangkasan Item – Item yang Tidak Frequent
Dalam tahap ini kita akan mencoba melakukan seleksi terhadap itemset yang telah terbentuk dari SOTrieIT dengan cara menghilangkan item yang ada dalam transaksi yang tidak frequent. Sebuah item dikatakan tidak frequent jika nilai support count-nya kurang dari batas minimum support yang ditentukan. Pemangkasan ini dilakukan berdasarkan L1 dan L2 untuk setiap transaksi. Untuk itemset yang lebih dari 2 juga akan dilakukan pemangkasan berdasarkan L1 dan L2 sehingga itemset yang tidak frequent juga akan dipangkas. Setelah pemangkasan transaksi T dilakukan maka akan dilakukan pengurutan berdasarkan nilai support count – nya yang terbesar sehingga akan didapatkan Ordered Frequent Items yang telah dipangkas.
Tahap Pembangunan FP – Tree
Pada tahapan ini akan dilakukan pembangunan FP – Tree dengan menggunakan data transaksi T yang telah dipangkas dan diurut berdasarkan nilai support count – nya.
Tahap Penggalian ItemsetFrequent Tahap ini dilakukan setelah FP – Tree selesai dibangun, penggalian itemset ini menggunakan algoritme FP – Growth pada FP –Tree tersebut.
Pengujian dan Analisis
Hasil dari pengujian yang didapatkan dari algoritme penggalian data dalam penelitian ini akan dikaji.
Analisis dilakukan dengan mencoba melihat hasil yang didapat dari proses penggalian dengan algoritme yang digunakan. Prosses penggalian dilakukan dengan menggunakan lima buah minimum support yaitu 1% - 5 %. Pemilihan nilai minimum support sebesar 1% sampai 5% diharapkan dapat memberikan suatu kesimpulan yang konvergen. Selain itu juga digunakan nilai minimum confidence sebesar 10% dalam pembentukan aturan asosiasinya. Pengambilan nilai minimum confidence sebesar 10% dilakukan supaya hasil itemset yang didapatkan berjumlah cukup banyak sehingga layak untuk dilakukan analisis.
HASIL DAN PEMBAHASAN
Percobaan dibagi menjadi dua buah proses atau tahapan, proses yang pertama dilakukan untuk mendapatkan itemset yang dicari. Kemudian proses berikutnya ialah proses perhitungan support serta confidence-nya untuk memperoleh aturan asosiasi yang lengkap dan terpercaya.Proses cleaning tidak dilakukan kembali pada penelitian ini, hal ini disebabkan proses tersebut telah dilakukan pada penelitian sebelumnya. Dengan demikain yang dilakukan dalam penelitian ini hanya proses transformasi data transaksi yang berjumlah 23.361 transaksi kedalam format text yang dapat dibaca oleh program. Hal ini perlu dilakukan karena data yang diperoleh masih berupa transaksi biner (Lampiran 1). Data biner akan ditransformasikan kedalam kode tertentu yang merepresentasikan kelompok barang yang dibeli (Lampiran 2).
Tahap Pembentukan Large Itemset
Pembentukan large itemset dilakukan dengan menjalankan algoritme algoritme FOLD – Growth. Algoritme tersebut akan menghasilkan kumpulan itemset dengan batas support tertentu. Pada penelitian ini digunakan 5 (lima) buah nilai minimum support yaitu sebesar 1% sampai 5% dari keseluruhan transaksi yang berjumlah 23.631 transaksi.
Pembentukan Large Itemset dengan Minimum Support Sebesar 1% - 5%
Dengan menggunakan minimum support sebesar 1 % didapatkan hasil sebagai berikut untuk algoritme penggalian yang digunakan
7 (Tabel 4). Hasil penggalian yang lebih
lengkapnya terdapat pada Lampiran 3. Tabel 4 Large Itemset dengan minsup 1%
Jumlah k –Itemset FOLD – Growth 1 - Itemset 23 Item 2 - Itemset 37 Kombinasi 3 - Itemset 5 Kombinasi
Hasil percobaan pertama (Tabel 4) memperlihatkan jumlah itemset yang diperoleh dengan algoritme FOLD – Growth. Itemset ini diperoleh dari proses penggalian yang meliputi faktor pemangkasan transaksi – transaksi yang tidak relevan terhadap acuan large 2 - itemset dan large 1 - itemset dan pencarian kombinasi antara item pada algoritma FOLD – Growth. Selain disebabkan karena faktor pemangkasan, faktor pemilihan nilai minimum support juga mempengaruhi pembentukan itemset yang didapatkan.
Dari percobaan pertama terlihat untuk kriteria 1 – itemset item dengan kode 20 (baterai) merupakan item yang paling jarang dibeli dalam keselutuhan transaksi (Lampiran 3). Sementara itu untuk item yang paling banyak dibeli ialah item dengan kode 6 (minuman) dengan nilai support sebesar 7093. Keunggulan FOLD – Growth selain dapat menemukan large 1 – itemset dengan cepat algoritme ini juga dapat menemukan large 2 – itemset dengan cepat. Untuk large 2 – itemset yang didapatkan terlihat bahwa kombinasi susu dan snack merupakan kombinasi terbesar dengan nilai support sebesar 1480 (Lampiran 3).
Setelah percobaan penggalian dengan penentuan minimum support sebesar 1% selesai dilakukan, dilakukan beberapa percobaan lainnya untuk memperkuat hasil analisis yang didapatkan sebelumnya. Percobaan berikutnya ialah proses penggalian dengan menggunakan minimum support sebesar 2% - 5%. Hasil yang didapatkan dari percobaan tersebut teringkas dalam Tabel 5 berikut ini.
Tabel 5 Pembentukan large itemset dengan algoritme FOLD - Growth
No Parameter Minsup
2% 3% 4% 5% 1 1–itemset 20 15 15 13 2 2–itemset 12 5 2 2
3 Total 32 20 17 15
Tabel 5 diatas memperlihatkan hubungan pembentukan large itemset yang dibentuk dari algoritme FOLD – Growth dengan nilai minsup tertentu. Dari tabel tersebut terlihat bahwa hasil akhir yang diperoleh algoritme tersebut ternyata merupakan hasil itemset yang terdiri dari sedikit kombinasi. Hasil ini selanjutnya dijadikan landasan kesimpulan bahwa data transaksi yang digunakan ternyata tidak cukup beragam sehingga hanya menghasilkan kombinasi itemset yang kecil dan relative sedikit.
Berdasarkan kesimpulan diatas, telah dibuktikan bahwa pemangkasan yang dilakukan
oleh FOLD – Growth dengan
mengkombinasikan 1 – itemset serta 2 – itemset dapat diterapkan walaupun terhadap data transaksi yang minim. Penerapan ini dapat dilakukan karena FOLD – Growth menghasilkan itemset yang dibutuhkan dalam penggalian data. Sehingga SOTrieIT dapat dimanfaatkan dalam membantu proses pemangkasan transaksi.
Tahap Pembentukan Aturan Asosiasi
Pembentukan aturan asosiasi diperlukan untuk mengetahui seberapa besar nilai kepercayaan yang didapatkan terhadap suatu kombinasi itemset yang didapatkan dalam proses penggalian. Pada percobaan kali ini nilai minimum confidence yang dipilih ialah sebesar 10% dan 20%.
Kisaran nilai support dari 1% - 6,58% memperlihatkan kecenderungan pola kombinasi antara item dalam dataset yang digunakan. Angka tersebut menunjukkan pola pembelian pelanggan Toko Sinar Bogor. Dari kumpulan itemset yang didapatkan, terlihat bahwa para pelanggan cenderung melakukan pembelian kelompok item susu yang dibarengi dengan pembelian kelompok item snack (susu snack). Asosiasi ini diperkuat dengan perhitungan support yang diperoleh, yaitu sebesar 6,58% dari keseluruhan transaksi yang dilakukan merupakan transaksi dengan kombinasi kelompok item tersebut dan nilai
8 confidence yang diperoleh untuk kombinasi
tersebut sebesar 44,64%. Sedangkan kombinasi kelompok item mie instant permen merupakan kombinasi dengan nilai support terkecil (support : 1,00%; confidence : 10,5%) dari keseluruhan itemset yang dihasilkan. Secara keseluruhan hasil yang diperoleh algoritme tersebut dalam mencari kombinasi dengan nilai minimum confidence sebesar 10% dapat dilihat pada Tabel 6 berikut.
Tabel 6 Hasil aturan asosiasi terbentuk dengan minimum confidence 10% dan minsup 1%
Kriteria FOLD - Growth
Support
terbesar
susu snack (supp : 6,58% conf : 44,64%)
Support
terkecil
Mie instant permen (supp : 1,00% conf: 10,5%)
Asosiasi terbentuk
71 Kombinasi
Tabel 6 di atas memperlihatkan hasil aturan asosiasi yang didapatkan dari keseluruhan itemset dari penggalian pada transaksi yang digunakan. Pemilihan nilai minimum support sebesar 10% ternyata meloloskan hampir semua kombinasi itemset yang didapatkan dari proses penggalian. Oleh karena itu akan dicoba proses pencarian kombinasi – kombinasi dengan nilai minimum confidence sebesar 20%. Percobaan ini dilakukan untuk meningkatkan nilai kepercayaan pengguna terhadap aturan asosiasi yang didapatkan dari proses penggalian yang telah dilakukan sebelumnya. Tabel 7 memperlihatkan hasil aturan asosiasi yang didapatkan dengan penggunaan nilai minimum confidence sebesar 20% dan minimum support sebesar 1%.
Tabel 7 Hasil aturan asosiasi terbentuk dengan minimum confidence 20% dan minsup 1%
Kriteria FOLD - Growth
Support
terbesar
susu snack (supp : 6,58% conf : 44,64%)
Support
terkecil
Pasta gigi lotion (supp : 1,03% conf: 20,58%)
Asosiasi terbentuk
45 Kombinasi
Berdasar pada nilai minimum confidence sebesar 20%, untuk kombinasi dengan nilai minimum support sebesar 1% diperoleh 45 aturan asosiasi. Dengan demikian terdapat 26 set kombinasi yang hilang karena memiliki nilai confidence dibawah 20%.
Selain itu, dalam pembentukan aturan asosiasi ini terlihat bahwa itemset dengan kombinasi susu.permen snack merupakan kombinasi dengan nilai confidence terbesar sebesar 70,44 % dan kombinasi sabun makanan pokok merupakan kombinasi dengan nilai confidence terendah sebesar 10,34%.
Pembentukan aturan asosiasi selanjutnya ialah penggunaan minimum support 2% - 5% dengan minimum confidence 10% (Lampiran 4,5, dan 6). Pada kasus minsup 2% terlihat jumlah kombinasi yang diperoleh berbeda seperti pada hasil penggalian dengan dengan minsup 1%. Hal ini dikarenakan banyak kombinasi yang memiliki nilai minimum support dibawah 2%.
Tabel 8 merupakan rangkuman hasil percobaan yang dilakukan dengan menggunakan hasil itemset yang didapatkan dari algoritme di atas.
Tabel 8 Hasil aturan asosiasi terbentuk dengan minimum confidence 10% dan minsup 2% - 5%
Minsup Kriteria FOLD – Growth
2% Support
terbesar
susu snack (supp : 6,58% conf : 44,64%)
Support
terkecil
Pelengkap roti snack (supp : 2,0% conf: 69,92%) Asosiasi terbentuk 12 kombinasi 3% Support terbesar
susu snack (supp : 6,58% conf : 44,64%)
Support
terkecil
snack sabun (supp : 3,22% conf :10,94%) Asosiasi terbentuk 5 kombinasi 4% Support terbesar
susu snack (supp : 6,58% conf : 44,64%)
Support
terkecil
minuman snack (supp : 6,26% conf : 20,87)
Asosiasi terbentuk
9
Minsup Kriteria FOLD – Growth
5% Support
terbesar
susu snack (supp : 6,58% conf : 44,64%)
Support
terkecil
minuman snack (supp : 6,26% conf : 20,87)
Asosiasi terbentuk
2 kombinasi
Berdasar pada Tabel 7 dan Tabel 8 memperlihatkan bahwa kombinasi susu snack merupakan kombinasi yang paling banyak terjadi dengan dukungan nilai support 6,58% dan nilai confidence sebesar 44,64%. Sementara kombinasi dengan nilai support terkecil ditemukan pada kombinasi mie instant mie permen (support : 1,00% ; confidence : 10,5%) saat percobaan dengan menggunakan nilai minsup sebesar 1%. Update Transaksi
Seperti yang dijelaskan pada bagian Tinjauan Pustaka, penggunaan algoritme FOLD – Growth dalam proses penggalian data memiliki beberapa kelebihan. Salah satu di antaranya ialah algoritme ini memungkinkan dilakukannya proses update transaksi baru terhadap transaksi yang lama.
Terbatasi oleh jumlah data transaksi yang dimiliki, maka dalam penelitian ini data transaksi yang diperoleh dibagi menjadi 2 (dua) bagian. Bagian pertama merupakan transaksi utama (dataset I) dan bagian selanjutnya ialah transaksi tambahan yang diperoleh dengan mengambil sebanyak 1/3 (sepertiga) bagian dari keseluruhan transaksi pada bagian awal, tengah, dan akhir basis data transaksi (dataset II). Penggalian pada proses update ini dilakukan dengan menggunakan nilai minimum support sebesar 2%.
Proses penggalian dengan dataset I dilakukan dengan menggunakan minimum support sebesar 2% dan didapatkan hasil seperti pada lampiran 5. Selanjutnya setelah proses penggalian dataset I selesai, dilakukan proses update dengan menambahkan dataset II pada sistem dengan nilai minimum support sebesar 2% kembali. Percobaan yang dilakukan menghasilkan kombinasi snack susu (support: 6,58% confidence: 44,64%) merupakan pola kombinasi pembelian yang paling banyak dilakukan.