NEGATIVE ASSOCIATION RULE
UNTUK MELIHAT POLA
KETERKAITAN PERILAKU KONSUMEN PADA DATA
TRANSAKSI PEMBELIAN
YOGI PRANOTO
DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
NEGATIVE ASSOCIATION RULE
UNTUK MELIHAT POLA
KETERKAITAN PERILAKU KONSUMEN PADA DATA
TRANSAKSI PEMBELIAN
YOGI PRANOTO
Skripsi
sebagai salah satu syarat untuk memperoleh gelar
Sarjana Komputer pada
Program Studi Ilmu Komputer
DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
ABSTRACT
YOGI PRANOTO. Negative Association Rule to See the Relationship between Consumer Behavior Pattern in the Purchase Transaction Data. Supervised by ANNISA.
Association rule mining is one of the most popular data mining techniques to find associations among items in a set by mining necessary patterns in a large database. Typical association rules consider only items enumerated in transactions. Such rules are referred to as positive association rules. Negative association rules also consider the same items, but in addition consider negated items or absent from transactions. The behavior of the customers is studied with reference to buying different products in a shopping store, the discovery of interesting patterns in this collection of data can lead to important marketing and management strategic decisions. Negative association rules are useful in market-basket analysis to identify products that conflict with each other or products that complement each other, in devising marketing strategies. This study used the combinations of minimum support of 10%, 30%, 50% and 70% and minimum confidence 10%, 30%, 50%, and 70%, also minimum interest 0.01, 0.001, 0.0001, and 0.00001. The result shows that the highest value is established by the occurence of rules if customers buy soap then customers will not buy soft drinks and otherwise if a customer buys a soft drink, the customer will not buy soap. Both rules have an interesting value 0.02012.
Judul Skripsi : Negative Association Rule untuk Melihat Pola Keterkaitan Perilaku Konsumen pada Data Transaksi Pembelian
Nama : Yogi Pranoto
NRP : G64086049
Menyetujui: Pembimbing
Annisa, S.Kom., M.Kom. NIP 197907312005012002
Mengetahui:
Ketua Departemen Ilmu Komputer
Dr. Ir. Agus Buono, M.Si., M.Kom. NIP 196607021993021001
RIWAYAT HIDUP
PRAKATA
Puji dan syukur penulis panjatkan ke hadirat Allah subhanahu wa ta’ala yang telah memberikan rahmat dan hidayah-Nya sehingga penulis dapat menyelesaikan karya ilmiah ini. Terima kasih penulis ucapkan kepada Ibu Annisa, S.Kom., M.Kom. selaku pembimbing. Adapun penulis mengucapkan terima kasih kepada:
1 Kedua orang tua, serta istri tercinta yang telah memberikan dukungan, perhatian, dan doa sehingga penulis dapat menyelesaikan studi di Departemen Ilmu Komputer IPB.
2 Dosen penguji, Ibu Imas S. Sitanggang, S.Si., M.Kom., dan Bapak Hari Agung Adrianto, S.Kom., M.Kom. atas saran dan bimbingannya.
3 Teman-teman satu bimbingan atas kerja samanya, serta
4 Teman-teman Alih Jenis Ilkom angkatan 3 atas kerjasamanya selama penelitian. Semoga penelitian ini dapat bermanfaat bagi semua pihak yang membutuhkan.
Bogor, Mei 2013
DAFTAR ISI
Halaman
DAFTAR TABEL ... vi
DAFTAR GAMBAR ... vi
DAFTAR LAMPIRAN ... vi
PENDAHULUAN ... 1
Latar Belakang ... 1
Tujuan ... 1
Ruang Lingkup ... 1
Manfaat ... 1
TINJAUAN PUSTAKA ... 1
Association Rule Mining ... 1
Negative Association Rule Mining ... 2
Interesting Itemset ... 2
Conditional Probability Increment Ratio ... 3
METODE PENELITIAN ... 3
Data Selection ... 3
Data Cleaning ... 3
Data Transformation ... 3
Data Mining ... 3
Knowledge Representation ... 5
Lingkungan Pengembangan ... 5
HASIL DAN PEMBAHASAN... 5
Pembersihan Data ... 5
Transformasi Data ... 5
Data Mining ... 5
Penerapan dalam Kode Program ... 7
KESIMPULAN DAN SARAN... 8
Kesimpulan ... 8
Saran ... 8
DAFTAR PUSTAKA ... 8
DAFTAR TABEL
Halaman
1 Large 1-frequentitemset dengan min_sup 30% ... 6
2 Large 2-infrequentitemset dengan min_sup 30% ... 6
3 Large 1-frequentitemset dengan min_sup 10% ... 6
4 Large 2-frequentitemset dengan min_sup 10% ... 6
5 Large 2-infrequentitemset dengan min_sup 10% ... 6
6 Large 3-infrequentitemset dengan min_sup 10% ... 6
DAFTAR GAMBAR
Halaman 1 Ilustrasi CNR dengan Diagram Venn ... 22 Ilustrasi ANR dengan Diagram Venn ... 2
3 Ilustrasi ACNR dengan Diagram Venn ... 2
4 Tahapan Penelitian ... 3
DAFTAR LAMPIRAN
Halaman 1 Langkah pengerjaan ... 102 Deskripsi sampel data transaksi pembelian Sinar Mart Swalayan ... 11
3 Format konversi items ke dalam bentuk numerik ... 12
4 Sampel data transaksi pembelian setelah praproses ... 13
5 Large 1-frequent itemset dengan min_sup 10% ... 14
6 Large 2-frequent itemset dengan min_sup 10% ... 14
7 Large 2-infrequent itemset dengan min_sup 10% ... 14
8 Large 3-infrequent itemset dengan min_sup 10% ... 15
9 Valid Rule ANR min_sup 10%, min_conf 50%, dan min_int 0.00001, 0.0001, 0.001, 0.01 ... 16
10 Valid Rule CNR min_sup 10%, min_conf 30%, dan min_int 0.00001, 0.0001, 0.001, 0.01 ... 16
11 Valid Rule ANR min_sup 10%, min_conf 30%, dan min_int 0.00001, 0.0001, 0.001, 0.01 ... 16
12 Valid Rule CNR min_sup 10%, min_conf 10%, dan min_int 0.00001, 0.0001, 0.001, 0.01 ... 17
13 Valid Rule ANR min_sup 10%, min_conf 10%, dan min_int 0.00001, 0.0001, 0.001, 0.01 ... 19
14 Valid Rule ACNR min_sup 10%, min_conf 10%, dan min_int 0.00001, 0.0001, 0.001, 0.01 ... 21
1
PENDAHULUAN
Latar Belakang
Association rule mining merupakan teknik
data mining yang digunakan untuk menemukan keterhubungan antar-item atau objek dalam
database yang kemudian direpresentasikan dalam bentuk aturan asosiasi (association rules). Association rule mining di antara record
yang jumlahnya sangat banyak dapat membantu dalam proses pengambilan keputusan (Han dan Kamber 2006).
Salah satu penerapan association rule mining ialah market basket analysis. Dalam proses ini data transaksi pembelian digunakan untuk mengetahui keterkaitan perilaku konsumen pada pembelian suatu barang dan
rule yang dihasilkan dapat digunakan untuk membantu pengambilan keputusan dalam strategi pemasaran.
Association rule mining yang biasa
diterapkan ialah positive association rule yang digunakan untuk mendapatkan keterhubungan positif antar item-item, misalnya: “jika pembeli membeli roti maka juga membeli susu”. Untuk keterhubungan negatif seperti: “jika pembeli membeli roti maka tidak membeli beras” digunakan Negative association rule yang merupakan aturan yang berisi negasi dari item
dan berbeda dari positive association rule baik dalam prosedur mining-nya tetapi juga bentuknya (Ramaraj dan Venkatesan 2008).
Negative association rule tidak hanya mempertimbangkan item yang ada data set transaksi, tetapi juga item yang dinegasikan (item yang tidak ada pada data transaksi).
Negative association rule berguna untuk mengidentifikasi produk yang bertentangan dengan satu sama lain atau produk yang saling melengkapi pada contoh kasus market basket analysis (Antonie danZaïane 2004). Tujuan
Tujuan dari penelitian ini ialah mengimplementasikan algoritme negative association rule untuk mengetahui pola keterhubungan antar item pada sekumpulan data transaksi pembelian.
Ruang Lingkup
Batasan pada penelitian ini ialah:
1 Menggunakan data transaksi pembelian Sinar Mart Swalayan selama periode 1 bulan terhitung sejak 1 Maret hingga 31 Maret 2004.
2 Menggunakan semua bentuk negative association rule.
Manfaat
Dari penelitian ini dapat diketahui informasi hubungan antar barang yang dibeli oleh pembeli pada data transaksi pembelian. Selain itu juga dapat diidentifikasi produk yang bertentangan dengan satu sama lain atau produk yang saling melengkapi. Keterhubungan tersebut dapat digunakan sebagai bahan pertimbangan dalam pengambilan keputusan yang berhubungan dengan penempatan produk, serta menyusun strategi pemasaran yang lebih baik.
TINJAUAN PUSTAKA
Association Rule Mining
Aturan asosiasi (association rule) atau analisis afinitas (affinity analysis) berkenaan dengan studi “apabersama apa”. Pada dasarnya aturan ini digunakan untuk menggambarkan keterkaitan antara item pada sekumpulan data (Han dan Kamber 2006).
Aturan asosiasi dapat diperoleh melalui 2 tahap berikut:
1 Mencari itemset yang memenuhi support di atas minimum support (min_sup). Min_sup
merupakan nilai ambang batas dari support
di dalam suatu basis data, sedangkan
support merupakan persentase dari transaksi dalam basis data yang mengandung sebuah
itemset tertentu (Han dan Kamber 2006).
Support diperoleh dengan menggunakan persamaan:
N = jumlah seluruh transaksi
2 Menggunakan itemset untuk membuat aturan asosiasi yang memiliki confidence di atas minimum confidence (min_conf).
Min_conf merupakan nilai ambang batas
confidence yang ditentukan, sedangkan
confidence merupakan persentase
kemunculan dari transaksi yang mengandung itemset tertentu juga diikuti kemunculan itemset lainnya. Confidence
diperoleh dengan menggunakan persamaan:
2
positive association rule yang bermanfaat dalam pengambilan keputusan, tetapi juga negative association rule (NAR). Asosiasi negatif disebut sebagai hubungan negatif antara dua
itemset. Hubungan negatif tersebut menyiratkan aturan negatif antara dua itemset. Namun, asosiasi negatif hanya mengungkapkan aturan negatif dalam representasi tersembunyi, dan tidak memberikan aturan negatif yang sebenarnya. Contoh aturan asosiasi negatif adalah:
Pelanggan yang beli susu tidak beli kopi, Pelanggan yang beli permen tidak beli
rokok.
Algoritme Negative association rules
(NAR) (Wu et al. 2004) adalah sebagai berikut:
Input:
D: basis data,
ms: minimum support,
mc: minimum confidence, mi: minimum interesting.
NL: Kumpulan interest infrequent itemset;
Output: negative association rules Method:
(1) Menghitung frequent itemset dan
infrequent itemset dari potential interest
pada database (lihat pada halaman 4) (2) //Men-generate negative association rule
Bentuk negative association rule (NAR), antara lain:
Consequent Negative Rule (CNR),
bentuknya: A ¬B seperti yang diilustrasikan pada Gambar 1,
supp(A ¬B) = supp(A) – supp(AB) conf(A ¬B) = supp – supp
supp
Gambar 1 Ilustrasi CNR dengan Diagram Venn
Antecedent Negative Rule (ANR),
bentuknya: ¬A B seperti yang diilustrasikan pada Gambar 2,
supp(¬A B) = supp(B) – supp(AB) conf(¬A B) = supp – supp
-supp
Gambar 2 Ilustrasi ANR dengan Diagram Venn.
Antecedent and Consequent Negative Rule
(ACNR), bentuknya: ¬A ¬B seperti yang diilustrasikan pada Gambar 3.
supp(¬A ¬B) = 1-supp(A)-supp(B) + supp(AB)
conf(¬A ¬B) = -supp -supp supp
-supp
Gambar 3 Ilustrasi ACNR dengan Diagram Venn.
Interesting Itemset
Pada negative association rule, dilakukan perhitungan interesting itemset dengan langkah-langkah sebagai berikut:
3
= |su - su su |...(3) dengan batas ambang mi (minimum interestingness).
- menggabungkan nilai interest, support dan
confidence.
Rumus interesting positive association rules: Rumus interesting negative association
rule:
Conditional Probability Increment Ratio
Conditional probability increment ratio
(CPIR) merupakan nilai korelasi antara item X
dan Y. Nilai CPIR yang didapatkan nantinya akan dijadikan nilai confidence. CPIR didapat dengan persamaan sebagai berikut:
P su -su su
su -su ...(6)
METODE PENELITIAN
Pada Penelitian ini dilakukan beberapa tahapan untuk mendapatkan hasil yang diinginkan. Alur metodologi penelitian dapat dilihat pada Gambar 4.
Data Selection
Tahap pertama adalah memilih data yang akan digunakan untuk dilakukan proses data mining. Pada tahapan ini ditentukan basis data yang akan digunakan, yaitu data transaksi pembelian Sinar Mart Swalayan selama periode 1 bulan terhitung sejak 1 Maret hingga 31 Maret 2004. Data transaksi pembelian tersebut sebelumnya sudah digunakan pada penelitian yang dilakukan oleh Sijabat (2011). Pada penelitian sebelumnya, data tersebut sudah dilakukan tahap pembersihan data, yaitu apabila transaksi yang terjadi pada waktu yang sama dan tercatat lebih dari satu kali akan dianggap sebagai satu transaksi dan data yang tidak lengkap akan dibuang, serta pada tahap proses seleksi data, yaitu dengan memilih atribut id pembeli, waktu pembelian berdasarkan tanggal, dan juga jenis barang atau item yang dibeli.
Data Cleaning
Pada penelitian ini, pembersihan data merupakan tahap yang dilakukan untuk membersihkan data dari duplikasi. Pada tahap ini, sebuah transaksi pembelian suatu barang yang terdiri atas lebih dari satu barang yang sama, akan dianggap sebagai satu transaksi.
Data Transformation
Pada tahap ini data yang digunakan diubah ke dalam bentuk yang sesuai dengan kebutuhan. Bentuk yang dimaksud adalah tabel dan susunan field yang disusun sesuai kebutuhan pada proses selanjutnya yaitu tahap association rules.
Gambar 4 Tahapan Penelitian
Data Mining
Pada association rule, pencarian aturan (rule) dari bentuk A B adalah dengan support
dan confidence lebih besar, atau sama dengan, dengan ambang batas min_sup, dan min_conf
yang telah ditentukan.
4
A ¬B disebut juga sebagai interesting negative rule.
Tahap ini merupakan inti dari analisis data. Pada tahap ini diterapkan penggunaan algoritme NAR. Tahapan-tahapan yang akan digunakan pada metode tersebut adalah:
1 Identifikasi interesting itemset
Sebelum mencari interesting itemset pada NAR adalah menemukan frequent dan
infrequent itemset. Frequent itemset merupakan
itemset yang memenuhi minimum support yang telah ditentukan (lebih besar atau sama dengan
ms), sedangkan infrequent itemset merupakan
itemset yang tidak memenuhi minimum support
yang telah ditentukan (lebih kecil dari ms). 1.1 Pruning
Pada negative association rule dihasilkan
infrequent itemset dalam jumlah yang sangat banyak, namun hanya beberapa di antaranya yang berguna dalam menambang negative association rule. Oleh karena itu, perlu dilakukan pruning. Pada negative association rule, pruning dilakukan dengan menghitung
interesting itemset menggunakan rumus 3, selanjutnya menggabungkan nilai interest, support dan confidence dengan menggunakan rumus 4 dan 5. Jika hasil fipis(X, Y) sama
negative rule adalah untuk membatasi pencarian
interesting rule, selanjutnya proses pruning
akan menghapus rule yang tidak mengarah pada
interesting rule.
1.2 Mencari interest frequent dan infrequent itemsets
Untuk mengefesiensikan algoritme dalam mencari frequent itemset yang berhubungan dengan positive rules dan infrequent itemset
yang berhubungan dengan negative rules
dilakukan pruning pada itemset yang tidak termasuk dalam interest itemset. Pada penelitian ini digunakan algoritme sebagai berikut untuk menemukan frequent itemset dan infrequent itemset dari potential interest pada database,
PL : Kumpulan interest frequent itemset;
NL : Kumpulan interest infrequent itemset; (1) PL←∅; NL←∅;
(2) L1←{frequent 1-itemsets}; PL←PL L1;
(3) for (k = 2; (Lk− =∅); k ++) do
begin //membangkitkan semua kemungkinan interest frequent dan
infrequent k-itemsets pada D.
(3.1) Temk←{{x1, ... , xk−2, xk− ,xk}|{x1, ... ,
//Periksa apakah k-itemset termasuk pada transaksi t.
2 Generate negative association rule
Tahapan selanjutnya adalah membangkitkan
negative association rule pada iipis(X,Y). Pada tahap ini, dilakukan perhitungan CPIR menggunakan rumus 6. Setelah didapatkan nilai CPIR, selanjutnya, rule X ¬Y dikatakan valid
apabila supp(X¬Y) ms, supp(X) ms,
supp(Y) ms, interest(X, ¬Y) mi, dan CPIR
5
Knowledge Representation
Knowledge representation merupakan tahap untuk merepresentasikan hasil asosiasi yang diperoleh ke dalam bentuk yang mudah dipahami. Pada penelitian ini, knowledge
representation mendeskripsikan hasil
penelitian.
Lingkungan Pengembangan
Penelitian ini dilakukan dalam lingkungan pengembangan sebagai berikut :
Perangkat lunak : - Processor AMD E350 - 2 GB RAM
- Harddisk kapasitas 320 GB
- Monitor dengan resolusi 1280 x 800 piksel
HASIL DAN PEMBAHASAN
Pada penelitian ini, data yang digunakan adalah data transaksi pembelian Sinar Mart Swalayan selama periode waktu 1 Maret hingga 31 Maret 2004. Data transaksi pembelian yang didapat memiliki tiga atribut, yaitu customer id (sid), waktu transaksi (eid), dan barang yang dibeli (item). Data didapat dalam format Microsoft Excel (transaksi_maret2004.xlsx). Urutan pengerjaan digambarkan pada Lampiran 1 dan deskripsi sampel data transaksi pembelian Sinar Mart Swalayan dapat dilihat pada Lampiran 2.
Pembersihan Data
Pembersihan data dilakukan apabila terdapat data pembelian barang yang sama pada satu transaksi, pembelian barang tersebut dicatat hanya satu kali.
Transformasi Data
Pada tahap ini dilakukan beberapa proses transformasi data, yaitu:
1 Konversi waktu transaksi (eid) ke dalam bentuk numerik. Waktu transaksi (eid) yang semula berformat date diubah menjadi numerik dengan mengganti format date menjadi number yang terdapat pada Microsoft Excel untuk menyesuaikan ke dalam format MySQL.
2 Konversi item ke dalam bentuk numerik.
Items yang dibeli oleh pembeli diubah ke dalam bentuk numerik dengan memberikan kode yang dimulai dari 1 hingga 35. Mie
instan dikodekan dengan 1, minyak goreng dikodekan dengan 2, demikian halnya dengan jenis barang lain. Format item yang dikonversi ke dalam bentuk numerik dapat dilihat pada Lampiran 3. Data hasil konversi terdiri atas 11866 baris, 308 pembeli yang berbeda dan 35 item yang berbeda. Sampel data transaksi pembelian setelah praproses dapat dilihat pada Lampiran 4.
Data mining
Pada tahap ini, percobaan dilakukan terhadap data transaksi pembelian Sinar Mart Swalayan yang telah melewati tahap praproses sebanyak 11866 record. Tahapan-tahapan yang dilakukan, yaitu
1 Identifikasi interesting itemset
Sebelum mencari interesting itemset pada NAR adalah menemukan frequent dan
infrequent itemset. Pada tahap ini, pengguna harus terlebih dahulu memberikan nilai
minimum support. Nilai minimum support
digunakan ialah 10%, 30%, 50%, 70%. Selanjutnya, dari masing-masing hasil min_sup
tersebut, jika min_sup 70% tidak ada itemset
yang memenuhi, kemudian diturunkan hingga
min_sup 50% hanya didapatkan frequent itemset
dengan 1 itemset, yaitu itemset snack dengan
support 53.81%.
Hasil pada min_sup 50% tidak bisa dijadikan sebagai bahan untuk analisis, karena karena pada large 1-itemset hanya menghasilkan 1 itemset, sehingga pada large
2-itemset tidak bisa menghasilkan frequent dan
infrequent itemset. Kemudian, min_sup
diturunkan lagi dan dicoba dengan min_sup
30% dan 10%.
1.1 Pembentukan Large Itemset Dengan
Min_sup 30%
a Large 1-frequentitemset
Berdasarkan min_sup 30% dihasilkan 3
itemset. Support tertinggi pada itemset snack dan terendah pada itemset susu dengan support
masing-masing 53.81% dan 33.33%. Hasil
large 1-frequent itemset dengan min_sup 30% ditampilkan pada Tabel 1.
6
Tabel 1 Large 1-frequent itemset dengan
min_sup 30%
No Itemset Jumlah
Transaksi
frequentitemset hanya menghasilkan infrequent itemset sehingga tidak memungkinkan lagi untuk dilanjutkan ke pembentukan large 3 -itemset. Oleh karena itu, pada tahap ini belum bisa didapatkan informasi yang cukup sebagai bahan analisis, walaupun sudah menghasikan beberapa rule, namun belum menghasilkan
valid rule. Hasil infrequent itemset tersebut dapat dilihat pada Tabel 2.
Tabel 2 Large 2-infrequent itemset dengan
min_sup 30%
No Itemset Jumlah
Transaksi
1.2 Pembentukan Large itemset dengan
min_sup 10% a Large 1-itemset
Tahap pembentukan large 1-itemset
menghasilkan 11 itemset. Beberapa hasil large
1-itemset dengan min_sup 30% ditampilkan pada Tabel 3, untuk hasil keseluruhan dapat dilihat pada Lampiran 5.
Tabel 3 Large 1-frequent itemset dengan
min_sup 10%
No Itemset Jumlah
Transaksi
selanjutnya dapat dibentuk frequent itemset
sebanyak 6 itemset dan infrequent itemset
sebanyak 49 itemset. Pada Tabel 4 dan 5 menampilkan beberapa hasil dari dibentuk
frequent itemset dan infrequent itemset tersebut, untuk dapat melihat hasil keseluruhan dapat dilihat pada Lampiran 6 dan 7.
Tabel 4 Large 2-frequent itemset dengan
min_sup 10%
No Itemset Jumlah
Transaksi
No Itemset Jumlah
Transaksi
large 2-frequent itemset hanya menghasilkan sebanyak 20 infrequent itemset. Beberapa hasil
infrequent itemset pada large 3-itemset ini dapat dilihat pada Tabel 6, untuk hasil selengkapnya dapat dilihat pada Lampiran 8.
Tabel 6 Large 3-infrequent itemset dengan
min_sup 10%
No Itemset Jumlah
Transaksi %
2 Pembentukan aturan asosiasi
Negative association rule mampu
menghasilkan infrequent itemset dalam jumlah yang sangat banyak, namun hanya beberapa di antaranya yang berguna dalam menghasilkan
negative association rule. Oleh karena itu, perlu dilakukan pruning, serta perhitungan interesting itemset pada proses pembentukan aturan asosiasi.
Pada tahapan sebelumnya didapatkan nilai
min_sup 10% yang digunakan untuk langkah selanjutnya. Nilai minimum confidence dan
7
minimum confidence 10%, 30%, 50%, 70%, serta minimum interest 0.01, 0.001, 0.0001, dan 0.00001.
2.1 Pembentukan aturan asosiasi dengan
min_conf 70%
Hasil percobaan dengan menggunakan
min_conf 70%, min_sup 10%, serta min_int
0.01, 0.001, 0.0001, dan 0.00001 untuk CNR, ANR dan ACNR tidak menghasilkan validrule.
2.2 Pembentukan aturan asosiasi dengan
min_conf 50%
Pada percobaan dengan menggunakan
min_sup 10%, min_conf 50%, dan min_int 0.01, 0.001, 0.0001, 0.00001 untuk CNR dan ACNR tidak menghasilkan valid rule, sedangkan ANR menghasilkan 3 valid rule
yang dapat dilihat pada Lampiran 9.
2.3 Pembentukan aturan asosiasi dengan
min_conf 30%
Percobaan ini menggunakan nilai min_sup
sebesar 10%, min_conf sebesar 30%, dan
min_int sebesar 0.01, 0.001, 0.0001, dan 0.00001. Hasilnya, CNR menghasilkan 2 valid rule ( Lampiran 10), ANR menghasilkan 9 valid
rule (Lampiran 11), dan ACNR tidak
menghasilkan valid rule.
2.4 Pembentukan aturan asosiasi dengan
min_conf 10%
Percobaan ini menggunakan nilai min_sup
sebesar 10%, min_conf sebesar 10%, dan
min_int sebesar 0.01, 0.001, 0.0001, dan 0.00001. Hasilnya, CNR menghasilkan 39 valid rule, ANR menghasilkan 40 valid rule, dan ACNR menghasilkan 15 valid rule. Valid rule
yang dihasilkan dari ketiga bentuk NAR tersebut dapat dilihat pada Lampiran 12, 13, dan 14.
Penerapan dalam kode program
Kode program yang digunakan untuk menghasilkan kombinasi itemset dan rule
adalah sebagai berikut:
//fungsi k-itemset //a = awal
//x = array kosong untuk index //i = array yang dikombinasikan function kitem($a,$x,$i){ melalui fungsi input dengan mengisi itemset
yang ingin dikombinasikan pada variable isi
dengan tipe data string, kemudian diproses oleh fungsi k-item dengan rekursif sebanyak jumlah anggota pada itemset yang dimasukkan. Hasil proses fungsi k-item disimpan dalam variables
dan j, variable s berisi itemset yang sudah di kombinasikan dan j berisi jumlah itemset dari s. Misalnya variableisi berisi data string 01,03,06 maka pada iterasi pertama s = 01 dan j = 1, iterasi kedua s = 01,03 dan j =2, selanjutnya secara berturut-turut isi variable s, yaitu: 01,03,06; 01,06; 03; 03,06; 06 dan isi variable j, yaitu: 3, 2, 1, 2, 1.
3 Analisis aturan asosiasi
Berdasarkan percobaan yang dilakukan didapat hasil sebagai berikut:
1 Dari 35 item kelompok barang yang dijadikan bahan analisis, hanya 3 item yang memiliki support di atas 30%, yaitu snack
(53.81%), softdrink (33.98%) dan susu (33.33%),
2 Support tertinggi dibentuk oleh item snack
sebesar 53.81% dan support terendah dibentuk oleh item sandal sebesar 0.15%, 3 CNR dengan nilai tertinggi dibentuk oleh
rule jika konsumen membeli snack maka konsumen tidak akan membeli makanan pokok dengan support 49.47%, interest
0.01285, dan CPIR 0.2283.
4 ANR dengan nilai tertinggi dibentuk oleh
rule jika konsumen tidak membeli permen dan sabun maka konsumen akan membeli
snack dengan support 51.33%, interest
0.4312 dan CPIR 0.644.
5 ACNR dengan nilai tertinggi dibentuk oleh
rule jika konsumen tidak membeli permen dan sabun maka konsumen tidak akan membeli snack dengan support 51.33%,
interest 0.43907 dan CPIR 0.205
6 CNR dengan nilai terendah dibentuk oleh
rule jika konsumen membeli lotion maka konsumen tidak akan membeli softdrink
8
7 ANR dengan nilai terendah dibentuk oleh
rule jika konsumen tidak membeli susu dan sabun maka konsumen akan membeli permen dengan support 17.85%, interest
0.78142 dan CPIR 0.151.
8 ACNR dengan nilai terendah dibentuk oleh
rule jika konsumen tidak membeli kopi maka konsumen tidak akan membeli snack
dengan support 46.07%, interest 0.4701 dan CPIR 0.149
KESIMPULAN DAN SARAN
Kesimpulan
Berdasarkan percobaan yang dilakukan didapat rule dengan nilai interesting yg tinggi yaitu jika pelanggan membeli sabun maka pelanggan tidak akan membeli softdrink dan sebaliknya jika pelanggan membeli softdrink
maka pelanggan tidak akan membeli sabun. Kedua rule ini mempunyai nilai interesting
sebesar 0.02012.
Saran bagi pengelola Sinar Mart Swalayan, dalam pengambilan keputusan atau kebijakan dari rule tersebut, yaitu:
Jangan menempatkan sabun dan softdrink
secara berdekatan karena pembeli hanya membeli salah satu dari item tersebut. Tidak menjadikan sabun dan softdrink satu
paket pembelian. Saran
Penelitian ini menggunakan data sebanyak 3384 transaksi. Penelitian selanjutnya dapat menambahkan data yang lebih banyak dengan menggunakan data series berikutnya sehingga dapat diperoleh hasil yang lebih baik. Selain itu,
penggunaan metode atau algoritme lain diharapkan dapat memperoleh hasil yang lebih baik lagi. Pengembangan sistem dapat dilakukan dengan penambahan fitur maupun tampilan agar lebih baik.
DAFTAR PUSTAKA
Antonie ML, Zaiane OR. 2004. Mining positive and negative association rules: an approach for confined rules. Di dalam: European PKDD Conference [Internet]. 2004 Sep 20-24; Edmonton, Alberta. hlm 29-30.
Han J, Kamber M. 2006. Data Mining: Concept and Techniques. Edisi ke-2. San Diego(US): Morgan-Kauffman.
Ramaraj E, Venkatesan N. 2008. Positive and negative association rule analysis in health care database. IJCSNS International Journal of Computer Science and Network Security. 8(10): 326.
Sijabat R. 2011. Penentuan pola sekuensial data transaksi pembelian menggunakan algoritme SPADE [skripsi]. Bogor(ID): Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor.
Sumalatha R, Ramasubbareddy B. 2010. Mining positive and negative association rules. International Journal on Computer Science and Engineering. 2(9): 2917-2918. Wu X, Zhang C, Zhang S. 2004. Efficient
10
Lampiran 1 Langkah pengerjaan
Mulai
Praproses Data Data transaksi
Cek 1 itemset yang memenuhi
support Input minimum
support
Positif itemset
Kombinasikan itemset 1+ n
Cek itemset yang terbentuk
Cek support
= 1 >=min supp
Cek interisting positif itemset
Cek minimum interest
Pruning !=1
< min supp Cek interisting
negtif itemset
!=2 Negatif itemset
= 2
Bangkitkan rule dari itemset yang
didapat
< min interest
Cek confidence < min confidence
Rule positif
Rule negatif >= min confidence
selesai Rule yang
11
Lampiran 2 Deskripsi sampel data transaksi pembelian Sinar Mart Swalayan
eid sid item
01/03/2004 00001 mie instant
01/03/2004 00001 makanan pokok
01/03/2004 00001 susu bayi
01/03/2004 00001 obat
01/03/2004 00004 mie instant
01/03/2004 00004 minyak goreng
01/03/2004 00004 kopi
01/03/2004 00004 makanan pokok
01/03/2004 00004 saus kecap
01/03/2004 00004 sabun
01/03/2004 00004 obat
01/03/2004 00014 permen
01/03/2004 00014 snack
01/03/2004 00017 susu
01/03/2004 00017 softdrink
01/03/2004 00018 mie instant
01/03/2004 00018 obat
01/03/2004 00020 permen
01/03/2004 00020 softdrink
01/03/2004 00020 snack
01/03/2004 00020 rokok
01/03/2004 00022 susu
01/03/2004 00022 softdrink
01/03/2004 00022 snack
01/03/2004 00023 permen
01/03/2004 00023 softdrink
01/03/2004 00027 susu
01/03/2004 00027 susu bayi
01/03/2004 00029 mie instant
01/03/2004 00029 tissue
01/03/2004 00031 susu
01/03/2004 00031 snack
01/03/2004 00031 susu bayi
01/03/2004 00031 perlengkapan bayi
01/03/2004 00034 mie instant
01/03/2004 00034 ice cream
01/03/2004 00039 makanan pokok
01/03/2004 00039 obat
01/03/2004 00041 handuk
01/03/2004 00041 tissue
12
Lampiran 3 Format konversi items ke dalam bentuk numerik
ID Nama
01 Mie Instant 02 Minyak Goreng 03 Susu
04 Kopi
05 Makanan Pokok 06 Permen
07 Softdrink 08 Snack
09 Pelengkap Roti 10 Saus Kecap 11 Makanan Kaleng 12 Lotion
13 Sabun 14 Shampo 15 Obat Nyamuk 16 Pengharum Ruangan 17 Bumbu Dapur 18 Tepung 19 Susu Bayi 20 Rokok 21 Baterai 22 Eskrim 23 Sosis
24 Perlengkapan Komputer 25 Obat
26 Pasta Gigi 27 Multivitamin 28 Perlengkapan Bayi 29 Handuk
30 Perlengkapan Dapur 31 Tissue
32 Sandal 33 Korek
13
Lampiran 4 Sampel data transaksi pembelian setelah praproses
sid eid items
1 38047 1
1 38047 5
1 38047 19
1 38047 25
1 38047 3
1 38047 25
1 38049 3
1 38049 8
1 38050 1
1 38050 7
1 38050 8
1 38051 8
1 38051 28
1 38055 7
1 38055 8
1 38057 12
1 38057 31
1 38057 35
1 38058 3
1 38058 4
1 38058 6
1 38058 7
1 38058 8
1 38058 19
1 38058 20
1 38058 25
1 38058 31
1 38060 6
1 38060 7
1 38060 8
1 38060 16
1 38063 13
1 38063 26
1 38064 8
1 38064 23
1 38064 31
1 38065 1
14
Lampiran 5 Large 1-frequent itemset dengan min_sup 10%
No Itemset Jumlah
Transaksi
No Itemset Jumlah
Transaksi
No Itemset Jumlah
15
Lanjutan
No Itemset Jumlah
Transaksi
25 Softdrink, Pasta gigi
117 34,57
Lampiran 8 Large 3-infrequent itemset dengan min_sup 10%
No Itemset Jumlah
Transaksi
16 Lampiran 9 Valid Rule ANR min_sup 10%, min_conf 50%, dan min_int 0.00001, 0.0001, 0.001, 0.01
No Item
Jumlah Transaksi
Item
Body
Jumlah Transaksi
Body
Head
Jumlah Transaksi
Head
Rule Support CPIR Interest FIPIS IIPIS
1 01,06,08 97 01,06 372 08 1821 0 ,06 → 08 50.95 0.601 0.43139 1 2
2 01,08,13 110 01,13 372 08 1821 0 , 3 → 08 50.56 0.525 0.43523 1 2
3 06,08,13 84 06,13 349 08 1821 06, 3 → 08 51.33 0.644 0.4312 1 2
Lampiran 10 Valid Rule CNR min_sup 10%, min_conf 30%, dan min_int 0.00001, 0.0001, 0.001, 0.01
No Item
Jumlah Transaksi
Item
Body
Jumlah Transaksi
Body
Head
Jumlah Transaksi
Head
Rule Support CPIR Interest FIPIS IIPIS
1 07,08,13 111 07,08 649 13 836 07,08 → 3 15.9 0.308 0.01458 1 2
2 07,08,13 111 13 836 07,08 649 3 → 07,08 21.42 0.308 0.01458 1 2
Lampiran 11 Valid Rule ANR min_sup 10%, min_conf 30%, dan min_int 0.00001, 0.0001, 0.001, 0.01
No Item
Jumlah Transaksi
Item
Body
Jumlah Transaksi
Body
Head
Jumlah Transaksi
Head
Rule Support CPIR Interest FIPIS IIPIS
1 01,06,08 97 01,06 372 08 1821 0 ,06 → 08 50.95 0.601 0.43139 1 2
2 01,07,08 124 01,07 372 08 1821 0 ,07 → 08 50.15 0.443 0.43937 1 2
3 01,08,13 110 01,13 372 08 1821 0 , 3 → 08 50.56 0.525 0.43523 1 2
4 03,06,13 50 06,13 435 03 1128 06, 3 → 03 31.86 0.328 0.63859 1 2
17 No Item
Jumlah Transaksi
Item
Body
Jumlah Transaksi
Body
Head
Jumlah Transaksi
Head
Rule Support CPIR Interest FIPIS IIPIS
6 03,07,13 69 07,13 649 03 1128 07, 3 → 03 31.29 0.341 0.62313 1 2
7 06,07,13 49 06,13 435 07 1150 06, 3 → 07 32.54 0.344 0.63096 1 2
8 06,08,13 84 06,13 349 08 1821 06, 3 → 08 51.33 0.644 0.4312 1 2
9 07,08,13 111 07,13 349 08 1821 07, 3 → 08 50.53 0.476 0.43918 1 2
Lampiran 12 Valid Rule CNR min_sup 10%, min_conf 10%, dan min_int 0.00001, 0.0001, 0.001, 0.01
No Item
Jumlah Transaksi
Item
Body
Jumlah Transaksi
Body
Head
Jumlah Transaksi
Head
Rule Support CPIR Interest FIPIS IIPIS
1 01,07 210 07 1150 01 706 07 → 0 27.78 0.125 0.00884 1 2
2 01,12 73 12 455 01 706 → 0 11.29 0.231 0.00648 1 2
3 04,06 88 06 654 04 507 06 → 04 16.73 0.102 0.00295 1 2
4 04,12 54 12 455 04 507 → 04 11.85 0.208 0.00419 1 2
5 03,05 94 03 1128 05 354 03 → 05 30.56 0.203 0.00709 1 2
6 05,06 52 06 654 05 354 06 → 05 17.79 0.24 0.00485 1 2
7 05,07 85 07 1150 05 354 07 → 05 31.47 0.293 0.01043 1 2
8 05,08 147 08 1821 05 354 08 → 05 49.47 0.228 0.01285 1 2
9 05,12 38 12 455 05 354 → 05 12.32 0.202 0.00284 1 2
10 05,26 39 26 440 05 354 6 → 05 11.85 0.153 0.00208 1 2
11 04,06 88 04 507 06 654 04 → 06 12.38 0.102 0.00295 1 2
18 No Item
Jumlah Transaksi
Item
Body
Jumlah Transaksi
Body
Head
Jumlah Transaksi
Head
Rule Support CPIR Interest FIPIS IIPIS
13 06,13 123 13 836 06 654 3 → 06 21.07 0.239 0.0114 1 2
14 06,26 63 26 440 06 654 6 → 06 11.14 0.259 0.00651 1 2
15 01,07 210 01 706 07 1150 0 → 07 14.66 0.125 0.00884 1 2
16 07,12 115 12 455 07 1150 → 07 10.05 0.256 0.01171 1 2
17 07,13 216 13 836 07 1150 3 → 07 18.32 0.24 0.02012 1 2
18 01,12 73 01 706 12 455 0 → 18.71 0.231 0.00648 1 2
19 03,12 134 03 1128 12 455 03 → 29.37 0.116 0.00522 1 2
20 04,12 54 04 507 12 455 04 → 13.39 0.208 0.00419 1 2
21 06,12 78 06 654 12 455 06 → 17.02 0.113 0.00294 1 2
22 07,12 115 07 1150 12 455 07 → 30.59 0.256 0.01171 1 2
23 08,12 209 08 1821 12 455 08 → 47.64 0.146 0.01059 1 2
24 03,08,13 154 03,08 702 13 836 03,08 → 3 16.19 0.112 0.00574 1 2
25 06,08,13 84 06,08 435 13 836 06,08 → 3 10.37 0.218 0.00693 1 2
26 06,13 123 06 654 13 836 06 → 3 15.69 0.239 0.0114 1 2
27 07,08,13 111 07,08 649 13 836 07,08 → 3 15.9 0.308 0.01458 1 2
28 07,13 216 07 1150 13 836 07 → 3 27.6 0.24 0.02012 1 2
29 06,26 63 06 654 26 440 06 → 6 17.46 0.259 0.00651 1 2
30 07,26 117 07 1150 26 440 07 → 6 30.53 0.218 0.00961 1 2
31 08,26 191 08 1821 26 440 08 → 6 48.17 0.193 0.01353 1 2
19 No Item
Jumlah Transaksi
Item
Body
Jumlah Transaksi
Body
Head
Jumlah Transaksi
Head
Rule Support CPIR Interest FIPIS IIPIS
33 06,31 64 06 654 31 372 06 → 3 17.43 0.11 0.00233 1 2
34 08,31 177 08 1821 31 372 08 → 3 48.58 0.116 0.00685 1 2
35 03,07,13 69 13 836 03,07 349 3 → 03,07 22.67 0.2 0.00509 1 2
36 03,08,13 154 13 836 03,08 702 3 → 03,08 20.15 0.112 0.00574 1 2
37 06,08,13 84 13 836 06,08 435 3 → 06,08 22.22 0.218 0.00693 1 2
38 07,08,13 111 13 836 07,08 649 3 → 07,08 21.42 0.308 0.01458 1 2
39 07,08,13 111 07 1150 08,13 372 07 → 08, 3 30.7 0.122 0.00456 1 2
Lampiran 13 Valid Rule ANR min_sup 10%, min_conf 10%, dan min_int 0.00001, 0.0001, 0.001, 0.01
No Item
Jumlah Transaksi
Item
Body
Jumlah Transaksi
Body
Head
Jumlah Transaksi
Head
Rule Support CPIR Interest FIPIS IIPIS
1 01,03,06 56 01,06 372 03 1128 0 ,06 → 03 31.68 0.274 0.64657 1 2
2 01,03,07 79 01,03 372 07 1150 0 ,03 → 07 31.65 0.193 0.64615 1 2
3 01,03,07 79 01,07 372 03 1128 0 ,07 → 03 31 0.181 0.65337 1 2
4 01,03,08 151 01,03 372 08 1821 0 ,03 → 08 49.35 0.286 0.44735 1 2
5 01,03,13 73 03,13 702 01 706 03, 3 → 0 18.71 0.132 0.76966 1 2
6 01,03,13 73 01,13 355 03 1128 0 , 3 → 03 31.18 0.192 0.65327 1 2
7 01,06,07 54 06,07 702 01 706 06,07 → 0 19.27 0.166 0.76405 1 2
8 01,06,07 54 01,06 372 07 1150 0 ,06 → 07 32.39 0.295 0.63877 1 2
20 No Item
Jumlah Transaksi
Item
Body
Jumlah Transaksi
Body
Head
Jumlah Transaksi
Head
Rule Support CPIR Interest FIPIS IIPIS
10 01,06,13 43 01,06 372 13 836 0 ,06 → 3 23.43 0.175 0.7385 1 2
11 01,06,13 43 06,13 435 01 706 06, 3 → 0 19.59 0.139 0.77726 1 2
12 01,07,08 124 01,07 372 08 1821 0 ,07 → 08 50.15 0.443 0.43937 1 2
13 01,07,13 60 07,13 649 01 706 07, 3 → 0 19.09 0.147 0.76909 1 2
14 01,07,13 60 01,13 355 07 1150 0 , 3 → 07 32.21 0.259 0.64225 1 2
15 01,07,13 60 01,07 372 13 836 0 ,07 → 3 22.93 0.114 0.74353 1 2
16 01,08,13 110 01,13 372 08 1821 0 , 3 → 08 50.56 0.525 0.43523 1 2
17 03,05 94 05 354 03 1128 05 → 03 30.56 0.102 0.65957 1 2
18 03,06,07 91 03,06 355 07 1150 03,06 → 07 31.29 0.126 0.65141 1 2
19 03,06,07 91 06,07 355 03 1128 06,07 → 03 30.64 0.115 0.65859 1 2
20 03,06,08 162 03,06 372 08 1821 03,06 → 08 49.02 0.222 0.4506 1 2
21 03,06,13 50 03,13 702 06 654 03, 3 → 06 17.85 0.151 0.78142 1 2
22 03,06,13 50 06,13 435 03 1128 06, 3 → 03 31.86 0.328 0.63859 1 2
23 03,06,13 50 03,06 355 13 836 03,06 → 3 23.23 0.141 0.74181 1 2
24 03,07,13 69 03,13 702 07 1150 03, 3 → 07 31.94 0.366 0.61006 1 2
25 03,07,13 69 07,13 649 03 1128 07, 3 → 03 31.29 0.341 0.62313 1 2
26 03,08,13 154 03,13 349 08 1821 03, 3 → 08 49.26 0.21 0.45189 1 2
27 05,07 85 05 354 07 1150 05 → 07 31.47 0.151 0.64973 1 2
28 05,08 147 05 354 08 1821 05 → 08 49.47 0.266 0.44903 1 2
21 No Item
Jumlah Transaksi
Item
Body
Jumlah Transaksi
Body
Head
Jumlah Transaksi
Head
Rule Support CPIR Interest FIPIS IIPIS
30 06,07,13 49 06,13 435 07 1150 06, 3 → 07 32.54 0.344 0.63096 1 2
31 06,07,13 49 06,07 702 13 836 06,07 → 3 23.26 0.235 0.71619 1 2
32 06,08,13 84 06,13 349 08 1821 06, 3 → 08 51.33 0.644 0.4312 1 2
33 07,08,13 111 07,08 649 13 836 07,08 → 3 21.42 0.101 0.73838 1 2
34 07,08,13 111 07,13 349 08 1821 07, 3 → 08 50.53 0.476 0.43918 1 2
35 07,12 115 12 455 07 1150 → 07 30.59 0.132 0.64846 1 2
36 07,13 216 13 836 07 1150 3 → 07 27.6 0.123 0.64004 1 2
37 07,26 117 26 440 07 1150 6 → 07 30.53 0.112 0.65055 1 2
38 08,12 209 12 455 08 1821 → 08 47.64 0.171 0.45129 1 2
39 08,26 191 26 440 08 1821 6 → 08 48.17 0.225 0.44835 1 2
40 08,31 177 31 372 08 1821 3 → 08 48.58 0.135 0.45503 1 2
Lampiran 14 Valid Rule ACNR min_sup 10%, min_conf 10%, dan min_int 0.00001, 0.0001, 0.001, 0.01
No Item
Jumlah Transaksi
Item
Body
Jumlah Transaksi
Body
Head
Jumlah Transaksi
Head
Rule Support CPIR Interest FIPIS IIPIS
1 01,03,08 151 01,03 372 08 1821 0 ,03 → 08 49.35 0.172 0.45573 1 2
2 01,06,08 97 01,06 372 08 1821 0 ,06 → 08 50.95 0.205 0.43977 1 2
3 01,07,08 124 01,07 372 08 1821 0 ,07 → 08 50.15 0.189 0.44775 1 2
4 01,08,13 110 01,13 372 08 1821 0 , 3 → 08 50.56 0.197 0.44361 1 2
22 No Item
Jumlah Transaksi
Item
Body
Jumlah Transaksi
Body
Head
Jumlah Transaksi
Head
Rule Support CPIR Interest FIPIS IIPIS
6 03,07,08 230 03,07 349 08 1821 03,07 → 08 47.02 0.116 0.48221 1 2
7 03,08,13 154 03,13 349 08 1821 03, 3 → 08 49.26 0.162 0.45975 1 2
8 04,08 262 04 507 08 1821 04 → 08 46.07 0.149 0.4701 1 2
9 05,08 147 05 354 08 1821 05 → 08 49.47 0.168 0.457 1 2
10 06,07,08 178 06,07 349 08 1821 06,07 → 08 48.55 0.148 0.46685 1 2
11 06,08,13 84 06,13 349 08 1821 06, 3 → 08 51.33 0.205 0.43907 1 2
12 07,08,13 111 07,13 349 08 1821 07, 3 → 08 50.53 0.189 0.44705 1 2
13 08,12 209 12 455 08 1821 → 08 47.64 0.164 0.46154 1 2
14 08,26 191 26 440 08 1821 6 → 08 48.17 0.171 0.45827 1 2