ARDIANSYAH dan IMAS S. SITANGGANG.
Teknik association rules mining di dalam data mining seringkali menghasilkan aturan asosiasi dalam jumlah banyak yang dapat mengandung aturan-aturan yang berulang, yaitu aturan-aturan yang memberikan informasi yang sama. Penelitian ini menggunakan teknik mining minimal non-redundant association rules untuk menghasilkan aturan asosiasi yang tidak berulang pada data transaksi pembelian barang di Sinar Mart Swalayan selama 2 bulan (1 Maret 2004 – 21 Mei 2004). Konsep closure dalam Galois connection diterapkan dalam teknik minimal non-redundant association rules mining untuk membentuk generators dan frequent closed itemsets menggunakan algoritma Close. Pada penelitian ini dilakukan pembentukan generators dan frequent closed itemsets dengan menggunakan empat nilai minimum support, yaitu 5 %, 2 %, 1 %, dan 0,5 % dari 23.631 transaksi yang ada. Berdasarkan generators dan frequent closed itemsets, dibentuk minimal non-redundant association rules menggunakan 11 nilai minimum confidence, yaitu 75 %, 70 %, 65 %, 60 %, 55 %, 50 %, 45 %, 40 %, 30 %, 20 %, dan 10 %.
Hasil penelitian memperlihatkan bahwa teknik minimal non-redundant association rules mining dapat menghasilkan aturan asosiasi yang tidak berulang dengan antesedan yang minimal dan konsekuen yang maksimal serta mengandung informasi lebih banyak. Di samping itu, waktu eksekusi dan penggunaan sumberdaya komputasi untuk implementasi teknik tersebut lebih efisien. Waktu eksekusi pembentukan minimal non-redundant association rules tercepat adalah 2 detik yang terjadi pada nilai minimum support terbesar, yaitu 5 % sedangkan waktu eksekusi paling lama sekitar 43 detik terjadi pada nilai minimum support terkecil, yaitu 0,5 %.
Data transaksi dalam penelitian ini memiliki sifat data yang tidak padat dan berkorelasi rendah, sehingga algoritma Close membutuhkan waktu eksekusi lebih lama. Semakin kecil nilai minimum support, maka semakin lama waktu yang dibutuhkan untuk membentuk generators dan frequent closed itemsets.
Kata kunci: data mining, aturan asosiasi, lattices, Galois connection, non-redundant
RISA MAISARAH
G64103009
DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
RISA MAISARAH
G64103009
DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
RISA MAISARAH
G64103009
Skripsi
Sebagai salah satu syarat untuk memperoleh gelar
Sarjana Komputer pada
Departemen Ilmu Komputer
DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
ARDIANSYAH dan IMAS S. SITANGGANG.
Teknik association rules mining di dalam data mining seringkali menghasilkan aturan asosiasi dalam jumlah banyak yang dapat mengandung aturan-aturan yang berulang, yaitu aturan-aturan yang memberikan informasi yang sama. Penelitian ini menggunakan teknik mining minimal non-redundant association rules untuk menghasilkan aturan asosiasi yang tidak berulang pada data transaksi pembelian barang di Sinar Mart Swalayan selama 2 bulan (1 Maret 2004 – 21 Mei 2004). Konsep closure dalam Galois connection diterapkan dalam teknik minimal non-redundant association rules mining untuk membentuk generators dan frequent closed itemsets menggunakan algoritma Close. Pada penelitian ini dilakukan pembentukan generators dan frequent closed itemsets dengan menggunakan empat nilai minimum support, yaitu 5 %, 2 %, 1 %, dan 0,5 % dari 23.631 transaksi yang ada. Berdasarkan generators dan frequent closed itemsets, dibentuk minimal non-redundant association rules menggunakan 11 nilai minimum confidence, yaitu 75 %, 70 %, 65 %, 60 %, 55 %, 50 %, 45 %, 40 %, 30 %, 20 %, dan 10 %.
Hasil penelitian memperlihatkan bahwa teknik minimal non-redundant association rules mining dapat menghasilkan aturan asosiasi yang tidak berulang dengan antesedan yang minimal dan konsekuen yang maksimal serta mengandung informasi lebih banyak. Di samping itu, waktu eksekusi dan penggunaan sumberdaya komputasi untuk implementasi teknik tersebut lebih efisien. Waktu eksekusi pembentukan minimal non-redundant association rules tercepat adalah 2 detik yang terjadi pada nilai minimum support terbesar, yaitu 5 % sedangkan waktu eksekusi paling lama sekitar 43 detik terjadi pada nilai minimum support terkecil, yaitu 0,5 %.
Data transaksi dalam penelitian ini memiliki sifat data yang tidak padat dan berkorelasi rendah, sehingga algoritma Close membutuhkan waktu eksekusi lebih lama. Semakin kecil nilai minimum support, maka semakin lama waktu yang dibutuhkan untuk membentuk generators dan frequent closed itemsets.
Kata kunci: data mining, aturan asosiasi, lattices, Galois connection, non-redundant
Menyetujui:
Pembimbing I, Pembimbing II,
Firman Ardiansyah, S.Kom, M.Si. Imas S. Sitanggang, S.Si.,M.Kom
NIP 132 311 919 NIP 132 206 235
Mengetahui:
Dekan Fakultas Matematika dan Ilmu Pengetahuan Alam
Institut Pertanian Bogor
Dr. drh. Hasim, DEA
NIP 131 578 806
lulus dari SMUN 1 Tapaktuan, Aceh Selatan dan diterima menjadi mahasiswa Departemen Ilmu Komputer Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor melalui jalur Undangan Seleksi Masuk IPB (USMI). Pada tahun 2007, Penulis berkesempatan menjalankan Praktik Kerja Lapangan (PKL) di Pusat Penelitian dan Pengembangan Perkebunan, Bogor selama kurang lebih dua bulan.
Alhamdulillaahi rabbil ‘aalamin dengan memanjatkan puji syukur kehadirat Allah SWT atas segala rahmat dan hidayah-Nya, sehingga penulis dapat menyelesaikan skripsi dengan judul Pembentukan Minimal Non-Redundant Association Rules menggunakan frequent closed itemsets pada Data Transaksi Swalayan. Shalawat serta salam juga penulis sampaikan kepada junjungan Nabi besar Muhammad SAW beserta seluruh keluarganya, sahabatnya, dan kita semua sebagai generasi penerusnya hingga akhir zaman.
Penulis mengucapkan terima kasih banyak kepada Bapak Firman Ardiansyah, S.Kom, M.Si. selaku pembimbing 1 dan Ibu Imas S. Sitanggang, S.Si.,M.Kom selaku pembimbing 2 yang telah banyak membantu dan memberikan saran yang bermanfaat serta arahan dalam proses penyelesaian skripsi. Terima kasih juga penulis ucapkan kepada dosen penguji atas kesediaannya untuk menguji dalam masa seminar dan sidang serta saran dan masukannya. Di samping itu, penulis juga ingin mengucapkan terima kasih kepada:
1 Mama dan almarhum Ayah tercinta yang selalu memberikan kasih sayang, doa, dan motivasi yang tidak pernah putus.
2 Ibu Yul, almarhumah Bapak Hatta, Papa Is, Anda Esy, dan Bang Meiby serta keluarga besar di Banda Aceh dan Tapaktuan atas semua perhatian dan dukungannya yang telah diberikan selama ini.
3 Kak Rini dan Bang Eyuu tercinta yang selalu memberikan perhatian, motivasi, dan doa yang tidak pernah putus.
4 Keluarga besar penulis yang berada di Jakarta atas perhatian dan dukungannya.
5 Teman-teman seperjuangan di Ilkom 40 Eggy, Anti, Tessy, Nanik, Ratih, Wisyu, Ocha, dan Chita serta semua ilkomerz 40 terima kasih atas perhatian, kerja sama, dan bantuannya selama penulis kuliah di IPB.
6 Teman-teman di Wisma Green House Eggy, Kak Eka, Mbak Yuyun, Mbak Nani, Mbak Rahmae, Rahma, Melly, Fitri, Restu, Nana, Mira, Umi, dan Evi atas kesabaran, perhatian, bantuan dan motivasinya selama ini.
7 Teman-teman terbaik di Banda Aceh dan Tapaktuan yang selalu memberikan perhatian dan motivasi.
8 Departemen Ilmu Komputer, staf, dan dosen yang telah banyak membantu penulis selama masa perkuliahan dan penelitian.
9 Semua pihak yang telah banyak membantu penulis dalam menyelesaikan perkuliahan di Ilmu Komputer IPB.
Penulis mohon maaf jika ada kekurangan-kekurangan yang terdapat dalam skripsi ini. Penulis berharap semoga skripsi ini dapat bermanfaat bagi perkembangan dunia ilmu pengetahuan di Indonesia.
Bogor, April 2008
Penulis
DAFTAR TABEL...vi
DAFTAR GAMBAR ...vi
DAFTAR LAMPIRAN ...vi
PENDAHULUAN...1
Latar Belakang ...1
Tujuan ...1
Ruang Lingkup...1
Manfaat Penelitian...1
TINJAUAN PUSTAKA...1
Knowledge Discovery in Database (KDD) ...1
Data Mining...2
Minimal Non-Redundant Association Rules...2
Galois Connection...3
Lift...4
METODE PENELITIAN...4
Metode Penelitian...4
Lingkungan Pengembangan Sistem ...6
Perancangan Basis Data ...6
HASIL DAN PEMBAHASAN ...7
Pembentukan Frequent Closed Itemsets...7
Pembentukan Minimal Non-Redundant Association Rules...9
Hasil Perbandingan Minimal Non-Redundant Association Rules Mining dengan Association Rules Mining pada Penelitian Widodo (2004)...11
KESIMPULAN DAN SARAN ...12
Kesimpulan ...12
Saran...12
DAFTAR PUSTAKA ...12
LAMPIRAN...13
2 Pembentukan frequent closed itemsets (FC)...8
3 Pembentukan large itemset...8
4 Jumlah minimal non-redundant association rules...9
5 Jumlah aturan asosiasi...9
6 Minimal non-redundant association rules dengan nilai confidence terbesar ...10
7 Aturan asosiasi dengan nilai confidence terbesar ...10
DAFTAR GAMBAR
Halaman 1 Tahapan dalam KDD (Han & Kamber 2006)...22 Basis data D dan closed itemset lattice dari D...3
3 Bagan alir minimal non-redundant association rules mining...7
4 Grafik waktu eksekusi...8
5 Waktu eksekusi pembentukan MNRAA dan AA dari (a) minsup 5 %, (b) minsup 2 %, (c) minsup 1 %, dan (d) minsup 0,5 %...9
6 Total waktu eksekusi minimal non-redundant association rules mining...11
7 Total waktu eksekusi association rules mining...11
DAFTAR LAMPIRAN
Halaman 1 Daftar properti tabel ...152 Tabel daftar kelompok barang...17
3 Data hasil kandidat FC dan FC dengan nilai minsup 5 %, 2 %, 1 %, dan 0,5 % ...18
4 Minimal non-redundant association rules (MNRAA) ...39
5 Minimal non-redundant association rules (MNRAA)yang memiliki korelasi positif ...45
6 Minimal non-redundant association rules (MNRAA)yang memiliki korelasi negatif ...51
PENDAHULUAN
Latar Belakang
Perkembangan yang cepat dalam teknologi pengumpulan dan penyimpanan data telah memudahkan organisasi untuk mengumpulkan sejumlah data berukuran besar, sehingga menghasilkan tumpukan data. Konsep data mining digunakan untuk mengelola tumpukan data menjadi suatu pengetahuan yang berharga, sehingga dapat diaplikasikan dalam berbagai bidang, di antaranya dalam bidang bisnis dan kedokteran.
Data mining merupakan proses ekstraksi informasi atau pola yang penting dalam basis data berukuran besar. Salah satu teknik data mining adalah metode association rule mining
yang berguna untuk menemukan aturan asosiasi pada basis data. Pada dasarnya aturan asosiasi digunakan untuk menggambarkan keterkaitan antar item pada sekumpulan data (Han & Kamber 2006).
Penerapan association rules dapat
dicontohkan pada analisis pembelian di suatu pasar swalayan, sehingga dapat diketahui berapa besar kemungkinan seorang pelanggan membeli roti bersamaan dengan susu. Dengan pengetahuan tersebut, pemilik pasar swalayan dapat mengatur penempatan barang atau merancang kampanye pemasaran dengan memakai kupon diskon untuk kombinasi barang tertentu.
Teknik association rules mining seringkali menghasilkan aturan asosiasi dalam jumlah banyak. Menurut Bastide et al. (2000), aturan asosiasi yang berjumlah banyak dapat mengandung aturan-aturan yang tidak relevan (minimal anteseden dan maksimal konsekuen) dan aturan yang berulang, yaitu aturan–aturan yang memberikan informasi yang sama.
Penelitian ini menerapkan teknik minimal non-redundant association rulesmining untuk menghasilkan aturan asosiasi yang tidak berulang menggunakan konsep closure dalam
Galois connection. Algoritma Close
digunakan untuk mengekstrak generators dan
frequent closed itemsets. Berdasarkan
generators dan frequent closed itemsets yang didapat akan dibentuk minimal non-redundant association rules (Bastide et al. 2000).
Minimal non-redundant association rules
mempresentasikan aturan dengan anteseden yang minimal dan konsekuen yang maksimal tanpa mengurangi informasi yang terkandung dalam data yang ditambang. Berdasarkan sudut pandang pengguna, aturan asosiasi yang
tidak berulang dengan anteseden yang minimal dan konsekuen yang maksimal menjadi bentuk aturan asosiasi paling relevan dan berguna (Bastide et al. 2000).
Tujuan
Tujuan penelitian ini adalah:
1 menerapkan konsep closure dari Galois connection untuk membentuk generators dan frequent closed itemsets
menggunakan algoritma Close (Pasquier 1998),
2 membentuk minimal non-redundant
association rules menggunakan
generators dan frequent closed itemsets,
3 membandingkan hasil dan waktu eksekusi pada minimal non-redundant association rules mining dengan association rules mining dalam penelitian sebelumnya (Widodo 2004).
Ruang Lingkup
Ruang lingkup penelitian ini dibatasi pada penggunaan konsep closure dalam Galois connection untuk mendapatkan minimal non-redundant association rules. Penelitian ini menggunakan data transaksi yang sama dengan penelitian Widodo (2004), yaitu data transaksi pembelian barang di Sinar Mart Swalayan selama 2 bulan (1 Maret 2004 – 21 Mei 2004).
Manfaat Penelitian
Hasil penelitian diharapkan dapat
memberikan minimal non-redundant
association rules yang paling relevan dan berguna serta mudah dipahami oleh pengguna.
TINJAUAN PUSTAKA
Knowledge Discovery in Database (KDD) Knowledge Discovery in Database (KDD) adalah proses untuk menemukan pengetahuan dari suatu basis data yang terdiri atas urutan langkah-langkah yang dapat dilihat pada Gambar 1 (Han & Kamber 2006).
Menurut Han & Kamber (2006), tahapan proses KDD adalah:
1 Pembersihan Data
Gambar 1 Tahapan dalam KDD (Han & Kamber 2006).
2 Seleksi Data
Proses seleksi data mengambil data yang relevan digunakan untuk proses analisis. 3 Transformasi Data
Proses ini mentransformasikan atau menggabungkan data ke dalam bentuk yang tepat untuk ditambangdengan cara melakukan peringkasan atau operasi agregrasi.
4 Data Mining
Data mining merupakan proses yang penting, di mana metode-metode cerdas diaplikasikan untuk mengekstrak pola-pola dalam data.
5 Evaluasi Pola
Evaluasi pola diperlukan untuk
mengidentifikasi pola-pola yang menarik dalam merepresentasikan pengetahuan. 6 Presentasi Pengetahuan
Penggunaan visualisasi dan teknik representasi untuk menunjukkan pengetahuan hasil penggalian gunung data kepada pengguna.
Data Mining
Data mining merupakan proses ekstraksi informasi atau pola yang penting dalam basis data berukuran besar. Beberapa teknik di dalam data mining antara lain: clustering, classification, association rule mining, dan
anomaly detaction. Association rule mining
digunakan untuk mencari hubungan menarik di antara items dalam suatu himpunan data (Han & Kamber 2006).
Ukuran objektif yang dapat digunakan untuk menemukan aturan asosiasi adalah nilai
support dan confidence. Support adalah persentase kombinasi item dalam basis data dan confidence merupakan nilai persentase dari hubungan antar item dalam aturan asosiasi.
dari basis data transaksi, Txy adalah himpunan dari banyak transaksi yang mengandung himpunan item data X dan Y. Tx adalah himpunan dari transaksi yang mengandung
item data X maka support dan confidence dari aturan asosiasi X → Y didefinisikan sebagai berikut:
Support = xy
T
S
Confidence =xy
x
T
T
Minimal Non-Redundant Association Rules Sebuah aturan asosiasi dikatakan berulang jika terdapat aturan asosiasi lain yang memberikan informasi yang sama sehingga aturan asosiasi tersebut menjadi tidak efektif (Bastide et al. 2000). Aturan asosiasi yang berulang dicontohkan sebagai berikut:
NO Aturan Asosiasi Support Confidence
1 A → B 33 % 66 %
2 A → B, C 33 % 66 %
3 A → B, C, E 33 % 66 %
Berdasarkan contoh di atas, ketiga aturan asosiasi tersebut berulang karena tidak memberikan tambahan informasi bagi pengguna. Hanya aturan asosiasi A → B, C, E yang paling relevan dan berguna untuk ditampilkan pada pengguna karena memiliki anteseden yang minimal dan konsekuen yang paling maksimal dan mengandung keseluruhan informasi dari ketiga aturan.
Aturan asosiasi yang berulang sering terdapat pada data yang bersifat dense (padat) dan memiliki korelasi data yang tinggi. Data yang padat memiliki nilai null yang sedikit, sehingga korelasi di dalam data kuat. Dalam data transaksi, korelasi terjadi pada transaksi dan item dalam data.
Menurut Bastide et al. (2000), sebuah aturan asosiasi r : l1 → l2 adalah minimal
non-redundant association rules jika dan hanya jika tidak ada aturan asosiasi lain r’ : l’1 → l’2 dengan support(r) = support(r’), confidence(r) = confidence(r’), l’1⊆ l1, dan l2 ⊆ l’2. Aturan asosiasi terbagi menjadi dua jenis, yaitu (Bastide et al. 2000):
1 Exact association rules adalah aturan asosiasi yang memiliki nilai confidence = 100 % dengan bentuk aturan asosiasi adalah r : l1
⇒
l2.2 Approximate association rules adalah aturan asosiasi yang memiliki nilai
Algoritma Close (Bastide 2000) digunakan untuk menghasilkan generators dan frequent closed itemsets yang memenuhi syarat
minimum support (minsup). Minimal non-redundant association rules membentuk exact association rules dan approximate association rules menggunakan generators dan frequent closed itemsets yang memenuhi syarat
minimum confidence (mincof ).
Minimal non-redundant association rules
meminimalkan jumlah aturan asosasi yang berulang dengan tetap memaksimalkan kuantitas dan kualitas informasi yang
dihasilkan. Minimal non-redundant
association rules menampilkan aturan asosiasi yang meliputi semua item yang ada dalam basis data.
Galois Connection
Galois connection ditemukan oleh ahli matematika dari Prancis bernama Evariste Galois. Galois connection didefinisikan sebagai hubungan antara dua item berbeda yang saling berhubungan satu sama lain dalam sebuah aplikasi. Konsep closure dalam Galois connection adalah suatu konsep hubungan antara dua item berbeda karena memiliki kesamaan (Priss 2006).
Dalam konteks datamining terdapat notasi untuk basis data D = ( , , R), dengan
adalah himpunan transaksi, adalah
himpunan item dalam basis data, dan R ⊆
Χ adalah suatu hubungan dalam nilai biner antara transaksi dan item. Setiap pasangan (o,
i)
∈
R menyatakan transaksi o∈
memilikiitemi
∈
(Pasquier et al. 1999).Berdasarkan pengertian konteks data mining, dijelaskan beberapa definisi yang berhubungan dengan mining minimal non-redudant association rules (Pasquier et al. 1999), yaitu:
Definisi 1 (Galois connection)
Diketahui D = ( , , R) dengan O ⊆
dan I ⊆ maka didefinisikan:
f(O) : 2 → 2
f(O) = {i
∈
|∀o∈
O, (o, i)∈
R}g(I) : 2 → 2
g(I) = {o
∈
|∀i∈
I, (o, i)∈
R}f(O) berasosiasi dengan O yang
mengandung item untuk semua transaksi
o
∈
O dan g(I) berasosiasi dengan I di mana transaksi mengandung semua item i∈
I. Pasangan aplikasi (f, g) merupakan Galois connection antara himpunan kuasa dari dengan himpunan kuasa dari . Dimisalkanuntuk semua I, I1, I2 ⊆ dan O, O1, O2 ⊆ memiliki sifat-sifat sebagai berikut: (1) I1 ⊆ I2
⇒
g(I1)⊇
g(I2) (1’) O1 ⊆ O2⇒
f(O1)⊇
f(O2) (2) O ⊆ g(I)⇔
I ⊆ f(O)Definisi 2 (Galois closure operator)
Operator h = f g untuk 2 dan h’ = g f untuk 2 disebut Galois closure operator. Diketahui suatu Galois connection (f, g) dengan memiliki sifat-sifat sebagai berikut: Perluasan: (3) I ⊆ h(I)
(3’) O ⊆ h’(O) Persamaan: (4) h(h(I)) = h(I) (4’) h’(h’(O)) = h’(O)) Monoton: (5) I1 ⊆ I2
⇒
h(I1) ⊆ h(I2)(5’) O1 ⊆ O2
⇒
h’(O1) ⊆ h’(O2)Definisi 3 (Closed itemsets)
Diketahui itemset C ⊆ dalam D adalah
closed itemset jika dan hanya jika h(C) = C.
Closed itemset yang paling minimal mengandung itemset I untuk h(I), h(I) disebut
closure dari I.
Definisi 4 (Closed itemset lattice)
Diketahui adalah himpunan dari closed itemset di dalam D yang didapat menggunakan
Galois closure operators. = ( , ≤) adalah
lattice yang kompleks disebut closed itemset lattice. Struktur dasar lattice memiliki dua ciri, yaitu:
1 Urutan elemen latticeC1, C2 ⊆ adalah
C1 ≤ C2 jika hanya jika C1 ⊆ C2.
2 memiliki batas atas dari fungsi join
dan batas bawah dari fungsi meet
terhadap elemen. Dimisalkan S ⊆
maka fungsi join dan meet terhadap elemen-elemen didefinisikan sebagai berikut:
Join (S) = h( ) Meet (S) =
C S C ∈
∪
C S C ∈∩
OID Item
1 A C D
2 B C E
3 A B C E
4 B E
5 A B C E
Gambar 2 DatasetD dan closed itemset lattice dari D.
digunakan untuk menemukan frequent closed itemset.
Definisi 5 (Frequent closed itemset)
Closed itemset C adalah frequent closed itemset jika support(C) ≥ minsup.
Definisi 6 (Generator) (Bastide et al. 2000) Sebuah itemset g dengan g ⊆ adalah
generator yang minimal dari closed itemsetl
jika dan hanya jika h(g) = l dan tidak ada g’⊆ dengan g’ g sehingga h(g’) = l. Urutan
generator dinotasikan sebagai i sehingga disebut i-generator.
⊂
Lift
Aturan asosiasi yang memenuhi nilai
minsup dan mincof, terkadang bisa menjadi aturan asosiasi yang menyesatkan bagi
pengguna. Aturan asosiasi A → B bisa
menyesatkan jika ternyata pembelian item A tidak diikuti dengan pembelian item B. Oleh sebab itu, digunakan suatu cara untuk mendapatkan aturan asosiasi yang tidak menyesatkan dengan mencari nilai korelasi antar data itemsets.
Pembelian itemset A adalah independent
terhadap pembelian itemset B jika P(A B) = P(A)P(B). Jika P(A B) ≠ P(A)P(B) maka pembelian itemset A dan B adalah dependent
dan saling berhubungan dalam transaksi yang sama. Menurut Han & Kamber (2006), korelasi antara pembelian A dan B dapat ditulis sebagai:
∪
∪
corrA,B = ( )
( ) ( )
P A B P A P B
∪
Nilai korelasi corrA,B sama dengan nilai
P(B|A)/P(B) yang disebut juga dengan lift dari aturan asosiasi A → B. Jika nilai corrA,B < 1
maka aturan asosiasi A → B memiliki korelasi negatif yang berarti pembelian item A tidak diikuti dengan pembelian item B. Aturan asosiasi A → B memiliki korelasi positif jika nilai corrA,B > 1, hal ini berarti pembelian item
A akan diikuti dengan pembelian item B.
Itemsets A dan B adalah independent dan tidak memiliki korelasi di antara A dan B jika nilai corrA,B = 1.
METODE PENELITIAN
Metode Penelitian
Metode yang digunakan dalam penelitian ini mengacu pada bagian datamining sebagai
salah satu tahapan proses Knowledge
Kamber 2006) yang meliputi:
1 Praproses Data
Praproses data meliputi pembersihan data, integrasi data, seleksi data dan transformasi data. Hasil praproses data tersebut berupa data yang dapat ditambang. Penelitian ini menggunakan data yang telah melalui tahap praproses dalam penelitian sebelumnya (Widodo 2004).
2 Data Mining
Dalam mencari minimal non-redudant
association rules, proses mining dibagi menjadi dua tahap, yaitu pembentukan
frequent closed itemsets dan pembentukan
minimal non-redundant association rules.
Pembentukan Frequent Closed Itemsets Pembentukan himpunan frequent closed itemsets (FCi) yang memenuhi minsup dilakukan dengan terlebih dahulu membentuk himpunan kandidat frequent closed itemsets
(FCCi). Himpunan FCCi terdiri dari generator,
closed itemset (closure), dan support dari
closure. Langkah ini dilakukan dengan iterasi
untuk mencari semua himpunan FC yang
memiliki kardinalitas dari 1 sampai i (i
-generator), pencarian berhenti jika tidak terbentuk lagi generator baru.
Pembentukan frequent closed itemsets
dilakukan dengan menggunakan Algoritma
Close sebagai berikut (Pasquier et al. 1998):
Generators in FCC1 = {1-itemsets}; for (i = 1;FCCi.generator • Ø;i++) do begin
closures in FCCi = Ø; supports in FCCi = 0; FCCi = Gen-Closure(FCCi);
forall candidate closed itemsets
c
∈
FCCi do beginif(c.support • minsupport)then FCi = FCi
∪
cend
FCCi+1 = Gen-Generator(FCi); end
Answer FC = 1 (FC
1
j i
j
= − =
∪
j.closure,FCj.support);
Berdasarkan algoritma di atas, pada awal iterasi, FCC1 merupakan himpunan kandidat 1-generators berdasarkan urutan 1-itemsets.
Setiap 1-generator akan mengalami
penelusuran dalam basis data untuk mencari
closure-nya dan support dari closure
menggunakan fungsi Gen-Closure. Fungsi
Gen-Closure akan menghasilkan himpunan
FCC1, setiap closurec dengan c
∈
FCC1 yangmemenuhi minsup masuk dalam himpunan
Berdasarkan 1-generator dalam FC1, maka dibentuklah himpunan kandidat 2-generator
untuk FCC2 menggunakan fungsi
Gen-Generator. Pada iterasi kedua, proses yang sama pada iterasi pertama dilakukan terhadap
FCC2. Iterasi pada algoritma Close akan berhenti jika tidak terbentuk lagi kandidat
generator baru.
Secara lebih detail, fungsi-fungsi yang ada pada algoritma Close dijelaskan sebagai berikut (Pasquier et al. 1998):
a.Fungsi Gen-Closure
Pada fungsi ini dilakukan pencarian
closure dan support dari closure untuk setiap
i-generator pada FCCi. Algoritma untuk fungsi Gen-Closure sebagai berikut:
forall objects o
∈
O do beginGo = Subset(FCCi.generator, f({o}));
forall generators p
∈
Go
do begin
if (p.closure = Ø) then p.closure = f({o}); else p.closure = p.closure
∩
f({o}); p.support++; end
end
Answer =
∪
{c∈
FCCi|c.closure • Ø};Pencarian closure dimulai dengan
membentuk Go, yaitu himpunan subsets
generators berdasarkan subsets dari itemset
dalam transaksi f({o}). Proses penelusuran dalam Go dilakukan untuk mencari closure dan
support dari closure tiap generator. b.Fungsi Gen-Generator
Pada fungsi ini dilakukan pembentukan kandidat himpunan generators baru untuk
FCC. Algoritma untuk fungsi Gen-Generator
sebagai berikut:
insert into FCCi + 1.generator
select p.item1, p.item2,..., p.itemi,
q.item i
from FCi.generator p,FCi.generatorq where p.item1 = q.item1,...,
p.itemi – 1 = q.itemi – 1,
p.itemi < q.itemi;
forall generators
p
∈
FCCi + 1.generator do beginforall i-subsets s of p do begin if (s
∉
FCi.generator) then delete p from FCCi+1.generator; endend
forall generators
p
∈
FCC
i + 1.generator do begin
Sp = Subset (FCCi.generator,p); forall s
∈
Sp do beginif (p ⊆ s.closure) then
delete p from FCCi+1.generator;
end end
Pembentukan himpunan (i+1)-generator
baru untuk FCCi+1 dilakukan dengan
menggabungkan himpunan i-generator p dan
q di dalam FCi yang memiliki p.item1 =
q.item1 dengan p.itemi < q.itemi. Himpunan
(i+1)-generator pada FCCi+1 akan mengalami
dua proses pruning (pemangkasan) pada
fungsi ini.
Proses pruning pertama dilakukan terhadap (i+1)-generator, jika i-subset pada (i
+1)-generator tidak ada pada himpunan
generators dalam FCi. Proses pruning kedua
dilakukan terhadap (i+1)-generator, jika (i
+1)-generator adalah subset atau sama dengan
closure dari i-generator yang ada pada himpunan generators dalam FCCi.
Pembentukan Minimal Non-Redundant Association Rules
Himpunan frequent closed itemsets (FCi)
yang telah dibentuk pada tahap satu digunakan
untuk membentuk minimal non-redundant
association rules. Minimal non-redundant association rules terdiri dari exact association rules dan approximate association rules.
Pembentukan exact association rules dan
approximate association rules dilakukan melalui dua proses pembentukan yang berbeda (Bastide et al. 2000), yaitu:
a Pembentukan exact association rules Exact association rule r: l1
⇒
(l2 \ l1) merupakan aturan asosiasi antara itemsetl1 danl2 dengan h(l1) = h(l2). Berdasarkan h(l1) =
h(l2) dianggap l1
⊂
l2, sehingga support (l1) =support (l2) dan nilai confidence = 1 atau 100%. Exact association rules dibentuk menggunakan Algoritma Gen-GB (Bastide et al. 2000) sebagai berikut:
Input: himpunan dari FCi
Output: himpunan dari GB yaitu exact association rules GB • {}
forall set FCi
∈
FC do beginforall i-generator g
∈
FCi such
that g • h(g) do begin GB • GB {(r:g (h(g)\g),
h(g).support)};
∪
⇒
end end
return GB;
b Pembentukan approximate association rules Approximate association rule r: l1 → (l2 \ l1) merupakan aturan asosiasi antara itemset
sebagai berikut:
µ = ukuran maksimal FCi minconfidence = mincof
Succg= himpunan supersets dari h(g) Input: himpunan FCidan nilai
minconfidence
Output: himpunan dari RI yaitu approximate association rules
RI • {}
for (i • 1;i •
µ
- 1;i++) do begin forall i-generator g∈
FCido begin Succg • {};for (j = |h(g)|;j •
µ
;j++)do begin
S
j • {f
∈
FC|f⊃
h(g)∧
|f|=j};end
for (j=|h(g)|;j •
µ
; j++) do beginforall frequent closed itemset
f
∈
Sj do beginif ( s
∈
Succg|s
⊂
f)then do begin
Succg • Succg
∪
f ; r.confidence •f.support/g.support; if(r.confidence •
minconfidence)then RI • RI {r : g • (f \ g), r.confidence, f.support};
∪
endif end end end endreturn RI;
3 Evaluasi Pola
Evaluasi pola yakni melakukan pencarian aturan asosiasi yang menarik dan tidak
misleading (menyesatkan). Tahap ini
dilakukan pada minimal non-redundant
association rules yang telah dihasilkan berdasarkan nilai lift dari minimal non-redundant association rules.
4 Presentasi Pengetahuan
Presentasi pengetahuan merupakan tahap akhir di mana hasil evaluasi pola minimal non-redundant association rules yang telah dihasilkan ditampilkan dalam bentuk tabel.
Tabel memuat minimal non-redundant
association rules, nilai support dan confidence.
Lingkungan Pengembangan Sistem
Lingkungan pengembangan sistem ini adalah sebagai berikut:
Perangkat keras:
• prosesor: Intel Pentium IV, 2.4 Ghz,
• memori: 256 MB RAM,
• harddisk dengan kapasitas 80 GB,
, dan
ra k:
i: Microsoft Windows XP
• soft Access 2003, dan
0.
akan adalah basis dat ini ata erangan • keyboard • monitor. Pe ngkat luna
• sistem operas
Professional, DBMS: Micro
• bahasa pemrograman: Visual Basic 6.
Perancangan Basis Data
Basis data yang digun
a pada penelitian Widodo (2004). Pada penelitian ini dilakukan beberapa perubahan dalam basis data sebelumnya untuk kepentingan implementasi Algoritma Close, Algoritma Gen-GB, dan Algoritma Gen-RI.
Basis data yang digunakan dalam sistem terdiri dari sembilan tabel yang dapat dilihat pada Tabel 1, properti dari setiap tabel terdapat pada Lampiran 1.
Tabel 1 Tabel dalam basis d
Nama Tabel Ket
tblTransaksiAsli Data hasil transaksi
tblKelBarang Data kelompok barang
tblTransaksiReduksi Data hasil proses
selection
tblCleanTransaksi Data hasil proses
cleaning
tblBiner Data hasil proses
integration dan
transformation
tblCGenerator Data kandiat
generators
tblGenClosure Data kandidat
frequent closed itemsets
tblClosure Data frequent closed
itemsets
tblBantu Data et dari
r subs
kandidat generato
tblResult Data hasil proses
mining
Penelitian ini melakukan pencarian
min
ian Widodo (2004), data pra
imal non-redundant association rules
(MNRAA) berdasarkan urutan proses dalam bagan alir minimal non-redundant association rules mining yang ditampilkan pada Gambar 3. Penelitian ini menggunakan hasil praproses yang telah dihasilkan penelitian sebelumnya (Widodo 2004).
Pada penelit
proses menghasilkan 35 jenis kelompok barang (Lampiran 2) dan 23.631 record. Pencarian minimal non-redundant association rules dilakukan melalui dua tahap, yaitu:
Gambar 3 Bagan alir minimal non- redundan
1 Pembentukan Frequent Closed itemsets
s
(FC e
kan
FC
Redundant
h frequent closed
item be
kan minimal non-red
roses pem
n terhadap kedua pendekatan ini (as
osed Itemsets
ng me
t association rules mining.
Pembentukan frequent closed itemset
) dilakukan d ngan membentuk kandidat
frequent closed itemsets (FCC). FCC yang memenuhi nilai minsup akan menjadi FC.
Pada penelitian ini dilakukan pembentu dengan menggunakan empat nilai minsup, yaitu 5 %, 2 %, 1 %, dan 0,5 % dari 23.631 transaksi yang ada. Empat nilai minsup
tersebut dipilih untuk mendapatkan variasi jumlah kandidat FC dan FC.
2 Pembentukan Minimal Non-Association Rules
Setelah diperole
sets, kemudian dilakukan pem ntukan
minimal non-redundant association rules.
Pembentukan minimal non-redundant
association rules dilakukan menggunakan 11 nilai mincof, yaitu 75 %, 70 %, 65 %, 60 %, 55 %, 50 %, 45 %, 40 %, 30 %, 20 %, dan 10 %. Nilai–nilai mincof tersebut digunakan untuk mengetahui nilai maksimum confidence
dari aturan asosiasi pada empat nilai minsup
yang telah dicobakan. Penelitian membanding
undant association rules mining dengan
association rules mining pada penelitian sebelumnya (Widodo 2004). Perbandingan dilakukan terhadap waktu eksekusi pembentukan dan jumlah kandidat FC dan FC
yang memenuhi minsup dengan waktu
eksekusi pembentukan dan jumlah kandidat
itemset dan large itemset yang memenuhi
minsup pada penelitian Widodo (2004). Perbandingan juga dilakukan pada p
bentukan aturan asosiasi. Waktu eksekusi
pembentukan dan jumlah minimal
non-redundant association rules yang memenuhi
mincof dengan waktu eksekusi pembentukan dan jumlah aturan asosiasi yang memenuhi
mincof pada penelitian sebelumnya (Widodo 2004).
Percobaa
sociation rules mining dan minimal non-redundant association rules mining) dilakukan di lingkungan sistem dan data transaksi yang sama. Nilai-nilai minsup dan mincof yang akan dicobakan juga sama.
Pembentukan Frequent Cl
Jumlah kandidat FC dan FC ya
menuhi empat nilai minsup yang dicobakan menggunakan Algoritma Close, disajikan pada Tabel 2. Data generator, closed itemset
(closure) dan support dari closure dalam
dapat dilihat pada Lampiran 3.
Tabel 2 Pembentukan frequent closed itemsets (FC)
Minsup (%) Parameter
5 2 1 0,5
Kandidat FC1 35 35 35 35
FC1 13 19 24 30
Kandidat FC2 78 171 276 435
FC2 2 11 37 87
Kandidat FC3 - 5 93 407
FC3 - - 5 34
Kandidat FC4 - - - 22
FC4 - - - -
Hasil pembentukan kandidat FC dan FC
dibandingkan dengan hasil pembentukan
kandidat itemset dan large itemset
menggunakan algoritma Apriori dari
penelitian sebelumnya (Widodo 2004). Jumlah kandidat itemset dan large itemset yang memenuhi empat nilai minsup yang dicobakan dapat dilihat pada Tabel 3.
Tabel 3 Pembentukan large itemset Minsup (%) Parameter
5 2 1 0,5
Kandidat 1-itemset 35 35 35 35
Large 1-itemset 13 19 24 30
Kandidat 2-itemset 78 171 276 435
Large 2-itemset 2 11 37 87
Kandidat 3-itemset - 5 93 407
Large 3-itemset - - 5 34
Kandidat 4-itemset - - - 23
Large 4-itemset - - - -
Grafik waktu eksekusi pembentukan kandidat FC dan FC (algoritma Close), dan pembentukan kandidat itemset dan large itemset (algoritma Apriori) untuk empat nilai
minsup yang dicobakan, dapat dilihat pada Gambar 4. 0 100 200 300 400 500 600
5 2 1 0,5
Minsup (%) W akt u ( de ti k) Apriori Close
Gambar 4 Grafik waktu eksekusi.
Berdasarkan data pada Tabel 2 dan Tabel 3 dapat dapat dinyatakan bahwa jumlah
terbentuk sama kecuali pada minsup 0,5 %. Algoritma Close membentuk 22 kandidat FC4 sedangkan algoritma Apriori menghasilkan 23 kandidat 4-itemset.
Perbedaan hasil pada kandidat FC4, disebabkan proses pemangkasan (pruning) kedua pada generator dalam pembentukan kandidat FC4. Generator {003, 008, 009, 025} adalah subset dari atau sama dengan closed itemset dari generator {003, 009, 025} dalam
FC3.
Jumlah FC dari kandidat FC dan jumlah
large itemset dari kandidat itemset yang
memenuhi keempat nilai minsup sama.
Algoritma Close menghasilkan FC yang identik dengan hasil large itemset dari algoritma Apriori.
Hasil algoritma Close berupa kandidat FC
dan FC identik dengan hasil algoritma Apriori
berupa kandidat itemset dan large itemset. Hal ini disebabkan data transaksi yang ditambang bersifat sparse (jarang) atau tidak padat. Data transaksi yang digunakan dalam penelitian ini bersifat tidak padat karena banyak mengandung nilai null. Data transaksi yang jarang mengakibatkan korelasi dalam data lemah.
Data transaksi yang bersifat jarang dan berkorelasi rendah mempengaruhi hasil dari algoritma Close dimana hasil closed itemsets
dari generator adalah generator itu sendiri. Oleh sebab itu, kedua proses pruning dalam algoritma Close tidak bisa memperkecil iterasi proses pembentukan set FC dan memperkecil jumlah kandidat FC dan FC yang terbentuk.
Grafik pada Gambar 4 menunjukkan waktu eksekusi algoritma Close lebih lama dibandingkan waktu eksekusi algoritma
Apriori. Algoritma Close membutuhkan waktu lebih untuk proses akses pada basis data selama proses pembentukan kandidat FC dan
FC. Hal ini juga disebabkan waktu yang
digunakan dua proses pruning dalam
algoritma Close untuk memperkecil iterasi pembentukan set FC menjadi tidak berguna. Oleh sebab itu, waktu eksekusi algoritma
Close menjadi lebih lama.
Pembentukan Minimal Non-Redundant Association Rules
Minimal non-redundant association rules
dibentuk menggunakan data hasil generators
dan frequent closed itemsets yang memenuhi empat nilai minsup yang telah dicobakan. Jumlah minimal non-redundant association rules terhadap 11 nilai mincof yang dicobakan dapat dilihat pada Tabel 4. Jumlah minimal non-redundant association rules untuk nilai
minsup dan mincof yang dicobakan terdapat pada Lampiran 4.
Tabel 4 Jumlah minimal non-redundant
associaton rules
Minsup (%)
Mincof
(%) 5 2 1 0,5
75 0 0 0 1
70 0 0 1 2
65 0 0 2 4
60 0 0 3 10
55 0 0 5 15
50 0 1 8 25
45 0 1 8 26
40 1 3 10 39
30 1 5 19 73
20 4 14 44 128
10 4 19 77 226
Berdasarkan data hasil large itemset yang memenuhi empat nilai minsup yang telah dicobakan, dilakukan pembentukan aturan asosiasi menggunakan aplikasi penelitian sebelumnya (Widodo 2004). Jumlah aturan asosiasi terhadap 11 nilai mincof yang dicobakan dapat dilihat pada Tabel 5.
Tabel 5 Jumlah aturan asosiasi
Minsup (%)
Mincof
(%) 5 2 1 0,5
75 0 0 0 0
70 0 0 1 1
65 0 0 1 2
60 0 0 2 3
55 0 0 4 5
50 0 0 4 8
45 0 0 4 9
40 1 2 6 15
30 1 3 7 22
20 2 9 16 39
10 2 11 34 71
Pembentukan aturan asosiasi untuk empat nilai minsup yang dicobakan dengan nilai
mincof > 78,67 % tidak lagi menghasilkan aturan asosiasi.
Grafik waktu eksekusi pembentukan
minimal non-redundant association rules
(MNRAA) pada penelitian ini dan aturan asosiasi (AA) pada penelitian Widodo (2004) untuk empat nilai minsup dan 11 nilai mincof
yang dicobakan, dapat dilihat pada Gambar 5.
0 2 4 6 8 10 12
75 70 65 60 55 50 45 40 30 20 10 Mincof (%) Waktu ( d etik) MNRAA AA (a) 0 10 20 30 40 50
75 70 65 60 55 50 45 40 30 20 10
Mincof (%) Waktu (detik) MNRAA AA (b) 0 40 80 120 160 200
75 70 65 60 55 50 45 40 30 20 10 Mincof (%) Waktu (detik) MNRAA AA (c) 0 200 400 600 800 1000 1200
75 70 65 60 55 50 45 40 30 20 10
Mincof (%) Wa ktu ( d eti k ) MNRAA AA
(d)
Gambar 5 Waktu eksekusi pembentukan MNRAA dan AA dari (a)
minsup 5 %, (b) minsup 2 %, (c)
minsup 1 %, dan (d) minsup
Tabel 5, semakin kecil nilai minsup dan
mincof maka jumlah aturan asosiasi yang dihasilkan semakin banyak. Untuk setiap nilai
minsup dan mincof yang dicobakan, jumlah
minimal non-redundant association rules yang dihasilkan lebih banyak dari jumlah aturan asosiasi.
Pada nilai minsup 2 % dengan nilai mincof
50 % dan 45 %, aturan asosiasi tidak menghasilkan aturan sedangkan minimal non-redundant association rules telah menghasilkan aturan asosiasi, yaitu aturan 026 → 013 (pasta gigi → sabun) dengan support
2,67 % dan confidence 53,64 %. Hal ini berarti 2,67 % dari konsumen akan membeli pasta gigi dan sabun bersamaan dan 53,64 % dari konsumen yang membeli pasta gigi akan selalu diikuti dengan pembelian sabun.
Untuk nilai minsup 0,5 % dan mincof
75 % aturan asosiasi tidak menghasilkan
aturan sedangkan minimal non-redundant
association rules dapat menghasilkan aturan, yaitu aturan 003, 009 → 008 (susu, pelengkap roti → snack) dengan support 0,7 % dan
confidence 78,67 %. Hal ini berarti 0,7 % dari konsumen akan membeli susu, pelengkap roti dan snack bersamaan dan 78,67 % dari konsumen yang membeli susu dan pelengkap roti akan selalu diikuti dengan pembelian snack.
Data minimal non-redundant association rules dengan nilai confidence terbesar dari empat nilai minsup yang telah dicobakan dapat dilihat pada Tabel 6. Data minimal non-redundant association rules yang memiliki korelasi positif dan korelasi negatif terdapat pada Lampiran 5 dan 6.
Tabel 6 Minimal non-redundant association rules dengan nilai confidence terbesar
Minsup (%) Aturan Asosiasi Support (%) Confidence (%)
5 susu → snack 6,54 44,64
2 pasta gigi → sabun
2,67 53,64
1 susu, permen →
snack
1,21 70,44
0,5 susu, pelengkap
roti → snack 0,7 78,67
Data aturan asosiasi dengan nilai
confidence terbesar dari empat nilai minsup
yang telah dicobakan pada penelitian sebelumnya (Widodo 2004) dapat dilihat pada Tabel 7.
confidence terbesar
Minsup (%) Aturan Asosiasi Support (%) Confidence (%)
5 susu → snack 6,54 44,64
2 susu → snack 6,54 44,64
1 susu, permen
→ snack 1,21 70,44
0,5 susu, permen → snack
1,21 70,44
Berdasarkan data hasil pada Tabel 6 dan
Tabel 7, mining minimal non-redundant
association rules menghasilkan aturan asosiasi dengan nilai confidence tertinggi yang berbeda-beda untuk empat nilai minsup yang dicobakan. association rules mining pada penelitian Widodo (2004) menghasilkan aturan asosiasi dengan confidence tertinggi yang sama untuk minsup 5% dan 2 %, begitu juga untuk minsup 1 % dan 0,5 %
Minimal non-redundant association rules
menghasilkan aturan asosasi yang lebih banyak mengandung informasi dibandingkan aturan asosiasi yang dihasilkan pada penelitian sebelumnya (Widodo 2004). Jika penelitian Widodo (2004) menghasilkan aturan asosiasi (013 → 026) untuk minsup
1 % dan mincof 10 %, maka selain menghasilkan aturan asosasi yang sama,
minimal non-redundant association rules juga menghasilkan aturan asosasi (026 → 013) dengan informasi nilai support yang sama, yaitu 2,67 % tetapi nilai confidence yang berbeda. Nilai confidence aturan asosiasi (013 → 026) adalah 26,7 % sedangkan aturan asosiasi (026 → 013) adalah 53,64 %.
Selain membentuk aturan asosiasi yang berbeda, waktu eksekusi pembentukan aturan asosiasi juga memiliki perbedaan yang cukup signifikan. Berdasarkan grafik waktu eksekusi
pembentukan minimal non-redundant
association rules dan aturan asosiasi dari penelitian sebelumnya (Widodo 2004) untuk empat nilai minsup yang ditunjukkan pada Gambar 5, semakin kecil nilai minsup, maka waktu eksekusi untuk pembentukan minimal non-redundant association rules dan aturan asosiasi semakin lama.
Rataan perbedaan waktu eksekusi pembentukan aturan asosiasi untuk masing-masing nilai minsup berbeda-beda. Untuk
minsup 5 %, rataan perbedaan waktu eksekusi adalah 9 detik, minsup 2 % adalah 40,45 detik,
Hasil Perbandingan Mining Minimal
Non-Redundant Association Rules dengan
Mining Association Rules pada Penelitian Widodo(2004)
Algoritma Apriori yang digunakan pada penelitian Widodo (2004), membentuk large itemset dengan membangkitkan itemset lattice
yang ada dalam basis data. Secara umum
proses pembangkitan itemset lattice
memerlukan waktu penelusuran basis data dan penggunaan sumberdaya komputasi yang besar.
Algoritma Close menggunakan closed itemset lattice yang merupakan sub-order dari
itemset lattice untuk membentuk generators
dan frequent closed itemsets. Penggunaan
closed itemset lattice bisa mengurangi waktu penelusuran basis data dan penggunaan sumberdaya komputasi yang besar.
Generators dan frequent closed itemsets
yang dihasilkan algoritma Close sangat
mempengaruhi pembentukan minimal
non-redundant association rules. Proses pruning
kedua dalam algoritma Close bertujuan
menghilangkan frequent closed itemsets yang berulang, sehingga tidak terjadi pembentukan aturan asosiasi yang berulang dalam minimal non-redundant association rules.
Grafik total waktu eksekusi minimal non-redundant association rules mining, meliputi waktu pembentukan frequent closed itemsets
(algoritma Close) dan waktu rata-rata
pembentukan minimal non-redundant
association rules (MNRAA) pada penelitian ini dapat dilihat pada Gambar 6.
0 100 200 300 400 500 600
5 2 1 0,5
Minsup (%)
W
aktu (detik)
MNRAA Close
Gambar 6 Total waktu eksekusi minimal non-redundant association rules mining.
Grafik total waktu eksekusi association rules mining, meliputi waktu pembentukan
large itemsets (algoritma Apriori) dan waktu rata-rata pembentukan aturan asosiasi (AA) pada penelitian Widodo (2004) dapat dilihat pada Gambar 7.
0 200 400 600 800 1000 1200
5 2 1 0,5
Minsup (%)
Waktu (detik)
AA Apriori
Gambar 7 Total waktu eksekusi
association rules mining.
Grafik pada Gambar 6 dan Gambar 7
menunjukkan pada minsup 5 % dan 2 %,
minimal non-redundant association rules mining membutuhkan waktu eksekusi lebih lama. Minimal non-redundant association rules mining membutuhkan waktu lebih lama untuk eksekusi algoritma Close, sedangkan
association rules mining membutuhkan waktu lebih lama untuk pembentukan aturan asosiasi. Pada minsup 1 % dan 0,5 %, association rules mining membutuhkan waktu eksekusi
lebih lama. Association rules mining
membutuhkan waktu lebih lama untuk pembentukan aturan asosiasi, sedangkan
minimal non-redundant association rules mining membutuhkan waktu lebih lama untuk eksekusi algoritma Close.
Penelitian ini menggunakan data transaksi yang bersifat tidak padat sehingga memiliki korelasi yang lemah dalam data. Hal
ini membuat algoritma Close tidak
memperlihatkan keunggulannya dalam efisiensi waktu dan penggunaan sumberdaya komputasi.
Pembentukan minimal non-redundant
association rules membutuhkan waktu eksekusi lebih sedikit. Pembentukan aturan asosiasi yang menggunakan aplikasi penelitian Widodo (2004) membutuhkan waktu eksekusi yang lebih lama. Hal ini disebabkan pembentukan aturan asosiasi dilakukan dengan mengkombinasikan semua item yang
ada dalam large itemset, sehingga
membutuhkan waktu eksekusi yang lebih lama dan sumberdaya komputasi yang besar.
Berdasarkan data transaksi yang digunakan, jumlah aturan asosiasi yang dihasilkan oleh aplikasi penelitian Widodo (2004) lebih kecil dibandingkan jumlah
rules tidak terlihat.
Meskipun begitu, mining minimal non-redundant association rules mampu menghasilkan aturan asosiasi yang mengandung informasi lebih banyak yang tidak dihasilkan oleh aplikasi penelitian sebelumnya (Widodo 2004). Terbentuknya aturan asosasi tersebut merupakan keunggulan lain yang dimiliki mining minimal non-redundant association rules.
Berdasarkan hasil perbandingan, mining minimal non-redundant association rules
memiliki keunggulan dibandingkan mining association rules pada penelitian sebelumnya (Widodo 2004). Keunggulan dalam waktu eksekusi, penggunaan sumberdaya komputasi dan hasil aturan asosiasi yang dihasilkan.
Pada penelitian ini, keunggulan mining non-redundant association rules hanya terlihat
pada proses pembentukan minimal
non-redundant association rules saja. Algoritma
Close tidak memperlihatkan keunggulannya karena sifat data transaksi yang tidak padat dan berkorelasi lemah.
KESIMPULAN DAN SARAN
Kesimpulan
Penelitian ini menerapkan teknik minimal non-redundant association rules mining
menggunakan generators dan frequent closed itemsets untuk membentuk aturan asosisi yang tidak berulang. Algoritma Close menggunakan teknik pruning terhadap closed itemset lattice, untuk membentuk generators dan frequent closed itemsets.
Minimal non-redundant association rules mining menghasilkan aturan asosiasi yang mengandung informasi lebih banyak dibandingkan dengan mining association rules. Pada penelitian ini, mining minimal non-redundant association rules mampu menghasilkan aturan asosiasi 003, 009 → 008 (susu, pelengkap roti → snack) dengan nilai
support 0,7 % dan confidence 78,67 % untuk
nilai minsup 0,5 % dan mincof 75 %
sedangkan mining association rules tidak menghasilkan aturan tersebut.
Berdasarkan hasil penelitian, dapat
dinyatakan keunggulan minimal
non-redundant association rules mining sebagai berikut:
berulang dengan anteseden yang minimal dan konsekuen yang maksimal,
2 menghasilkan aturan asosasi yang lebih banyak mengandung informasi dari basis data. Jika dihasilkan aturan asosiasi 001 → 003 (mie instant → susu) maka akan dihasilkan juga aturan asosasi 003 → 001 (susu → mie instant) dengan informasi nilai support yang sama tetapi nilai
confidence yang berbeda,
3 efisiensi terhadap waktu eksekusi dan
penggunaan sumberdaya komputasi. Waktu eksekusi pembentukan aturan asosiasi tercepat adalah 2 detik yang terjadi pada nilai minsup terbesar, yaitu 5 % sedangkan waktu eksekusi paling lama sekitar 43 detik terjadi pada nilai
minsup terkecil, yaitu 0,5 %.
Data transaksi dalam penelitian ini memiliki sifat data yang tidak padat dan berkorelasi rendah, sehingga algoritma Close
membutuhkan waktu eksekusi lebih lama. Semakin kecil nilai minsup, maka semakin lama waktu yang dibutuhkan untuk membentuk generators dan frequent closed itemsets.
Saran
Aplikasi mining minimal non-redundant association rules yang telah dihasilkan dapat dicobakan dengan menggunakan data yang bersifat padat dan memiliki korelasi tinggi,
sehingga mining minimal non-redundant
association rules dapat memperlihatkan keunggulannya.
Aplikasi mining minimal non-redundant association rules yang telah dihasilkan, dapat dikembangkan dengan menggunakan algoritma lain untuk membentuk generators
dan frequent closed itemsets yang lebih sedikit pada data yang bersifat jarang.
DAFTAR PUSTAKA
Bastide Y, Pasquier N, Taouil R, Stumme G, Lakhal L. 2000. Mining Minimal Non-Redundant Association Rules using Frequent Closed Itemsets. France: Blaise Pascal University.
Godin R, Missaoui R, Alaoui H. 1995.
Incremental Concept Formation Algorithms based on Galois (Concept)
Han J, Kamber M. 2006. Data Mining: Concepts and Techniques (second edition). San Diego, USA: Morgan-Kaufmann.
Pasquier N, Bastide Y, Taouil R, Lakhal L. 1998. Pruning Closed Itemset Lattices for Association Rules. France: Blaise Pascal University.
---. 1999. Discovering Closed Itemsets for Association Rules. France: Blaise Pascal University.
Priss U. 2006. Formal Concept Analysis in Information Science. Di dalam: Cronin,
Blaise, editor. Annual Review of
Information Science and Technology. American Society for Information Science and Technology. hlm 521-543.
Lampiran 1 Daftar properti tabel a Properti tblTransaksiAsli
Nama atribut Tipe Data Keterangan
Tanggal Date/time Primary Key
Berisi tanggal transaksi
NoRegistrasi Text Berisi nomor registrasi dari petugas kasir
KodeShif Text Primary Key
Berisi kode shif petugas kasir
PosNumber Text Primary Key
Berisi urutan masukan data yang terjual KodeBarang Text Berisi kode barang
Satuan Text Berisi jenis satuan barang Harga Number Berisi harga barang
Kelompok Text Berisi kode kelompok barang b Properti tblKelBarang
Nama atribut Tipe Data Keterangan
NO_ID Number Primary Key
Berisi kode kelompok barang Nama Text Berisi nama kelompok barang c Properti tblTransaksiReduksi
Nama atribut Tipe Data Keterangan
Tanggal Date/time Primary Key
Berisi tanggal transaksi
KodeShif Text Primary Key
Berisi kode shif petugas kasir
PosNumber Text Primary Key
Berisi urutan masukan data yang terjual Kelompok Text Berisi kode kelompok barang
d Properti tblCleanTransaksi
Nama atribut Tipe Data Keterangan
Tanggal Date/time Primary Key
Berisi tanggal transaksi
KodeShif Text Primary Key
Berisi kode shif petugas kasir
PosNumber Text Primary Key
Berisi urutan masukan data yang terjual Kelompok Text Berisi kode kelompok barang
e Properti tblBiner
Nama atribut Tipe Data Keterangan
TID AutoNumber Primary Key
Nama atribut Tipe Data Keterangan 008 Number Berisi data biner item 008 009 Number Berisi data biner item 009 010 Number Berisi data biner item 010 011 Number Berisi data biner item 011 012 Number Berisi data biner item 012 013 Number Berisi data biner item 013 014 Number Berisi data biner item 014 015 Number Berisi data biner item 015 016 Number Berisi data biner item 016 017 Number Berisi data biner item 017 018 Number Berisi data biner item 018 019 Number Berisi data biner item 019 020 Number Berisi data biner item 020 021 Number Berisi data biner item 021 022 Number Berisi data biner item 022 023 Number Berisi data biner item 023 024 Number Berisi data biner item 024 025 Number Berisi data biner item 025 026 Number Berisi data biner item 026 027 Number Berisi data biner item 027 028 Number Berisi data biner item 028 029 Number Berisi data biner item 029 030 Number Berisi data biner item 030 031 Number Berisi data biner item 031 032 Number Berisi data biner item 032 033 Number Berisi data biner item 033 034 Number Berisi data biner item 034 035 Number Berisi data biner item 035 f Properti tblCGenerator
Nama atribut Tipe Data Keterangan
Generator Text Berisi data generator Length Number Berisi data jumlah generator
g Properti tblGenClosure
Nama atribut Tipe Data Keterangan
Generator Text Berisi data generator
Closure Text Berisi data kandidat closed itemset dari generator Support Number Berisi nilai support dari kandidat closed itemset h Properti tblClosure
Nama atribut Tipe Data Keterangan
Generator Text Berisi data generator
Closure Text Berisi data frequent closed itemset dari generator Support Number Berisi nilai support dari frequent closed itemset LengthG Number Berisi data jumlah generator
Lampiran 1 Lanjutan i Properti tblBantu
Nama atribut Tipe Data Keterangan
Generator Text Berisi data generator
Subset Text Berisi data subset dari generator j Properti tblResult
Nama atribut Tipe Data Keterangan
NO Number Berisi nomor urut aturan asosiasi yang terbentuk Antecedent Text Berisi data anteseden dalam aturan asosiasi Implies Text Berisi simbol untuk aturan asosiasi Consequent Text Berisi data konsekuen dalam aturan asosiasi Support Number Berisi nilai support dari aturan asosiasi Confidence Number Berisi nilai confidence dari aturan asosiasi
Lampiran 2 Tabel daftar kelompok barang No_ID Nama Barang
001 Mie instant 002 Minyak goreng 003 Susu
004 Kopi
005 Makanan Pokok 006 Permen
007 Minuman 008 Snack
009 Pelengkap roti 010 Saus kecap 011 Makanan kaleng 012 Lotion
013 Sabun 014 Shampo 015 Obat nyamuk 016 Pengharum ruangan 017 Bumbu dapur 018 Tepung 019 Susu bayi 020 Rokok 021 Baterai 022 Es krim 023 Sosis
024 Perlengkapan komputer 025 Obat
026 Pasta gigi 027 Multivitamin 028 Perlengkapan bayi
029 Handuk dan pakaian dalam 030 Perlengkapan dapur 031 Tissue dan pembalut 032 Sandal
033 Korek
a Kandidat FC1 dengan minsup 5 %
NO Generator Closure Support (%) NO Generator Closure Support (%)
1 001 001 9,555245 19 019 019 5,221954
2 002 002 1,56574 20 020 020 7,701748
3 003 003 14,73911 21 021 0
4 004 004 7,85409 22 022 022 4,350218
5 005 005 5,844018 23 023 023 0,7109306
6 006 006 8,531167 24 024 024 0,4147095
7 007 007 30,01566 25 025 025 5,585883
8 008 008 29,38513 26 026 026 4,993441
9 009 009 2,869112 27 027 027 0,7151623
10 010 010 2,945284 28 028 028 2,941052
11 011 011 0,4612585 29 029 029 1,675765
12 012 012 5,920189 30 030 030 0,7617113
13 013 013 10,0292 31 031 031 5,001904
14 014 014 2,170877 32 032 032 0,0507807
15 015 015 1,599594 33 033 033 0,9944564
16 016 016 1,180652 34 034 034 0,6432229
17 017 017 1,299141 35 035 035 0,6432229
18 018 018 0,3893191
b FC1 dengan minsup 5 %
NO Generator Closure Support (%)
1 001 001 9,555245
2 003 003 14,73911
3 004 004 7,85409
4 005 005 5,844018
5 006 006 8,531167
6 007 007 30,01566
7 008 008 29,38513
8 012 012 5,920189
9 013 013 10,0292
10 019 019 5,221954
11 020 020 7,701748
12 025 025 5,585883
13 031 031 5,001904
c Kandidat FC2 dengan minsup 5 %
Lampiran 3 Lanjutan
NO Generator Closure Support (%) NO Generator Closure Support (%) 27 004,008 004,008 2,192036 53 007,013 007,013 1,684228 28 004,012 004,012 0,4866489 54 007,019 007,019 0,5966738 29 004,013 004,013 1,434556 55 007,020 007,020 0,9902247 30 004,019 004,019 0,2962211 56 007,025 007,025 0,9013584 31 004,020 004,020 0,3893191 57 007,031 007,031 0,9436757 32 004,025 004,025 0,4189412 58 008,012 008,012 1,773095 33 004,031 004,031 0,5205027 59 008,013 008,013 3,216115 34 005,006 005,006 0,406246 60 008,019 008,019 1,362617 35 005,007 005,007 0,7786382 61 008,020 008,020 0,8124921 36 005,008 005,008 1,261055 62 008,025 008,025 1,362617 37 005,012 005,012 0,2369768 63 008,031 008,031 1,582667 38 005,013 005,013 1,036774 64 012,013 012,013 1,489569 39 005,019 005,019 0,1777326 65 012,019 012,019 0,1861961 40 005,020 005,020 0,1354153 66 012,020 012,020 0,2073547 41 005,025 005,025 0,3343066 67 012,025 012,025 0,3935508 42 005,031 005,031 0,3004528 68 012,031 012,031 0,8378825 43 006,007 006,007 2,035462 69 013,019 013,019 0,5712835 44 006,008 006,008 3,762007 70 013,020 013,020 0,2750624 45 006,012 006,012 0,579747 71 013,025 013,025 0,7659431 46 006,013 006,013 0,8801997 72 013,031 013,031 1,155262 47 006,019 006,019 0,3385383 73 019,020 019,020 0,1311836 48 006,020 006,020 0,2581355 74 019,025 019,025 0,2454403 49 006,025 006,025 0,4020143 75 019,031 019,031 0,2242817 50 006,031 006,031 0,4612585 76 020,025 020,025 0,1777326 51 007,008 007,008 6,262959 77 020,031 020,031 0,0846345 52 007,012 007,012 0,9267488 78 025,031 025,031 0,3258432 d FC2 dengan minsup 5 %
NO Generator Closure Support (%) 1 003,008 003,008 6,580339 2 007,008 007,008 6,262959 e Kandidat FC1 dengan minsup 2 %
NO Generator Closure Support (%) NO Generator Closure Support (%)
1 001 001 9,555245 17 017 017 1,299141
2 002 002 1,56574 18 018 018 0,3893191
3 003 003 14,73911 19 019 019 5,221954
4 004 004 7,85409 20 020 020 7,701748
5 005 005 5,844018 21 021 0
6 006 006 8,531167 22 022 022 4,350218
7 007 007 30,01566 23 023 023 0,7109306
8 008 008 29,38513 24 024 024 0,4147095
9 009 009 2,869112 25 025 025 5,585883
10 010 010 2,945284 26 026 026 4,993441
11 011 011 0,4612585 27 027 027 0,7151623
12 012 012 5,920189 28 028 028 2,941052
13 013 013 10,0292 29 029 029 1,675765
14 014 014 2,170877 30 030 030 0,7617113
15 015 015 1,599594 31 031 031 5,001904
NO Generator Closure Support (%)
33 033 033 0,9944564
34 034 034 0,6432229
35 035 035 0,6432229
f FC1 dengan minsup 2 %
NO Generator Closure Support (%) NO Generator Closure Support (%)
1 001 001 9,555245 11 013 013 10,0292
2 003 003 14,73911 12 014 014 2,170877
3 004 004 7,