• Tidak ada hasil yang ditemukan

Pembentukan Minimal Non-Redundant Association Rules Menggunakan Frequent Closed Itemsets pada Data Transaksi Swalayan

N/A
N/A
Protected

Academic year: 2017

Membagikan "Pembentukan Minimal Non-Redundant Association Rules Menggunakan Frequent Closed Itemsets pada Data Transaksi Swalayan"

Copied!
116
0
0

Teks penuh

(1)

ARDIANSYAH dan IMAS S. SITANGGANG.

Teknik association rules mining di dalam data mining seringkali menghasilkan aturan asosiasi dalam jumlah banyak yang dapat mengandung aturan-aturan yang berulang, yaitu aturan-aturan yang memberikan informasi yang sama. Penelitian ini menggunakan teknik mining minimal non-redundant association rules untuk menghasilkan aturan asosiasi yang tidak berulang pada data transaksi pembelian barang di Sinar Mart Swalayan selama 2 bulan (1 Maret 2004 – 21 Mei 2004). Konsep closure dalam Galois connection diterapkan dalam teknik minimal non-redundant association rules mining untuk membentuk generators dan frequent closed itemsets menggunakan algoritma Close. Pada penelitian ini dilakukan pembentukan generators dan frequent closed itemsets dengan menggunakan empat nilai minimum support, yaitu 5 %, 2 %, 1 %, dan 0,5 % dari 23.631 transaksi yang ada. Berdasarkan generators dan frequent closed itemsets, dibentuk minimal non-redundant association rules menggunakan 11 nilai minimum confidence, yaitu 75 %, 70 %, 65 %, 60 %, 55 %, 50 %, 45 %, 40 %, 30 %, 20 %, dan 10 %.

Hasil penelitian memperlihatkan bahwa teknik minimal non-redundant association rules mining dapat menghasilkan aturan asosiasi yang tidak berulang dengan antesedan yang minimal dan konsekuen yang maksimal serta mengandung informasi lebih banyak. Di samping itu, waktu eksekusi dan penggunaan sumberdaya komputasi untuk implementasi teknik tersebut lebih efisien. Waktu eksekusi pembentukan minimal non-redundant association rules tercepat adalah 2 detik yang terjadi pada nilai minimum support terbesar, yaitu 5 % sedangkan waktu eksekusi paling lama sekitar 43 detik terjadi pada nilai minimum support terkecil, yaitu 0,5 %.

Data transaksi dalam penelitian ini memiliki sifat data yang tidak padat dan berkorelasi rendah, sehingga algoritma Close membutuhkan waktu eksekusi lebih lama. Semakin kecil nilai minimum support, maka semakin lama waktu yang dibutuhkan untuk membentuk generators dan frequent closed itemsets.

Kata kunci: data mining, aturan asosiasi, lattices, Galois connection, non-redundant

(2)

RISA MAISARAH

G64103009

DEPARTEMEN ILMU KOMPUTER

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

INSTITUT PERTANIAN BOGOR

(3)

RISA MAISARAH

G64103009

DEPARTEMEN ILMU KOMPUTER

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

INSTITUT PERTANIAN BOGOR

(4)

RISA MAISARAH

G64103009

Skripsi

Sebagai salah satu syarat untuk memperoleh gelar

Sarjana Komputer pada

Departemen Ilmu Komputer

DEPARTEMEN ILMU KOMPUTER

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

INSTITUT PERTANIAN BOGOR

(5)

ARDIANSYAH dan IMAS S. SITANGGANG.

Teknik association rules mining di dalam data mining seringkali menghasilkan aturan asosiasi dalam jumlah banyak yang dapat mengandung aturan-aturan yang berulang, yaitu aturan-aturan yang memberikan informasi yang sama. Penelitian ini menggunakan teknik mining minimal non-redundant association rules untuk menghasilkan aturan asosiasi yang tidak berulang pada data transaksi pembelian barang di Sinar Mart Swalayan selama 2 bulan (1 Maret 2004 – 21 Mei 2004). Konsep closure dalam Galois connection diterapkan dalam teknik minimal non-redundant association rules mining untuk membentuk generators dan frequent closed itemsets menggunakan algoritma Close. Pada penelitian ini dilakukan pembentukan generators dan frequent closed itemsets dengan menggunakan empat nilai minimum support, yaitu 5 %, 2 %, 1 %, dan 0,5 % dari 23.631 transaksi yang ada. Berdasarkan generators dan frequent closed itemsets, dibentuk minimal non-redundant association rules menggunakan 11 nilai minimum confidence, yaitu 75 %, 70 %, 65 %, 60 %, 55 %, 50 %, 45 %, 40 %, 30 %, 20 %, dan 10 %.

Hasil penelitian memperlihatkan bahwa teknik minimal non-redundant association rules mining dapat menghasilkan aturan asosiasi yang tidak berulang dengan antesedan yang minimal dan konsekuen yang maksimal serta mengandung informasi lebih banyak. Di samping itu, waktu eksekusi dan penggunaan sumberdaya komputasi untuk implementasi teknik tersebut lebih efisien. Waktu eksekusi pembentukan minimal non-redundant association rules tercepat adalah 2 detik yang terjadi pada nilai minimum support terbesar, yaitu 5 % sedangkan waktu eksekusi paling lama sekitar 43 detik terjadi pada nilai minimum support terkecil, yaitu 0,5 %.

Data transaksi dalam penelitian ini memiliki sifat data yang tidak padat dan berkorelasi rendah, sehingga algoritma Close membutuhkan waktu eksekusi lebih lama. Semakin kecil nilai minimum support, maka semakin lama waktu yang dibutuhkan untuk membentuk generators dan frequent closed itemsets.

Kata kunci: data mining, aturan asosiasi, lattices, Galois connection, non-redundant

(6)

Menyetujui:

Pembimbing I, Pembimbing II,

Firman Ardiansyah, S.Kom, M.Si. Imas S. Sitanggang, S.Si.,M.Kom

NIP 132 311 919 NIP 132 206 235

Mengetahui:

Dekan Fakultas Matematika dan Ilmu Pengetahuan Alam

Institut Pertanian Bogor

Dr. drh. Hasim, DEA

NIP 131 578 806

(7)

lulus dari SMUN 1 Tapaktuan, Aceh Selatan dan diterima menjadi mahasiswa Departemen Ilmu Komputer Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor melalui jalur Undangan Seleksi Masuk IPB (USMI). Pada tahun 2007, Penulis berkesempatan menjalankan Praktik Kerja Lapangan (PKL) di Pusat Penelitian dan Pengembangan Perkebunan, Bogor selama kurang lebih dua bulan.

(8)

Alhamdulillaahi rabbil ‘aalamin dengan memanjatkan puji syukur kehadirat Allah SWT atas segala rahmat dan hidayah-Nya, sehingga penulis dapat menyelesaikan skripsi dengan judul Pembentukan Minimal Non-Redundant Association Rules menggunakan frequent closed itemsets pada Data Transaksi Swalayan. Shalawat serta salam juga penulis sampaikan kepada junjungan Nabi besar Muhammad SAW beserta seluruh keluarganya, sahabatnya, dan kita semua sebagai generasi penerusnya hingga akhir zaman.

Penulis mengucapkan terima kasih banyak kepada Bapak Firman Ardiansyah, S.Kom, M.Si. selaku pembimbing 1 dan Ibu Imas S. Sitanggang, S.Si.,M.Kom selaku pembimbing 2 yang telah banyak membantu dan memberikan saran yang bermanfaat serta arahan dalam proses penyelesaian skripsi. Terima kasih juga penulis ucapkan kepada dosen penguji atas kesediaannya untuk menguji dalam masa seminar dan sidang serta saran dan masukannya. Di samping itu, penulis juga ingin mengucapkan terima kasih kepada:

1 Mama dan almarhum Ayah tercinta yang selalu memberikan kasih sayang, doa, dan motivasi yang tidak pernah putus.

2 Ibu Yul, almarhumah Bapak Hatta, Papa Is, Anda Esy, dan Bang Meiby serta keluarga besar di Banda Aceh dan Tapaktuan atas semua perhatian dan dukungannya yang telah diberikan selama ini.

3 Kak Rini dan Bang Eyuu tercinta yang selalu memberikan perhatian, motivasi, dan doa yang tidak pernah putus.

4 Keluarga besar penulis yang berada di Jakarta atas perhatian dan dukungannya.

5 Teman-teman seperjuangan di Ilkom 40 Eggy, Anti, Tessy, Nanik, Ratih, Wisyu, Ocha, dan Chita serta semua ilkomerz 40 terima kasih atas perhatian, kerja sama, dan bantuannya selama penulis kuliah di IPB.

6 Teman-teman di Wisma Green House Eggy, Kak Eka, Mbak Yuyun, Mbak Nani, Mbak Rahmae, Rahma, Melly, Fitri, Restu, Nana, Mira, Umi, dan Evi atas kesabaran, perhatian, bantuan dan motivasinya selama ini.

7 Teman-teman terbaik di Banda Aceh dan Tapaktuan yang selalu memberikan perhatian dan motivasi.

8 Departemen Ilmu Komputer, staf, dan dosen yang telah banyak membantu penulis selama masa perkuliahan dan penelitian.

9 Semua pihak yang telah banyak membantu penulis dalam menyelesaikan perkuliahan di Ilmu Komputer IPB.

Penulis mohon maaf jika ada kekurangan-kekurangan yang terdapat dalam skripsi ini. Penulis berharap semoga skripsi ini dapat bermanfaat bagi perkembangan dunia ilmu pengetahuan di Indonesia.

Bogor, April 2008

Penulis

(9)

DAFTAR TABEL...vi

DAFTAR GAMBAR ...vi

DAFTAR LAMPIRAN ...vi

PENDAHULUAN...1

Latar Belakang ...1

Tujuan ...1

Ruang Lingkup...1

Manfaat Penelitian...1

TINJAUAN PUSTAKA...1

Knowledge Discovery in Database (KDD) ...1

Data Mining...2

Minimal Non-Redundant Association Rules...2

Galois Connection...3

Lift...4

METODE PENELITIAN...4

Metode Penelitian...4

Lingkungan Pengembangan Sistem ...6

Perancangan Basis Data ...6

HASIL DAN PEMBAHASAN ...7

Pembentukan Frequent Closed Itemsets...7

Pembentukan Minimal Non-Redundant Association Rules...9

Hasil Perbandingan Minimal Non-Redundant Association Rules Mining dengan Association Rules Mining pada Penelitian Widodo (2004)...11

KESIMPULAN DAN SARAN ...12

Kesimpulan ...12

Saran...12

DAFTAR PUSTAKA ...12

LAMPIRAN...13

(10)

2 Pembentukan frequent closed itemsets (FC)...8

3 Pembentukan large itemset...8

4 Jumlah minimal non-redundant association rules...9

5 Jumlah aturan asosiasi...9

6 Minimal non-redundant association rules dengan nilai confidence terbesar ...10

7 Aturan asosiasi dengan nilai confidence terbesar ...10

DAFTAR GAMBAR

Halaman 1 Tahapan dalam KDD (Han & Kamber 2006)...2

2 Basis data D dan closed itemset lattice dari D...3

3 Bagan alir minimal non-redundant association rules mining...7

4 Grafik waktu eksekusi...8

5 Waktu eksekusi pembentukan MNRAA dan AA dari (a) minsup 5 %, (b) minsup 2 %, (c) minsup 1 %, dan (d) minsup 0,5 %...9

6 Total waktu eksekusi minimal non-redundant association rules mining...11

7 Total waktu eksekusi association rules mining...11

DAFTAR LAMPIRAN

Halaman 1 Daftar properti tabel ...15

2 Tabel daftar kelompok barang...17

3 Data hasil kandidat FC dan FC dengan nilai minsup 5 %, 2 %, 1 %, dan 0,5 % ...18

4 Minimal non-redundant association rules (MNRAA) ...39

5 Minimal non-redundant association rules (MNRAA)yang memiliki korelasi positif ...45

6 Minimal non-redundant association rules (MNRAA)yang memiliki korelasi negatif ...51

(11)

PENDAHULUAN

Latar Belakang

Perkembangan yang cepat dalam teknologi pengumpulan dan penyimpanan data telah memudahkan organisasi untuk mengumpulkan sejumlah data berukuran besar, sehingga menghasilkan tumpukan data. Konsep data mining digunakan untuk mengelola tumpukan data menjadi suatu pengetahuan yang berharga, sehingga dapat diaplikasikan dalam berbagai bidang, di antaranya dalam bidang bisnis dan kedokteran.

Data mining merupakan proses ekstraksi informasi atau pola yang penting dalam basis data berukuran besar. Salah satu teknik data mining adalah metode association rule mining

yang berguna untuk menemukan aturan asosiasi pada basis data. Pada dasarnya aturan asosiasi digunakan untuk menggambarkan keterkaitan antar item pada sekumpulan data (Han & Kamber 2006).

Penerapan association rules dapat

dicontohkan pada analisis pembelian di suatu pasar swalayan, sehingga dapat diketahui berapa besar kemungkinan seorang pelanggan membeli roti bersamaan dengan susu. Dengan pengetahuan tersebut, pemilik pasar swalayan dapat mengatur penempatan barang atau merancang kampanye pemasaran dengan memakai kupon diskon untuk kombinasi barang tertentu.

Teknik association rules mining seringkali menghasilkan aturan asosiasi dalam jumlah banyak. Menurut Bastide et al. (2000), aturan asosiasi yang berjumlah banyak dapat mengandung aturan-aturan yang tidak relevan (minimal anteseden dan maksimal konsekuen) dan aturan yang berulang, yaitu aturan–aturan yang memberikan informasi yang sama.

Penelitian ini menerapkan teknik minimal non-redundant association rulesmining untuk menghasilkan aturan asosiasi yang tidak berulang menggunakan konsep closure dalam

Galois connection. Algoritma Close

digunakan untuk mengekstrak generators dan

frequent closed itemsets. Berdasarkan

generators dan frequent closed itemsets yang didapat akan dibentuk minimal non-redundant association rules (Bastide et al. 2000).

Minimal non-redundant association rules

mempresentasikan aturan dengan anteseden yang minimal dan konsekuen yang maksimal tanpa mengurangi informasi yang terkandung dalam data yang ditambang. Berdasarkan sudut pandang pengguna, aturan asosiasi yang

tidak berulang dengan anteseden yang minimal dan konsekuen yang maksimal menjadi bentuk aturan asosiasi paling relevan dan berguna (Bastide et al. 2000).

Tujuan

Tujuan penelitian ini adalah:

1 menerapkan konsep closure dari Galois connection untuk membentuk generators dan frequent closed itemsets

menggunakan algoritma Close (Pasquier 1998),

2 membentuk minimal non-redundant

association rules menggunakan

generators dan frequent closed itemsets,

3 membandingkan hasil dan waktu eksekusi pada minimal non-redundant association rules mining dengan association rules mining dalam penelitian sebelumnya (Widodo 2004).

Ruang Lingkup

Ruang lingkup penelitian ini dibatasi pada penggunaan konsep closure dalam Galois connection untuk mendapatkan minimal non-redundant association rules. Penelitian ini menggunakan data transaksi yang sama dengan penelitian Widodo (2004), yaitu data transaksi pembelian barang di Sinar Mart Swalayan selama 2 bulan (1 Maret 2004 – 21 Mei 2004).

Manfaat Penelitian

Hasil penelitian diharapkan dapat

memberikan minimal non-redundant

association rules yang paling relevan dan berguna serta mudah dipahami oleh pengguna.

TINJAUAN PUSTAKA

Knowledge Discovery in Database (KDD) Knowledge Discovery in Database (KDD) adalah proses untuk menemukan pengetahuan dari suatu basis data yang terdiri atas urutan langkah-langkah yang dapat dilihat pada Gambar 1 (Han & Kamber 2006).

Menurut Han & Kamber (2006), tahapan proses KDD adalah:

1 Pembersihan Data

(12)

Gambar 1 Tahapan dalam KDD (Han & Kamber 2006).

2 Seleksi Data

Proses seleksi data mengambil data yang relevan digunakan untuk proses analisis. 3 Transformasi Data

Proses ini mentransformasikan atau menggabungkan data ke dalam bentuk yang tepat untuk ditambangdengan cara melakukan peringkasan atau operasi agregrasi.

4 Data Mining

Data mining merupakan proses yang penting, di mana metode-metode cerdas diaplikasikan untuk mengekstrak pola-pola dalam data.

5 Evaluasi Pola

Evaluasi pola diperlukan untuk

mengidentifikasi pola-pola yang menarik dalam merepresentasikan pengetahuan. 6 Presentasi Pengetahuan

Penggunaan visualisasi dan teknik representasi untuk menunjukkan pengetahuan hasil penggalian gunung data kepada pengguna.

Data Mining

Data mining merupakan proses ekstraksi informasi atau pola yang penting dalam basis data berukuran besar. Beberapa teknik di dalam data mining antara lain: clustering, classification, association rule mining, dan

anomaly detaction. Association rule mining

digunakan untuk mencari hubungan menarik di antara items dalam suatu himpunan data (Han & Kamber 2006).

Ukuran objektif yang dapat digunakan untuk menemukan aturan asosiasi adalah nilai

support dan confidence. Support adalah persentase kombinasi item dalam basis data dan confidence merupakan nilai persentase dari hubungan antar item dalam aturan asosiasi.

dari basis data transaksi, Txy adalah himpunan dari banyak transaksi yang mengandung himpunan item data X dan Y. Tx adalah himpunan dari transaksi yang mengandung

item data X maka support dan confidence dari aturan asosiasi X → Y didefinisikan sebagai berikut:

Support = xy

T

S

Confidence =

xy

x

T

T

Minimal Non-Redundant Association Rules Sebuah aturan asosiasi dikatakan berulang jika terdapat aturan asosiasi lain yang memberikan informasi yang sama sehingga aturan asosiasi tersebut menjadi tidak efektif (Bastide et al. 2000). Aturan asosiasi yang berulang dicontohkan sebagai berikut:

NO Aturan Asosiasi Support Confidence

1 A → B 33 % 66 %

2 A → B, C 33 % 66 %

3 A → B, C, E 33 % 66 %

Berdasarkan contoh di atas, ketiga aturan asosiasi tersebut berulang karena tidak memberikan tambahan informasi bagi pengguna. Hanya aturan asosiasi A → B, C, E yang paling relevan dan berguna untuk ditampilkan pada pengguna karena memiliki anteseden yang minimal dan konsekuen yang paling maksimal dan mengandung keseluruhan informasi dari ketiga aturan.

Aturan asosiasi yang berulang sering terdapat pada data yang bersifat dense (padat) dan memiliki korelasi data yang tinggi. Data yang padat memiliki nilai null yang sedikit, sehingga korelasi di dalam data kuat. Dalam data transaksi, korelasi terjadi pada transaksi dan item dalam data.

Menurut Bastide et al. (2000), sebuah aturan asosiasi r : l1 → l2 adalah minimal

non-redundant association rules jika dan hanya jika tidak ada aturan asosiasi lain r’ : l’1 → l’2 dengan support(r) = support(r’), confidence(r) = confidence(r’), l’1⊆ l1, dan l2 ⊆ l’2. Aturan asosiasi terbagi menjadi dua jenis, yaitu (Bastide et al. 2000):

1 Exact association rules adalah aturan asosiasi yang memiliki nilai confidence = 100 % dengan bentuk aturan asosiasi adalah r : l1

l2.

2 Approximate association rules adalah aturan asosiasi yang memiliki nilai

(13)

Algoritma Close (Bastide 2000) digunakan untuk menghasilkan generators dan frequent closed itemsets yang memenuhi syarat

minimum support (minsup). Minimal non-redundant association rules membentuk exact association rules dan approximate association rules menggunakan generators dan frequent closed itemsets yang memenuhi syarat

minimum confidence (mincof ).

Minimal non-redundant association rules

meminimalkan jumlah aturan asosasi yang berulang dengan tetap memaksimalkan kuantitas dan kualitas informasi yang

dihasilkan. Minimal non-redundant

association rules menampilkan aturan asosiasi yang meliputi semua item yang ada dalam basis data.

Galois Connection

Galois connection ditemukan oleh ahli matematika dari Prancis bernama Evariste Galois. Galois connection didefinisikan sebagai hubungan antara dua item berbeda yang saling berhubungan satu sama lain dalam sebuah aplikasi. Konsep closure dalam Galois connection adalah suatu konsep hubungan antara dua item berbeda karena memiliki kesamaan (Priss 2006).

Dalam konteks datamining terdapat notasi untuk basis data D = ( , , R), dengan

adalah himpunan transaksi, adalah

himpunan item dalam basis data, dan R

Χ adalah suatu hubungan dalam nilai biner antara transaksi dan item. Setiap pasangan (o,

i)

R menyatakan transaksi o

memiliki

itemi

(Pasquier et al. 1999).

Berdasarkan pengertian konteks data mining, dijelaskan beberapa definisi yang berhubungan dengan mining minimal non-redudant association rules (Pasquier et al. 1999), yaitu:

Definisi 1 (Galois connection)

Diketahui D = ( , , R) dengan O

dan I ⊆ maka didefinisikan:

f(O) : 2 → 2

f(O) = {i

|∀o

O, (o, i)

R}

g(I) : 2 → 2

g(I) = {o

|∀i

I, (o, i)

R}

f(O) berasosiasi dengan O yang

mengandung item untuk semua transaksi

o

O dan g(I) berasosiasi dengan I di mana transaksi mengandung semua item i

I. Pasangan aplikasi (f, g) merupakan Galois connection antara himpunan kuasa dari dengan himpunan kuasa dari . Dimisalkan

untuk semua I, I1, I2 ⊆ dan O, O1, O2 ⊆ memiliki sifat-sifat sebagai berikut: (1) I1 ⊆ I2

g(I1)

g(I2) (1’) O1 ⊆ O2

f(O1)

f(O2) (2) Og(I)

If(O)

Definisi 2 (Galois closure operator)

Operator h = f g untuk 2 dan h’ = g f untuk 2 disebut Galois closure operator. Diketahui suatu Galois connection (f, g) dengan memiliki sifat-sifat sebagai berikut: Perluasan: (3) Ih(I)

(3’) Oh’(O) Persamaan: (4) h(h(I)) = h(I) (4’) h’(h’(O)) = h’(O)) Monoton: (5) I1 ⊆ I2

h(I1) ⊆ h(I2)

(5’) O1 ⊆ O2

h’(O1) ⊆ h’(O2)

Definisi 3 (Closed itemsets)

Diketahui itemset C ⊆ dalam D adalah

closed itemset jika dan hanya jika h(C) = C.

Closed itemset yang paling minimal mengandung itemset I untuk h(I), h(I) disebut

closure dari I.

Definisi 4 (Closed itemset lattice)

Diketahui adalah himpunan dari closed itemset di dalam D yang didapat menggunakan

Galois closure operators. = ( , ≤) adalah

lattice yang kompleks disebut closed itemset lattice. Struktur dasar lattice memiliki dua ciri, yaitu:

1 Urutan elemen latticeC1, C2 ⊆ adalah

C1 C2 jika hanya jika C1 C2.

2 memiliki batas atas dari fungsi join

dan batas bawah dari fungsi meet

terhadap elemen. Dimisalkan S

maka fungsi join dan meet terhadap elemen-elemen didefinisikan sebagai berikut:

Join (S) = h( ) Meet (S) =

C S C

C S C

OID Item

1 A C D

2 B C E

3 A B C E

4 B E

5 A B C E

Gambar 2 DatasetD dan closed itemset lattice dari D.

(14)

digunakan untuk menemukan frequent closed itemset.

Definisi 5 (Frequent closed itemset)

Closed itemset C adalah frequent closed itemset jika support(C) ≥ minsup.

Definisi 6 (Generator) (Bastide et al. 2000) Sebuah itemset g dengan g ⊆ adalah

generator yang minimal dari closed itemsetl

jika dan hanya jika h(g) = l dan tidak ada g’⊆ dengan gg sehingga h(g’) = l. Urutan

generator dinotasikan sebagai i sehingga disebut i-generator.

Lift

Aturan asosiasi yang memenuhi nilai

minsup dan mincof, terkadang bisa menjadi aturan asosiasi yang menyesatkan bagi

pengguna. Aturan asosiasi A → B bisa

menyesatkan jika ternyata pembelian item A tidak diikuti dengan pembelian item B. Oleh sebab itu, digunakan suatu cara untuk mendapatkan aturan asosiasi yang tidak menyesatkan dengan mencari nilai korelasi antar data itemsets.

Pembelian itemset A adalah independent

terhadap pembelian itemset B jika P(A B) = P(A)P(B). Jika P(A B) ≠ P(A)P(B) maka pembelian itemset A dan B adalah dependent

dan saling berhubungan dalam transaksi yang sama. Menurut Han & Kamber (2006), korelasi antara pembelian A dan B dapat ditulis sebagai:

corrA,B = ( )

( ) ( )

P A B P A P B

Nilai korelasi corrA,B sama dengan nilai

P(B|A)/P(B) yang disebut juga dengan lift dari aturan asosiasi A → B. Jika nilai corrA,B < 1

maka aturan asosiasi A → B memiliki korelasi negatif yang berarti pembelian item A tidak diikuti dengan pembelian item B. Aturan asosiasi A → B memiliki korelasi positif jika nilai corrA,B > 1, hal ini berarti pembelian item

A akan diikuti dengan pembelian item B.

Itemsets A dan B adalah independent dan tidak memiliki korelasi di antara A dan B jika nilai corrA,B = 1.

METODE PENELITIAN

Metode Penelitian

Metode yang digunakan dalam penelitian ini mengacu pada bagian datamining sebagai

salah satu tahapan proses Knowledge

Kamber 2006) yang meliputi:

1 Praproses Data

Praproses data meliputi pembersihan data, integrasi data, seleksi data dan transformasi data. Hasil praproses data tersebut berupa data yang dapat ditambang. Penelitian ini menggunakan data yang telah melalui tahap praproses dalam penelitian sebelumnya (Widodo 2004).

2 Data Mining

Dalam mencari minimal non-redudant

association rules, proses mining dibagi menjadi dua tahap, yaitu pembentukan

frequent closed itemsets dan pembentukan

minimal non-redundant association rules.

Pembentukan Frequent Closed Itemsets Pembentukan himpunan frequent closed itemsets (FCi) yang memenuhi minsup dilakukan dengan terlebih dahulu membentuk himpunan kandidat frequent closed itemsets

(FCCi). Himpunan FCCi terdiri dari generator,

closed itemset (closure), dan support dari

closure. Langkah ini dilakukan dengan iterasi

untuk mencari semua himpunan FC yang

memiliki kardinalitas dari 1 sampai i (i

-generator), pencarian berhenti jika tidak terbentuk lagi generator baru.

Pembentukan frequent closed itemsets

dilakukan dengan menggunakan Algoritma

Close sebagai berikut (Pasquier et al. 1998):

Generators in FCC1 = {1-itemsets}; for (i = 1;FCCi.generator • Ø;i++) do begin

closures in FCCi = Ø; supports in FCCi = 0; FCCi = Gen-Closure(FCCi);

forall candidate closed itemsets

c

FCCi do begin

if(c.support minsupport)then FCi = FCi

c

end

FCCi+1 = Gen-Generator(FCi); end

Answer FC = 1 (FC

1

j i

j

= − =

j.closure,

FCj.support);

Berdasarkan algoritma di atas, pada awal iterasi, FCC1 merupakan himpunan kandidat 1-generators berdasarkan urutan 1-itemsets.

Setiap 1-generator akan mengalami

penelusuran dalam basis data untuk mencari

closure-nya dan support dari closure

menggunakan fungsi Gen-Closure. Fungsi

Gen-Closure akan menghasilkan himpunan

FCC1, setiap closurec dengan c

FCC1 yang

memenuhi minsup masuk dalam himpunan

(15)

Berdasarkan 1-generator dalam FC1, maka dibentuklah himpunan kandidat 2-generator

untuk FCC2 menggunakan fungsi

Gen-Generator. Pada iterasi kedua, proses yang sama pada iterasi pertama dilakukan terhadap

FCC2. Iterasi pada algoritma Close akan berhenti jika tidak terbentuk lagi kandidat

generator baru.

Secara lebih detail, fungsi-fungsi yang ada pada algoritma Close dijelaskan sebagai berikut (Pasquier et al. 1998):

a.Fungsi Gen-Closure

Pada fungsi ini dilakukan pencarian

closure dan support dari closure untuk setiap

i-generator pada FCCi. Algoritma untuk fungsi Gen-Closure sebagai berikut:

forall objects o

O do begin

Go = Subset(FCCi.generator, f({o}));

forall generators p

G

o

do begin

if (p.closure = Ø) then p.closure = f({o}); else p.closure = p.closure

f({o}); p.support++; end

end

Answer =

{c

FCCi|c.closure • Ø};

Pencarian closure dimulai dengan

membentuk Go, yaitu himpunan subsets

generators berdasarkan subsets dari itemset

dalam transaksi f({o}). Proses penelusuran dalam Go dilakukan untuk mencari closure dan

support dari closure tiap generator. b.Fungsi Gen-Generator

Pada fungsi ini dilakukan pembentukan kandidat himpunan generators baru untuk

FCC. Algoritma untuk fungsi Gen-Generator

sebagai berikut:

insert into FCCi + 1.generator

select p.item1, p.item2,..., p.itemi,

q.item i

from FCi.generator p,FCi.generatorq where p.item1 = q.item1,...,

p.itemi – 1 = q.itemi – 1,

p.itemi < q.itemi;

forall generators

p

FCCi + 1.generator do begin

forall i-subsets s of p do begin if (s

FCi.generator) then delete p from FCCi+1.generator; end

end

forall generators

p

FCC

i + 1.generator do begin

Sp = Subset (FCCi.generator,p); forall s

Sp do begin

if (p ⊆ s.closure) then

delete p from FCCi+1.generator;

end end

Pembentukan himpunan (i+1)-generator

baru untuk FCCi+1 dilakukan dengan

menggabungkan himpunan i-generator p dan

q di dalam FCi yang memiliki p.item1 =

q.item1 dengan p.itemi < q.itemi. Himpunan

(i+1)-generator pada FCCi+1 akan mengalami

dua proses pruning (pemangkasan) pada

fungsi ini.

Proses pruning pertama dilakukan terhadap (i+1)-generator, jika i-subset pada (i

+1)-generator tidak ada pada himpunan

generators dalam FCi. Proses pruning kedua

dilakukan terhadap (i+1)-generator, jika (i

+1)-generator adalah subset atau sama dengan

closure dari i-generator yang ada pada himpunan generators dalam FCCi.

Pembentukan Minimal Non-Redundant Association Rules

Himpunan frequent closed itemsets (FCi)

yang telah dibentuk pada tahap satu digunakan

untuk membentuk minimal non-redundant

association rules. Minimal non-redundant association rules terdiri dari exact association rules dan approximate association rules.

Pembentukan exact association rules dan

approximate association rules dilakukan melalui dua proses pembentukan yang berbeda (Bastide et al. 2000), yaitu:

a Pembentukan exact association rules Exact association rule r: l1

(l2 \ l1) merupakan aturan asosiasi antara itemsetl1 dan

l2 dengan h(l1) = h(l2). Berdasarkan h(l1) =

h(l2) dianggap l1

l2, sehingga support (l1) =

support (l2) dan nilai confidence = 1 atau 100%. Exact association rules dibentuk menggunakan Algoritma Gen-GB (Bastide et al. 2000) sebagai berikut:

Input: himpunan dari FCi

Output: himpunan dari GB yaitu exact association rules GB • {}

forall set FCi

FC do begin

forall i-generator g

FC

i such

that gh(g) do begin GB GB {(r:g (h(g)\g),

h(g).support)};

end end

return GB;

b Pembentukan approximate association rules Approximate association rule r: l1 → (l2 \ l1) merupakan aturan asosiasi antara itemset

(16)

sebagai berikut:

µ = ukuran maksimal FCi minconfidence = mincof

Succg= himpunan supersets dari h(g) Input: himpunan FCidan nilai

minconfidence

Output: himpunan dari RI yaitu approximate association rules

RI • {}

for (i • 1;i

µ

- 1;i++) do begin forall i-generator g

FCido begin Succg • {};

for (j = |h(g)|;j

µ

;j++)

do begin

S

j • {f

FC|f

h(g)

|f|=j};

end

for (j=|h(g)|;j

µ

; j++) do begin

forall frequent closed itemset

f

Sj do begin

if ( s

Succ

g|s

f)

then do begin

SuccgSuccg

f ; r.confidence •

f.support/g.support; if(r.confidence •

minconfidence)then RIRI {r : g • (f \ g), r.confidence, f.support};

endif end end end end

return RI;

3 Evaluasi Pola

Evaluasi pola yakni melakukan pencarian aturan asosiasi yang menarik dan tidak

misleading (menyesatkan). Tahap ini

dilakukan pada minimal non-redundant

association rules yang telah dihasilkan berdasarkan nilai lift dari minimal non-redundant association rules.

4 Presentasi Pengetahuan

Presentasi pengetahuan merupakan tahap akhir di mana hasil evaluasi pola minimal non-redundant association rules yang telah dihasilkan ditampilkan dalam bentuk tabel.

Tabel memuat minimal non-redundant

association rules, nilai support dan confidence.

Lingkungan Pengembangan Sistem

Lingkungan pengembangan sistem ini adalah sebagai berikut:

Perangkat keras:

• prosesor: Intel Pentium IV, 2.4 Ghz,

• memori: 256 MB RAM,

harddisk dengan kapasitas 80 GB,

, dan

ra k:

i: Microsoft Windows XP

• soft Access 2003, dan

0.

akan adalah basis dat ini ata erangan • keyboard • monitor. Pe ngkat luna

• sistem operas

Professional, DBMS: Micro

• bahasa pemrograman: Visual Basic 6.

Perancangan Basis Data

Basis data yang digun

a pada penelitian Widodo (2004). Pada penelitian ini dilakukan beberapa perubahan dalam basis data sebelumnya untuk kepentingan implementasi Algoritma Close, Algoritma Gen-GB, dan Algoritma Gen-RI.

Basis data yang digunakan dalam sistem terdiri dari sembilan tabel yang dapat dilihat pada Tabel 1, properti dari setiap tabel terdapat pada Lampiran 1.

Tabel 1 Tabel dalam basis d

Nama Tabel Ket

tblTransaksiAsli Data hasil transaksi

tblKelBarang Data kelompok barang

tblTransaksiReduksi Data hasil proses

selection

tblCleanTransaksi Data hasil proses

cleaning

tblBiner Data hasil proses

integration dan

transformation

tblCGenerator Data kandiat

generators

tblGenClosure Data kandidat

frequent closed itemsets

tblClosure Data frequent closed

itemsets

tblBantu Data et dari

r subs

kandidat generato

tblResult Data hasil proses

mining

(17)

Penelitian ini melakukan pencarian

min

ian Widodo (2004), data pra

imal non-redundant association rules

(MNRAA) berdasarkan urutan proses dalam bagan alir minimal non-redundant association rules mining yang ditampilkan pada Gambar 3. Penelitian ini menggunakan hasil praproses yang telah dihasilkan penelitian sebelumnya (Widodo 2004).

Pada penelit

proses menghasilkan 35 jenis kelompok barang (Lampiran 2) dan 23.631 record. Pencarian minimal non-redundant association rules dilakukan melalui dua tahap, yaitu:

Gambar 3 Bagan alir minimal non- redundan

1 Pembentukan Frequent Closed itemsets

s

(FC e

kan

FC

Redundant

h frequent closed

item be

kan minimal non-red

roses pem

n terhadap kedua pendekatan ini (as

osed Itemsets

ng me

t association rules mining.

Pembentukan frequent closed itemset

) dilakukan d ngan membentuk kandidat

frequent closed itemsets (FCC). FCC yang memenuhi nilai minsup akan menjadi FC.

Pada penelitian ini dilakukan pembentu dengan menggunakan empat nilai minsup, yaitu 5 %, 2 %, 1 %, dan 0,5 % dari 23.631 transaksi yang ada. Empat nilai minsup

tersebut dipilih untuk mendapatkan variasi jumlah kandidat FC dan FC.

2 Pembentukan Minimal Non-Association Rules

Setelah diperole

sets, kemudian dilakukan pem ntukan

minimal non-redundant association rules.

Pembentukan minimal non-redundant

association rules dilakukan menggunakan 11 nilai mincof, yaitu 75 %, 70 %, 65 %, 60 %, 55 %, 50 %, 45 %, 40 %, 30 %, 20 %, dan 10 %. Nilai–nilai mincof tersebut digunakan untuk mengetahui nilai maksimum confidence

dari aturan asosiasi pada empat nilai minsup

yang telah dicobakan. Penelitian membanding

undant association rules mining dengan

association rules mining pada penelitian sebelumnya (Widodo 2004). Perbandingan dilakukan terhadap waktu eksekusi pembentukan dan jumlah kandidat FC dan FC

yang memenuhi minsup dengan waktu

eksekusi pembentukan dan jumlah kandidat

itemset dan large itemset yang memenuhi

minsup pada penelitian Widodo (2004). Perbandingan juga dilakukan pada p

bentukan aturan asosiasi. Waktu eksekusi

pembentukan dan jumlah minimal

non-redundant association rules yang memenuhi

mincof dengan waktu eksekusi pembentukan dan jumlah aturan asosiasi yang memenuhi

mincof pada penelitian sebelumnya (Widodo 2004).

Percobaa

sociation rules mining dan minimal non-redundant association rules mining) dilakukan di lingkungan sistem dan data transaksi yang sama. Nilai-nilai minsup dan mincof yang akan dicobakan juga sama.

Pembentukan Frequent Cl

Jumlah kandidat FC dan FC ya

menuhi empat nilai minsup yang dicobakan menggunakan Algoritma Close, disajikan pada Tabel 2. Data generator, closed itemset

(closure) dan support dari closure dalam

(18)

dapat dilihat pada Lampiran 3.

Tabel 2 Pembentukan frequent closed itemsets (FC)

Minsup (%) Parameter

5 2 1 0,5

Kandidat FC1 35 35 35 35

FC1 13 19 24 30

Kandidat FC2 78 171 276 435

FC2 2 11 37 87

Kandidat FC3 - 5 93 407

FC3 - - 5 34

Kandidat FC4 - - - 22

FC4 - - - -

Hasil pembentukan kandidat FC dan FC

dibandingkan dengan hasil pembentukan

kandidat itemset dan large itemset

menggunakan algoritma Apriori dari

penelitian sebelumnya (Widodo 2004). Jumlah kandidat itemset dan large itemset yang memenuhi empat nilai minsup yang dicobakan dapat dilihat pada Tabel 3.

Tabel 3 Pembentukan large itemset Minsup (%) Parameter

5 2 1 0,5

Kandidat 1-itemset 35 35 35 35

Large 1-itemset 13 19 24 30

Kandidat 2-itemset 78 171 276 435

Large 2-itemset 2 11 37 87

Kandidat 3-itemset - 5 93 407

Large 3-itemset - - 5 34

Kandidat 4-itemset - - - 23

Large 4-itemset - - - -

Grafik waktu eksekusi pembentukan kandidat FC dan FC (algoritma Close), dan pembentukan kandidat itemset dan large itemset (algoritma Apriori) untuk empat nilai

minsup yang dicobakan, dapat dilihat pada Gambar 4. 0 100 200 300 400 500 600

5 2 1 0,5

Minsup (%) W akt u ( de ti k) Apriori Close

Gambar 4 Grafik waktu eksekusi.

Berdasarkan data pada Tabel 2 dan Tabel 3 dapat dapat dinyatakan bahwa jumlah

terbentuk sama kecuali pada minsup 0,5 %. Algoritma Close membentuk 22 kandidat FC4 sedangkan algoritma Apriori menghasilkan 23 kandidat 4-itemset.

Perbedaan hasil pada kandidat FC4, disebabkan proses pemangkasan (pruning) kedua pada generator dalam pembentukan kandidat FC4. Generator {003, 008, 009, 025} adalah subset dari atau sama dengan closed itemset dari generator {003, 009, 025} dalam

FC3.

Jumlah FC dari kandidat FC dan jumlah

large itemset dari kandidat itemset yang

memenuhi keempat nilai minsup sama.

Algoritma Close menghasilkan FC yang identik dengan hasil large itemset dari algoritma Apriori.

Hasil algoritma Close berupa kandidat FC

dan FC identik dengan hasil algoritma Apriori

berupa kandidat itemset dan large itemset. Hal ini disebabkan data transaksi yang ditambang bersifat sparse (jarang) atau tidak padat. Data transaksi yang digunakan dalam penelitian ini bersifat tidak padat karena banyak mengandung nilai null. Data transaksi yang jarang mengakibatkan korelasi dalam data lemah.

Data transaksi yang bersifat jarang dan berkorelasi rendah mempengaruhi hasil dari algoritma Close dimana hasil closed itemsets

dari generator adalah generator itu sendiri. Oleh sebab itu, kedua proses pruning dalam algoritma Close tidak bisa memperkecil iterasi proses pembentukan set FC dan memperkecil jumlah kandidat FC dan FC yang terbentuk.

Grafik pada Gambar 4 menunjukkan waktu eksekusi algoritma Close lebih lama dibandingkan waktu eksekusi algoritma

Apriori. Algoritma Close membutuhkan waktu lebih untuk proses akses pada basis data selama proses pembentukan kandidat FC dan

FC. Hal ini juga disebabkan waktu yang

digunakan dua proses pruning dalam

algoritma Close untuk memperkecil iterasi pembentukan set FC menjadi tidak berguna. Oleh sebab itu, waktu eksekusi algoritma

Close menjadi lebih lama.

(19)

Pembentukan Minimal Non-Redundant Association Rules

Minimal non-redundant association rules

dibentuk menggunakan data hasil generators

dan frequent closed itemsets yang memenuhi empat nilai minsup yang telah dicobakan. Jumlah minimal non-redundant association rules terhadap 11 nilai mincof yang dicobakan dapat dilihat pada Tabel 4. Jumlah minimal non-redundant association rules untuk nilai

minsup dan mincof yang dicobakan terdapat pada Lampiran 4.

Tabel 4 Jumlah minimal non-redundant

associaton rules

Minsup (%)

Mincof

(%) 5 2 1 0,5

75 0 0 0 1

70 0 0 1 2

65 0 0 2 4

60 0 0 3 10

55 0 0 5 15

50 0 1 8 25

45 0 1 8 26

40 1 3 10 39

30 1 5 19 73

20 4 14 44 128

10 4 19 77 226

Berdasarkan data hasil large itemset yang memenuhi empat nilai minsup yang telah dicobakan, dilakukan pembentukan aturan asosiasi menggunakan aplikasi penelitian sebelumnya (Widodo 2004). Jumlah aturan asosiasi terhadap 11 nilai mincof yang dicobakan dapat dilihat pada Tabel 5.

Tabel 5 Jumlah aturan asosiasi

Minsup (%)

Mincof

(%) 5 2 1 0,5

75 0 0 0 0

70 0 0 1 1

65 0 0 1 2

60 0 0 2 3

55 0 0 4 5

50 0 0 4 8

45 0 0 4 9

40 1 2 6 15

30 1 3 7 22

20 2 9 16 39

10 2 11 34 71

Pembentukan aturan asosiasi untuk empat nilai minsup yang dicobakan dengan nilai

mincof > 78,67 % tidak lagi menghasilkan aturan asosiasi.

Grafik waktu eksekusi pembentukan

minimal non-redundant association rules

(MNRAA) pada penelitian ini dan aturan asosiasi (AA) pada penelitian Widodo (2004) untuk empat nilai minsup dan 11 nilai mincof

yang dicobakan, dapat dilihat pada Gambar 5.

0 2 4 6 8 10 12

75 70 65 60 55 50 45 40 30 20 10 Mincof (%) Waktu ( d etik) MNRAA AA (a) 0 10 20 30 40 50

75 70 65 60 55 50 45 40 30 20 10

Mincof (%) Waktu (detik) MNRAA AA (b) 0 40 80 120 160 200

75 70 65 60 55 50 45 40 30 20 10 Mincof (%) Waktu (detik) MNRAA AA (c) 0 200 400 600 800 1000 1200

75 70 65 60 55 50 45 40 30 20 10

Mincof (%) Wa ktu ( d eti k ) MNRAA AA

(d)

Gambar 5 Waktu eksekusi pembentukan MNRAA dan AA dari (a)

minsup 5 %, (b) minsup 2 %, (c)

minsup 1 %, dan (d) minsup

(20)

Tabel 5, semakin kecil nilai minsup dan

mincof maka jumlah aturan asosiasi yang dihasilkan semakin banyak. Untuk setiap nilai

minsup dan mincof yang dicobakan, jumlah

minimal non-redundant association rules yang dihasilkan lebih banyak dari jumlah aturan asosiasi.

Pada nilai minsup 2 % dengan nilai mincof

50 % dan 45 %, aturan asosiasi tidak menghasilkan aturan sedangkan minimal non-redundant association rules telah menghasilkan aturan asosiasi, yaitu aturan 026 → 013 (pasta gigi → sabun) dengan support

2,67 % dan confidence 53,64 %. Hal ini berarti 2,67 % dari konsumen akan membeli pasta gigi dan sabun bersamaan dan 53,64 % dari konsumen yang membeli pasta gigi akan selalu diikuti dengan pembelian sabun.

Untuk nilai minsup 0,5 % dan mincof

75 % aturan asosiasi tidak menghasilkan

aturan sedangkan minimal non-redundant

association rules dapat menghasilkan aturan, yaitu aturan 003, 009 → 008 (susu, pelengkap roti → snack) dengan support 0,7 % dan

confidence 78,67 %. Hal ini berarti 0,7 % dari konsumen akan membeli susu, pelengkap roti dan snack bersamaan dan 78,67 % dari konsumen yang membeli susu dan pelengkap roti akan selalu diikuti dengan pembelian snack.

Data minimal non-redundant association rules dengan nilai confidence terbesar dari empat nilai minsup yang telah dicobakan dapat dilihat pada Tabel 6. Data minimal non-redundant association rules yang memiliki korelasi positif dan korelasi negatif terdapat pada Lampiran 5 dan 6.

Tabel 6 Minimal non-redundant association rules dengan nilai confidence terbesar

Minsup (%) Aturan Asosiasi Support (%) Confidence (%)

5 susu → snack 6,54 44,64

2 pasta gigi → sabun

2,67 53,64

1 susu, permen →

snack

1,21 70,44

0,5 susu, pelengkap

roti → snack 0,7 78,67

Data aturan asosiasi dengan nilai

confidence terbesar dari empat nilai minsup

yang telah dicobakan pada penelitian sebelumnya (Widodo 2004) dapat dilihat pada Tabel 7.

confidence terbesar

Minsup (%) Aturan Asosiasi Support (%) Confidence (%)

5 susu → snack 6,54 44,64

2 susu → snack 6,54 44,64

1 susu, permen

→ snack 1,21 70,44

0,5 susu, permen → snack

1,21 70,44

Berdasarkan data hasil pada Tabel 6 dan

Tabel 7, mining minimal non-redundant

association rules menghasilkan aturan asosiasi dengan nilai confidence tertinggi yang berbeda-beda untuk empat nilai minsup yang dicobakan. association rules mining pada penelitian Widodo (2004) menghasilkan aturan asosiasi dengan confidence tertinggi yang sama untuk minsup 5% dan 2 %, begitu juga untuk minsup 1 % dan 0,5 %

Minimal non-redundant association rules

menghasilkan aturan asosasi yang lebih banyak mengandung informasi dibandingkan aturan asosiasi yang dihasilkan pada penelitian sebelumnya (Widodo 2004). Jika penelitian Widodo (2004) menghasilkan aturan asosiasi (013 → 026) untuk minsup

1 % dan mincof 10 %, maka selain menghasilkan aturan asosasi yang sama,

minimal non-redundant association rules juga menghasilkan aturan asosasi (026 → 013) dengan informasi nilai support yang sama, yaitu 2,67 % tetapi nilai confidence yang berbeda. Nilai confidence aturan asosiasi (013 → 026) adalah 26,7 % sedangkan aturan asosiasi (026 → 013) adalah 53,64 %.

Selain membentuk aturan asosiasi yang berbeda, waktu eksekusi pembentukan aturan asosiasi juga memiliki perbedaan yang cukup signifikan. Berdasarkan grafik waktu eksekusi

pembentukan minimal non-redundant

association rules dan aturan asosiasi dari penelitian sebelumnya (Widodo 2004) untuk empat nilai minsup yang ditunjukkan pada Gambar 5, semakin kecil nilai minsup, maka waktu eksekusi untuk pembentukan minimal non-redundant association rules dan aturan asosiasi semakin lama.

Rataan perbedaan waktu eksekusi pembentukan aturan asosiasi untuk masing-masing nilai minsup berbeda-beda. Untuk

minsup 5 %, rataan perbedaan waktu eksekusi adalah 9 detik, minsup 2 % adalah 40,45 detik,

(21)

Hasil Perbandingan Mining Minimal

Non-Redundant Association Rules dengan

Mining Association Rules pada Penelitian Widodo(2004)

Algoritma Apriori yang digunakan pada penelitian Widodo (2004), membentuk large itemset dengan membangkitkan itemset lattice

yang ada dalam basis data. Secara umum

proses pembangkitan itemset lattice

memerlukan waktu penelusuran basis data dan penggunaan sumberdaya komputasi yang besar.

Algoritma Close menggunakan closed itemset lattice yang merupakan sub-order dari

itemset lattice untuk membentuk generators

dan frequent closed itemsets. Penggunaan

closed itemset lattice bisa mengurangi waktu penelusuran basis data dan penggunaan sumberdaya komputasi yang besar.

Generators dan frequent closed itemsets

yang dihasilkan algoritma Close sangat

mempengaruhi pembentukan minimal

non-redundant association rules. Proses pruning

kedua dalam algoritma Close bertujuan

menghilangkan frequent closed itemsets yang berulang, sehingga tidak terjadi pembentukan aturan asosiasi yang berulang dalam minimal non-redundant association rules.

Grafik total waktu eksekusi minimal non-redundant association rules mining, meliputi waktu pembentukan frequent closed itemsets

(algoritma Close) dan waktu rata-rata

pembentukan minimal non-redundant

association rules (MNRAA) pada penelitian ini dapat dilihat pada Gambar 6.

0 100 200 300 400 500 600

5 2 1 0,5

Minsup (%)

W

aktu (detik)

MNRAA Close

Gambar 6 Total waktu eksekusi minimal non-redundant association rules mining.

Grafik total waktu eksekusi association rules mining, meliputi waktu pembentukan

large itemsets (algoritma Apriori) dan waktu rata-rata pembentukan aturan asosiasi (AA) pada penelitian Widodo (2004) dapat dilihat pada Gambar 7.

0 200 400 600 800 1000 1200

5 2 1 0,5

Minsup (%)

Waktu (detik)

AA Apriori

Gambar 7 Total waktu eksekusi

association rules mining.

Grafik pada Gambar 6 dan Gambar 7

menunjukkan pada minsup 5 % dan 2 %,

minimal non-redundant association rules mining membutuhkan waktu eksekusi lebih lama. Minimal non-redundant association rules mining membutuhkan waktu lebih lama untuk eksekusi algoritma Close, sedangkan

association rules mining membutuhkan waktu lebih lama untuk pembentukan aturan asosiasi. Pada minsup 1 % dan 0,5 %, association rules mining membutuhkan waktu eksekusi

lebih lama. Association rules mining

membutuhkan waktu lebih lama untuk pembentukan aturan asosiasi, sedangkan

minimal non-redundant association rules mining membutuhkan waktu lebih lama untuk eksekusi algoritma Close.

Penelitian ini menggunakan data transaksi yang bersifat tidak padat sehingga memiliki korelasi yang lemah dalam data. Hal

ini membuat algoritma Close tidak

memperlihatkan keunggulannya dalam efisiensi waktu dan penggunaan sumberdaya komputasi.

Pembentukan minimal non-redundant

association rules membutuhkan waktu eksekusi lebih sedikit. Pembentukan aturan asosiasi yang menggunakan aplikasi penelitian Widodo (2004) membutuhkan waktu eksekusi yang lebih lama. Hal ini disebabkan pembentukan aturan asosiasi dilakukan dengan mengkombinasikan semua item yang

ada dalam large itemset, sehingga

membutuhkan waktu eksekusi yang lebih lama dan sumberdaya komputasi yang besar.

Berdasarkan data transaksi yang digunakan, jumlah aturan asosiasi yang dihasilkan oleh aplikasi penelitian Widodo (2004) lebih kecil dibandingkan jumlah

(22)

rules tidak terlihat.

Meskipun begitu, mining minimal non-redundant association rules mampu menghasilkan aturan asosiasi yang mengandung informasi lebih banyak yang tidak dihasilkan oleh aplikasi penelitian sebelumnya (Widodo 2004). Terbentuknya aturan asosasi tersebut merupakan keunggulan lain yang dimiliki mining minimal non-redundant association rules.

Berdasarkan hasil perbandingan, mining minimal non-redundant association rules

memiliki keunggulan dibandingkan mining association rules pada penelitian sebelumnya (Widodo 2004). Keunggulan dalam waktu eksekusi, penggunaan sumberdaya komputasi dan hasil aturan asosiasi yang dihasilkan.

Pada penelitian ini, keunggulan mining non-redundant association rules hanya terlihat

pada proses pembentukan minimal

non-redundant association rules saja. Algoritma

Close tidak memperlihatkan keunggulannya karena sifat data transaksi yang tidak padat dan berkorelasi lemah.

KESIMPULAN DAN SARAN

Kesimpulan

Penelitian ini menerapkan teknik minimal non-redundant association rules mining

menggunakan generators dan frequent closed itemsets untuk membentuk aturan asosisi yang tidak berulang. Algoritma Close menggunakan teknik pruning terhadap closed itemset lattice, untuk membentuk generators dan frequent closed itemsets.

Minimal non-redundant association rules mining menghasilkan aturan asosiasi yang mengandung informasi lebih banyak dibandingkan dengan mining association rules. Pada penelitian ini, mining minimal non-redundant association rules mampu menghasilkan aturan asosiasi 003, 009 → 008 (susu, pelengkap roti → snack) dengan nilai

support 0,7 % dan confidence 78,67 % untuk

nilai minsup 0,5 % dan mincof 75 %

sedangkan mining association rules tidak menghasilkan aturan tersebut.

Berdasarkan hasil penelitian, dapat

dinyatakan keunggulan minimal

non-redundant association rules mining sebagai berikut:

berulang dengan anteseden yang minimal dan konsekuen yang maksimal,

2 menghasilkan aturan asosasi yang lebih banyak mengandung informasi dari basis data. Jika dihasilkan aturan asosiasi 001 → 003 (mie instant → susu) maka akan dihasilkan juga aturan asosasi 003 → 001 (susu → mie instant) dengan informasi nilai support yang sama tetapi nilai

confidence yang berbeda,

3 efisiensi terhadap waktu eksekusi dan

penggunaan sumberdaya komputasi. Waktu eksekusi pembentukan aturan asosiasi tercepat adalah 2 detik yang terjadi pada nilai minsup terbesar, yaitu 5 % sedangkan waktu eksekusi paling lama sekitar 43 detik terjadi pada nilai

minsup terkecil, yaitu 0,5 %.

Data transaksi dalam penelitian ini memiliki sifat data yang tidak padat dan berkorelasi rendah, sehingga algoritma Close

membutuhkan waktu eksekusi lebih lama. Semakin kecil nilai minsup, maka semakin lama waktu yang dibutuhkan untuk membentuk generators dan frequent closed itemsets.

Saran

Aplikasi mining minimal non-redundant association rules yang telah dihasilkan dapat dicobakan dengan menggunakan data yang bersifat padat dan memiliki korelasi tinggi,

sehingga mining minimal non-redundant

association rules dapat memperlihatkan keunggulannya.

Aplikasi mining minimal non-redundant association rules yang telah dihasilkan, dapat dikembangkan dengan menggunakan algoritma lain untuk membentuk generators

dan frequent closed itemsets yang lebih sedikit pada data yang bersifat jarang.

DAFTAR PUSTAKA

Bastide Y, Pasquier N, Taouil R, Stumme G, Lakhal L. 2000. Mining Minimal Non-Redundant Association Rules using Frequent Closed Itemsets. France: Blaise Pascal University.

Godin R, Missaoui R, Alaoui H. 1995.

Incremental Concept Formation Algorithms based on Galois (Concept)

(23)

Han J, Kamber M. 2006. Data Mining: Concepts and Techniques (second edition). San Diego, USA: Morgan-Kaufmann.

Pasquier N, Bastide Y, Taouil R, Lakhal L. 1998. Pruning Closed Itemset Lattices for Association Rules. France: Blaise Pascal University.

---. 1999. Discovering Closed Itemsets for Association Rules. France: Blaise Pascal University.

Priss U. 2006. Formal Concept Analysis in Information Science. Di dalam: Cronin,

Blaise, editor. Annual Review of

Information Science and Technology. American Society for Information Science and Technology. hlm 521-543.

(24)
(25)

Lampiran 1 Daftar properti tabel a Properti tblTransaksiAsli

Nama atribut Tipe Data Keterangan

Tanggal Date/time Primary Key

Berisi tanggal transaksi

NoRegistrasi Text Berisi nomor registrasi dari petugas kasir

KodeShif Text Primary Key

Berisi kode shif petugas kasir

PosNumber Text Primary Key

Berisi urutan masukan data yang terjual KodeBarang Text Berisi kode barang

Satuan Text Berisi jenis satuan barang Harga Number Berisi harga barang

Kelompok Text Berisi kode kelompok barang b Properti tblKelBarang

Nama atribut Tipe Data Keterangan

NO_ID Number Primary Key

Berisi kode kelompok barang Nama Text Berisi nama kelompok barang c Properti tblTransaksiReduksi

Nama atribut Tipe Data Keterangan

Tanggal Date/time Primary Key

Berisi tanggal transaksi

KodeShif Text Primary Key

Berisi kode shif petugas kasir

PosNumber Text Primary Key

Berisi urutan masukan data yang terjual Kelompok Text Berisi kode kelompok barang

d Properti tblCleanTransaksi

Nama atribut Tipe Data Keterangan

Tanggal Date/time Primary Key

Berisi tanggal transaksi

KodeShif Text Primary Key

Berisi kode shif petugas kasir

PosNumber Text Primary Key

Berisi urutan masukan data yang terjual Kelompok Text Berisi kode kelompok barang

e Properti tblBiner

Nama atribut Tipe Data Keterangan

TID AutoNumber Primary Key

(26)

Nama atribut Tipe Data Keterangan 008 Number Berisi data biner item 008 009 Number Berisi data biner item 009 010 Number Berisi data biner item 010 011 Number Berisi data biner item 011 012 Number Berisi data biner item 012 013 Number Berisi data biner item 013 014 Number Berisi data biner item 014 015 Number Berisi data biner item 015 016 Number Berisi data biner item 016 017 Number Berisi data biner item 017 018 Number Berisi data biner item 018 019 Number Berisi data biner item 019 020 Number Berisi data biner item 020 021 Number Berisi data biner item 021 022 Number Berisi data biner item 022 023 Number Berisi data biner item 023 024 Number Berisi data biner item 024 025 Number Berisi data biner item 025 026 Number Berisi data biner item 026 027 Number Berisi data biner item 027 028 Number Berisi data biner item 028 029 Number Berisi data biner item 029 030 Number Berisi data biner item 030 031 Number Berisi data biner item 031 032 Number Berisi data biner item 032 033 Number Berisi data biner item 033 034 Number Berisi data biner item 034 035 Number Berisi data biner item 035 f Properti tblCGenerator

Nama atribut Tipe Data Keterangan

Generator Text Berisi data generator Length Number Berisi data jumlah generator

g Properti tblGenClosure

Nama atribut Tipe Data Keterangan

Generator Text Berisi data generator

Closure Text Berisi data kandidat closed itemset dari generator Support Number Berisi nilai support dari kandidat closed itemset h Properti tblClosure

Nama atribut Tipe Data Keterangan

Generator Text Berisi data generator

Closure Text Berisi data frequent closed itemset dari generator Support Number Berisi nilai support dari frequent closed itemset LengthG Number Berisi data jumlah generator

(27)

Lampiran 1 Lanjutan i Properti tblBantu

Nama atribut Tipe Data Keterangan

Generator Text Berisi data generator

Subset Text Berisi data subset dari generator j Properti tblResult

Nama atribut Tipe Data Keterangan

NO Number Berisi nomor urut aturan asosiasi yang terbentuk Antecedent Text Berisi data anteseden dalam aturan asosiasi Implies Text Berisi simbol untuk aturan asosiasi Consequent Text Berisi data konsekuen dalam aturan asosiasi Support Number Berisi nilai support dari aturan asosiasi Confidence Number Berisi nilai confidence dari aturan asosiasi

Lampiran 2 Tabel daftar kelompok barang No_ID Nama Barang

001 Mie instant 002 Minyak goreng 003 Susu

004 Kopi

005 Makanan Pokok 006 Permen

007 Minuman 008 Snack

009 Pelengkap roti 010 Saus kecap 011 Makanan kaleng 012 Lotion

013 Sabun 014 Shampo 015 Obat nyamuk 016 Pengharum ruangan 017 Bumbu dapur 018 Tepung 019 Susu bayi 020 Rokok 021 Baterai 022 Es krim 023 Sosis

024 Perlengkapan komputer 025 Obat

026 Pasta gigi 027 Multivitamin 028 Perlengkapan bayi

029 Handuk dan pakaian dalam 030 Perlengkapan dapur 031 Tissue dan pembalut 032 Sandal

033 Korek

(28)

a Kandidat FC1 dengan minsup 5 %

NO Generator Closure Support (%) NO Generator Closure Support (%)

1 001 001 9,555245 19 019 019 5,221954

2 002 002 1,56574 20 020 020 7,701748

3 003 003 14,73911 21 021 0

4 004 004 7,85409 22 022 022 4,350218

5 005 005 5,844018 23 023 023 0,7109306

6 006 006 8,531167 24 024 024 0,4147095

7 007 007 30,01566 25 025 025 5,585883

8 008 008 29,38513 26 026 026 4,993441

9 009 009 2,869112 27 027 027 0,7151623

10 010 010 2,945284 28 028 028 2,941052

11 011 011 0,4612585 29 029 029 1,675765

12 012 012 5,920189 30 030 030 0,7617113

13 013 013 10,0292 31 031 031 5,001904

14 014 014 2,170877 32 032 032 0,0507807

15 015 015 1,599594 33 033 033 0,9944564

16 016 016 1,180652 34 034 034 0,6432229

17 017 017 1,299141 35 035 035 0,6432229

18 018 018 0,3893191

b FC1 dengan minsup 5 %

NO Generator Closure Support (%)

1 001 001 9,555245

2 003 003 14,73911

3 004 004 7,85409

4 005 005 5,844018

5 006 006 8,531167

6 007 007 30,01566

7 008 008 29,38513

8 012 012 5,920189

9 013 013 10,0292

10 019 019 5,221954

11 020 020 7,701748

12 025 025 5,585883

13 031 031 5,001904

c Kandidat FC2 dengan minsup 5 %

(29)

Lampiran 3 Lanjutan

NO Generator Closure Support (%) NO Generator Closure Support (%) 27 004,008 004,008 2,192036 53 007,013 007,013 1,684228 28 004,012 004,012 0,4866489 54 007,019 007,019 0,5966738 29 004,013 004,013 1,434556 55 007,020 007,020 0,9902247 30 004,019 004,019 0,2962211 56 007,025 007,025 0,9013584 31 004,020 004,020 0,3893191 57 007,031 007,031 0,9436757 32 004,025 004,025 0,4189412 58 008,012 008,012 1,773095 33 004,031 004,031 0,5205027 59 008,013 008,013 3,216115 34 005,006 005,006 0,406246 60 008,019 008,019 1,362617 35 005,007 005,007 0,7786382 61 008,020 008,020 0,8124921 36 005,008 005,008 1,261055 62 008,025 008,025 1,362617 37 005,012 005,012 0,2369768 63 008,031 008,031 1,582667 38 005,013 005,013 1,036774 64 012,013 012,013 1,489569 39 005,019 005,019 0,1777326 65 012,019 012,019 0,1861961 40 005,020 005,020 0,1354153 66 012,020 012,020 0,2073547 41 005,025 005,025 0,3343066 67 012,025 012,025 0,3935508 42 005,031 005,031 0,3004528 68 012,031 012,031 0,8378825 43 006,007 006,007 2,035462 69 013,019 013,019 0,5712835 44 006,008 006,008 3,762007 70 013,020 013,020 0,2750624 45 006,012 006,012 0,579747 71 013,025 013,025 0,7659431 46 006,013 006,013 0,8801997 72 013,031 013,031 1,155262 47 006,019 006,019 0,3385383 73 019,020 019,020 0,1311836 48 006,020 006,020 0,2581355 74 019,025 019,025 0,2454403 49 006,025 006,025 0,4020143 75 019,031 019,031 0,2242817 50 006,031 006,031 0,4612585 76 020,025 020,025 0,1777326 51 007,008 007,008 6,262959 77 020,031 020,031 0,0846345 52 007,012 007,012 0,9267488 78 025,031 025,031 0,3258432 d FC2 dengan minsup 5 %

NO Generator Closure Support (%) 1 003,008 003,008 6,580339 2 007,008 007,008 6,262959 e Kandidat FC1 dengan minsup 2 %

NO Generator Closure Support (%) NO Generator Closure Support (%)

1 001 001 9,555245 17 017 017 1,299141

2 002 002 1,56574 18 018 018 0,3893191

3 003 003 14,73911 19 019 019 5,221954

4 004 004 7,85409 20 020 020 7,701748

5 005 005 5,844018 21 021 0

6 006 006 8,531167 22 022 022 4,350218

7 007 007 30,01566 23 023 023 0,7109306

8 008 008 29,38513 24 024 024 0,4147095

9 009 009 2,869112 25 025 025 5,585883

10 010 010 2,945284 26 026 026 4,993441

11 011 011 0,4612585 27 027 027 0,7151623

12 012 012 5,920189 28 028 028 2,941052

13 013 013 10,0292 29 029 029 1,675765

14 014 014 2,170877 30 030 030 0,7617113

15 015 015 1,599594 31 031 031 5,001904

(30)

NO Generator Closure Support (%)

33 033 033 0,9944564

34 034 034 0,6432229

35 035 035 0,6432229

f FC1 dengan minsup 2 %

NO Generator Closure Support (%) NO Generator Closure Support (%)

1 001 001 9,555245 11 013 013 10,0292

2 003 003 14,73911 12 014 014 2,170877

3 004 004 7,

Gambar

Gambar 1  Tahapan dalam KDD (Han &
Gambar 2 menunjukkan datasetmemiliki  D yang closed itemset lattice sesuai dengan
Tabel 1 Tabel dalam basis data
Gambar 3 Bagan alir minimal non- redundan  t association rules mining.
+7

Referensi

Dokumen terkait

(If Dalam  kondisi  normal,  baku  mutu  air  limbah  sebagaimana  climaksud  dalam  Pasal  4  setiap  saat  tidak  boleh  dilampaui  oleh  perianggung  jawab 

Lagipula, dalam konteks skripsi ini yang dibahas adalah potensi instabilitas terkait sengketa wilayah, sulit untuk memikirkan adanya negara yang akan melakukan bandwagoning

Data keluaran yang akan ditampilkan pada sistem adalah berupa data solusi atau rekomendasi untuk suatu fakta yang dilakukan oleh siswa-siswi...

Kinerja suatu perusahaan tidak terlepas dari kinerja setiap individu karyawan yang bekerja di dalam perusahaan tersebut. Kinerja karyawan merupakan salah satu faktor utama pendorong

Struktur dari sampel dengan 30% Al2O3 pada permukaan didapatkan lebih berporos hal ini kemungkinan disebabkan karena terlalu banyaknya kandungan Al2O3 yang dicampurkan pada

Berdasarkan hasil penelitian, terdapat beber- apa implikasi sebagai berikut: pertama, Itjen perlu membuat policy recommendation kepada DJPB agar PMK 219 Tahun 2013

Dans l'apprentissage de la langue française, les supports audiovisuels peuvent être utilisés pour améliorer les compétences linguistiques des apprenants, et notamment

/\) This Supplementary Agreement applies to any collaborative activities between the Center and Indonesian research institutions except as otherwise agreed by the Parties or