• Tidak ada hasil yang ditemukan

Belajar Mudah Algoritma Data Mining : Apriori

N/A
N/A
Protected

Academic year: 2021

Membagikan "Belajar Mudah Algoritma Data Mining : Apriori"

Copied!
6
0
0

Teks penuh

(1)

1

Belajar Mudah Algoritma Data Mining : Apriori

Algoritma apriori merupakan salah satu algoritma klasik data mining. Algoritma apriori digunakan agar komputer dapat mempelajari aturan asosiasi. Tabel 1 di bawah ini merupakan contoh transaksi pada suatu toko swalayan :

Tabel 1. Tabel Transaksi Barang yang Dibeli Transaksi Barang yang Dibeli

T1 Barang1, Barang2, Barang3 T2 Barang1, Barang2

T3 Barang2, Barang5

T4 Barang1, Barang2, Barang5

Mempelajari aturan asosiasi berarti komputer diminta untuk mencari barang-barang yang sering dibeli bersamaan. Pada Tabel 1 di atas, barang-barang yang paling sering dibeli bersamaan adalah Barang1 dan Barang2. Untuk selanjutnya barang disebut dengan item dan himpunan barang disebut itemset.

Contoh pemakaian hasil dari mempelajari aturan asosiasi :

• Meletakkan barang-barang yang sering dibeli bersamaan dengan posisi berdekatan atau mudah dijangkau sehingga diharapkan pembeli membeli barang lebih banyak. Cara ini dikembangkan oleh Wal-Mart yang merupakan salah satu pasar swalayan populer di Amerika. Saat itu Wal-Mart menganalisis data yang dimilikinya, dan menemukan bahwa pada hari Jumat sore, pembeli laki-laki yang membeli popok, ternyata cenderung membeli bir. Dari hasil temuan tersebut, Wal-Mart menempatkan bir di dekat tempat penjualan popok, dan alhasil penjualan bir meningkat. Kasus ini menjadi terkenal, karena sebelumnya banyak yang tidak menduga akan ampuhnya data mining.

Amazon.com, mengembangkan perekomendasi (recommender), yaitu sebuah program untuk merekomendasikan barang-barang lain kepada pembeli pada saat pembeli melakukan browsing atau membeli suatu barang.

• Google mengembangkan fitur auto-complete, yaitu saat pemakai mengetikkan suatu kata, program akan menampilkan daftar kata-kata berikutnya, yang paling banyak memiliki asosiasi pada kata yang diketik.

Berikut ini adalah langkah-langkah menggunakan algoritma apriori untuk mempelajari aturan asosiasi transaksi barang-barang yang dibeli, dengan contoh yang lebih kompleks pada Tabel 2. Untuk menggunakan algoritma apriori, golden rule yang digunakan adalah : sebuah item atau itemset disebut sering dibeli jika dibeli 60% kali. Jadi dalam kasus ini adalah barang yang dibeli paling sedikit tiga kali.

(2)

2 Tabel 2. Transaksi Barang yang Dibeli

ID Transaksi Barang yang Dibeli

T1 {Mango, Onion, Nintendo, Key-chain, Eggs, Yo-yo} T2 {Doll, Onion, Nintendo, Key-chain, Eggs, Yo-yo} T3 {Mango, Apple, Key-chain, Eggs}

T4 {Mango, Umbrella, Corn, Key-chain, Yo-yo} T5 {Corn, Onion, Onion, Key-chain, Ice-cream, Eggs}

Untuk mempermudah, nama-nama item di Tabel 2, disingkat dengan diambil huruf awalnya saja, sebagai contoh :

M = Mango O = Onion Dan sebagainya.

Sehingga Tabel 2, menjadi seperti Tabel 3 di bawah :

Tabel 3. Transaksi Barang yang Dibeli

ID Transaksi Barang yang Dibeli

T1 {M, O, N, K, E, Y } T2 {D, O, N, K, E, Y } T3 {M, A, K, E} T4 {M, U, C, K, Y } T5 {C, O, O, K, I, E}

Langkah ke-1 : Hitung banyaknya transaksi untuk setiap item. Hati-hati, untuk item O (Onion) dibeli sebanyak 4 biji, namun pembelian O hanya ada 3 transaksi.

Tabel 4. Banyaknya Transaksi per Item

Item Banyaknya Transaksi M 3 O 3 N 2 K 5 E 4 Y 3 D 1 A 1 U 1 C 2 I 1

(3)

3 Langkah ke-2 : Berdasarkan golden rule yang telah disebutkan di atas, saring data pada Tabel 4, hanya memilih item yang memiliki transaksi minimal sebanyak 3 transaksi. Item yang banyaknya transaksi kurang dari 3, dibuang. Hasilnya dapat dilihat di Tabel 5.

Tabel 5. Item yang Paling Sering Dibeli

Item Banyaknya Transaksi M 3 O 3 K 5 E 4 Y 3

Langkah ke-3 : Buat pasangan item dimulai dari item pertama, yaitu MO, MK, ME, MY. Kemudian dilanjutkan dengan item kedua. Misalnya OK, OE, OY. Perhatikan, OM tidak dibuat karena OM = MO (pasangan yang dibuat dari item pertama).

Tabel 6. Pasangan Item Pasangan Item MO MK ME MY OK OE OY KE KY EY

Langkah ke-4 : Hitung berapa kali suatu pasangan item dibeli bersamaan. Contohnya pasangan MO dibeli secara bersamaan dalam itemset {M, O, N, K, E, Y}. Pasangan MK dibeli bersamaan sebanyak 3 kali yaitu di dalam {M,O,N,K,E,Y}, {M,A,K,E}, dan {M,U,C, K, Y}. Hasilnya dapat dilihat pada Tabel 7.

(4)

4 Tabel 7. Banyaknya Transaksi Pasangan Item

Pasangan Item Banyaknya Transaksi MO 1 MK 3 ME 2 MY 2 OK 3 OE 3 OY 2 KE 4 KY 3 EY 2

Langkah ke-5 : Gunakan golden rule, hapus semua pasangan item yang banyaknya transaksi kurang dari tiga. Hasilnya adalah pada Tabel 8.

Tabel 8. Transaksi Pasangan Item yang Terbanyak Pasangan Item Banyaknya Transaksi MK 3 OK 3 OE 3 KE 4 KY 3

Langkah ke-6 : Buat pasangan tiga item dengan aturan menggunakan pasangan item pada Tabel 8 yang memiliki huruf awal yang sama yaitu :

• OK dan OE, menjadi OKE • KE dan KY, menjadi KEY

Kemudian hitung ada beberapa banyaknya transaksi dari pasangan tiga item berdasarkan Tabel 3. Hasilnya dapat dilihat pada Tabel 9.

(5)

5 Tabel 9. Banyak Transaksi 3 Pasang Item

Pasangan Item Banyaknya Transaksi

OKE 3

KEY 2

Dalam langkah ini, misalkan ada tiga pasangan item ABC, ABD, ACD, ACE, BCD dan akan dibuatkan pasangan 4 item, carilah 2 huruf awal yang sama. Contoh :

• ABC dan ABD, menjadi ABCD • ACD dan ACE, menjadi ACDE

Dan seterusnya. Secara umum, carilah pasangan item yang huruf (item) terakhirnya berbeda. Langkah ke-7 : Gunakan lagi golden rule, dengan membuang pasangan tiga item yang banyaknya transaksi kurang dari 3. Hasilnya tinggal OKE karena KEY hanya dibeli bersamaan dua kali.

Kesimpulan : Tiga item yang sering dibeli bersamaan adalah O, K, dan E. \

Pengertian Dukungan (Support) dan Keyakinan (Confidence)

Di situs Amazon.com, terdapat fitur Frequently Bought Together (barang yang sering dibeli bersamaan) dan Customers who bought this item also bought (barang yang juga dibeli oleh pembeli saat membeli suatu barang). Algoritma apriori dapat digunakan untuk menentukan Frequently Bought Together berdasarkan significance of support, dan menentukan Customers who bought this item also bought berdasarkan tingkat keyakinan (confidence).

Yang dimaksud dengan dukungan atau significance of support, ada pada golden rule yang telah digunakan di atas yaitu ; sebuah item atau itemset disebut sering dibeli jika dibeli 60% kali. Hal

(6)

6 tersebut menunjukkan bahwa dukungan minimum (minimum support) adalah 60%. Dengan kata lain, suatu itemset disebut sering dibeli jika minimal 60% itemset tersebut ada pada keseluruhan transaksi dan dapat digunakan pada Frequently Bought Together. Pada contoh di atas, itemset O, K, E adalah Frequently Bought Together.

Untuk mengetahui tingkat keyakinan, frequent itemset (yaitu {O, K, E}) dapat digunakan untuk mencari aturan-aturan asosiasi antar item di dalam frequent itemset tersebut. Caranya adalah ; 1. Itemset dibuatkan himpunan bagiannya. Hasilnya seperti pada contoh di bawah :

• {O} • {K} • {E} • {O, K} • {K, E} • {O, E}

2. Cari asosiasi pada semua himpunan bagian yang telah dibuat, misal :

{O} => {K, E} artinya : jika O dibeli, bagaimana kemungkinan K dan E akan dibeli pada transaksi yang sama. O dibeli pada 3 transaksi dan di dalam 3 transaksi tersebut, K dan E juga dibeli. Maka keyakinannya adalah : 3/3 x 100% = 100%.

{K} => {O,E} : keyakinannya adalah 3/5 x 100% = 60% {E} => {O,K} : keyakinannya adalah 3/4 x 100% = 75% {K,E} => {O} : keyakinannya adalah 3/3 x 100% = 100% {O,E} => {K} : keyakinannya adalah 3/3 x 100% = 100% {O,K} => {E} : keyakinannya adalah 3/4 x 100% = 100%

<eof>

Sumber : Vithlani, Nikhil (2012), Apriori algorithm for Data Mining – Made Simple, http://nikhilvithlani.blogspot.com/2012/03/apriori-algorithm-for-data-mining-made.html, 30 Des 2013.

Gambar

Tabel 4. Banyaknya Transaksi per Item
Tabel 6. Pasangan Item  Pasangan Item  MO  MK  ME  MY  OK  OE  OY  KE  KY  EY
Tabel 8. Transaksi Pasangan Item yang Terbanyak  Pasangan  Item  Banyaknya Transaksi  MK  3  OK  3  OE  3  KE  4  KY  3

Referensi

Dokumen terkait

Setelah itu dari hasil frequent itemset atau termasuk dalam Large 2- itemset terse- but, dibentuk aturan asosiasi ( association rule) yang memenuhi nilai minimum. support dan

Setelah frequent itemset terbentuk,tahap selanjutnya adalah proses pembentukan aturan. Aturan asosiasi yang terbentuk adalah aturan asoisasi yang telah memenuhi minimum support

Pada Tabel diatas menampilkan 22 itemset dari total record dataset sebanyak 683 data yang akan diolah menggunakan perhitungan apriori dengan minimum support 70 % dan didapat

Proses yang terjadi dalam algoritma apriori ketika memindai seluruh item yang ada di dataset, kemudian pemrosesan berlanjut untuk menghitung nilai support count

Support 26%, artinya 26% dari semua transak- si yang dianalisis menunjukkan bahwa anti par- asitik dan antibiotika dibeli bersamaan, sedan- gkan confidence

Hasil pengujian apriori untuk menentuka minimal support terbaik Percobaan Minimal Support Hasil Pengujian 1 0.5 Tidak terdapat itemset 2 0.05 Terdapat 14 itemset 3 0.02 Terdapat 52

2 Hasil perhitungan dengan algoritma apriori menunjukkan bahwa nilai itemset ke-3 dari data matakuliah mahasiswa merupakan nilai matakuliah dominan yang digunakan dalam meningkatkan

Output Nilai Support 2 Itemset Pada titik ini, library panda diimpor untuk menampilkan dua data kumpulan item yang telah menerima dukungan, dan membaca kumpulan data Excel berlanjut..