• Tidak ada hasil yang ditemukan

Data Mining III Asosiasi

N/A
N/A
Protected

Academic year: 2021

Membagikan "Data Mining III Asosiasi"

Copied!
46
0
0

Teks penuh

(1)

Data Mining III

Asosiasi

Mata Kuliah Data Warehouse Universitas Darma Persada

Oleh

Adam Arif B 2011

(2)

Data Mining - Asosiasi

• Market basket analysis

• Tool untuk menemukan pengetahuan

berdasarkan hubungan asosiasi dua set data berdasarkan hubungan asosiasi dua set data

(3)

Data Mining - Asosiasi

• Bila diberi data transaksi item belanja dari 14 pengunjung pada swalayan UNSADA

(4)

Data Mining - asosiasi

• Informasi apa yang bisa diperoleh dari data tersebut?

• Pengetahuan apa yang tersimpan dalam data • Pengetahuan apa yang tersimpan dalam data

(5)

Istilah-istilah

• Data di atas merupakan data historis, data masa lalu

data latihan/training data

data data pengalaman

• Algoritma aturan asosiasi akan menggunakan data • Algoritma aturan asosiasi akan menggunakan data

latihan ini untuk menemukan pengetahuan sesuai dengan definisi data mining

• Pengetahuan yang dihasilkan adalah mengetahui item-item belanja yang sering dibeli secara

(6)

Istilah-istilah (lanj)

• Aturan asosiasi yang berbentuk

if….then….” atau “jika….maka”,

merupakan pengetahuan yang dihasilkan dari fungsi aturan asosiasi.

Item barang yang dibeli atau barang yang • Item barang yang dibeli atau barang yang

menjadi objek kegiatan belanja.

• Pada swalayan unsada terdapat 7 jenis item yaitu (urut abjad) asparagus, beans,

(7)

Istilah-istilah (lanj)

• Himpunan item dilambangkan dengan I

merupakan himpunan dari semua jenis item yang akan dibahas.

• Persamaan himpunan item

Persamaan 1: Persamaan 1:

I = {asparagus, beans, brocolli, corn, green peppers, squash, tomatoes}

• Himpunan item yang dibeli pengunjung ke–i disebut transaksi ke – i

(8)

Istilah-istilah (lanj)

Persamaan 2:

• T1 = {brocolli, green, peppers, corn} • T2 = {Asparagus, squash, corn}

• ………

• T14 = {corn, green, peppers, tomatoes, beans, brocolli}

(9)

Persamaan 3:

• Himpunan seluruh transaksi dilambangkan dengan D sehingga persamaan 3 ini

dengan D sehingga persamaan 3 ini menjadi:

(10)

Istilah-istilah

Persamaan 4 implikasi

jika A, maka B” atau “ A

B ”

• A disebut anteseden atau pendahulu

• B disebut konsekuen atau pengikut

Aturan asosiasi yang dihasilkan nanti harus Aturan asosiasi yang dihasilkan nanti harus

memenuhi dua sifat

(11)

Istilah-istilah

2. A dan B adalah dua himpunan yang saling lepas. Sehingga disimbolkan pada

persamaan 6:

A

B =

ø

Salah satu ukuran kinerja bagi aturan asosiasi Salah satu ukuran kinerja bagi aturan asosiasi

A

B ” adalah besaran support

(dukungan) yang dilambangkan dengan

s(A

B). Dan didefinisikan sebagaimana

(12)

Istilah-istilah (lanj)

Persamaan 7

• Ukuran kinerja lain bagi aturan asosiasi “A

B “ adalah besaran support yang

dilambangkan dengan conf (A ⇒ B ) dan

(13)

Istilah-istilah (lanj)

Persamaan 8

Jumlah transaksi yang mengandung A

Itemset suatu himpunan yang

beranggotakan sebagian atau seluruh item yang menjadi anggota I.

Jumlah transaksi yang mengandung B

(14)

Istilah-istilah (lanj)

• Contoh dari itemset adalah {Asparagus}

atau {Asparagus, Bean}, atau {Asparagus, Beans, Squash}

Beans, Squash}

• Itemset yang beranggotakan k buah item disebut k-itemset.

(15)

Istilah-istilah (lanj)

1. Himpunan {Asparagus} adalah suatu itemset. Lebih spesifik lagi 1-itemset karena hanya

beranggotakan satu buah item saja

2. Himpunan {Asparagus, Beans} adalah suatu itemset. Lebih spesifik lagi 2-itemset karena hanya beranggotakan dua buah item saja

hanya beranggotakan dua buah item saja

3. Himpunan {Asparagus, beans, squash} adalah suatu itemset. Lebih spesifik lagi 3-itemset

(16)

Istilah-istilah (lanj)

• Besaran frekuensi itemset mengukur

berapa kali sebuah itemset muncul sebagai bagian atau keseluruhan transaksi yang

menjadi anggota daftar transaksi D. Contoh:

Contoh:

1. Frekuensi itemset {asparagus} adalah

(17)

Istilah-istilah (lanj)

2. Frekuensi itemset {asparagus,

beans} adalah 5 karena himpunan ini

menjadi bagian dari lima transaksi , yaitu T5, T6, T9, T12 dan T13

3. Frekuensi itemset {asparagus,

3. Frekuensi itemset {asparagus,

beans, squash} adalah 4 karena

himpunan ini menjadi bagian dari empat transaksi (slide 3), yaitu T6, T9, T12 dan T13

(18)

Istilah-istilah (lanj)

Itemset sering/frequent itemset suatu itemset yang memiliki frekuensi itemset minimal sebesar bilangan Φ yang

ditetapkan.

Contoh bila kita tetapkan Φ = 4, maka:

Contoh bila kita tetapkan Φ = 4, maka:

1. Itemset {asparagus, beans,

(19)

Istilah-istilah (lanj)

2. Itemset {squash, tomatoes} tidak

termasuk itemset sering karena memiliki frekuensi itemset sebesar 3, artinya masih di bawah nilai Φ

yang ditetapkan

Itemset sering yang memiliki k buah anggota disebut

k-itemset sering. Misalnya itemset

k-itemset sering. Misalnya itemset

{asparagus, beans, squash} termasuk

3 itemset sering karena himpunan ini termasuk itemset sering dan memiliki 3 anggota.

(20)

Istilah-istilah (lanj)

• Aturan asosiasi secara ringkas digambarkan sbb:

1. Berawal dari data latihan yang tersedia (lihat slide 3)

2. Data latihan diolah dengan menggunakan 2. Data latihan diolah dengan menggunakan

algoritma atuan asosiasi.

3. Masalah aturan asosiasi berakhir dengan dihasilkannya pengetahuan yang

(21)

Prototip masalah aturan asosiasi dan pengetahuan yang dihasilkan

“jika membeli asparagus, maka membeli beans” Dapat diartikan:

• Item asparagus mempunyai kecenderungan untuk dibeli bersama-sama dengan item beans, atau

• Pengunjung toko unsada yang membeli asparagus mempunyai kecenderungan untuk juga membeli beans

(22)

Prototip masalah aturan asosiasi dan pengetahuan yang dihasilkan

• Dengan adanya prototip ,masalah aturan asosiasi kita dapat mengetahui definisi masalah aturan asosiasi

• Dengan pembahasan interpretasi • Dengan pembahasan interpretasi

pengetahuan yang dihasilkan oleh fungsi

mayor aturan asosiasi, kita bisa mengetahui cara memaknai pengetahuan yang

(23)

Algoritma aturan asosiasi

Market Basket Analysis (MBA)

Hasil pembahasan sebelumnya dapat disimpulkan menjadi:

• Data historis merupakan data penting sebagai data latihan/training data

• Data tersebut akan dijadikan input bagi suatu • Data tersebut akan dijadikan input bagi suatu

algoritma yang saat ini belum kita ketahui algoritmnya

• Sebagai keluaran algoritma yang saat ini belum kita ketahui jenisnya , kita akan memperoleh pengetahuan yang secara sederhana dapat

(24)

langkah umum Market Basket Analysis (MBA)

1. Menetapkan besaran Φ (itemset sering), nilai

minimum besaran support dan besaran

confidence yang diinginkan untuk dipenuhi oleh aturan asosiasi yang ingin dihasilkan

2. Menetapkan semua itemset sering, yaitu itemset 2. Menetapkan semua itemset sering, yaitu itemset

yang memiliki frekuensi itemset minimal sebesar bilangan Φ yang telah ditetapkan

(25)

Langkah dalam MBA-1

1. Langkah pertama

menetapkan besaran Φ dan nilai minimum

support dan confidence , misalnya Φ = 4,

maka min (support) = 30% dan min (confidence) = 70%

2. Langkah kedua

Menyusun semua itemset sering, yaitu itemset yang memiliki frekuensi itemset minimal sebesar bilangan Φ = 4 yang

(26)

Langkah dalam MBA-2

• Kita mulai dari pembahasan setiap 1-itemset sbb:

{asparagus}, {beans}, {brocolli}, {corn}, {green peppers}, {squash} dan {tomatoes} adalah 1-itemset sering,

karena itemset ini berhasil muncul melebihi Φ kali,

atau 4 kali dalam daftar D, sehingga bisa dituliskan atau 4 kali dalam daftar D, sehingga bisa dituliskan sebagai berikut:

F1 ={{asparagus}, {beans}, {brocolli}, {corn}, {green

(27)

Langkah dalam MBA-2 (lanj)

• Dilanjutkan dengan 2-itemset 1. {asparagus,beans},

{asparagus,brocoli},{asparagus,corn},{a sparagus, green peppers}, {asparagus, squash}, {asparagus, tomatoes}, {beans, corn},{beans, green peppers}, {beans, squash}, {beans, tomatoes},{brocoli, squash}, {beans, tomatoes},{brocoli, corn}, {brocoli, green peppers},

{brocoli, squash}, {brocoli, tomatoes}, {corn, green peppers}, {corn, squash}, {corn, squash},{corn, tomatoes}, {green peppers, squash}, {green peppers,

(28)

Langkah dalam MBA-2 (lanj)

2. Kesimpulan hanya {asparagus, beans}, {asparagus, squash}, {bean, corn}, {bean, squash}, {bean, tomatoes}, {brocolli, greenpepper}, dan {corn, tomatoes} yang merupakan 2-itemset sering

sehingga : sehingga :

F2 = {{asparagus, beans},

{asparagus, squash}, {bean, corn}, {bean, squash}, {bean, tomatoes},

(29)

Langkah dalam MBA-2 (lanj)

Untuk meringankan kita dalam mengkaji F3, F4, F5 dan seterusnya , gunakan aturan

berikut:

“jika Z bukan itemset sering, maka Z

A

pasti bukan itemset sering , untuk setiap A” pasti bukan itemset sering , untuk setiap A”

(30)

Langkah dalam MBA-2 (lanj)

Penggunaan aturan apriori

Bila {asparagus, brocolli} bukan

2-itemset sering, maka menurut aturan apriori:

{asparagus, brocoli, corn} {asparagus, brocoli, corn}

merupakan gabungan dari 2-itemset

{asparagus, brocolli} yang tidak

(31)

Langkah dalam MBA-2 (lanj)

• Penerapan aturan apriori terhadap seluruh anggota F2 hanya akan memberikan

{asparagus, beans, squash}

sebagai satu-satunya 3-itemset sering sehingga didapatkan:

F3 = {{asparagus, beans, F3 = {{asparagus, beans,

squash}}

Selanjutnya akan diperoleh F4=F5=F6=F7=

ø

(32)

Langkah dalam MBA-3

• Aturan asosiasi yang memenuhi nilai

minimum support dan confidence (yang

telah ditetapkan) dari semua itemset sering yang ada akan dibangun

A. Dari semua itemset sering s yang ada di

A. Dari semua itemset sering s yang ada di F2, F3 dan seterusnya, daftarkan semua himpunan bagian murni yang tak kosong

(33)

Langkah dalam MBA-3 (lanj)

• Sehingga:

1. Untuk s = {asparagus,beans} didapatkan ss = {asparagus} atau ss = {beans}

2. Untuk s = {asparagus,squash} didapatkan ss = {asparagus} atau ss = {squash}

ss = {asparagus} atau ss = {squash}

3. Untuk s = {beans,corn} didapatkan ss = {beans} atau ss = {corn}

4. Untuk s = {beans,squash} didapatkan ss = {beans} atau ss = {squash}

(34)

Langkah dalam MBA-3 (lanj)

5. Untuk s = {beans,tomatoes} didapatkan ss = {beans} atau ss = {tomatoes}

6. Untuk s = {brocolli, green pepper} didapatkan ss

= {brocolli} atau ss = {greenpepper}

7. Untuk s = {corn, tomatoes} didapatkan ss = 7. Untuk s = {corn, tomatoes} didapatkan ss =

{corn} atau ss = {tomatoes}

8. Untuk s = {asparagus, beans, squash} didapatkan ss = {asparagus} atau ss = {beans} atau ss =

(35)

Langkah dalam MBA-3 (lanj)

B. Bentuk aturan asosiasi yang berpola “ jika ss, maka (s-ss) “ atau “s

(s-ss)

Untuk mempermudah, pilihlah aturan yang hanya berkonsekuen sebuah item saja

sehingga (s-ss) hanya beranggotakan sebuah sehingga (s-ss) hanya beranggotakan sebuah item saja. Sehingga masalah toko unsada

didapatkan calon aturan asosiasi pada tabel berikut.

(36)
(37)

Langkah dalam MBA-3 (lanj)

C. Pilih aturan asosiasi yang memenuhi nilai minimum (support) dan minimum

(confidence) saja. Sebelumnya ditentukan batasan min (support) = 30% dan min

(confidence) = 70% tampak pada tabel di (confidence) = 70% tampak pada tabel di bawah

(38)
(39)

Capeeknya habis ngitung

gituan…bobok dulu ah

(40)

Pengetahuan apa yang bisa diperoleh

dari perhitungan tersebut?

• Jika pelanggan membeli asparagus maka barang

berikutnya yang dibeli adalah beans dan atau squash 83.3%

• Jika pelanggan membeli squash, maka barang berikutnya • Jika pelanggan membeli squash, maka barang berikutnya

yang dibeli adalah asparagus 71.4%

• Jika pelanggan membeli beans, maka barang berikutnya yang dibeli adalah squash 60%

(41)

Langkah selanjutnya?

• Berdasarkan data tersebut bisa dilakukan penataan barang berdasarkan yang banyak dibeli

• Pemberian discount pada hari tertentu • Dll

• Dll • Dll

• Stok asparagus dan beans diperbanyak sesuai permintaan pembelian salah satu barang

(42)

Algoritma lain?

• Market basket Analysis bukan satu-satunya algoritma untuk mengetahui asosiasi

• Terdapat algoritma lain untuk keperluan • Terdapat algoritma lain untuk keperluan

yang sama misalnya:

(43)

Pekerjaan Rumah

(kumpulkan minggu depan)

• Saya tinggal di pedesaan. Di desa ku sering ada pertunjukkan sirkus. Tidak setiap hari sirkus ini show di desaku. Saya pernah

sirkus ini show di desaku. Saya pernah

mengamati kapan saja mereka main ke sini. Dan data pengamatan saya , saya buatkan tabel sebagai berikut

(44)
(45)
(46)

Referensi

Dokumen terkait

Hoya memiliki tipe daun sukulen dan non sukulen. Karakter anatomi dapat digunakan untuk identifikasi, klasifikasi, dan penentu kekerabatan tumbuhan. Penelitian ini

Orang asing yang telah berjasa kepada negara Republik Indonesia atau dengan alasan kepentingan negara dapat diberi Kewarganegaraan Republik Indonesia oleh Presiden setelah memperoleh

Titik studi yang diambil untuk dilakukan analisis bahaya pada tugas akhir ini terdapat pada unit main

Tabel di atas menjelaskan data berisi Zona Kedalaman, Quality Code Kedalaman dan Source Code Kedalaman. Data di atas digunakan untuk mengetahui arus kedalaman laut di sekitar

“di dalam CS, khususnya di plasa, kami memiliki code of conduct untuk memberikan pengalaman yang baik kepada konsumen yang datang ke plasa, dari memberi salam

Dalarn usaha menjalin kerjasama tersebut, komunikasi melalui word of mouth akan menjadi lebih efektif untuk menjalin ikatan yang baik dengan pihak organisasi

Pada tahap ini silabus, RPP, dan bahan ajar disusun. Baik silabus, RPP, dan bahan ajar dirancang agar muatan maupun kegiatan pembelajarannya

Selain menjadi ajang perlombaan sekaligus memperkenalkan budaya masyarakat Madura, Sapi sonok dan sapi karapan ternyata memliki nilai jual yang tinggi mengingat sapi-sapi