• Tidak ada hasil yang ditemukan

TUGAS 5 DATA MINING - 20210801492

N/A
N/A
putri N@

Academic year: 2024

Membagikan "TUGAS 5 DATA MINING - 20210801492"

Copied!
8
0
0

Teks penuh

(1)

TUGAS 5 DATA MINING Putri Nur Khasanah

20210801492 1. Berikan Langkah-langkah algoritma Apriori!

 Berikut ini langkah-langkah dalam Algoritma Apriori:

a. Mulanya, pindai DB sekali untuk mendapatkan 1-itemet sesering mungkin b. Hasilkan panjang (k + 1) kandidat itemset dari length k frequent itemset c. Uji kandidat terhadap DB

d. Hentikan ketika tidak ada kandidat sering atau set dapat dihasilkan

2. Berikan Langkah-langkah algoritma FP-Growth!

 Berikut ini 9 tahapan dalam Algoritma FP Growth a. Penyiapan Dataset

b. Pencarian Frequent Itemset (Item yang sering muncul)

(2)

c. Dataset diurutkan Berdasarkan Priority

d. Pembuatan FP-Tree Berdasarkan Item yang sudah diurutkan

(3)

e. Pembangkitan Conditional Pattern Base

f. Pembangkitan Conditional FP-tree

g. Pembangkitan Frequent Pattern

(4)

Pembangkitan Frequent Pattern

Frequent 2 Itemset h. Mencari Support 2 Itemset

i. Mencari Confidence 2 Itemset

(5)

3. Misalnya dipunyai data penjualan Smartphone seperti dibawah ini,

Apabila minimum support = 30% dan minimum confidence = 60%, Kerjakanlah dengan menggunakan langkah pada Algoritma Apriori dan berikan kesimpulan pola aturan terbaik.

Analisis Data Penjualan Smartphone Menggunakan Algoritma Apriori Pendahuluan

Analisis ini memanfaatkan algoritma Apriori untuk mengekstrak aturan asosiasi berharga dari data penjualan smartphone Anda. Dengan mengidentifikasi model smartphone yang sering dibeli bersama, aturan ini dapat memberikan wawasan tentang pola pembelian pelanggan, strategi penentuan posisi produk, dan peluang upselling atau cross-selling.

Persiapan Data

(6)

Format Data: Data harus dalam format transaksi, di mana setiap baris mewakili pembelian pelanggan (transaksi) dan setiap kolom mewakili model smartphone yang dijual dalam transaksi tersebut (seperti yang terlihat pada tabel yang disediakan).

Pembersihan Data: Pastikan data bebas dari nilai yang hilang,

ketidakkonsistenan, atau kesalahan ketik. Teknik pembersihan data dapat digunakan jika perlu.

Ambang Dukungan dan Keyakinan Minimum

Efektivitas algoritma Apriori bergantung pada pemilihan ambang dukungan dan keyakinan minimum yang sesuai. Ambang batas ini menentukan signifikansi statistik dari aturan asosiasi yang ditemukan.

Dukungan Minimum: Berdasarkan pernyataan masalah (minimum support = 30%), itemset (kelompok model smartphone) harus muncul dalam setidaknya 30% transaksi agar dianggap sering.

Keyakinan Minimum: Demikian pula (minimum confidence = 60%), aturan asosiasi hanya valid jika konsekuensi (item yang direkomendasikan) muncul dalam setidaknya 60% transaksi yang berisi anteseden (item yang dibeli).

Langkah-Langkah Algoritma Apriori

1. Pass 1: Itemset 1-Itemset yang Sering

o Hitung frekuensi (dukungan) dari setiap model smartphone individu di semua transaksi.

o Filter model yang muncul dalam kurang dari 30% (ambang dukungan minimum) transaksi. Model yang tersisa menjadi itemset 1-itemset yang sering.

2. Pass k (2, 3, ..., dll.): Hasilkan Kandidat k-Itemset

o Pada pass berikutnya, kita akan fokus pada pembuatan pasangan kandidat (k=2) dan kelompok yang mungkin lebih tinggi (k>2) model smartphone berdasarkan itemset 1-itemset yang sering dari pass sebelumnya.

(7)

o Prinsip Apriori memastikan itemset k-kandidat hanya dapat sering terjadi jika semua subsetnya (itemset k-1) sudah sering terjadi. Hal ini memangkas kombinasi yang tidak mungkin, meningkatkan efisiensi.

3. Pass k: Hitung Dukungan untuk Kandidat k-Itemset

o Pindai data transaksi lagi untuk menghitung berapa kali setiap itemset k- kandidat muncul bersama dalam transaksi.

o Jika dukungan itemset k-kandidat turun di bawah minimum support (30% di sini), itu dibuang.

4. Hasilkan Aturan Asosiasi

o Dari itemset yang sering (k >= 2), buat aturan asosiasi dalam bentuk X => Y, di mana X adalah kumpulan model smartphone (anteseden) dan Y adalah model lain (konsekuensi).

o Hitung keyakinan untuk setiap aturan: confidence(X => Y) = support(XUY) / support(X).

o Filter aturan dengan keyakinan lebih rendah dari ambang minimum confidence (60%).

Analisis Data Penjualan Smartphone (Contoh)

Mari kita analisis data penjualan smartphone yang disediakan dalam tabel, dengan mengingat bahwa hasilnya mungkin lebih signifikan secara statistik dengan kumpulan data yang lebih besar:

Analisis Tabel

Model Smartphone Frekuensi Itemset 1-Itemset yang Sering?

Samsung 4 Ya

Advance 3 Ya

Lenovo 4 Ya

(8)

Apple 2 Tidak (Di bawah dukungan minimum)

Huawei 2 Tidak (Di bawah dukungan minimum)

Pass 2 (Itemset Kandidat 2) dan Pass 3 (Aturan Asosiasi):

Berdasarkan itemset 1-itemset yang sering (Samsung, Advance, Lenovo), kita dapat menghasilkan tiga pasangan kandidat:

{Samsung, Advance}

{Samsung, Lenovo}

{Advance, Lenovo}

Setelah menghitung dukungan dan keyakinan, kami memperoleh aturan asosiasi berikut yang memenuhi persyaratan keyakinan minimum:

Aturan 1: {Samsung} => {Lenovo} dengan keyakinan = 75% (menunjukkan pelanggan yang membeli Samsung juga cenderung mempertimbangkan Lenovo).

Aturan 2: {Advance} => {Lenovo} dengan keyakinan = 100% (mungkin kurang signifikan secara statistik karena ukuran sampel,

Referensi

Dokumen terkait

Pengujian ini dilakukan untuk mengetahui pengaruh nilai minimum support terhadap jumlah frequent itemset serta aturan asosiasi yang dihasilkan. Adapun hasil

Data keluaran yang dihasilkan adalah semua frequent k- itemset, yang akan digunakan untuk proses pembentukan kaidah asosiasi..

lebih dari nilai minimum yang telah ditentukan (ɸ) misalkan ɸ = 2, maka semua itemset yang frekuensi kemunculanya lebih dari atau sama dengan 2 kali disebut

Beberapa metoda atau teknik yang dikenal di dalam data mining salah satunya adalah association rule (aturan asosiasi) yang berusaha menemukan aturan-aturan tertentu

Beberapa metoda atau teknik yang dikenal di dalam data mining salah satunya adalah association rule (aturan asosiasi) yang berusaha menemukan aturan-aturan tertentu

Kemudian tahapan-tahapan dalam algoritma FP-Growth yaitu: 1 menentukan nilai support dari tiap-tiap itemset, 2 itemset yang mendapatan nilai support lebih dari nilai minimum support

Aturan Asosiasi Berdasarkan hasil analisis tanagra pada gambar di atas Hasil pengujian data pola penjualan di edukits batam centre maka didapatkan 2 aturan asosiasi yang terbentuk,

Selanjutnya, kombinasi dua dan tiga itemset terbentuk akan dilakukan perhitungan aturan asosiasi dengan minimum confidence yang ditentukan sebesar 50% menggunakan Rumus 3 dan