A
rsitektur dan
M
odel
D
ata
M
ining
Arsitektur Data Mining
Keterangan :
1. Data cleaning (Pembersihan Data) : untuk membuang data yang tidak konsisten dan noise
2. Data integration : penggabungan data dari beberapa sumber
3. Data Mining Engine : Mentranformasikan data menjadi bentuk yang sesuai untuk di mining
4. Pattern evaluation : untuk menemukan pengetahuan yang bernilai melalui knowledge base
Model Data Mining
Model Prediksi
➢ Dengan menggunakan beberapa variabel, untuk
memprediksi nilai yang belum diketahui (unknown ) atau nilai selanjutnya (future) dari variabel lain
Classification
Regression
Model Data Mining
Model Deskripsi
➢ Menemukan pola pendeskripsian data yang dapat diinterpretasikan oleh manusia
Clustering
Classification
Proses untuk menemukan model atau fungsi yang membedakan kelas data, dengan tujuan untuk dapat
Examples of Classification Task
➢ Memprediksi sel tumor apakah jinak atau ganas
➢ Klasifikasi transaksi kartu kredit apakah sah atau penipuan
Classification Techniques
❖ Decision Tree based Methods
❖ Neural Networks
❖ Rule-based Methods
❖ Memory based reasoning
❖ Naïve Bayes and Bayesian Belief Networks
Classification Techniques
Classification Techniques
Example
Type :
SUV Minivan
Car
Door : 2, 4
Classification Techniques
Classification Techniques
Types Doors Tires Result
-Classification Techniques
Regression
➢ Digunakan untuk memetakan data dengan prediksi atribut bernilai real
Examples of Regression Task
✓Memprediksi jumlah penjualan produk baru pada advertising expenditure (belanja iklan).
✓Memprediksi kecepatan memutar (wind velocities) pada fungsi temperatur, tekanan udara , dll
Regression Techniques
✓ Linear Regression
✓ Logic Regression
SQL Server Data Mining mendukung teknik :
✓ Regression Trees (bagian Microsoft Decission Trees)
✓ Neural Network
Oracle Data Mining mendukung teknik :
✓ Generalized Linear Models (GLM)
Deviation Detection / Deviation Analysis
✓ Digunakan untuk mencari kasus yang bertindak sangat berbeda dari normalnya
Examples of Deviation Analysis Task
✓Pendeteksian penyalah gunaan Kartu kredit.
✓Pendeteksian gangguan jaringan komputer
✓Analisa kesalahan produksi, dll
Deviation Analysis Techniques
✓ Decision trees
Clustering
✓ Disebut juga sebagai Segmentation
✓ Clustering mendistribusikan obyek ke dalam kelompok, sehingga :
✓ derajat tingkat keterhubungan antar anggota cluster yang sama adalah kuat dan
✓ derajat tingkat keterhubungan antar anggota cluster yang berbeda adalah lemah
✓ Clustering adalah suatu alat untuk analisa data, yang memecahkan permasalahan
Clustering
Contoh :
Clustering
Contoh :
Clustering
Cluster Analysis
Contoh Kasus :
Cluster Analysis
Parameter / Variabel yang diukur :
✓ Layout ruangan
✓ Kelengkapan produk yang ditawarkan
✓ Harga yang di tetapkan
✓ Penggunaan musik dalam ruangan
✓ Pelayanan Karyawan
✓ Pelayanan Kasir
✓ Promosi yang di buat
✓ Image mengenai Dept.Store tsb.
Cluster Analysis
Beberapa kesimpulan yang bisa diambil dari contoh diatas :
✓ Mengetahui pengelompokkan dan menentukan target pasar yang di tuju
✓ Mengetahui positioning produk dan menentukan pengembangan produk baru
Clustering
Gambar dibawah ini menunjukkan kelompok data pelanggan yang berisi dua atribut, yaitu
Clustering
Algoritma Clustering mengelompokkan kelompok data kedalam tiga segment berdasarkan kedua atribut ini.
Cluster 1 berisi populasi berusia muda dengan pendapatan rendah
Cluster 2 berisi populasi berusia menengah dengan pendapatan yang lebih tinggi
Association Rule Discovery
Teknik Association Rule
Association Rule
Example Association Rule Task
Contoh :
Analisis pembelian barang di suatu pasar swalayan yaitu :
Association Rule Techniques
Tahap analisis asosiasi untuk menghasilkan algoritma adalah pola frekuensi tinggi (frequent pattern mining)