• Tidak ada hasil yang ditemukan

IF MATERI DATA MINING PERTEMUAN 06

N/A
N/A
Protected

Academic year: 2017

Membagikan "IF MATERI DATA MINING PERTEMUAN 06"

Copied!
30
0
0

Teks penuh

(1)

A

rsitektur dan

M

odel

D

ata

M

ining

(2)
(3)

Arsitektur Data Mining

Keterangan :

1. Data cleaning (Pembersihan Data) : untuk membuang data yang tidak konsisten dan noise

2. Data integration : penggabungan data dari beberapa sumber

3. Data Mining Engine : Mentranformasikan data menjadi bentuk yang sesuai untuk di mining

4. Pattern evaluation : untuk menemukan pengetahuan yang bernilai melalui knowledge base

(4)

Model Data Mining

Model Prediksi

➢ Dengan menggunakan beberapa variabel, untuk

memprediksi nilai yang belum diketahui (unknown ) atau nilai selanjutnya (future) dari variabel lain

 Classification

 Regression

(5)

Model Data Mining

Model Deskripsi

➢ Menemukan pola pendeskripsian data yang dapat diinterpretasikan oleh manusia

 Clustering

(6)

Classification

Proses untuk menemukan model atau fungsi yang membedakan kelas data, dengan tujuan untuk dapat

(7)

Examples of Classification Task

➢ Memprediksi sel tumor apakah jinak atau ganas

➢ Klasifikasi transaksi kartu kredit apakah sah atau penipuan

(8)

Classification Techniques

❖ Decision Tree based Methods

❖ Neural Networks

❖ Rule-based Methods

❖ Memory based reasoning

❖ Naïve Bayes and Bayesian Belief Networks

(9)

Classification Techniques

(10)

Classification Techniques

Example

Type :

SUV Minivan

Car

Door : 2, 4

(11)

Classification Techniques

(12)

Classification Techniques

Types Doors Tires Result

(13)

-Classification Techniques

(14)

Regression

➢ Digunakan untuk memetakan data dengan prediksi atribut bernilai real

(15)

Examples of Regression Task

✓Memprediksi jumlah penjualan produk baru pada advertising expenditure (belanja iklan).

✓Memprediksi kecepatan memutar (wind velocities) pada fungsi temperatur, tekanan udara , dll

(16)

Regression Techniques

✓ Linear Regression

✓ Logic Regression

SQL Server Data Mining mendukung teknik :

✓ Regression Trees (bagian Microsoft Decission Trees)

✓ Neural Network

Oracle Data Mining mendukung teknik :

✓ Generalized Linear Models (GLM)

(17)

Deviation Detection / Deviation Analysis

✓ Digunakan untuk mencari kasus yang bertindak sangat berbeda dari normalnya

(18)

Examples of Deviation Analysis Task

✓Pendeteksian penyalah gunaan Kartu kredit.

✓Pendeteksian gangguan jaringan komputer

✓Analisa kesalahan produksi, dll

Deviation Analysis Techniques

✓ Decision trees

(19)

Clustering

✓ Disebut juga sebagai Segmentation

✓ Clustering mendistribusikan obyek ke dalam kelompok, sehingga :

✓ derajat tingkat keterhubungan antar anggota cluster yang sama adalah kuat dan

✓ derajat tingkat keterhubungan antar anggota cluster yang berbeda adalah lemah

✓ Clustering adalah suatu alat untuk analisa data, yang memecahkan permasalahan

(20)

Clustering

Contoh :

(21)

Clustering

Contoh :

(22)

Clustering

(23)

Cluster Analysis

Contoh Kasus :

(24)

Cluster Analysis

Parameter / Variabel yang diukur :

Layout ruangan

Kelengkapan produk yang ditawarkan

Harga yang di tetapkan

Penggunaan musik dalam ruangan

Pelayanan Karyawan

Pelayanan Kasir

Promosi yang di buat

Image mengenai Dept.Store tsb.

(25)

Cluster Analysis

Beberapa kesimpulan yang bisa diambil dari contoh diatas :

Mengetahui pengelompokkan dan menentukan target pasar yang di tuju

Mengetahui positioning produk dan menentukan pengembangan produk baru

(26)

Clustering

Gambar dibawah ini menunjukkan kelompok data pelanggan yang berisi dua atribut, yaitu

(27)

Clustering

Algoritma Clustering mengelompokkan kelompok data kedalam tiga segment berdasarkan kedua atribut ini.

Cluster 1 berisi populasi berusia muda dengan pendapatan rendah

Cluster 2 berisi populasi berusia menengah dengan pendapatan yang lebih tinggi

(28)

Association Rule Discovery

Teknik Association Rule

Association Rule

(29)

Example Association Rule Task

Contoh :

Analisis pembelian barang di suatu pasar swalayan yaitu :

(30)

Association Rule Techniques

Tahap analisis asosiasi untuk menghasilkan algoritma adalah pola frekuensi tinggi (frequent pattern mining)

Gambar

Gambar dibawah ini menunjukkan kelompok data pelanggan yang berisi dua atribut, yaitu

Referensi

Dokumen terkait

Klasifikasi adalah proses untuk menemukan model atau fungsi yang menjelaskan atau membedakan konsep atau kelas data dengan tujuan untuk memperkirakan kelas yang tidak diketahui

Klasifikasi adalah proses penemuan model (atau fungsi) yang membedakan kelas data atau konsep yang bertujuan agar dapat digunakan untuk memprediksi kelas dari objek

Klasifikasi adalah proses untuk menemukan model atau fungsi yang menjelaskan atau membedakan konsep atau kelas data dengan tujuan untuk memperkirakan kelas yang tidak diketahui

Klasifikasi adalah suatu fungsionalitas data mining yang akan menghasilkan model untuk memprediksi kelas atau kategori dari objek-objek di dalam

Klasifikasi adalah proses untuk menemukan model atau fungsi yang menjelaskan atau membedakan konsep atau kelas data, dengan tujuan untuk dapat memperkirakan kelas dari

Klasifikasi adalah proses untuk menemukan model atau fungsi yang menjelaskan atau membedakan konsep atau kelas data dengan tujuan untuk memperkirakan kelas yang tidak diketahui

Klasifikasi adalah sebuah proses untuk menemukan model yang menjelaskan atau membedakan konsep atau kelas data, dengan tujuan untuk dapat memperkirakan kelas dari suatu objek

Klasifikasi adalah proses penemuan model (atau fungsi) yang menggambarkan dan membedakan kelas data atau konsep yang bertujuan agar bisa digunakan untuk memprediksi kelas dari