PENAMBANGAN DATA OPENCOURSEWARE UNIVERSITAS PEMBANGUNAN JAYA Handout TIF311 DM 2

12 

Teks penuh

(1)

PENAMBANGAN DATA

(2)

DISIPLIN ILMU DATA MINING

Berawal dari beberapa disiplin ilmu, bertujuan untuk memperbaiki teknik

tradisional sehingga bisa menangani:

Jumlah data yang sangat besarDimensi data yang tinggi

(3)

DATA MINING

Kata kunci data mining:

Sifatnya non trivial/ iteratif

Menemukan knowledge atau informasi dari data yang

berjumlah besar

 Data Mining merupakan inti dari proses

Knowledge

(4)

JENIS DATA DALAM DATA MINING

Database, data warehouse, database transaksional Data streams dan sensor data

Time-series data, temporal data, sequence data

Struktur data, graf, social networks dan database link Object-relational database

Spatial data

Spatiotemporal data Multimedia database Text databases

(5)

ARSITEKTUR DATA MINING

data cleaning, integration, and selection

Database or Data Warehouse Server

Data Mining Engine Pattern Evaluation Graphical User Interface

Kno

Database Data

Warehouse

World-Wide Web

(6)

TASK DALAM DATA MINING

Metode Prediksi

Dengan menggunakan beberapa variabel untuk memprediksi nilai yang belum diketahui (unknown) atau nilai selanjutnya (future) dari variabel lain

Contoh:

Classification Regression

Deviation Detection

Metode Deskripsi

Menemukan pola pendeskripsian data yang dapat diinterpretasikan oleh manusia Contoh:

Clustering

(7)

FUNGSIONALITAS DALAM DATA MINING

Klasifikasi dan Prediksi

Frequent patterns, asosiasi , korelasi dan kausalitas Analisis klaster

Analisis Outlier

Analysis Trend dan evolution

(8)

APLIKASI DATA MINING

Analisis dan Manajemen Pasar

Target pemasaran, customer relation management (CRM), market basket analysis, cross selling, segmentasi pasar

Analisis dan Manajemen Resiko

Forecasting, customer retention, quality control, analisis kompetisi

Deteksi dan manajemen fraud (kecurangan)

(9)

APLIKASI DATA MINING

Marketing and Sales Promotion

Supermarket shelf management.

Inventory Management

Diagnosis Medis

Collaborative Filtering

Business Intelligence

Network Intrusion detection

Deteksi spam

(10)
(11)
(12)

PERMASALAHAN DATA MINING

Bagaimana Menentukan metodologi mining? karena: Tipe data berbeda

Performansi yang diharapkan dari segi keefektifan, efisiensi dan skalabilitas bisa jadi berbeda tiap metodologi

Evaluasi pola yanki pengukuran “interestingness’ yang berbeda Penanganan missing value dan noise

dll

Bagaimana Bentuk Interaksi dengan User? Apakah:

Menggunakan Data mining query languages dan ad-hoc miningHasil data mining berupa ekspresi dan visualisasi

Aplikasi dan Dampak Sosial

Figur

Memperbarui...

Referensi

Memperbarui...