• Tidak ada hasil yang ditemukan

IF MATERI DATA MINING PERTEMUAN 02

N/A
N/A
Protected

Academic year: 2017

Membagikan "IF MATERI DATA MINING PERTEMUAN 02"

Copied!
26
0
0

Teks penuh

(1)

Knowledge Discovery in Databases (KDD)

(2)

Knowledge Discovery in Databases (KDD)

Definisi Knowledge Discovery in Database (KDD)

Tahapan Proses KDD

Data Pre-Pocessing

Data Reduction

Pengantar On-Line Analytical Processing

Data Warehouse

(3)

Definisi Knowledge Discovery in

Database (KDD)

Knowledge discovery in databases (KDD) adalah

keseluruhan proses untuk mencari dan mengidentifikasi pola (pattern) dalam data, dimana pola yang ditemukan dapat bermanfaat dan dapat dimengerti.

KDD berhubungan dengan teknik

(4)
(5)

Tahapan Proses KDD

1. Data Selection

❖Menciptakan himpunan data target, pemilihan himpunan data, atau memfokuskan pada subset variabel atau sampel data, dimana penemuan (discovery) akan dilakukan.

(6)

Tahapan Proses KDD

2. Pre-processing / Cleaning

Pre-processing dan cleaning data merupakan

operasi dasar yang dilakukan seperti penghapusan noise.

(7)

Tahapan Proses KDD

3. Transformation

❖ Merupakan proses integrasi pada data yang telah dipilih, sehingga data sesuai untuk proses data mining.

❖Merupakan proses yang sangat tergantung pada jenis atau pola informasi yang akan dicari dalam basis data

(8)

Tahapan Proses KDD

4. Data mining

❖ Pemilihan tugas data mining merupakan pemilihan goal dari proses KDD misalnya karakterisasi,

klasifikasi, regresi, clustering, asosiasi, dll.

(9)

Tahapan Proses KDD

5. Interpretation/ Evaluation

❖ Yaitu penerjemahan pola-pola yang dihasilkan dari data mining.

❖ Pola informasi yang dihasilkan perlu ditampilkan dalam bentuk yang mudah dimengerti

❖ Tahap ini melakukan pemeriksaan apakah pola atau informasi yang

(10)

Data Pre-processing

Sampling : menyeleksi subset representatif dari populasi data yang besar.

Transformation : memanipulasi data mentah untuk menghasilkan input tunggal.

Denoising : menghilangkan noise dari data

Normalization : mengorganisasi data untuk pengaksesan yang lebih spesifik

F eature Extraction : membuka spesifikasi data yang signifikan dalam konteks tertentu.

(11)

Data Reduction

Data reduction merupakan teknik yang

digunakan untuk mentransformasi dari data mentah ke bentuk format data yang lebih

berguna. Sebagai contoh groupping,

counting, summing dan averaging data.

Data reduction dilakukan untuk mengatasi

ukuran data yang terlalu besar yang dapat menimbulkan ketidakefisienan proses dan peningkatan biaya

(12)

OLAP (On-Line Analytical Processing)

OLAP adalah suatu sistem atau teknologi yang dirancang untuk mendukung proses analisis

kompleks dalam rangka mengungkapkan

kecenderungan pasar dan faktor-faktor penting dalam bisnis

(13)

OLAP (On-Line Analytical Processing)

OLAP dapat digunakan membuat rangkuman baru dari multidimensi data yang berbeda, dan dapat merespon secara online, dan

(14)

Data Warehouse

Definisi Data Warehouse

Data Warehouse adalah pusat informasi yang mampu memberikan database berorientasi subyek untuk

informasi yang bersifat historis yang mendukung DSS (Decision Support System) dan EIS (Executive

(15)

Data Warehouse

Tujuan Data Warehouse

(16)

Data Warehouse

Kegunaan Data Warehouse

❖ Pembuatan Laporan

Dapat menghasilkan laporan per periode

❖ Menganalisis data (OLAP)

Melakukan analisis bisnis untuk menyelidiki kecenderungan pasar dan faktor penyebabnya

❖ Data Mining

Mencari pola dan hubungan data untuk mengambil keputusan

❖ Proses Informasi Eksekutif

(17)

Data Warehouse

Ciri-ciri Data Warehouse

1. Subject Oriented

✓ Data disusun dan dikelompokkan berdasarkan

subyek yang berisi hanya informasi yang penting bagi pemrosesan decision support.

Subyek dirangkum ke dalam dimensi, misalnya :

(18)

Data Warehouse

Ciri-ciri Data Warehouse (Lanjutan) 2. Integrated

Jika data terletak pada berbagai aplikasi yang terpisah,encoding data sering tidak seragam

(19)

Data Warehouse

Ciri-ciri Data Warehouse (Lanjutan) 3. Time-variant

Data warehouse adalah tempat untuk storing data selama 5 sampai 10 tahun atau lebih

4. Non volatile

(20)

Data Warehouse

Arsitektur Data Warehouse

Operational data source 2

Operational data source (ODS) Operational data source n

Meta data

Detailed data

Lightly summarized data

Highly summarized data Warehouse Manager

and EIS tools

OLAP Tools

Data Mining Tools End-user access tools DBMS

(21)

Data Mart

Definisi Data Mart

Data Mart adalah subset dari data warehouse yang

mendukung kebutuhan informasi dari departemen atau fungsi bisnis tertentu.

(22)

Arsitektur Data Mart

Operational data source 2

Operational data source (ODS) Operational data source n

Meta data

Detailed data

Lightly summarized data

Highly summarized data Warehouse Manager

and EIS tools

OLAP Tools

Data Mining Tools End-user access tools DBMS

Operational data source 1

Data Mart

Summarized Data (Relational Database)

Summarized Data (Multi Dimansional Database)

Reporting, query, application development

and EIS tools

OLAP Tools

(23)

Data Warehouse / Data Mart VS OLAP

OLAP adalah teknologi yang memproses data di

(24)

Data Warehouse / Data Mart VS OLTP

Data Warehouse / Data Mart OLTP

Menyimpan data historis Menyimpan data saat ini

Menyimpan detailed, lightly, highly, summary data

Menyimpan detailed data

Data bersifat statis Data bersifat dinamis

Mengarah pada analisis Mengarah pada transaksi

Berorientasi pada subjek Berorientasi pada aplikasi

Mendukung keputusan strategi Mendukung keputusan sehari-hari

Pemakai manajerial dalam tingkat yang relatif rendah

(25)

OLTP VS OLAP

OLTP OLAP

Tujuan Mengotomatisasi bisnis Mengoptimalkan bisnis

Penggunaan Proses transaksi Pelaporan, Analisis, Modeling, Perencanaan

Skema Dua dimensi, Normalisasi Multi Dimensi, Hirarki

Navigasi Didasarkan pada langkah kerja transaksi

Didasarkan pada cara user menganalisis

Penghitungan Agregasi, Matriks Sederhana Agregasi, Matriks, Dimensi saling silang, Perumusan, Prosedural

Implementasi Lambat dalam penyebaran, dan mudah untuk diubah datanya

Cepat dalam penyebaran, adan susah untuk diubah datanya

(26)

Terima Kasih

Referensi

Dokumen terkait

Data mining merupakan proses pencarian pengetahuan yang menarik dari data berukuran besar yang disimpan dalam basis data, data warehouse atau tempat penyimpanan informasi

Basis data adalah suatu kumpulan data terhubung ( interralated data ) yang disimpan secara bersama-sama pada suatu media, tanpa mengatap satu sama lain atau tidak perlu

Data mining adalah kegiatan menemukan pola yang menarik dari data dalam jumlah besar, data dapat disimpan dalam database, data warehouse, atau penyimpanan informasi lainnya..

Dari tabel diatas, Gain Tertinggi adalah HUMIDITY dan menjadi node akar. Maka diperoleh bentuk pohon keputusan awal

Dengan terhubungnya komputer pada jaringan internet maka kita bisa mencari banyak informasi yang ada pada sebuah website yang dibangun oleh orang lain pada3.

Tan (2006) mendefinisikan data mining sebagai proses untuk mendapatkan informasi yang berguna dari gudang basis data yang besar?. Data mining juga dapat diartikan sebagai

Data mining merupakan proses menemukan informasi atau pola yang penting dalam basis data berukuran besar.. Data- data yang ada di gali, di olah, di analisa dan akan di dapatkan berbagai

• Supervised Learning digunakan ketika kita memiliki data berlabel dan ingin membuat model yang bisa memprediksi atau mengklasifikasikan data baru berdasarkan pola yang telah