• Tidak ada hasil yang ditemukan

KNOWLEGDE DISCOVERY in DATABASE (KDD)

N/A
N/A
Protected

Academic year: 2018

Membagikan "KNOWLEGDE DISCOVERY in DATABASE (KDD)"

Copied!
39
0
0

Teks penuh

(1)

KNOWLEGDE DISCOVERY in DATABASE (KDD)

Tujuan : Mahasiswa Dapat memahami konsep KDD yang merupakan tujuan akhir dari Data Warehouse

dan Data Mining

(2)
(3)

Data Warehouse

Defnisi :

 Data Warehouse adalah Pusat repositori informasi yang mampu memberikan database berorientasi subyek untuk informasi yang bersifat historis yang mendukung DSS (Decision Suport System) danEIS (Executive Information System).

Salinan dari transaksi data yang terstruktur secara spesifk pada query dan analisa.

 Salinan dari transaksi data yang terstruktur spesifk untuk query dan laporan

Tujuan :

(4)

Empat karakteristik data

warehouse

Subject orientedIntegrated

(5)

Empat karakteristik data

warehouse

Subject oriented

– Data yang disusun menurut subyek berisi hanya informasi yang penting bagi pemprosesan decision support.

– Database yang semua informasi yang tersimpan di kelompokkan berdasarkan subyek tertentu misalnya: pelanggan, gudang, pasar, dsb.

– Semua Informasi tersebut disimpan dalam suatu sistem data warehouse.

(6)

Empat karakteristik data

warehouse

Integrated

– Jika data terletak pada berbagai aplikasi yang terpisah dalam suatu lingkungan operasional, encoding data sering tidak seragam sehinggga bila data dipindahkan ke data warehouse maka coding akan diasumsikan sama seperti

(7)

Empat karakteristik data

warehouse

Time variant

Data warehouse adalah tempat untuk storing data selama 5 sampai 10 tahun atau lebih, data digunakan untuk

(8)

Empat karakteristik data

warehouse

Non-volatile

(9)

Perbedaan Data Warehouse

dan Database

Data Warehouse

Tidak terikat suatu

aplikasi

Data terpusatHistorical

Denormalisasi kecilMultiple subject

Sumber dari dari semua

internal maupun eksternal source

Fleksibel

Data oriented

Umurnya panjangUkuran besar

Single complex structure

Database

Aplikasi DSS secara

spesifk

Tidak terpusat oleh user

area

Sebagian historicalDenormalisasi besarOne central subject of

concern of user

Sumber dari sebagian

internal maupun eksternal source

Tidak feksibel, terbatasProject oriented

Umurnya pendek

Ukuran dari kecil menjadi

besar

(10)
(11)
(12)
(13)

ARSITEKTUR DATA

WAREHOUSE

Pilihan berikut harus dibuat didalam perancangan data warehouse

process model

Tipe apa yang akan dimodelkan? • grain

Apa dasar data dan level atom data yang akan disajikan?

dimensi

Dimensi apa yang dipakai untuk masing-masing record tabel fakta?

ukuran

(14)

ARSITEKTUR DATA

WAREHOUSE

(15)
(16)

OLAP (On-line analytical processing)

 OLAP adalah suatu sistem atau teknologi yang dirancang

untuk

mendukung proses analisis kompleks dalam rangka mengungkapkan

kecenderungan pasar dan faktor-faktor penting dalam bisnis

 OLAP ditandai dengan kemampuannya menaikkan atau

menurunkan

dimensi data sehingga kita dapat menggali data sampai pada level yang

sangat detail dan memperoleh pandangan yang lebih luas mengenai

objek yang sedang kita analisis.

 OLAP secara khusus memfokuskan pada pembuatan data agar

dapat

diakses pada saat pendefnisian kembali dimensi.

 OLAP dapat digunakan membuat rangkuman dari multidimensi

data

yang berbeda, rangkuman baru dan mendapatkan respon secara online,

dan memberikan view dua dimensi pada data cube multidimensi secara

(17)

Perbedaan data warehouse dan data mining

(18)
(19)

Tahap pemprosesan dalam Data Mining

(20)

Penerapan Data Mining di

Perusahaan

Analisa Perusahaan dan Manajemen Resiko

Perencanaan Keuangan dan Evaluasi Aset

Data Mining dapat membantu untuk melakukan analisis dan prediksi cash fow serta melakukan contingent claim analysis untuk mengevaluasi aset. Selain itu juga dapat menggunakannya untuk analisis trend.

Perencanaan Sumber Daya (Resource Planning)

Dengan melihat informasi ringkas (summary) serta pola pembelanjaan dan

pemasukan dari masing-masing resource, dapat memanfaatkannya untuk melakukan resource planning.

Persaingan (Competition)

Sekarang ini banyak perusahaan yang berupaya untuk dapat melakukan

competitive intelligence. Data Mining dapat membantu untuk memonitor pesaing-pesaing dan melihat market direction mereka.

dapat melakukan pengelompokan customer dan memberikan variasi

harga/layanan/bonus untuk masing-masing grup.

Menyusun strategi penetapan harga di pasar yang sangat kompetitif. Hal ini

(21)

DATA MINING &

KDD

(22)

DATA MINING

Data Mining adalah kegiatan untuk

menemukan informasi atau pengetahuan yang berguna secara otomatis dari data yang jumlahnya besar.

Data Mining merupakan salah satu proses

dari keseluruhan proses yang ada pada

(23)

KDD

Knowledge Discovery in Databases (KDD) merupakan

sekumpulan proses untuk menemukan pengetahuan yang bermanfaat dari data.

Kumpulan proses dalam KDD meliputi : pembersihan data (data

cleaning), integrasi data (data integration), pemilihan data (data selection), transformasi data (data transformation),

penambangan data (data mining), evaluasi pola (pattern evaluation), dan presentasi pengetahuan (knowledge presentation).

Berdasarkan defnisi ini terlihat bahwa data mining hanya

(24)

DATA MINING &

KDD

DATA MINING &

KDD

DATA

WAREHOUSE

DATA

(25)

DATA

WAREHOUSE

DATA

WAREHOUSE

DATA MINING

DATA MINING

KDD

(26)

KDD vs. DM

Menurut Cabena, Data Mining =

Knowledge Discovery in Database (KDD).

Menurut Jiawei Han, Data Mining

merupakan Subset atau salah satu

tahap dari KDD saja. Sehingga, batasan ini yang selanjutkan digunakan.

Data Mining bertujuan mengekplorasi

(27)

TAHAPAN KNOWLEDGE

DISCOVERY IN DATABASE

Menurut Peter Cabena, Tahapan – tahapan dalam KDD adalah sebagai berikut :

 Penentuan Sasaran Bisnis (Business

Objective Determination)

 Persiapan Data (Preparation Data)

Data Selection

 Data Preprocessing  Data Transformation

Data Mining

Anaysis of Result

(28)

Business Objective

Determination - 1

Merupakan sebuah tahapan yang mendefnisikan

permasalahan atau tantangan bisnis dengan jelas. Hal ini merupakan aspek yang sangat esensial dalam setiap proyek data mining.

Contoh Sasaran Bisnis :

Mengembangkan suatu strategi marketing untuk

mempertahankan loyalitas customer di Jawa Tengah dan Jawa Timur untuk produk soft drink dengan brand dan ukuran tertentu (200ml dalam kotak alumunium) selama bulan April, Mei , Juni yang akan datang. Perusahaan

(29)

Business Objective

Determination - 2

Sehingga dampak keseluruhan KDD adalah :

 – Data Selection: dipilih customers yang membeli

produk soft drink 200 ml dalam kotak alumunium di Jawa Tengah dan Jawa Timur.

 – Data Transformation: customers yang membeli

produk soft drink 200 ml dalam kotak alumunium disorting dalam 10 kategori, yang masing-masing membedakan tingkat loyalitasnya: membeli produk tersebut 0-10%, 11-20%, ... , 81-90%, 91-100%

(30)

Persiapan Data (Preparation

Data) -1

 Merupakan tahapan untuk mempersiapkan

data yang diperlukan untuk proses data

mining. Tujuannya adalah agar data yang digunakan benar-benar sesuai dengan

permasalahan yang akan dipecahkan, dapat dijamin kebenarannya, dan dalam format yang sesuai/tepat.

 Tahap yang paling banyak mengkonsumsi

resources (manusia, biaya, waktu) yang tersedia. Biasanya mencapai 60%

(31)

Persiapan Data (Preparation

Data) -2

Data Selection

 Mengidentifkasi semua sumber informasi internal dan

eksternal dan memilih sebagian saja dari data yang diperlukan untuk aplikasi data mining.

Data Preprocessing

Meyakinkan kualitas data yang telah dipilih pada

tahapan sebelumnya. 2 issue yang sering dihadapkan pada tahapan ini adalah Noisy Data dan Missing Value.

Data Transformation

Mengubah data ke dalam model analitis serta

(32)

Data Mining -1

Melakukan proses pencarian pengetahuan

terhadap data yang ditransformasikan pada tahap sebelumnya.

 Contoh Pengetahuan berbentuk Association Rule

untuk kasus "Soft Drink“:

 IF soft drink sejenis dengan ukuran yang lebih besar

(bukan botol kecil) dibeli lebih dari 58% dalam sejarah pembelian soft drink seorang consumer

THEN consumer tersebut diprediksi Loyal.

 Pemilihan tugas data mining : pemilihan goal dari

(33)

Data Mining -2

Proses Data mining yaitu proses mencari

pola atau informasi menarik dalam data terpilih dengan menggunakan teknik atau metode tertentu. Teknik, metode, atau

algoritma dalam data mining sangat bervariasi. Pemilihan metode atau

algoritma yang tepat sangat bergantung pada tujuan dan proses KDD secara

(34)

Anaysis of Result

 Menginterpretasikan dan mengevaluasi

output dari tahap mining: patterns.

 Pendekatan analisa yang digunakan akan

(35)

Assimilation of Knowledge

 Menggunakan hasil mining yang telah

(36)
(37)

DATA MINING dan PROSES KDD - 2

Pembersihan data (Data Cleaning)

Digunakan untuk membuang data yang tidak konsisten dan noise.Intergrasi Data (Data Integration)

Data yang diperlukan untuk data mining tidak hanya berasal dari satu database tetapi juga berasal dari beberapa database atau fle teks. Hasil integrasi data sering diwujudkan dalam sebuah data warehouse karena dengan data

warehouse, data dikonsolidasikan dengan struktur khusus yang efsien. Selain itu data warehouse juga memungkinkan tipe analisa seperti OLAP.

Transformasi data

Transformasi dan pemilihan data ini untuk menentukan kualitas dari hasil data mining, sehingga data diubah menjadi bentuk sesuai untuk di-Mining.

Aplikasi Teknik Data Mining

Aplikasi teknik data mining sendiri hanya merupakan salah satu bagian dari proses data mining. Ada beberapa teknik data mining yang sudah umum dipakai.

Evaluasi pola yang ditemukan

Dalam tahap ini hasil dari teknik data mining berupa pola-pola yang khas maupun model prediksi dievaluasi untuk menilai apakah hipotesa yang ada memang tercapai.

Presentasi Pengetahuan

(38)

Daftar Pustaka

 Djoni Darmawikarta, Mengenal Data

Warehouse, 2003

 Yudho Giri Sucahyo, Data Mining,2003  Yudho Giri Sucahyo, Penerapan Data

Mining, 2003

Jefrey A. Hofer, Mary B. Prescott, Fred

R. McFadden ;

Modern Database Management
(39)

Referensi

Dokumen terkait

Pompa hidrolik atau biasa disebut dengan pompa hydram adalah suatu peralatan yang unik, dimana peralatan ini menggunakan energi dari aliran air yang memiliki

Ariyanti & Setiawan (2017) pemecahan masalah dalam pola berpikir matematik yaitu: 1) Menarik kesimpulan logis, 2) Menggunakan penjelasan dengan menggunakan

Bagi orang tua siswa MTs Negeri Tunggangri Kalidawir hasil penelitian ini dapat dijadikan sebagai bahan memperoleh informasi tentang strategi pembelajaran guru akidah

(3) Tujuan pembinaan keagamaan bagi tukang becak melalui Matabaca Nurul Hayat Jember adalah untuk memberdayakan ekonomi jamaahnya, untuk mengembangkan pengetahuan

Hasil penelitian ini menunjukkan prestasi belajar siswa kelas XI dan XII cabang olahraga voli pantai yang berada pada kriteria “baik” dan tidak linier dengan

Langkah-langkah pelaksanaan yang dilakukan dalam program Islamic School Culture yaitu terdiri dari kegiatan awal, kegiatan inti dan kegiatan akhir dalam

Penerapan data mining ini menggunakan tahapan Knowledge Discovery in Database (KDD) yang terdiri dari Data Cleaning, Data Integration, Data Selection,

Data mining yang disebut juga dengan Knowledge- Discovery in Database (KDD) adalah sebuah proses secara otomatis atas pencarian data di dalam sebuah memori