• Tidak ada hasil yang ditemukan

Data Mining. Pengenalan Sistem & Teknik, Serta Contoh Aplikasi. Avinanta Tarigan. 22 Nov Avinanta Tarigan Data Mining

N/A
N/A
Protected

Academic year: 2021

Membagikan "Data Mining. Pengenalan Sistem & Teknik, Serta Contoh Aplikasi. Avinanta Tarigan. 22 Nov Avinanta Tarigan Data Mining"

Copied!
41
0
0

Teks penuh

(1)

Data Mining

Pengenalan Sistem & Teknik, Serta Contoh Aplikasi

Avinanta Tarigan

(2)

Outline

1

Pengertian Dasar

2

Classification Mining

3

Association Mining

4

Clustering

5

Penutup

(3)

Outline

1

Pengertian Dasar

2

Classification Mining

3

Association Mining

4

Clustering

5

Penutup

(4)

Latar Belakang

Banyak data yang telah direkam dan disimpan:

Transaksi penjualan supermarket

Transaksi perbankan dan kartu kredit

Log kunjungan Web (access_log) Akuisisi data dalam

penelitian-penelitian seperti astronomi, kesehatan, dll

Sistem komputer lebih murah Kebutuhan untuk berkompetisi

dengan strategi yang tepat

(5)

Mengapa Harus Data Mining ?

Data yang sedemikian besar kadang memiliki informasi yang tersembunyi

Kemampuan manusia terbatas untuk “mempelototi”

data-data tersebut dalam analisis

(6)

Definisi 2 Data Mining

Data

Rekaman atau catatan terhadap fakta / transaksi / obyek

Definisi

Ekstraksi informasi yang implisit, tidak diketahui sebelumnya, dan berpotensi berguna

Eksplorasi dan analisis, secara otomatis atau tidak, data

yang sangat besar untuk menemukan pola-pola yang

berguna dan mempunyai arti

(7)

Pengertian Yang Salah

Bukan Data Mining

Mencari nomor telepon

“Bambang Gunawan” di buku telepon Indonesia Mencari informasi mengenai “Bunga” di google.com

Data Mining

Menemukan bahwa banyak orang bernama Bambang di daerah Jawa Timur Mengelompokkan dokumen web mengenai “Bunga”

sesuai dengan konteks Bunga Bank atau Kredit (Keuangan)

Bunga - Tanaman /

Pertanian

(8)

Sistem Ekstraksi Pengetahuan

KDD (Knowledge Discovery in Databases)

(9)

Ilmu Data Mining

Gabungan dari

beberapa bidang ilmu dalam Matematik dan Ilmu Komputer Diperlukan karena:

Data yang s(u)angat b(u)esar

Dimensi data yang besar

Data Heterogen

(10)

Data

Kumpulan obyek data dan atributnya

Obyek : record, point, case,

sampel, entitas, instan

Atribut / variabel / field :

karakteristik dari obyek (status

pernikahan, umur, dll)

(11)

Outline

1

Pengertian Dasar

2

Classification Mining

3

Association Mining

4

Clustering

5

Penutup

(12)

Classification Mining

Ekstraksi pola pengelompokan atau pengklasifikasian sebuah himpunan obyek / data (training-set) ke dalam kelas (class) tertentu berdasarkan atribut-atributnya Pola pengelompokan yang ditemukan akan menjadi model pengelompokan

Model digunakan untuk memprediksi kelompok data /

obyek baru (test-set)

(13)

Ilustrasi Classification Mining

(14)

Contoh Aplikasi I

Pemakaian Kartu Kredit secara Ilegal

Tujuan : mendeteksi adanya penggunaan kartu kredit secara ilegal

Pendekatan :

Data transaksi sebelumnya (lokasi & waktu transaksi, jenis barang yang dibeli, besar transaksi)

Label data-data tersebut dengan Curang atau Aman DM mencari model klasifikasi Curang atau Aman berdasarkan atribut transaksi

Menerapkan model tersebut jika ada transaksi baru untuk

mempercepat / tepat tindakan preventif

(15)

Contoh Aplikasi II

Deteksi SPAM

Tujuan : mendeteksi email yang tidak diharapkan secara dini

Direct Marketing

Tujuan : mencari pengelompokan profil pelanggan agar target marketing sesuai

Sky Survey Cataloging

Tujuan : mengelompokkan obyek langit hasil pemotretan

teleskop ke dalam class-nya

(16)

Contoh Aplikasi III

(17)

Teknik / Metode

Decision Tree (Pohon Keputusan) Rule-based Methods

Memory based reasoning

Neural Networks (Jaringan Syaraf Tiruan)

Naive Bayes dan Bayesian Belief Networks

Support Vector Machines

(18)

Contoh Model: Pohon Keputusan I

(19)

Contoh Model: Pohon Keputusan II

(20)

Outline

1

Pengertian Dasar

2

Classification Mining

3

Association Mining

4

Clustering

5

Penutup

(21)

Association Mining

Menemukan pola asosiasi dalam data

Adanya kemunculan obyek tertentu berdasarkan

kemunculan obyek yang lain

(22)

Contoh Aplikasi I

Marketing & Sales Promotion Misalnya pola yang ditemukan : {Susu Anak, ...} → {Kwaci}

Kwaci sebagai konsekuen : bagaimana caranya menaikkan penjualan kwaci

Susu Anak sebagai anteseden : jika tidak lagi menjual susu

anak, memprediksi produk lain yang ikut jatuh penjualannya

Dua-duanya : membuat paket promo Susu Anak, Kwaci, dll

(23)

Contoh Aplikasi II

Pengelolaan Rak di Supermarket

Tujuan: memudahkan pelanggan berbelanja barang-barang yang sering dibeli bersama

Misalnya: ada rak kecil berisi kwaci diletakkan pada bagian susu anak

Sistem Rekomendasi Pintar

Tujuan: memberikan rekomendasi kepada pelanggan toko

buku on-line tentang buku-buku lain yang sering dibeli juga

oleh pelanggan lainnya jika membeli buku tertentu

(24)

Metode

Rule asosiasi : X → Y

1

Membangkitkan semua item-set yang kemunculannya tinggi pada data

1

Bentuk Lattice (struktur yang akan memunculkan semua subset yang diurutkan berdasarkan subset - superset)

2

Menyeleksi item-set dg Support yang tinggi. Support = Jumlah Transaksi Yg Berisi

X

dan

Y

Jumlah Keseluruhan Transaksi

2

Mencari pola asosiasi yang mempunyai “confidence” yang tinggi

1

Confidence = Mengukur seberapa sering item di Y juga muncul pada transaksi yang berisi X

2

Gunakan pencarian Bread-First-Search atau

Depth-First-Search pada Lattice tsb

(25)

Ilustrasi I

Pembentukan Lattice

(26)

Ilustrasi II

Seleksi “Support”

(27)

Ilustrasi III

Seleksi High “Confidence”

(28)

Outline

1

Pengertian Dasar

2

Classification Mining

3

Association Mining

4

Clustering

5

Penutup

(29)

Clustering (Penggugusan)

Definition

Proses mencari gugus-gugus dari sekumpulan obyek sehingga

obyek-obyek di dalam sebuah gugus mirip satu dengan lainnya,

dan berbeda dengan obyek di luar gugusnya.

(30)

Contoh Aplikasi I

Web-Document Clustering:

Tujuan: mencari gugus dokumen-dokumen Web yang mirip berdasarkan kemunculan istilah penting

Pendekatan: mengidentifikasi istilah yang sering muncul pada setiap dokumen, mengukur kemiripan berdasarkan frekwensi kemunculan istilah pada dokumen lainnya Hasil: Web search engine memunculkan

dokumen-dokumen yang mirip (dalam 1 gugus)

berdasarkan istilah yang dicari

(31)

Contoh Aplikasi II

Segmentasi Pasar:

Tujuan: mencari gugus segmentasi pasar berdasarkan data transaksi untuk keperluan marketing

Pendekatan:

mempersiapkan data beserta atribut data pelanggan berdasarkan geografi dan data pribadi lainnya

mencari gugus pelanggan yang mirip berdasarkan atribut2 tsb

melakukan observasi perilaku pasar berdasarkan

gugus-gugus pelanggan yang ditemukan

Hasil: strategi marketing yang tepat sasaran

(32)

Mengukur Kemiripan Atribut Data I

Kemiripan (Similarity):

ukuran dalam numerik [0,1] yang merepresentasikan kemiripan antara 2 obyek

0 (tidak mirip) < range-kemiripan < 1(sama/mirip sekali) Ketidakmiripan (Disimilarity) vs Kemiripan

p dan q adalah nilai atribut dari 2 obyek Tipe Atribut Ketidakmiripan Kemiripan

Nominal d =

( 0 if p = q

1 if p 6= q s =

( 0 if p 6= q

1 if p = q

Ordinal d =

|p−q|n

s = 1 −

|p−q|n

(33)

Mengukur Kemiripan Atribut Data II

Pengukuran kemiripan variabel kontinyu:

Euclidean Distance:

dist = q

ni=1

(p

i

− q

i

)

2

Minkowski Distance:

dist = ∑

ni=1

|p

i

− q

i

|

r



1r

(34)

Mengukur Kemiripan Atribut Data III

Contoh Euclidean Distance

(35)

Contoh Algoritma Pencari Gugus

K -Means Clustering, Konsep: Centroid → titik tengah gugus

Algoritma (asumsi: sudah dilakukan pengukuran kemiripan)

1

Tentukan K points sebagai awal centroids

2

Repeat

3

Buat K buah gugus dengan memasukkan point-point yang dekat dengan centroid

4

Cari centroid baru dari gugus-gugus tersebut

5

Until Centroid tidak berubah

(36)

Ilustrasi K-Means

(37)

Outline

1

Pengertian Dasar

2

Classification Mining

3

Association Mining

4

Clustering

5

Penutup

(38)

OnLine Analytical Processing I

Diusulkan oleh E.F. Codd (Bapak Relational Database) Data tidak diolah dari database, melainkan dibentuk dalam array multidimensi

Data dapat direpresentasikan sebagai titik / point dalam

ruang multi-dimensi jika atribut

2

nya adalah numerik

Matriks m × n dapat merepresentasikan model data tsb,

dimana terdapat m obyek dan n atribut (Data Cube)

Keuntungan: explorasi, operasi, dan transformasi data

dapat lebih mudah dilakukan dan (hampir) real-time

(39)

OnLine Analytical Processing II

Banyak analisis terhadap transaksi bisnis dengan volume

(40)

Informasi Mengenai Data Mining

Tan, Steinbach, Kumar, “Introduction to Data Mining”

http://en.wikipedia.org/wiki/Data_mining

(41)

Selesai

TERIMAKASIH

presentasi ini sendiri dapat didownload dari

http://avinanta.staff.gunadarma.ac.id

Gambar

Ilustrasi Classification Mining
Ilustrasi II
Ilustrasi III
Ilustrasi K-Means

Referensi

Dokumen terkait

Tahun 2014.. 10) Silakan tambahkan poin selanjutnya jika masih diperlukan. Bagaimana pendapat Anda mengenai tanggapan dari pengelola Program Studi D-IV Kearsipan

Ada beberapa yang dapat disimpulkan sebagai berikut : (1) Skor rata-rata penilaian terhadap kemampuan guru dalam menyusun Rencana Pembelajaran mengalami peningkatan

tidak hanya dipengaruhi oleh metode atau media saja juga dipengaruhi oleh banyak faktor yang bisa datang dari dalam siswa (internal) ataupun dalam diri siswa (eksternal).

Bagi mereka yang mendukung operasi plastik alasan pertama yang diutarakan berkaitan dengan keiginan untuk tampil lebih muda.. Terlihat lebih muda membuat orang

Contoh penerapan teori sistem sebagai hal yang mempertegas dan memperjelas antara deskriptif dan preskriptif pada suatu permasalahan yang sedang dikemukakan

kerjasama Indonesia – Jepang melalui Joint Crediting Mechanism dalam pembangunan rendah karbon yang diimplementasikan dalam bentuk kerjasama antar kota dengan studi kasus

Tujuan penelitian ini adalah untuk mengidentifikasi dan menganalisis penerapan terapi perilaku: token ekonomi pada klien dengan gangguan sensori persepsi:

Prosedur penelitian dilakukan dengan beberapa tahapan yaitu fermentasi biji kakao, sampling, analisis populasi mikroorganisme (khamir, bakteri asam laktat dan