• Tidak ada hasil yang ditemukan

Pengantar Data Mining (DM)

N/A
N/A
Protected

Academic year: 2023

Membagikan "Pengantar Data Mining (DM)"

Copied!
25
0
0

Teks penuh

(1)

Pertemuan-1

(2)

Pengantar Data Mining (DM)

Motivasi

Mengapa? Apa?

Aplikasi

Proses KDD

Tinjauan DM Isu Utama

Pengantar DM

(3)

Motivasi: “Kebutuhan

Merupakan Sumber Penemuan”

• Problem ledakan data

– Tool koleksi data otomatis dan

perkembangan teknologi database

menyebabkan banyak sekali data yang bisa dikumpulkan di dalam database, data

warehouse, dan alat peyimpanan informasi lainnya, untuk dianalisa

• Kita berkubang data tetapi kelaparan pengetahuan!

Pengantar DM

(4)

Motivasi: “Kebutuhan

Merupakan Sumber Penemuan”

• Solusi: Penggudangan data dan

penambangan data (Data warehousing and data mining)

– Data warehousing dan on-line analytical processing (OLAP)

– Penyaringan pengetahuan yang menarik

(kaidah, keberaturan, pola, kendala) dari data dalam database yang besar

Pengantar DM

(5)

Komputer Tahun 1940-an (ENIAC)

Pengantar DM

(6)

Help

Personal Home Network Tahun 2000-an

FileEdit 500 400 Locate View

E DC BA

Help Storage

300 200

100 Mount

431 7437 1950

012345

6 Network Traffic

7 79% /

0263196347358

93%/us

Storage

Storage Storage

Storage Storage Storage

Internet

Storage

Pengantar DM

(7)

Evolusi atau Perkembangan Teknologi Database

• 1960an: Koleksi data, pembuatan data, IMS dan network DBMS

• 1970an: Model data relasional dan implementasi DBMS relasional

• 1980an: RDBMS, model data lanjut (extended- relational, OO, deduktif, dsb.) DBMS berorientasi aplikasi(spasial, saintifik, teknik, dsb.)

• 1990an –2000an: Data mining dan data

warehousing, database multimedia, teknologi Web

Pengantar DM

(8)

Apa Itu Data Mining?

• Pada dasarnya: Perolehan pengetahuan dari data

– “Ekstraksi informasi atau pola yang menarik (tidak sepele, implisit, tak-diketahui

sebelumnya, mungkin bermanfaat) dari data didalam database yang besar"

• Seringkali hanya:

– “Memberitahu sesuatu yang menarik dari data ini", “Menguraikan data ini"

Penyelidikan: analisa data semi-otomatis atas sekumpulan data yang besar

Pengantar DM

(9)

Apa Itu Data Mining?

• Istilah yang rada baku:

– Data mining

• Biasanya DM adalah salah satu proses KDD – Knowledge discovery in databases (KDD)

• Istilah umum yang meliputi, preprocessing data, DM, dan postprocessing

• Istilah yang tidak terlalu sering digunakan:

– Ekstraksi pengetahuan, arkeologi data,

pengerukan data, penuaian informasi, analisa data/pola

• Publisitas terbaru:

– Kecerdasan bisnis, manajemen pengetahuan

Pengantar DM

(10)

Mengapa Data Mining?

• Ketersediaan data dalam jumlah yang sangat besar:

– Tool koleksi data otomatis dan

perkembangan teknologi database menyebabkan banyak sekali data yang bisa dikumpulkan di dalam database, data warehouse, dan alat peyimpanan informasi lainnya

– Pemeriksaan data manual adalah membosankan dan terkadang tidak masuk akal

Pengantar DM

(11)

Apa Manfaat Dari DM?

Meningkatkan pengetahuan agar bisa membuat keputusan

berdasarkan:

Marketing

Misal, pengaruh pada marketing Peran dan pengaruh DM yang bertumbuh pesat dan masih bertumbuh!

Data

Database Marketing

KDD &

Tetapi DM tidaklah sekedar marketing...

Warehousing Data Mining

Pengantar DM

(12)

Potensi Aplikasi?

• Analisis database dan dukungan keputusan:

– Analisis dan manajemen pasar

• Target pasar, manajemen relasi

customer (CRM), analisis keranjang pasar, penjualan silang, segmentasi pasar

– Analisis dan manajemen resiko

• Peramalan, tindakan mempertahankan customer, peningkatan asuransi,

kontrol kualitas, analisis kompetitif – Deteksi dan manajemen kecurangan

Pengantar DM

(13)

Potensi Aplikasi?

• Aplikasi lain:

– Text mining (news group, email, dokumen) dan Web mining

– Stream data mining

– Analisis DNA dan bio data

Pengantar DM

(14)

Analisis dan Manajemen Pasar

• Dari mana data berasal?

– Transaksi kartu kredit, loyalty cards, kupon discount, keluhan customer, kajian lifestyle publik

• Target Pasar

– Mendapatkan kelompok model customer yang berbagi

karakteristik yang sama: minat, tingkat pendapatan, kebiasaan belanja, dsb.

– Menentukan pola pembelian customer berdasarkan waktu

• Analisis lintas pasar

– Asosiasi/korelasi antara penjualan produk & taksiran berdasarkan asosiasi demikian

Pengantar DM

(15)

Analisis dan Manajemen Pasar

• Profil customer

– Tipe customer apa membeli produk apa (pengelompokan atau klasifikasi)

• Analisa kebutuhan customer

– Mengenali produk terbaik untuk customer berbeda – Meramalkan faktor apa yang akan memikat customer

baru

• Penyediaan rangkuman informasi

– Rangkuman laporan multidimensi

– Rangkuman informasi statistik (kecenderungan data terpusat dan variasi)

Pengantar DM

(16)

Analisis dan Manajemen Resiko Perusahaan

• Perencanaan keuangan dan evaluasi aset – Analisis dan peramalan cash flow

– Analisis ganti rugi yang mungkin untuk mengevaluasi aset

– Analisis cross-sectional dan time series (financial- ratio, analisa trend, dsb.)

• Perencanaan sumberdaya

– Merangkum dan membandingkan sumberdaya dan pengeluaran

Pengantar DM

(17)

Analisis dan Manajemen Resiko Perusahaan

• Kompetisi

– Memantau pesaing dan arah pasar

– Mengelompokkan customer kedalam kelas dan prosedur harga berbasis kelas

– Menetapkan strategi harga dalam suatu pasar dengan kompetitif tinggi

Pengantar DM

(18)

Aplikasi Lain

• Olah raga

– IBM Advanced Scout menganalisa statistik (shots blocked, assists, dan fouls) pertandingan NBA untuk mendapatkan keuntungan kompetitif bagi New York Knicks dan Miami Heats

• Astronomi

– Observatory JPL dan Palomar menemukan 22 quasars dengan bantuan data mining

• Internet Web Surf-Aid

– IBM Surf-Aid menerapkan algoritma data mining untuk akses logs halaman Web yang terkait dengan pasar dalam upaya mendapatkan kesukaan dan perilaku customer,

mengenalisa efektifitas pemasaran Web, perbaikan situs Web organisasi, dsb.

Pengantar DM

(19)

Contoh (1)

• Anda seorang manajer marketing untuk perusahaan telepon cellular:

– Pelanggan menerima sebuah telepon gratis (nilai 1.5 juta) dengan kontrak satu tahun; anda

memberikan suatu komisi penjualan sebesar 2.5 juta per kontrak

– Problem: Turnover (setelah kontrak berakhir) adalah 25%

– Memberikan suatu telepon baru ke setiap orang yang kontraknya habis sangatlah mahal

– Membawa kembali customer setelah keluar adalah juga sukar dan mahalPengantar DM

(20)

Contoh (1)

• Tiga bulan sebelum suatu kontrak berakhir, cari tahu customer mana yang akan

Yippee!

I won't leave!

keluar:

– Jika anda ingin mempertahankan

customer yang diduga akan keluar, tawarkan customer tersebut suatu telepon baru

Pengantar DM

(21)

Contoh (2)

• Anda seorang petugas asuransi dan anda harus mendefinisikan suatu Oh, yes!

I love my Ferrari!

pembayaran bulanan yang

pantas untuk seorang pemuda berusia 18 tahun yang

membeli sebuah Ferrari … apa yang anda akan lakukan?

Pengantar DM

(22)

Contoh (2)

• Kaji seluruh data customer dan data kompensasi pembayaran sebelumnya

• Kaji peluang penyebab kecelakaan paling banyak berdasarkan dugaan…

– Kelamin pengendara (pria/wanita) dan usia

– Model dan usia mobil, tempat tinggal – dsb.

• Jika peluang kecelakaan lebih besar dari rata-rata, aturlah pembayaran bulanan yang sesuai!

Pengantar DM

(23)

Contoh (3)

• Anda berada diluar negeri dan seseorang mencuri atau menggandakan kartu kredit atau telepon mobile anda …

• Perusahaan kartu kredit …

– Menggunakan data histori untuk

membangun model prilaku penipuan dan gunakan data mining untuk membantu didalam mengenali kejadian yang mirip

• Perusahaan telepon …

– Menganalisis pola yang menyimpang dari suatu kebiasaan yang diharapkan (tujuan, durasi, dsb.)

Pengantar DM

(24)

Contoh (4)

• Log pengaksesan Web bisa dianalisis untuk …

Excellent surfing

experience! – Mendapatkan apa kesukaan customer – Memperbaiki situs Web organisasi

• Demikian pula …

– Seluruh jenis analisis log informasi – Adaptasi antarmuka/layanan user

Pengantar DM

(25)

Pengantar DM

Selesai

Referensi

Dokumen terkait

Berdasarkan latar belakang yang telah disampaikan dapat diperoleh rumusa n masalah yaitu “Bagaimana cara menerapkan data mining dengan algoritma naïve bayes untuk

Berdasarkan uraian latar belakang diatas maka permasalahan pada penelitian ini adalah Bagaimana menerapkan data mining dengan menggunakan algoritma Naive Bayes

Beberapa metoda atau teknik yang dikenal di dalam data mining salah satunya adalah association rule (aturan asosiasi) yang berusaha menemukan aturan-aturan tertentu

Dapat menerapkan data mining dengan algoritma apriori pada data alumni TIF terkait mencari pola-pola yang mempengaruhi lama studi mahasiswa berdasarkan tiga

Menerapkan teknik data mining dengan algoritma Naive Bayesian Classifier untuk menampilkan informasi yang berharga dari data posyandu mengenai pertumbuhan balita ideal dan tidak

Proses Utama pada Data Mining Input (Data) Metode (Algoritma Data Mining) Output (Pola/Model) DATA PRE-PROCESSING Data integration Normalization Feature selection. DATA

Contoh implementasi data mining seperti Analisa Pasar dan Manajemen (contoh: menembak target pasar, identifikasi kebutuhan customer), Analisa Perusahaan dan Manajemen Resiko

Dokumen ini membahas tentang Data Mining dengan fokus pada algoritma Decision