• Tidak ada hasil yang ditemukan

IN086 - Temu Pengetahuan

N/A
N/A
Protected

Academic year: 2021

Membagikan "IN086 - Temu Pengetahuan"

Copied!
10
0
0

Teks penuh

(1)

IN086 - Temu Pengetahuan

1. Pengenalan Temu Pengetahuan

1

Materi Perkuliahan

Review Basis Data

Data Warehouse

(2)

Apa itu Data Warehouse?

• Didefinisikan dalam berbagai bentuk, namun belum ada definisi yang pasti

• Sebuah basis data pendukung keputusan yang dipelihara terpisah dari basis data operasional dari sebuah organisasi

• Mendukung pengolahan informasi dengan menyediakan platform yang solid untuk analisis dari data historis yang terkonsolidasi.

• Sebuah Data Warehouse adalah sebuah koleksi data yang

berorientasi subyek, terintegrasi, bervariasi waktu, dan tidak berubah untuk mendukung proses pengambilan keputusan dari manajemen – W.H.Inmon

3

Contoh

Toko JC Penney :

Seorang manajer senior (Tuan X) ingin

mengetahui tipe apa saja (gaya, bahan baju,

warna, dan ukuran) dari baju wanita yang

terjual cepat selama bulan Oktober sampai

Desember di wilayah Utara?

4

Type Oktober November Desember Total Casual 1.500.000 1.700.000 3.500.000 6.700.000 Formal 2.300.000 2.500.000 2.200.000 7.000.000 Party 1.500.000 2.000.000 5.000.000 8.500.000 Total 5.300.000 6.200.000 10.700.000 22.200.000

(3)

Tiada akhir

….

Tuan X kembali lagi – Apa mungkin untuk

didetilkan di setiap toko di setiap kota?

• Berdasarkan kelompok umur, apabila mungkin

• Berdasarkan kelompok pendapatan, jika data tersedia

• Berdasarkan metode pembayaran (cek, tunai, kartu kredit, dll)

Manager IS jadi capek ....

5

– Setelah dua hari – Tuan X meminta data didetilkan

untuk setiap minggu selama Oktober – Desember

– Hari berikutnya Tuan X ingin didetilkan lagi

berdasarkan kota di wilayah Utara

(4)

Mengapa Data Mining?

Pertumbuhan data yang ekslosif: dari terabita ke petabita

• Koleksi data dan ketersediaan data: perangkat pengumpul data otomatis, sistem basis data, Web, masyarakat yang terkomputerisasi

Banyak sumber – sumber data yang berlimpah

• Bisnis: Web, E-Commerce, transaksi, bursa, ....

• Ilmu Pengetahuan: penginderaan jarak jauh, bio informatika, simulasi ilmiah ...

• Komunitas dan semua orang: berita, kamera digital ....

Kita kebanjiran data, tapi kelaparan pengetahuan!

“Kebutuhan adalah ibu dari penemuan” – Data mining –

analisa otomatis dari data set yang masif

7

Sumber Data yang Masif

Data Astronomi tentang obyek luar angkasa:

10

6

– 10

12

Data dengan atribut yang sangat banyak

(fitur, pengukuran, kolom)

Ratusan variabel untuk rekam medis pasien yang

berhubungan dengan hasil eksaminasi medis

(5)

Evolution dari Teknologi Basisdata

• 1960-an: Koleksi data, kreasi data, IMS dan jaringan DBMS

• 1970-an: Model data relasional, implementasi DBMS relasional

• 1980-an:

• RDBMS, model data yang lebih majur (extended-relational, OO, deductive, dll) • DBMS berorientasi aplikasi (spasial, ilmu pengetahuan, teknik, dll)

• 1990-an: Dataminng, Data Warehousing, Basis data multimedia, dan basis data web

• 2000-an

• Manajemen aliran data (stream data) dan mining • Data mining dan aplikasinya

• Teknologi Web (XML, data integrasi) dan sistem informasi global

• 2010-an: No SQL, komputasi awan

DM-MA/S1IF/FTI/UKM/2012 9

Evolusi Ilmu Pengetahuan

• Sebelum 1600, ilmu empiris

• 1600 – 1950-an, ilmu teoritis: setiap disiplin ilmu mengembangkan komponen teori. Model teori sering memotivasi eksperimen dan menggeneralisasi pemahaman kita

• 1950-an – 1960-an, ilmu komputasi: simulasi komputasi, terjadi karena ketidakmampuan menemukan solusi tertutup dari model matematika yang kompleks

• 1990-an – sekarang, ilmu data

• Banjir data dari perangkat dan simulasi ilmu pengetahuan yang baru

• Kemampuan untuk menyimpan dan mengelola data online dalam petabita dengan harga terjangkau

• Internet dan komputasi grid membuat semua arsip ini dapat diakses secara universal • Tugas – tugas manajemen informasi ilmiah, akuisisi, organisasi, kueri, dan visualisasi memilik skala liner terhadap volume data. Datamining menjadi tantangan terbesar!

(6)

Proses Temu Pengetahuan (KDD)

Datamining – inti dari

proses temu

pengetahuan

11 Data Cleaning Data Integration Databases Data Warehouse Task-relevant Data Selection Data Mining Pattern Evaluation

Apa itu Data Mining?

Data mining (temu pengetahuan dari data)

• Ekstraksi dari pola – pola atau pengetahuan yang menarik (non-trivial, implisit, tidak diketahui sebelumnya, dan secara potensial berguna).

• Data Mining : sebuah kesalahan istilah?

Nama – nama alternatif

• Temu pengetahuan (mining) di basis data (KDD), ekstraksi pengetahuan, analisi data / pola, arkeologi data, data dredging, pemanenan data, business intelligence, dll

Hati – hati: apakah semuanya “Data Mining”?

• Pencarian sederhana atau proses kueri

• Sistem pakar (deduktif)

(7)

Data Mining

DM-MA/S1IF/FTI/UKM/2012 13

DATA DATA MINING POLA - POLA

Data Mining dan Business Intelligence

Potensi yang meningkat Dari dukungan keputusan

bisnis Pengguna Akhir

Analis Bisnis Analis Data DBA Pengambilan Keputusan Presentasi Data Teknik – teknik visualisasi

Data Mining Penemuan Informasi Eksplorasi Data

Ringkasan Statistik, Proses kueri, dan Pelaporan Preprocessing Data/Integrasi, Data Warehouses

Sumber – sumber Data

(8)

Proses KDD Process: Pandangan Umum dari Machine

Learning dan Statistika

• Ini adalah pandangan umum dari komunitas machine learning dan statistika

15

Input Data Data

Mining Data Pre-Processing Post-Processing Data integration Normalization Feature selection Dimension reduction Pattern discovery Association & correlation Classification Clustering Outlier analysis … … … … Pattern evaluation Pattern selection Pattern interpretation Pattern visualization

Aplikasi Data mining

• Ilmu Pengetahuan:

• astronomi, bioinformatika, penemuan obat, dll

• Bisnis

• Periklanan, CRM (Customer Relationship Management), investasi, manufakturing, olah raga / entertainment, telekomunikasi, e-commerce, target marketing, jaminan kesehatan, dll • Web

• Mesin pencari, bot, dll

• Negara

• Penegakan hukum, profil pengemplang pajak, anti teror, dll

• Contoh: Amazon.commenggunakan data mining untuk menyediakan saran pembelian

kepada konsumen

Customers who bought this book also bought:

• Seven Methods for Transforming Corporate Data Into Business Intelligence by Vasant Dhar, Roger Stein

• Building Data Mining Applications for CRM by Alex Berson, et al

• Data Preparation for Data Mining by Dorian Pyle Kellogg on

• Integrated Marketing by Dawn Iacobucci (Editor), et al Multivariate

• Data Analysis (5th Edition) by Joseph F. Hair (Editor), et al

Explore similar items

(9)

Aplikasi DM: Ritel

Melakukan analis keranjang (basket analysis)

• Barang – barang apa yang akan dibeli bersamaan oleh konsumen

• Pengetahuan ini dapat meningkatkan penyetokan, strategi layout toko, dan promosi

Sales forecasting

• Meneliti pola – pola pembelian berdasarkan waktu dapat membantu riteler untuk membuat keputusan stok yang tepat

• Jika seorang konsumen membeli sebuah item hari ini, kapan kira – kira dia akan membeli item komplementer?

Database marketing

• Riteler dapat membangun profil konsumen dengan perilaku tertentu, contohnya, siapa saja yang membeli produk bermerek dan siapa saja yang datang saat promosi diskon

• Informasi ini dapat digunakan untuk promosi yang terfokus sehingga efektif secara biaya

DM-MA/S1IF/FTI/UKM/2012 17

DM dalam CRM: Siklus Hidup Komsumen

Siklus Hidup Konsumen: tahapan hubungan antara

seorang konsumen dengan sebuah bisnis

Tahapan penting dari Siklus Hidup Konsumen

Prospects:

• Orang yang belum menjadi konsumen tapi menjadi target pasar

Responders:

• Prospektus yang menunjukkan ketertarikan pada sebuah produk atau layanan

Active Customers:

• Orang yang sekarang ini menggunakan produk atau layanan

Former Customers:

• Mungkin konsumen yang “tidak baik” yang tidak membayar tagihan atau menyebabkan biaya tinggi

(10)

Referensi

Dokumen terkait