CHAPTER 5
BUSINESS INTELLIGENCE: DATA WAREHOUSING,
DATA ACQUISITION, DATA MINING, BUSINESS
ANALYTICS, AND VISUALIZATION
Turban, Aronson, and Liang
Decision Support Systems and Intelligent Systems,
Seventh Edition
BAB-5
SISTEM
Tujuan Pembelajaran
Menjelaskan masalah dalam manajemen data.
Memahami konsep dan kegunaan DBMS.
Mempelajari data warehousing dan data marts.
Menjelaskan business intelligence/business
analytics.
Membahas bagaimana meningkatkan pengambilan
keputusan melalui manipulasi data dan analisa.
Memahami interaksi antara teknologi Web dan
database.
Menjelaskan bagaimana teknologi database
digunakan dalam business analytics.
Memahami pengaruh Web terhadap business
Pengantar
Banyak Organisasi memiliki data yang jumlahnya terus
meningkat sangat cepat.
Menghapus data-data penting menjadi suatu masalah?
Efektif, dan tidak efektif dan bermasalah bagi sebagian
organisasi
Solusi:
menggunakan
piranti
analitik
untuk
meningkatkan
pengambilan
keputusan,
dengan
menempatkan arsitektur data dengan benar.
Data warehouse memberikan sebuah
arsitektur data strategis untuk melakukan
analisis pendukung keputusan.
Data warehouse memungkinkan data
mining,
sebuah
kemampuan
secara
otomatis mensintesakan sejumlah besar
informasi untuk menemukan
kebenaran-kebenaran tersembunyi
di dalam data.
Information Sharing a Principle Component of
the National Strategy for Homeland Security
Vignette
Jaringan dari sistem yang memberikan
distribusi dan integrasi knowledge
Horizontal and vertical information sharing
Peningkatan komunikasi & Mengintegrasikan
pengetahuan.
Data Mining tersimpan dalam data warehouse
yang memungkinkan diakses melalui Web
@ Menggunakan orang yang tepat, proses serta
Peningkatan komunikasi
& Mengintegrasikan
pengetahuan.
Mengintegrasikan pemakaian informasi secara
bersama-sama dil intas pemerintahan federal
Memperluas integrasi pemakaian informasi
bersama-sama di lintas pemerintahan bagian
dan lokal, industri swasta, dan warga negara
Mengadopsi standar metadata dari informasi
elektronik yang relevan dengan keamanan tanah
air
Meningkatkan komunikasi keamanan publik
Data, Information,
Knowledge
Seorang pengambil keputusan membutuhkan data, informasi
dan pengetahuan
Pengambil keputusan harus mampu menerapkan piranti
analisis OLAP, data mining dll sehingga data, informasi, dan
pengetahuan bermanfaat.
Kecerdasan bisnis membuat para pengambil keputusan dapat
mengidentifikasi hubungan diantara item-item data sehingga
memberikan pemahaman dan keunggulan kompetitif
Data diintegrasikan dalam sebuah data warehouse dan
dianalisis secara otomatis via piranti data mining atau para
analis dengan menggunakan OLAP.
Data, Information,
Knowledge
Data
Sesuatu yang menjadi gambaran paling mendasar mengenai sesuatu, benda, peristiwa, aktifitas dan transaksi yg direkam.
Terdiri dari internal (data korporat) atau eksternal (komersial, Sensor dan Satelit (GIS), lembaga riset, bank, biro sensus dll )
Data dan pengetahuan personal
Informasi
Data yang telah diolah menjadi sesuatu yang lebih berarti dan bernilai
Knowledge
Data (
Pengumpulan data, Masalah dan
Kualitas
)
Data mentah diperoleh secara manual atau menggunakan
instrumen (alat/sensor scanner/GPS/PDA/RFID) metode
time study, surve, kuesioner, observasi dan wawancara
Masalah2 Data (GIGO)
Kualitas Data merupakan sesuatu yang penting
Kualitas menentukan manfaat
Contextual data quality (Relevansi, nilai tambah, batasan waktu, kelengkapan, dan jmlah data)
Intrinsic data quality (akurasi, objectivitas, kemampuan u/ dapat dipercaya, reputasi)
Accessibility data quality (kemudahan akses, dan keamanan akses)
Representation data quality (pemahaman, kemampuan untuk diinterpretasikan (representasi tepat dan konsisten)
Sering kali terlupakan atau ditangani begitu saja
Data
Membersihkan data
Ketika menggunakan warehouse
Data quality action plan
Best practices untuk kualitas data
Mengukur hasil
Topik terkait dengan Integritas Data
Uniformity (Keseragaman)
Version (pemeriksaan versi ketika diubah
menggunakan metadata dan memastikan data
asli tidak berubah)
Completeness check (Periksa kelengkapan)
Conformity check (Periksa konsistensi)
Data
Integrasi Data
(mengatasi sistem pengarsipan lemah, konflik data, tipe
dan ukuran)
Diperlukan akses ke berbagai sumber
Seringkali berskala besar
(enterprise-wide)
Database yang berbeda dan heterogen
XML menjadi bahasa standard
Sumber Data Eksternal
Mengumpulkan data dari banyak sumber
eksternal bisa sangat rumit.
Web (
kebanyakan sumber data ekst. Aadalah
web
)
Intelligent agents
Document management systems
Content management systems
Commercial databases
Contoh: Layanan database
komersial
CompuServe and the source (compuserve.com)
menyediakan bank data statistik, bibliografi
(berita, referensi, perpustakaan, dan ensiklopedi)
Compustat
(compustat.com)
menyediakan
statistik keuangan puluhan ribu korporasi, statistik
pertanian,
perbankan,
komoditi,
demografi,
ekonomi, energi, keuangan, asuransi dll.
Dow Jone Information service
Lockheed in information system
Database Management Systems
Software program
Mendukung Sistem Operasi
Mengelola data
Menjalankan Query dan
menghasilkan reports
Keamanan Data
Dikombinasikan dengan modeling
Database Models
Hierarchical
Top down, seperti struktur pohon
Fields hanya memiliki satu “parent”, setiap “parent” dapat memiliki beberapa “children”
Cepat
Network
Relationships dibuat melalui linked lists, dengan menggunakan pointers
“Children” dapat memiliki beberapa “parents”
Sangat fleksibel
Relational
Flat, tabel dua dimensi dengan multiple access queries
Menganalisa relasi antar tabel
Fleksibel, cepat, dan diperluas dengan data independence
Object oriented
Database Models,
lanjutan
Multimedia Based
Multiple data formats
JPEG, GIF, bitmap, PNG, sound, video, virtual reality
Membutuhkan hardware tertentu untuk dapat
menampilkan semua feature yang tersedia
Document Based
Penyimpanan dan manajemen dokumen
Intelligent Based
Intelligent agents dan Artificial Neural Network
Data Warehouse
Subject oriented (diorganisasi berdasar subjek tertentu: Pelanggan, klaim dll)
Terintegrasi: Sudah dibersihkan sehingga data menjadi standar meski
diperoleh dari berbagai sumber
Time series; no current status (data 5 tahun, 10 tahun) Nonvolatile
Read only dan eklusif untuk akses data Ringkas/Rangkuman
Tidak normal; mungkin saja terjadi kerangkapan data (redundant)
Menyajikan data dari sumber internal dan eksternal Mencakup Metadata
Data tentang data
Business metadata Semantic metadata
ARSITEKTUR
May have one or more tiers
Ditentukan oleh warehouse (data dan perangkat
lunak terkait), data acquisition (
back end
) yang
mengektraksi data dari sistem legacy dan sumber
ekstrenal, dan perangkat lunak client (
front end
)
yang mengizinkan pengguna mengakses dan
meneliti data di dalam warehouse.
One tier, dimana semua dijalankan dalam platform yang sama, sangat jarang
Two tier biasanya menggabungkan DSS engine (client) dengan warehouse
Lebih ekonomis
Migrasi Data
Business rules
Tersimpan dalam metadata repository
Diaplikasikan pada data warehouse secara terpusat
Data di-extract dari berbagai sumber yang
relevan
Di-load melalui data-transformation tools atau
programs
Terpisah antara operation dan decision support
environments
Memperbaiki masalah kualitas sebelum data
disimpan
Proses membersihkan dan mengorganisasikan
Perancangan Data
Warehouse
Dimensional modeling
Retrieval based
Diimplementasikan dengan star schema
Central fact table
Dimension tables
Grain
Pengembangan Data
Warehouse
Teknik Implementasi Data warehouse
Top down
Bottom up
Hybrid
Federated
Projects may be data centric or application centric
Implementation factors
Organizational issues
Project issues
Technical issues
Scalable
Data Marts
Data mart adalah sebuah subkumpulan (subset)
data warehouse, terdiri dari subject tunggal (mis:
pemasaran, operasional)
Dependent
Dibuat dari warehouse
Replika
Functional subset dari warehouse
Independent
Skala lebih kecil, versi data warehouse yang “lebih murah”
Dirancang untuk sebuah departemen/bagian
Business Intelligence and
Analytics
Business intelligence
Akuisisi/penggabungan dari data dan
informasi untuk digunakan dalam kegiatan
pengambilan keputusan
Business analytics
Models and solution methods
Data mining
Menerapkan model dan metod pada data
OLAP
Aktivitas yang dilakukan oleh end users pada
online systems
Specific, open-ended query generation
SQL