BAB II
LANDASAN TEORI
2.1. Teori Umum
Adapun teori ataupun istilah – istilah umum dalam data warehouse dan business Intelligence
2.1.1.Data dan Informasi
Menurut McLeod (2007, 11), data terdiri dari fakta-fakta dan angka yang secara relatif tidak berarti bagi pemakai. Sedangkan informasi adalah data yang sudah diproses atau data yang memiliki arti. Disini kita dapat melihat bahwa data merupakan suatu bentuk keterangan-keterangan yang belum diolah atau dimanipulasi sehingga belum begitu berarti bagi sebagian pemakai. Sedangkan informasi merupakan data yang sudah diolah sehingga memiliki arti.
2.1.2.Pengertian Database
Menurut James A. O’Brien (2011: 4) Database adalah suatu koleksi terintegrasi dimana secara logika berhubungan dengan record dari file.
Menurut Fatansyah (2012: 2), Database adalah kumpulan data yang saling berhubungan yang disimpan secara bersama sedemikian rupa dan tanpa pengulangan(redudansi) yang tidak perlu, untuk memenuhi berbagai kebutuhan.
Jadi Database adalah tempat penyimpanan data yang saling berhubungan secara logika, sehingga bisa digunakan untuk mendapatkan suatu informasi yang diperlukan oleh suatu organisasi atau perusahaan. Sedangkan data yang diperoleh suatu organisasi atau perusahaan umumnya didapat dari kegiatan operasional sehari-hari atau hasil dari transaksi. Dari perkembangan model database, muncul lah apa yang disebut dengan data warehouse.
2.1.3.Pengertian Datawarehouse
Pengertian Data Warehouse dapat bermacam-macam namun mempunyai inti yang sama, seperti pendapat beberapa ahli berikut ini :
Menurut W.H. Inmon dan Richard D.H (2005: 493), data warehouse adalah koleksi data yang mempunyai sifat berorientasi subjek,terintegrasi,time-variant, dan bersifat tetap dari koleksi data dalam mendukung proses pengambilan keputusan management.
Menurut Paul Lane (2001: 30), data warehouse merupakan database relasional yang didesain lebih kepada query dan analisa dari pada proses transaksi, biasanya mengandung history data dari proses transaksi dan bisa juga data dari sumber lainnya. Data warehouse memisahkan beban kerja analisis dari beban kerja transaksi dan memungkinkan organisasi menggabung/konsolidasi data dari berbagai macam sumber.
Jadi, data warehouse merupakan metode dalam perancangan database, yang menunjang DSS(Decission Support System) dan EIS (Executive Information System). Secara fisik data warehouse adalah database, tapi perancangan data warehouse dan database sangat berbeda. Dalam perancangan database tradisional menggunakan normalisasi, sedangkan pada data warehouse normalisasi bukanlah cara yang terbaik.
Dari definisi-definisi yang dijelaskan tadi, dapat disimpulkan data warehouse adalah database yang saling bereaksi yang dapat digunakan untuk query dan analisisis, terintegrasi dan statis yang digunakan untuk membantu para pengambil keputusan.
2.1.4.Pengertian Data Mart
Data mart adalah suatu bagian pada data warehouse yang mendukung pembuatan laporan dan analisa data pada suatu unit, bagian atau operasi pada suatu perusahaan. Dalam beberapa implementasi data warehouse, data mart adalah miniature data warehouse. Data mart sering digunakan untuk memberikan informasi kepada segmen fungsional organisasi. Contoh umum data mart adalah untuk departemen penjualan, departemen persediaan dan pengiriman, departemen keuangan, manajemen tingkat atas, dan seterusnya. Data mart juga dapat digunakan untuk gudang data segmen data untuk mencerminkan bisnis secara geografis terletak di mana masing-masing daerah relatif otonom. Sebagai contoh, sebuah organisasi layanan yang besar mungkin memperlakukan pusat operasi regional sebagai unit usaha perorangan, masing-masing dengan data mart sendiri yang memberikan kontribusi untuk gudang data master.
2.1.5.Pengertian OLAP
Online Analytical Processing (OLAP) merupakan suatu metode pendekatan untuk menyajikan jawaban dari permintaan proses analisis yang bersifat dimensional secara cepat, yaitu desain dari aplikasi dan teknologi yang dapat mengoleksi, menyimpan,
memanipulasi suatu data multidimensi untuk tujuan analisis.
OLAP (Online Analytical Processing) adalah teknologi yang memproses data di dalam data warehouse dalam struktur multidimensi, menyediakan jawaban yang cepat untuk query analisis yang kompleks.
2.1.6.Pengertian Bisnis
Bisnismerupakan kata dengan banyak arti dan penggunaan. Dalam arti sempit bisnis berarti dalam keadaan sibuk. Namun, pengertian bisnis ini mengandung banyak konotasi sejak kata bisnis digunakan dalam segala aktivitas ekonomi orang yang sibuk. Dalam pengertian yang lebih ketat dalam ekonomi, tujuan dari bisnis adalah untuk menciptakan kostumer/konsumen untuk memperoleh keuntungan. Dalam kenyataannya, hanya beberapa bagian dari aktivitas individu yang terorganisasi yang dianggap sebagai aktivitas bisnis yaitu seperti yang berhubungan dengan pemenuhan kebutuhan manusia ataupun makhluk hidup.
Pengertian Bisnis menurut Haney adalah dapat didefinisikan sebagai aktivitas manusia yang dihubungkan dengan produksi ataupun memperoleh kekayaan melalui pembelian dan penjualan barang.
Pengertian Bisnis lebih lanjut dibatasi oleh Peterson dan Plowman yang menjelaskan bahwa bisnis merupakan serangkaian kegiatan yang berhubungan dengan penjualan ataupun pembelian barang dan jasa yang secara konsisten berulang. Menurutnya, penjualan jasa ataupun barang yang hanya terjadi satu kali saja bukan merupakan pengertian dari bisnis.
Pengertian Bisnis menurut Hooper bahwa bisnis adalah Segala dan keseluruhan kompleksitas yang ada pada berbagai bidang seperti penjualan (commerce) dan industri, industri dasar, processing, dan industri manufaktur dan jaringan, distribusi, perbankkan,insuransi, transportasi, dan seterusnya yang kemudian melayani dan memasuki secara utuh (which serve and interpenetrate) dunia bisnis secara menyeluruh.
Pengertian bisnis menurut Urwick dan hunt bahwa bisnis adalah segala perusahaan yang membuat, mendistribusikan, ataupun menyediakan segala barang ataupun jasa yang dibutuhkan oleh anggota masyarakat lainnya serta bersedia dan mampu untuk membeli atau membayarnya.
2.1.7.Pengertian Business Intelligence
Istilah Business Intelligence (BI) pertama kali didengungkan pada tahun 1958 oleh seorang peneliti dari IBM yang bernama Hans Peter Luhn. Beliau mendefinisikan istilah intelligence sebagai “Kemampuan dalam mengerti dan memahami suatu hubungan timbal balik antara fakta-fakta yang disajikan sedemikian rupa menjadi suatu landasan dalam bertindak untuk mencapai tujuan yang dikehendaki”.
BI seperti yang kita ketahui pada saat ini bisa dikatakan sebagai hasil evolusi dari Decision Support System (DSS) yang dimulai sekitar tahun 1960 dan berkembang sampai tahun 1980an. Sekitar tahun 1980an mulai dari DSS, EIS (Executive Information System), data warehouse, OLAP dan BI mulai menjadi perhatian dan menjadi suatu kesatuan system. Pada tahun 1989 dalam sebuah artikel terbitan Gartner, Howard Dresner menggunakan istilah Business Intelligence (BI) . Dia menggambarkan istilah tersebut sebagai seperangkat konsep dan metode yang berguna untuk meningkatkan kemampuan pembuatan keputusan dengan bantuan sistem yang berbasiskan fakta atau realita yang terjadi.
Menurut Nadia Branon, Business Intelligence merupakan kategori yang umum digunakan untuk aplikasi dan teknologi untuk mengumpulkan, menyimpan, menganalisa, dan menyediakan akses pada data agar dapat membantu pengguna dari kalangan perusahaan agar dapat mengambil keputusan dengan lebih baik dan tepat.
2.2. Teori Khusus
2.2.1.Karakteristik Data Warehouse
Karakteristik data warehouse menurut Inmon, yaitu : 1. Subject Oriented (Berorientasi subject)
Data warehouse berorientasi subject artinya data warehouse didesain untuk menganalisa data berdasarkan subject-subject tertentu dalam organisasi, bukan pada proses atau fungsi aplikasi tertentu.
Data warehouse diorganisasikan disekitar subjek-subjek utama dari perusahaan(customers,products dan sales) dan tidak diorganisasikan pada area-area aplikasi utama (customer invoicing,stock control dan product sales). Hal ini dikarenakan kebutuhan dari data warehouse untuk menyimpan data-data yang bersifat sebagai penunjang suatu keputusan, dari pada aplikasi yang berorientasi terhadap data.
Jadi dengan kata lain, data yang disimpan adalah berorientasi kepada subjek bukan terhadap proses. Secara garis besar perbedaan antara data operasional dan data warehouse yaitu :
Table 2.1 Perbedaan data Operasional dengan data Warhouse
Data Operasional Data Warehouse
Dirancang berorientasi hanya pada aplikasi dan fungsi tertentu
Dirancang berdasar pada subjek-subjek tertentu(utama)
Focusnya pada desain database dan proses Focusnya pada pemodelan data dan desain data
Berisi rincian atau detail data Berisi data-data history yang akan
dipakai dalam proses analisis Relasi antar table berdasar aturan terkini(selalu
mengikuti rule(aturan) terbaru)
Banyak aturan bisnis dapat tersaji antara tabel-tabel
2. Integrated (Terintegrasi)
Data Warehouse dapat menyimpan data-data yang berasal dari sumber-sumber yang terpisah kedalam suatu format yang konsisten dan saling terintegrasi satu dengan lainnya. Dengan demikian data tidak bisa dipecah-pecah karena data yang ada merupakan suatu kesatuan yang menunjang keseluruhan konsep data warehouse itu sendiri.
Syarat integrasi sumber data dapat dipenuhi dengan berbagai cara sepeti konsisten dalam penamaan variable,konsisten dalam ukuran variable,konsisten dalam struktur pengkodean dan konsisten dalam atribut fisik dari data.
Contoh pada lingkungan operasional terdapat berbagai macam aplikasi yang mungkin pula dibuat oleh developer yang berbeda. Oleh karena itu, mungkin dalam aplikasi-aplikasi tersebut ada variable yang memiliki maksud yang sama tetapi nama dan format nya berbeda. Variable tersebut harus dikonversi menjadi nama yang sama dan format yang disepakati bersama. Dengan demikian tidak ada lagi kerancuan karena perbedaan nama, format dan lain sebagainya. Barulah data tersebut bisa dikategorikan sebagai data yang terintegrasi karena kekonsistenannya.
3. Time-variant (Rentang Waktu)
Seluruh data pada data warehouse dapat dikatakan akurat atau valid pada rentang waktu tertentu. Untuk melihat interval waktu yang digunakan dalam mengukur keakuratan suatu data warehouse, kita dapat menggunakan cara antara lain:
Cara yang paling sederhana adalah menyajikan data warehouse pada rentang waktu tertentu, misalnya antara 5 sampai 10 tahun ke depan.
Cara yang kedua, dengan menggunakan variasi/perbedaan waktu yang disajikan dalam data warehouse baik implicit maupun explicit secara explicit dengan unsur waktu dalam hari, minggu, bulan dsb. Secara implicit misalnya pada saat data tersebut diduplikasi pada setiap akhir bulan, atau per tiga bulan. Unsur waktu akan tetap ada secara implisit didalam data tersebut.
Cara yang ketiga,variasi waktu yang disajikan data warehouse melalui serangkaian snapshot yang panjang. Snapshot merupakan tampilan dari sebagian data tertentu sesuai keinginan pemakai dari keseluruhan data yang ada bersifat read-only.
4. Non-Volatile
Karakteristik keempat dari data warehouse adalah non-volatile,maksudnya data pada data warehouse tidak di-update secara real time tetapi di refresh dari sistem operasional secara reguler. Data yang baru selalu ditambahkan sebagai suplemen bagi database itu sendiri dari pada sebagai sebuah perubahan. Database tersebut secara kontinyu menyerap data baru ini, kemudian secara incremental disatukan dengan data sebelumnya.
Berbeda dengan database operasional yang dapat melakukan update,insert dan delete terhadap data yang mengubah isi dari database sedangkan pada data warehouse hanya ada dua kegiatan memanipulasi data yaitu loading data (mengambil data) dan akses data (mengakses data warehouse seperti melakukan query atau menampilan laporan yang dibutuhkan, tidak ada kegiatan updating data).
2.2.2.Keuntungan Datawarehouse
Data warehouse dapat memberikan beberapa keuntungan bagi perusahaan (Connolly dan Begg, 2005:1152), diantaranya :
1. Tingkat pengembalian investasi yang tinggi
Sebuah organiassi harus menangani sumber daya dalama jumlah besar untuk memastikan implementasi data warehouse yang berhasil dan biaya yang sangat bervariasi.
2. Keuntungan kompetitif
Pengembalian investasi yang tinggi bagi perusahaan yang
mengimplementasikan data warehouse dengan berhasil akan memberikan mereka keuntungan kompetitif. Keuntungan tersebut didapat dengan mengizinkan pembuat keputusan mengakses data yang sebelumnya tidak tersedia, tidak diketahui dan informasi yang belum dimanfaatkan, contohnya tren dan permintaan.
3. Meningkatkan produktivitas para pembuat keputusan perusahaan
Data warehouse meningkatkan produktivitas dari pembuat keputusan perusahaan dengan menciptakan database yang terintegrasi, konsisten, berorientassi subjek dan data historis. Dengan merubah data dan mmenjadi informai yang berarti, data warehouse memungkinkan manajer untuk melakukan analisis dengan lebih akurat dan konsisten.
2.2.3.Model Dimensi
Model dimensi merupakan sebuah teknik desain logis yang bertujuan untuk menghadirkan data dalam sebuah bentuk yang standar dan intuitif yang memungkinkan pekasesan basis data dengan performa yang tinggi (Connolly dan Begg, 2001:1183)
Ada beberapa konsep permodelan data warehouse, konsep-konsep tersebut antara lain star schema, snowflake dan fact constellation schema.
1. Skema Bintang (Star Schema)
Skema bintang terdiri dari dua macam tabel, yaitu tabel fakta (fact table) dan tabel dimensi (dimension table). Tabel fakta mengandung fakta uata data kuantitatif mengenai sebuah bisnis seperti jumlah unit terjual, jumlah order daan sebagainya. Tabel dimensi berisi data deskriptif mengenai subjek bisnis. Tabel dimensi biasanya adalah sebagai sumber atribute yang digunakan untuk mengkualifikasi, mengkategorikan, atau meringkas fakta dalam query, report, atau grafik (Modern Database Mangement 8th Edition, 2007:457). Skema bintang adalah sebuah loogikal struktur yang mempunyai sebuah tabel fakta berisi data terbaru di tengah, yang dikelilingi tabel dimensi yang berisi data referensi (Connolly dan Begg, 2005:1018). Skema bintang memiliki beberapa keuntungan (Ponniah, 2001:220), yaitu:
a. Pengguna mudah untuk dimengerti
Saat user berinteraksi dengan data warehouse melalui alat query pihak ketiga, user seharusnya mengetahui apa maksud pertanyaan. Mereka harus mengetahui data apa yang tersedia bagi mereka data warehouse. Mereka harus memahami struktur data dan bagaimana bermacam-macam bagian yang saling berhubungan dalam seluruh skema. Skema bintang menampilkan bagaimana user berpikir dan apa yang pengguna perlukan untuk meng-query dan mengalisis.
b. Optimasi navigasi
Hubungan digunakan untuk berpindah dari datu tabel ke tabel yang lain untuk mendapatkan informasi yang dicari. Hubungan menyediakan kemampuan untuk melakukan navigasi melalui database. User dapat berpindah ke tabel satu ke tabel lain menggunakan join. Jika bagian dari proses join banyak dan rumit, navigasi melalui database menjadi sulit dan lambat. Di sisi lain, jika bagian join sederhana, maka navigasi yang ada menjadi optimal dan cepat. Keuntungan utama dari skema bintang adalah mengoptimasi navigasi melalui database. Bahkan ketika hasil dari query terlihat kompleks, navigasi akan tetap sederhana.
c. Cocok untuk pemrosesan Query
d. Star Join dan Star Index
Skema bintang mengizinkan software pemroses query untuk melakukaan pelaksanaan yang lebih baik. Itu dapat membuat performa skema spesifik yang dapat diimplementasikan dalam query. Susunan skema bintang lebih cocok untuk teknik performa yang khusus
2. Snowflake Schema
Snowflake Schema merupakan variasi dari skema bintang dimana tabel dimensi dari skema bintang dinormalisasi (Ponniah, 2001:235).
3. Fact Constellation
Fact Constellation schema adalah skema multi dimensional yang berisikan lebih dari satu tabel fakta yang saling berbagi tabel dimensi. Jenis skema ini dapat dilihat sebagai gabungan dari berbagai skema bintang sehingga sering juga disebut dengan nama skema galaksi (Han, 2006:116).
2.2.4.Karakteristik Business Intelligence
Business Intelligence yang baik mempunyai berbagai karakteristik (Stevans,2008), diantaranya :
1. Tujuan utama
Seluruh sistem komputer mempunyai tujuan utama bagi seluruh pengguna sesuai dengan kebutuhan penguna masing-masing.
2. Ketersediaan data yang relevan
Masalah ketersediaan data merupakan poin yang paling penting dalam sistem business intelligence yang efektif. Dalam proses pembuat keputusan sering terjadi penyampaian informasi yang tidak lengkap atau bahkan yang tidak sebenarnya. Namun dengan dukungan BI, ketersediaan data yang relevan dapat diatasis ehingga dapat menyuguhkan data-data yang relevan.
3. Kemampuan
Dalam hal ini terdapat kemampuan BI yang paling utama yaitu dapat memberikan kemudahan akses untuk informasi terbaru dari bisnis yang berjalan serta peluang yang diproyeksikan, selain itu Bi dapat memenuhi kapabilitas untuk melakukan analisis dan memenuhi permintaan pengguna
4. Struktur Pendukung
Dalam BI, sistem pendukung didalamnya tidak hanya terdiri darihardware dan software, namun juga terdiri dari suatu proses yang dibuat untuk pengambilan keputusan yang lebih baik serta untuk menentukan strategi untuk misi dan tujuan kedepan
2.2.5.Nine step Design Method
Berikut ini adalah Sembilan langkah untuk merancang data warehouse yang dicetuskan Kimball :
2.2.5.1.Memilih Proses
Pada proses pertama ini, yang dilakukan adalah menganalisa dan menentukan subyek permasalahan yang dihadapi, lalu mengidentifikasi proses bisnis yang berhubungan dengan permasalahan tersebut. Pemilihan proses dilakukan untuk memperjelas batasan data warehouse yang akan dibuat
2.2.5.2.Menentukan Grain
Grain merupakan calon fakta yang dapat dianalisis. Pemilihan grain dilakukan untuk memutuskan apa yang direpresentasikan record dari table fakta. Pada proses kedua ini dipilihlah data dari calon fakta, dengan memutuskan record apa yang akan dipresentasikan pada table fakta.
2.2.5.3.Mengidentifikasi dan menyesuaikan dimensi
Dalam tahap ini dilakukan identifikasi dimensi untuk setiap table fakta yang ada, misalkan, setiap data customer pada tabel dimensi customer dilengkapi dengan custno, nama, alamat, dan lain sebagainya.
2.2.5.4.Memilih fakta
Pada tahap ini dipilih fakta – fakta yang akan mengisi setiap tabel fakta, dimana fakta-fakta yang dipilih harus sesuai dengan grain yang telah ditentukan. Biasanya penyesuaian dimensi dan grain ini ditampilkan dalam bentuk matriks.
2.2.5.5.Menyimpan perhitungan awal dalam tabel fakta
Sesuai dengan grain yang telah ditentukan sebelumnya yang merupakan calon fakta. Masing masing fakta memiliki data yang dapat dihitung, pada tahap inilah perhitungan tersebut dilakukan.
2.2.5.6.Melihat kembali tabel dimensi
Pada tahap ini ditambahkan keterangan selengkap-lengkapnya pada tabel dimensi. Keterangan harus bersifat intuitif dan mudah dipahami oleh pengguna
2.2.5.7.Memilih durasi database
Pada proses ini yang dilakukan adalah menentukan pembatasan waktu untuk data yang diambil dan dipindahkan kedalam tabel fakta. Penentuan durasi ini tergantung kebutuhan informasi yang diminta. Misalnya suatu perusahaan mengharuskan menyimpan data untuk lebih dari 10 tahun.
2.2.5.8.Menulusuri perubahan dimensi
Pada proses ini yang dilakukan adalah mengamati perubahan data dari tabel dimensi. Cara yang dapat dilakukan ada tiga :
1. Atribut dimensi yang berubah ditulis ulang kembali 2. Atribut dimensi yang berubah menimbulkan dimensi baru
3. Atribut dimensi yang berubah menimbukan alternatif sehingga nilai atribut lama dan yang baru dapat diakses secara bersama pada dimensi yang sama.
2.2.5.9.Menentukan prioritas query dan tipe query
Pada langkah ini difokuskan pada perancangan fisik data warehouse. Persoalan perancangan fisik yang paling kritis adalah urutan fisik dari tabel fakta pada tempat penyimpanan dan pengadaan ringkasan yang disimpan sebelumnya atau penggabungan kerudanya.
Diluar persoalan tersebut ada sejumlah persoalan perancangan fisik tambahan yang memengaruhi administrasi backup, kinerja pengurutan, dan keamanan dalam pengaksesan maupun penyimpanan data dan analisis kapasitas penyimpanan