2. LANDASAN TEORI
2.4.6 Metode Pengembangan Data Warehouse
Metode pengembangan data warehouse yang dikenal terdiri dari dua pendekatan. Pendekatan pertama dikemukakan oleh Inmon (2005), yaitu pendekatan top-down. Pendekatan top-down, data warehouse mendapatkan data yang disediakan unit produksi data, kemudian data warehouse akan memberikan input data pada
dependent data mart. Pada pendekatan ini menggunakan perangkat basisdata relasional yang tradisional untuk mengembangkan kebutuhan enterprise-wide data warehouse, yang disebut pendekatan EDW. Metode yang dikemukakan Inmon diturunkan dari metodologi pengembangan spiral perangkat lunak disebut CLDS yaitu prosesnya kebalikan dari System Development Life Cycle (SDLC). Metode ini dimulai dari data, kemudian diintegrasi dan diuji untuk mengetahui jika ada bias pada data. Kemudian dilakukan analisis terhadap data, sehingga menghasilkan kebutuhan data. Siklus metode ini diilustrasikan pada Gambar 2.14.
Gambar 2. 14 Data Warehouse SDLC (Inmon, 2005)
Pendekatan kedua dikemukakan oleh Kimball (2008), yaitu pendekatan bottom-up. Pendekatan bottom-up, data mart dibuat terlebih dahulu untuk menyediakan kemampuan analitikal dan pelaporan pada beberapa subjek bisnis yang spesifik sebagai dasar model data dimensional. Pada pendekatan ini menggunakan pemodelan dimensional yang disebut pendekatan data mart. Metode yang dikemukakan disebut Kimball Lifecycle. Metode ini dimulai dengan tahapan perencanaan projek, mendefinisikan kebutuhan bisnis, technology track, data track, application track, deployment, hingga tahap pemeliharaan. Siklus metode ini diilustrasikan pada Gambar 2.15.
Pada Tabel 2.3 berikut dijelaskan perbandingan antara metode Inmon (2005) dengan metode Kimball (2008) dijelaskan oleh Turban (2011).
Tabel 2. 2 Perbandingan Metode Inmon dengan Metode Kimball
No. Karakteristik Inmon Kimball
1. Pendekatan Top-down (
enterprise-wide data warehouse).
Bottom-up (Data mart).
2. Struktur Arsitektur Enterprise-wide
(atomic) data warehouse mengisi
basisdata di
departemen.
Model Data mart sebagai
proses bisnis tunggal, dan
konsistensi perusahaan
dicapai melalui data bus
dan dimensi yang sesuai.
3. Kompleksitas
Metodologi
Cukup kompleks. Cukup sederhana.
4. Perbandingan
dengan metodologi yang sudah ada
Diturunkan dari
metodologi spiral.
Terdiri dari empat tahapan
proses. Berangkat dari
metode relational database
management systems (RDBMS).
5. Pembahasan desain
fisik
Cukup menyeluruh. Cukup sederhana.
6. Orientasi Data subject atau data
driven
Process Oriented
7. Perangkat
Pemodelan Data
Entity-relationship Diagram (ERD), Data Flow Diagram (DFD)
Pemodelan dimensional
8. Aksesibilitas
end-user
Rendah Tinggi
9. Primary audience IT Professionals End user 10. Tempat dalam
organisasi
Bagian yang tidak
terpisahkan dari
penghasil informasi
perusahaan.
Transformer dan retainer data operasional.
11. Tujuan Pengembangan
Menghasilkan solusi
teknis berdasarkan
metode dan teknologi basisdata yang telah teruji.
Menghasilkan solusi yang
memudahkan end user
secara langsung melakukan query terhadap data dengan waktu tunggu yang cukup baik.
Adapun tahapan perancangan data warehouse menurut Malinowski dan Zimanyi (2008) dibedakan menjadi tiga pendekatan. 1) Pendekatan Analysis-Driven
Pendekatan ini membutuhkan partisipasi pengguna yang intensif dari level-level organisasi yang berbeda. Dukungan
pengguna level eksekutif sangat penting dalam menentukan tujuan dan kebutuhan bisnis. Ada beberapa aspek yang harus diperhatikan pada pendekatan ini, yaitu:
Pengguna yang menjadi target harus memahami tujuan bisnis secara keseluruhan. Hal ini untuk menghindari situasi kebutuhan akan merepresentasikan persepsi pribadi berdasarkan peran pengguna dalam organisasi.
Pengguna yang akan mendominasi proses spesifikasi kebutuhan sebaiknya dihindari. Hal ini untuk menjamin mempertimbangkan kebutuhan informasi dari berbagai pengguna.
Pengguna harus ada dan menyetujui untuk berpartisipasi pada keseluruhan proses pengumpulan kebutuhan dan perancangan konseptual.
Pengguna memiliki gagasan bagaimana sistem data warehouse
dan sistem OLAP.
Tahapan perancangan data warehouse pendekatan analysis-driven dapat dilihat pada Gambar 2.16.
Gambar 2. 16 Pendekatan Analysis-Driven (Malinowski dan Zimanyi, 2008)
Pada fase spesifikasi kebutuhan (requirement specification), fokus kepada mendapatkan kebutuhan pengguna dalam mencapai tujuan bisnis. Kegiatan yang dapat dilakukan dalam mencapai kebutuhan bisnis dibagi menjadi dua yaitu, mendapatkan kebutuhan pengguna yang lebih rinci, atau melakukan analisis terhadap proses bisnis yang berkaitan dengan layanan atau aktifitas. Hasil dari tahapan ini adalah dokumen
spesifikasi kebutuhan yang memiliki konten mengenai spesifikasi yang tepat dari fakta, dimensi, dan measures, juga deskripsi metadata.
Pada tahapan perancangan konseptual (conceptual design) diawali dengan pengembangan skema awal dengan memasukkan fakta dan dimensi yang diidentifikasi pada tahapan sebelumnya. Skema ini ditinjau kembali dalam hal untuk memverifikasi bahwa sistem operasional memiliki data yang dibutuhkan pengguna. Apabila sistem operasional tidak dapat menyediakan, maka skema awal dimodifikasi sesuai dengan ketersediaan data pada sumber. Pada tahapan ini juga dilakukan spesifikasi pemetaan dan keterkaitan antara elemen data pada sistem sumber dan elemen data pada data warehouse.
Pada tahapan perancangan lojikal (logical design) dan perancangan fisikal (physical design) yang dilakukan adalah mengembangkan skema dan melakukan spesifikasi dan implementasi pada proses ETL.
2) Pendekatan Source-Driven
Pada pendekatan ini partisipasi pengguna tidak secara eksplisit diperlukan. Pengguna terlibat hanya secara sporadis, yaitu dalam melakukan konfirmasi kebenaran dari struktur yang dikerjakan ataupun dalam melakukan identifikasi fakta dan
measures sebagai titik awal dalam membuat skema multidimensional. Keterlibatan pengguna datang dari level profesional atau administratif. Pendekatan ini memerlukan perancang dengan keahlian dan pengalaman yang tinggi. Selain memiliki kemampuan pemodelan, perancang juga harus memiliki pengetahian bisnis yang cukup untuk memahami konteks bisnis dan kebutuhannya berdasarkan data operasional. Perancang juga harus memiliki kapasitas untuk memahami struktur basisdata operasional.
Tahapan perancangan data warehouse pendekatan source-driven dapat dilihat pada Gambar 2.17.
Gambar 2. 17 Pendekatan Source-Driven (Malinowski dan Zimanyi, 2008)
Pada tahapan spesifikasi kebutuhan, sistem sumber yang mengirimkan data untuk tujuan analisis harus diidentifikasi. Kemudian diturunkan fakta, measure, dan dimensi dari sistem sumber. Proses ini dapat dilakukan secara manual dengan dasar dari dokumen yang ada pada sistem sumber atau secara semi otomatis atau otomatis. Tahapan spesifikasi kebutuhan menghasilkan dokumen yang berisi deskripsi semua data elemen pada sistem sumber yang dapat digunakan sebagai kandidat untuk fakta, measure, dan dimensi.
Pada tahapan perancangan konseptual, dokumen spesifikasi kebutuhan digunakan sebagai referensi dalam membuat skema multidimensional awal. Pada tahapan ini tidak semua elemen skema awal menjadi perhatian pengguna, pengguna menentukan elemen yang dibutuhkan untuk tujuan analisis. Setelah itu, skema
dan pemetaan akhir dikembangkan dengan cara yang sama pada pendekatan analysis-driven.
Pada tahapan perancangan lojikal dan perancangan fisikal yang dilakukan adalah mengembangkan skema dan melakukan spesifikasi dan implementasi pada proses ETL.
3) Pendekatan Analysis/Source-Driven
Pendekatan ini menggabungkan pendekatan analysis-driven
dan source-driven. Tahapan perancangan data warehouse
pendekatan analysis/source-driven dapat dilihat pada Gambar 2.18.
Gambar 2. 18 Pendekatan Analysis/Source-Driven (Malinowski dan Zimanyi, 2008)
Pada tahapan spesifikasi kebutuhan dan perancangan konseptual terdapat dua rangkaian aktifitas yang berhubungan. Rangkaian ini digabungkan bersama pada tahapan perbandingan dan integrasi dua skema yang dihasilkan oleh pendekatan
analysis-driven dan source-driven. Tahapan ini tidak mudah untuk dilakukan, dan biasanya memerlukan perulangan tambahan pada rangkaian aktifitas dan harus mengulang kembali tahapan spesifikasi kebutuhan. Tahapan perancangan lojikal dan perancangan fisikal dilakukan sama seperti dua pendekatan sebelumnya.