(STUDI KASUS : PT. ASURANSI TAKAFUL UMUM)
Skripsi
Sebagai Salah Satu Syarat Untuk Memperoleh Gelar Sarjana Komputer Fakultas Sains dan Teknologi
Universitas Islam Negeri Syarif Hidayatullah
Disusun Oleh:
NUR LISKA AMELIA NIM: 107093002832
PROGRAM STUDI SISTEM INFORMASI FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS ISLAM NEGERI SYARIF HIDAYATULLAH JAKARTA
v
SKRIPSI ATAU KARYA ILMIAH PADA PERGURUAN TINGGI ATAU
LEMBAGA MANAPUN.
Jakarta, 14 November 2011
vi
NUR AENI HIDAYAH dan NIA KUMALADEWI.
PT. Asuransi Takaful Umum merupakan perusahaan jasa yang bergerak dalam bidang asuransi syariah yang saat ini sedang banyak diminati oleh masyarakat untuk mempercayakan kendaraan mereka ke dalam produk pertanggungan yang dikeluarkan oleh PT. Asuransi Takaful Umum. Berdasarkan data dari PT. Asuransi Takaful Umum, total premi yang berhasil dihimpun dari asurani kendaraan semakin meningkat setiap tahunnya, pada tahun 2001 mencapai Rp.2,3 triliun, tahun 2002 Rp.2,8 triliun, tahun 2003 Rp. 3,2 triliun, dan tahun 2004 mencapai Rp.4 triliun. Seiring dengan meningkatnya jumlah peserta asuransi maka semakin banyak pula jumlah premi dari peserta asuransi, maupun jumlah peserta yang mengajukan klaim kepada PT. Asuransi Takaful Umum. Dengan demikian semakin banyak pula data yang masuk ke dalam perusahaan, data-data tersebut tentunya perlu disimpan, diolah, dan dianalisis untuk menghasilkan suatu informasi yang berguna bagi perusahaan, dan dilaporkan kepada manajer untuk mengetahui keadaan perusahaan pada periode waktu tertentu. Sementara itu, untuk membuat laporan tersebut, dibutuhkan waktu lebih untuk mengumpulkan informasi dan mengolah data yang tersimpan dalam database operasional di General Takaful System. Karena dianggap perlu untuk melakukan pengelolaan data yang berjumlah besar untuk dapat menghasilkan suatu informasi secara cepat, maka dibuatlah suatu perancangan data warehouse yang dapat memudahkan dalam melakukan pengolahan data-data, menganalisis, dan melaporkan hasil analisis data. Metode yang digunakan dalam merancang data warehouse ini adalah Nine Step Design Methodology yang terdiri dari sembilan langkah yaitu memilih proses, menentukan grain/sumber dari proses bisnis, mengidentifikasi dan penyesuaian dimensi, memilih fakta, menyimpan perhitungan awal dalam tabel fakta, melihat kembali tabel dimensi, memilih durasi database, menelusuri perubahan dari dimensi, dan yang terakhir adalah memutuskan prioritas query dan tipe query. Dari penelitian ini menghasilkan sebuah data warehouse untuk PT. Asuransi Takaful Umum, serta jumlah kapasitas media penyimpanan yang dibutuhkan untuk data histori.
Kata Kunci : Data Warehouse, Nine Step Design Method, OLAP, SQL Server
V Bab + 126 Halaman + xvii Halaman + 43 Gambar + 26 Tabel + Pustaka + Lampiran
vii
Alhamdulillahirrobbil ‘alamiin, segala puji dan syukur kepada Allah SWT
yang telah memberikan rahmat dan taufik-Nya sehingga penulisan skripsi dengan
judul “Analisis dan Desain Data Warehouse Pada Perusahaan Asuransi Syariah
(Studi Kasus: PT. Asurani Takaful Umum)” dapat terselesaikan dengan baik.
Skripsi ini disusun untuk memenuhi salah satu syarat dalam menyelesaikan program
S1 UIN Syarif Hidayatullah Jakarta, khususnya Jurusan Sistem Informasi, Fakultas
Sains dan Teknologi.
Selama proses penyusunan skripsi ini mendapat banyak bimbingan dan
bantuan dari berbagai pihak. Oleh karena itu, ucapan terima kasih ditujukan kepada:
1. Bapak DR. Syopiansyah Jaya Putra, M.SIS, selaku Dekan Fakultas Sains dan
Teknologi.
2. Ibu Nur Aeni Hidayah, MMSI, selaku Ketua Program Studi Sistem Informasi
sekaligus selaku Dosen Pembimbing I yang memberikan ilmu, motivasi dan
bimbingan selama proses penyusunan skripsi ini.
3. Bapak Zainul Arham, S.Kom, MSI, selaku Sekretaris Program Studi Sistem
Informasi.
4. Ibu Nia Kumaladewi, MMSI, selaku Dosen Pembimbing II, yang selalu
memberikan masukan, motivasi, dan bimbingan selama proses penyusunan
viii
keponakan-keponakan kecil saya yang selalu berulah sekaligus memberi canda
dan tawa dalam keluarga besar saya.
7. Nia Mariana yang telah bersedia membantu saya mempelajari materi-materi
mengenai data warehouse serta SQL Server.
8. Seluruh SIBIS 2007 (#SIBIS2007BISA) dan anggota SI D 2007, serta Lele, Cha,
Rina, Tya, Lya, Ichan, Devika, Itun, Iwa, Oji, sahabat-sahabatku tersayang yang
selalu memberiku tempat nyaman dan hangat di sisi mereka, terima kasih atas
segala semangat dan semoga Allah membalas dengan segala kebaikan yang
berlipat ganda.
9. Dan semua pihak yang tidak dapat disebutkan satu persatu yang telah membantu
saya selama penyelesaian skripsi ini dan memberikan doanya.
Penyusunan skripsi ini masih terdapat kekurangan, dan jauh dari sempurna
sehingga saran dan kritik yang berguna dari pembaca dapat disampaikan melalui email
amelia.achmad@ymail.com. Akhir kata semoga skripsi ini dapat memberikan sedikit wacana dan bermanfaat bagi kita semua.
Wassalamu ‘alaikum wr. wb
Jakarta, 14 November 2011
ix
LEMBAR PENGESAHAN ... iv
LEMBAR PERNYATAAN ... v
ABSTRAK ... vi
KATA PENGANTAR ... vii
DAFTAR ISI ... ix
1.4 Tujuan Penelitian ... 9
1.5 Manfaat Penelitian ... 10
1.6 Metode Penelitian ... 10
1.6.1 Metode Pengumpulan Data ... 10
1.6.2 Metode Perancangan Data Warehouse ... 11
1.7 Sistematika Penulisan ... 12
BAB II LANDASAN TEORI ... 14
2.1 Data Dan Informasi ... 14
2.1.1 Data ... 14
2.1.2 Informasi ... 14
2.2 Sistem Informasi ... 15
2.3 Pengertian Basis Data ... 16
x
2.7 Perbedaan OLAP dengan OLTP ... 37
2.8 Model Dimensional ... 38
2.8.1 Star Scheme ... 39
2.8.2 Snowflake Scheme ... 40
2.8.3 Starflake Scheme ... 41
2.9 Extract, Transform, Load ... 42
2.10 Nine Step Design Method ... 43
2.10.1 Memilih Proses ... 43
2.10.2 Menentukan Grain... 43
2.10.3 Mengidentifikasi Dan Penyesuaian Dimensi ... 44
2.10.4 Memilih Fakta ... 44
xi
2.11 Tools Pembuatan Data Warehouse ... 46
2.11.1 SQL Server ... 46
2.11.1.1 Komponen Dasar SQl Server ... 47
2.12 Asuransi Syariah ... 49
2.12.1 Pengertian Asuransi Syariah ... 49
2.12.2 Akad Dalam Asuransi Syariah ... 50
2.12.3 Prinsip Asuransi Syariah ... 50
2.12.4 Landasan Al-Qur’an dan Hadits Asuransi Syariah ... 51
2.12.5 Landasan Fatwa Asuransi Syariah ... 52
2.12.6 Perbedaan Asuransi Syariah dengan Konvensional ... 53
2.12.7 Hal-hal Terkait Dalam Asuransi Syariah ... 54
2.13 Metode Pengumpulan Data ... 56
2.13.1 Observasi ... 57
2.13.2 Wawancara ... 57
2.13.3 Studi Pustaka ... 58
2.13.4 Studi Literatur ... 58
BAB III METODOLOGI PENELITIAN ... 62
3.1 Metode Pengumpulan Data ... 62
3.1.1 Observasi ... 62
3.1.2 Wawancara ... 63
3.1.3 Studi Pustaka ... 64
3.1.4 Studi Literatur ... 64
xii
3.2.5 Menyimpan Perhitungan Awal Dalam Tabel Fakta ... 69
3.2.6 Melihat Kembali Tabel Dimensi ... 69
3.2.7 Memilih Durasi Database ... 69
3.2.8 Menelusuri Perubahan Dari Dimensi ... 70
3.2.9 Memutuskan Prioritas Query Dan Tipe Query ... 70
3.3 Kerangka Penelitian ... 71
BAB IV PEMBAHASAN ... 72
4.1 Profil Perusahaan ... 72
4.2 Visi dan Misi PT. Syarikat Takaful Indonesia ... 73
4.2.1 Visi ... 73
4.2.2 Misi ... 73
4.3 Konsep dan Filosofi ... 74
4.4 Struktur Organisasi Perusahaan ... 75
4.5 Produk-produk Asuransi Kendaraan ... 76
4.6 Prosedur Umum Asuransi ... 77
4.7 Metode Desain Data Warehouse ... 78
4.7.1 Memilih Proses ... 78
4.7.1.1 Identifikasi Prosedur Klaim ... 79
4.7.1.2 Identifikasi Database yang Digunakan ... 81
4.7.1.3 Normalisasi ... 82
4.7.1.4 Rancangan ERD ... 85
4.7.1.5 Keterangan Tabel ... 86
xiii
4.7.7 Memilih Durasi dari Basis Data ... 95
4.7.8 Menelusuri Perubahan Dimensi Secara Perlahan ... 96
4.7.9 Memutuskan Prioritas Query dan Tipe Query ... 97
4.7.9.1 Proses ETL ... 97
4.7.9.2 Analisis Kapasitas Media Penyimpanan ... 117
4.8 Skema Bintang ... 121
4.9 Meta Data ... 122
BAB V PENUTUP ... 125
5.1 Simpulan ... 125
5.2 Saran ... 126
DAFTAR PUSTAKA
xiv
Gambar 2.3 Data Warehouse Berorientasi Subjek ... 26
Gambar 2.4 Data Warehouse Terintegrasi ... 27
Gambar 2.5. Data Warehouse Non-Volatile ... 28
Gambar 2.6. Data Warehouse Berorientasi Waktu ... 29
Gambar 2.7. Struktur Dari Data Warehouse ... 30
Gambar 2.8. Komponen Utama Dari Data Warehouse ... 34
Gambar 2.9. Star Scheme ... 39
Gambar 2.10. Snowflake Scheme ... 41
Gambar 3.1. Kerangka Penelitian ... 71
Gambar 4.1 Struktur Organisasi PT. Syarikat Takaful Umum ... 75
Gambar 4.2 Alur Prosedur Umum Kegiatan Asuransi ... 77
Gambar 4.3 Alur Prosedur Klaim ... 79
Gambar 4.4 Data sebelum dinormalisasi ... 82
Gambar 4.5 Normalisasi 1NF ... 83
Gambar 4.6 Normalisasi 2NF ... 84
Gambar 4.7 Entity Relationship Diagram (physical design) ... 85
Gambar 4.8 Database ‘takaful’ ... 98
Gambar 4.8 Tabel-tabel Database ‘OLAPtakaful’ ... 98
Gambar 4.10 Create New Data Source ... 99
Gambar 4.11 Jendela Data Source Wizard ... 99
Gambar 4.12 Jendela Data Source Wizard Pilih ‘takaful’ dan ‘OLAPtakaful’ ... 100
Gambar 4.13 Compleeting the Wizard ... 101
Gambar 4.14 New SSIS Package ... 101
Gambar 4.15 Connection Managers ... 102
Gambar 4.16 Jendela Select Data Source ... 102
xv
Gambar 4.22 Jendela Execute SQL Task Editor ... 106
Gambar 4.23 Jendela SQL Querry ... 107
Gambar 4.24 Data Flow Task Dan Execute Task Sukses ... 107
Gambar 4.25 Create Data Source ... 108
Gambar 4.26 Data Source Wizard Pemilihan Data Connection ... 108
Gambar 4.27 Impersonation Information ... 109
Gambar 4.28 Data Source Name ... 109
Gambar 4.29 Membuat New Data Source View ... 110
Gambar 4.30 Pemilihan Data Source ... 110
Gambar 4.31 Pemilihan Tabel Yang Akan Ditampilkan ... 111
Gambar 4.32 Penamaan Data Source View ... 111
Gambar 4.33 Create New Cube ... 112
Gambar 4.34 Pemilihan Metode Pembuatan ... 112
Gambar 4.35 Pemilihan Data Source ... 113
Gambar 4.36 Deteksi Tabel Dimensi Dan Fakta ... 113
Gambar 4.37 Identifikasi Tabel Dimensi Dan Fakta ... 114
Gambar 4.38 Pemilihan Measure ... 114
Gambar 4.39 Pendeteksian Hirarki ... 115
Gambar 4.40 Review New Dimension ... 115
Gambar 4.41 Pemberian Nama Cube ... 116
Gambar 4.42 Hasil Cube Star Schema ... 117
xvi
Tabel 2.3 Bentuk Normal Kedua ... 23
Tabel 2.4 Bentuk Normal Ketiga ... 24
Tabel 2.5. Perbedaan OLAP dengan OLTP ... 37
Tabel 2.6. Perbedaan Asuransi Syariah Dan Konvensional... 53
Tabel 2.7. penelitian Data Warehouse Sebelumnya ... 59
Tabel 4.1 Identifikasi Tabel Yang Digunakan ... 81
Tabel 4.2. Tabel trxklaim ... 86
Tabel 4.3 Tabel trxveh ... 87
Tabel 4.10 Tabel Grain Dan Dimensi Dari Klaim... 92
Tabel 4.11 Tabel-Tabel Dimensi ... 94
Tabel 4.12 Tabel Waktudim ... 94
Tabel 4.13 Tabel Dimensicustomer ... 94
Tabel 4.14 Tabel Dimensicauses ... 95
Tabel 4.15 Tabel Dimensiproduct ... 95
Tabel 4.16 Tabel Durasi Database ... 95
Tabel 4.17 Contoh Tabel Pada Dimensi Cause ... 96
Tabel 4.18 Contoh Perubahan Tabel Pada Dimensi Cause ... 96
Tabel 4.19 Contoh Tabel Pada Dimensi Product ... 96
Tabel 4.20 Contoh Perubahan Tabel Pada Dimensi Product... 97
xvii
Tabel 4.24 Meta Data Pada Dimensi Product... 123
1
1.1 Latar Belakang
Perkembangan dunia teknolgi informasi saat ini semakin pesat, hampir
semua aspek kegiatan manusia dipengaruhi oleh teknologi informasi, tak luput
juga dalam dunia bisnis saat ini. Banyak perusahaan yang memanfaatkan
teknologi informasi untuk dapat meningkatkan kinerja bisnisnya sehingga dapat
menghadapi persaingan bisnis yang ketat yang bertujuan untuk meraih pangsa
pasar yang lebih besar, dengan harapan agar keuntungan perusahaan yang dicapai
dapat lebih meningkat pula. Data warehouse merupakan salah satu bagian dari
teknologi informasi yang dapat menunjang kegiatan perusahaan tersebut (Supawi,
2003).
Data warehouse dapat membantu pihak manajerial dan eksekutif
perusahaan dalam penentuan kebijakan perusahan, agar dapat menghasilkan
keputusan yang cepat dan tepat berdasarkan hasil analisa dari data dan fakta yang
ada. Keberadaan data warehouse akan mempermudah pembuatan
aplikasi-aplikasi seperti Decission Support System dan Sistem Informasi Eksekutif karena
memang kegunaan dari data warehouse ini adalah untuk mendukung proses
analisa bagi para pihak eksekutif dalam pengambilan keputusan (Oktavia, 2011).
Dengan membangun data warehouse dapat memberikan
keuntungan-keuntungan strategis bagi perusahaan. Hal ini dikarenakan kemampuan data
kemampuan kinerja analisis yang cepat sehingga dengan kelebihan-kelebihan
tersebut dapat menyediakan informasi yang dibutuhkan bagi perusahaan dengan
kinerja yang efektif dan tanpa menambah biaya administrasi perusahaan
(Rahmadi, 2007).
Tidak hanya perusahaan-perusahaan yang menghasilkan produk, banyak
perusahaan jasa seperti asuransi yang kini juga saling berkompetisi untuk dapat
mempertahankan dan memajukan bisnisnya, seiring dengan semakin banyaknya
pesaing. Bahkan untuk perusahaan asuransi syariah, ditandai sejak tahun 2006
industri ini telah diwarnai oleh kegiatan marketing yang agresif oleh beberapa
perusahaan (Nina, 2008). Untuk itulah, perusahaan jasa seperti asuransi syariah
ini juga dianggap perlu untuk memiliki suatu data warehouse guna menunjang
kegiatan pengambilan keputusan dalam perusahaan.
Penelitian dengan tema data warehouse telah dilakukan oleh banyak orang,
dan dalam berbagai bidang. Seperti halnya yang disebutkan dalam sebuah
penelitian mengenai data warehouse berdasarkan framework-framework yang
ada, telah diungkapkan bahwa setidaknya ada 129 artikel yang di terbitkan dalam
31 jurnal sejak tahun 1995 dan tahun 2003 yang berkaitan dengan penelitian
dibidang data warehouse (Lin, 2006). Artikel-artikel tersebut diklasifikasikan
berdasarkan enam kategori framework, yaitu manajemen proyek, desain data,
arsitektur, realisasi, deployment, dan maintenance.
Di dalam proses pembuatan data warehouse sendiri perlu ada beberapa
tahapan, diantaranya tahap analisis. Ada sebuah penelitian yang berpendapat
pengambilan keputusan maka harus fokus pada analisis kebutuhan dari
perusahaan, untuk itu diusulkan suatu metode yang disebut CADWA sebagai
panduan dalam proses analisis kebutuhan dari user (Gam et al. 2005). Penelitian
lainnya mengenai tahap mendesain data warehouse, dengan mengusulkan
pendekatan baru berbasis clover model untuk membantu user dalam mendesain
suatu data warehouse (Arfaoui et al. 2010).
Disamping proses analisis dan desain, masih ada proses lain seperti extract,
transform, dan loading data ke dalam database data warehouse dimana jika user
tidak memahami cara melakukannya, hal ini dapat menyita waktu. Karena itulah
dibangun sebuah framework yang dapat digunakan sebagai panduan dalam
melakukan kegiatan extract, transform, dan loading data (Wah et al. 2007).
Bahkan untuk lebih mempermudah dalam melakukan proses extract, transform,
dan loading ditemukan suatu cara untuk automasi dalam siklus ETL di dalam
pembuatan data warehouse (Amin dan Aziz, 2010).
Sebelum di implementasikan tentunya data-data yang ada harus di integrasi,
salah satu caranya adalah dengan menerapkan XML dan XSLT sebagai general
platform untuk mengintegrasikan dari berbagai sumber database yang
berbeda-beda (Tseng, 2007). Untuk mengimplementasikan data warehouse perlu
diperhatikan hal-hal yang dapat memengaruhi performa dari data warehouse, dan
dinyatakan pula bahwa kualitas data dan kualitas dari sistem juga dapat
mempengaruhi kesuksesan dari data warehouse yang telah dibuat (Hayen et al.
2007). Tidak hanya kualitas dari data di dalam data warehouse tetapi faktor
oleh peneliti, dengan memutuskan siapa saja yang berhak mengakses data
warehouse dan tabel mana yang boleh diakses (Rosenthal et al. 2000). Setelah di
implementasikan, masih ada beberapa faktor yang perlu diperhatikan sebagai
efek dari implementasi dari data warehouse tersebut, hal ini dilakukan untuk
memfasilitasi integrasi dan pemilihan variabel pada penelitian-penelitian yang
akan dilakukan selanjutnya (Hwang et al. 2007).
Tidak hanya untuk Decision Support System dalam bidang bisnis, data
warehouse juga diterapkan dalam dunia marketing seperti salah satu jurnal yang
membahas bagaimana memanfaatkan data warehouse untuk menganalisis hal-hal
yang mempengaruhi perkembangan perusahaan dalam hal pemasaran (Payton et
al. 2005). Sedangkan dalam dunia science dan kesehatan ada beberapa ilmuan
yang juga memanfaatkan data warehouse seperti bagaimana penerapan integrasi
data untuk menampung data penyakit-penyakit cardiovascular (Kormeier et al.,
2009). Serta ada beberapa yang memanfaatkan data warehouse untuk
pengambilan keputusan dalam community centre mengenai angka kesehatan
(Berndt et al. 2003). Data warehouse dapat juga di integrasikan dengan web dan
dimanfaatkan untuk web intelligence (Domingues et al. 2004) dan dijadikan
acuan dalam pembuatan model untuk statistical mining (Kascelan, 2005).
Data warehouse merupakan metode dalam perancangan database, yang
menunjang DSS (Decission Support System) dan EIS (Executive Information
System). Menurut Inmon (2002), data warehouse adalah koleksi data yang
mempunyai sifat berorientasi subjek, terintegrasi, time-variant, dan bersifat tetap
Inmon (2002) juga menyatakan bahwa ada empat tugas yang dapat dilakukan
dengan adanya data warehouse, yaitu: Pembuatan laporan, On-Line Analytical
Processing, Data Mining, dan proses Informasi Executive.
Setiap pihak baik individu maupun korporasi akan selalu menghadapi
resiko, seperti kerusakan harta karena bencana alam, hilangnya keuntungan
karena gangguan usaha, maupun resiko sakit atau meninggal karena kecelakaan.
Kerugian yang di akibatkan oleh resiko-resiko tersebut dapat di minimalisasi
dengan adanya asuransi. Saat ini semakin banyak individu dan perusahaan yang
menyadari keuntungan dan kemudahan yang mereka dapat jika menyertakan
harta ataupun jiwanya dalam asuransi (Sula, 2009).
Asuransi Syariah adalah usaha saling melindungi dan tolong menolong
diantara sejumlah orang atau pihak melalui investasi dalam bentuk aset dan atau
tabarru’ memberikan pola pengembalian untuk menghadapi resiko tertentu
melalui akad (perikatan) yang sesuai dengan syariah (DSN MUI, 2001). Berbeda
dengan konvensional, dalam asuransi syariah yang terjadi adalah pembagian
resiko finansial di antara peserta, pihak perusahaan asuransi bertindak sebagai
pemegang amanah. Konsep seperti inilah yang dinilai lebih menguntungkan
peserta asuransi dibandingkan dengan asuransi konvensional. Hal ini
menyebabkan asuransi syariah semakin popular dan mulai berkembang
menyaingi asuransi konvensional (Sula, 2009).
PT. Syarikat Takaful Indonesia (Perusahaan) berdiri pada 24 Februari 1994
atas prakarsa Tim Pembentukan Asuransi Takaful Indonesia (TEPATI) yang
Abdi Bangsa, Bank Muamalat Indonesia Tbk., PT Asuransi Jiwa Tugu Mandiri,
Departemen Keuangan RI, serta beberapa pengusaha muslim Indonesia. Melalui
kedua anak perusahaannya yaitu PT Asuransi Takaful Keluarga dan PT Asuransi
Takaful Umum, Perusahaan telah memberikan jasa perlindungan asuransi yang
menerapkan prinsip-prinsip murni syariah pertama di Indonesia. Anak
perusahaan yang bergerak di bidang asuransi umum Syariah yaitu PT Asuransi
Takaful Umum, yang diresmikan oleh Menristek/Ketua BPPT Prof. Dr. B.J.
Habibie pada 2 Juni 1995. Untuk meningkatkan kualitas layanan yang diberikan
Perusahaan dan menjaga konsistensinya, Perusahaan memperoleh Sertifikasi ISO
9001:2000 dari SGS JAS-ANZ, Selandia Baru bagi Asuransi Takaful Umum.
Fokus utamanya adalah memberikan layanan dan bantuan menyangkut asuransi
di bidang kerugian seperti perlindungan dari kebakaran, pengangkutan, niaga,
dan kendaraan bermotor, dengan harapan bisa tercapainya masyarakat Indonesia
yang sejahtera dengan perlindungan asuransi yang sesuai Muamalah Syariah
Islam.
Seiring dengan semakin banyaknya individu atau organisasi yang
mempercayakan harta serta keselamatan jiwanya pada perusahaan asuransi
syariah (Sula, 2009), maka semakin banyak pula data-data yang masuk ke dalam
perusahaan dari waktu ke waktu. Oleh karena itu dibutuhkan suatu cara untuk
mengelola dan menganalisis data untuk mendapatkan informasi yang akurat
dengan pertumbuhan data yang cepat, salah satu caranya adalah dengan adanya
Begitu juga halnya dengan apa yang terjadi di PT. Asuransi Takaful Umum,
seiring dengan meningkatnya jumlah peserta asuransi maka semakin banyak pula
jumlah premi dari peserta asuransi, maupun jumlah peserta yang mengajukan
klaim kepada PT. Asuransi Takaful Umum. Data-data tersebut tentunya perlu
disimpan, dan dilaporkan kepada manajer untuk mengetahui keadaan perusahaan
pada periode waktu tertentu. Sementara itu, untuk membuat laporan tersebut,
dibutuhkan waktu lebih untuk mengumpulkan informasi dan mengolah data yang
tersimpan dalam database operasional di General Takaful System. Oleh karena
itu perlu adanya suatu tool atau aplikasi pengelolaan data yang dapat digunakan
untuk mengetahui seberapa banyak peserta yang mengajukan klaim berdasarkan
jenis resikonya dan berapa jumlah peningkatan serta penurunanya dari tahun ke
tahun.
Dilihat dari latar belakang di atas, maka penelitian ini di tujukan kepada PT.
Asuransi Takaful Umum dengan menggunakan data warehouse dalam bidang
keilmuannya dalam melakukan pengolahan data-data yang dimiliki perusahaan.
Karena dianggap perlu untuk melakukan pengelolaan data yang berjumlah besar
untuk dapat menghasilkan suatu informasi secara cepat. Dengan adanya data
warehouse di sini dapat memudahkan dalam pengimplementasian tool/aplikasi
untuk mengetahui jumlah klaim yang diajukan oleh peserta asuransi setiap
tahunnya. Hal-hal tersebut dapat dilakukan tanpa membutuhkan banyak waktu
untuk melihat, menganalisis, dan melaporkan perkembangannya kepada manajer
ataupun bagian-bagian terkait lainnya sebagai bahan pertimbangan dalam
Berdasarkan latar belakang diatas, di lakukanlah penelitian dalam bidang
pengelolaan data untuk PT. Asuransi Takaful Umum yang bergerak dibidang
asuransi syariah dengan judul “Analisis dan Desain Data Warehouse Pada
Perusahaan Asuransi Syariah”.
1.2 Rumusan Masalah
Berdasarkan latar belakang di atas, maka dapat dirumuskan beberapa
permasalahan sebagai berikut:
1. Bagaimana menganalisis data yang dibutuhkan untuk penyampaian
laporan statistik kepada manajer klaim?
2. Bagaimana cara pengambilan data dari database ke dalam data
warehouse?
3. Bagaimana desain data warehouse dan rancangan database yang akan
digunakan dalam data warehouse PT. Asuransi Takaful Umum?
4. Seberapa besar kapasitas data warehouse yang akan digunakan dalam
perusahaan?
1.3 Batasan Masalah
Agar lebih terarah, maka penelitian ini mempunyai batasan masalah sebagai
berikut:
1. Penelitian ini hanya membahas analisis data yang berkaitan dengan data
2. Desain data warehouse dalam penelitian ini hanya menggunakan satu
jenis skema yaitu skema bintang.
3. Analisis dan desain data warehouse dalam perusahaan asuransi syariah
PT. Asurani Takaful Umum menggunakan Nine Step Design Method.
4. Penelitian ini hanya dilakukan sampai tahap bagaimana melakukan
migrasi dari database operasional menuju data warehouse yang akan
digunakan dalam perusahaan PT. Asuransi Takaful Umum.
5. Dalam penelitian ini, akan menggunakan SQL Server Management Studio
untuk mendesain database dan SQL Server BI Development Studio untuk
analisis data.
1.4 Tujuan Penelitian
Tujuan penelitian yang akan dilakukan dalam penelitian ini terdiri dari dua
jenis, tujuan umum dan tujuan khusus. Tujuan umum penelitian ini adalah
menghasilkan sebuah desain data warehouse yang dapat digunakan dalam
perusahaan PT. Asuransi Takaful Umum. Sedangkan tujuan khusus dari
penelitian ini adalah menghasilkan:
1. Analisis data terkait untuk penyampaian laporan statistik kepada manajer
klaim.
2. Penjabaran proses pengambilan data dari database General Takaful
System di PT. Asuransi Takaful Umum ke dalam data warehouse.
3. Desain data warehouse berdasarkan hasil analisis data, dengan
4. Perhitungan besar kapasitas data warehouse yang akan digunakan dalam
perusahaan.
1.5 Manfaat Penelitian
Adapun manfaat yang didapat dari penelitian ini adalah sebagai berikut:
1. Penelitian ini dapat menjadi salah satu referensi bagi penelitian
berikutnya, khususnya di bidang data warehouse untuk perusahaan
asuransi syariah.
2. Dengan adanya analisis dan desain data warehouse dalam Asuransi
Syariah diharapkan kelak dapat memudahkan dalam
mengimplementasikan aplikasi pengelolaan data dan pembuatan laporan
statistik untuk manajer.
3. Memberikan pemahaman mengenai konsep data warehouse pada asuransi
syariah dan mengenai tahapan perancangannya berdasarkan Nine Step
Design Method.
4. Memberikan gambaran umum mengenai bagaimana salah satu cara untuk
memanfaatkan data warehouse pada suatu perusahaan asuransi syariah.
1.6 Metodologi Penelitian
1.6.1 Metode Pengumpulan Data
1. Observasi
Observasi berarti mengamat-amati suatu obyek secara langsung. Dengan
mengamat-amatinya secara langsung selama waktu tertentu, dengan sedemikian
rupa (Duhu, 1985). Data-data yang didapat dari hasil observasi ini perlu dicatat
dan didokumentasikan, karena jika tidak dilakukan dengan semestinya, maka
sebagian atau seluruh data yang telah di dapat akan hilang sia-sia.
2. Wawancara
Wawancara adalah metode pengambilan data dengan cara menanyakan
sesuatu kepada seseorang responden dengan bercakap-cakap secara tatap muka,
wawancara merupakan bentuk pengumpulan data yang paling sering digunakan
dalam penelitian kualitatif. Pedoman wawancara digunakan untuk mengingatkan
interviewer mengenai aspek-aspek apa yang harus dibahas, juga menjadi daftar
pengecek (check list) apakah aspek-aspek relevan tersebut telah dibahas seperti
yang dinyatakan oleh Creswell (Rachmawati, 2008).
3. Studi Pustaka
Memperoleh informasi dari penelitian terdahulu merupakan langkah yang
penting dan harus dilakukan dalam penelitian. Hal ini dilakukan dengan cara
menelusuri data dan informasi yang ada dan menelaahnya secara tekun (Nazir,
2005), dengan cara membaca buku-buku, jurnal, skripsi, maupun referensi
lainnya yang dapat dijadikan acuan pembahasan dalam masalah ini.
1.6.2 Metode Perancangan Data Warehouse
Metode yang digunakan dalam membangun perancangan data warehouse
atau sering disebut Nine Step Design Method (Kimball et al. 2002) yang terdiri
dari beberapa fase, di antaranya:
a. Memilih proses.
b. Menentukan grain/sumber dari proses bisnis.
c. Mengidentifikasi dan penyesuaian dimensi
d. Memilih fakta.
e. Menyimpan perhitungan awal dalam tabel fakta.
f. Melihat kembali tabel dimensi
g. Memilih durasi database.
h. Menelusuri perubahan dari dimensi.
i. Memutuskan prioritas query dan tipe query, memilih physical design
1.8 Sistematika Penulisan
Dalam penulisan skripsi ini dibagi menjadi enam bab dengan beberapa sub
pokok bahasan. Adapun sistematika dari skripsi ini adalah sebagai berikut:
BAB I : PENDAHULUAN
Dalam bab ini akan diuraikan tentang latar belakang
penulisan, ruang lingkup atau batasan dalam penelitian
ini, tujuan yang hendak dicapai, manfaat yang
diharapkan dan metodologi yang digunakan dalam
penelitian ini secara sistematik.
Dalam bab ini akan diuraikan mengenai teori-teori yang
digunakan dalam pembahasan penulisan skripsi ini dan
sumber teori-teori tersebut.
BAB III : METODOLOGI PENELITIAN
Dalam bab ini menjelaskan tentang tata cara penelitian
berdasarkan metodologi penelitian yang dipilih. Metode
yang digunakan antara lain metode pengumpulan data
dan metode data warehouse multidimensi atau sering
disebut Nine Step Design Method. Dimana pada metode
pengumpulan data, penulis menggunakan metode
observasi, wawancara, dan studi pustaka.
BAB IV : HASIL DAN PEMBAHASAN
Dalam bab ini akan dibahas mengenai gambaran umum
perusahaan, analisis proses yang sedang berjalan, analisis
dari data-data yang digunakan dalam perusahaan, serta
akan dibahas perancangan data warehouse, juga
spesifikasi tabel dan rancangan skema bintang yang
dipakai.
BAB V : SIMPULAN DAN SARAN
Bab ini merupakan akhir penulisan skripsi, di mana
berdasarkan uraian-uraian yang telah dibahas akan
dituangkan ke dalam suatu bentuk kesimpulan akhir serta
14 2.1. Data Dan Informasi
2.1.1. Data
Data adalah fakta mengenai objek, orang dan lain-lain. Data dinyatakan
dengan nilai (angka, deretan karakter, atau simbol) (Kadir, 1998).
Menurut pendapat lainnya, Data adalah fakta tentang sesuatu di dunia nyata
yang dapat direkam dan disimpan pada media komputer. Definisi di atas perlu
diperluas untuk mencerminkan realitas yang ada saat ini. Basis data saat ini
digunakan untuk menyimpan objek-objek seperti: dokumen, citra fotografi, suara,
serta vedio, alih-alih hanya teks serta angka pada aplikasi basis data terdahulu.
Dengan demikian, pengertian data dapat diperluas menjadi: fakta, teks, grafik,
suara, serta video yang bermanfaat di lingkup pengguna (Hariyanto, 2004).
2.1.2. Informasi
Informasi adalah data yang diolah menjadi bentuk yang lebih berguna dan
lebih berarti bagi yang menerimanya. sumber dari informasi adalah data. Suatu
informasi dikatakan bernilai bila manfaatnya lebih efektif dibandingkan dengan
biaya mendapatkannya. Kegunaan informasi adalah untuk mengurangi hal
ketidakpastian di dalam proses pengambilan keputusan tentang suatu keadaan.
Informasi yang digunakan di dalam suatu sistem informasi umumnya digunakan
2.2. Sistem Informasi
Suatu sistem adalah suatu jaringan kerja dari prosedur-prosedur yang saling
berhubungan untuk melakukan suatu kegiatan atau untuk menyelesaikan suatu
sasaran tertentu. Sistem informasi didefinisikan sebagai suatu sistem di dalam
suatu organisasi yang mempertemukan kebutuhan pengolahan transaksi harian,
mendukung operasi, bersifat manajerial dan kegiatan strategi dari suatu
organisasi dan menyediakan pihak luar tertentu dengan laporan-laporan yang
diperlukan (Jogiyanto, 2005).
Sistem informasi terdiri dari komponen-komponen yang disebut dengan
istilah blok bangunan (building block), yaitu blok masukkan (input block), blok
model (model block), blok keluaran (output block), blok teknologi (technology
block), bok basis data (database block), dan blok kendali (controls block) (Burch
dan Grudnitski, 1984)
TEKNOLOGI BASIS DATA KENDALI
INPUT MDEL OUTPUT
PEMAKAI
PEMAKAI PEMAKAI
PEMAKAI PEMAKAI
PEMAKAI
2.3.Pengertian Basis Data
Basis data adalah koleksi dari data-data yang terorganisasi dengan cara
sedemikian rupa sehingga data mudah disimpan dan dimanipulasi (diperbaharui,
dicari, diolah dengan perhitungan-perhitungan tertentu, serta dihapus) (Nugroho,
2004).
Pendapat lain mengatakan bahwa basis data adalah suatu kumpulan data
terhubung (interrelated data) yang disimpan secara bersama-sama pada suatu
media, tanpa mengatap satu sama lain atau tidak perlu suatu kerangkapan data
(controlled redudancy) dengan cara-cara tertentu sehingga mudah untuk
digunakan atau ditampilkan kembali; dapat digunakan oleh satu atau lebih
program aplikasi secara optimal; data disimpan tanpa mengalami ketergantungan
pada program yang akan menggunakannya; data disimpan sedemikian rupa
sehingga penambahan, pengambilan dan modifikasi data dapat dilakukan dengan
mudah dan terkontrol (Sutanta, 1995).
Basis Data adalah kumpulan data (elementer) yang secara logik berkaitan
dalam merepresentasikan fenomena/fakta secara terstruktur dalam domain
tertentu untuk mendukung aplikasi pada sistem tertentu, merupakan kumpulan
data yang saling berhubungan yang merefleksikan fakta-fakta yang terdapat di
organisasi (Hariyanto, 2004).
Dari beberapa pengertian di atas, dapat disimpulkan bahwa basis data
adalah sekumpulan data yang saling terkait dan terintegrasi yang berkaitan
dilakukan operasi-operasi seperti penambahan, pengambilan, dan modifikasi data
lainnya dengan mudah.
2.4. Sistem Basis Data
Sistem basis data adalah koleksi dari file yang saling berelasi dan sebuah set
aplikasi yang memungkinkan untuk memodifikasi file tersebut (Rizky, 2008).
Atau dapat dikatakan sistem basis data merupakan gabungan antara basis data
dan perangkat lunak SMBD (Sistem Manajemen Basis Data) termasuk di
dalamnya program aplikasi yang dibuat dan bekerja dalam satu sistem disebut
dengan Sistem Basis Data. Sistem basis data dapat dianggap sebagai tempat
untuk sekumpulan berkas data yang terkomputerisasi dengan tujuan untuk
memelihara informasi dan membuat informasi tersebut tersedia saat dibutuhkan
(Dzacko, 2007).
Komponen-komponen utama dari sebuah sistem basis data adalah sebagai
berikut:
1. Basis Data
2. Perangkat Keras
3. Sistem Operasi
4. Sistem Pengelolaan Basis Data (DBMS)
5. Pemakai
Bila dibandingkan dengan sistem pemrosesan file yang didukung oleh
sistem operasi konvensional, maka penggunaan sistem basis data memiliki
banyak keuntungan, diantaranya:
1. Mengurangi duplikasi data.
2. Data yang independen, sehingga memisahkan data dengan aplikasi dalam
penyimpanannya.
3. Kemudahan, kecepatan, dan efisiensi akses atau pemanggilan data.
4. Menjaga ntegritas data.
5. Meningkatkan faktor keamanan data dengan memanfaatkan akses kontrol dari
database itu sendiri.
6. Dengan adanya penggunaan database waktu yang diperlukan untuk
mengembangkan aplikasi sistem informasi tentu saja menjadi lebih cepat.
2.5. Database Management System
DBMS adalah koleksi terpadu dari program-program (sistem perangkat
lunak) yang digunakan untuk mendefinisikan, menciptakan, mengakses dan
merawat database (basis data). Tujuannya adalah menyediakan lingkungan yang
mudah dan aman untuk penggunaan dan perawatan database. Perangkat tersebut
juga menerapkan mekanisme pengamanan data (security), pemakaian data secara
bersama (sharing data), pemaksaan keakuratan / konsistensi data, dan
sebagainya. Perangakat lunak yang termasuk DBMS adalah MS-Access, Foxpro,
Dbase-IV, Foxbase, Clipper, dan lainnya untuk kelas sederhana, dan Oracle,
Manfaat dari menggunakan DBMS tersebut adalah:
1. Untuk mengorganisasi dan mengelola data dalam jumlah besar.
2. Untuk membantu dan melindungi data dari kerusakan yang disebabkan
pengaksesan yang tidak sah.
3. Memudahkan dalam mengakses dan pengambilan data
4. Memudahkan untuk pengaksesan data secara bersamaan dalam suatu
jaringan.
2.5.1. Basis Data Relasional
Merupakan model basis data yang terdiri dari tabel-tabel terpisah yang
memiliki relasi antar tabel dimana setiap tabelnya mempunyai key sebagai kunci
relasi, dan setiap key mewakili semua field yang ketergantungan kepadanya
(Hutabarat, 2004). Dengan menggunakan model ini, pencarian field dari suatu
tabel atau banyak tabel dapat dilakukan dengan cepat. Pencarian atribut yang
berhubungan pada tabel yang berbeda dapat dilakukan dengan menghubungkan
terlebih dahulu tabel-tabel tersebut dengan menggunakan atribut yang sama (joint
operation).
Ada beberapa ciri dari basis data relasional yang baik (Hutabarat, 2004),
yaitu:
1. Mempunyai struktur basisdata yang lebih kompak (terdiri dari tabel-tabel
yang saling berhubungan).
2. Mempunyai struktur dari masing-masing table yang lebih efisien dan
3. Operasi basisdata yang lebih cepat (karena dlm perancangan basisdata ukuran
tabel diharapkan semakin kecil).
4. Tingkat redundansi yang lebih kecil.
2.5.2. Normalisasi
Normalisasi merupakan suatu teknik untuk mengorganisasi data kedalam
beberapa tabel, dimana tabel-tabel tersebut saling berhubungan satu dengan yang
lainnya (Hutabarat, 2004). Proses normalisasi menyediakan cara sistematis untuk
meminimalkan terjadinya kerangkapan data diantara relasi dalan perancangan
logikal basis data. Tujuan lain dari normalisasi adalah untuk mengurangi
kompleksitas, dan untuk mempermudah pemodifikasian data.
Format normalisasi terdiri dari lima bentuk, yaitu bentuk tidak normal,
bentuk normal pertama, bentuk normal kedua, bentuk normal ketiga,
Boyce-Codde, bentuk normal keempat, dan bentuk normal kelima, seperti yang
Gambar 2.2 Format Normalisasi
Namun yang umum digunakan adalah bentuk normal sampai 3NF, berikut
ini akan dijelaskan format normalisasi hingga 3NF:
2.5.2.1. Bentuk Tidak Normal
Pada bentuk ini biasanya data yang direkam tidak megikuti suatu format
Tabel 2.1 Bentuk Tidak Normal
2.5.2.2. Bentuk Normal Pertama (1NF)
Pada bentuk ini data dibuat dalam tabel dua dimensi dan tidak ada atribut
yang bernilai ganda atau berulang dan tidak mempunyai baris yang rangkap.
Tabel 2.2 Bentuk Normal Pertama (1NF)
2.5.2.3. Bentuk Normal Kedua (2NF)
Suatu relasi dikatakan sudah memenuhi bentuk normal kedua bila relasi
tersebut sudah memenuhi bentuk normal kesatu, dan atribut yang bukan key
Tabel 2.3 Bentuk Normal Kedua
2.5.2.4. Bentuk Normal Ketiga (3NF)
Suatu relasi dikatakan sudah memenuhi bentuk normal ketiga bila relasi
tersebut sudah memenuhi bentuk normal kedua dan atribut yang bukan key tidak
Tabel 2.4 Bentuk Normal Ketiga
2.6. Data warehouse
2.6.1. Pengertian
Data warehouse adalah kumpulan dari basis data yang terintegrasi dan
bersifat subject-oriented yang dirancang untuk memberikan (supply) informasi
yang dibutuhkan untuk pembuatan keputusan (Inmon, 1992). Data warehouse
berisi data hasil ekstraksi dari berbagai sistem operasi suatu perusahaan, setiap
sistem operasi tersebut berisi record yang berbeda-beda dari setiap transaksi
Data warehouse adalah sekumpulan data yang terintegrasi,
subject-oriented, nonvolatile, dan time-variant yang menunjang keputusan dari
manajemen (Kimball, 2002).
Data warehouse ialah sekumpulan informasi yang disimpan dalam basis
data yang digunakan untuk mendukung pengambilan keputusan dalam sebuah
organisasi. Data dikumpulkan dari berbagai aplikasi yang telah ada. Data yang
telah dikumpulkan tersebut kemudian divalidasi dan direstrukturisasi lagi, untuk
selanjutnya disimpan dalam data warehouse. Pengumpulan data ini
memungkinkan para pengambil keputusan untuk pergi hanya ke satu tempat
untuk mengakses seluruh data yang ada tentang organisasinya(Handojo, 2004).
Dari beberapa definisi di atas dapat disimpulkan bahwa data warehouse
adalah sekumpulan informasi yang didapatkan dari berbagai sistem operasi dalam
suatu perusahaan dan di kumpulkan dalam suatu database dalam sistem terpisah
untuk dilakukan ekstraksi, transformasi agar data terintegrasi, dan dapat
digunakan untuk melakukan analisis dalam pengambilan suatu keputusan.
2.6.2. Karakteristik Data warehouse
2.6.2.1. Berorientasi Subjek
Data warehouse berorientasi pada subjek-subjek area mayor dari
perusahaan. Data warehouse berorientasi subject artinya data warehouse
didesain untuk menganalisa data berdasarkan subject-subject tertentu dalam
organisasi,bukan pada proses atau fungsi aplikasi tertentu. Contohnya
diimplementasikan sebagai serangkaian tabel yang saling terhubung di dalam
data warehouse.
Gambar 2.3 Data Warehouse Berorientasi Subjek
2.6.2.2. Terintegrasi
Sumber data yang ada di dalam data warehouse tidak hanya berasal dari
database operasional (internal source) tetapi juga berasal dari luar sistem
(external source). Data warehouse dapat menyimpan data-data yang berasal dari
sumber-sumber yang terpisah kedalam suatu format yang konsisten dan saling
terintegrasi satu dengan lainnya. Dari seluruh aspek dari data warehouse,
integrasilah yang paling penting karena data yang akan dimasukkan ke dalam
Gambar 2.4 Data Warehouse Terintegrasi
2.6.2.3. Non-volatile
Maksud dari Non-volatile disini adalah data pada data warehouse tidak
di-update secara real time tetapi di refresh dari sistem operasional secara reguler.
Data yang baru selalu ditambahkan sebagai suplemen bagi database itu sendiri
dari pada sebagai sebuah perubahan. Database tersebut secara kontinyu
menyerap data baru ini, kemudian secara incremental disatukan dengan data
Berbeda dengan database operasional yang dapat melakukan update, insert
dan delete terhadap data yang mengubah isi dari database sedangkan pada data
warehouse hanya ada dua kegiatan memanipulasi data yaitu loading data
(mengambil data) dan access data (mengakses data warehouse seperti melakukan
query atau menampilan laporan yang dibutuhkan, tidak ada kegiatan updating
data).
Gambar 2.5 Data Warehouse Non-Volatile
2.6.2.4. Time-variant
Berbeda dengan database operasional, data yang terdapat di dalam data
warehouse tidak hanya mengandung data yang bernilai sekarang, tetapi juga data
history yang akan digunakan dalam analisis dan pengambilan keputusan . Seluruh
data pada data warehouse dapat dikatakan akurat atau valid pada rentang waktu
tertentu, data untuk analisis tersebut berisi berbagai nilai waktu, misalkan harian,
Gambar 2.6 Data Warehouse Berorientasi Waktu
2.6.3. Manfaat Data warehouse
Secara garis besar, data warehouse dapat meningkatkan produktivitas
pembuat keputsan melalui konsolidasi, konversi, transformasi, dan pemaduan
data operasional sehingga menyediakan pandangan konsisten terhadap
perusahaan. (Hariyanto, 2004).
Secara rinci manfaatnya sebagai berikut;
1. Kemampuan mengakses data yang berskala perusahaan.
2. Kemampuan memiliki data yang konsisten.
3. Kemampuan melakukan analisis secara cepat.
4. Dapat digunakan untuk mencari redudansi usaha diperusahaan.
5. Penemuan gap antara pengetahuan bisnis atau proses bisnis.
6. Mengurangi ongkos administrasi
7. Memberdayakan anggota perusahaan dengan informasi yang diperlukan
2.6.4. Struktur Data warehouse
Data warehouse memiliki struktur yang spesifik dan mempunyai
perbedaan dalam tingkatan detail data dan umur data (Poe, 2003).
Gambar 2.7 Struktur Dari Data Warehouse
Komponen dari struktur data warehouse adalah:
1. Current detail data
Current detail data merupakan data detil yang aktif saat ini,mencerminkan
keadaan yang sedang berjalan dan merupakan level terendah dalam data
warehouse. Didalam area ini warehouse menyimpan seluruh detail data yang
terdapat pada skema basis data. Jumlah data sangat besar sehingga memerlukan
storage yang besar pula dan dapat diakses secara cepat. Dampak negatif yang
ditimbulkan adalah kerumitan untuk mengatur data menjadi meningkat dan biaya M
E
T
A
yang diperlukan menjadi mahal. Berikut ini beberapa alasan mengapa current
detail data menjadi perhatian utama :
a. Menggambarkan kejadian yang baru terjadi dan selalu menjadi
perhatian utama
b. Sangat banyak jumlahnya dan disimpan pada tingkat penyimpanan
terendah.
c. Hampir selalu disimpan dalam storage karena cepat di akses tetapi
mahal dan kompleks dalam pengaturannya.
d. Bisa digunakan dalam membuat rekapitulasi sehingga current detail
data harus akurat.
2. Older detail data
Data ini merupakan data historis dari current detail data, dapat berupa hasil
cadangan atau archive data yang disimpan dalam storage terpisah. Karena
bersifat back-up(cadangan), maka biasanya data disimpan dalam storage
alternatif seperti tape-desk. Data ini biasanya memilki tingkat frekuensi akses
yang rendah. Penyusunan file atau directory dari data ini di susun berdasarkan
umur dari data yang bertujuan mempermudah untuk pencarian atau pengaksesan
kembali.
3. Lighlty summarized data
Data ini merupakan ringkasan atau rangkuman dari current detail data.
Data ini dirangkum berdasar periode atau dimensi lainnya sesuai dengan
kebutuhan. Ringkasan dari current detail data belum bersifat total summary.
kebutuhan warehouse pada tingkat departemen. Tingkatan data ini di sebut juga
dengan data mart. Akses terhadap data jenis ini banyak digunakan untuk view
suatu kondisi yang sedang atau sudah berjalan.
4. Highly summarized data
Data ini merupakan tingkat lanjutan dari Lightly summarized data,
merupakan hasil ringkasan yang bersifat totalitas, dapat di akses misal untuk
melakukan analisis perbandingan data berdasarkan urutan waktu tertentu dan
analisis menggunakan data multidimensi.
5. Metadata
Metadata bukan merupakan data hasil kegiatan seperti keempat jenis data
diatas. Metadata adalah „data tentang data‟ dan menyediakan informasi tentang
struktur data dan hubungan antara struktur data di dalam atau antara storage
(tempat penyimpanan data). Metadata berisikan data yang menyimpan proses
perpindahan data meliputi database structure, contents, detailed data dan
summary data, matrics, versioning, aging criteria, versioning, transformation
criteria. Metadata khusus dan memegang peranan yang sangat penting dalam
data warehouse. Metadata sendiri mengandung :
a. Struktur data: Sebuah direktori yang membantu user untuk melakukan
analisis Decission Support System dalam pencarian letak/lokasi dalam
data warehouse.
b. Algoritma: Algoritma digunakan untuk summary data. Metadata sendiri
summary data antara current detail data dengan lightly summarized data
dan antara lightly summarized data dengan hightly summaried data.
c. Mapping: Sebagai panduan pemetaan(mapping) data pada saat data di
transform/diubah dari lingkup operasional menjadi lingkup data
warehouse.
2.6.5. Arsitektur Data warehouse
Menurut Poe (2003), arsitektur adalah sekumpulan atau struktur yang
memberikan kerangka untuk keseluruhan rancangan suatu sistem atau produk.
Arsitektur data menyediakan kerangka dengan mengidentifikasikan dan
memahami bagaimana data akan pindah melalui sistem dan digunakan dalam
perusahaan. Arsitektur data untuk data warehouse mempunyai komponen utama
yaitu read-only database.
Karakterisitik arsitektur data warehouse (Poe, 2003) :
1. Data diambil dari sistem asal (sistem informasi yang ada), database dan file.
2. Data dari sistem asal diintegrasikan dan ditransformasi sebelum disimpan ke
dalam Database Management Sistem (DBMS) seperti Oracle,Ms SQL Server,
Sybase dan masih banyak yang lainnya.
3. Data warehouse merupakan sebuah database terpisah bersifat hanya dapat
dibaca yang dibuat khusus untuk mendukung pengambilan keputusan
4. Pemakai mengakses data warehouse melalui aplikasi front end tool
Arsitektur dan komponen utama dari data warehouse dapat dilihat pada
Gambar 2.8 Komponen Utama Dari Data Warehouse
1. Operational Data
Sumber data dari data warehouse dapat diambil langsung dari mainframe,
basis data relasional seperti Oracle, Ms SQL server dan sebagainya. Selain itu
dapat melaluo Operational Data Source(ODS). ODS menampung data yang
diekstrak dari sistem utama atau sumber-sumber data yang ada dan kemudian
data hasil ekstrasi tersebut dibersihkan.
2. Load manager
Load manager juga disebut sebagai komponen front-end yang bertugas
melakukan seluruh operasi yang berhubungan dengan ekstrasi dan me-load data
ke warehouse.
Warehouse manager melakukan seluruh operasi-operasi yang berhubungan
dengan kegiatan manajemen data di dalam warehouse. Operasi-operasi tersebut
meliputi :
a. Analisis terhadap data untuk memastikan konsistensi
b. Transformasi dan penggabungan sumber data dari tempat penyimpanan
sementara menjadi tabel-tabel data warehouse.
c. Penciptaan indeks-indeks dan view berdasarkan tabel-tabel dasar
d. Melakukan denormalisasi dan agregasi jika diperlukan
e. Backing-Up dan mengarsipkan data
4. Query manager
Query manager juga disebut komponen back-end, melakukan
operasi-operasi yang berhubungan dengan manajemen user queries. Operasi-operasi-operasi yang
dilakukan oleh komponen ini termasuk mengarahkan query kepada tabel-tabel
yang tepat dan menjadwalkan eksekusi dari query tersebut.
5. End-user Access Tools
Prinsip atau tujuan utama dari dibangunnya data warehouse adalah untuk
menyediakan informasi bisnis kepada user-user untuk dapat melakukan
pengambilan keputusan secara cepat dan tepat. User ini berinteraksi dengan
warehouse melalui end-user access tools. Data warehouse harus secara efisien
mendukung secara khusus kebutuhan user serta secara rutin melakukan analisis.
Performa yang baik dapat dicapai dengan merencanakan dahulu
dengan end-users. Dimana terdapat lima grup utama dari tools tersebut, antara
lain :
1. Reporting and query tools
2. Application development tools
3. Executive information Sistem (EIS) tools
4. Online Analytical Processing (OLAP) tools
5. Data mining tools
Arsitektur dan infrastruktur dari data warehouse sangat erat hubungannya
dan satu dengan lainnya saling berkaitan.
2.6.6. Tiga Model Data warehouse
1. Enterprise Data warehouse
Semua informasi yang dikumpulkan berupa subjek, yang mencakup seluruh
organisasi perusahaan.
2. Data mart
Sebagian data dari bagian perusahaan yang mempunyai nilai bagi
pengguna. Ruang lingkupnya lebih spesifik, seperti data Penjualan atau
marketing saja.
Data mart adalah sistem yang mengumpulkan data yang dibutuhkan sebuah
departemen atau aplikasi terkait. Data mart dapat diimplementasikan di data
warehouse dengan cara membuat view khusus, spesifik aplikasi tertentu. Dapat
disimpan. Data mart dapat memiliki representasi berbeda dan menggunakan
OLAP engine sendiri (Hariyanto, 2004).
3. Virtual Warehouse
Memantau melalui data operasional pada database. Suatu ringkasan dari
data yang fleksibel, mengurangi biaya untuk pengguna yang membutuhkan.
Karena tersedianya data yang siap disajikan tidak hanya untuk beberapa
pengguna didalam perusahaan, akan tetapi perusahaan lain yang membutuhkan
data tersebut dapat mudah untuk memperolehnya.
2.7. Perbedaan OLAP Dengan OLTP
OLAP adalah operasi basis data (database) untuk mendapatkan informasi
dalam bentuk kesimpulan dengan menggunakan agregasi sebagai mekanisme
utama, mekanisme berupa analisis dan pengambilan keputusan. Analisis OLAP
menggunakan tabel fakta dan dimensi untuk dapat menampilkan berbagai macam
bentuk laporan, analisis, query dari data yang berukuran besar.
OLTP merupakan suatu pemrosesan yang menyimpan data mengenai
kegiatan operasional transaksi sehari-hari, dimana data yang ada adalah data
terbaru dan spesifik.
Berikut ini adalah beberapa perbedaan yang signifikan antara OLAP dengan
OLTP:
Tabel 2.5 Perbedaan OLAP Dengan OLTP
OLTP OLAP
Function Transaksi setiap hari Pendukung keputusan
Db design Aplikasi oriented Subjek oriented
Data Sekarang, terbaru,
lengkap detail
Historical, ringkas,
multidimensi
terintegrasi
Usage Repetitive Ad-hoc
Access Membaca,menulis dan
merubah
Membaca dengan rinci
<kompleks>
Unit of work Pendek,transaksi yang
ringkas
Query kompleks
Db size Mega byte Terra byte
2.8. Model Dimensional
Model dimensional merupakan rancangan logikal yang bertujuan untuk
menampilkan data dalam bentuk standar dan intuitif yang memperbolehkan akses
dengan performa yang tinggi. Model dimensional menggunakan konsep model
hubungan antar entity (ER) dengan beberapa batasan yang penting. Setiap model
dimensi terdiri dari sebuah tabel dengan sebuah komposit primary key, disebut
dengan tabel fakta, dan satu set tabel yang lebih kecil disebut tabel dimensi.
Setiap tabel dimensi memiliki sebuah simple primary key yang merespon tepat
pada satu komponen primary key pada tabel fakta. Dengan kata lain primary key
pada tabel fakta terdiri dari dua atau lebih foreign key. Struktur karakteristik ini
disebut dengan skema bintang.
Fitur terpenting dalam model dimensional ini adalah semua natural keys
diganti dengan kunci pengganti (surrogate keys). Maksudnya yaitu setiap kali
Kegunaan dari kunci pengganti adalah memperbolehkan data pada data
warehouse untuk memiliki beberapa kebebasan dalam penggunaan data, tidak
seperti halnya yang diproduksi oleh sistem OLTP.
Dimensional model yang sering digunakan pada data warehouse adalah
skema bintang atau snowflake yang mudah dimengerti dan sesuai dengan
kebutuhan bisnis, mendukung query sederhana dan menyediakan performa query
yang superior dengan meminimalisasi tabel-tabel join. Berikut ini adalah skema
dimensional model yang sering digunakan:
2.8.1. Star Scheme
Skema bintang merupakan struktuk logikal yang memiliki tabel fakta yang
terdiri atas data faktual ditengahnya, dan dikelilingi oleh tabel-tabel dimensi yang
berisi referensi data. Pada model ini setiap tabel dimensi hanya berhubungan
dengan tabel fakta (Connoly dan Begg, 2005).
1. Tabel Fakta
Tabel fakta berisi field yang menunjukkan fakta dari suatu subjek, yang
diidentifikasi bahwa dengan field ini kita bisa mengukur nilai suatu aktivitas
dalam subjek tertentu. Misalnya dalam subjek penjualan. Tabel fakta ini
berisi foreign key dari tabel dimensi, karena berhubungan dengan tabel-tabel
dimensi di sekelilingnya.
2. Tabel Dimensi
Tabel dimensi merupakan penjelasan dari data yang terdapat dalam tabel
fakta. Misalnya dalam tabel fakta menyebutkan penjualan produk ke
pelanggan PT.X, maka untuk melihat detail mengenai PT.X, bisa dilihat
dalam tabel dimensi Pelanggan yang berhubungan dengan tabel fakta
tersebut.
2.8.2. Snowflake Scheme
Merupakan varian dari skema bintang dimana tabel-tabel dimensi tidak
terdapat data yang di denormalisasi. Dengan kata lain satu atau lebih tabel
dimensi boleh tidak bergabung secara langsung kepada tabel fakta tapi pada tabel
Gambar 2.10 Snowflake Scheme
2.8.3. Starflake Scheme
Keduanya merupakan model-model dimensional, perbedaannya terletak
pada implementasi fisikal. Skema snowflake memberi kemudahan pada
perawatan dimensi, dikarenakan strukturnya yang lebih normalisasi. Sedangkan
skema bintang lebih efisien serta sederhana dalam membuat query dan mudah
diakses secara langsung oleh pengguna. Adapun starflake merupakan gabungan
diantara keduanya. Keuntungan menggunakan masing-masing model tersebut
dalam data warehouse antara lain :
a. Efisien dalam hal mengakses data
b. Dapat beradaptasi terhadap kebutuhan-kebutuhan user
c. Bersifat fleksibel terhadap perubahan yang terjadi khususnya perubahan
yang mengarah pada perkembangan
e. Meskipun skema yang dihasilkan sangat kompleks, tetapi pemrosesan
query dapat diperkirakan, hal ini dikarenakan pada level terendah, setiap
tabel fakta harus di query secara independen.
2.9. Extract, Transform, Load
ETL (Extract, Transform, Load) adalah proses pengambilan data dari
application data dan mengintegrasikannya ke dalam data warehouse (Inmon,
2002). Atau bias diartikan sebagai proses migrasi dari database operasional
menuju data warehouse (mariana et al. 2010). Tujuan ETL adalah
mengumpulkan, menyaring, mengolah, dan menggabungkan data-data yang
relevan dari berbagai sumber untuk disimpan ke dalam data warehouse
(Darudiato, 2010). Hasil dari proses ETL adalah dihasilkannya data yang
memenuhi kriteria data warehouse seperti data yang historis, terpadu, terangkum,
statis, dan memiliki struktur yang dirancang untuk keperluan proses analisis.
Proses ETL ini dibagi menjadi tiga, yaitu:
1. Extraxt, adalah proses penentuan source yang akan digunakan sebagai
sumber data bagi data warehouse. Dalam proses ini ditentukan data apa saja
yang dibutuhkan, tabel apa yang dijadikan sumber.
2. Transform, setelah data ditentukan barulah data-data tersebut dirubah agar
sesuai dengan standard yang ada pada data warehouse.
3. Kemudian di Load, yaitu proses untuk memasukkan data-data yang sudah
Masalah-masalah yang terjadi dalam ETL adalah sumber-sumber data
umumnya sangat bervariasi (Darudiato, 2010) diantaranya:
1. Platform mesin dan sistem operasi yang berlainan.
2. Mungkin melibatkan sistem kuno dengan teknologi basis data yang sudah
ketinggalan zaman.
3. Kualitas data yang berbeda-beda.
4. Aplikasi sumber data mungkin menggunakan nilai data (representasi) internal
yang sulit dimengerti.
2.10.Nine Step Design Method
Berikut ini adalah Sembilan langkah untuk merancang suatu data
warehouse yang di cetuskan oleh Kimball (2002):
2.10.1.Memilih Proses
Pada proses pertama ini, yang dilakukan adalah menganalisa dan
menentukan subyek permasalahan yang dihadapi, lalu mengidentifikasi proses
bisnis yang berhubungan dengan permasalahan tersebut. Pemilihan proses
dilakukan untuk memperjelas batasan data warehouse yang akan dibuat.
2.10.2. Menentukan Grain
Grain merupakan calon fakta yang dapat dianalisis. Pemilihan grain
Pada proses kedua ini dipilihlah data dari calon fakta, dengan memutuskan
record apa yang akan direpresentasikan pada tabel fakta.
2.10.3. Mengidentifikasi Dan Penyesuaian Dimensi
Dalam tahap ini dilakukan identifikasi dimensi untuk setiap tabel fakta yang
ada. Misal, setiap data pelanggan pada tabel dimensi pembeli dilengkapi dengan
id_pelanggan, no_pelanggan, tipe_pelanggan, tempat_tinggal, dan lain
sebagainya.
2.10.4. Memilih Fakta
Pada tahap ini dipilih fakta-fakta yang akan mengisi setiap tabel fakta,
dimana fakta-fakta yang dipilih harus sesuai dengan grain yang telah ditentukan.
Biasanya penyesuaian dimensi dan grain ini ditampilkan dalam bentuk matriks.
2.10.5. Menyimpan Perhitungan Awal Dalam Tabel Fakta
Sesuai dengan grain yang telah ditentukan sebelumnya yang merupakan
calon-calon fakta. Masing-masing fakta memiliki data yang dapat dihitung, pada
tahap inilah perhitungan tersebut dilakukan. Hal ini terjadi apabila fakta
2.10.6. Melihat Kembali Tabel Dimensi
Pada tahap ini ditambahkan keterangan selengkap-lengkapnya pada tabel
dimensi. Keterangannya harus bersifat intuitif dan mudah dipahami oleh
pengguna.
2.10.7. Memilih Durasi Database
Pada proses ini yang dilakukan adalah menentukan pembatasan waktu
untuk data yang diambil dan dipindahkan kedalam tael fakta. Penentuan durasi
ini tergantung terhadap kebutuhan informasi perusahaan. Misalnya pada suatu
perusahaan asuransi, mengharuskan data disimpan selama 10 tahun atau lebih.
2.10.8. Menelusuri Perubahan Dari Dimensi
Pada proses ini yang dilakukan adalah mengamati perubahan data dari tabel
dimensi. Cara yang dapat dilakukan ada tiga, yaitu:
a. Atribut dimensi yang telah berubah tertulis ulang
b. Atribut dimensi yang telah berubah menimbulkan sebuah dimensi baru
c. Atribut dimensi yang telah berubah menimbulkan alternatif sehingga
nilai atribut lama dan yang baru dapat diakses secara bersama pada
2.10.9. Memutuskan Prioritas Query Dan Tipe Query, Memilih Physical
Design
Pada langkah ini difokuskan pada perancangan fisik untuk data warehouse.
Persoalan perancangan fisik yang paling kritis adalah urutan fisik dari tabel fakta
pada tempat penyimpanan dan pengadaan ringkasan yang disimpan sebelumnya
atau penggabungan antara keduanya.
Diluar persoalan tersebut ada sejumlah persoalan perancangan fisik
tambahan yang memengaruhi administrasi, backup, kinerja pengurutan, dan
keamanan dalam pengaksesan maupun penyimpana data dan analisis kapasitas
media penyimpanan.
2.11.Tools Pembuatan Data Warehouse
2.11.1.SQL Server
Microsoft SQL Server merupakan aplikasi database handal yang digunakan
oleh sebagian besar perusahaan terkemuka di dunia termasuk di Indonesia.
Microsoft SQL Server merupakan pendobrak dan inovasi database modern yang
mengetengahkan kemudahan, kecepatan, ketepatan dan kecanggihan dalam
mengelola sebuah database modern berskala kecil, menengah dan besar. Melihat
kemampuan yang sangat hebat ini Microsoft SQL Server mendapat julukan The
Next Generation Database. Dengan demikian Microsoft SQL Server merupakan
solusi database modern yang mampu mengelola data warehousing, komputer