• Tidak ada hasil yang ditemukan

Arsitektur Data Warehouse

Dalam dokumen BAB II LANDASAN TEORI (Halaman 28-35)

Ada beberapa arsitektur dasar dari data warehouse. Arsitektur two-tier dan three-tier adalah yang paling umum, akan tetapi kadang-kadang hanya one-tier dibedakan antara arsitektur ini dengan membagi data warehouse menjadi tiga bagian yaitu :

a. Data warehouse itu sendiri, yang berisi data dan software yang terkait. b. Data acquisition (back-end) software, yang mengekstrak data dari sistem

warisan dan sumber-sumber eksternal, mengkonsolidasikan dan meringkas mereka ke dalam data warehouse.

c. Client (front-end) software, yang mengijinkan user untuk mengakses dan menganalisa data dari data warehouse (a DSS/BI/business analytycs [BA] engine)

Di arsitektur three-tier, sistem operasional berisi data dan software untuk data acquisition di one tier, data warehouse ada di lapisan lainnya dan third tier meliputi DSS/BI/BA Engine (server aplikasi) dan client. Data dari datawarehouse di proses dua kali dan disimpan di database multidimensi, terorganisasi untuk kemudahan analisa multidimensional dan presentasi atau di replikasi di dalam data marts. Keuntungan dari arsitektur three-tier adalah pemisahan fungsi data warehouse yang menghilangkan keterbatasan sumber daya dan memungkinkan untuk dengan mudah membuat data marts.

Dalam arsitektur two-tier, mesin DSS secara fisik berjalan dalam platform hardware yang sama sebagai data warehouse. Untuk itu, arsitektur ini lebih ekonomis dibandingkan dengan struktur three-tier. Arsitektur two-tier memiliki masalah kinerja dari data warehouse yang besar yang bekerja dengan aplikasi data-intensive untuk mendukung keputusan.

Gambar 2.9. Arsitektur three-tier data warehouse Tier 1 : Client workstation Tier 2 : Application and Database Server

Gambar 2.10. Arsitektur two-tier data warehouse

Data warehousing dan internet merupakan dua kunci teknologi yang menawarkan solusi penting untuk mengelola data perusahaan. Integrasi dari kedua teknologi menghasilkan based data warehousing. Arsitektur Web-based data waerhousing adalah three-tiered dan meliputi PC lient, Web server dan application server. Di sisi client, user memerlukan koneksi internet dan web browser yang memiliki Graphical User Interface (GUI). Internet/intranet/extranet merupakan komunikasi menengah antara client dan servers. Di sisi server, Web server digunakan untuk mengelola arus masuk dan keluar dari informasi antara client dan server. Ini di dukung oleh data warehouse dan application server. Web-based data warehousing menawarkan

beberapa keuntungan menarik, termasuk kemudahan akses, independensi platform, dan biaya yang lebih rendah.

Gambar 2.11. Arsitektur web-based data warehouse

2.6.5. Data Integration dan Proses Extraction, Transformation, Load (ETL) a. Data Integration

Integrasi data terdiri dari tiga proses utama yang ketika diimplementasikan dengan benar, memungkinkan data yang akan diakses dan dapat diakses oleh berbagai alat analisis ETL dan lingkungan data warehousing : data access (kemamuan untuk mengakses dan mengekstrak data dari sumber data), data federation (integrasi pandangan bisnis di beberapa penyimpanan data), change capture (berdasarkan identifikasi, menangkap, dan mengirimkan perubahan yang dibuat untuk sumber data perusahaan).

b. Extraction, Transformation, and Load

Jantung dari sisi teknis proses data warehousing adalah ekstraksi, transformasi, dan load (ETL). Teknologi ETL yang telah ada selama beberapa waktu, adalah instrumen dalam proses penggunaan data warehouse. Proses ETL merupakan komponen integral dalam setiap proyek data-centric. Manager TI sering dihadapkan dengan tantangan karena proses ETL biasanya mengkonsumsi 70 persen dari waktu dalam sebuah proyek data-centric.

Proses ETL terdiri dari extraction (membaca data dari satu atau lebih database), transformation (mengubah data yang diambil dari bentuk sebelumnya menjadi bentuk yang perlu sehingga dapat ditempatkan ke dalam data warehouse atau hanya database lain), dan load (Menempatkan data ke dalam data waerhouse). Tranformasi terjadi dengan menggunakan aturan atau tabel lookup atau dengan menggabungkan data dengan data lain. Tiga fungsi database diintegrasikan ke dalam satu alat untuk menarik data dari satu atau lebih database dan menempatkan mereka ke tempat lain, basis data konsolidasi atau data warehouse.

Alat ETL juga mengantarkan data antara sumber dan target, dokumen bagaimana elemen data berubah saat berpindah dari sumber ke target, menukar metadata dengan aplikasi lain yang diperlukan, dan mengelola semua proses dan operasi yang berjalan (jadwal, management error, log audit, dan statistik). ETL sangat penting untuk integrasi data dalam data warehousing. Tujuan dari proses ETL adalah untuk memuat

warehouse dengan integrasi dan data yang sudah dibersihkan. Data yang digunakan dalam ETL proses dapat berasal dari berbagai sumber, aplikasi mainframe, aplikasi ERP, CRM, file dan Excel, atau bahkan hanya antrian pesan.

Proses perpindahan data ke data warehouse melibatkan ekstraksi data dari semua sumber. Sumber data dapat terdiri dari file ekstrak dari database OLTP, spreadsheets, database personal, atau file dari luar. Pada umumnya, semua masukan file ditulis ke dalam table sementara, yang di buat untuk memfasilitasi proses load. Data warehouse mengandung banyak aturan bisnis yang mendefinisikan bagaimana data tersebut akan digunakan, aturan peringkasan, standarisasi atribut enkode, dan aturan perhitungan. Masalah kualitas data yang berkaitan dengan sumber file perlu untuk diperbaiki sebelum data tersebut dimuat ke dalam data warehouse. Salah satu keuntungan dari design data warehouse adalah aturan tersebut dapat disimpan ke dalam repositori metadata dan digunakan dalam data warehouse terpusat. Hal ini berbeda dengan pendekatan OLTP, yang biasanya memiliki data dan aturan bisnis yang tersebar di seluruh sistem. Proses dari memuat data ke dalam data warehouse dapat dilakukan baik melalui alat transformasi data yang menyediakan GUI untuk membantu dalam pengembangan dan pemeliharaan aturan bisnis atau melalui metode tradisional, seperti mengembangkan program atau alat untuk memuat data warehouse, menggunakan bahasa pemrograman. Keputusan ini tidak mudah untuk

organisasi. Beberapa masalah yang mempengaruhi apakah organisasi akan membeli alat transformasi atau membangun proses transformasi sendiri :  Alat transformasi data sangat mahal.

 Alat transformasi data memiliki kurva pembelajaran yang panjang.  Sangat sulit untuk mengukur bagaimana yang dilakukan organisasi IT

sampai mempelajari bagaimana menggunakan alat transformasi data. Solomon (2005) mengklasifikasikan teknologi ETL menjadi empat kategori : canggih, memungkinkan, sederhana dan belum sempurna. Secara umum diakui bahwa alat dalam kategori canggih akan menghasilkan dalam proses ETL menjadi terdokumentasi dengan baik dan lebih terkelola secara akurat sebagai pengembangan proyek data warehouse. Meskipun mungkin bagi programer untuk mengembangkan program untuk ETL, sangat mudah menggunakan alat ETL yang sudah ada.

Dalam dokumen BAB II LANDASAN TEORI (Halaman 28-35)

Dokumen terkait