PROTOTIPE
DATA WAREHOUSE
PENJUALAN PRODUK
BAKOSURTANAL
RIKA INDRIANI
DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
PROTOTIPE
DATA WAREHOUSE
PENJUALAN PRODUK
BAKOSURTANAL
RIKA INDRIANI
Skripsi
sebagai salah satu syarat untuk memperoleh gelar
Sarjana Komputer pada
Departemen Ilmu Komputer
DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
ABSTRACT
RIKA INDRIANI. Data Warehouse Sale Prototype of Bakosurtanal Product. Supervised by HARI AGUNG ADRIANTO.
Speeding up reporting process and obtaining strategic information based on a multidimensional analysis query can be done by building OLAP applications integrated with data warehouse. Development of data warehouse Bakosurtanal product sales data and web-based OLAP applications has been done using Palo. Palo is one of the OLAP server with multidimensional data storage model (MOLAP). Mondrian is an OLAP server with relational data storage model (ROLAP)
This research aims to develop a data warehouse and wab-based OLAP using Mondrian 3.1.6. This research designs the data warehouse using star scheme and OLAP development. This research produces a web-based OLAP cube consisting of one data cube: sales of products and four dimensions: time, type of data, qualification, and scale. Users can interact with the following facilities: 1) Selecting dimensions to display the information at the level needed, 2) Displaying information in the form of bar charts, stacked bar, line charts, line charts, stacked area, and pie charts 3) Exporting files into Microsoft Excel format. Users can explore this application using OLAP operations including roll-up, drill-down, slice, dice, etc.
Judul Skripsi : Prototipe Data Warehouse Penjualan Produk BAKOSURTANAL Nama : Rika Indriani
NIM : G64066039
Menyetujui:
Pembimbing,
Hari Agung Adrianto, S.Kom, M.Si NIP. 19760917 200501 1 001
Mengetahui:
Ketua Departemen Ilmu Komputer
KATA PENGANTAR
Puji dan syukur kehadirat Allah Subhanahu Wa Ta’ala yang telah memberikan rahmat, tuntunan dan kemurahan-Nya kepada penulis untuk dapat menyelesaikan penelitian ini. Akhirnya, skripsi dengan judul “Prototipe Data Warehouse Penjualan Produk Bakosurtanal”, yang disusun sebagai salah satu syarat untuk mengikuti ujian akhir sarjana pada Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor, dapat diselesaikan.
Dalam pengerjaan penelitian ini tentu tidak lepas dari pihak-pihak yang terus mendukung dan membantu, oleh karena itu dengan tulus penulis mengucapkan terima kasih kepada :
1. Ibu dan kakak-kakakku tercinta yang telah memberikan dukungan, do’a, semangat dan kasih sayang yang luar biasa kepada penulis sehingga dapat menyelesaikan penelitian ini. 2. Suamiku tercinta, Yusup Hendra Perkasa, ST yang selalu setia menemani dan tak pernah
lelah memberikan semangat, do’a, dukungan, cinta dan kasih sayangnya serta menjadi tempat bertukar pikiran.
3. Bapak Hari Agung Adrianto, S.Kom, M.Si., selaku pembimbing yang telah bersedia meluangkan waktu untuk memberikan bimbingan dan masukkan yang sangat bermanfaat dalam penyusunan penelitian ini.
4. Bapak Ahmad Ridha, S.Kom, M.S, dan Ibu Annisa, S.Kom, M.Kom. yang bersedia menjadi penguji pada sidang ujian akhir penulis.
5. Bapak/Ibu Dosen Institut Pertanian Bogor yang telah memberikan ilmunya pada penulis selama belajar di Institut Pertanian Bogor ini.
6. Rekan-rekan mahasiswa/i Ekstensi Ilkom Angkatan 1, terima kasih atas kebersamaan dan kerja samanya.
7. Kepada pihak lainnya yang telah memberikan kontribusi besar selama pengerjaan penelitian ini yang tidak dapat disebutkan satu-persatu, penulis ucapkan terima kasih banyak.
Akhirnya, sebagai seorang manusia biasa, penulis menyadari pasti ada kekurangan dan kelemahan yang terdapat pada penelitian ini. Untuk itu, penulis terbuka terhadap kritik dan saran dari semua pihak. Dan semoga penelitian ini dapat bermanfaat bagi kita semua. Amin.
Bogor, November 2010
RIWAYAT HIDUP
Penulis dilahirkan di Bogor pada tanggal 28 Agustus 1984. Penulis merupakan anak kelima dari lima bersaudara pasangan bapak Hapid (Alm) dan ibu Endeh Saodah. Penulis menyelesaikan program studi Diploma 3 Teknik Informatika, Departemen Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor pada tahun 2006. Kemudian pada tahun 2007, penulis diterima sebagai mahasiswi Program Sarjana Ilmu Komputer Penyelenggaraan Khusus, Departemen Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor.
DAFTAR ISI
Halaman
DAFTAR TABEL...v
DAFTAR GAMBAR ...v
DAFTAR LAMPIRAN ...v
PENDAHULUAN...1
Latar Belakang...1
Tujuan...1
Ruang Lingkup ...1
Manfaat...1
TINJAUAN PUSTAKA...1
Data warehouse ...1
Model Data Multidimensi...2
Operasi-operasi pada OLAP ...3
Pemodelan Penyimpanan Data ...3
Arsitektur Komponen OLAP Pentaho ...4
Metode Pengembangan Data Warehouse ...4
METODE PENELITIAN...6
Desain Logis...6
Proses Loading...6
Uji Query...6
Pembuatan Data Warehouse...6
Lingkungan Pengembangan ...7
HASIL DAN PEMBAHASAN ...7
Desain Logis...7
Proses Loading...8
Desain Fisik ...8
Uji Query...9
KESIMPULAN DAN SARAN ...9
Kesimpulan...9
Saran...9
DAFTAR PUSTAKA ...9
DAFTAR GAMBAR
Halaman
1 Skema bintang (Han & Kamber 2006). ...3
2 Skema kepingan salju (Han & Kamber 2006). ...3
3 Skema galaksi (Han & Kamber 2006)...3
4 Gambaran komponen Pentaho OLAP (Bouman & Doungen 2009)...5
5 Gambaran metode pengembangan data warehouse (Malinowski & Zimányi 2008) . ...6
6 Diagram alir metode penelitian . ...6
7 Skema bintang dengan tabel fakta penjualan_produk. ...8
8 Skema galaksi dengan tabel fakta lembar_penjualan dan harga_penjualan (Nurhasanah 2009)..9
DAFTAR TABEL
Halaman 1 Atribut hasil analisis dan deskripsi tiap atribut (Nurhasanah 2009) ...72 Kebutuhan analisis data penjualan setiap pengguna (Nurhasanah 2009) ...7
3 Nama dan deskripsi dimensi dari kubus Jumlah Penjualan ...8
DAFTAR LAMPIRAN
Halaman 1 Proses bisnis kegiatan penjualan produk surta ...112 Bentuk formulir pemesanan (Form-LP) ...12
3 Contoh catatan data penjualan produk Bakosurtanal...13
4 Contoh format laporan penjualan produk surta dalam bentuk grafik dan tabel...15
5 Atribut-atribut data penjualan tahun 2002 – 2007 ...18
6 Model hierarki tiap dimensi...19
7 Data dalam tabel dimensi ...20
8 Grafik hasil operasi roll up jumlah produk surta yang terjual per tahun ...24
9 Grafik hasil operasi drill dwon jumlah produk surta yang terjual per jenis data ...25
10 Grafik hasil operasi slice jumlah lembar penjualan produk surta pada dimensi waktu dan dimensi skala ...26
PENDAHULUAN Latar Belakang
Badan Koordinasi Survei dan Pemetaan Nasional (Bakosurtanal) merupakan Lembaga Pemerintah Non Departemen yang bertugas melaksanakan survei dan pemetaan sesuai dengan ketentuan peraturan perundang-undangan yang berlaku. Dalam hal tersebut, Bakosurtanal mempunyai kewenangan menyediakan informasi spasial kedalam suatu produk survei dan pemetaan (surta) berupa peta atau atlas dalam berbagai format, jenis dan skala. Untuk itu, Bakosurtanal menjadi titik tumpu dalam pelaksanaan pendistribusian dan pelayanan produk surta kepada pengguna dalam berbagai kalangan.
Perolehan produk surta dapat dilakukan secara langsung atau tertulis (melalui surat/ faksimili). Untuk pembelian secara langsung, pengguna harus mengisi formulir pesanan (Form-LP) yang disediakan di loket penjualan. Setelah terjadi transaksi, petugas unit pelayanan mencatat data penjualan tersebut menggunakan Microsoft Office Excel. Pengolahan data yang disajikan dalam bentuk laporan penjualan masih dilakukan dengan query manual pada setiap tabel data penjualan yang tersimpan di Microsoft Office Excel. Laporan tersebut disesuaikan dengan kebutuhan pengguna. Dengan proses tersebut, data yang tercatat memiliki atribut-atribut terbatas dan tidak konsisten antar tahun. Hal tersebut menyebabkan tingkat akurasi rendah terhadap hasil analisis data penjualan dan membutuhkan waktu yang lama.
Untuk mempercepat proses pelaporan dan memperoleh informasi yang strategis
berdasarkan query analisis yang
multidimensi, dapat dilakukan dengan membangun aplikasi OLAP yang diintegrasikan dengan data warehouse.
Pembangunan data warehouse data
penjualan produk Bakosurtanal dan aplikasi OLAP berbasis web telah dilakukan pada penelitian sebelumnya (Nurhasanah 2009) dengan menggunakan Palo. Palo merupakan salah satu OLAP server dengan model penyimpanan data multidimensi (MOLAP) sehingga jumlah volume data yang dapat ditangani terbatas. Saat ini banyak OLAP
server yang dikembangkan dan bersifat open source salah satunya adalah Mondrian (http://mondrian.pentaho.org/). Mondrian merupakan OLAP server dengan model
penyimpanan data relasional (ROLAP) yang dikembangkan dengan Java dan memungkinkan penguna menganalisis dataset yang disimpan di database secara interaktif. Selain terdapat perbedaan pada OLAP server yang digunakan, skema pada penelitian ini juga berbeda dengan penelitian sebelumnya. Pada penelitian sebelumnya, skema yang digunakan adalah skema galaksi sedangkan pada penelitian kali ini digunakan skema bintang. Hal tersebut terjadi karena setelah dilakukan pengkajian lebih lanjut, terdapat redudansi data pada penelitian sebelumnya yang menggunakan skema galaksi.
Tujuan
Penelitian ini bertujuan untuk membangun suatu sistem data warehouse
yang dapat mendukung analisis penjualan produk sesuai dengan kebutuhan pengguna.
Ruang Lingkup
Ruang lingkup penelitian ini adalah: 1 Penelitian ini akan menghasilkan
prototipe data warehouse dan aplikasi OLAP berbasis web. Data tersebut dilakukan analisis menggunakan OLAP
server Mondrian.
2 Data yang digunakan adalah data penjualan produk survei dan pemetaan Bakosurtanal tahun 2002 sampai dengan 2007.
Manfaat
Hasil penelitian yang diperoleh diharapkan dapat mendukung pengambilan keputusan yang strategis untuk mencapai tujuan bisnis (meningkatkan mutu produk, meningkatkan layanan konsumen, meningkatkan penjualan, dll) yang didapat secara informatif, cepat dan akurat.
TINJAUAN PUSTAKA
Data warehouse
Data warehouse menyediakan arsitektur dan alat bagi para eksekutif bisnis untuk mengatur secara sistematis, mengerti, dan menggunakan data dalam membuat keputusan strategis.
pemrosesan informasi dengan menyediakan suatu platform yang kokoh untuk analisis data yang mengandung histori dan terkonsolidasi.
Data warehouse mempunyai
karakteristik berorientasi subjek, terintegrasi, time variant dan non volatile. Hal tersebut tersebut membedakan data warehouse dengan sistem penyimpanan data lainnya, berikut adalah penjelasan dari masing-masing karakteristik (Han & Kamber 2006):
• Orientasi subjek
Data warehouse diorganisasikan pada subjek-subjek utama seperti halnya konsumen, pemasok, produk dan penjualan. Dibandingkan dengan berkonsentrasi terhadap kegiatan operasi keseharian dan proses transaksi dari suatu organisasi, data warehouse fokus terhadap pembentukan model data dan analisis data untuk pengambilan keputusan. Karena itu data warehouse
biasanya menyediakan pola pandang yang sangat mudah terhadap beberapa subjek yang ada dengan menghilangkan data yang tidak berguna pada proses pengambilan keputusan.
• Terintegrasi
Data warehouse biasanya terbentuk dengan melakukan integrasi terhadap data yang berbeda seperti halnya basis data relasional, flat file dan catatan transaksi online. Teknik data cleaning
dan integrasi data diterapkan untuk memastikan konsistensi dalam hal keseragaman penamaan, struktur pengkodean, pengukuran atribut dan hal lainnya.
• Time variant
Data disimpan untuk menyediakan informasi dari perspektif historical
(seperti 5-10 tahun kebelakang). Setiap struktur kunci pada data warehouse
mengandung elemen waktu baik itu secara implisit ataupun eksplisit.
• Non volatile
Data terpisah dari data operasional sehingga tidak membutuhkan suatu proses transaksi, recovery, dan mekanisme kontrol konkurensi akan
dalam mengakses data yaitu pemasukan data pertama dan pengaksesan data.
Model Data Multidimensi
Data warehouse didasarkan pada suatu model data multidimensi. Model ini melihat data dalam bentuk kubus data. Kubus data memungkinkan data yang akan dimodelkan dan dilihat dalam multidimensi. Hal tersebut didefinisikan oleh dimensi dan fakta.
Dalam istilah umum, Dimensi adalah perspektif atau entitas yang digunakan sebagai tempat menyimpan beberapa record
yang saling berhubungan. Masing-masing dimensi memiliki sebuah tabel yang terkait dengannya, disebut sebagai tabel dimensi.
Fakta adalah ukuran-ukuran numerik. Fakta merupakan kuantitas yang akan dianalisis hubungan antar dimensi. Tabel fakta berisi nama dari fakta (ukuran) dan
keys dari tabel dimensi yang bersangkutan. Untuk menggambarkan hubungan antar data pada data multidimensi digunakan skema multidimensi. Pada data warehouse, skema merupakan sekumpulan tabel yang berhubungan. Skema digunakan untuk menunjukkan hubungan antara tabel dimensi dengan tabel fakta. Skema ditentukan berdasarkan kebutuhan data warehouse dan keinginan pembuat data warehouse. Data warehouse membutuhkan skema yang ringkas dan berorientasi subjek. Tipe-tipe skema multidimensi antara lain (Han & Kamber 2006):
1 Skema bintang (star schema)
Skema bintang adalah skema data warehouse yang paling umum. Skema bintang merupakan struktur logikal yang memiliki tabel fakta yang terdiri atas data faktual ditengahnya, dan dikelilingi oleh tabel-tabel dimensi yang berisi referensi data.
Keuntungan yang didapat jika menggunakan skema ini adalah peningkatan kinerja data warehouse, pemrosesan query
yang lebih efisien, dan waktu respon yang cepat. Bentuk skema bintang dapat dilihat pada Gambar 1.
2 Skema kepingan salju (snowflake schema)
Gambar 1 Skema bintang (Han & Kamber 2006).
Perbedaan utama antara model kepingan salju dan skema bintang adalah bahwa tabel dimensi dari model kepingan salju dapat disimpan dalam bentuk normalisasi untuk mengurangi redudansi. Selanjutnya, struktur kepingan salju dapat menghemat penggunaan memori, tapi waktu yang dibutuhkan untuk pemrosesan query menjadi lebih lama akibatnya kinerja sistem dapat berdampak buruk. Bentuk skema kepingan salju dapat dilihat pada Gambar 2.
Gambar 2 Skema kepingan salju (Han & Kamber 2006).
3 Skema galaksi (fact constellation) Aplikasi canggih mungkin memerlukan beberapa tabel fakta untuk berbagi tabel dimensi. Skema semacam ini dapat dilihat sebagai kumpulan bintang, dan karenanya disebut skema galaksi atau konstelasi fakta. Keuntungan menggunakan skema ini adalah menghemat memori dan mengurangi kesalahan yang mungkin terjadi. Bentuk skema galaksi dapat dilihat pada Gambar 3.
Gambar 3 Skema galaksi (Han & Kamber 2006).
Operasi-operasi pada OLAP
Dalam model multidimensi, data tersebut akan disusun dalam berbagai dimensi, dan masing-masing dimensi berisi beberapa tingkat abstraksi yang didefinisikan oleh konsep hierarki. Hal tersebut memberikan fleksibilitas bagi pengguna untuk melihat data dari perspektif yang berbeda. Sejumlah operasi OLAP pada kubus data yang ada untuk mewujudkan perspektif yang berbeda, memungkinkan query interaktif dan analisis data. Oleh karena itu, OLAP menyediakan lingkungan yang user-friendly untuk analisis data secara interaktif. Beberapa operasi OLAP dijelaskan berikut ini (Han & Kamber 2006):
• Roll up (drill up): roll up dilakukan dengan cara menaikkan tingkat hierarki atau mereduksi jumlah dimensi.
• Drill down: drill down merupakan kebalikan dari roll up. Operasi ini merepresentasikan data secara lebih detail.
• Pivot (rotate): merotasikan sumbu data untuk memberikan alternatif dalam presentasi data.
• Slice and Dice: slice melakukan seleksi pada satu dimensi kubus sehingga menghasilkan subcube. Dice merupakan proses mendefinisikan subcube dengan memilih dua atau lebih dimensi.
• Pivot (rotate): memvisualisasikan operasi yang merotasikan sumbu data sebagai alternatif dalam presentasi data.
Pemodelan Penyimpanan Data
fisik dan implementasi OLAP server harus mempertimbangkan masalah penyimpanan data. Implementasi dari sebuah server data warehouse untuk pemrosesan OLAP meliputi (Bouman & Doungen 2009):
MOLAP
Multidimensional online analitycal processing (MOLAP) menyimpan data dan aggregasi pada struktur data multidimensi. Struktur MOLAP ini tidak tersimpan pada
data warehouse tapi tersimpan pada OLAP
server, sehingga performa query yang dihasilkan olehnya sangat bagus. Model penyimpanan ini sesuai untuk database
dengan ukuran kecil sampai sedang.
ROLAP
Relational online analitycal processing
(ROLAP) menggunakan tabel pada
relational database untuk menyimpan detail data dan aggregasi kubus. Berbeda dengan MOLAP, ROLAP tidak menyimpan salinan
database tapi mengakses langsung pada tabel fakta ketika membutuhkan jawaban sebuah query, sehingga query pada ROLAP mempunyai response time yang lebih lambat dibandingkan MOLAP maupun HOLAP. Karakteristik model ini digunakan untuk menyimpan data yang besar dan jarang dilakukannya proses query. Misalkan, data histori dalam jumlah besar dari beberapa tahun yang sebelumnya.
HOLAP
Hybrid OLAP, Menggabungkan
teknologi ROLAP dan MOLAP. HOLAP menggabungkan kelebihan-kelebihan yang ada pada keduanya, skalabilitas yang lebih besar dari ROLAP dan perhitungan yang lebih cepat dari MOLAP. HOLAP menggunakan relational database untuk menyimpan detil data dan menggunakan
multidimentional database untuk menyimpan agregasinya.
Arsitektur Komponen OLAP Pentaho
Mondrian merupakan aplikasi server
OLAP berbasis open source yang sangat populer dan saat ini bernaung di bawah Pentaho Corporation. Proyek Mondrian ini merupakan kombinasi yang sangat baik dengan JPivot - interface berbasis web yang juga merupakan proyek open source. Gambar 2 menunjukkan gambaran semantik dari komponen Pentaho Analysis Services
menjelaskan apa yang terjadi ketika pengguna menggunakan aplikasi Pentaho OLAP (Bouman & Doungen 2009).
1 Pengguna web browser menggunakan sebuah HTTP request untuk melihat,
browse atau drill down kedalam tabel pivot OLAP
2 JPivot servlet menerima request dari pengguna dan menerjemahkan request
tersebut kedalam sebuah MDX query. MDX query ini kemudian dikirmkan ke Mondrian engine
3 Mondrian menginterpretasikan MDX
query dan menerjemahkannya kedalam satu atau lebih SQL query. Teknik khusus ini disebut sebagai ROLAP, yang merupakan singkatan dari
Relational OLAP
4 Relational Database Management System (RDBMS) mengeksekusi query
yang diberikan oleh Mondrian. Mondrian menerima hasil query dalam bentuk tabular (relational)
5 Mondrian memproses hasil yang
diterima dari RDBMS dan menerjemahkannya kedalam result-set
multidimensi. Ini sebenarnya adalah hasil query MDX dari query MDX yang dikirim ke Mondrian pada langkah 2
6 JPivot menggunakan hasil
multidimensi untuk membuat halaman HTML menampilkan data. Inilah yang kemudian dikirim ke browser untuk ditunjukkan kepada pengguna
Metode Pengembangan Data Warehouse
Metode yang digunakan untuk merancang database operasional meliputi tahapan yang didefinisikan dengan baik. Tahap pertama adalah spesifikasi kebutuhan yang terdiri dari mengumpulkan permintaan pengguna ke dalam spesifikasi yang koheren dan ringkas. Tahap berikutnya, desain konseptual, desain logis, dan desain fisik yang merupakan hasil penerjemahan dari kebutuhan pengguna.
Karena data warehouse adalah database
yang khusus ditujukan untuk mendukung proses pengambilan keputusan, tahapan yang digunakan dalam desain database
konvensional diadopsi untuk pengembangan
Schema File (XML)
RDBMS
∑
Mondrian ROLAP Engine
4. Relational Result Read Metadata
<schema> <cube>
……… ∑
Edit Publish
Pentaho Schema Workbench XML Editor Pentaho Agregator Designer Metadata and Beck End
OLAP Front End
1. HTTP Request
Optimize, Publish Web Browser Crosstab
6. HTML
Gambar 4 Gambaran komponen Pentaho OLAP (Bouman & Doungen 2009).
Selama proses pengumpulan kebutuhan, pengguna di berbagai tingkat manajemen diwawancara untuk mengetahui analisis kebutuhan mereka. Spesifikasi yang diperoleh berfungsi sebagai dasar untuk membuat sebuah skema database yang mampu merespon permintaan pengguna. Dalam banyak situasi, karena kurangnya model konseptual yang diterima baik untuk aplikasi data warehouse, desainer
melewatkan tahap desain konseptual dan menggunakan representasi logis berdasarkan skema bintang dan / atau skema kepingan salju. Selanjutnya desain fisik mempertimbangkan fasilitas yang disediakan oleh DBMS yang ada untuk melakukan penyimpanan, pengindeksan, dan manipulasi data yang terdapat pada data warehouse.
warehouse berbeda secara signifikan dari
pengembangan sistem database
konvensional. Oleh karena itu, modifikasi terhadap metode yang dijelaskan di atas sangat penting. Sebagai contoh, tidak seperti
database konvensional, data dalam data warehouse diekstrak dari sistem beberapa sumber. Sebagai akibatnya, beberapa pendekatan untuk desain data warehouse
tidak hanya mempertimbangkan kebutuhan pengguna tetapi juga ketersediaan data. Selain itu, karena dalam banyak kasus data diambil dari berbagai sumber maka harus ditransformasikan sebelum dimuat ke dalam
data warehouse, maka perlu
dipertimbangkan selama desain data warehouse proses ekstraksi-transformasi-loading (ETL). Gambaran metode pengembangan data warehouse dapat dilihat pada Gambar 5 (Malinowski & Zimányi 2008).
Namun, pengalaman menunjukkan
Keterangan:
: Optional
M LITIAN
Taha nelitian
ini dapa nelitian
ini
ni dilakukan desain logis t-atribut yang didapat pada h
P
ni data sudah siap untuk
data warehouse. Tahap
ni melakukan konversi data n pada proses ETL kedalam
ni dilakukan setelah pembuatan house selesai. Pengujian ini ila
Tahap ketiga yang dilakukan pada pengembangan
data warehouse (Malinowski &
Gambar 5 Gambaran metode
ETODE PENE
pan yang dilakukan pada pe t dilihat pada Gambar 6. Pe
menggunakan data pada penelitian sebelumnya sehingga tahapan spesifikasi kebutuhan, proses ekstraksi, dan transformasi data tidak dilakukan.
Desain Logis
Pada tahap i terhadap atribu
ta apan sebelumnya. Dari atribut-atribut tersebut, ditentukan yang menjadi ukuran (measure) dan yang bukan ukuran ( non-measure) pada sebuah tabel fakta. Selain itu
dimensi tersebut dan skema yang terbentuk pada tahapan ini. Pada tahapan ini, terdapat beberapa perbedaan dengan penelitian sebelumnya diantaranya adalah skema yang digunakan dan kubus data yang terbentuk.
Mulai
Gambar 6 Diagram alir metode penelitian.
roses Loading
Pada tahap i dimasukkan ke
pemuatan bertujuan untuk memuat data yang terseleksi ke dalam data warehouse tujuan dan membuat indeks yang diperlukan.
Desain Fisik
Tahapan i yang dihasilka
sistem manajemen basis data MySQL.
Uji Query
Tahap i data ware
d kukan untuk melihat apakah operasi dasar OLAP berhasil diimplementasikan dan sesuai dengan informasi yang ditampilkan. Pengujian dilakukan dengan memvisualisasikan kubus data dengan grafik dan tabel pivot.
Pembuatan Data Warehouse
Zimányi 2008).
Spesifikasi Kebutuhan
Desain Konseptual
Desain Logis
Desain Fisik Proses ETL
Selesai Uji Query
Data Warehouse Final
TAHAP II
TAHAP III TAHAP I
Mulai
Desain Logis
Proses Loading
Desain Fisik
Uji Query
Data Warehouse Final
warehouse dengan menggunakan data j
Lingkungan Pengembangan
Lingkungan pengembangan yang digunakan untuk pengembangan aplikasi OLAP adalah sebagai berikut:
Perangkat lunak yang digunakan: 1 Web server Apache Tomcat 2 MySQL versi 5.0
3 Mondrian Server 3.1.6 4 Windows XP Pro SP2 Edition 5 Schema Workbench
6 Web browser Mozilla Firefox 3.0.1 Perangkat keras yang digunakan dalam membagun sistem ini berupa komputer dengan spesifikasi:
1 Processor Intel Core Duo 2 Memory 512 MB
3 Harddisk 80 GB 4 Keyboard dan mouse
5 Monitor
HASIL DAN PEMBAHASAN
Selama ini, proses analisis data hasil penjualan masih dilakukan secara manual. Proses bisnis dari kegiatan penjualan tersebut dapat dilihat pada Lampiran 1. Untuk memesan produk surta pengguna harus mengisi lembar pesanan yang disediakan di loket penjualan. Bentuk lembar pemesanan dapat dilihat pada Lampiran 2. Kemudian staf pelayanan mencatat data penjualan tersebut dengan menggunakan Microsoft Office Excel, hasilnya dapat dilihat pada Lampiran 3. Untuk membuat laporan masih dilakukan
query manual pada tiap tabel data di Microsoft Office Excel. Contoh laporan yang dihasilkan dapat dilihat pada Lampiran 4. Dalam proses bisnis di atas, data yang tercatat memiliki atribut-atribut terbatas dan tidak konsisten antar tahun seperti terlihat pada Lampiran 5. Hal ini membuat hasil analisis kurang akurat dan membutuhkan waktu lama.
Desain Logis
Sebelum menentukan desain logis dalam bentuk skema dengan cara memilih
atribut-atribut yang menjadi ukuran (measure) dan non ukuran (non measure), maka ditentukan terlebih dahulu atribut yang dipilih berdasarkan kebutuhan analisis data penjualan setiap pengguna. Pemilihan atribut berdasarkan subjek utama yang akan dianalisis untuk proses pengambilan keputusan sesuai dengan kebutuhan pengguna. Atribut yang digunakan dapat dilihat pada Tabel 1 sedangkan kebutuhan analisis data penjualan setiap pengguna dapat dilihat pada Tabel 2. Jumlah lembar dipilih sebagai measure untuk mengetahui jumlah lembar produk yang terjual pada bulan dan tahun tertentu sedangkan jumlah harga, dipilih sebagai measure untuk mengetahui jumlah rupiah yang diperoleh dari penjualan produk pada bulan dan tahun tertentu.
Tabel 1 Atribut hasil analisis dan deskripsi tiap atribut (Nurhasanah 2009) pen ualan produk surta Bakosurtanal mulai
tahun 2002 sampai tahun 2007.
Atribut Deskripsi
Tanggal Tanggal pemesanan
Kualifikasi Nama kualifikasi
Jenis data Nama jenis data
Skala Nilai skala
Jumlah lembar Menyatakan jumlah lembar
Jumlah harga Menyatakan jumlah harga
Tabel 2 Kebutuhan analisis data penjualan setiap pengguna (Nurhasanah 2009) Pengguna Kebutuhan Frekuensi Kepala
Pengguna Kebutuhan Frekuensi jumlah hasil penjualan
Hasil analisis data ditentukan satu tabel uk) dan empat dimensi ta, waktu, dan skala).
mensi ditentukan diperlukan beserta ng membentuknya. Dimensi
isusun dalam tiga level yaitu
tahun a
me
fisik nama dan deskripsi dimensi
Tabel 3 Nama dan deskripsi dimensi dari Jumlah Penj
dan dapat dilihat pada Gambar 7 disertai dengan perbandingan skema yang digunakan pada penelitian sebelumnya yaitu skema galaksi yang dapat dilihat pada Gambar 8.
Proses Loading
Proses ekstraksi dan transformasi data telah dilakukan pada penelitian sebelumnya sehingga proses yang dilakukan pada tahapan ini hanya proses pemuatan data (loading). Proses pemuatan data tetap dilakukan karena terdapat perbedaan OLAP server yang digunakan. Data yang sudah siap digunakan untuk pembuatan data warehouse dimuat ke kubus data OLAP
server Mondrian dengan format .xml.
Desain Fisik
Desain
dari kubus Jumlah Penjualan dapat dilihat pada Tabel 3.
kubus ualan
Nama Dimensi Deskripsi
fakta (penjualan_prod (kualifikasi, jenis da
Untuk masing-masing di Waktu Bulan dan tahun
pemesanan Jenis_data
tingkat perincian yang hierarki ya
waktu dapat d
Nama jenis produk Kualifikasi Kualifikasi pemesan Skala
> triwulan > bulan. Dimensi jenis dat miliki dua level yaitu nama unit kerja dan nama data. Dimensi kualifikasi memiliki satu level yaitu jenis kualifikasi. Dimensi skala memiliki satu level yaitu skala. Model hierarki setiap dimensi dapat dilihat pada Lampiran 6 sedangkan data dalam tabel dimensi dapat dilihat pada Lampiran 7. Skema yang digunakan yaitu skema bintang
Nilai skala
Jml_harga harga) ma uku
penjualan dan harga_penjualan (Nurhasanah
Gambar 8 Skema an tabel fakta lembar_
2009).
Uji
surta yang lebih rinci. Misalnya untuk mengetahui jumlah lembar pada masing-masing jenis data. Implementasi drill down dapat dilihat pada Lampiran 9.
• Operasi Slice dan dice dilakukan melihat keadaan jumlah lembar dan jumlah harga hasil penjualan pada waktu tertentu, jenis data dan skala tertentu atau kualifikasi tertentu. Implementasi hasil operasi slice
dapat dilihat pada Lampiran 10 sedangkan untuk operasi dice dapat dilihat pada Lampiran 11 .
K AN
K
Pemba rehouse
dan OLAP berbasi njualan peta
B , proses ualan
p tida ecara
m anal bih
aku pat di gai
f an tampila am berbagai
b afik dan le.
Dikembangkan aplikasi untuk integrasi basis data penjualan dari masing-masing
outlet sehingga data warehouse yang dibuat mencakup informasi mengenai jumlah hasil penjualan dari masing-masing lokasi outlet.
DAFTAR PUSTAKA
Bouman R, Doungen J. 2009. Pentaho Solutions: Business Intellegence and Data Warehousing with Pentaho and MySQL. Indianapolis : Wiley Publishing, Inc.
Han J, Kamber M. 2006. Data Mining : Concepts and Techniques. San ansisco
isher.
Malinowski E, Zimányi E. 2008. Advance Data Warehouse Design. Berlin: Springer galaksi deng
Query
Implementasi operasi-operasi OLAP yaitu:
• Operasi roll up pada waktu, yaitu triwulan (roll up) ke tahun. Contoh
roll up untuk mengetahui jumlah lembar tiap tahun. Roll up dimensi waktu dari tingkat triwulan menjadi tingkat tahun untuk mengetahui jumlah lembar produk surta yang terjual per tahun. Implementasi roll up dapat dilihat pada Lampiran 8. • Operasi drill down dilakukan untuk
mengetahui jumlah lembar dan jumlah harga hasil penjualan produk
ESIMPULAN DAN SAR esimpulan
Dengan ngunan data wa
s web data pe akosurtanal
roduk surta
analisis hasil penj k lagi dilakukan s anual. Hasil
rat dan da
isis yang dihasilkan le sajikan dalam berba
ormat d n seperti dal
entuk gr engambil nformasi pen
dalam bentuk .xls fi
tusan dapat melih an denga
apat di nformasi dia
sewaktu-waktu kare elalui web
S
Nurhasanah S. 2009. Prototipe Data Warehouse Data Penjualan Produk BAKOSURTANAL [Skripsi]. Bogor: Departemen Ilmu Komputer, FMIPA, Institut Pertanian Bogor.
Sulistyaningsih W. 2010. Pembangunan Data Warehouse Akademik (Studi Kasus: Kurikulum Mayor-Minor Program Sarjana Departemen Ilmu Komputer IPB)
[Skripsi]. Bogor: Departemen Ilmu Komputer, FMIPA, Institut Pertanian Bogor.
ran
LAPORAN PENJUALAN DATA PRODUK BAKOSURTANAL BULAN : DESEMBER
TAHUN : 2006
S K A L A JUMLAH
NO. TANGGAL PEMESAN INSTANSI Pembelian Kualifikasi ALAMAT DAERAH
1:25.000 1:50.000 1:250.000 1:500.000
1:1.000.000 ATLAS
LBR.
HARGA
1 01-12-06 Mega Gracia Perorangan LANGSUNG Perorangan Jakarta Jawa 2 2
40,000
2 01-12-06 Tirto PDAM Kab.
Pacitan FAX Negeri
Jl. Suryo Pranoto No. 2 Pacitan Jatim
Jawa 2 2
9 01-12-06 Ridwan
PT. Bhumi
11 01-12-06 Bukhari Perorangan LANGSUNG Perorangan Jl. Gardu Raya
13 01-12-06 Apris CV. Techno LANGSUNG Nusra 6 6 Daryanto Outlet Bapp
Jateng FAX Outlet
Jl. P
18 01-12-06 Wening Perorangan LANGSUNG Perorangan No. 29 Depok Digital
Lampung 2 2
20 01-12-06 Tukiman Perorangan LANGSUNG Perorangan a Jaka
ong Aceh 12 12 PT. Sarana Ek
LANGSUNG Swasta Jl. Buncit R Jaka Ary PT. Kalpata
Investama LANGSUN Swas
Lampiran 4 Lanjutan
RTANAL TERHADAP PNBP
JUMLAH (RP)
KONTRIBUSI PUSAT-PUSAT DI BAKOSU BULAN : DESEMBER 2007
NO NAMA PUSAT
1 PUSAT ATLAS 3,725,000
2 PDKK 1,936,000
3 PDRTR 233,191,000
4 PGG 1,400,000
5 PSSAD 1,335,000
6 PUSJASINFO 5,435,000
Lampiran 4 Lanjutan
REKAP PENJUALAN DATA PRODUK BAKOSURTANAL
BULAN : DESEMBER 2007
NO. URAIAN JML. LEMBAR
PUSAT ATLAS
1 ATLAS 51
2 CD ATLAS ELEKTRONIK 11
3 INDONESIA FROM SPACE 2
4 BALI FROM SPACE 1
5 LOMBOK FROM SPACE 1
6 BANTEN FROM SPACE 1
PDRTR
1 BALI 8
2 DATA DIGITAL 237
3 IRIAN 98
4 JAWA 1,806
5 KALIMANTAN 877
6 NUSRA 322
7 MALUKU 19
8 SULAWESI 529
9 SUMATERA 313
10 PETA FOTO 6
PUSJASINFO
1 PLOT PETA 33
2 BUKU PANDUAN MEMBACA PETA 7
PDKK
1 LLN 25
2 LPI 20
PSSAD
1 REPPROT 5
PGG
1 Titik GPS 6
2 Titik TTG 21
3 BUKU PANDUAN DATUM 1
4 BUKU PASUT 2007 1
5 RAW DATA 5
ibut data penjualan tahun 2002 – 2007
004 2005 2006 2007
Lampiran 5 Atribut-atr
Nama Atribut 2002 2003 2
Tanggal 9 9 9 9 9 9
Instansi 9 9 9 9 9 9
Cara Order - - 9 9 9 9
Kualifikasi - - 9 9 9 9
Alamat 9 9 9 9 9 9
Daerah 9 9 9 9 9 9
Skala 9 9 9 9 9 9
Jumlah Lembar 9 9 9 9 9 9
Lampiran 6 Model hierarki tiap dimensi
a M ensi wa
Model hierarki dimensi jenis data
Model hierarki dimensi kualifikasi
Model hierarki dimensi skala odel hierarki dim ktu
b
c
d
At PDRTR Pusjasinfo PDKK PSDAD PGG Sisjar PSDAL
NTB from space
Indeks Atlas
Buku Atlas Sulawesi Sumatera
Peta Foto
Plot Peta
Indeks Peta Buku Cakupan
LPI
LLN LBI Peta Tematik
Peta Propinsi
Peta Neraca Titik TTG Titik GPS
Data Pasut
Buku SNI Buku Spesifikasi
Basisdata
Buku Integrasi Neraca SDA las
All All
Jenis Data Unit Kerja
1:25.000 1:50.000 1:250.000 1:500.000 1:1.000.000 Atlas All
All
Lampiran 7 Data dalam tabel dimensi
a Data dimensi waktu
id_waktu tahun triwulan bulan
1 2002 Triwulan I 2002 Jan-2002
2 2002 Triwulan I 2002 Feb-2002
3 2002 Triwulan I 2002 Mar-2002
4 2002 Triwulan II 2002 Apr-2002
5 2002 Triwulan II 2002 May-2002
6 2002 Triwulan II 2002 Jun-2002
7 2002 Triwulan III 2002 Jul-2002
8 2002 Triwulan III 2002 Aug-2002
9 2002 Triwulan III 2002 Sep-2002
10 2002 Triwulan IV 2002 Oct-2002
11 2002 Triwulan IV 2002 Nov-2002
12 2002 Triwulan IV 2002 Dec-2002
13 2003 Triwulan I 2003 Jan-2003
14 2003 Triwulan I 2003 Feb-2003
15 2003 Triwulan I 2003 Mar-2003
16 2003 Triwulan II 2003 Apr-2003
17 2003 Triwulan II 2003 May-2003
18 2003 Triwulan II 2003 Jun-2003
19 2003 Triwulan III 2003 Jul-2003
20 2003 Triwulan III 2003 Aug-2003
21 2003 Triwulan III 2003 Sep-2003
22 2003 Triwulan IV 2003 Oct-2003
23 2003 Triwulan IV 2003 Nov-2003
24 2003 Triwulan IV 2003 Dec-2003
25 2004 Triwulan I 2004 Jan-2004
26 2004 Triwulan I 2004 Feb-2004
27 2004 Triwulan I 2004 Mar-2004
28 2004 Triwulan II 2004 Apr-2004
29 2004 Triwulan II 2004 May-2004
30 2004 Triwulan II 2004 Jun-2004
31 2004 Triwulan III 2004 Jul-2004
32 2004 Triwulan III 2004 Aug-2004
33 2004 Triwulan III 2004 Sep-2004
34 2004 Triwulan IV 2004 Oct-2004
35 2004 Triwulan IV 2004 Nov-2004
36 2004 Triwulan IV 2004 Dec-2004
37 2005 Triwulan I 2005 Jan-2005
38 2005 Triwulan I 2005 Feb-2005
39 2005 Triwulan I 2005 Mar-2005
40 2005 Triwulan II 2005 Apr-2005
41 2005 Triwulan II 2005 May-2005
42 2005 Triwulan II 2005 Jun-2005
43 2005 Triwulan III 2005 Jul-2005
44 2005 Triwulan III 2005 Aug-2005
Lampiran 7 Lanjutan
Triwulan IV 2005 Nov-2005
47 2005
48 2005 Triwulan IV 2005 Dec-2005
49 2006 Triwulan I 2006 Jan-2006
50 2006 Triwulan I 2006 Feb-2006
51 2006 Triwulan I 2006 Mar-2006
52 2006 Triwulan II 2006 Apr-2006
53 2006 Triwulan II 2006 May-2006
54 2006 Triwulan II 2006 Jun-2006
55 2006 Triwulan III 2006 Jul-2006
56 2006 Triwulan III 2006 Aug-2006
57 2006 Triwulan III 2006 Sep-2006
58 2006 Triwulan IV 2006 Oct-2006
59 2006 Triwulan IV 2006 Nov-2006
60 2006 Triwulan IV 2006 Dec-2006
61 2007 Triwulan I 2007 Jan-2007
62 2007 Triwulan I 2007 Feb-2007
63 2007 Triwulan I 2007 Mar-2007
64 2007 Triwulan II 2007 Apr-2007
65 2007 Triwulan II 2007 May-2007
66 2007 Triwulan II 2007 Jun-2007
67 2007 Triwulan III 2007 Jul-2007
68 2007 Triwulan III 2007 Aug-2007
69 2007 Triwulan III 2007 Sep-2007
70 2007 Triwulan IV 2007 Oct-2007
71 2007 Triwulan IV 2007 Nov-2007
72 2007 Triwulan IV 2007 Dec-2007
b Data dimens ikasi
id_ lifikasi ku
i kualif
kua alifikasi
1 Swasta 2 Negeri 3 Perorangan 4 Mahasiswa 5 Outlet 6 Tidak ada keterangan
c Da imensi
id_ la
ta d skala
ska skala
1 1:25.000 2 1:50.000 3 1:250.000 4 1:500.000 5 1:1.000.000
Lampiran 7 Lanjutan
d D imensi data
id_ unit_kerja
ata d jenis_
data nama data
1 NTB fromSpace Atlas
2 Indeks Atlas Atlas
3 Buku Atlas Atlas
4 Bali From Space Atlas
5 PETA WAC PDKK
6 Peta Jalur Penerbangan PDKK
7 LPI PDKK
8 LLN PDKK
9 LBI PDKK
10 Timor Timur PDRTR
11 Sumatera PDRTR
12 Sulawesi PDRTR
13 Peta Indonesia PDRTR
14 Peta Foto PDRTR
15 Peta Dinding PDRTR
16 Nusa Tenggara PDRTR
17 Maluku PDRTR
18 Kalimantan PDRTR
19 Jawa PDRTR
20 Irian Jaya PDRTR
21 Data Digital PDRTR
22 Bali PDRTR
23 Aceh PDRTR
24 Peta Dunia PDRTR
25 Peta ASEAN PDRTR
26 Foto Udara PDRTR
27 Titik TTG PGG
28 Titik GPS PGG
29 Data Pasut PGG
30 Buku PrediksiPasut PGG
31 Buku Panduan GPS PGG
32 Buku Panduan Datum PGG
33 Buku JaringanKontrol PGG
34 Buku Data Kota PGG
35 Spek Basis Data Neraca Sumberdaya Lahan PSDAD
36 REPPORT PSDAD
37 Peta Tematik PSDAD
38 Peta si Propin PSDAD
39 atalog K Data Tematik PSDAD
40 Digital Sistem Lahan Jatim PSDAD
41 Buku Spek Teknis Nilai Ekonomi Sumberdaya Air PSDAD
42 Buku Satuan Lahan PSDAD
43 eta P Neraca PSDAL
Pusjasinfo Lampiran 7 Lanjutan
47 Indeks Peta
48 Buku Cakupan Pusjasinfo
49 Buku Spesifikasi Basisdata Sisjar
Lampiran 8 Grafik hasil operasi roll up jumlah produk surta yang terjual per tahun
Lampiran 9 Grafik hasil operasi drill dwon jumlah produk surta yang terjual per jenis data
Lampiran 10 Grafik hasil operasi slice jumlah lembar penjualan produk surta pada dimensi waktu dan dimensi skala
Lampiran 11 Grafik hasil operasi dice jumlah lembar penjualan produk surta pada dimensi waktu , jenis data, dan kualifikasi tertentu
dice juml ng terjual
pada pusat AD pada
Tahun 2004 dengan
kualifikasi pembeli Swasta ah produk surta ya
ABSTRACT
RIKA INDRIANI. Data Warehouse Sale Prototype of Bakosurtanal Product. Supervised by HARI AGUNG ADRIANTO.
Speeding up reporting process and obtaining strategic information based on a multidimensional analysis query can be done by building OLAP applications integrated with data warehouse. Development of data warehouse Bakosurtanal product sales data and web-based OLAP applications has been done using Palo. Palo is one of the OLAP server with multidimensional data storage model (MOLAP). Mondrian is an OLAP server with relational data storage model (ROLAP)
This research aims to develop a data warehouse and wab-based OLAP using Mondrian 3.1.6. This research designs the data warehouse using star scheme and OLAP development. This research produces a web-based OLAP cube consisting of one data cube: sales of products and four dimensions: time, type of data, qualification, and scale. Users can interact with the following facilities: 1) Selecting dimensions to display the information at the level needed, 2) Displaying information in the form of bar charts, stacked bar, line charts, line charts, stacked area, and pie charts 3) Exporting files into Microsoft Excel format. Users can explore this application using OLAP operations including roll-up, drill-down, slice, dice, etc.
PENDAHULUAN Latar Belakang
Badan Koordinasi Survei dan Pemetaan Nasional (Bakosurtanal) merupakan Lembaga Pemerintah Non Departemen yang bertugas melaksanakan survei dan pemetaan sesuai dengan ketentuan peraturan perundang-undangan yang berlaku. Dalam hal tersebut, Bakosurtanal mempunyai kewenangan menyediakan informasi spasial kedalam suatu produk survei dan pemetaan (surta) berupa peta atau atlas dalam berbagai format, jenis dan skala. Untuk itu, Bakosurtanal menjadi titik tumpu dalam pelaksanaan pendistribusian dan pelayanan produk surta kepada pengguna dalam berbagai kalangan.
Perolehan produk surta dapat dilakukan secara langsung atau tertulis (melalui surat/ faksimili). Untuk pembelian secara langsung, pengguna harus mengisi formulir pesanan (Form-LP) yang disediakan di loket penjualan. Setelah terjadi transaksi, petugas unit pelayanan mencatat data penjualan tersebut menggunakan Microsoft Office Excel. Pengolahan data yang disajikan dalam bentuk laporan penjualan masih dilakukan dengan query manual pada setiap tabel data penjualan yang tersimpan di Microsoft Office Excel. Laporan tersebut disesuaikan dengan kebutuhan pengguna. Dengan proses tersebut, data yang tercatat memiliki atribut-atribut terbatas dan tidak konsisten antar tahun. Hal tersebut menyebabkan tingkat akurasi rendah terhadap hasil analisis data penjualan dan membutuhkan waktu yang lama.
Untuk mempercepat proses pelaporan dan memperoleh informasi yang strategis
berdasarkan query analisis yang
multidimensi, dapat dilakukan dengan membangun aplikasi OLAP yang diintegrasikan dengan data warehouse.
Pembangunan data warehouse data
penjualan produk Bakosurtanal dan aplikasi OLAP berbasis web telah dilakukan pada penelitian sebelumnya (Nurhasanah 2009) dengan menggunakan Palo. Palo merupakan salah satu OLAP server dengan model penyimpanan data multidimensi (MOLAP) sehingga jumlah volume data yang dapat ditangani terbatas. Saat ini banyak OLAP
server yang dikembangkan dan bersifat open source salah satunya adalah Mondrian (http://mondrian.pentaho.org/). Mondrian merupakan OLAP server dengan model
penyimpanan data relasional (ROLAP) yang dikembangkan dengan Java dan memungkinkan penguna menganalisis dataset yang disimpan di database secara interaktif. Selain terdapat perbedaan pada OLAP server yang digunakan, skema pada penelitian ini juga berbeda dengan penelitian sebelumnya. Pada penelitian sebelumnya, skema yang digunakan adalah skema galaksi sedangkan pada penelitian kali ini digunakan skema bintang. Hal tersebut terjadi karena setelah dilakukan pengkajian lebih lanjut, terdapat redudansi data pada penelitian sebelumnya yang menggunakan skema galaksi.
Tujuan
Penelitian ini bertujuan untuk membangun suatu sistem data warehouse
yang dapat mendukung analisis penjualan produk sesuai dengan kebutuhan pengguna.
Ruang Lingkup
Ruang lingkup penelitian ini adalah: 1 Penelitian ini akan menghasilkan
prototipe data warehouse dan aplikasi OLAP berbasis web. Data tersebut dilakukan analisis menggunakan OLAP
server Mondrian.
2 Data yang digunakan adalah data penjualan produk survei dan pemetaan Bakosurtanal tahun 2002 sampai dengan 2007.
Manfaat
Hasil penelitian yang diperoleh diharapkan dapat mendukung pengambilan keputusan yang strategis untuk mencapai tujuan bisnis (meningkatkan mutu produk, meningkatkan layanan konsumen, meningkatkan penjualan, dll) yang didapat secara informatif, cepat dan akurat.
TINJAUAN PUSTAKA
Data warehouse
Data warehouse menyediakan arsitektur dan alat bagi para eksekutif bisnis untuk mengatur secara sistematis, mengerti, dan menggunakan data dalam membuat keputusan strategis.
PENDAHULUAN Latar Belakang
Badan Koordinasi Survei dan Pemetaan Nasional (Bakosurtanal) merupakan Lembaga Pemerintah Non Departemen yang bertugas melaksanakan survei dan pemetaan sesuai dengan ketentuan peraturan perundang-undangan yang berlaku. Dalam hal tersebut, Bakosurtanal mempunyai kewenangan menyediakan informasi spasial kedalam suatu produk survei dan pemetaan (surta) berupa peta atau atlas dalam berbagai format, jenis dan skala. Untuk itu, Bakosurtanal menjadi titik tumpu dalam pelaksanaan pendistribusian dan pelayanan produk surta kepada pengguna dalam berbagai kalangan.
Perolehan produk surta dapat dilakukan secara langsung atau tertulis (melalui surat/ faksimili). Untuk pembelian secara langsung, pengguna harus mengisi formulir pesanan (Form-LP) yang disediakan di loket penjualan. Setelah terjadi transaksi, petugas unit pelayanan mencatat data penjualan tersebut menggunakan Microsoft Office Excel. Pengolahan data yang disajikan dalam bentuk laporan penjualan masih dilakukan dengan query manual pada setiap tabel data penjualan yang tersimpan di Microsoft Office Excel. Laporan tersebut disesuaikan dengan kebutuhan pengguna. Dengan proses tersebut, data yang tercatat memiliki atribut-atribut terbatas dan tidak konsisten antar tahun. Hal tersebut menyebabkan tingkat akurasi rendah terhadap hasil analisis data penjualan dan membutuhkan waktu yang lama.
Untuk mempercepat proses pelaporan dan memperoleh informasi yang strategis
berdasarkan query analisis yang
multidimensi, dapat dilakukan dengan membangun aplikasi OLAP yang diintegrasikan dengan data warehouse.
Pembangunan data warehouse data
penjualan produk Bakosurtanal dan aplikasi OLAP berbasis web telah dilakukan pada penelitian sebelumnya (Nurhasanah 2009) dengan menggunakan Palo. Palo merupakan salah satu OLAP server dengan model penyimpanan data multidimensi (MOLAP) sehingga jumlah volume data yang dapat ditangani terbatas. Saat ini banyak OLAP
server yang dikembangkan dan bersifat open source salah satunya adalah Mondrian
penyimpanan data relasional (ROLAP) yang dikembangkan dengan Java dan memungkinkan penguna menganalisis dataset yang disimpan di database secara interaktif. Selain terdapat perbedaan pada OLAP server yang digunakan, skema pada penelitian ini juga berbeda dengan penelitian sebelumnya. Pada penelitian sebelumnya, skema yang digunakan adalah skema galaksi sedangkan pada penelitian kali ini digunakan skema bintang. Hal tersebut terjadi karena setelah dilakukan pengkajian lebih lanjut, terdapat redudansi data pada penelitian sebelumnya yang menggunakan skema galaksi.
Tujuan
Penelitian ini bertujuan untuk membangun suatu sistem data warehouse
yang dapat mendukung analisis penjualan produk sesuai dengan kebutuhan pengguna.
Ruang Lingkup
Ruang lingkup penelitian ini adalah: 1 Penelitian ini akan menghasilkan
prototipe data warehouse dan aplikasi OLAP berbasis web. Data tersebut dilakukan analisis menggunakan OLAP
server Mondrian.
2 Data yang digunakan adalah data penjualan produk survei dan pemetaan Bakosurtanal tahun 2002 sampai dengan 2007.
Manfaat
Hasil penelitian yang diperoleh diharapkan dapat mendukung pengambilan keputusan yang strategis untuk mencapai tujuan bisnis (meningkatkan mutu produk, meningkatkan layanan konsumen, meningkatkan penjualan, dll) yang didapat secara informatif, cepat dan akurat.
TINJAUAN PUSTAKA
Data warehouse
Data warehouse menyediakan arsitektur dan alat bagi para eksekutif bisnis untuk mengatur secara sistematis, mengerti, dan menggunakan data dalam membuat keputusan strategis.
pemrosesan informasi dengan menyediakan suatu platform yang kokoh untuk analisis data yang mengandung histori dan terkonsolidasi.
Data warehouse mempunyai
karakteristik berorientasi subjek, terintegrasi, time variant dan non volatile. Hal tersebut tersebut membedakan data warehouse dengan sistem penyimpanan data lainnya, berikut adalah penjelasan dari masing-masing karakteristik (Han & Kamber 2006):
• Orientasi subjek
Data warehouse diorganisasikan pada subjek-subjek utama seperti halnya konsumen, pemasok, produk dan penjualan. Dibandingkan dengan berkonsentrasi terhadap kegiatan operasi keseharian dan proses transaksi dari suatu organisasi, data warehouse fokus terhadap pembentukan model data dan analisis data untuk pengambilan keputusan. Karena itu data warehouse
biasanya menyediakan pola pandang yang sangat mudah terhadap beberapa subjek yang ada dengan menghilangkan data yang tidak berguna pada proses pengambilan keputusan.
• Terintegrasi
Data warehouse biasanya terbentuk dengan melakukan integrasi terhadap data yang berbeda seperti halnya basis data relasional, flat file dan catatan transaksi online. Teknik data cleaning
dan integrasi data diterapkan untuk memastikan konsistensi dalam hal keseragaman penamaan, struktur pengkodean, pengukuran atribut dan hal lainnya.
• Time variant
Data disimpan untuk menyediakan informasi dari perspektif historical
(seperti 5-10 tahun kebelakang). Setiap struktur kunci pada data warehouse
mengandung elemen waktu baik itu secara implisit ataupun eksplisit.
• Non volatile
Data terpisah dari data operasional sehingga tidak membutuhkan suatu proses transaksi, recovery, dan mekanisme kontrol konkurensi akan tetapi hanya membutuhkan dua operasi
dalam mengakses data yaitu pemasukan data pertama dan pengaksesan data.
Model Data Multidimensi
Data warehouse didasarkan pada suatu model data multidimensi. Model ini melihat data dalam bentuk kubus data. Kubus data memungkinkan data yang akan dimodelkan dan dilihat dalam multidimensi. Hal tersebut didefinisikan oleh dimensi dan fakta.
Dalam istilah umum, Dimensi adalah perspektif atau entitas yang digunakan sebagai tempat menyimpan beberapa record
yang saling berhubungan. Masing-masing dimensi memiliki sebuah tabel yang terkait dengannya, disebut sebagai tabel dimensi.
Fakta adalah ukuran-ukuran numerik. Fakta merupakan kuantitas yang akan dianalisis hubungan antar dimensi. Tabel fakta berisi nama dari fakta (ukuran) dan
keys dari tabel dimensi yang bersangkutan. Untuk menggambarkan hubungan antar data pada data multidimensi digunakan skema multidimensi. Pada data warehouse, skema merupakan sekumpulan tabel yang berhubungan. Skema digunakan untuk menunjukkan hubungan antara tabel dimensi dengan tabel fakta. Skema ditentukan berdasarkan kebutuhan data warehouse dan keinginan pembuat data warehouse. Data warehouse membutuhkan skema yang ringkas dan berorientasi subjek. Tipe-tipe skema multidimensi antara lain (Han & Kamber 2006):
1 Skema bintang (star schema)
Skema bintang adalah skema data warehouse yang paling umum. Skema bintang merupakan struktur logikal yang memiliki tabel fakta yang terdiri atas data faktual ditengahnya, dan dikelilingi oleh tabel-tabel dimensi yang berisi referensi data.
Keuntungan yang didapat jika menggunakan skema ini adalah peningkatan kinerja data warehouse, pemrosesan query
yang lebih efisien, dan waktu respon yang cepat. Bentuk skema bintang dapat dilihat pada Gambar 1.
2 Skema kepingan salju (snowflake schema)
Gambar 1 Skema bintang (Han & Kamber 2006).
Perbedaan utama antara model kepingan salju dan skema bintang adalah bahwa tabel dimensi dari model kepingan salju dapat disimpan dalam bentuk normalisasi untuk mengurangi redudansi. Selanjutnya, struktur kepingan salju dapat menghemat penggunaan memori, tapi waktu yang dibutuhkan untuk pemrosesan query menjadi lebih lama akibatnya kinerja sistem dapat berdampak buruk. Bentuk skema kepingan salju dapat dilihat pada Gambar 2.
Gambar 2 Skema kepingan salju (Han & Kamber 2006).
3 Skema galaksi (fact constellation) Aplikasi canggih mungkin memerlukan beberapa tabel fakta untuk berbagi tabel dimensi. Skema semacam ini dapat dilihat sebagai kumpulan bintang, dan karenanya disebut skema galaksi atau konstelasi fakta. Keuntungan menggunakan skema ini adalah menghemat memori dan mengurangi kesalahan yang mungkin terjadi. Bentuk skema galaksi dapat dilihat pada Gambar 3.
Gambar 3 Skema galaksi (Han & Kamber 2006).
Operasi-operasi pada OLAP
Dalam model multidimensi, data tersebut akan disusun dalam berbagai dimensi, dan masing-masing dimensi berisi beberapa tingkat abstraksi yang didefinisikan oleh konsep hierarki. Hal tersebut memberikan fleksibilitas bagi pengguna untuk melihat data dari perspektif yang berbeda. Sejumlah operasi OLAP pada kubus data yang ada untuk mewujudkan perspektif yang berbeda, memungkinkan query interaktif dan analisis data. Oleh karena itu, OLAP menyediakan lingkungan yang user-friendly untuk analisis data secara interaktif. Beberapa operasi OLAP dijelaskan berikut ini (Han & Kamber 2006):
• Roll up (drill up): roll up dilakukan dengan cara menaikkan tingkat hierarki atau mereduksi jumlah dimensi.
• Drill down: drill down merupakan kebalikan dari roll up. Operasi ini merepresentasikan data secara lebih detail.
• Pivot (rotate): merotasikan sumbu data untuk memberikan alternatif dalam presentasi data.
• Slice and Dice: slice melakukan seleksi pada satu dimensi kubus sehingga menghasilkan subcube. Dice merupakan proses mendefinisikan subcube dengan memilih dua atau lebih dimensi.
• Pivot (rotate): memvisualisasikan operasi yang merotasikan sumbu data sebagai alternatif dalam presentasi data.
Pemodelan Penyimpanan Data
fisik dan implementasi OLAP server harus mempertimbangkan masalah penyimpanan data. Implementasi dari sebuah server data warehouse untuk pemrosesan OLAP meliputi (Bouman & Doungen 2009):
MOLAP
Multidimensional online analitycal processing (MOLAP) menyimpan data dan aggregasi pada struktur data multidimensi. Struktur MOLAP ini tidak tersimpan pada
data warehouse tapi tersimpan pada OLAP
server, sehingga performa query yang dihasilkan olehnya sangat bagus. Model penyimpanan ini sesuai untuk database
dengan ukuran kecil sampai sedang.
ROLAP
Relational online analitycal processing
(ROLAP) menggunakan tabel pada
relational database untuk menyimpan detail data dan aggregasi kubus. Berbeda dengan MOLAP, ROLAP tidak menyimpan salinan
database tapi mengakses langsung pada tabel fakta ketika membutuhkan jawaban sebuah query, sehingga query pada ROLAP mempunyai response time yang lebih lambat dibandingkan MOLAP maupun HOLAP. Karakteristik model ini digunakan untuk menyimpan data yang besar dan jarang dilakukannya proses query. Misalkan, data histori dalam jumlah besar dari beberapa tahun yang sebelumnya.
HOLAP
Hybrid OLAP, Menggabungkan
teknologi ROLAP dan MOLAP. HOLAP menggabungkan kelebihan-kelebihan yang ada pada keduanya, skalabilitas yang lebih besar dari ROLAP dan perhitungan yang lebih cepat dari MOLAP. HOLAP menggunakan relational database untuk menyimpan detil data dan menggunakan
multidimentional database untuk menyimpan agregasinya.
Arsitektur Komponen OLAP Pentaho
Mondrian merupakan aplikasi server
OLAP berbasis open source yang sangat populer dan saat ini bernaung di bawah Pentaho Corporation. Proyek Mondrian ini merupakan kombinasi yang sangat baik dengan JPivot - interface berbasis web yang juga merupakan proyek open source. Gambar 2 menunjukkan gambaran semantik dari komponen Pentaho Analysis Services
dan hubungan diantara komponen tersebut. Urutan peristiwa pada Gambar 4
menjelaskan apa yang terjadi ketika pengguna menggunakan aplikasi Pentaho OLAP (Bouman & Doungen 2009).
1 Pengguna web browser menggunakan sebuah HTTP request untuk melihat,
browse atau drill down kedalam tabel pivot OLAP
2 JPivot servlet menerima request dari pengguna dan menerjemahkan request
tersebut kedalam sebuah MDX query. MDX query ini kemudian dikirmkan ke Mondrian engine
3 Mondrian menginterpretasikan MDX
query dan menerjemahkannya kedalam satu atau lebih SQL query. Teknik khusus ini disebut sebagai ROLAP, yang merupakan singkatan dari
Relational OLAP
4 Relational Database Management System (RDBMS) mengeksekusi query
yang diberikan oleh Mondrian. Mondrian menerima hasil query dalam bentuk tabular (relational)
5 Mondrian memproses hasil yang
diterima dari RDBMS dan menerjemahkannya kedalam result-set
multidimensi. Ini sebenarnya adalah hasil query MDX dari query MDX yang dikirim ke Mondrian pada langkah 2
6 JPivot menggunakan hasil
multidimensi untuk membuat halaman HTML menampilkan data. Inilah yang kemudian dikirim ke browser untuk ditunjukkan kepada pengguna
Metode Pengembangan Data Warehouse
Metode yang digunakan untuk merancang database operasional meliputi tahapan yang didefinisikan dengan baik. Tahap pertama adalah spesifikasi kebutuhan yang terdiri dari mengumpulkan permintaan pengguna ke dalam spesifikasi yang koheren dan ringkas. Tahap berikutnya, desain konseptual, desain logis, dan desain fisik yang merupakan hasil penerjemahan dari kebutuhan pengguna.
Karena data warehouse adalah database
yang khusus ditujukan untuk mendukung proses pengambilan keputusan, tahapan yang digunakan dalam desain database
konvensional diadopsi untuk pengembangan
Schema File (XML)
RDBMS
∑
Mondrian ROLAP Engine
4. Relational Result Read Metadata
<schema> <cube>
……… ∑
Edit Publish
Pentaho Schema Workbench XML Editor Pentaho Agregator Designer Metadata and Beck End
OLAP Front End
1. HTTP Request
Optimize, Publish Web Browser Crosstab
6. HTML
Gambar 4 Gambaran komponen Pentaho OLAP (Bouman & Doungen 2009).
Selama proses pengumpulan kebutuhan, pengguna di berbagai tingkat manajemen diwawancara untuk mengetahui analisis kebutuhan mereka. Spesifikasi yang diperoleh berfungsi sebagai dasar untuk membuat sebuah skema database yang mampu merespon permintaan pengguna. Dalam banyak situasi, karena kurangnya model konseptual yang diterima baik untuk aplikasi data warehouse, desainer
melewatkan tahap desain konseptual dan menggunakan representasi logis berdasarkan skema bintang dan / atau skema kepingan salju. Selanjutnya desain fisik mempertimbangkan fasilitas yang disediakan oleh DBMS yang ada untuk melakukan penyimpanan, pengindeksan, dan manipulasi data yang terdapat pada data warehouse.
warehouse berbeda secara signifikan dari
pengembangan sistem database
konvensional. Oleh karena itu, modifikasi terhadap metode yang dijelaskan di atas sangat penting. Sebagai contoh, tidak seperti
database konvensional, data dalam data warehouse diekstrak dari sistem beberapa sumber. Sebagai akibatnya, beberapa pendekatan untuk desain data warehouse
tidak hanya mempertimbangkan kebutuhan pengguna tetapi juga ketersediaan data. Selain itu, karena dalam banyak kasus data diambil dari berbagai sumber maka harus ditransformasikan sebelum dimuat ke dalam
data warehouse, maka perlu
Keterangan:
: Optional
M LITIAN
Taha nelitian
ini dapa nelitian
ini
ni dilakukan desain logis t-atribut yang didapat pada h
P
ni data sudah siap untuk
data warehouse. Tahap
ni melakukan konversi data n pada proses ETL kedalam
ni dilakukan setelah pembuatan house selesai. Pengujian ini ila
Tahap ketiga yang dilakukan pada penelitian ini adalah membuat data
pengembangan
data warehouse (Malinowski &
Gambar 5 Gambaran metode
ETODE PENE
pan yang dilakukan pada pe t dilihat pada Gambar 6. Pe
menggunakan data pada penelitian sebelumnya sehingga tahapan spesifikasi kebutuhan, proses ekstraksi, dan transformasi data tidak dilakukan.
Desain Logis
Pada tahap i terhadap atribu
ta apan sebelumnya. Dari atribut-atribut tersebut, ditentukan yang menjadi ukuran (measure) dan yang bukan ukuran ( non-measure) pada sebuah tabel fakta. Selain itu ditentukan pula dimensi beserta hierarki dari
dimensi tersebut dan skema yang terbentuk pada tahapan ini. Pada tahapan ini, terdapat beberapa perbedaan dengan penelitian sebelumnya diantaranya adalah skema yang digunakan dan kubus data yang terbentuk.
Mulai
Gambar 6 Diagram alir metode penelitian.
roses Loading
Pada tahap i dimasukkan ke
pemuatan bertujuan untuk memuat data yang terseleksi ke dalam data warehouse tujuan dan membuat indeks yang diperlukan.
Desain Fisik
Tahapan i yang dihasilka
sistem manajemen basis data MySQL.
Uji Query
Tahap i data ware
d kukan untuk melihat apakah operasi dasar OLAP berhasil diimplementasikan dan sesuai dengan informasi yang ditampilkan. Pengujian dilakukan dengan memvisualisasikan kubus data dengan grafik dan tabel pivot.
Pembuatan Data Warehouse
Zimányi 2008).
Spesifikasi Kebutuhan
Desain Konseptual
Desain Logis
Desain Fisik Proses ETL
Selesai Uji Query
Data Warehouse Final
TAHAP II
TAHAP III TAHAP I
Mulai
Desain Logis
Proses Loading
Desain Fisik
Uji Query
Data Warehouse Final
Keterangan:
: Optional
M LITIAN
Taha nelitian
ini dapa nelitian
ini
ni dilakukan desain logis t-atribut yang didapat pada h
P
ni data sudah siap untuk
data warehouse. Tahap
ni melakukan konversi data n pada proses ETL kedalam
ni dilakukan setelah pembuatan house selesai. Pengujian ini ila
Tahap ketiga yang dilakukan pada pengembangan
data warehouse (Malinowski &
Gambar 5 Gambaran metode
ETODE PENE
pan yang dilakukan pada pe t dilihat pada Gambar 6. Pe
menggunakan data pada penelitian sebelumnya sehingga tahapan spesifikasi kebutuhan, proses ekstraksi, dan transformasi data tidak dilakukan.
Desain Logis
Pada tahap i terhadap atribu
ta apan sebelumnya. Dari atribut-atribut tersebut, ditentukan yang menjadi ukuran (measure) dan yang bukan ukuran ( non-measure) pada sebuah tabel fakta. Selain itu
dimensi tersebut dan skema yang terbentuk pada tahapan ini. Pada tahapan ini, terdapat beberapa perbedaan dengan penelitian sebelumnya diantaranya adalah skema yang digunakan dan kubus data yang terbentuk.
Mulai
Gambar 6 Diagram alir metode penelitian.
roses Loading
Pada tahap i dimasukkan ke
pemuatan bertujuan untuk memuat data yang terseleksi ke dalam data warehouse tujuan dan membuat indeks yang diperlukan.
Desain Fisik
Tahapan i yang dihasilka
sistem manajemen basis data MySQL.
Uji Query
Tahap i data ware
d kukan untuk melihat apakah operasi dasar OLAP berhasil diimplementasikan dan sesuai dengan informasi yang ditampilkan. Pengujian dilakukan dengan memvisualisasikan kubus data dengan grafik dan tabel pivot.
Pembuatan Data Warehouse
Zimányi 2008).
Spesifikasi Kebutuhan
Desain Konseptual
Desain Logis
Desain Fisik Proses ETL
Selesai Uji Query
Data Warehouse Final
TAHAP II
TAHAP III TAHAP I
Mulai
Desain Logis
Proses Loading
Desain Fisik
Uji Query
Data Warehouse Final