• Tidak ada hasil yang ditemukan

Prototipe data warehouse penjualan produk bakosurtanal

N/A
N/A
Protected

Academic year: 2017

Membagikan "Prototipe data warehouse penjualan produk bakosurtanal"

Copied!
67
0
0

Teks penuh

(1)

PROTOTIPE

DATA WAREHOUSE

PENJUALAN PRODUK

BAKOSURTANAL

RIKA INDRIANI

DEPARTEMEN ILMU KOMPUTER

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

INSTITUT PERTANIAN BOGOR

(2)

PROTOTIPE

DATA WAREHOUSE

PENJUALAN PRODUK

BAKOSURTANAL

RIKA INDRIANI

Skripsi

sebagai salah satu syarat untuk memperoleh gelar

Sarjana Komputer pada

Departemen Ilmu Komputer

DEPARTEMEN ILMU KOMPUTER

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

INSTITUT PERTANIAN BOGOR

(3)

ABSTRACT

RIKA INDRIANI. Data Warehouse Sale Prototype of Bakosurtanal Product. Supervised by HARI AGUNG ADRIANTO.

Speeding up reporting process and obtaining strategic information based on a multidimensional analysis query can be done by building OLAP applications integrated with data warehouse. Development of data warehouse Bakosurtanal product sales data and web-based OLAP applications has been done using Palo. Palo is one of the OLAP server with multidimensional data storage model (MOLAP). Mondrian is an OLAP server with relational data storage model (ROLAP)

This research aims to develop a data warehouse and wab-based OLAP using Mondrian 3.1.6. This research designs the data warehouse using star scheme and OLAP development. This research produces a web-based OLAP cube consisting of one data cube: sales of products and four dimensions: time, type of data, qualification, and scale. Users can interact with the following facilities: 1) Selecting dimensions to display the information at the level needed, 2) Displaying information in the form of bar charts, stacked bar, line charts, line charts, stacked area, and pie charts 3) Exporting files into Microsoft Excel format. Users can explore this application using OLAP operations including roll-up, drill-down, slice, dice, etc.

(4)

Judul Skripsi : Prototipe Data Warehouse Penjualan Produk BAKOSURTANAL Nama : Rika Indriani

NIM : G64066039

Menyetujui:

Pembimbing,

Hari Agung Adrianto, S.Kom, M.Si NIP. 19760917 200501 1 001

Mengetahui:

Ketua Departemen Ilmu Komputer

(5)

KATA PENGANTAR

Puji dan syukur kehadirat Allah Subhanahu Wa Ta’ala yang telah memberikan rahmat, tuntunan dan kemurahan-Nya kepada penulis untuk dapat menyelesaikan penelitian ini. Akhirnya, skripsi dengan judul Prototipe Data Warehouse Penjualan Produk Bakosurtanal, yang disusun sebagai salah satu syarat untuk mengikuti ujian akhir sarjana pada Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor, dapat diselesaikan.

Dalam pengerjaan penelitian ini tentu tidak lepas dari pihak-pihak yang terus mendukung dan membantu, oleh karena itu dengan tulus penulis mengucapkan terima kasih kepada :

1. Ibu dan kakak-kakakku tercinta yang telah memberikan dukungan, do’a, semangat dan kasih sayang yang luar biasa kepada penulis sehingga dapat menyelesaikan penelitian ini. 2. Suamiku tercinta, Yusup Hendra Perkasa, ST yang selalu setia menemani dan tak pernah

lelah memberikan semangat, do’a, dukungan, cinta dan kasih sayangnya serta menjadi tempat bertukar pikiran.

3. Bapak Hari Agung Adrianto, S.Kom, M.Si., selaku pembimbing yang telah bersedia meluangkan waktu untuk memberikan bimbingan dan masukkan yang sangat bermanfaat dalam penyusunan penelitian ini.

4. Bapak Ahmad Ridha, S.Kom, M.S, dan Ibu Annisa, S.Kom, M.Kom. yang bersedia menjadi penguji pada sidang ujian akhir penulis.

5. Bapak/Ibu Dosen Institut Pertanian Bogor yang telah memberikan ilmunya pada penulis selama belajar di Institut Pertanian Bogor ini.

6. Rekan-rekan mahasiswa/i Ekstensi Ilkom Angkatan 1, terima kasih atas kebersamaan dan kerja samanya.

7. Kepada pihak lainnya yang telah memberikan kontribusi besar selama pengerjaan penelitian ini yang tidak dapat disebutkan satu-persatu, penulis ucapkan terima kasih banyak.

Akhirnya, sebagai seorang manusia biasa, penulis menyadari pasti ada kekurangan dan kelemahan yang terdapat pada penelitian ini. Untuk itu, penulis terbuka terhadap kritik dan saran dari semua pihak. Dan semoga penelitian ini dapat bermanfaat bagi kita semua. Amin.

Bogor, November 2010

(6)

RIWAYAT HIDUP

Penulis dilahirkan di Bogor pada tanggal 28 Agustus 1984. Penulis merupakan anak kelima dari lima bersaudara pasangan bapak Hapid (Alm) dan ibu Endeh Saodah. Penulis menyelesaikan program studi Diploma 3 Teknik Informatika, Departemen Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor pada tahun 2006. Kemudian pada tahun 2007, penulis diterima sebagai mahasiswi Program Sarjana Ilmu Komputer Penyelenggaraan Khusus, Departemen Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor.

(7)

DAFTAR ISI

Halaman

DAFTAR TABEL...v

DAFTAR GAMBAR ...v

DAFTAR LAMPIRAN ...v

PENDAHULUAN...1

Latar Belakang...1

Tujuan...1

Ruang Lingkup ...1

Manfaat...1

TINJAUAN PUSTAKA...1

Data warehouse ...1

Model Data Multidimensi...2

Operasi-operasi pada OLAP ...3

Pemodelan Penyimpanan Data ...3

Arsitektur Komponen OLAP Pentaho ...4

Metode Pengembangan Data Warehouse ...4

METODE PENELITIAN...6

Desain Logis...6

Proses Loading...6

Uji Query...6

Pembuatan Data Warehouse...6

Lingkungan Pengembangan ...7

HASIL DAN PEMBAHASAN ...7

Desain Logis...7

Proses Loading...8

Desain Fisik ...8

Uji Query...9

KESIMPULAN DAN SARAN ...9

Kesimpulan...9

Saran...9

DAFTAR PUSTAKA ...9

(8)

DAFTAR GAMBAR

Halaman

1 Skema bintang (Han & Kamber 2006). ...3

2 Skema kepingan salju (Han & Kamber 2006). ...3

3 Skema galaksi (Han & Kamber 2006)...3

4 Gambaran komponen Pentaho OLAP (Bouman & Doungen 2009)...5

5 Gambaran metode pengembangan data warehouse (Malinowski & Zimányi 2008) . ...6

6 Diagram alir metode penelitian . ...6

7 Skema bintang dengan tabel fakta penjualan_produk. ...8

8 Skema galaksi dengan tabel fakta lembar_penjualan dan harga_penjualan (Nurhasanah 2009)..9

DAFTAR TABEL

Halaman 1 Atribut hasil analisis dan deskripsi tiap atribut (Nurhasanah 2009) ...7

2 Kebutuhan analisis data penjualan setiap pengguna (Nurhasanah 2009) ...7

3 Nama dan deskripsi dimensi dari kubus Jumlah Penjualan ...8

DAFTAR LAMPIRAN

Halaman 1 Proses bisnis kegiatan penjualan produk surta ...11

2 Bentuk formulir pemesanan (Form-LP) ...12

3 Contoh catatan data penjualan produk Bakosurtanal...13

4 Contoh format laporan penjualan produk surta dalam bentuk grafik dan tabel...15

5 Atribut-atribut data penjualan tahun 2002 – 2007 ...18

6 Model hierarki tiap dimensi...19

7 Data dalam tabel dimensi ...20

8 Grafik hasil operasi roll up jumlah produk surta yang terjual per tahun ...24

9 Grafik hasil operasi drill dwon jumlah produk surta yang terjual per jenis data ...25

10 Grafik hasil operasi slice jumlah lembar penjualan produk surta pada dimensi waktu dan dimensi skala ...26

(9)

PENDAHULUAN Latar Belakang

Badan Koordinasi Survei dan Pemetaan Nasional (Bakosurtanal) merupakan Lembaga Pemerintah Non Departemen yang bertugas melaksanakan survei dan pemetaan sesuai dengan ketentuan peraturan perundang-undangan yang berlaku. Dalam hal tersebut, Bakosurtanal mempunyai kewenangan menyediakan informasi spasial kedalam suatu produk survei dan pemetaan (surta) berupa peta atau atlas dalam berbagai format, jenis dan skala. Untuk itu, Bakosurtanal menjadi titik tumpu dalam pelaksanaan pendistribusian dan pelayanan produk surta kepada pengguna dalam berbagai kalangan.

Perolehan produk surta dapat dilakukan secara langsung atau tertulis (melalui surat/ faksimili). Untuk pembelian secara langsung, pengguna harus mengisi formulir pesanan (Form-LP) yang disediakan di loket penjualan. Setelah terjadi transaksi, petugas unit pelayanan mencatat data penjualan tersebut menggunakan Microsoft Office Excel. Pengolahan data yang disajikan dalam bentuk laporan penjualan masih dilakukan dengan query manual pada setiap tabel data penjualan yang tersimpan di Microsoft Office Excel. Laporan tersebut disesuaikan dengan kebutuhan pengguna. Dengan proses tersebut, data yang tercatat memiliki atribut-atribut terbatas dan tidak konsisten antar tahun. Hal tersebut menyebabkan tingkat akurasi rendah terhadap hasil analisis data penjualan dan membutuhkan waktu yang lama.

Untuk mempercepat proses pelaporan dan memperoleh informasi yang strategis

berdasarkan query analisis yang

multidimensi, dapat dilakukan dengan membangun aplikasi OLAP yang diintegrasikan dengan data warehouse.

Pembangunan data warehouse data

penjualan produk Bakosurtanal dan aplikasi OLAP berbasis web telah dilakukan pada penelitian sebelumnya (Nurhasanah 2009) dengan menggunakan Palo. Palo merupakan salah satu OLAP server dengan model penyimpanan data multidimensi (MOLAP) sehingga jumlah volume data yang dapat ditangani terbatas. Saat ini banyak OLAP

server yang dikembangkan dan bersifat open source salah satunya adalah Mondrian (http://mondrian.pentaho.org/). Mondrian merupakan OLAP server dengan model

penyimpanan data relasional (ROLAP) yang dikembangkan dengan Java dan memungkinkan penguna menganalisis dataset yang disimpan di database secara interaktif. Selain terdapat perbedaan pada OLAP server yang digunakan, skema pada penelitian ini juga berbeda dengan penelitian sebelumnya. Pada penelitian sebelumnya, skema yang digunakan adalah skema galaksi sedangkan pada penelitian kali ini digunakan skema bintang. Hal tersebut terjadi karena setelah dilakukan pengkajian lebih lanjut, terdapat redudansi data pada penelitian sebelumnya yang menggunakan skema galaksi.

Tujuan

Penelitian ini bertujuan untuk membangun suatu sistem data warehouse

yang dapat mendukung analisis penjualan produk sesuai dengan kebutuhan pengguna.

Ruang Lingkup

Ruang lingkup penelitian ini adalah: 1 Penelitian ini akan menghasilkan

prototipe data warehouse dan aplikasi OLAP berbasis web. Data tersebut dilakukan analisis menggunakan OLAP

server Mondrian.

2 Data yang digunakan adalah data penjualan produk survei dan pemetaan Bakosurtanal tahun 2002 sampai dengan 2007.

Manfaat

Hasil penelitian yang diperoleh diharapkan dapat mendukung pengambilan keputusan yang strategis untuk mencapai tujuan bisnis (meningkatkan mutu produk, meningkatkan layanan konsumen, meningkatkan penjualan, dll) yang didapat secara informatif, cepat dan akurat.

TINJAUAN PUSTAKA

Data warehouse

Data warehouse menyediakan arsitektur dan alat bagi para eksekutif bisnis untuk mengatur secara sistematis, mengerti, dan menggunakan data dalam membuat keputusan strategis.

(10)

pemrosesan informasi dengan menyediakan suatu platform yang kokoh untuk analisis data yang mengandung histori dan terkonsolidasi.

Data warehouse mempunyai

karakteristik berorientasi subjek, terintegrasi, time variant dan non volatile. Hal tersebut tersebut membedakan data warehouse dengan sistem penyimpanan data lainnya, berikut adalah penjelasan dari masing-masing karakteristik (Han & Kamber 2006):

• Orientasi subjek

Data warehouse diorganisasikan pada subjek-subjek utama seperti halnya konsumen, pemasok, produk dan penjualan. Dibandingkan dengan berkonsentrasi terhadap kegiatan operasi keseharian dan proses transaksi dari suatu organisasi, data warehouse fokus terhadap pembentukan model data dan analisis data untuk pengambilan keputusan. Karena itu data warehouse

biasanya menyediakan pola pandang yang sangat mudah terhadap beberapa subjek yang ada dengan menghilangkan data yang tidak berguna pada proses pengambilan keputusan.

• Terintegrasi

Data warehouse biasanya terbentuk dengan melakukan integrasi terhadap data yang berbeda seperti halnya basis data relasional, flat file dan catatan transaksi online. Teknik data cleaning

dan integrasi data diterapkan untuk memastikan konsistensi dalam hal keseragaman penamaan, struktur pengkodean, pengukuran atribut dan hal lainnya.

Time variant

Data disimpan untuk menyediakan informasi dari perspektif historical

(seperti 5-10 tahun kebelakang). Setiap struktur kunci pada data warehouse

mengandung elemen waktu baik itu secara implisit ataupun eksplisit.

Non volatile

Data terpisah dari data operasional sehingga tidak membutuhkan suatu proses transaksi, recovery, dan mekanisme kontrol konkurensi akan

dalam mengakses data yaitu pemasukan data pertama dan pengaksesan data.

Model Data Multidimensi

Data warehouse didasarkan pada suatu model data multidimensi. Model ini melihat data dalam bentuk kubus data. Kubus data memungkinkan data yang akan dimodelkan dan dilihat dalam multidimensi. Hal tersebut didefinisikan oleh dimensi dan fakta.

Dalam istilah umum, Dimensi adalah perspektif atau entitas yang digunakan sebagai tempat menyimpan beberapa record

yang saling berhubungan. Masing-masing dimensi memiliki sebuah tabel yang terkait dengannya, disebut sebagai tabel dimensi.

Fakta adalah ukuran-ukuran numerik. Fakta merupakan kuantitas yang akan dianalisis hubungan antar dimensi. Tabel fakta berisi nama dari fakta (ukuran) dan

keys dari tabel dimensi yang bersangkutan. Untuk menggambarkan hubungan antar data pada data multidimensi digunakan skema multidimensi. Pada data warehouse, skema merupakan sekumpulan tabel yang berhubungan. Skema digunakan untuk menunjukkan hubungan antara tabel dimensi dengan tabel fakta. Skema ditentukan berdasarkan kebutuhan data warehouse dan keinginan pembuat data warehouse. Data warehouse membutuhkan skema yang ringkas dan berorientasi subjek. Tipe-tipe skema multidimensi antara lain (Han & Kamber 2006):

1 Skema bintang (star schema)

Skema bintang adalah skema data warehouse yang paling umum. Skema bintang merupakan struktur logikal yang memiliki tabel fakta yang terdiri atas data faktual ditengahnya, dan dikelilingi oleh tabel-tabel dimensi yang berisi referensi data.

Keuntungan yang didapat jika menggunakan skema ini adalah peningkatan kinerja data warehouse, pemrosesan query

yang lebih efisien, dan waktu respon yang cepat. Bentuk skema bintang dapat dilihat pada Gambar 1.

2 Skema kepingan salju (snowflake schema)

(11)

Gambar 1 Skema bintang (Han & Kamber 2006).

Perbedaan utama antara model kepingan salju dan skema bintang adalah bahwa tabel dimensi dari model kepingan salju dapat disimpan dalam bentuk normalisasi untuk mengurangi redudansi. Selanjutnya, struktur kepingan salju dapat menghemat penggunaan memori, tapi waktu yang dibutuhkan untuk pemrosesan query menjadi lebih lama akibatnya kinerja sistem dapat berdampak buruk. Bentuk skema kepingan salju dapat dilihat pada Gambar 2.

Gambar 2 Skema kepingan salju (Han & Kamber 2006).

3 Skema galaksi (fact constellation) Aplikasi canggih mungkin memerlukan beberapa tabel fakta untuk berbagi tabel dimensi. Skema semacam ini dapat dilihat sebagai kumpulan bintang, dan karenanya disebut skema galaksi atau konstelasi fakta. Keuntungan menggunakan skema ini adalah menghemat memori dan mengurangi kesalahan yang mungkin terjadi. Bentuk skema galaksi dapat dilihat pada Gambar 3.

Gambar 3 Skema galaksi (Han & Kamber 2006).

Operasi-operasi pada OLAP

Dalam model multidimensi, data tersebut akan disusun dalam berbagai dimensi, dan masing-masing dimensi berisi beberapa tingkat abstraksi yang didefinisikan oleh konsep hierarki. Hal tersebut memberikan fleksibilitas bagi pengguna untuk melihat data dari perspektif yang berbeda. Sejumlah operasi OLAP pada kubus data yang ada untuk mewujudkan perspektif yang berbeda, memungkinkan query interaktif dan analisis data. Oleh karena itu, OLAP menyediakan lingkungan yang user-friendly untuk analisis data secara interaktif. Beberapa operasi OLAP dijelaskan berikut ini (Han & Kamber 2006):

Roll up (drill up): roll up dilakukan dengan cara menaikkan tingkat hierarki atau mereduksi jumlah dimensi.

Drill down: drill down merupakan kebalikan dari roll up. Operasi ini merepresentasikan data secara lebih detail.

Pivot (rotate): merotasikan sumbu data untuk memberikan alternatif dalam presentasi data.

Slice and Dice: slice melakukan seleksi pada satu dimensi kubus sehingga menghasilkan subcube. Dice merupakan proses mendefinisikan subcube dengan memilih dua atau lebih dimensi.

Pivot (rotate): memvisualisasikan operasi yang merotasikan sumbu data sebagai alternatif dalam presentasi data.

Pemodelan Penyimpanan Data

(12)

fisik dan implementasi OLAP server harus mempertimbangkan masalah penyimpanan data. Implementasi dari sebuah server data warehouse untuk pemrosesan OLAP meliputi (Bouman & Doungen 2009):

MOLAP

Multidimensional online analitycal processing (MOLAP) menyimpan data dan aggregasi pada struktur data multidimensi. Struktur MOLAP ini tidak tersimpan pada

data warehouse tapi tersimpan pada OLAP

server, sehingga performa query yang dihasilkan olehnya sangat bagus. Model penyimpanan ini sesuai untuk database

dengan ukuran kecil sampai sedang.

ROLAP

Relational online analitycal processing

(ROLAP) menggunakan tabel pada

relational database untuk menyimpan detail data dan aggregasi kubus. Berbeda dengan MOLAP, ROLAP tidak menyimpan salinan

database tapi mengakses langsung pada tabel fakta ketika membutuhkan jawaban sebuah query, sehingga query pada ROLAP mempunyai response time yang lebih lambat dibandingkan MOLAP maupun HOLAP. Karakteristik model ini digunakan untuk menyimpan data yang besar dan jarang dilakukannya proses query. Misalkan, data histori dalam jumlah besar dari beberapa tahun yang sebelumnya.

HOLAP

Hybrid OLAP, Menggabungkan

teknologi ROLAP dan MOLAP. HOLAP menggabungkan kelebihan-kelebihan yang ada pada keduanya, skalabilitas yang lebih besar dari ROLAP dan perhitungan yang lebih cepat dari MOLAP. HOLAP menggunakan relational database untuk menyimpan detil data dan menggunakan

multidimentional database untuk menyimpan agregasinya.

Arsitektur Komponen OLAP Pentaho

Mondrian merupakan aplikasi server

OLAP berbasis open source yang sangat populer dan saat ini bernaung di bawah Pentaho Corporation. Proyek Mondrian ini merupakan kombinasi yang sangat baik dengan JPivot - interface berbasis web yang juga merupakan proyek open source. Gambar 2 menunjukkan gambaran semantik dari komponen Pentaho Analysis Services

menjelaskan apa yang terjadi ketika pengguna menggunakan aplikasi Pentaho OLAP (Bouman & Doungen 2009).

1 Pengguna web browser menggunakan sebuah HTTP request untuk melihat,

browse atau drill down kedalam tabel pivot OLAP

2 JPivot servlet menerima request dari pengguna dan menerjemahkan request

tersebut kedalam sebuah MDX query. MDX query ini kemudian dikirmkan ke Mondrian engine

3 Mondrian menginterpretasikan MDX

query dan menerjemahkannya kedalam satu atau lebih SQL query. Teknik khusus ini disebut sebagai ROLAP, yang merupakan singkatan dari

Relational OLAP

4 Relational Database Management System (RDBMS) mengeksekusi query

yang diberikan oleh Mondrian. Mondrian menerima hasil query dalam bentuk tabular (relational)

5 Mondrian memproses hasil yang

diterima dari RDBMS dan menerjemahkannya kedalam result-set

multidimensi. Ini sebenarnya adalah hasil query MDX dari query MDX yang dikirim ke Mondrian pada langkah 2

6 JPivot menggunakan hasil

multidimensi untuk membuat halaman HTML menampilkan data. Inilah yang kemudian dikirim ke browser untuk ditunjukkan kepada pengguna

Metode Pengembangan Data Warehouse

Metode yang digunakan untuk merancang database operasional meliputi tahapan yang didefinisikan dengan baik. Tahap pertama adalah spesifikasi kebutuhan yang terdiri dari mengumpulkan permintaan pengguna ke dalam spesifikasi yang koheren dan ringkas. Tahap berikutnya, desain konseptual, desain logis, dan desain fisik yang merupakan hasil penerjemahan dari kebutuhan pengguna.

Karena data warehouse adalah database

yang khusus ditujukan untuk mendukung proses pengambilan keputusan, tahapan yang digunakan dalam desain database

konvensional diadopsi untuk pengembangan

(13)

Schema File (XML)

RDBMS

Mondrian ROLAP Engine

4. Relational Result Read Metadata

<schema> <cube>

………

Edit Publish

Pentaho Schema Workbench XML Editor Pentaho Agregator Designer Metadata and Beck End

OLAP Front End

1. HTTP Request

Optimize, Publish Web Browser Crosstab

6. HTML

Gambar 4 Gambaran komponen Pentaho OLAP (Bouman & Doungen 2009).

Selama proses pengumpulan kebutuhan, pengguna di berbagai tingkat manajemen diwawancara untuk mengetahui analisis kebutuhan mereka. Spesifikasi yang diperoleh berfungsi sebagai dasar untuk membuat sebuah skema database yang mampu merespon permintaan pengguna. Dalam banyak situasi, karena kurangnya model konseptual yang diterima baik untuk aplikasi data warehouse, desainer

melewatkan tahap desain konseptual dan menggunakan representasi logis berdasarkan skema bintang dan / atau skema kepingan salju. Selanjutnya desain fisik mempertimbangkan fasilitas yang disediakan oleh DBMS yang ada untuk melakukan penyimpanan, pengindeksan, dan manipulasi data yang terdapat pada data warehouse.

warehouse berbeda secara signifikan dari

pengembangan sistem database

konvensional. Oleh karena itu, modifikasi terhadap metode yang dijelaskan di atas sangat penting. Sebagai contoh, tidak seperti

database konvensional, data dalam data warehouse diekstrak dari sistem beberapa sumber. Sebagai akibatnya, beberapa pendekatan untuk desain data warehouse

tidak hanya mempertimbangkan kebutuhan pengguna tetapi juga ketersediaan data. Selain itu, karena dalam banyak kasus data diambil dari berbagai sumber maka harus ditransformasikan sebelum dimuat ke dalam

data warehouse, maka perlu

dipertimbangkan selama desain data warehouse proses ekstraksi-transformasi-loading (ETL). Gambaran metode pengembangan data warehouse dapat dilihat pada Gambar 5 (Malinowski & Zimányi 2008).

Namun, pengalaman menunjukkan

(14)

Keterangan:

: Optional

M LITIAN

Taha nelitian

ini dapa nelitian

ini

ni dilakukan desain logis t-atribut yang didapat pada h

P

ni data sudah siap untuk

data warehouse. Tahap

ni melakukan konversi data n pada proses ETL kedalam

ni dilakukan setelah pembuatan house selesai. Pengujian ini ila

Tahap ketiga yang dilakukan pada pengembangan

data warehouse (Malinowski &

Gambar 5 Gambaran metode

ETODE PENE

pan yang dilakukan pada pe t dilihat pada Gambar 6. Pe

menggunakan data pada penelitian sebelumnya sehingga tahapan spesifikasi kebutuhan, proses ekstraksi, dan transformasi data tidak dilakukan.

Desain Logis

Pada tahap i terhadap atribu

ta apan sebelumnya. Dari atribut-atribut tersebut, ditentukan yang menjadi ukuran (measure) dan yang bukan ukuran ( non-measure) pada sebuah tabel fakta. Selain itu

dimensi tersebut dan skema yang terbentuk pada tahapan ini. Pada tahapan ini, terdapat beberapa perbedaan dengan penelitian sebelumnya diantaranya adalah skema yang digunakan dan kubus data yang terbentuk.

Mulai

Gambar 6 Diagram alir metode penelitian.

roses Loading

Pada tahap i dimasukkan ke

pemuatan bertujuan untuk memuat data yang terseleksi ke dalam data warehouse tujuan dan membuat indeks yang diperlukan.

Desain Fisik

Tahapan i yang dihasilka

sistem manajemen basis data MySQL.

Uji Query

Tahap i data ware

d kukan untuk melihat apakah operasi dasar OLAP berhasil diimplementasikan dan sesuai dengan informasi yang ditampilkan. Pengujian dilakukan dengan memvisualisasikan kubus data dengan grafik dan tabel pivot.

Pembuatan Data Warehouse

Zimányi 2008).

Spesifikasi Kebutuhan

Desain Konseptual

Desain Logis

Desain Fisik Proses ETL

Selesai Uji Query

Data Warehouse Final

TAHAP II

TAHAP III TAHAP I

Mulai

Desain Logis

Proses Loading

Desain Fisik

Uji Query

Data Warehouse Final

(15)

warehouse dengan menggunakan data j

Lingkungan Pengembangan

Lingkungan pengembangan yang digunakan untuk pengembangan aplikasi OLAP adalah sebagai berikut:

Perangkat lunak yang digunakan: 1 Web server Apache Tomcat 2 MySQL versi 5.0

3 Mondrian Server 3.1.6 4 Windows XP Pro SP2 Edition 5 Schema Workbench

6 Web browser Mozilla Firefox 3.0.1 Perangkat keras yang digunakan dalam membagun sistem ini berupa komputer dengan spesifikasi:

1 Processor Intel Core Duo 2 Memory 512 MB

3 Harddisk 80 GB 4 Keyboard dan mouse

5 Monitor

HASIL DAN PEMBAHASAN

Selama ini, proses analisis data hasil penjualan masih dilakukan secara manual. Proses bisnis dari kegiatan penjualan tersebut dapat dilihat pada Lampiran 1. Untuk memesan produk surta pengguna harus mengisi lembar pesanan yang disediakan di loket penjualan. Bentuk lembar pemesanan dapat dilihat pada Lampiran 2. Kemudian staf pelayanan mencatat data penjualan tersebut dengan menggunakan Microsoft Office Excel, hasilnya dapat dilihat pada Lampiran 3. Untuk membuat laporan masih dilakukan

query manual pada tiap tabel data di Microsoft Office Excel. Contoh laporan yang dihasilkan dapat dilihat pada Lampiran 4. Dalam proses bisnis di atas, data yang tercatat memiliki atribut-atribut terbatas dan tidak konsisten antar tahun seperti terlihat pada Lampiran 5. Hal ini membuat hasil analisis kurang akurat dan membutuhkan waktu lama.

Desain Logis

Sebelum menentukan desain logis dalam bentuk skema dengan cara memilih

atribut-atribut yang menjadi ukuran (measure) dan non ukuran (non measure), maka ditentukan terlebih dahulu atribut yang dipilih berdasarkan kebutuhan analisis data penjualan setiap pengguna. Pemilihan atribut berdasarkan subjek utama yang akan dianalisis untuk proses pengambilan keputusan sesuai dengan kebutuhan pengguna. Atribut yang digunakan dapat dilihat pada Tabel 1 sedangkan kebutuhan analisis data penjualan setiap pengguna dapat dilihat pada Tabel 2. Jumlah lembar dipilih sebagai measure untuk mengetahui jumlah lembar produk yang terjual pada bulan dan tahun tertentu sedangkan jumlah harga, dipilih sebagai measure untuk mengetahui jumlah rupiah yang diperoleh dari penjualan produk pada bulan dan tahun tertentu.

Tabel 1 Atribut hasil analisis dan deskripsi tiap atribut (Nurhasanah 2009) pen ualan produk surta Bakosurtanal mulai

tahun 2002 sampai tahun 2007.

Atribut Deskripsi

Tanggal Tanggal pemesanan

Kualifikasi Nama kualifikasi

Jenis data Nama jenis data

Skala Nilai skala

Jumlah lembar Menyatakan jumlah lembar

Jumlah harga Menyatakan jumlah harga

Tabel 2 Kebutuhan analisis data penjualan setiap pengguna (Nurhasanah 2009) Pengguna Kebutuhan Frekuensi Kepala

(16)

Pengguna Kebutuhan Frekuensi jumlah hasil penjualan

Hasil analisis data ditentukan satu tabel uk) dan empat dimensi ta, waktu, dan skala).

mensi ditentukan diperlukan beserta ng membentuknya. Dimensi

isusun dalam tiga level yaitu

tahun a

me

fisik nama dan deskripsi dimensi

Tabel 3 Nama dan deskripsi dimensi dari Jumlah Penj

dan dapat dilihat pada Gambar 7 disertai dengan perbandingan skema yang digunakan pada penelitian sebelumnya yaitu skema galaksi yang dapat dilihat pada Gambar 8.

Proses Loading

Proses ekstraksi dan transformasi data telah dilakukan pada penelitian sebelumnya sehingga proses yang dilakukan pada tahapan ini hanya proses pemuatan data (loading). Proses pemuatan data tetap dilakukan karena terdapat perbedaan OLAP server yang digunakan. Data yang sudah siap digunakan untuk pembuatan data warehouse dimuat ke kubus data OLAP

server Mondrian dengan format .xml.

Desain Fisik

Desain

dari kubus Jumlah Penjualan dapat dilihat pada Tabel 3.

kubus ualan

Nama Dimensi Deskripsi

fakta (penjualan_prod (kualifikasi, jenis da

Untuk masing-masing di Waktu Bulan dan tahun

pemesanan Jenis_data

tingkat perincian yang hierarki ya

waktu dapat d

Nama jenis produk Kualifikasi Kualifikasi pemesan Skala

> triwulan > bulan. Dimensi jenis dat miliki dua level yaitu nama unit kerja dan nama data. Dimensi kualifikasi memiliki satu level yaitu jenis kualifikasi. Dimensi skala memiliki satu level yaitu skala. Model hierarki setiap dimensi dapat dilihat pada Lampiran 6 sedangkan data dalam tabel dimensi dapat dilihat pada Lampiran 7. Skema yang digunakan yaitu skema bintang

Nilai skala

Jml_harga harga) ma uku

(17)

penjualan dan harga_penjualan (Nurhasanah

Gambar 8 Skema an tabel fakta lembar_

2009).

Uji

surta yang lebih rinci. Misalnya untuk mengetahui jumlah lembar pada masing-masing jenis data. Implementasi drill down dapat dilihat pada Lampiran 9.

• Operasi Slice dan dice dilakukan melihat keadaan jumlah lembar dan jumlah harga hasil penjualan pada waktu tertentu, jenis data dan skala tertentu atau kualifikasi tertentu. Implementasi hasil operasi slice

dapat dilihat pada Lampiran 10 sedangkan untuk operasi dice dapat dilihat pada Lampiran 11 .

K AN

K

Pemba rehouse

dan OLAP berbasi njualan peta

B , proses ualan

p tida ecara

m anal bih

aku pat di gai

f an tampila am berbagai

b afik dan le.

Dikembangkan aplikasi untuk integrasi basis data penjualan dari masing-masing

outlet sehingga data warehouse yang dibuat mencakup informasi mengenai jumlah hasil penjualan dari masing-masing lokasi outlet.

DAFTAR PUSTAKA

Bouman R, Doungen J. 2009. Pentaho Solutions: Business Intellegence and Data Warehousing with Pentaho and MySQL. Indianapolis : Wiley Publishing, Inc.

Han J, Kamber M. 2006. Data Mining : Concepts and Techniques. San ansisco

isher.

Malinowski E, Zimányi E. 2008. Advance Data Warehouse Design. Berlin: Springer galaksi deng

Query

Implementasi operasi-operasi OLAP yaitu:

• Operasi roll up pada waktu, yaitu triwulan (roll up) ke tahun. Contoh

roll up untuk mengetahui jumlah lembar tiap tahun. Roll up dimensi waktu dari tingkat triwulan menjadi tingkat tahun untuk mengetahui jumlah lembar produk surta yang terjual per tahun. Implementasi roll up dapat dilihat pada Lampiran 8. • Operasi drill down dilakukan untuk

mengetahui jumlah lembar dan jumlah harga hasil penjualan produk

ESIMPULAN DAN SAR esimpulan

Dengan ngunan data wa

s web data pe akosurtanal

roduk surta

analisis hasil penj k lagi dilakukan s anual. Hasil

rat dan da

isis yang dihasilkan le sajikan dalam berba

ormat d n seperti dal

entuk gr engambil nformasi pen

dalam bentuk .xls fi

tusan dapat melih an denga

apat di nformasi dia

sewaktu-waktu kare elalui web

S

(18)

Nurhasanah S. 2009. Prototipe Data Warehouse Data Penjualan Produk BAKOSURTANAL [Skripsi]. Bogor: Departemen Ilmu Komputer, FMIPA, Institut Pertanian Bogor.

Sulistyaningsih W. 2010. Pembangunan Data Warehouse Akademik (Studi Kasus: Kurikulum Mayor-Minor Program Sarjana Departemen Ilmu Komputer IPB)

[Skripsi]. Bogor: Departemen Ilmu Komputer, FMIPA, Institut Pertanian Bogor.

(19)
(20)
(21)

ran

LAPORAN PENJUALAN DATA PRODUK BAKOSURTANAL BULAN : DESEMBER

TAHUN : 2006

S K A L A JUMLAH

NO. TANGGAL PEMESAN INSTANSI Pembelian Kualifikasi ALAMAT DAERAH

1:25.000 1:50.000 1:250.000 1:500.000

1:1.000.000 ATLAS

LBR.

HARGA

1 01-12-06 Mega Gracia Perorangan LANGSUNG Perorangan Jakarta Jawa 2 2

40,000

2 01-12-06 Tirto PDAM Kab.

Pacitan FAX Negeri

Jl. Suryo Pranoto No. 2 Pacitan Jatim

Jawa 2 2

9 01-12-06 Ridwan

PT. Bhumi

11 01-12-06 Bukhari Perorangan LANGSUNG Perorangan Jl. Gardu Raya

(22)

13 01-12-06 Apris CV. Techno LANGSUNG Nusra 6 6 Daryanto Outlet Bapp

Jateng FAX Outlet

Jl. P

18 01-12-06 Wening Perorangan LANGSUNG Perorangan No. 29 Depok Digital

Lampung 2 2

20 01-12-06 Tukiman Perorangan LANGSUNG Perorangan a Jaka

ong Aceh 12 12 PT. Sarana Ek

LANGSUNG Swasta Jl. Buncit R Jaka Ary PT. Kalpata

Investama LANGSUN Swas

(23)
(24)

Lampiran 4 Lanjutan

RTANAL TERHADAP PNBP

JUMLAH (RP)

KONTRIBUSI PUSAT-PUSAT DI BAKOSU BULAN : DESEMBER 2007

NO NAMA PUSAT

1 PUSAT ATLAS 3,725,000

2 PDKK 1,936,000

3 PDRTR 233,191,000

4 PGG 1,400,000

5 PSSAD 1,335,000

6 PUSJASINFO 5,435,000

(25)

Lampiran 4 Lanjutan

REKAP PENJUALAN DATA PRODUK BAKOSURTANAL

BULAN : DESEMBER 2007

NO. URAIAN JML. LEMBAR

PUSAT ATLAS

1 ATLAS 51

2 CD ATLAS ELEKTRONIK 11

3 INDONESIA FROM SPACE 2

4 BALI FROM SPACE 1

5 LOMBOK FROM SPACE 1

6 BANTEN FROM SPACE 1

PDRTR

1 BALI 8

2 DATA DIGITAL 237

3 IRIAN 98

4 JAWA 1,806

5 KALIMANTAN 877

6 NUSRA 322

7 MALUKU 19

8 SULAWESI 529

9 SUMATERA 313

10 PETA FOTO 6

PUSJASINFO

1 PLOT PETA 33

2 BUKU PANDUAN MEMBACA PETA 7

PDKK

1 LLN 25

2 LPI 20

PSSAD

1 REPPROT 5

PGG

1 Titik GPS 6

2 Titik TTG 21

3 BUKU PANDUAN DATUM 1

4 BUKU PASUT 2007 1

5 RAW DATA 5

(26)

ibut data penjualan tahun 2002 – 2007

004 2005 2006 2007

Lampiran 5 Atribut-atr

Nama Atribut 2002 2003 2

Tanggal 9 9 9 9 9 9

Instansi 9 9 9 9 9 9

Cara Order - - 9 9 9 9

Kualifikasi - - 9 9 9 9

Alamat 9 9 9 9 9 9

Daerah 9 9 9 9 9 9

Skala 9 9 9 9 9 9

Jumlah Lembar 9 9 9 9 9 9

(27)

Lampiran 6 Model hierarki tiap dimensi

a M ensi wa

Model hierarki dimensi jenis data

Model hierarki dimensi kualifikasi

Model hierarki dimensi skala odel hierarki dim ktu

b

c

d

At PDRTR Pusjasinfo PDKK PSDAD PGG Sisjar PSDAL

NTB from space

Indeks Atlas

Buku Atlas Sulawesi Sumatera

Peta Foto

Plot Peta

Indeks Peta Buku Cakupan

LPI

LLN LBI Peta Tematik

Peta Propinsi

Peta Neraca Titik TTG Titik GPS

Data Pasut

Buku SNI Buku Spesifikasi

Basisdata

Buku Integrasi Neraca SDA las

All All

Jenis Data Unit Kerja

1:25.000 1:50.000 1:250.000 1:500.000 1:1.000.000 Atlas All

All

(28)

Lampiran 7 Data dalam tabel dimensi

a Data dimensi waktu

id_waktu tahun triwulan bulan

1 2002 Triwulan I 2002 Jan-2002

2 2002 Triwulan I 2002 Feb-2002

3 2002 Triwulan I 2002 Mar-2002

4 2002 Triwulan II 2002 Apr-2002

5 2002 Triwulan II 2002 May-2002

6 2002 Triwulan II 2002 Jun-2002

7 2002 Triwulan III 2002 Jul-2002

8 2002 Triwulan III 2002 Aug-2002

9 2002 Triwulan III 2002 Sep-2002

10 2002 Triwulan IV 2002 Oct-2002

11 2002 Triwulan IV 2002 Nov-2002

12 2002 Triwulan IV 2002 Dec-2002

13 2003 Triwulan I 2003 Jan-2003

14 2003 Triwulan I 2003 Feb-2003

15 2003 Triwulan I 2003 Mar-2003

16 2003 Triwulan II 2003 Apr-2003

17 2003 Triwulan II 2003 May-2003

18 2003 Triwulan II 2003 Jun-2003

19 2003 Triwulan III 2003 Jul-2003

20 2003 Triwulan III 2003 Aug-2003

21 2003 Triwulan III 2003 Sep-2003

22 2003 Triwulan IV 2003 Oct-2003

23 2003 Triwulan IV 2003 Nov-2003

24 2003 Triwulan IV 2003 Dec-2003

25 2004 Triwulan I 2004 Jan-2004

26 2004 Triwulan I 2004 Feb-2004

27 2004 Triwulan I 2004 Mar-2004

28 2004 Triwulan II 2004 Apr-2004

29 2004 Triwulan II 2004 May-2004

30 2004 Triwulan II 2004 Jun-2004

31 2004 Triwulan III 2004 Jul-2004

32 2004 Triwulan III 2004 Aug-2004

33 2004 Triwulan III 2004 Sep-2004

34 2004 Triwulan IV 2004 Oct-2004

35 2004 Triwulan IV 2004 Nov-2004

36 2004 Triwulan IV 2004 Dec-2004

37 2005 Triwulan I 2005 Jan-2005

38 2005 Triwulan I 2005 Feb-2005

39 2005 Triwulan I 2005 Mar-2005

40 2005 Triwulan II 2005 Apr-2005

41 2005 Triwulan II 2005 May-2005

42 2005 Triwulan II 2005 Jun-2005

43 2005 Triwulan III 2005 Jul-2005

44 2005 Triwulan III 2005 Aug-2005

(29)

Lampiran 7 Lanjutan

Triwulan IV 2005 Nov-2005

47 2005

48 2005 Triwulan IV 2005 Dec-2005

49 2006 Triwulan I 2006 Jan-2006

50 2006 Triwulan I 2006 Feb-2006

51 2006 Triwulan I 2006 Mar-2006

52 2006 Triwulan II 2006 Apr-2006

53 2006 Triwulan II 2006 May-2006

54 2006 Triwulan II 2006 Jun-2006

55 2006 Triwulan III 2006 Jul-2006

56 2006 Triwulan III 2006 Aug-2006

57 2006 Triwulan III 2006 Sep-2006

58 2006 Triwulan IV 2006 Oct-2006

59 2006 Triwulan IV 2006 Nov-2006

60 2006 Triwulan IV 2006 Dec-2006

61 2007 Triwulan I 2007 Jan-2007

62 2007 Triwulan I 2007 Feb-2007

63 2007 Triwulan I 2007 Mar-2007

64 2007 Triwulan II 2007 Apr-2007

65 2007 Triwulan II 2007 May-2007

66 2007 Triwulan II 2007 Jun-2007

67 2007 Triwulan III 2007 Jul-2007

68 2007 Triwulan III 2007 Aug-2007

69 2007 Triwulan III 2007 Sep-2007

70 2007 Triwulan IV 2007 Oct-2007

71 2007 Triwulan IV 2007 Nov-2007

72 2007 Triwulan IV 2007 Dec-2007

b Data dimens ikasi

id_ lifikasi ku

i kualif

kua alifikasi

1 Swasta 2 Negeri 3 Perorangan 4 Mahasiswa 5 Outlet 6 Tidak ada keterangan

c Da imensi

id_ la

ta d skala

ska skala

1 1:25.000 2 1:50.000 3 1:250.000 4 1:500.000 5 1:1.000.000

(30)

Lampiran 7 Lanjutan

d D imensi data

id_ unit_kerja

ata d jenis_

data nama data

1 NTB fromSpace Atlas

2 Indeks Atlas Atlas

3 Buku Atlas Atlas

4 Bali From Space Atlas

5 PETA WAC PDKK

6 Peta Jalur Penerbangan PDKK

7 LPI PDKK

8 LLN PDKK

9 LBI PDKK

10 Timor Timur PDRTR

11 Sumatera PDRTR

12 Sulawesi PDRTR

13 Peta Indonesia PDRTR

14 Peta Foto PDRTR

15 Peta Dinding PDRTR

16 Nusa Tenggara PDRTR

17 Maluku PDRTR

18 Kalimantan PDRTR

19 Jawa PDRTR

20 Irian Jaya PDRTR

21 Data Digital PDRTR

22 Bali PDRTR

23 Aceh PDRTR

24 Peta Dunia PDRTR

25 Peta ASEAN PDRTR

26 Foto Udara PDRTR

27 Titik TTG PGG

28 Titik GPS PGG

29 Data Pasut PGG

30 Buku PrediksiPasut PGG

31 Buku Panduan GPS PGG

32 Buku Panduan Datum PGG

33 Buku JaringanKontrol PGG

34 Buku Data Kota PGG

35 Spek Basis Data Neraca Sumberdaya Lahan PSDAD

36 REPPORT PSDAD

37 Peta Tematik PSDAD

38 Peta si Propin PSDAD

39 atalog K Data Tematik PSDAD

40 Digital Sistem Lahan Jatim PSDAD

41 Buku Spek Teknis Nilai Ekonomi Sumberdaya Air PSDAD

42 Buku Satuan Lahan PSDAD

43 eta P Neraca PSDAL

(31)

Pusjasinfo Lampiran 7 Lanjutan

47 Indeks Peta

48 Buku Cakupan Pusjasinfo

49 Buku Spesifikasi Basisdata Sisjar

(32)

Lampiran 8 Grafik hasil operasi roll up jumlah produk surta yang terjual per tahun

(33)

Lampiran 9 Grafik hasil operasi drill dwon jumlah produk surta yang terjual per jenis data

(34)

Lampiran 10 Grafik hasil operasi slice jumlah lembar penjualan produk surta pada dimensi waktu dan dimensi skala

(35)

Lampiran 11 Grafik hasil operasi dice jumlah lembar penjualan produk surta pada dimensi waktu , jenis data, dan kualifikasi tertentu

dice juml ng terjual

pada pusat AD pada

Tahun 2004 dengan

kualifikasi pembeli Swasta ah produk surta ya

(36)

ABSTRACT

RIKA INDRIANI. Data Warehouse Sale Prototype of Bakosurtanal Product. Supervised by HARI AGUNG ADRIANTO.

Speeding up reporting process and obtaining strategic information based on a multidimensional analysis query can be done by building OLAP applications integrated with data warehouse. Development of data warehouse Bakosurtanal product sales data and web-based OLAP applications has been done using Palo. Palo is one of the OLAP server with multidimensional data storage model (MOLAP). Mondrian is an OLAP server with relational data storage model (ROLAP)

This research aims to develop a data warehouse and wab-based OLAP using Mondrian 3.1.6. This research designs the data warehouse using star scheme and OLAP development. This research produces a web-based OLAP cube consisting of one data cube: sales of products and four dimensions: time, type of data, qualification, and scale. Users can interact with the following facilities: 1) Selecting dimensions to display the information at the level needed, 2) Displaying information in the form of bar charts, stacked bar, line charts, line charts, stacked area, and pie charts 3) Exporting files into Microsoft Excel format. Users can explore this application using OLAP operations including roll-up, drill-down, slice, dice, etc.

(37)

PENDAHULUAN Latar Belakang

Badan Koordinasi Survei dan Pemetaan Nasional (Bakosurtanal) merupakan Lembaga Pemerintah Non Departemen yang bertugas melaksanakan survei dan pemetaan sesuai dengan ketentuan peraturan perundang-undangan yang berlaku. Dalam hal tersebut, Bakosurtanal mempunyai kewenangan menyediakan informasi spasial kedalam suatu produk survei dan pemetaan (surta) berupa peta atau atlas dalam berbagai format, jenis dan skala. Untuk itu, Bakosurtanal menjadi titik tumpu dalam pelaksanaan pendistribusian dan pelayanan produk surta kepada pengguna dalam berbagai kalangan.

Perolehan produk surta dapat dilakukan secara langsung atau tertulis (melalui surat/ faksimili). Untuk pembelian secara langsung, pengguna harus mengisi formulir pesanan (Form-LP) yang disediakan di loket penjualan. Setelah terjadi transaksi, petugas unit pelayanan mencatat data penjualan tersebut menggunakan Microsoft Office Excel. Pengolahan data yang disajikan dalam bentuk laporan penjualan masih dilakukan dengan query manual pada setiap tabel data penjualan yang tersimpan di Microsoft Office Excel. Laporan tersebut disesuaikan dengan kebutuhan pengguna. Dengan proses tersebut, data yang tercatat memiliki atribut-atribut terbatas dan tidak konsisten antar tahun. Hal tersebut menyebabkan tingkat akurasi rendah terhadap hasil analisis data penjualan dan membutuhkan waktu yang lama.

Untuk mempercepat proses pelaporan dan memperoleh informasi yang strategis

berdasarkan query analisis yang

multidimensi, dapat dilakukan dengan membangun aplikasi OLAP yang diintegrasikan dengan data warehouse.

Pembangunan data warehouse data

penjualan produk Bakosurtanal dan aplikasi OLAP berbasis web telah dilakukan pada penelitian sebelumnya (Nurhasanah 2009) dengan menggunakan Palo. Palo merupakan salah satu OLAP server dengan model penyimpanan data multidimensi (MOLAP) sehingga jumlah volume data yang dapat ditangani terbatas. Saat ini banyak OLAP

server yang dikembangkan dan bersifat open source salah satunya adalah Mondrian (http://mondrian.pentaho.org/). Mondrian merupakan OLAP server dengan model

penyimpanan data relasional (ROLAP) yang dikembangkan dengan Java dan memungkinkan penguna menganalisis dataset yang disimpan di database secara interaktif. Selain terdapat perbedaan pada OLAP server yang digunakan, skema pada penelitian ini juga berbeda dengan penelitian sebelumnya. Pada penelitian sebelumnya, skema yang digunakan adalah skema galaksi sedangkan pada penelitian kali ini digunakan skema bintang. Hal tersebut terjadi karena setelah dilakukan pengkajian lebih lanjut, terdapat redudansi data pada penelitian sebelumnya yang menggunakan skema galaksi.

Tujuan

Penelitian ini bertujuan untuk membangun suatu sistem data warehouse

yang dapat mendukung analisis penjualan produk sesuai dengan kebutuhan pengguna.

Ruang Lingkup

Ruang lingkup penelitian ini adalah: 1 Penelitian ini akan menghasilkan

prototipe data warehouse dan aplikasi OLAP berbasis web. Data tersebut dilakukan analisis menggunakan OLAP

server Mondrian.

2 Data yang digunakan adalah data penjualan produk survei dan pemetaan Bakosurtanal tahun 2002 sampai dengan 2007.

Manfaat

Hasil penelitian yang diperoleh diharapkan dapat mendukung pengambilan keputusan yang strategis untuk mencapai tujuan bisnis (meningkatkan mutu produk, meningkatkan layanan konsumen, meningkatkan penjualan, dll) yang didapat secara informatif, cepat dan akurat.

TINJAUAN PUSTAKA

Data warehouse

Data warehouse menyediakan arsitektur dan alat bagi para eksekutif bisnis untuk mengatur secara sistematis, mengerti, dan menggunakan data dalam membuat keputusan strategis.

(38)

PENDAHULUAN Latar Belakang

Badan Koordinasi Survei dan Pemetaan Nasional (Bakosurtanal) merupakan Lembaga Pemerintah Non Departemen yang bertugas melaksanakan survei dan pemetaan sesuai dengan ketentuan peraturan perundang-undangan yang berlaku. Dalam hal tersebut, Bakosurtanal mempunyai kewenangan menyediakan informasi spasial kedalam suatu produk survei dan pemetaan (surta) berupa peta atau atlas dalam berbagai format, jenis dan skala. Untuk itu, Bakosurtanal menjadi titik tumpu dalam pelaksanaan pendistribusian dan pelayanan produk surta kepada pengguna dalam berbagai kalangan.

Perolehan produk surta dapat dilakukan secara langsung atau tertulis (melalui surat/ faksimili). Untuk pembelian secara langsung, pengguna harus mengisi formulir pesanan (Form-LP) yang disediakan di loket penjualan. Setelah terjadi transaksi, petugas unit pelayanan mencatat data penjualan tersebut menggunakan Microsoft Office Excel. Pengolahan data yang disajikan dalam bentuk laporan penjualan masih dilakukan dengan query manual pada setiap tabel data penjualan yang tersimpan di Microsoft Office Excel. Laporan tersebut disesuaikan dengan kebutuhan pengguna. Dengan proses tersebut, data yang tercatat memiliki atribut-atribut terbatas dan tidak konsisten antar tahun. Hal tersebut menyebabkan tingkat akurasi rendah terhadap hasil analisis data penjualan dan membutuhkan waktu yang lama.

Untuk mempercepat proses pelaporan dan memperoleh informasi yang strategis

berdasarkan query analisis yang

multidimensi, dapat dilakukan dengan membangun aplikasi OLAP yang diintegrasikan dengan data warehouse.

Pembangunan data warehouse data

penjualan produk Bakosurtanal dan aplikasi OLAP berbasis web telah dilakukan pada penelitian sebelumnya (Nurhasanah 2009) dengan menggunakan Palo. Palo merupakan salah satu OLAP server dengan model penyimpanan data multidimensi (MOLAP) sehingga jumlah volume data yang dapat ditangani terbatas. Saat ini banyak OLAP

server yang dikembangkan dan bersifat open source salah satunya adalah Mondrian

penyimpanan data relasional (ROLAP) yang dikembangkan dengan Java dan memungkinkan penguna menganalisis dataset yang disimpan di database secara interaktif. Selain terdapat perbedaan pada OLAP server yang digunakan, skema pada penelitian ini juga berbeda dengan penelitian sebelumnya. Pada penelitian sebelumnya, skema yang digunakan adalah skema galaksi sedangkan pada penelitian kali ini digunakan skema bintang. Hal tersebut terjadi karena setelah dilakukan pengkajian lebih lanjut, terdapat redudansi data pada penelitian sebelumnya yang menggunakan skema galaksi.

Tujuan

Penelitian ini bertujuan untuk membangun suatu sistem data warehouse

yang dapat mendukung analisis penjualan produk sesuai dengan kebutuhan pengguna.

Ruang Lingkup

Ruang lingkup penelitian ini adalah: 1 Penelitian ini akan menghasilkan

prototipe data warehouse dan aplikasi OLAP berbasis web. Data tersebut dilakukan analisis menggunakan OLAP

server Mondrian.

2 Data yang digunakan adalah data penjualan produk survei dan pemetaan Bakosurtanal tahun 2002 sampai dengan 2007.

Manfaat

Hasil penelitian yang diperoleh diharapkan dapat mendukung pengambilan keputusan yang strategis untuk mencapai tujuan bisnis (meningkatkan mutu produk, meningkatkan layanan konsumen, meningkatkan penjualan, dll) yang didapat secara informatif, cepat dan akurat.

TINJAUAN PUSTAKA

Data warehouse

Data warehouse menyediakan arsitektur dan alat bagi para eksekutif bisnis untuk mengatur secara sistematis, mengerti, dan menggunakan data dalam membuat keputusan strategis.

(39)

pemrosesan informasi dengan menyediakan suatu platform yang kokoh untuk analisis data yang mengandung histori dan terkonsolidasi.

Data warehouse mempunyai

karakteristik berorientasi subjek, terintegrasi, time variant dan non volatile. Hal tersebut tersebut membedakan data warehouse dengan sistem penyimpanan data lainnya, berikut adalah penjelasan dari masing-masing karakteristik (Han & Kamber 2006):

• Orientasi subjek

Data warehouse diorganisasikan pada subjek-subjek utama seperti halnya konsumen, pemasok, produk dan penjualan. Dibandingkan dengan berkonsentrasi terhadap kegiatan operasi keseharian dan proses transaksi dari suatu organisasi, data warehouse fokus terhadap pembentukan model data dan analisis data untuk pengambilan keputusan. Karena itu data warehouse

biasanya menyediakan pola pandang yang sangat mudah terhadap beberapa subjek yang ada dengan menghilangkan data yang tidak berguna pada proses pengambilan keputusan.

• Terintegrasi

Data warehouse biasanya terbentuk dengan melakukan integrasi terhadap data yang berbeda seperti halnya basis data relasional, flat file dan catatan transaksi online. Teknik data cleaning

dan integrasi data diterapkan untuk memastikan konsistensi dalam hal keseragaman penamaan, struktur pengkodean, pengukuran atribut dan hal lainnya.

Time variant

Data disimpan untuk menyediakan informasi dari perspektif historical

(seperti 5-10 tahun kebelakang). Setiap struktur kunci pada data warehouse

mengandung elemen waktu baik itu secara implisit ataupun eksplisit.

Non volatile

Data terpisah dari data operasional sehingga tidak membutuhkan suatu proses transaksi, recovery, dan mekanisme kontrol konkurensi akan tetapi hanya membutuhkan dua operasi

dalam mengakses data yaitu pemasukan data pertama dan pengaksesan data.

Model Data Multidimensi

Data warehouse didasarkan pada suatu model data multidimensi. Model ini melihat data dalam bentuk kubus data. Kubus data memungkinkan data yang akan dimodelkan dan dilihat dalam multidimensi. Hal tersebut didefinisikan oleh dimensi dan fakta.

Dalam istilah umum, Dimensi adalah perspektif atau entitas yang digunakan sebagai tempat menyimpan beberapa record

yang saling berhubungan. Masing-masing dimensi memiliki sebuah tabel yang terkait dengannya, disebut sebagai tabel dimensi.

Fakta adalah ukuran-ukuran numerik. Fakta merupakan kuantitas yang akan dianalisis hubungan antar dimensi. Tabel fakta berisi nama dari fakta (ukuran) dan

keys dari tabel dimensi yang bersangkutan. Untuk menggambarkan hubungan antar data pada data multidimensi digunakan skema multidimensi. Pada data warehouse, skema merupakan sekumpulan tabel yang berhubungan. Skema digunakan untuk menunjukkan hubungan antara tabel dimensi dengan tabel fakta. Skema ditentukan berdasarkan kebutuhan data warehouse dan keinginan pembuat data warehouse. Data warehouse membutuhkan skema yang ringkas dan berorientasi subjek. Tipe-tipe skema multidimensi antara lain (Han & Kamber 2006):

1 Skema bintang (star schema)

Skema bintang adalah skema data warehouse yang paling umum. Skema bintang merupakan struktur logikal yang memiliki tabel fakta yang terdiri atas data faktual ditengahnya, dan dikelilingi oleh tabel-tabel dimensi yang berisi referensi data.

Keuntungan yang didapat jika menggunakan skema ini adalah peningkatan kinerja data warehouse, pemrosesan query

yang lebih efisien, dan waktu respon yang cepat. Bentuk skema bintang dapat dilihat pada Gambar 1.

2 Skema kepingan salju (snowflake schema)

(40)

Gambar 1 Skema bintang (Han & Kamber 2006).

Perbedaan utama antara model kepingan salju dan skema bintang adalah bahwa tabel dimensi dari model kepingan salju dapat disimpan dalam bentuk normalisasi untuk mengurangi redudansi. Selanjutnya, struktur kepingan salju dapat menghemat penggunaan memori, tapi waktu yang dibutuhkan untuk pemrosesan query menjadi lebih lama akibatnya kinerja sistem dapat berdampak buruk. Bentuk skema kepingan salju dapat dilihat pada Gambar 2.

Gambar 2 Skema kepingan salju (Han & Kamber 2006).

3 Skema galaksi (fact constellation) Aplikasi canggih mungkin memerlukan beberapa tabel fakta untuk berbagi tabel dimensi. Skema semacam ini dapat dilihat sebagai kumpulan bintang, dan karenanya disebut skema galaksi atau konstelasi fakta. Keuntungan menggunakan skema ini adalah menghemat memori dan mengurangi kesalahan yang mungkin terjadi. Bentuk skema galaksi dapat dilihat pada Gambar 3.

Gambar 3 Skema galaksi (Han & Kamber 2006).

Operasi-operasi pada OLAP

Dalam model multidimensi, data tersebut akan disusun dalam berbagai dimensi, dan masing-masing dimensi berisi beberapa tingkat abstraksi yang didefinisikan oleh konsep hierarki. Hal tersebut memberikan fleksibilitas bagi pengguna untuk melihat data dari perspektif yang berbeda. Sejumlah operasi OLAP pada kubus data yang ada untuk mewujudkan perspektif yang berbeda, memungkinkan query interaktif dan analisis data. Oleh karena itu, OLAP menyediakan lingkungan yang user-friendly untuk analisis data secara interaktif. Beberapa operasi OLAP dijelaskan berikut ini (Han & Kamber 2006):

Roll up (drill up): roll up dilakukan dengan cara menaikkan tingkat hierarki atau mereduksi jumlah dimensi.

Drill down: drill down merupakan kebalikan dari roll up. Operasi ini merepresentasikan data secara lebih detail.

Pivot (rotate): merotasikan sumbu data untuk memberikan alternatif dalam presentasi data.

Slice and Dice: slice melakukan seleksi pada satu dimensi kubus sehingga menghasilkan subcube. Dice merupakan proses mendefinisikan subcube dengan memilih dua atau lebih dimensi.

Pivot (rotate): memvisualisasikan operasi yang merotasikan sumbu data sebagai alternatif dalam presentasi data.

Pemodelan Penyimpanan Data

(41)

fisik dan implementasi OLAP server harus mempertimbangkan masalah penyimpanan data. Implementasi dari sebuah server data warehouse untuk pemrosesan OLAP meliputi (Bouman & Doungen 2009):

MOLAP

Multidimensional online analitycal processing (MOLAP) menyimpan data dan aggregasi pada struktur data multidimensi. Struktur MOLAP ini tidak tersimpan pada

data warehouse tapi tersimpan pada OLAP

server, sehingga performa query yang dihasilkan olehnya sangat bagus. Model penyimpanan ini sesuai untuk database

dengan ukuran kecil sampai sedang.

ROLAP

Relational online analitycal processing

(ROLAP) menggunakan tabel pada

relational database untuk menyimpan detail data dan aggregasi kubus. Berbeda dengan MOLAP, ROLAP tidak menyimpan salinan

database tapi mengakses langsung pada tabel fakta ketika membutuhkan jawaban sebuah query, sehingga query pada ROLAP mempunyai response time yang lebih lambat dibandingkan MOLAP maupun HOLAP. Karakteristik model ini digunakan untuk menyimpan data yang besar dan jarang dilakukannya proses query. Misalkan, data histori dalam jumlah besar dari beberapa tahun yang sebelumnya.

HOLAP

Hybrid OLAP, Menggabungkan

teknologi ROLAP dan MOLAP. HOLAP menggabungkan kelebihan-kelebihan yang ada pada keduanya, skalabilitas yang lebih besar dari ROLAP dan perhitungan yang lebih cepat dari MOLAP. HOLAP menggunakan relational database untuk menyimpan detil data dan menggunakan

multidimentional database untuk menyimpan agregasinya.

Arsitektur Komponen OLAP Pentaho

Mondrian merupakan aplikasi server

OLAP berbasis open source yang sangat populer dan saat ini bernaung di bawah Pentaho Corporation. Proyek Mondrian ini merupakan kombinasi yang sangat baik dengan JPivot - interface berbasis web yang juga merupakan proyek open source. Gambar 2 menunjukkan gambaran semantik dari komponen Pentaho Analysis Services

dan hubungan diantara komponen tersebut. Urutan peristiwa pada Gambar 4

menjelaskan apa yang terjadi ketika pengguna menggunakan aplikasi Pentaho OLAP (Bouman & Doungen 2009).

1 Pengguna web browser menggunakan sebuah HTTP request untuk melihat,

browse atau drill down kedalam tabel pivot OLAP

2 JPivot servlet menerima request dari pengguna dan menerjemahkan request

tersebut kedalam sebuah MDX query. MDX query ini kemudian dikirmkan ke Mondrian engine

3 Mondrian menginterpretasikan MDX

query dan menerjemahkannya kedalam satu atau lebih SQL query. Teknik khusus ini disebut sebagai ROLAP, yang merupakan singkatan dari

Relational OLAP

4 Relational Database Management System (RDBMS) mengeksekusi query

yang diberikan oleh Mondrian. Mondrian menerima hasil query dalam bentuk tabular (relational)

5 Mondrian memproses hasil yang

diterima dari RDBMS dan menerjemahkannya kedalam result-set

multidimensi. Ini sebenarnya adalah hasil query MDX dari query MDX yang dikirim ke Mondrian pada langkah 2

6 JPivot menggunakan hasil

multidimensi untuk membuat halaman HTML menampilkan data. Inilah yang kemudian dikirim ke browser untuk ditunjukkan kepada pengguna

Metode Pengembangan Data Warehouse

Metode yang digunakan untuk merancang database operasional meliputi tahapan yang didefinisikan dengan baik. Tahap pertama adalah spesifikasi kebutuhan yang terdiri dari mengumpulkan permintaan pengguna ke dalam spesifikasi yang koheren dan ringkas. Tahap berikutnya, desain konseptual, desain logis, dan desain fisik yang merupakan hasil penerjemahan dari kebutuhan pengguna.

Karena data warehouse adalah database

yang khusus ditujukan untuk mendukung proses pengambilan keputusan, tahapan yang digunakan dalam desain database

konvensional diadopsi untuk pengembangan

(42)

Schema File (XML)

RDBMS

Mondrian ROLAP Engine

4. Relational Result Read Metadata

<schema> <cube>

………

Edit Publish

Pentaho Schema Workbench XML Editor Pentaho Agregator Designer Metadata and Beck End

OLAP Front End

1. HTTP Request

Optimize, Publish Web Browser Crosstab

6. HTML

Gambar 4 Gambaran komponen Pentaho OLAP (Bouman & Doungen 2009).

Selama proses pengumpulan kebutuhan, pengguna di berbagai tingkat manajemen diwawancara untuk mengetahui analisis kebutuhan mereka. Spesifikasi yang diperoleh berfungsi sebagai dasar untuk membuat sebuah skema database yang mampu merespon permintaan pengguna. Dalam banyak situasi, karena kurangnya model konseptual yang diterima baik untuk aplikasi data warehouse, desainer

melewatkan tahap desain konseptual dan menggunakan representasi logis berdasarkan skema bintang dan / atau skema kepingan salju. Selanjutnya desain fisik mempertimbangkan fasilitas yang disediakan oleh DBMS yang ada untuk melakukan penyimpanan, pengindeksan, dan manipulasi data yang terdapat pada data warehouse.

warehouse berbeda secara signifikan dari

pengembangan sistem database

konvensional. Oleh karena itu, modifikasi terhadap metode yang dijelaskan di atas sangat penting. Sebagai contoh, tidak seperti

database konvensional, data dalam data warehouse diekstrak dari sistem beberapa sumber. Sebagai akibatnya, beberapa pendekatan untuk desain data warehouse

tidak hanya mempertimbangkan kebutuhan pengguna tetapi juga ketersediaan data. Selain itu, karena dalam banyak kasus data diambil dari berbagai sumber maka harus ditransformasikan sebelum dimuat ke dalam

data warehouse, maka perlu

(43)

Keterangan:

: Optional

M LITIAN

Taha nelitian

ini dapa nelitian

ini

ni dilakukan desain logis t-atribut yang didapat pada h

P

ni data sudah siap untuk

data warehouse. Tahap

ni melakukan konversi data n pada proses ETL kedalam

ni dilakukan setelah pembuatan house selesai. Pengujian ini ila

Tahap ketiga yang dilakukan pada penelitian ini adalah membuat data

pengembangan

data warehouse (Malinowski &

Gambar 5 Gambaran metode

ETODE PENE

pan yang dilakukan pada pe t dilihat pada Gambar 6. Pe

menggunakan data pada penelitian sebelumnya sehingga tahapan spesifikasi kebutuhan, proses ekstraksi, dan transformasi data tidak dilakukan.

Desain Logis

Pada tahap i terhadap atribu

ta apan sebelumnya. Dari atribut-atribut tersebut, ditentukan yang menjadi ukuran (measure) dan yang bukan ukuran ( non-measure) pada sebuah tabel fakta. Selain itu ditentukan pula dimensi beserta hierarki dari

dimensi tersebut dan skema yang terbentuk pada tahapan ini. Pada tahapan ini, terdapat beberapa perbedaan dengan penelitian sebelumnya diantaranya adalah skema yang digunakan dan kubus data yang terbentuk.

Mulai

Gambar 6 Diagram alir metode penelitian.

roses Loading

Pada tahap i dimasukkan ke

pemuatan bertujuan untuk memuat data yang terseleksi ke dalam data warehouse tujuan dan membuat indeks yang diperlukan.

Desain Fisik

Tahapan i yang dihasilka

sistem manajemen basis data MySQL.

Uji Query

Tahap i data ware

d kukan untuk melihat apakah operasi dasar OLAP berhasil diimplementasikan dan sesuai dengan informasi yang ditampilkan. Pengujian dilakukan dengan memvisualisasikan kubus data dengan grafik dan tabel pivot.

Pembuatan Data Warehouse

Zimányi 2008).

Spesifikasi Kebutuhan

Desain Konseptual

Desain Logis

Desain Fisik Proses ETL

Selesai Uji Query

Data Warehouse Final

TAHAP II

TAHAP III TAHAP I

Mulai

Desain Logis

Proses Loading

Desain Fisik

Uji Query

Data Warehouse Final

(44)

Keterangan:

: Optional

M LITIAN

Taha nelitian

ini dapa nelitian

ini

ni dilakukan desain logis t-atribut yang didapat pada h

P

ni data sudah siap untuk

data warehouse. Tahap

ni melakukan konversi data n pada proses ETL kedalam

ni dilakukan setelah pembuatan house selesai. Pengujian ini ila

Tahap ketiga yang dilakukan pada pengembangan

data warehouse (Malinowski &

Gambar 5 Gambaran metode

ETODE PENE

pan yang dilakukan pada pe t dilihat pada Gambar 6. Pe

menggunakan data pada penelitian sebelumnya sehingga tahapan spesifikasi kebutuhan, proses ekstraksi, dan transformasi data tidak dilakukan.

Desain Logis

Pada tahap i terhadap atribu

ta apan sebelumnya. Dari atribut-atribut tersebut, ditentukan yang menjadi ukuran (measure) dan yang bukan ukuran ( non-measure) pada sebuah tabel fakta. Selain itu

dimensi tersebut dan skema yang terbentuk pada tahapan ini. Pada tahapan ini, terdapat beberapa perbedaan dengan penelitian sebelumnya diantaranya adalah skema yang digunakan dan kubus data yang terbentuk.

Mulai

Gambar 6 Diagram alir metode penelitian.

roses Loading

Pada tahap i dimasukkan ke

pemuatan bertujuan untuk memuat data yang terseleksi ke dalam data warehouse tujuan dan membuat indeks yang diperlukan.

Desain Fisik

Tahapan i yang dihasilka

sistem manajemen basis data MySQL.

Uji Query

Tahap i data ware

d kukan untuk melihat apakah operasi dasar OLAP berhasil diimplementasikan dan sesuai dengan informasi yang ditampilkan. Pengujian dilakukan dengan memvisualisasikan kubus data dengan grafik dan tabel pivot.

Pembuatan Data Warehouse

Zimányi 2008).

Spesifikasi Kebutuhan

Desain Konseptual

Desain Logis

Desain Fisik Proses ETL

Selesai Uji Query

Data Warehouse Final

TAHAP II

TAHAP III TAHAP I

Mulai

Desain Logis

Proses Loading

Desain Fisik

Uji Query

Data Warehouse Final

Gambar

Gambar 3 Skema galaksi (Han & Kamber 2006).
Gambar 4 Gambaran komponen Pentaho OLAP (Bouman & Doungen 2009).
Gambar 6 Diagram alir metode penelitian.
Tabel 2 Kebutuhan analisis data penjualan   setiap pengguna (Nurhasanah 2009)
+7

Referensi

Dokumen terkait

Hasil pengujian hipotesis ini sejalan dengan faaizin dan Anang (2013) yang menyatakan bahwa kecerdasan emosional/kompetensi emosional tidak berpengaruh signifikan

Rumah Buku di kawasan Manahan Solo tepatnya Kelurahan Karangasem, Kecamatan Laweyan, Kota Surakarta merupakan suatu wadah untuk memfasilitasi segala kegiatan yang berkaitan

Dengan demikian dapat disimpulkan bahwa penderita TB paru yang berobat di Puskesmas Rejosari memiliki perilaku dan persepsi yang baik dalam pengobatan TB paru,

 Report View, mengizinkan untuk menganalisis isi sebuah web site, menghitung berapa total ukuran file yang telah dibuat, file-file mana saja yang tidak terhubung

 Sifat Listrik  Sifat Listrik  tidak sama tidak sama dengan sifat magnet, karena Medan magnet suatu bahan dengan sifat magnet, karena Medan magnet suatu

Karena sebagian besar jasa diberikan oleh orang, seleksi, pelatihan, dan motivasi pegawai dapat membuat perbedaan yang besar dalam kepuasan pelanggan dan berimplikasi

Dari pandangan tersebut di atas maka sistem ekonomi kapitalis menetapkan bahwa permasalahan ekonomi akan muncul pada setiap diri individu, masyarakat atau negara karena

Hasil penelitian ini adalah: Keterlaksanaan Fungsi Kepemimpinan Kepala Madrasah Ibtidaiyah Negeri Sekota Bandar Lampung Tahun 2016 1) Fungsi Instruksi telah berjalan