FA
IM
FAKULTAS
IMPLEMEN
PADA
(STUDI K
FA
DEPA
AS MATEM
INST
ENTASI OL
A DATA P
I KASUS PT
FACHRAN
ARTEMEN
MATIKA D
STITUT PE
B
OLAP SECA
PENJUAL
PT SANG H
N NAZARU
N ILMU K
DAN ILMU
ERTANIAN
BOGOR
2012
CARA
POR
LAN BENI
HYANG S
RULLAH
KOMPUTE
U PENGE
AN BOGOR
RTABLE
NIH
SERI)
ER
ETAHUAN
R
2
IMPLEMENTASI OLAP SECARA
PORTABLE
PADA DATA PENJUALAN BENIH
(STUDI KASUS : PT SANG HYANG SERI)
FACHRAN NAZARULLAH
Skripsi
Sebagai salah satu syarat untuk memperoleh gelar
Sarjana Komputer pada
Departemen Ilmu Komputer
DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
3
ABSTRACT
FACHRAN NAZARULLAH.Portable OLAP Implementation on Data Seed Sales (Case Study : PT Sang Hyang Seri). Supervised by HARI AGUNG ADRIANTO.
Speeding up reporting process and obtaining strategic information based on a multidimensional analysis query can be done by building OLAP applications which is integrated with data warehouse. Central office will consolidate data of seed sales from each branch office that required for data warehouse development.
This research designed for developing a web-based data warehouseusing Mondrian 3.2, star schema and OLAP development. This research produced a web-based OLAP cube which is consist of a fact table Penjualan Benih and three dimension table : Waktu, Kantor Regional, and Komoditi. Users can interact using the facility such as : 1) Selecting dimension that required for display, 2) Display the information in the cube graphic form, 3) Export the data into excel format. Users can use the application to run OLAP operation such as roll-up, drill-dowm, slice, dice, and pivot.
4
Judul Skripsi : Implementasi OLAP Secara Portable pada Data Penjualan Benih (Studi Kasus PT Sang Hyang Seri)
Nama : Fachran Nazarullah
NIM : G64086061
Menyetujui: Pembimbing,
Hari Agung Adrianto S.Si, M.Si NIP. 19760917 200501 1 001
Mengetahui:
Ketua Departemen Ilmu Komputer,
Dr. Ir. Agus Buono, M.Si, M.Kom NIP. 196607021993021001
5
KATA PENGANTAR
Puji syukurpenulis panjatkan ke hadirat Allah Subhanahu wata’alaatas segala curahan rahmat dan karunia-Nya sehingga skripsi ini dapat diselesaikan. Skripsi ini merupakan hasil penelitian yang mengangkat bidang PembangunanData Warehouse Penjualan Benih(Studi KasusPT Sang Hyang Seri).
Penulis mengucapkan terima kasih kepada Bapak Hari Agung Adrianto, S.Si, M.Si selaku pembimbing yang telah memberi saran, masukan, dan ide-ide kepada Penulis dalam menyusun skripsi ini dan kepada para dosen penguji Bapak Firman Ardiansyah, S.Kom, M.Si dan Ibu Dr. Yani Nurhadriyani, S.Si, MT. Penulis juga mengucapkan terima kasih kepada:
1 Ibu dan Bapak serta adik yang selalu memberikan doa, nasihat, dukungan, semangat, dan kasih sayang yang luar biasa kepada penulis sehingga penulis dapat menyelesaikan tugas akhir ini. 2 Teman-teman Ilmu Komputer Ekstensi angkatan tiga yang sudah berjuang bersama-sama sejak
awal sampai sekarang.
3 Departemen Ilmu Komputer, staf, dan dosen yang telah banyak membantu baik selama penelitian maupun pada masa perkuliahan.
Kepada semua pihak lainnya yang telah memberikan kontribusi yang besar selama pengerjaan penelitian ini yang tidak dapat disebutkan satu-persatu, penulis ucapkan terima kasih banyak.
Semoga penelitian ini dapat memberikan manfaat.
Bogor, Desember 2011
6
RIWAYAT HIDUP
Penulis dilahirkan di Leles pada tanggal 27 Juli 1987dan merupakan anak pertama dari tiga bersaudara dengan ayah bernama Voeady Chatha dan ibu bernama Nani Suswanti. Penulis merupakan anak pertama dari tiga bersaudara.
i
DAFTAR ISI
Halaman
DAFTAR TABEL ... vii
DAFTAR GAMBAR ... vii
DAFTAR LAMPIRAN ... vii
PENDAHULUAN
Latar Belakang ... 1
Tujuan ... 1
Ruang Lingkup ... 1
Manfaat Penelitian ... 1
TINJAUAN PUSTAKA
Database
... 2
DataWarehouse
... 2
Online Analytical Processing
(OLAP) ... 3
Model Data Multidimensi ... 3
Pemodelan Penyimpanan Data ... 4
Mondrian ... Error! Bookmark not defined.
MultidimensionalExpression
(MDX) ... 6
Portable
... 6
METODE PENELITIAN
Analisis ... 7
Praproses data ... 7
Pembuatan data
warehouse
... 7
Uji
query
... 7
Pembuatan Aplikasi
Portable
... 7
Lingkungan pengembangan ... 8
HASIL DAN PEMBAHASAN
Analisis data ... 8
Desain Fisik ... 8
Pembersihan data ... 9
Transformasi data ... 9
Pemuatan data ... 9
Proses
Portable
... 10
Gambaran Umum Aplikasi ... 10
Kelebihan dan Kekurangan Aplikasi ... 11
KESIMPULAN DAN SARAN
Kesimpulan ... 11
Saran ... 11
ii
DAFTAR TABEL
Halaman
1
Nama dan deskripsi
table
fakta Jumlah Penjualandari kubus ... 9
2
Detail Table Dimensi ... 9
DAFTAR GAMBAR
Halaman
1
Cube
yang memiliki tiga dimensi kota, waktu, dan kategori produk ... 3
2
Skema Bintang (Malinowski & Zaimanyi 2008) ... 4
3
Skema Kepingan Salju (Malinowski & Zaimanyi 2008) ... 4
4
Skema Kepingan Bintang (Malinowski & Zaimanyi 2008) ... 4
5
Skema Galaksi (Malinowski & Zaimanyi 2008). ... 5
6
Diagram alir metode penelitian dan proses
portable
... 6
7
Arsitektur data
warehouse
dan aplikasi OLAP pada penelitian…..…………...7
DAFTAR LAMPIRAN
Halaman
1. Arsitektur Mondrian... ... 14
2
Contoh
File
Microsoft Excel ……….. ... ...15
3. Data dalam tabel dimensi ……….. ... 17
4. Model hierarki tiap dimensi ... 19
5. Contoh operasi
roll up
... 21
6. Contoh operasi
drill down
... 22
7. Contoh operasi
slice and dice
... 23
8. Langkah instalasi XAMPPLite dan Tomcat pada USB
flashdisk
... 25
PENDAHULUAN Latar Belakang
PT Sang Hyang Seri (PT SHS) merupakan salah satu Badan Usaha Milik Negara (BUMN) yang bergerak di bidang pertanian. Aktivitas rutin yang dilakukan oleh PT SHS berupa pengembangbiakan, pengelolaan, hingga produksi benih pertanian. Ada beberapa jenis benih yang menjadi konsentrasi utama PT SHS, yaitu benih padi, benih jagung, benih kedele, benih hortikultura, hasil pertanian serta sarana pertanian.
PT.SHS memiliki enam Kantor Regional (KR) dan satu Pusat Benih Sentral (PBS) yang tersebar di seluruh Indonesia. Setiap KR dan PBS bertugas untuk melakukan seluruh proses produksi benih untuk menghasilkanbenih-benih terbaik. Benih yang dihasilkan dari proses produksi di setiap KR dan PBS akan dijadikan sebagai cadangan pangan nasional bahkan ada yang di ekspor sehingga dapat menambah devisa negara.
Sebagai sebuah BUMN yang mendapat pengawasan langsung dari Pemerintah Indonesia melalui Kementerian Pertanian (Kementan), PT SHS diwajibkan untuk menyediakan laporan penjualan benih yang dapat dijadikan sebagai kontrol pemasukan keuangan negara melalui bidang pertanian. Dalam menyajikan laporan penjualan benih, PT SHS harus mengonsolidasikan seluruh laporan penjualan dari setiap KR dan PBS. Saat ini PT SHS belum memiliki database yang terintegrasi karena setiap KR dan PBS masih menggunakan berbagai jenis aplikasi berbeda seperti Microsoft Excel di KR 1 Sukamandi dan
Lotus di KR 3 Malang sehingga penyediaan laporan akan memakan waktu yang lama karena diperlukan penyesuaian dari data yang dikirimoleh KR dan PBS.
Pemercepatan proses pelaporan dan memperoleh informasi yang akurat berdasarkan
query analysis yang multidimensi dapat dilakukan dengan membangun aplikasi OLAP yang diintegrasikan dengan data warehouse. Proses pembuatan data warehouse dilakukan
dengan mengambil, mengumpulkan,
mempersiapkan, menyimpan, dan menyediakan data untuk aplikasi yang menyimpan query atau
reporting.
Saat ini, sudah banyak teknologi data
warehouse yang menggunakan OLAP server
sebagai tool salah satunya adalah Mondrian(http://Mondrian.pentaho.org). Indriani (2010) membangun data warehouse
dan operasi-operasi OLAP untuk penjualan produk Bakosurtanal dengan menggunakan Mondrian. Mondrian merupakan OLAP server
yang menggunakan penyimpanan data relasional (ROLAP) yang dikembangkan dengan Java dan memungkinkan pengguna menggunakan dataset yang disimpan di
database secara interaktif.
Perkembangan data warehouse dan OLAP semakin berkembang dalam beberapa kurun waktu, salah satunya yaitu pengembangan data
warehouse dan OLAP yang disajikan secara
portable. Ada beberapa hal yang menjadi alasan mengapa pengembangan data warehouse dan OLAP secara portable dirasa perlu diantaranya, 1 Infrastruktur yang belum tersedia di masing-masing KR dan PBS sehingga menjadi kendala jika akan melakukan analisis secara
online.
2 Kemudahan dalam mengakses OLAP server
tanpa harus melakukan instalasi berbagai jenis server terlebih dahulu dan dapat menjalankan OLAP server dimana saja dan kapan saja.
Akan tetapi, pengembangan secara portable
juga masih mendapatkan beberapa kendala yaitu tidak update-nya informasi dan data yang digunakan untuk melakukan analisis.
Tujuan
Tujuan penelitian ini ialah membangun suatu sistem datawarehouse dan aplikasi OLAP yang portablesehingga dapat mendukung analisis penjualan benih sesuai kebutuhan pada PT SHS.
Ruang Lingkup
Ruang lingkup penelitian ini adalah: 1 Penelitian ini akan merancang data
warehouse dan aplikasi OLAP berbasis web
dengan menggunakan aplikasi Mondrian sebagai OLAP server.
2 Data yang digunakan adalah data penjualan benih PT SHS tahun 2008 sampai dengan 2009.
3 Merancang sistem agar dapat menjalankan aplikasi Mondrian dapat dijalankan secara
portable melalui USB drive.
Manfaat Penelitian
1 Dapat mengintegrasikan database penjualan benih PT SHS dengan menggunakan data
warehouse.
2 Dapat mendukung pengambilan keputusan yang strategis untuk mencapai tujuan bisnis yang didapat secara informatif, cepat dan akurat.
TINJAUAN PUSTAKA
Database
Database dapat dikatakan sebagai tempat penyimpanan data yang saling berhubungan satu dengan lainnya sehingga dapat digunakan untuk mendapatkan informasi yang diperlukan oleh suatu perusahaan atau organisasi.
Data dan informasi yang diperoleh suatu perusahaan dan organisasi pada umumnya menggunakan OLTP (Online Transaction Processing) atau dapat disebut juga dengan kegiatan operasional sehari-hari dan hasil dari transaksi.
Menurut Conolly dan Begg (2005), database
memiliki sifat berikut: 1 Berbagi Data
Data yang tersimpan dalam database tidak mutlak hanya dimiliki oleh satu pihak, namun dapat diakses serta dimanfaatkan oleh banyak pihak dalam satu waktu tertentu.
2 Integrasi Data
Database dapat membawa banyak keuntungan bagi organisasi atau perusahaan sehingga database diharuskan memiliki integrasi data yang mengkolektifkan data yang berasal dari berbagai sumber berbeda sehingga dapat dimanfaatkan untuk keperluan organisasi atau perusahaan. 3 Integritas Data
Salah satu sifat database lainnya yaitu integritas data yang mampu menjaga setiap perubahan data yang terjadi.
4 Keamanan Data
Sifat lainnya yaitu keamanan data yang memastikan integritas data. Untuk memastikan hal tersebut dilakukan dengan pembatasan akses untuk tujuan keamanan. 5 Abstraksi Data
Database dianggap sebagai model nyata. Data dan informasi yang disimpan dalam
database pada umumnya merupakan sebuah usaha untuk menyajikan sifat dari objek
sesungguhnya. Akan tetapi, database tidak dapat menyimpan semua sifat dari objek sehingga database dikatakan sebagai abstraksi data.
6 Independensi Data
Independensi Data adalah kemampuan untuk melakukan pengubahan pada struktur data tanpa membuat pengubahan pada program yang memproses data. Jika suatu perubahan dibuat ke dalam beberapa bagian dari suatu sistem aplikasi, semestinya perubahan itu tidak mempengaruhi struktur dasar yang digunakan oleh aplikasi.
Dari pengembangan model database, muncul satu istilah baru yang lebih khusus yaitu
datawarehouse.
DataWarehouse
Datawarehouse adalah kumpulan data dari berbagai sumber terpisah dan berbeda yang dikumpulkan dalam satu tempat penyimpanan yang berukuran besar lalu diproses menjadi bentuk penyimpanan multi-dimensional dan didesain untuk querying dan reporting.
Datawarehouse merupakan suatu sistem yang mengonsolidasikan data secara periodik dari sistem-sistem yang ada (OLTP) dalam suatu penyimpanan dimensional. Pada umumnya, datawarehouse menyimpan data histori beberapa tahun dan akan dilakukan
query untuk keperluan business intelligence
atau aktivitas analisis lainnya (Rainardi 2008). Ada empat karateristik utama yang membedakan data warehouse dengan database
seperti yang dijelaskan oleh Han dan Kamber (2006):
1 Berorientasi Subjek
Datawarehouse lebih diorganisasikan pada subjek-subjek utama seperti halnya konsumen, pemasok, produk dan penjualan daripada terfokus pada proses operasi dan transaksi yang bersifat harian. Hal ini dikarenakan data warehouse berorientasi untuk membuat model dan analisa data yang dapat digunakan untuk penunjang pengam-bilan keputusan,sehingga datawarehouse
memberikan kemudahan kepada subjek dengan menyediakan pola pandang dengan mengabaikan data yang tidak berguna dalam pengambilan keputusan.
2 Terintegrasi
Datawarehouse dapat menyimpan data-data yang berasal dari berbagai jenis dan format
yang konsisten dan saling integrasi satu sama lain. Teknik datacleaning dan integrasi data diterapkan untuk memastikan konsistensi dalam hal keseragaman penamaan, struktur pengkodean, pengukuran atribut, dan hal lainnya.
3 Time Variant (Rentang Waktu)
Data disimpan untuk menyediakan informasi dari perspektif historical. Setiap data pada
datawarehouse dapat dikatakan valid jika memiliki rentang waktu tertentu seperti 5-10 tahun ke belakang.
4 Non Volatile
Data terpisah dari pangkalan data operasional sehingga hanya memerlukan pemuatan dan akses data tanpa perlu proses transaksi, recovery, dan mekanisme kontrol yang hanya memerlukan dua operasi dalam mengakses data yaitu pemasukan data pertama dan pengaksesan data.
Online Analytical Processing (OLAP)
OLAP merupakan suatu istilah yang digunakan untuk menganalisis dan menggambarkan teknologi yang dapat membantu pengguna dalam menyajikan informasi yang stategis untuk keperluan analisis data yang berasal dari sebuah data warehouse
dalam bentuk berbagai tampilan data dan didukung dengan representasi data grafik yang dinamis.
Beberapa operasi OLAP menurut Han dan Kamber (2006) yaitu:
- Roll Up (drill-up)
Ringkasan data yang menaikan agregasi konsep hirarki atau mereduksi dimensi. Misalnya tiap kota diberi nilai total penjualan, total penjualan tiap propinsi didapatkan dengan menjumlahkan total penjualan di setiap kota dalam satu propinsi.
- Drill Down (roll down)
Kebalikan dari roll up, yaitu dengan merepresentasikan data secara lebih detail atau spesifik dari level tinggi ke level rendah. Misalnya setiap propinsi diberikan nilai total penjualan, maka total penjualan dapat dilihat hingga ke level kota dari setiap propinsi.
- Slice and Dice
Slice adalah pemilihan data satu dimensi dari kubus data bersangkutan sedangkan dice
mendefinisikan subcubedengan memilih dua dimensi atau lebih.
- Pivot (Rotate)
Memvisualisasikan operasi yang merotasi sumbu data dalam view sebagai alternatif dalam presentasi data.
Model Data Multidimensi
Model data multidimensi merupakan suatu model yang dikembangkan dan digunakan dalam data warehouse untuk memfasilitasi analisis, bukan transaksi, sehingga akan memiliki banyak konsep intuitif dari banyak dimensi atau sudut pandang yang berbeda atau fakta-fakta.
Pada umumnya, dimensi merupakan suatu perspektif atau entitas yang digunakan untuk menyimpan beberapa record yang memiliki keterkaitan satu sama lain. Setiap dimensi memiliki sebuh tabel yang berkaitan disebut sebagai tabel dimensi.
Cube merupakan salah satu contoh implementasi dari data multidimensi. Dengan
cube, data akan menjadi lebih mudah untuk dimanipulasi. Pada cube juga terdapat banyak sumbu yang menjadi representasi dari dimensi-dimensi yang tersedia. Unsur penting lainnya ialahmeasure yang merupakan nilai kuantitatif
database yang akan dianalisis. Contoh nilai
measure ini biasanya berupa nilai penjualan, biaya, budget, produk, dan lainnya. Bentuk dari
cube dapat dilihat pada Gambar 1.
Menurut Malinowski dan Zimanyi (2008) data multidimensi memiliki beberapa tipe skema yaitu:
1 Skema Bintang (star schema)
Skema bintang terdiri atas satu tabel fakta dan satu set tabel dimensi dengan setiap tabel merupakan representasi dari dimensi. Skema bintang ini memungkinkan terjadinya redudansi data karena table tidak dinormalisasi. Sebagai contoh kasus, skema
Gambar 1Cube yang memiliki tiga dimensi kota,
bintang memiliki satu table fakta Sales dan memiliki empat tabledimensi, yaitu Store, Product, Promotion, dantime. Untuk lebih jelas dapat dilihat pada Gambar 2.
2 Skema Kepingan Salju (Snowflake Schema) Skema kepingan salju (snowflake schema) memperbaiki kekurangan yang ada pada skema bintangyaitu menghilangkan redudansi data karena sudah menerapkan normalisasi tabledatabase. Skema ini terdiri atas satu tabel fakta dan memiliki beberapa tabel dimensi yang saling berhubungan. Akan tetapi, dampak yang terjadi akibat normalisasi table dan banyaknya tabel dimensi yang saling berkaitan yaitu semakin lambatnya waktu pengeksekusian query
karena akan semakin banyak tabel yang
di-join. Dengan menggunakan contoh yang sama pada skema bintang, dihasilkan skema kepingan saljuyang telah dinormalisasi pada tableProduct dan Store sehingga bertambah empat table baru, yaitu Category,
Departement, City,dan State.Contoh skema kepingan saljudapat dilihat pada Gambar 3. 3 Skema Kepingan Bintang (Starflakes
Schema)
Skema galaksi merupakan kombinasi antara skema bintang dan skema kepingan salju dengan beberapa tabel ada yang dinormalisasi dan ada juga yang tidak. Dengan menggunakan contoh yang sama dengan dua skema sebelumnya, pada skema kepingan bintang (starflakes)terjadi sedikit perubahan pada tableProduct dan Store.
Terlihat bahwa table Store sama seperti pada skema bintang tidak dinormalisasi, sedangkan pada table Product terjadi normalisasi sama seperti pada skema kepingan salju. Contoh skema kepingan bintang dapat dilihat pada Gambar 4. 4 Skema Galaxy (Constellation Schema)
Skema terakhir adalah skema galaxy yang memiliki beberapa table fakta yang dapat digunakan lebih dari satu table dimensi. Skema galaxy dapat terdiri atastable dimensi yang dinormalisasi ataupun tidak. Sebagai contoh skema galaxy memiliki dua table
fakta Sales dan Purchase yang digunakan oleh dua table dimensi yang berbeda yaitu
tableTime dan Product, seperti ditunjukan pada Gambar 5.
Pemodelan Penyimpanan Data
Cube merupakan implementasi dari model data multi dimensi diperlukan model tertentu untuk melakukan penyimpanan data ke dalam
cube.
Gambar 4Skema Kepingan Bintang (Malinowski & Zaimanyi).
Gambar 2 Skema Bintang (Malinowski & Zimanyi 2008).
Menurut Bouman dan Doungen(2009) terdapat tiga jenis model penyimpanan data digunakan dalam menyimpan hasil pemrosesan OLAP, yaitu:
1 MultidimensionalOLAP (MOLAP)
Pada model MOLAP penyimpanan data dan agregasi dilakukan dalam format multidimensi. Struktur MOLAP tidak tersimpan pada datawarehouse tetapi pada OLAP server sehingga query yang dihasilkan akan sangat baik. Model penyimpanan ini sangat sesuai digunakan untuk database dengan skala yang kecil dan sedang.
2 Relational OLAP (ROLAP)
Model penyimpanan ROLAP meng-gunakan tabel pada relational database
yang digunakan untuk menyimpan detail data dan agregasi kubus. ROLAP tidak menyimpan salinan database tapi akan mengakses langsung pada tabel fakta ketika membutuhkan hasil yang sesuai dengan
querysehingga response time yang dihasilkan pada model ROLAP akan lebih lambat. Model ini digunakan untuk menyimpan data yang besar dan jarang dilakukan proses query. Sebagai contoh penggunaan model ROLAP yaitu pada data historis dalam jumlah besar dari beberapa tahun sebelumnya.
3 Hybrid OLAP (HOLAP)
Model ini merupakan gabungan dari dua model sebelumnya, yaitu MOLAP dan ROLAP. HOLAP menggabungkan
kele-bihan yang ada pada dua model sebelum-nya, yaitu menggunakan relational database untuk menyimpan detail data dan menggunakan multidimensional database
untuk menyimpan agregasinya. Penyim-panan HOLAPbaik digunakan untuk cube
yang membutuhkan performa query yang baik dengan jumlah data yang sangat besar.
Mondrian
Mondrian merupakan salah satu aplikasi
server OLAP (Online Analytical Processing) yang berbasis bahasa pemrograman Java. Mondrian mengeksekusi query yang ditulis dengan bahasa MDX (Multi-Dimensional Expression), membaca data dari database
relasional (RDBMS), dan merepresentasikan hasil multidimensional dengan format Java API. Aplikasi yang diprakarsai oleh Julian Hyde dari Amerika Serikat dan sekarang menjabat sebagai Project Leader dari Mondrian ini,
bernaung di bawah Pentaho
Corporation.Mondrian merupakan kombinasi yang sangat baik antara JPivot – interface
berbasis web yang merupakan bagian dari proyek open source.
Pada Lampiran 1, terdapat arsitektur gambaran arsitektur Mondrian. Arsitektur Mondrian terdiri atas empat layer yaitu: 1 Presentation Layer(Lapisan Presentasi)
Layer ini merupakan bagian yang menghubungkan antara keinginan peng-guna dan aplikasi Mondrian. Pengpeng-guna dapat memberikan masukan melalui Swing
atau JSP. Setiap masukan memiliki kesamaan tata bahasa multidimensi yang disebut Multidimensional Expression
(MDX). Kemudian setiap masukan akan ditampilkan kepada pengguna dalam bentuk tabel pivot, grafik pie, grafik garis, dan grafik batang. Semua grafik tersebut ditampilkan dalam format Joint Photographic Experts Group (JPEG) dan
Graphics Interchange Format (GIF).
2 Dimensional Layer(Lapisan Dimensi) Lapisan ini merupakan lapisan kedua yang terlebih dahulu melakukan koneksi dengan
database serverkemudian melakukan
parsing, memvalidasi, dan menjalankan
query MDX.Untuk efisiensi, lapisan Cell Request akan mengirimkan permintaan ke lapisan Cached Agregasi. Sebuah query transformer memungkinkan pengguna memanipulasi query yang sudah ada
daripada harus membuat
statementMDXdari awal untuk setiap permintaan.
3 Star Layer(Lapisan Bintang)
Lapisan ketiga ini bertanggung jawab untuk menjaga Cached Agregasi. Agregasi adalah suatu rangkaian nilai measures atau disebut
cells pada memori. Lapisan bintang ini akan menerima permintaan seperangkat
cells dari lapisan dimensi.Jika cells yang diminta tidak ada dalam cache,Agregasi
Loader akan mengirimkan permintaan ke lapisan penyimpanan (Storage Layer).
4 Storage Layer.(Lapisan Penyimpanan) Lapisan terakhir atau lapisan keempat ini lebih khusus menjadi lapisan untuk
database yang menyediakan data cells
agregasi yang berasal dari lapisan bintang.
Selain keempat lapisan yang sudah dijelaskan di atas terdapat satu komponen atau modul yang disebut SchemaLoader.
SchemaLoader pada Mondrian disebut
SchemaWorkbench. SchemaWorkbench
merupakan sebuah aplikasi GUI yang digunakan untuk membuat file skema Mondrian dalam format XML untuk memetakan cube, dimensi, dan measure dengan database relational.
MultidimensionalExpression (MDX)
Pada penjelasan sebelumnya Mondrian memiliki kesamaan tata bahasa yang disebut
Multidimensional Expression (MDX). Menurut Bouman dan Dongen (2006) MDX adalah suatu bahasa yang mengeskpresikan pemilihan (selection), perhitungan (calculation), dan mendefinisikan (definition) beberapa metadata
dari database OLAP kemudian memiliki
kemampuan khusus agar dapat
merepresentasikan hasil query. Tidak seperti beberapa bahasa OLAP lainnya, hasil query
MDX dikembalikan kepada pengguna dalam bentuk data yang terstruktur yang akan diproses menjadi grafik atau beberapa bentuk output
lainnya.
MDX memiliki cara kerja yang mirip dengan SQL yang digunakan untuk melakukan
query pada database relational.Akan tetapi, MDX memiliki stuktur yang berbeda dengan SQL. Berikut contoh query dasar yang pada MDX :
Select
{[Measures].[Unit Sales],[Measures]. [Store Sales]} On Columns,
{[Time]. [1997],[Time].[1998]} On Rows From [Sales]
Where [Store].[USA].[CA].
Pada contoh diatas dapat dijelaskan bahwa MDX memiliki dua komponen utama yaitu
SELECT danFROMserta satu komponen yang
opsional yaitu WHERE.Pernyataan
SELECTmenunjukkan ada dua sumbu dimensi yang dihasilkan, yaitu sumbu ROWSdan
COLUMNS. Pernyataan FROM menunjukan dimensi yang dijadikan sebagai sumber utama. Pada contoh, data yang diambil berasal dari dimensi Sales. Pernyataan WHERE
menunjukkan dimensi atau anggota dimensi yang dijadikan sebagai filter agar dapat menampilkan data tertentu saja.
Portable
Portabel dapat didefinisikan sebagai suatu hal yang mudah untuk dibawa serta memungkinkan untuk ditransfer dan diadaptasi.
Portable merupakan suatu perangkat yang dapat digunakan kapan saja dan dimana saja. Perangkat portable terbagi dalam dua kategori yaitu perangkat lunak dan perangkat keras. Salah satu contoh perangkat keras yang
portable adalah USB flash drive atau lebih dikenal dengan flashdisk. Perangkat lunak
portable sering disebut dengan aplikasi
portable.
Aplikasi portable adalah sebuah perangkat lunak yang dijalankan pada perangkat keras tanpa harus melakukan instalasi terlebih dahulu sehingga pada saat perangkat keras portable
dihubungkan ke komputer maka aplikasi
portable dapat langsung digunakan. Kelebihan dari aplikasi portable yaitu dapat membawa data serta program yang dibutuhkan sehingga dapat dijalankan kapan saja dan di komputer mana pun. Sisi keamanan juga akan lebih terjamin karena data yang diperlukan hanya berada pada perangkat portable yang dimiliki tidak disimpan pada komputer tertentu.
Akan tetapi, perangkat portable bukan tidak memiliki kekurangan. Karena perangkat keras
portable memiliki kapasitas yang terbatas sehingga data yang dapat disimpan juga memiliki batas. Selain itu kemampuan akses data juga tidak akan maksimal karena USB
T diba untu kedu suda pene Ana A men ware peng bebe fisik P peng atrib dipe mem men kem data Prap S data prap prap meli 1 P T m p d sa p 2 T P d t y 3 P T y d Pem T data penj sam METO
Tahapan pene bagi menjadi du tuk mengemba dua untuk menj dah terbentuk nelitian dapat di
nalisis
Analisis meru enentukan spe
arehouse yang s ngguna. Tahap a berapa desain y sik.
Pada tahap ana ngumpulan data ribut dari data peroleh nilai da embangun sebu enentukan nilai
mudian dilanju ta.
raproses data
Sebelum mene
tawarehouse
aproses data aproses pada da eliputi:
Pembersihan Tahap pemb menyaring dat penamaan kare dari KR dan sangat dimun penamaan di se Transformasi d Pada tahap dilakukan peny tabel hasil pem yang digunakan Pemuatan data Tahap ini mel yang sudah m dalam datawar
embuatan data
Tahap selan
tawarehouse d njualan benih mpai dengan 200
ODE PENELIT
nelitian yang a dua bagian, yang mbangkan dataw
njalankan data w
secara port
dilihat pada Gamb
merupakan tahap spesifikasi ke sesuai dengan p analisis awal in yaitu desain log
nalisis ini juga h ta untuk mengan ata tersebut se data atribut ya buah datawareh
i dan atribut yan jutkan ke taha
neruskan ke tah sangat dipe terlebih dah data penjualan
mbersihan dila ata yang tidak rena data yang d n PBS yang be
ungkinkan terj setiap KR dan P si data
p transformasi enyeragaman na embersihan sesua kan pada datawa
ta
elakukan pemu melewati tahap
arehouse yang a
a warehouse anjutnya yaitu
dengan meng PT SHS mul 009.
ITIAN
akan dilakuka ang pertama yait
warehouse da
warehouse yan
ortable. Metod ambar 6.
ap awal untu kebutuhan dat an keinginan da
ini menghasilka logika dan desai
a harus dilakuka ganalisis nilai da sehingga dapa yang tepat untu
rehouse. Setela yang tepat, prose hapan praprose
tahap pembuata iperlukan taha ahulu. Tahapa n benih PT SH
ilakukan untu k konsisten pad g diterima berasa berbeda sehingg erjadi perbedaa
PBS.
si data, aka nama atribut da suai dengan nam
arehouse.
uatan (load)dat p sebelumnya k akan dibangun.
itu pembuata nggunakan dat ulai tahun 200 kan aitu dan ang ode tuk data dari kan sain kan dan apat tuk elah ses ses atan hap pan HS tuk ada asal gga aan kan dari ama data ke n. atan data 008
Uji que Uji setelah Penguj operasi informa dibutuh memvi dan tab Pembu Prose meranc data portabl aplikas pengatu yang a mengga dilakuk Ada untuk p lingkun Gambar Pro uery
ji query merupa ah pembuatan da ujian dilakukan asi dasar OLA
masi yang sesua tuhkan. Pengu
visualisasikan k abel pivot.
buatan Aplikasi
roses yang te ncang agar selur
warehouse d
ble.Dalam prose asi dan pengatu aturan yang dila akan digunak ganggu dan me ukan pada proses dapun beberapa k proses ini, dapa
ungan pengemba
ar 6 Diagram alir
portable.
roses Portable
pakan tahap yan data warehouse
n untuk menget LAP sudah m suai dan tepat d gujian dilakuk
kubus data de
asi Portable terakhir dilak luruh hasil prose dapat dijalan oses ini digunak aturan khusus. ilakukan hanya p
akan sehingga merubah proses ses sebelumnya. pa aplikasi yan apat dilihat pada
bangan dibawah
lir metode peneliti
ang dilakukan telah selesai. getahui apakah menampilkan t dengan yang ukan dengan dengan grafik
akukan yaitu ses pembuatan ankan secara akan beberapa s. Akan tetapi, a pada aplikasi a tidak akan ses yang sudah
a.
ang digunakan da pembahasan
ah ini.
Lingkungan pengembangan
Lingkungan pengembangan yang digunakan untuk mengembangkan aplikasi OLAP adalah:
Perangkat lunak minimal yang digunakan : 1 Mondrianserver
2 Sistem operasi Windows XP 3 Schema Workbench 4 Web Browser
5 Paket XAMPP yang memiliki fitur a. Web Server Apache
b. MySQL Server
c. Apache Tomcat d. PHP
Perangkat keras minimal yang digunakan adalah:
1 Processor IntelCore 2 Duo 2 Memory RAM 512 MB 3 Harddisk 80 GB 4 Keyboard dan mouse
5 Monitor
6 USB Flashdisk 4 GB
HASIL DAN PEMBAHASAN Analisis data
Selama ini, proses analisis data hasil penjualan benih masih dilakukan secara manual dengan melakukan konsolidasi laporan penjualan dari setiap KR dan PBS. Petugas Konsolidasi Kantor Pusat menerima laporan penjualan bulanan pada tanggal 20 setiap bulannya dalam bentuk Microsoft Office Excel
untuk selanjutnya dilakukan konsolidasi. Untuk membuat laporan masih dilakukan query
manual pada setiap tabel data di Microsoft Office Excel. Laporan yang berbeda dari setiap KR dan PBS menyebabkan waktu untuk menyediakan laporan konsolidasi menjadi lebih lama. Contoh bentuk laporan dalam bentuk
Microsoft Exceldapat dilihat pada Lampiran 2. Atribut yang akan digunakan, dipilih berdasarkan ketentuan berikut:
- Atribut yang dipilihmemiliki relasi dengan atribut di tabel data yang lain.
- Data yang dianalisis tidak terlalu banyak mengandung nilai null.
Setelah proses analisis, proses selanjutnya ialah menentukan desain konseptual dengan cara memilih atribut-atribut yang menjadi ukuran (measure) dan non ukuran (non measure).Perlu dilakukan pemilihan atribut yang sesuai dengan kebutuhan analisis data penjualan.
Berdasarkan hasil analisis yang membutuhkan kecepatan kesediaan data yang lebih ringan dan memungkinkan penjelajahan data yang lebih dalam maka dalam pembangunan data warehouse ini digunakan skema bintang sehingga hanya diperlukan satu tabel fakta dan beberapa tabel dimensi. Skema bintang dapat dilihat pada Gambar 5. Untuk lebih mendukung kecepatan query, dilakukan pengubahan susunan identitas pada setiap table
dengan menggunakan tipe stringatau varchar.
Format penulisan identitas table akan disesuaikan dengan data sehingga cukup dengan satu query akan didapatkan hasil yang diinginkan. Contoh format penulisan identitas
tabledapat dilihat pada Lampiran 3.
Dalam penelitian ini,dihasilkan satu tabel fakta, yaitu penjualan_benih, dan tiga tabel dimensi, yaitu dimensi waktu, dimensi regional serta dimensi komoditi. Untuk masing-masing dimensi ditentukan tingkat perincian yang diperlukan beserta hierarki yang membentuk-nya. Dimensi waktu disusun menjadi tiga level, yaitu tahun > semester > bulan. Dimensi regional dapat disusun menjadi satu level, yaitu kantor regional, sedangkan dimensi komoditi dapat disusun menjadi dua level, yaitu jenis komoditi > nama komoditi. Model hierarki setiap dimensi dapat dilihat pada Lampiran 4.
Desain Fisik
Desain fisik nama dan deskripsi tablefakta Jumlah Penjualandari kubus dapat dilihat pada Tabel 1.
Tabel1Nama dan deskripsi tabelfaktaJumlah
Penjualan dari kubus.
Kolom Status Deskripsi
Waktu Dimensi Bulan dan tahun Penjualan Regional Dimensi Kantor Regional Komoditi Dimensi Jenis
Komoditi/Produk Ukuran
jml_penjua lan_rp
Fakta Nama ukuran
dalam rupiah (jumlah jual dalam rupiah) Ukuran
jml_penjua lan_kg
Fakta Nama ukuran
Tabel2 Detail table dimensi Nama Dimensi Nama Field Deskripsi
Tbl_waktu id_waktu Identitas untuk
table dimensi waktu
semester Kolom untuk membagi bulan berdasarkan semester
tahun Menunjukan
tahun dari data yang tersedia
bulan Menunjukan
bulan dari data yang tersedia Tbl_region
al
id_regional Identitas data
dari table
dimensi regional kantor_reg
ional
Nama kantor regional Tbl_komo
diti
id_komodi ti
Identitas data
dari table
dimensi komoditi jenis_kom
oditi
Kategori jenis komoditi
nama_kom oditi
Nama Komoditi
Untuk desain arsitektur pada hasil percobaan ini, penulis mengadopsi arsitektur
three-tier yaitu dengan menggunakan tiga lapis proses. Proses pada lapisan bawah adalah pemrosesan data dan pembuatan skema
datawarehouse dengan DMBS MySQL. Di lapisan tengah, aplikasi OLAP yang
digunakan adalah Mondrian yang
dikembangkan menggunakan bahasa
pemrograman Java dan hanya dapat berjalan pada web server Apache Tomcat. Mondrian dapat menyimpan data dalam bentuk kubus data yang nantinya dapat diakses oleh web server.
Lapisan paling atas adalah visualisasi dari aplikasi OLAP yang dilakukan oleh web browser. Pada lapisan ini pengguna dapat melakukan pencarian data, melihat pola yang dibentuk oleh berbagai jenis data, dan mendapatkan representasi informasi dalam bentuk yang mudah dipahami karena sudah disajikan dalam bentuk crosstab dan grafik. Arsitektur data warehouse pada penelitian ini dapat dilihat pada Gambar 7.
Pembersihan data
Proses pembersihan data dilakukan dengan mengidentifikasi data yang tidak konsisten dalam penggunaan istilah baik karena kesalahan dalam penginputan maupun akibat proses integrasi data.
Setiap KR dan PBS memiliki format yang tidak sama sehingga menyebabkan terdapat beberapa perbedaan dalam penginputan data. Beberapa contoh data yang tidak konsisten seperti RM (Regional Manager) diubah menjadi Kantor Regional.
Saat ini proses pembersihan data masih dilakukan secara manual sehingga membutuhkan waktu yang sedikit lebih lama untuk mengkompilasi dari beberapa sumber data.
Transformasi data
Proses transformasi data dilakukan untuk menyeragamkan nama atribut dari tabel. Data yang dihasilkan memiliki atribut yang berbeda untuk beberapa jenis komoditi sehingga perlu dilakukan penyeragaman. Contoh atribut yang berbeda terdapat pada jenis komoditi benih padi dan diversifikasi. Komoditi diversifikasi memiliki atribut Saprotan reguler, proyek blp, dan proyek lain. Komoditi benih padi memiliki atribut benih jenis ES reguler, proyek, dan buffer stok.Oleh sebab itu perlu dilakukan penyeragaman nama atribut dari data semula sesuai dengan atribut pada dimensi agar menghasilkan data yang konsisten. Sebagai contoh bentuk format laporan dalam Microsoft Excel dapat dilihat pada Lampiran 2.
Pemuatan data
Proses ekstraksi dan transformasi data sudah dilakukan pada tahap sebelumnya sehingga menghasilkan data yang siap untuk diproses lebih lanjut. Tahap pemuatan data dilakukan dengan memuat (load)data ke kubus data OLAP
serverMondrian yang telah dirancang.
Uji Query
Implementasi operasi-operasi OLAP adalah sebagai berikut:
- Operasi roll up
- Operasi drill down
Operasi ini dilakukan untuk mengetahui jumlah penjualan benih dan kuantum (kg) secara lebih rinci. Misalnya untuk mengetahui jumlah penjualan benih pada masing-masing komoditi. Implementasi drill down dapat dilihat pada Lampiran 6. - Operasi slice dan dice
Operasi ini dilakukan untuk melihat keadaan jumlah penjualan kuantum benih serta jumlah harga penjualan benih berdasarkan waktu, komodoti, dan regional tertentu yang dipilih. Contoh operasi slice dan dice dapat dilihat pada Lampiran 7.
Proses Portable
Proses terakhir yang dilakukan adalah merancang agar datawarehouse yang sudah dibangun menggunakan aplikasi Mondrian dapat berjalan secara portable dengan menggunakan media USB flashdisk.
Untuk menjalankan Mondrian secara
portbale, diperlukan beberapa aplikasi khusus yang sudah dirancang khusus agar dapat berjalan langsung di USB flashdisk. Dalam penelitian ini penulis menggunakan beberapa aplikasi yang berjalan baik pada sistem operasi Windows, antara lain :
1 Java RTE atau JDK
2 XAMPPlite yang sudah memiliki beberapa fitur seperti :
a Apache webservice
b MySQL
c PHP
3 Apache Tomcat plugin untuk XAMPP
Selanjutnya ada beberapa langkah yang harus dilakukan agar aplikasi dapat berjalan secara portable,antara lain:
1 Install atau extract Java RTE atau JDK langsung ke dalam USB flashdisk.
2 Install XAMPPlite langsung ke USB
flashdisk sehingga USB akan memiliki
control-panel-xampp yang dapat diakses langsung dari USB.
3 Extract/copyplugin Apache-Tomcat ke dalam folder xampp yang sudah ter-install
pada USB.
4 CopyfolderMondrian yang berisi seluruh file
aplikasi ke dalam folder
USB:/xampp/tomcat/.
Langkah instalasi yang lebih jelas dapat dilihat pada Lampiran 8.
Gambaran Umum Aplikasi
Aplikasi OLAP pada penelitian ini memiliki beberapa fasilitas, antara lain : 1 Menu OLAP.Dengan fasilitas ini pengguna
dapat menentukan kubus data, ukuran, dan dimensi-dimensi yang diperlukan untuk dianalisis.
2 Filter dimensi, fungsi ini menyaring dimensi yang ditampilkan pada sumbu x dan sumbu
y untuk menampilkan elemen-elemen tertentu dari dimensi. Dimensi lainnya dapat dipilih satu elemen dari tiap-tiap dimensi. 3 Visualisasi Crosstab dan Graph,Data hasil
operasi OLAP yang dilakukan pengguna dapat ditampilkan dalam bentuk crosstabdan
Gambar 7 Arsitektur data warehouse dan aplikasi OLAP pada penelitian
MySQL Praproses Data Data Warehouse Hasil Output OLAP
Lapisan Bawah :
DBMS
Lapisan Tengah :
OLAP Server
atau grafik. Grafik yang ditampilkan berupa
bar plot,line plot,dan pie chart.
Gambaran umum aplikasi dapat dilihat pada Lampiran 9.
Kelebihan dan Kekurangan Aplikasi
Aplikasi yang dikembangkan pada penelitian ini memiliki beberapa kelebihan dan kekurangan, untuk kelebihan dari aplikasi antara lain:
1 Dapat dijalankan secara portable melalui
media USB flashdisk sehingga
mengeliminasi kebutuhan untuk instalasi perangkat lunak pada komputer atau bahkan keterbatasan infrastruktur seperti minimnya akses internet.
2 Dikembangkan menggunakan aplikasi yang berbasis opensource sehingga akan sangat mudah untuk pengembangan aplikasi selanjutnya.
Sedangkan untuk kekurangan dari aplikasi yang dikembangkan antara lain:
1 Hanya dapat berjalan pada sistem operasi Windows saja. Sehingga perlu penelitian lebih lanjut agar dapat menjalankan aplikasi pada setiap sistem operasi.
2 Belum ada fasilitas untuk memodelkan struktur kubus data dan memuat data baru ke dalam kubus data.
3 Akan berjalan sedikit lebih lambat karena aplikasi dijalankan langsung dari USB flashdisk.
4 Saat ini hanya terbatas pada tiga dimensi saja.
KESIMPULAN DAN SARAN Kesimpulan
Hasil penelitian menyimpulkan bahwa pembangunan data warehouse dan OLAP berbasis web pada data penjualan benih PT Sang Hyang Seri menghasilkan satu tabel fakta dan tiga tabel dimensi yang dapat digunakan sebagai untuk memvisualisasikan hasil analisis dalam bentuk grafik dan bentuk .xls file.
Hasil analisis juga dapat disajikan dengan lebih cepat karena sudah tidak perlu dilakukan secara manual lagi. Para pengambil keputusan juga dapat melihat informasi penjualan benih dengan mudah dan dapat diakses kapan saja karena aplikasi yang dikembangkan bersifat
portable.
Operasi OLAP yang dilakukan pada penilitian ini adalah roll-up, drill-down, pivot, dice, dan slice.
Dengan adanya sistem dan aplikasi ini, data yang disimpan dalam bentuk excel dan lotus file
bisa menjadi lebih komunikatif dan informatif.
Saran
1 Dikembangkan aplikasi untuk integrasi basis data penjualan benih pada masing-masing cabang yang tersebar di setiap Kantor Regional. Sehingga informasi yang diperoleh bisa lebih rinci dan lebih detail.
2 Pembersihan data masih dilakukan secara manual sehingga akan lebih baik jika dikembangkan juga aplikasi untuk melakukan pembersihan dari data mentah menjadi data yang siap dipakai untuk
datawarehouse.
3 Saat ini, hanya terdapat tiga dimensi yang digunakan sehingga perlu ditambahkan beberapa dimensi lagi agar membuat aplikasi menjadi lebih bermanfaat.
4 Aplikasi hanya dapat berjalan pada sistem operasi Windows. Mengingat terdapat berbagai jenis sistem operasi maka dirasa perlu untuk dikembangkan lebih lanjut pada penelitian selanjutnya agar aplikasi dapat berjalan pada semua jenis sistem operasi.
DAFTAR PUSTAKA
Bouman R, Doungen J. 2009. Pentaho Solutions: Business Intellegence and Data Warehousing with Pentaho and MySQL. Indianapolis : Wiley Publishing,Inc. Connoly T, Begg C. 2005. Database System
Fourth Edition : A Practical Approach to Design Implementation, and Management.
England: Pearson Education Limited. Han J, Kamber M. 2006. Data Mining :
Concept and Techniques. San Francisco: Morgan Kaufmann Publisher.
Indriani R. 2010. Prototipe Data Warehouse Penjualan Produk Bakosurtanal[skripsi].
Bogor: Departemen Ilmu Komputer, FMIPA, Institut Pertanian Bogor.
Rainardi, V. 2008. Building a Data Warehouse with Examples in SQL Server. New York: Apress.
Lampiran 3 Data Dalam table dimensi
a. Data dimensi waktu
id_waktu tahun semester bulan 2008.s01.b01 2008 semester 1 1 2008.s01.b02 2008 semester 1 2 2008.s01.b03 2008 semester 1 3 2008.s01.b04 2008 semester 1 4 2008.s01.b05 2008 semester 1 5 2008.s01.b06 2008 semester 1 6 2008.s02.b07 2008 semester 2 7 2008.s02.b08 2008 semester 2 8 2008.s02.b09 2008 semester 2 9 2008.s02.b10 2008 semester 2 10 2008.s02.b11 2008 semester 2 11 2008.s02.b12 2008 semester 2 12 2009.s01.b01 2009 semester 1 1 2009.s01.b02 2009 semester 1 2 2009.s01.b03 2009 semester 1 3 2009.s01.b04 2009 semester 1 4 2009.s01.b05 2009 semester 1 5 2009.s01.b06 2009 semester 1 6 2009.s02.b07 2009 semester 2 7 2009.s02.b08 2009 semester 2 8 2009.s02.b09 2009 semester 2 9 2009.s02.b10 2009 semester 2 10 2009.s02.b11 2009 semester 2 11 2009.s02.b12 2009 semester 2 12
b. Data dimensi regional
id_regional regional
Lampiran 3 Lanjutan
c. Data dimensi komoditi
id_komoditi jenis_komoditi nama_komoditi kmd.bnh.phb Benih Padi Hibrida kmd.bnh.pnh Benih Padi Non Hibrida kmd.bnh.kdl Benih Kedele
Lampiran 5 Contoh operasi roll up
Rol
l u
p
da
ri
s
em
es
te
r
ke
t
ah
u
2
2
an
6
C
o
n
to
h
o
p
er
asi
d
ri
ll
d
o
w
n
Drill down dari semua jenis komoditi ke masing-masing
Lampiran 7 Contoh operasi slice and dice
Sl
ic
e
da
ta
pe
n
ju
al
a
n
d
i
K
ant
or
R
egi
ona
Lampiran 7 Lanjutan