Data Warehouse : Pentaho Open Source
Elsen Ronando, S.Si.,M.Si.,M.Sc.
Teknik Informatika Fakultas Teknik
Universitas 17 Agustus 1945 Surabaya
1 Apa itu Pentaho ?
Beberapa fasilitas Pentaho
Skema Pentaho Business Intelligence
2 Integrasi Data dengan Pentaho
Demo Program
3 Pemodelan Multidimensional
Demo Program
4 Pentaho BI Server
Contoh Pentaho BI Server
Apa itu Pentaho ?
Software open source didirikan di Orlando, Amerika Serikat pada tahun 2004.
Digunakan untuk keperluan data warehouse dan business intelligence,
sehingga menjadi lebih efektif dan efisien.
Data warehouse →pusat penggabungan dan pengolahan data yang digunakan untuk pelaporan dan analisis data.
Business Intelligence→transformasi data menjadi informasi yang mengandung arti dan berguna.
Penggalian dan pelaporan data secara interaktif.
Analisa OLAP (Online Analytical Processing) berkaitan dengan
ukuran dan dimensi data.
Integrasi pelaporan (Dashboard). Adanya ruang alur kerja.
Manajemen metadata.
Adanya dukungan ETL (Extract Transform Load) yang digunakan
Biasanya disebut juga dengan PDI ataukettle. Beberapa komponenkettle, antara lain :
Koneksi data.
Transformation: menangani proses manipulasi aliran data. Job : menganalisa dan memelihara tugas yang sedang dilakukan. Alat Desain
Spoon: merancang, menyunting, dan menjalankanjobdan
transformation.
Kitchen: menjalankanjobmelalui mekanisme penjadwalan.
Pan: menjalankantransformationmelalui mekanisme penjadwalan.
Skema Integrasi Data dengan Pentaho
Program Job
Langkah-langkah sebagai berikut :
1 Pilih menu File >New > Job.
2 Arahkan ke ikon START pada sisi kiri grupGeneral, kemudian drag
dan drop ke ruang kerja.
3 Buka grupUtility dan kemudian drag dan drop ikon Display Msgbox
Info ke ruang kerja.
4 Hubungkan job entry START danDisplay Msgbox Info dengan
cara sebagai berikut :
Arahkan pointer ke atasjob entry START, tunggu dan kemudian klik ikon paling kanan dan gerakkan pointer mouse ke arahjob entry Display Msgbox Info
5 Arahkan ke ikon Set Variables pada grupGeneral, kemudian drag
Demo Program
Lanjutan Program Job
6 Geser ikonSet Variables pada ruang kerja ke posisi tengah diantara
garis dari STARTdanDisplay Msgbox Info (Hingga garis diantara
keduanya menebal).
Jika muncul windowSplit hop?, maka tekan tombolyes.
7 Sunting propertis dari job entry Set Variables dengan cara arahkan
pointer keatasnya dan klik ikon kedua dari kiri.
Pada gridVariables, sisipkaan beberapa parameter sebagai berikut : Variable name: NAME
Value: Elsen
Variable scope type: Valid in the current job
8 Sunting propertis dari job entry Display Msgbox Info dengan cara
mirip dengan step 7,dan tambahkan informasi sebagai berikut :
Message title: Info
Message Body: Hello ${NAME}
Lanjutan Program Job
Demo Program
Program Transformation
Untuk membaca dan menulis Tabel Basis Data, langkah-langkahnya sebagai berikut :
1 Buat basis data dengan namaclassicmodels. Berikut adalah Gambar
Lanjutan Program Transformation
2 Buat juga basis data dengan nama dblatihan, kemudian koneksikaan
dengan pentaho dan lakukan shareuntuk keduanya agar basis data
dapat diakses melalui ruang kerjatransformation.
3 Drag dan drop input Table Input ke ruang kerja, dan sunting
propertisnya sebagai berikut :
Koneksikan dengan basis dataclassicmodels. Inputkan SQLquery sebagai berikut:
SELECT O.orderNumber ,O.customerNumber ,C.customerName
Demo Program
Lanjutan Program Transformation
3 Untuk cek hasilquery dan telah terkoneksi dengan basis data
classicmodels, klikpreview.
4 Bawa step Table Outputke ruang kerja, dan buat hop terhubung
antara Table Inputdan Table Output. Sunting propertis Table
Outputsebagai berikut :
Koneksikan dengan basis datadblatihan. Isi kolomTargettabledengan ringkasan order. Kemudian centangTruncate Table.
Untuk cekdblatihantelah memiliki tabel ringkasan order, klikSQL sehingga munculSimple SQL Editordan tekan tombol Execute.
5 Setelah seluruhnya telah terkoneksi dengan baik, jalankan skema
Lanjutan Program Transformation
Sementara untuk melihat hasil transformation dari basis datadblatihan,
dapat dilihat melalui perintah cmd promptsebagai berikut :
cd c:\xampp\mysql\bin mysql.exe -u root -p use dblatihan; show tables;
Pemodelan Multidimensional
Teknik desain untuk menyajikan data dalam kerangka kerja yang intuitif dan akses data dengan kinerja tinggi.
Biasanya dimodelkan dengan konsep star schema.
Terdiri dari tabel factdan tabel dimensi.
Tabel Fact: berisi data yang dapat diukur, seperti harga jumlah barang, dan sebagainya.
Tabel Dimensi: berisi detail yang menjelaskan foreign key yang terdapat pada tabel fakta.
Program Dimensi Waktu
1 Drag dan drop step Generate Rowske ruang kerja dan sunting
propertisnya sebagai berikut :
IsiStep name dengan Tanggal Awal danLimitdengan 10000.
Pada gridFields, isi dataName dengan tanggal awal,Typedengan Date,Formatdengan yyyy-MM-dd, danValuedengan 2000-01-01.
2 Drag dan drop stepAdd sequences ke ruang kerja dan buat hop dari
Tanggal Awal ke step Add Sequences, kemudian sunting propertis dari Add sequencessebagai berikut :
Isi dataStep namedengan Hari Selanjutnya, Name of valuedengan hari selanjutnya, cek boxUse counter to calculate sequence?,Start
at valuedengan 0,Increment bydengan 1, danMaximum value
dengan 999999999.
3 Drag dan drop step Calculator ke ruang kerja dan buat hop dari step
Hari Selanjutnyake step Calculator. Kemudian, sunting propertis
Demo Program
Lanjutan Program Dimensi Waktu
3 IsiStep name dengan Hitung Tanggal dan isiFieldssesuaikan dengan
setting.
4 Drag dan drop step Data gridke ruang kerja dan sunting
Lanjutan Program Dimensi Waktu
4 IsiStep name dengan Nama Bulan dan pada tabmetaisi sesuaikan
dengan setting.
Name Type
month number Integer month name String
Pada tabDataisikanmonth numberdn month namesesuai dengan angka dan nama bulan.
5 Drag dan drop step Stream lookupke ruang kerja dan buat hop dari
stepHitung Tanggal keStream lookup. Kemudian, buat hop lgi
dari stepNama Bulanke step Stream lookup. Ubah propertis dari
Demo Program
Lanjutan Program Dimensi Waktu
5 IsiStep name dengan Lookup Nama Bulan danLookup stepdengan
Nama Bulan.
Pada gridThe key(s) to lookup up the value(s), sisipkan baris berikut:
Field LookupField
month month number
Pada gridSpecify the fields to retrieve, sisipkan baris berikut:
Field Type
Lanjutan Program Dimensi Waktu
6 Drag dan drop step Modified Java Script Valueke ruang kerja dan
buat hop dari step Lookup Nama Bulanke step Modified Java
Script Value. Kemudian, sunting propertis dari step Modified Java Script Valuesebagai berikut:
Isistep nameengan SK dan isiScript 1sebagai berikut :
var sk;
sk = (year*10000) + (month*100) + day; Pada gridFields, sisipkan baris berikut:
Fieldname Type
Demo Program
Lanjutan Program Dimensi Waktu
7 Drag dan drop step Select Value ke ruang kerja dan buat hop dari
stepSK ke step Select Value. Kemudian, sunting propertis dari step
Select Value sebagai berikut:
Pada tabSelect & Alter, masukkan
sk,date,year,quarter,month,month name,dayke dalam gridFields.
8 Drag dan drop step Table Outputke ruang kerja dan buat hop dari
Select Value keTable output. Kemudian, setting propertisnya sebagai berikut :
Koneksikan dengan MySQL-ClassicModelsDwh. Target table: dim date.
Truncate table: Dipilih.
Pentaho BI Server
Aplikasi web yang merupakan framework untuk melakukan beragam pekerjaan yang berhubungan dengan masalah Business Intelligence (BI).
Fitur-fitur:
Backend security.
User Access Control List (ACL). Pentaho component integrator. Scheduler.
Audit log. dan sebagainya.
Akses pentaho BI : http://localhost:8080dengan username : admin
Contoh Pentaho BI Server
Catatan
Presentasi dapat didownload pada link berikut :
https://sites.google.com/site/elsenronandosite/files Klik .
Link download pentaho open source :
http://www.pentaho.com/download Klik . Kemudian pilih dan
download Pentaho Business Analytics.
Link download tutorial pentaho BI Server : Tutorial pentaho BI
Server Klik .
Link download koneksi MySQL dengan Pentaho : Konektor MySQL
ke Pentaho Klik .
Sumber utama literatur dan link download: Buku Pentaho Solutions: