31
Langkah selanjutnya adalah menjalankan proses ETL yang harus dipersiapkan terlebih dahulu menggunakan tool Data Integration.
Sebelum menjalankan tool Data Integration, instal terlebih dahulu Java Development Kit versi 6.
Mengakses Pentaho Data Integration dilakukan seperti pada gambar di bawah ini.
Gambar 25. Akses design tool “Data Integration”
32 Sylvia Jane Annatje Sumarauw
Tampilan awal ketika menjalankan Data Integretion (interface Data Integration) akan tampak seperti pada gambar di bawah ini.
Gambar 26. Tampilan awal Data Integration
Sebelum sampai ke interface Data Integration, maka pertama kali akan tampil sebuah jendela “Repository Connection”. Repository adalah modul interfacing data yang pada pentaho terdiri dari tiga jenis yaitu: Enterprise repository, Kettle database repository, dan Kettle file repository.
Sebelum membuat desain ETL, sebuah repository harus dibuat terlebih dahulu yang pada percobaan ini dipilih Kettle database repository dengan konfigurasi seperti pada gambar di bawah ini.
Gambar 27. Kettle database repository
33 Monograf Pentaho Business Intelligence
Database connection tentu saja harus mengacu pada data yang telah dipersiapkan konfigurasinya adalah sebagai berikut (tekan tombol “Edit” pada gambar di atas).
Gambar 28. Database connection
Setelah database connection selesai dibuat, maka desain transformasi ETL bisa dilakukan. Untuk membuat transformasi bisa dilakukan dengan klik kanan folder “Transformation” dan pilih “New” seperti pada gambar di bawah ini.
Gambar 29. Membuat transformasi baru
34 Sylvia Jane Annatje Sumarauw
Interface untuk membuat desain transformasi akan tampak seperti pada gambar di bawah ini.
Gambar 30. Interface untuk membuat desain transformasi Untuk mengerjakan ide seperti dijelaskan pada bagian IV, maka desain dibuat seperti pada gambar di bawah ini.
Gambar 31. Transformasi file-file DIL ke table output (tblpelanggan)
35 Monograf Pentaho Business Intelligence
Penjelasan tentang objek transformasi dan nilai dari parameter- parameter pada gambar di atas adalah sebagai berikut.
Objek Nama Objek Parameter Nilai
1 2 3 4
Text file input File directory C:\Pentaho\Data Wilcard DIL.*
Include subfolder Yes
Fields Name=IDPEL, Type=String, Position=0, Length=12 Name=KDDK, Type=String, Position=12, Length=12 Name=KODESUBUNIT, Type=String, Position=2, Length=2 Name=TARIF, Type=String, Position=88, Length=2 Name=DAYA, Type=Number, Position=93, Length=6 Name=KDPP, Type=String, Position=203, Length=14 Name=KWHBLOK1, Type= Number, Position=586, Length=9 Name= KWHBLOK2, Type= Number, Position=595, Length=9 Name= KWHBLOK3, Type= Number, Position=604, Length=9 Name=RPBEBAN, Type= Number, Position=622, Length=10 Name=RPKBB, Type= Number, Position=632, Length=9 Name=RPBLOK1, Type= Number, Position=641, Length=10 Name=RPBLOK2, Type= Number, Position=651, Length=10 Name=RPBLOK3, Type= Number, Position=661, Length=10 Name=RPREKENING, Type= Number, Position=671, Length=11 Name=RPTTLB, Type= Number, Position=682, Length=10 Name=RPPPN, Type= Number, Position=692, Length=10 Name=RPPPJ, Type= Number, Position=702, Length=10 Name=RPPAM, Type= Number, Position=712, Length=10 Name=RPLAIN2, Type= Number, Position=722, Length=9 Name=RPBRUTO, Type= Number, Position=731, Length=11 Name=RPRESTITUSI, Type= Number, Position=742, Length=7 Name=RPMATERAI, Type= Number, Position=749, Length=5 Name=RPTAG, Type= Number, Position=754, Length=11 Name=BULAN, Type=String, Position=765, Length=2 Name=TAHUN, Type=String, Position=767, Length=4 Switch / Case Field name to
switch TARIF
Case value data
type String
Case values Value=B1 Target step=B1 Range Value=B2 Target step=B2 Value=B3 Target step=B3 Value=I1 Target step=I1 Range Value=I2 Target step=I2 Value=I3 Target step=I3 Value=I4 Target step=I4 Value=P1 Target step=P1 Range Value=P2 Target step=P2 Value=P3 Target step=P3 Value=R1 Target step=R1 Range Value=R2 Target step=R2 Value=R3 Target step=R3 Value=S1 Target step=S1 Value=S2 Target step=S2 Range Value=S3 Target step=S3 Default target step Abort
Abort Step name Abort
Abort value 0
Abort message Kesalahan pada input file DIL Always log True
36 Sylvia Jane Annatje Sumarauw
1 2 3 4
Number range Input field DAYA Output field DayaMin Step name &
Range Step name Lower bound Upper bound Value B1 Range 0
450 900 1300
450 900 1300
0 450 900 1300 I1 Range 0
450 900 1300 2200
450 900 1300 2200
0 450 900 1300 2200 P1 Range 0
450 900 1300 2200
450 900 1300 2200
0 450 900 1300 2200 R1 Range 0
450 900 1300
450 900 1300
0 450 900 1300 S2 Range 0
450 900 1300 2200
450 900 1300 2200
0 450 900 1300 2200 Value Mapper Fieldname to use
Target field name Step name & Field
values Step name Source value Target value
B2 B2 3500
B3 B3 200000
I2 I2 14000
I3 I3 200000
I4 I4 200000
P2 P2 200000
P3 P3 0
R2 R2 2200
R3 R3 2200
S1 S1 0
S3 S3 200000
37 Monograf Pentaho Business Intelligence
1 2 3 4
Text file output Connection Pelanggan_PLN_Conn Target table Tblpelanggan Commit size 1000 Use batch update for insert True Store the table name field True
Field to inserts Table field Stream field IDPEL
KDDK KODESUBUNIT TARIF DAYA KDPP KWHBLOK1 KWHBLOK2 KWHBLOK3 RPBEBAN RPKBB RPBLOK1 RPBLOK2 RPBLOK3 RPREKENING RPTTLB RPPPN RPPPJ RPPAM RPLAIN2 RPBRUTO RPRESTITUSI RPMATERAI RPTAG BULAN TAHUN
IDPEL KDDK KODESUBUNIT TARIF DAYA KDPP KWHBLOK1 KWHBLOK2 KWHBLOK3 RPBEBAN RPKBB RPBLOK1 RPBLOK2 RPBLOK3 RPREKENING RPTTLB RPPPN RPPPJ RPPAM RPLAIN2 RPBRUTO RPRESTITUSI RPMATERAI RPTAG BULAN TAHUN
Setelah desain transformasi dibuat dan diyakini benar, maka transformasi dapat di-running dengan menekan tombol “Run this transformation or job” seperti pada gambar di bawah ini.
Gambar 32. Running transformation
Ketika running transformasi dikerjakan, pertama kali akan tampil jendela “Execute a transformation” yang merupakan kumpulan informasi dan opsi-opsi proses eksekusi transformasi dan tampak seperti pada gambar di bawah ini.
38 Sylvia Jane Annatje Sumarauw
Gambar 33. Jendela informasi dan opsi-opsi untuk eksekusi transformasi
Selanjutnya dengan menekan tombol “Launch” pada gambar di atas, maka proses eksekusi transformasi akan dijalankan dan akan tampil jendela “Execution Results” seperti pada gambar di bawah ini.
Gambar 34. Jendela “Execution Results”
Proses eksekusi ini akan berjalan terus dan akan berakhir sampai semua langkah pada kolom “Active” berisi informasi “Finished”.
Ketika proses eksekusi selesai dan tidak ada kesalahan yang terjadi,
39 Monograf Pentaho Business Intelligence
maka jendela “Execution Results” akan tampak seperti pada gambar di bawah ini.
Gambar 35. Jendela “Execution Results” pada akhir proses transformasi
Keberhasilan proses transformasi dapat kita lihat pada jendela
“Execution Results” yang menunjukkan jumlah input dan output yang sama (lingkaran merah). Dari informasi- informasi yang ada kita juga dapat menarik beberapa kesimpulan antara lain:
● jenis tarif yang ada adalah: I1, P1, R1, S2, B2, P3, R2, R3, S1 dan B1;
● jenis tarif yang tidak ada adalah: B3, I2, I3, I4, P2 dan S3;
● pelanggan yang mendominasi jenis tarif pada 4 Rayon tersebut adalah pelanggan dengan jenis tarif R1;
● dan lain-lain.
Lama proses transformasi tergantung dari jumlah data yang akan ditransformasikan. Dalam percobaan ini, menurut gambar di atas, untuk mentransformasikan 1.867.978 data pelanggan membutuhkan waktu 1599,8 detik atau ~ 27 menit. Di samping jumlah data, hal- hal yang berkaitan dengan teknologi juga perlu menjadi perhatian jika performance proses transformasi menjadi bahan pertimbangan, apalagi jika penerapan sistem ini untuk aplikasi-aplikasi strategis
40 Sylvia Jane Annatje Sumarauw
suatu perusahaan. Teknologi yang berkaitan dengan hal tersebut antara lain: teknologi RDBMS (MySQL, Oracle, MSSQL Server, dll.), spesifikasi server, teknologi media penyimpanan data (storage), dan lain-lain.
Sebagai hasil dari proses transformasi ini (ETL), dapat dilihat pada tabel output yaitu “tblpelanggan” yang jika dilihat pada MySQL Front akan tampak seperti pada gambar di bawah ini.
Gambar 36. Data hasil transformasi pada tblpelanggan
41
Schema Workbench adalah sebuah tool yang telah dikemas dalam paket Pentaho BI Enterprise Edition. Tool ini berfungsi untuk membuat skema yang mendefinisikan database multidimensi. Skema ini berisi model logika, yang terdiri dari cubes, hierarchies, dan members; dan pemetaan model ini ke model fisik.
Model logis terdiri dari konstruksi yang digunakan untuk menulis pertanyaan dalam bahasa MDX: cubes, dimensions, hierarchies, levels, dan members. Model fisik adalah sumber data yang disajikan melalui model logika. Biasanya merupakan skema bintang, yang merupakan sekumpulan tabel dalam database relasional.
Setelah Pentaho BI Enterprise terinstall, akses Schema Workbench dapat dilakukan seperti pada gambar di bawah ini.