LAPORAN KERJA MAGANG
DATA CLEANSING DAN PEMBUATAN KETTLE DENGAN
PENTAHO DATA INTEGRATION DI PT PUTERA HANDAL
INDOTAMA
Diajukan Sebagai Salah Satu Syarat untuk Memperoleh Gelar Sarjana Teknik
Septiandy 00000014415
PROGRAM STUDI TEKNIK KOMPUTER FAKULTAS TEKNIK DAN INFORMATIKA UNIVERSITAS MULTIMEDIA NUSANTARA
TANGERANG 2019
PERNYATAAN TIDAK MELAKUKAN PLAGIAT
Dengan ini saya,
Nama : Septiandy
NIM 00000014415
Program Studi : Teknik Komputer
menyatakan bahwa saya telah melaksanakan praktik kerja magang:
Nama Perusahaan : PT Putera Handal Indotama
Divisi : Data as a Service
Alamat : Ruko Bolsena A/31, Paramount Serpong
Periode Magang : 10 Juni 2019 s.d 12 Agustus 2019
Pembimbing Lapangan : Elita Marpaung
Dan bahwa laporan magang berjudul “Data Cleansing dan Pembuatan Kettle Dengan Pentaho Data Integration Di PT Putera Handal Indotama” ini adalah karya ilmiah saya sendiri, bukan plagiat dari karya ilmiah yang ditulis oleh orang lain atau lembaga lain. Semua karya ilmiah orang lain atau lembaga lain yang dirujuk dalam laporan kerja magang ini telah disebutkan sumber kutipannya di Daftar Acuan.
Jika di kemudian hari terbukti ditemukan kecurangan/penyimpangan, baik dalam pelaksanaan kerja magang maupun dalam penulisan laporan kerja magang, saya bersedia menerima konsekuensi dinyatakan TIDAK LULUS untuk mata kuliah Kerja Magang yang telah saya tempuh.
Tangerang, 10 Desember 2019
KATA PENGANTAR
Puji dan syukur kepada Tuhan Yang Maha Esa karena dengan rahmat dan karunia-Nya penulis dapat menyelesaikan laporan kerja magang berjudul “Data Cleansing dan Pembuatan Fact dengan Pentaho Data Integration di PT Putera Handal Indotama”. Laporan kerja magang ini diajukan kepada Program Strata I Program Studi Teknik Komputer, Fakultas Teknik dan Informatika, Universitas Multimedia Nusantara.
Terselesaikannya laporan kerja magang ini tentunya tidak terlepas dari kerja sama, dukungan, dan bimbingan yang telah diberikan kepada penulis selama menjalankan program kerja magang, maka dari itu penulis mengucapkan terima kasih kepada:
1. Dr. Ninok Leksono, Rektor Universitas Multimedia Nusantara. 2. Hira Meidia, Ph.D., Wakil Rektor Bidang Akademik Universitas
Multimedia Nusantara.
3. Ir. Andrey Andoko, M.Sc., Wakil Rektor Bidang Administrasi Umum dan Keuangan Universitas Multimedia Nusantara.
4. Ika Yanuarti, S.E., MSF, Wakil Rektor Bidang Kemahasiswaan Universitas Multimedia Nusantara.
5. Prof. Dr. Muliawati G. Siswanto, M.Eng.Sc., Wakil Rektor Bidang Hubungan dan Kerjasama Universitas Multimedia Nusantara. 6. Friska Natalia, Ph.D., Dekan Fakultas Teknik dan Informatika 7. Samuel, M.T.I., Ketua Program Studi Teknik Komputer Universitas
Multimedia Nusantara.
8. Dareen Kusuma Halim, S.Kom., M.Eng.Sc. Sekretaris Program Studi Teknik Komputer Universitas Multimedia Nusantara sekaligus pembimbing magang penulis.
9. Bapak Feris Thia dan Bapak Victor Gunawan yang sudah menjadi pembimbing selama penulis melakukan kerja magang.
10. Ibu Elita Marpaung selaku supervisi penulis selama melakukan kerja magang.
v
11. Seluruh karyawan PT Putera Handal Indotama.
12. Orang tua dan saudara penulis yang selalu mendukung dan menyemangati. 13. Seluruh rekan mahasiswa Teknik Komputer UMN angkatan 2016 yang
selalu memberikan semangat dan bantuan selama penulis melakukan kerja magang.
Semoga laporan kerja magang ini dapat dijadikan sebagai sumber informasi atau inspirasi bagi para pembaca.
Tangerang, 10 Desember 2019
ABTRAKSI
Pengoloahan data yang baik dan benar sangat penting bagi perusahaan. Hal ini yang dijadikan sebagai peluang bisnis oleh PT Putera Handal Indotama dengan menawarkan jasa, produk, dan solusi di bidang teknologi data dengan tujuan utama yaitu data driven Indonesia. Masalah yang ditangani salah satunya dengan pembuatan data cleansing. Data cleansing dilakukan tanpa mengubah nilai asli data, tujuan akhirnya adalah data bersih yang siap dikonsumsi. Pekerjaan data
cleansing dilakukan dengan Pentaho Data Integration (PDI) yang membuat kettle
sehingga user bisa melakukan pembaruan data lebih mudah. Tool ini dapat membaca data yang bersumber dari file dan dapat berintegrasi dengan berbagai macam sistem basis data.
vii
ABSTRACT
Good data processing is very important for the company. PT Putera Handal Indotama sees this demand as a business oppotunity by offering services, products, and solutions in the field of data technology with the main objective of being Indonesian data driven company. One of the problems handled is by making data cleansing. Data cleansing is done without changing the original value of the data, the ultimate goal is clean data that is ready for consumption. Data cleansing work is done with Pentaho Data Integration (PDI) which makes kettle so that users can update data more easily. This tool can read data sourced from files and can integrate with a variety of database systems.
DAFTAR ISI
HALAMAN PERNYATAAN ... ii
HALAMAN PENGESAHAN ... iii
KATA PENGANTAR ... iv
ABTRAKSI ... vi
ABSTRACT ... vii
DAFTAR ISI ... viii
DAFTAR TABEL ... x
DAFTAR GAMBAR ... xi
DAFTAR LAMPIRAN ... xiii
BAB I PENDAHULUAN ... 12
1.1 Latar Belakang... 1
1.2 Tujuan Kerja Magang ... 1
1.2.1 Tujuan Umum ... 1
1.2.2 Tujuan Khusus ... 2
1.3 Waktu Dan Prosedur Kerja Magang... 2
BAB II TINJAUAN PUSTAKA ... 3
2.1 Deskripsi Singkat Perusahaan ... 3
2.2 Visi, Misi, dan Nilai Perusahaan ... 4
2.2.1 Visi ... 4
2.2.2 Misi ... 4
2.3 Struktur Perusahaan ... 4
BAB III ANALISIS DAN PERANCANGAN SISTEM ... 5
3.1 Konsep Extract, Transform, Load ... 5
3.2 Data Cleansing... 5
3.3 Pentaho Data Integration ... 5
ix
BAB IV PELAKSANAAN KERJA MAGANG ... 8
4.1 Kedudukan dan Koordinasi ... 8
4.2 Tugas yang Dilakukan ... 8
4.3 Timeline Kerja Magang per Minggu ... 9
4.4 Uraian Pelaksanaan Kerja Magang ... 9
BAB V SIMPULAN DAN SARAN ... 22
5.1 Simpulan ... 22
5.2 Saran ... 22
DAFTAR PUSTAKA ... 23
DAFTAR TABEL
Tabel 4.1 Timeline kerja magang per minggu ... 9 Tabel 4.2 Urutan yang dilakukan dalam pembuatan kettle ... 10
xi
DAFTAR GAMBAR
Gambar 2.1 Logo PHI-Integration ... 3
Gambar 2.2 Logo Data Qualitix ... 3
Gambar 2.3 Logo DqLab ... 3
Gambar 2.4 Struktur Organisasi ... 4
Gambar 3.1 Logo Pentaho ... 6
Gambar 3.2 Tampilan Spoon/ Kettle Pentaho ... 6
Gambar 3.3 Logo Microsoft SQL Server ... 7
Gambar 3.4 Logo Forticlient VPN ... 7
Gambar 3.5 Tampilan Microsoft SQL Server ... 7
Gambar 4.1 Proses kettle job Pentaho ... 10
Gambar 4.2 Mengatur koneksi VPN ... 11
Gambar 4.3 Input username dan password untuk terhubung dengan server client ... 11
Gambar 4.4 Contoh design transformasi “staging_sales_Shipping – XTS” ... 12
Gambar 4.5 Step table input “Sales(Line><Head)” pada transformasi “staging_sales_Shipping - XTS”... 12
Gambar 4.6 Database connection ... 13
Gambar 4.7 Menubar akses untuk mengatur Target Schema ... 13
Gambar 4.8 Kettle properties untuk mengatur Target Schema ... 14
Gambar 4.9 Step table output pada transformasi “staging_sales_Shipping - XTS” ... 14
Gambar 5.0 Contoh gambaran Target Schema staging pada SQL Server ... 15
Gambar 5.1.1 Step table input “Sales(Line><Head) 2” pada transformasi “staging_sales_Shipping - XTS”... 15
Gambar 5.1.2 Step table input “Sales(Line><Head) 2” pada transformasi “staging_sales_Shipping - XTS”... 15
Gambar 5.2 Proses job SQL yang melakukan update berdasarkan waktu ... 16
Gambar 5.3 Proses transformasi pada “STG1 - gudang” ... 17
Gambar 5.4 Query Data Cleansing step Table Input “staging.stg_sales_shipping” pada transformasi “STG1 - gudang” ... 17
Gambar 5.5 Step Table Output “stg_fact_sales_shipping1” pada transformasi “STG1 - gudang”... 18
Gambar 5.6 Query Data Cleansing step Table Input pada transformasi “fact_sales_shipping” ... 19
Gambar 5.7 Table Output pada transformasi “fact_sales_shipping” ... 19
Gambar 5.8 Contoh gambaran Target Schema fact pada SQL Server ... 19
Gambar 6.0 Fact sebelum dilakukan tuning ... 20
Gambar 6.1 Akses server client berdasarkan waktu terakhir digunakan ... 21
xiii
DAFTAR LAMPIRAN
Lampiran 1 Daftar Riwayat Hidup ... 24
Lampiran 2 Salinan KM03 ... 25
Lampiran 3 Salinan KM04 ... 26
Lampiran 4 Salinan KM05 ... 27
Lampiran 5 Salinan KM07 ... 28