Pemanfaatan gudang data untuk keperluan Online Analytical Processing (OLAP) dan penambangan data studi kasus PT. ASDP Indonesia Ferry (Persero) cabang Kupang

(1)

i

PEMANFAATAN GUDANG DATA UNTUK KEPERLUAN ONLINE

ANALYTICAL PROCESSING (OLAP) DAN PENAMBANGAN DATA

(Studi Kasus: PT. ASDP Indonesia Ferry (Persero) Cabang Kupang)

Skripsi

Diajukan Untuk Memenuhi Salah Satu Syarat Memperoleh Gelar Sarjana Komputer

Oleh:

Loudya Ester Rosalina Kapa 085314054

PROGRAM STUDI TEKNIK INFORMATIKA FAKULTAS SAINS DAN TEKNOLOGI

UNIVERSITAS SANATA DHARMA YOGYAKARTA

(2)

ii

THE UTILIZATION OF DATA WAREHOUSE FOR ONLINE ANALYTICAL PROCESSING(OLAP) AND DATA MINING PURPOSES

(Case Study: PT. ASDP Indonesia Ferry (Persero) Cabang Kupang)

A Thesis

Presented as Partial Fulfillment of the Requirements To Obtain the Sarjana Komputer Degree

By:

Loudya Ester Rosalina Kapa 085314054

INFORMATICS ENGINEERING STUDY PROGRAM FACULTY OF SCIENCE AND TECHNOLOGY

SANATA DHARMA UNIVERSITY YOGYAKARTA

(3)

(4)

(5)

v

PERNYATAAN KEASLIAN KARYA

Saya menyatakan dengan sesungguhnya bahwa skripsi yang saya tulis ini tidak memuat karya atau bagian karya orang lain, kecuali yang telah dsebutkan dalam kutipan dan daftar pustaka, sebagaimana layaknya karya ilmiah.

Yogyakarta, 20 February 2013 Penulis,

(6)

vi

LEMBAR PERNYATAAN PERSETUJUAN

PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS

Yang bertanda tangan di bawah ini, saya mahasiswa Universitas Sanata Dharma : Nama : Loudya Ester Rosalina Kapa

Nomor Mahasiswa : 08 5314 054

Demi pengembangan ilmu pengetahuan, saya memberikan kepada Perpustakaan Universitas Sanata Dharma karya ilmiah saya yang berjudul :

Pemanfaatan Gudang Data Untuk Keperluan Online Analytical Processing (OLAP) dan Penambangan Data

Studi Kasus : PT. ASDP Indonesia Ferry (Persero) Cabang Kupang

beserta perangkat yang diperlukan (bila ada). Dengan demikian saya memberikan kepada Perpustakaan Universitas Sanata Dharma hak untuk menyimpan, mengalihkan dalam bentuk media lain, mengelolanya dalam bentuk pangkalan data, mendistribusikannya secara terbatas, dan mempublikasikannya di Internet atau media lain untuk kepentingan akademis tanpa perlu meminta ijin dari saya maupun memberikan royalti kepada saya selama tetap mencantumkan nama saya sebagai penulis.

Demikian pernyataan ini yang saya buat dengan sebenarnya.

Dibuat di Yogyakarta

Pada tanggal : 22 Februari 2013 Yang menyatakan

(7)

vii

HALAMAN PERSEMBAHAN

Karya ini saya persembahkan kepada :

TUHAN YESUS, tanganMU yang setia menuntun ku, Engkau

Penopang dan Harapan ku

Bapa & Mama tercinta

Adik-adik ku sayang, Cory dan Anto

Keluarga Besar

(8)

viii M O T T O

~~~

Janganlah takut, sebab Aku menyertai engkau, janganlah bimbang, sebab Aku ini Allahmu;

Aku akan meneguhkan, bahkan akan menolong engkau; Aku akan memegang engkau dengan tangan kanan-Ku yang membawa kemenangan.

Yesaya 41:10

~~~

I hear no voice

I feel no touch

I see no glory bright

But yet I know that

“GOD is near”

In the darkness as in light

(9)

ix

KATA PENGANTAR

Segala puji syukur penulis panjatkan kepada Allah Bapa di Surga, karena berkat dan penyertaan-Nya penulis dapat menyelesaikan penyusunan Skripsi yang berjudul “Pemanfaatan Gudang Data untuk keperluan Online Analytical

Processing (OLAP) dan Penambangan Data (Studi Kasus: PT. ASDP Indonesia Ferry (Persero) Cabang Kupang)”.

Skripsi ini disusun sebagai salah satu syarat untuk memperoleh gelar sarjana strata satu pada Program Studi Teknik Informatika Fakultas Sains dan Teknologi Universitas Sanata Dharma Yogyakarta.

Pada saat pengerjaan skripsi ini penulis banyak mendapatkan bantuan dari berbagai pihak, oleh karena itu penulis ingin mengucapkan terima kasih kepada : 1. Ibu Ridowati Gunawan, S.Kom, M.T. selaku Ketua Prodi Teknik Informatika

sekaligus dosen pembimbing, yang telah memberikan kebaikan, arahan, bimbingan, serta meluangkan waktu sehingga penulis dapat menyelesaikan skripsi ini.

2. Ibu P.H Prima Rosa, S.Si., M.Sc. selaku Dekan Fakultas Sains dan Teknologi dan sekaligus sebagai dosen penguji yang telah memberikan kritik dan saran untuk penyempurnaan skripsi ini

(10)

x

4. Bapak Hermin, selaku Supervisor Lintasan, yang telah mengizinkan penulis untuk melakukan studi kasus

5. Kedua orang tua, Bapak Morizon B.D Kapa dan Ibu S.Leonora Welkis yang telah memberikan dukungan doa, semangat, motivasi , perhatian, yang selalu sabar membimbing penulis sehingga penulis dapat membuktikan kepada keluarga bahwa penulis berhasil menyelesaikan skripsi ini. Kalian luar biasa. 6. Adik-adik tercinta, Cory dan Anto, yang selalu mendukung dalam doa serta

memberi semangat kepada penulis.

7. Keluarga Besar di Kupang, Opa Tom, Opa Benja, Opa Sabu, bapa Min, Be‟a Teli, bapa Herman, mama Ren, dan semua saudara yang selalu memberikan semangat dan doa bagi penulis. Kak Rose, Kak Ani, Rino, kak Adi, kak Jimmy, kak Cindi, dan semua keluarga yang selalu memberi support yang luar biasa kepada penulis.

8. Saudara sekaligus sahabat Carla R.G. Pekujawang S.Kom, Hety, Yanti, Juan, Didi „Dircya‟, Nitha, Dirk, Ivanna „Boim‟, Ryan, Debby Kristiana Dima yang

selalu memberikan senyum, doa, dan motivasi kepada penulis.

9. Sahabat-sahabat seperjuangan, Lucy, Devi, Angga, Siska, Surya, Petra, Pucha, Endro, Ithak, Ochak, Reza, Wulan, Densi, Ilana, Suci, Roy, Linardi, Tista serta sibling Bebeth, Agnes, Gadis, dan Ade, yang membantu penulis saat mengalami kesulitan dalam pengerjaan skripsi, dan memberikan semangat, tawa, dan doa.

(11)

xi

11. Teman-teman kos Intan, Ce Pipi dan Niken, yang memberikan motivasi dan doa kepada penulis. Teman-teman kos Puri Liberti, Anyho, dan semuanya yang begitu mendukung penulis dalam setiap keceriaan dan motivasi yang kalian berikan.

12. Teman-teman GSM (kak Santi, Novita, Winnie „Jaja‟, Kia, Galuh, Caca, Dea) yang mendukung dalam doa dan bersedia meluangkan waktu memberi support kepada penulis.

13. Semua pihak yang telah membantu dan memberikan dukungan kepada penulis yang tidak dapat disebutkan satu per satu.

Dengan kerendahan hati, penulis menyadari bahwa skripsi ini masih jauh dari sempurna, oleh karena itu berbagi saran, kritik, dan masukan sangat diharapkan demi perbaikan skripsi ini di kemudian hari. Akhir kata, penulis berharap semoga skripsi ini dapat bermanfaat.

(12)

xii

DAFTAR ISI

HALAMAN JUDUL ……….. i

HALAMAN JUDUL INGGRIS ……….... ii

HALAMAN PERSETUJUAN ……….. iii

HALAMAN PENGESAHAN ……… iv

HALAMAN KEASLIAN KARYA ………... v

LEMBAR PERNYATAAN PERSETUJUAN ……….. vi

(13)

xiii 2.3 Metode Analisis Asosiasi ………....

2.4 Algoritma Apriori ………

9

ANALISIS DAN PERANCANGAN SISTEM ………. 30

3.1 Identifikasi Masalah ………. 3.2 Arsitektur Sistem ………. 3.3 Analisis Kebutuhan ………. 3.4 Pembersihan Data ……… 3.5 Transformasi Data ……… 3.6 Pembuatan Gudang Data ………. 3.6.1 Membaca data legacy ……….

3.6.2 Memindahkan data ke server gudang data ……….

3.7 Pemanfaatan Gudang Data ………..

3.7.1 Pembuatan OLAP ………...

3.7.2 Penerapan Algoritma Apriori ………..

(14)

xiv

3.8 Analisis Kebutuhan ………..

3.8.1 Use Case ……….

3.8.2 Narasi Use Case ………...

3.8.3 Desain Antar Muka ………

3.9 Kebutuhan Komponen dan Kebutuhan Sistem ……….

51

IMPLEMENTASI DAN ANALISIS SISTEM ……….. 63

4.1 Implementasi Arsitektur Gudang Data ……… 4.2 Langkah Pembuatan Gudang Data ……….. 4.2.1 Membaca data legacy ……….

4.2.2 Memindahkan data ke server gudang data ………. 4.3 Penggunaan Gudang Data ……… 4.3.1 Gudang data untuk keperluan OLAP………. 4.3.2 Gudang data untuk penerapan algoritma Apriori ………. 4.4 Implementasi Antar Muka Pengguna ………..

4.4.1 Halaman Login ……….

4.4.2 Halaman utama ……….

4.4.3 Halaman Laporan Produksi ……… 4.4.4 Halaman Laporan Pendapatan..……… 4.4.5 Halaman Transformasi Data ……….. 4.4.6 Halaman Aturan Asosiasi ………..

63 5.1 Penyelesaian Rumusan Masalah ……….

5.2 Pengujian Cube ……… 5.3 Kelebihan dan Kelemahan Sistem ………...

(15)

xv

Perbedaan OLTP dan OLAP ………

Rekapitulasi jenis lintasan ………

Contoh data rekapitulasi ………...

Contoh data dari atribut ……… Narasi use case login……….

Narasi use case melihat laporan rekapitulasi………

Narasi use case melihat laporan produksi ………

Narasi use case melihat laporan pendapatan ………

Narasi use case transfer data produksi dan pendapatan... Narasi use case cari aturan asosiasi ………..

Penjelasan spesifikasi pembentukan tabel master………... Penjelasan pembentukan tabel dimensi_lintasan ………….

Penjelasan pembentukan tabel dimensi_kapal ……….

Penjelasan pembentukan tabel dimensi_tiket……… Penjelasan pembentukan fact_rekapitulasi ………..

Penjelasan pembentukan fact_laporan_produksi ………...

Penjelasan pembentukan fact_laporan_pendapatan ……...

Skema MDX cube Rekapitulasi Pelayanan ………..

(16)

xvi

Definisi skema LaporanRekapitulasi.xml ……… Tabel kode perintas file Automatisasi_data.bat………

Query sql untuk scanning database ……….

Listing Program untuk halaman login ………

Fungsi Login pada Control.jsp ……… Fungsi Login pada kelas Login.jsp ……….

Struktur halaman Laporan Rekapitulasi.jsp ……….. Struktur halaman Laporan Produksi.jsp ……….

Struktur halaman Laporan Pendapatan.jsp ……….

Listing Program untuk Halaman Transformasi data……..

Fungsi Transformasi pada Control.jsp ………

Method runBat pada kelas Tools.java ……….. Listing Program halaman pola asosiasi ………..

(17)

xvii

Arsitektur Gudang Data ………...

Arsitektur Sistem ………..

Pembentukan master_operasional ……… Pembentukan tabel dimensi_lintasan ………... Pembentukan tabel dimensi_kapal ………... Pembentukan tabel dimensi_tiket ………. Pembentukan tabel dimensi_waktu ……….. Pembentukan tabel fact_rekapitulasi ……… Pembentukan tabel fact_laporan_produksi ……….. Pembentukan tabel fact_laporan_pendapatan ………..

Star schema laporan_rekapitulasi ……….

Star schema laporan_produksi ……….

Star schema laporan_pendapatan ……….

Diagram Use Case ………

(18)

xviii

Star schema cube Rekapitulasi Pelayanan ………. Struktur pembentukan dimensi_lintasan ……… Struktur pembentukan dimensi_kapal ……… Struktur pembentukan dimensi_tiket ……….. Struktur pembentukan dimensi_waktu ………..

Star Schema cube Laporan Produksi ……….

Struktur pembentukan dimensi_waktu ……….. Struktur pembentukan dimensi_lintasan ……… Struktur pembentukan dimensi_kapal ……… Struktur pembentukan dimensi_tiket ………..

Star Schema cube Laporan Pendapatan ……….

(19)

(20)

xx

ABSTRAK

PEMANFAATAN GUDANG DATA UNTUK KEPERLUAN ONLINE

ANALYTICAL PROCESSING (OLAP) DAN PENAMBANGAN DATA (Studi Kasus: PT. ASDP Indonesia Ferry (Persero) Cabang Kupang)

Loudya Ester Rosalina Kapa Universitas Sanata Dharma

Yogyakarta 2013

Saat ini perusahaan harus pandai dalam mengelola data yang dimiliki untuk menjadi informasi yang berguna. informasi tersebut dapat membantu perusahaan dalam upaya peningkatan kualitas. Pada proses pengolahan data dapat digunakan sebuah teknik yaitu gudang data.

Pada tugas akhir ini diimplementasikan teknik gudang data yang berfungsi untuk OLAP (Online Analytical Processing) dan penerapan algoritma data mining yakni algoritma apriori. Teknologi gudang data ini membantu Supervisor Lintasan PT. ASDP Ferry Kupang dalam pembuatan laporan bulanan produksi dan pendapatan menggunakan teknologi OLAP. Selain itu gudang data ini dimanfaatkan untuk proses penambangan data untuk menemukan asosiasi antara hari, lintasan, dan pendapatan di PT. ASDP Ferry Kupang.

(21)

xxi

ABSTRACT

THE UTILIZATION OF DATA WAREHOUSE FOR ONLINE ANALYTICAL PROCESSING (OLAP) AND DATA MINING PURPOSES

(Case Study: PT. ASDP Indonesia Ferry (Persero) Cabang Kupang)

Loudya Ester Rosalina Kapa Universitas Sanata Dharma

Yogyakarta 2013

Today a company should capable on managing the data to be the useful information. Based on the information, it may help the company to develop the quality. In processing of data, it could use a technique called Data Warehouse.

In this final paper, the technique of warehouse is used for OLAP and the algorithm application of data mining called Apriori Algorithm. The technology of data warehouse would help the Route Supervisor of PT. ASDP Ferry Kupang on making the month production report and the income of using technology OLAP (Online Analytical Processing). Besides, Warehouse will be applied on data mining algorithm to get the information about association between day, route, and income in PT ASDP Ferry Kupang.

Keyword : Data Warehouse, OLAP, Apriori Algorithm, Production, Income

(22)

1

BAB I

PENDAHULUAN

1.1 Latar Belakang Masalah

Dewasa ini, peranan teknologi informasi sangat penting bagi banyak perusahaan dalam berbagai bidang. Perusahaan harus pandai dalam memanfaatkan sumber daya yang telah dimiliki baik itu data dan informasi. Pengolahan data menjadi informasi yang berguna ditinjau dari kualitas informasi yang dihasilkan. Proses pengolahan data dapat diterapkan di berbagai media, seperti pada database operasional, aplikasi operasional, atau menggunakan teknologi gudang data. Semakin baik kualitas informasi yang dihasilkan berpengaruh terhadap strategi dan keberhasilan perusahaan.

(23)

perolehan data dan informasi yang lengkap dan akurat. Untuk itu PT. ASDP Indonesia Ferry (Persero) cabang Kupang memerlukan sebuah teknologi informasi yang dapat mengintegrasikan, menyimpan data dalam jumlah besar serta menyediakan data dan informasi yang akurat bagi perusahaan guna menunjang proses analisa. Teknologi tersebut dinamakan Gudang Data.

Gudang data merupakan sekumpulan data yang berorientasi pada subjek, terintegrasi, memiliki rentang waktu, dan koleksi datanya tidak mengalami perubahan dalam mendukung pengambilan keputusan manajerial [2]. Gudang data memungkinkan integrasi berbagai jenis data dari berbagai macam aplikasi atau sistem. Beberapa manfaat dari gudang data adalah OLAP dan Penambangan Data [4]. OLAP mendayagunakan konsep data multi dimensi dan memungkinkan para pemakai menganalisa data sampai mendetail. Penambangan Data menggali pengetahuan dan informasi dari gudang data.

(24)

pendapatan yang diterima setiap bulan. Penerapan algoritma Apriori untuk menemukan asosiasi antara hari, lintasan, dan pendapatan sehingga membantu pihak Supervisor Lintasan dalam pengembangan pelayanan PT. ASDP Ferry Kupang.

1.2 Rumusan Masalah

Berdasarkan latar belakang yang telah diuraikan diatas, permasalahan yang diselesaikan dalam penelitian ini yakni : Bagaimana membuat gudang data yang dapat dipergunakan untuk sistem database Online Analytical Processing (OLAP) dan penambangan data dengan algoritma apriori untuk menunjang proses analisa pelayanan PT. ASDP Indonesia Ferry cabang Kupang ?

1.3 Tujuan Penelitian

Sesuai dengan rumusan masalah diatas, maka tujuan yang mendasari penelitian ini antara lain :

1. Membangun sistem database Online Analytical Processing

(OLAP) dari gudang data pelayanan ASDP sehingga diperoleh informasi pelayanan yang dapat membantu

(25)

2. Menerapkan algoritma Apriori dari gudang data yang terbentuk untuk menemukan asosiasi antara hari, lintasan, dan pendapatan di PT. ASDP Indonesia Ferry Cabang Kupang.

1.4 Kegunaan

Adapun kegunaan dari aplikasiyang akan dibangun adalah sebagai berikut :

Bagi penulis :

1. Menyelesaikan Tugas Akhir sebagai syarat kelulusan tingkat strata satu.

2. Mengetahui mengenai pelayanan operasional di PT. ASDP Indonesia Ferry (Persero) Cabang Kupang

3. Dapat membuat suatu gudang data pelayanan ASDP yang sudah terintegrasi dengan teknologi Online Analytical Processing

(OLAP) dan teknik penambangan data dengan algoritma Apriori

Bagi Supervisor Lintasan PT. ASDP Indonesia Ferry (Persero) Cabang Kupang :

(26)

2. Membantu kegiatan evaluasi produksi dan pendapatan lintasan yang dikelola oleh PT. ASDP Indonesia Ferry (Persero) Cabang Kupang

1.5 Batasan Masalah

Adapun batasan-batasan masalah dalam penelitian ini adalah :

a. Penelitian ini menggunakan data produksi dan pendapatan PT. ASDP Indonesia Ferry (Persero) Cabang Kupang tahun 2010 dan 2011 b. Gudang data yang terbentuk dimanfaatkan untuk sistem On-Line

Analytical Processing (OLAP) dan teknik penambangan data dengan algoritma apriori

c. Pada proses penambangan data dengan algoritma apriori, atribut yang diambil dari tabel master dalam gudang data hanya terdiri dari hari, lintasan, dan pendapatan

1.6 Metodologi Penelitian

Bagian ini bertujuan untuk menguraikan langkah-langkah peneliti dalam melaksanakan penelitian tugas akhir. Langkah-langkahnya antara lain:

1. Identifikasi Masalah

Melakukan wawancara kepada pihak yang terkait untuk mendapatkan informasi kebutuhan yang diperlukan.

(27)

Setelah data diperoleh dari pihak PT. ASDP Ferry Kupang, data kemudian dipersiapkan untuk proses pembuatan gudang data. Pertama yang dilakukan adalah pembersihan (cleaning) data. Informasi yang tidak dibutuhkan dihapus untuk mempercepat pemrosesan.

3. Transformasi Data

Pada tahap ini dilakukan transformasi terhadap data dengan cara mengubah metadata dari setiap atribut dan menambahkan data tertentu sehingga membuat data menjadi lebih mudah untuk digunakan dan dinavigasikan.

4. Pembentukan Gudang Data (Data Warehousing)

Setelah data di transformasikan, data dari sumber dipindahkan ke gudang data. Gudang data yang terbentuk dimanfaatkan untuk 2 proses antara lain:

a. Online Analytical Processing (OLAP)

Pembuatan sistem Online Analytical Processing (OLAP) dilakukan dengan cara :

1. Memecah gudang data ke dalam tabel dimensi dan tabel fakta

2. Pembuatan cube menggunakan skema multidimensi yaitu Skema Bintang (Star Schema). Penggunaan Star Schema

(28)

b. Penerapan Algoritma Apriori

Gudang data yang terbentuk diterapkan algoritma apriori untuk menemukan keterkaitan antara hari, lintasan, dan pendapatan dalam membantu analisis pelayanan PT. ASDP Ferry Indonesia Kupang

5. Evaluasi dan Presentasi pola

Pada tahap ini hasil direpresentasikan kepada pengguna akhir dalam bentuk yang dapat dipahami.

1.7 Sistematika Penulisan

Sistematika penulisan merupakan uraian susunan penulisan Tugas Akhir yang akan dibuat secara teratur dan sistematis yang dijalankan dalam beberapa bab dan subbab sehingga pada akhir penulisan akan memberikan gambaran secara menyeluruh. Sistematika penulisan disusun dengan urutan sebagai berikut.

BAB I. PENDAHULUAN

Bab ini berisi latar belakang penulisan tugas akhir, rumusan masalah, batasan masalah, metodologi penelitian, dan sistematika penulisan.

BAB II. LANDASAN TEORI

(29)

penambangan data menggunakan metode analisis asosiasi dengan algoritma Apriori.

BAB III : ANALISIS DAN PERANCANGAN SISTEM

Dalam bab ini akan diidentifikasikan masalah yang akan diselesaikan serta tahap tahap penyelesaian masalah tersebut dengan menggunakan algoritma apriori. Dalam bab ini pula akan dijelaskan pembuatan gudang data dan perancangan program implementasi penambangan data dengan algoritma apriori.

BAB IV. IMPLEMENTASI SISTEM

Bab ini berisi implementasi sistem yang meliputi implementasi data, implementasi use case, implementasi gudang data dan algoritma Apriori.

BAB V. ANALISA HASIL DAN PEMBAHASAN

Bab ini berisi analisa hasil program dan pembahasan masalah berdasarkan hasil yang telah didapat secara keseluruhan.

BAB VI. KESIMPULAN DAN SARAN

(30)

BAB II

LANDASAN TEORI

2.1Gudang Data

2.1.1 Definisi Gudang Data

Gudang Data merupakan koleksi data yang mempunyai sifat berorientasi subjek, terintegrasi, rentang waktu dan tidak mengalami perubahan dari koleksi data dan mendukung proses pengambilan keputusan [1].

Menurut Connolly dan Begg, gudang data adalah koleksi data yang mempunyai sifat berorientasi pada subjek, terintegrasi, memiliki rentang waktu, dan koleksi datanya tidak mengalami perubahan dalam mendukung pengambilan keputusan ditingkatan manajerial.

Tujuan utama gudang data untuk mengintegrasi data yang dimiliki perusahaan ke dalam sebuah repository yang akan memudahkan pengguna untuk menjalankan query, menghasilkan laporan, dan menampilkan analisa sehingga memudahkan perusahaan dalam mengambil keputusan.

2.1.2 Komponen Gudang Data

Ada banyak komponen yang terdapat dalam gudang data[2], diantaranya :

1. Penyimpan data

(31)

penyimpanan data operasional dimana data yang disimpan adalah tunggal untuk suatu aplikasi tertentu. Fungsi dari penyimpanan data operasional dalam gudang data adalah sebagai sumber aliran data mentah. Organisasi dalam penyimpanan data ini pada umumnya berorientasi subyek, dan berfokus pada pelanggan, produk, order, kebijakan hal lain diseputarnya. Penyimpanan data ini sering juga disebut sebagai gudang data secara fisik.

2. Data Mart

Data Mart adalah bagian dari gudang datadimana hanya data yang relevan saja yang dipelihara. Data Mart sering dilihat sebagai cara untuk meningkatkan masukan ke dalam bidang dari gudang data dan membuat seluruh kesalahan menjadi kecil. Data Mart biasanya digunakan oleh firma untuk memperkecil biaya dan memperkecil skala.

3. Metadata

Metadata merupakan salah satu contoh dari gudang data secara logikal. Yang digunakan untuk memperoleh informasi dan mengakses data secara aktual. Sistem legacy pada umumnya tidak menyimpan

(32)

lebih memperhatikan informasi yang disimpan tentang gudang dari pada informasi yang disediakan oleh gudang.

4. Sistem pendukung keputusan dan sistem informasi eksekutif. Keduanya bukanlah bagian dari gudang data akan tetapi aplikasi - aplikasinya digunakan untuk gudang data.

2.1.3 Karakteristik Gudang Data

Karakteristik gudang data[2]

1. Subject Oriented (Berorientasi subject)

Gudang Data berorientasi subject artinya Gudang Data didesain untuk menganalisa data berdasarkan subject-subject tertentu dalam organisasi,bukan pada proses atau fungsi aplikasi tertentu. Gudang Data diorganisasikan disekitar subjek-subjek utama dari perusahaan(customers, products dan sales) dan tidak diorganisasikan pada area-area aplikasi utama (customer invoicing,stock control dan

sales product). Hal ini dikarenakan kebutuhan dari gudang Data untuk menyimpan data-data yang bersifat sebagai penunjang suatu keputusan, dari pada aplikasi yang berorientasi terhadap data. Jadi dengan kata lain, data yang disimpan adalah berorientasi kepada subjek bukan terhadap proses.

2. Integrated (Terintegrasi)

(33)

tidak bisa dipecah-pecah karena data yang ada merupakan suatu kesatuan yang menunjang keseluruhan konsep gudang data itu sendiri. Syarat integrasi sumber data dapat dipenuhi dengan berbagai cara sepeti konsisten dalam penamaan variable,konsisten dalam ukuran variable,konsisten dalam struktur pengkodean dan konsisten dalam atribut fisik dari data. Contoh pada lingkungan operasional terdapat berbagai macam aplikasi yang mungkin pula dibuat oleh pengembang yang berbeda. Oleh karena itu, mungkin dalam aplikasi-aplikasi tersebut ada variable yang memiliki maksud yang sama tetapi nama dan format nya berbeda. Variable tersebut harus dikonversi menjadi nama yang sama dan format yang disepakati bersama. Dengan demikian tidak ada lagi kerancuan karena perbedaan nama, format dan lain sebagainya. Barulah data tersebut bisa dikategorikan sebagai data yang terintegrasi karena kekonsistenannya.

3. Time-variant (Rentang Waktu)

(34)

4. Non-Volatile

Karakteristik keempat dari gudang data adalah non-volatile, maksudnya data pada gudang data tidak di-update secara real time

tetapi di refresh dari sistem operasional secara reguler. Data yang baru selalu ditambahkan sebagai suplemen bagi database itu sendiri dari pada sebagai sebuah perubahan. Database tersebut secara terus-menerus menyerap data baru ini, kemudian secara incremental disatukan dengan data sebelumnya. Berbeda dengan database operasional yang dapat melakukan update, insert dan delete terhadap data yang mengubah isi dari database sedangkan pada gudang data hanya ada dua kegiatan memanipulasi data yaitu loading data (mengambil data) dan akses data (mengakses gudang data seperti melakukan query atau menampilan laporan yang dibutuhkan, tidak ada kegiatan updating data).

2.1.4 Arsitektur Gudang Data

(35)

Sumber data untuk mendukung pembuatan gudang data berupa data transaksi sehari-hari. Data tersebut dapat disimpan dalam berbagai media seperti

file excel , OLTP, dan sebagainya. Sebelum data di pindahkan ke gudang data, terlebih dahulu dilakukan proses ETL (Extract, Transform, Load). Setelah gudang data terbentuk dilanjutkan dengan proses OLAP dan Data Mining. OLAP menyediakan data secara multidimensi sehingga memudahkan pengguna dalam proses analisa dan pelaporan. Data mining menggali informasi berharga lainnya dari gudang data yang telah terbentuk.

2.1.5 Manfaat Gudang Data

Berikut ini manfaat yang bisa dilakukan dengan adanya gudang data, yaitu [4]:

a. Pembuatan laporan merupakan salah satu kegunaan gudang data yang paling umum dilakukan. Dengan menggunakan query sederhana didapatkan laporan perhari, perbulan, pertahun atau jangka waktu kapanpun yang diinginkan

b. On-Line Analytical Processing (OLAP).

(36)

dimensi, maka data yang berupa fakta yang sama bisa dilihat dengan menggunakan fungsi yang berbeda. Fasilitas lain yang ada pada sofware OLAP adalah fasilitas rool-up dan drill- down. Drill-down adalah kemampuan untuk melihat detail dari suatu informasi dan roll-up adalah kebalikannya

c. Penambangan Data (Data mining)

Data mining merupakan proses untuk menggali (mining) pengetahuan dan informasi baru dari data yang berjumlah banyak pada gudang data, dengan menggunakan kecerdasan buatan (Artificial Intellegence), statistik dan matematika. Data mining merupakan teknologi yang diharapkan dapat menjembatani komunikasi antara data dan pemakainya.

d. Proses informasi executive

(37)

2.1.6 Langkah Pembuatan Gudang data

Adapun langkah-langkah dalam pembuatan gudang dataantara lain:

1. Membaca data legacy

Memperhatikan bagian-bagian data yang perlu untuk dibersihkan 2. Memindahkan data dari sumber ke server gudang data

Membuat standarisasi format dan copy-kan data dari sumber sekaligus data dibuat bersih (clean).

3. Memecah gudang data dalam tabel fakta dan tabel dimensi.

Tabel fakta dan tabel dimensi disusun menurut kebutuhan subyek

2.1.7 Online Analytical Processing (OLAP)

Online Analytical Processing (OLAP) adalah sintetis dinamis, analisis dan konsolidasi dari sekumpulan besar data multi-dimensi [3]. OLAP memungkinkan pengguna untuk mendapatkan pengertian dan pengetahuan yang mendalam mengenai berbagai aspek dari data perusahaan dengan akses yang cepat, konsisten, interaktif melalui kemungkinan variasi view

dari data. Penjelasan mengenai perbedaan OLTP dan OLAP tampak pada tabel 2.1 [7].

Tabel 2.1 Perbedaan OLTP dan OLAP

Fitur OLTP OLAP

Karakteristik Proses operasional Proses Informasi

(38)

Fungsi Menangani transaksi sehari-hari

Kebutuhan informasi jangka panjang, pendukung keputusan Desain Database Berorientasi pada aplikasi Star/Snowflake Schema

Data Data up-to-date Data histori

Unit Kerja Transaksi sederhana Complex query

2.1.8 Extract, Transform, Load (ETL)

ETL merupakan singkatan dari extract, transform, load yang berfungsi untuk melakukan ekstraksi data dari data source, dan kemudian melakukan transformasi data, sebelum mengirimkannya ke data store

tujuan. Extract adalah suatu pengambilan atau perpindahan data yang dilakukan dari suatu tempat data awal ke tempat data sementara. Kemudian transform adalah suatu perubahan bentuk yang dilakukan untuk memenuhi kebutuhan. Sedangkan load adalah suatu pengiriman atau perpindahan data dari tempat data sementara atau variabel tertentu ke tempat penampungan akhir sebelum data tersebut ditampilkan atau diolah kembali.

(39)

dan membuat index dari data itu untuk menjamin kualitas dari data lalu menerbitkannya.

2.1.9 Dimensional modeling

2.1.9.1Tabel Fakta (Fact Table)

Tabel fakta merupakan tabel utama dalam model dimensional dimana ukuran dari performa suatu bisnis disimpan [7] . Fakta berisi nilai dari sebuah kejadian atau transaksi tertentu misalnya penyimpanan uang di bank, penjualan produk, pesanan, dan sebagainya. Tabel fakta umumnya mengandung angka dan data history yang terdiri dari foreign key yang merupakan primary key dari beberapa dimension table yang saling berhubungan. Tabel fakta sering disebut juga dengan major table.

2.1.9.2Tabel Dimensi

Tabel dimensi digunakan untuk menyempurnakan data yang ada pada tabel fakta atau menjelaskannya dengan lebih detil [7]. Datanya berupa karakter. Setiap tabel dimensi menyimpan baris dari data dengan informasi berupa karakter yang menjelaskan field yang berhubungan dengan tabel fakta dengan lebih detil.

(40)

fakta bisa memiliki banyak baris data untuk beberapa transaksi bagi item data yang sama.

2.1.9.3Cube, Dimension, Measure,Member

Teknologi OLAP menganut multi dimensional modeling, artinya dapat melihat analisis pengukuran dengan pandangan berbagai dimensi. Di dalam konsep ini perlu mengenal berbagai istilah yang berkaitan dengan OLAP [8]:

1. Cube adalah struktur multi dimensional konseptual, terdiri dari dimension dan measure dan biasanya mencakup pandangan bisnis tertentu.

2. Dimension adalah struktur view / sudut pandang yang menyusun cube. Dimensi dapat terdiri dari berbagai level.

3. Measure : nilai pengukuran

4. Member adalah isi / anggota dari suatu dimension / measure tertentu

2.1.9.4Skema Bintang (Star Schema)

(41)

Gambar 2.1 Star Schema dari PHI-Minimart

2.1.9.5Surrogate key

Surrogate key adalah key / kolom data di tabel dimensi yang menjadi primary

key dari tabel tersebut. Nilai ini biasanya berupa nilai sekuensial dan tidak

memiliki arti dari proses bisnis darimana sumber data berasal [10].

2.2Penambangan Data (Data Mining)

“Penambangan data adalah proses pengolahan informasi dari sebuah

database yang besar, meliputi proses ekstraksi, pengenalan, komprehensif, dan penyajian informasi sehingga dapat digunakan dalam pengambilan keputusan bisnis yang krusial “ (Connolly dan Begg 2004, p1233).

Sedangkan menurut Han dan Kamber (2006, p7)., “Penambangan

(42)

yang sangat besar. “. Penambangan Data merupakan suatu langkah dalam

knowledge discovery in database (KDD).

Langkah-langkah dalam menemukan pengetahuan (discovery knowledge) meliputi :

1. Data cleaning

Menghilangkan noise dan data yang tidak konsisten

2. Data integration

Menggabungkan berbagai sumber data

3. Data Selection

Menerima data yang berhubungan dnegan analisa dari database

4. Data transformation

Mengubah data ke bentuk yang sesuai untuk mining dengan melakukan agregasi atau summary

5. Data mining

Melakukan proses mining untuk mengekstrak data

6. Pattern evaluation

Mengidentifikasi pola yang menggambarkan pengetahuan (knowledge)

(43)

Menampilkan mined knowledge kepada pengguna

Gambar 2.3 Langkah-Langkah Discovery Knowledge

Suatu sistem atau query data mining mungkin saja menghasilkan ribuan pola, namun tidak semua pola tersebut adalah pola yang menarik atau penting. Ukuran suatu pola yang menarik atau penting adalah jika pola tersebut mudah dimengerti oleh manusia, bermanfaat, valid / benar pada data baru atau data tes dan membenarkna beberapa hipotesis.

(44)

digunakan untuk analisa data menggunakan teknik penambangan data sedangkan OLAP adalah basisdata yang khusus digunakan untuk menunjang proses pengambilan keputusan (decision making). Teknologi yang ada di gudang data dan OLAP dimanfaatkan penuh untuk melakukan penambangan data.

Gambar 2.4 Data Mining dan teknologi basisdata lainnya

2.3Metode Analisis Asosiasi

Salah satu metode dalam penambangan data adalah metode analisis asosiasi (association analysis). Metode analisis asosiasi merupakan metode yang bertujuan untuk menemukan aturan (association rule) antar item dalam suatu himpunan data (dataset), yaitu dengan membuat korelasi antar item yang dikelompokan ke dalam transaksi kemudian mengambil kesimpulan berdasarkan hubungan yang terbentuk dari sekumpulan data tersebut. Kumpulan item data ini sering disebut itemset.

(45)

analisis asosiasi bertujuan untuk menemukan semua aturan yang terdapat pada basisdata dengan minsup (minimum support) dan mincof (minimum confidence) yang melebihi batas tertentu. Suatu aturan asosiasi dirasa valid

apabila mempunyai nilai confidence / nilai kepastian ≥ 50% (Lopez-Cozar, 2000).

Support dari aturan adalah rasio dari record yang mengandung dengan total record dalam basisdata. Untuk mendapatkan nilai support

dapat menggunakan rumus :

...(2.1) Sedangkan Minsup (minimum support) menandakan ambang batas (threshold) yang menentukan apakah sebuah itemset akan digunakan pada perhitungan selanjutnya untuk pencarian aturan asosiasi.

Confidence dari aturan asosiasi adalah rasio dari record yang mengandung dengan total record yang mengandung . Untuk mendapatkan nilai confidence dapat menggunakan rumus :

.......(2.2) Atau dapat ditulis sebagai berikut:

(46)

Misalnya terdapat himpunan data transaksi D sebagai berikut [13]:

Tabel 2.2 Contoh Tabel Transaksi D

TID Itemset

1 Bread, Milk

2 Bread, Diaper, beer, Eggs

3 Milk, Diaper, Beer, Coke

4 Bread, Milk, Diaper, Coke

5 Bread, Milk, Diaper, Coke

Misalkan akan dihasilkan rule : {Milk, Diaper}→Beer Maka support menjadi

Confidence menjadi

Secara umum yang dilakukan dalam proses pencarian aturan asosiasi ini dapat dibagi menjadi 2 tahapan, yang terdiri dari :

o Pencarian frequent itemset

Yaitu proses pencarian semua itemset yang memiliki nilai support ≥

minsup. Itemset ini disebut frequent itemset atau large itemset ( l-itemset). Dalam tugas akhir ini proses pencarian frequent itemset

menggunakan algoritma apriori.

o Pembentukan strong association rule

(47)

aturan asosiasi yang memiliki nilai confidence minconf. Aturan asosiasi dapat ditemukan dari setiap frequent itemset.

2.4Algoritma Apriori

Algoritma Apriori merupakan algoritma untuk mencari frequent itemset yang berdasarkan prinsip apriori, yaitu jika suatu itemset merupakan

frequent itemset maka semua subset-nya akan berupa frequent itemset (Tan, et.al. 2006). Pembentukan frequent itemset dilakukan dengan mencari semua kombinasi item-item yang memiliki support yang lebih besar atau sama dengan minsup yang telah ditentukan. Pseudocode untuk pencarian frequent itemset menggunakan algoritma apriori adalah sebagai berikut (Gunawan, 2003) [11] :

= candidate itemset untuk ukuran k

= frequent itemset / large itemset untuk ukuran k = {candidate 1-itemset}

= {large 1-itemset}

for ( ) do begin

// new candidate

for all transaction do begin

//candidate contained in

for all candidates do

end

end

(48)

Algoritma diatas dapat dijelaskan sebagai berikut :

a. Pada iterasi pertama dihitung jumlah kemunculan setiap item dalam transaksi untuk menentukan large 1-itemset. Pada iterasi selanjutnya akan dihasilkan candidate k-itemset Ck menggunakan

frequent(k-1)-itemset yang ditemukan pada iterasi sebelumnya. Candidate generation

diimplementasikan menggunakan sebuah fungsi yang disebut apriori-gen. Apriori-gen digunakan untuk menghasilkan candidate itemset yang menyebabkan tidak seluruh itemset diolah pada proses selanjutnya, hanya yang memenuhi persyaratan saja yaitu sesuai dengan support

yang telah ditentukan. Hal ini mempersingkat waktu proses pencarian seluruh aturan asosiasi.

b. Setelah itu, dilakukan penelusuran dalam basisdata untuk menghitung

support bagi setiap candidate itemset dalam Ck . Untuk setiap transaksi

t, dicari semua candidate itemset t dalam set Ck yang terkandung dalam transaksi tersebut. Kumpulan dari semua candidate itemset dalam Ck yang terkandung dalam transaksi t disebut Ct dan ditulis dengan notasi

c. Selanjutnya nilai support dari semua candidate k-itemset dalam Ct dinaikkan. Penelusuran dilanjutkan pada transaksi berikutya sampai semua transaksi dalam basisdata ditelusuri. Lalu akan dilakukan eliminasi candidate itemset yang memiliki nilai support lebih kecil dari

(49)

disimpan dalam Lk yang akan digunakan untuk membentuk large

(k+1)-itemset. Algoritma berakhir ketika tidak ada large itemset baru yang dihasilkan.

Pencarian frequent itemset menggunakan algoritma apriori memiliki 2 karakteristik penting yaitu :

1. Apriori merupakan algoritma level-wise dimana proses pada algoritma ini membangkitkan frequent itemset per level, dimulai dari level 1-itemset sampai ke itemset terpanjang dan candidate level yang baru, dibentuk dari frequent itemset yang ditemukan di level sebelumnya lalu menentukan nilai supportnya.

2. Algoritma ini menggunakan strategi generate and test untuk menemukan frequent itemset. Pada tiap iterasi, candidate itemset

yang baru, dihasilkan dari frequent itemset yang ditemukan pada iterasi sebelumnya. Nilai support tiap candidate dihitung dan di bandingkan kembali dengan ambang batas minsupnya. Jumlah

iterasi yang dibutuhkan algoritma ini adalah , dimana kmaxmerupakan ukuran maksimum dari frequent itemset.

(50)

support-nya untuk menemukan frequent itemset pada level tersebut. Sedangkan strategi perhitungan nilai support dilakukan dengan horizontal counting, dengan cara membaca transaksi satu persatu, jika ditemukan

(51)

BAB III

ANALISIS DAN PERANCANGAN SISTEM

3.1 Identifikasi Masalah

PT. ASDP Indonesia Ferry (Persero) Cabang Kupang menangani pelayaran antar pulau di daerah Nusa Tenggara Timur. Data transaksi operasional pelayaran di tiap lintasan meliputi kapal yang beroperasi, jenis tiket yang terdiri dari tiket penumpang, tiket kendaraan, dan tiket barang serta produksi dan pendapatan. Data operasional produksi dan pendapatan yang dimiliki oleh PT. ASDP Kupang ini masih tercatat secara manual dalam bentuk file excel sehingga pihak Supervisor mengalami kesulitan dalam menganalisa data tersebut. Jadi untuk memudahkan menganalisa data tersebut maka digunakan teknik gudang data untuk merangkum transaksi sehingga mudah dianalisa.

(52)

3.2 Arsitektur Sistem

excel Gudang data Pemanfaatan

Gudang data

Gambar 3.1 Arsitektur Sistem

(53)

3.3 Analisis Kebutuhan

Supervisor Lintasan PT. ASDP Ferry Cabang Kupang ingin mengetahui informasi produksi dan pendapatan pada PT. ASDP Indonesia Ferry (Persero) Cabang Kupang. Informasi yang diinginkan meliputi informasi lintasan yang dikelola, kapal yang sering beroperasi, jenis tiket yang ditawarkan, besar produksi, dan besar pendapatan yang diterima tiap bulan. Informasi dibutuhkan untuk membuat rekap produksi dan pendapatan berbagai lintasan yang dikelola oleh PT. ASDP Kupang. Selain itu dengan teknik penambangan data menghasilkan informasi berharga mengenai keterkaitan antara hari, lintasan, pendapatan. Hasil asosiasi teknik penambangan data membantu pihak ASDP menyusun strategi untuk peningkatan kualitas pelayanan perusahaan.

3.4 Pembersihan Data

(54)

3.5 Transformasi Data

Pada tahap ini dilakukan pengubahan data ke dalam format yang sesuai untuk proses dalam gudang data. Terdapat pengubahan metadata dari setiap atribut sehingga mudah dinavigasikan. Atribut yang dimiliki data transaksi antara lain kode_tiket, jenis_tiket, tarif, nama_kapal, tanggal, produksi, pendapatan. Terdapat beberapa atribut yang dipecah antara lain kode_tiket dan jenis_tiket. Kode_tiket dibagi menjadi 2 antara lain id_kategori_tiket, yang menampung kategori tiket yaitu id tiket kategori penumpang, id tiket kategori kendaraan, dan id tiket kategori barang. Kategori_tiket menampung 3 kategori tiket yaitu penumpang, kendaraan, dan barang. Jenis tiket dibagi menjadi 2 yaitu id_tiket dan nama tiket. Berdasarkan pemecahan data tersebut dihasilkan atribut baru yaitu no, tanggal_opr, lintasan, kapal, id_kategori_tiket, id_tiket, kategori_tiket, tiket, produksi, dan pendapatan. Pada proses transformasi ini sebelum data dimasukkan ke gudang data akan diubah meta data dari tiap atribut sehingga memudahkan untuk proses selanjutnya.

3.6 Pembuatan Gudang Data

(55)

3.6.1 Membaca data legacy

Sumber data yang ada berupa data transaksi setiap lintasan. Data transaksi ini masih berbentuk file excel. Struktur data dari rekapitulasi tiap jenis lintasan seperti pada tabel 3.1

Tabel 3.1 Rekapitulasi jenis lintasan

JenisLintasan Tabel jenis lintasan pada tiap layanan PK NO URUT NO URUT sebagai primary key

Berisi NO URUT transaksi Berisi kode tiket pelayaran

Berisi jenis tiket lintasan, yang terdiri dari tiket penumpang, tiket kendaraan, dan tiket barang Berisi tarif tiket dari lintasan

Berisi nama kapal yang beroperasi Berisi nama lintasan yang dikelola Berisi tanggal operasi kapal Berisi jumlah tiket yang dibeli

Berisi pendapatan dari penjualan jenis tiket

(56)

TANGGAL, PRODUKSI, PENDAPATAN. Contoh data jenis lintasan seperti pada tabel 3.2

Tabel 3.2 Contoh data rekapitulasi Lintasan

NO URUT 1

KODE TIKET 4101010301

JENIS TIKET EKONOMI – DEWASA

TARIF 29700

NAMA KAPAL CUCUT

NAMA LINTASAN KUPANG-ROTE

TANGGAL 01/01/2010

PRODUKSI 153

PENDAPATAN 4.544.100

3.6.2 Memindahkan data dari sumber ke server gudang data

(57)

master_operasional

Gambar 3.2 Pembentukan master_operasional ke gudang data

Gambar 3.2 merupakan proses pembentukan tabel master_operasional. Tabel master_operasional berasal dari data operasional pada file excel. Tabel ini akan digunakan untuk proses selanjutnya yaitu OLAP dan Penambangan Data.

3.7Pemanfaatan Gudang Data

3.7.1 Pembuatan OLAP

Setelah tabel master_operasional terbentuk ke dalam gudang data maka dilanjutkan proses OLAP dan penerapan algoritma Apriori. Dalam proses pembentukan OLAP akan digunakan sebuah schema multidimensional yaitu Star Schema. Schema ini digunakan karena lebih efisien dan sederhana dalam pembuatan query serta mudah diakses oleh pengguna. Dalam star schema terdapat tiga tabel fakta dan beberapa tabel dimensi guna pemrosesan query yang lebih ringan.

(58)

1. Informasi rekapitulasi jumlah produksi dan besar pendapatan yang diperoleh setiap bulannya pada tahun 2010 dan 2011 untuk setiap lintasan, kapal dan tiket.

2. Informasi jumlah produksi untuk setiap lintasan, kapal, dan tiket tiap bulannya pada tahun 2010 dan 2011.

3. Informasi besar pendapatan yang diperoleh untuk setiap lintasan, kapal, dan tiket tiap bulannya pada tahun 2010 dan 2011.

Dalam proses pembuatan OLAP, gudang data yang terbentuk dipecah menjadi beberapa tabel dimensi dan tabel fakta. Pembentukan tabel dimensi dan tabel fakta antara lain:

1. Tabel Dimensi merupakan tabel yang berisi data yang menunjukkan tinjauan dari berbagai perspektif. Penjelasan dari masing-masing tabel dimensi dijelaskan sebagai berikut:

a. Tabel dimensi_lintasan

Gambar 3.3 Pembentukan tabel dimensi_lintasan

(59)

master_operasional. Pada tabel dimensi_lintasan ini memiliki

primary key sk_lintasan dan field lainnya yaitu lintasan.

b. Tabel dimensi_kapal master_operasional

PK no

tanggal_opr lintasan kapal

id_kategori_tiket kategori_tiket id_tiket tiket produksi pendapatan

dimensi_kapal

PK sk_kapal

kapal

Gambar 3.4 Pembentukan tabel dimensi_kapal

Gambar 3.4 merupakan proses pembentukan tabel dimensi_kapal. Table dimensi_kapal berasal dari tabel master_operasional. Pada tabel dimensi_kapal ini memiliki

primary key sk_kapal dan field lainnya yaitu kapal.

(60)

master_operasional

Gambar 3.5 Pembentukan tabel dimensi_tiket

Gambar 3.5 merupakan proses pembentukan tabel dimensi_tiket. Table dimensi_tiket berasal dari tabel master_operasional. Pada tabel dimensi_tiket ini memiliki primary key sk_tiket dan field lainnya yaitu id_kategori_tiket, kategori_tiket, id_tiket, dan tiket.

d. Tabel dimensi_waktu

(61)

Gambar 3.6 merupakan proses pembentukan tabel dimensi_waktu. Table dimensi_waktu berasal dari tabel master_operasional. Pada tabel dimensi_tiket ini memiliki primary key sk_waktu dan field lainnya yaitu day, month, year.

2. Tabel fakta yang terbentuk dari perancangan gudang data ini merupakan tabel yang berhubungan dengan pelayanan operasional di PT. ASDP Indonesia Ferry Cabang Kupang. Pembentukan tabel fakta dapat dijelaskan sebagai berikut :

a. Tabel fact_rekapitulasi

(62)

master_operasional

Gambar 3.7 Pembentukan tabel fact_rekapitulasi b. Tabel fact_laporan_produksi

(63)

master_operasional

Gambar 3.8 Pembentukan tabel fact_laporan_produksi

c. Tabel fact_laporan_pendapatan

(64)

master_operasional

Gambar 3.9 Pembentukan tabel fact_laporan_pendapatan

Proses pembentukan OLAP ASDP ini memerlukan 3 cube yaitu

cube laporan_rekapitulasi, cube laporan_produksi, dan cube

laporan_pendapatan. Cube laporan_rekapitulasi merupakan cube yang digunakan untuk melihat hasil rekapitulasi semua data produksi dan pendapatan yang dilihat dari perspektif waktu, lintasan, kapal, dan tiket.

(65)

untuk melihat laporan besar pendapatan pelayan operasional PT. ASDP Ferry Cabang Kupang yang dilihat dari perspektif waktu, lintasan, kapal, dan tiket. Ketiga cube ini berhubungan dengan tabel dimensi. Berikut ini penjelasan mengenai cube dalam pembentukan OLAP

1. Cube laporan_rekapitulasi

Cube laporan_rekapitulasi dengan star schema laporan_rekapitulasi. Pada star schema laporan_rekapitulasi memilki tabel fakta yaitu fact_rekapitulasi dan tabel dimensi yaitu tabel dimensi_waktu, dimensi_lintasan, dimensi_kapal, dan dimensi_tiket. Nilai pengukuran dalam cube adalah jumlah produksi dan besar pendapatan pelayanan operasional PT. ASDP Ferry Cabang Kupang. Star schema

(66)

master_operasional

Gambar 3.10 Star Schema laporan_rekapitulasi 2. Cube laporan_produksi

Cube laporan_produksi dengan star schema laporan_produksi. Pada

(67)

master_operasional

Gambar 3.11 Star Schema laporan_produksi 3. Cube laporan_pendapatan

(68)

master_operasional

Gambar 3.12 Star Schema laporan_pendapatan

3.7.2 Penerapan Algoritma Apriori

(69)

perhitungan association rule pengguna menentukan dataset atau parameter yang akan digunakan dalam proses.

Data set yang digunakan berasal dari gudang data yang telah terbentuk yakni dari tabel master_operasional. Atribut yang dipakai untuk proses asosiasi adalah hari, lintasan, dan pendapatan.

Tabel 3.3 Contoh data dari atribut

Hari Lintasan Pendapatan

Sabtu AIMERE_KUPANG 21.324.000

Rabu AIMERE_KUPANG 11.602.000

Rabu AIMERE_KUPANG 13.336.900

Selasa AIMERE_WAINGAPU 7.835.100

Kamis AIMERE_WAINGAPU 4.457.300

Sabtu AIMERE_WAINGAPU 3.710.100

Jumat BARANUSA_KALABAHI 851.000

Minggu BARANUSA_LEWOLEBA 408.000

Senin BARANUSA_LEWOLEBA 513.000

Selasa ENDE_KUPANG 9.895.700

Senin ENDE_KUPANG 11.968.800

..dst ..dst ..dst

Data atribut pendapatan dilakukan partisi sebanyak 5 partisi antara lain SANGAT TINGGI, TINGGI, CUKUP, RENDAH, SANGAT RENDAH. Kriteria pendapatan sangat tinggi > 30 juta, tinggi berkisar antara 19 juta sampai dengan 29,9 juta, kriteria cukup berkisar antara 9 juta hingga 18,9 juta, kriteria rendah berkisar 1,2 juta hingga 8,9 juta, dan kriteria sangat rendah < 1,19 juta.

. Selanjutnya pengguna menentukan nilai minimum support dan

(70)

100%. Setelah menentukan nilai minimum support dan minimum confidence yang akan digunakan dalam proses, baru dilakukan proses perhitungan association rule. Setelah proses perhitungan selesai, system akan menampilkan rule yang dihasilkan dan nilai confidencenya. Rule ini menunjukkan hasil asosiasi antara hari, lintasan, dan pendapatan.

Proses perhitungan association rule terdiri dari beberapa tahap antara lain

1. Sistem men-scan database untuk mendapatkan kandidiat 1-itemset (himpunan item yang terdiri dari 1 item) dan menghitung nilai

supportnya.. Support dari suatu itemset (S) merupakan presentase dari transaksi dalam T yang mengandung S. Kemudian nilai support tersebut dibandingkan dengan minimum support yang telah ditentukan. Jika nilainya lebih besar atau sama dengan minimum support maka itemset tersebut trmasuk dalam large itemset.

2. Itemset yang tidak termasuk dalam large itemset tidak diikutkan dalam iterasi selanjutnya (di-prune)

(71)

mendapatkan Lk seperti pada itersi sebelumnya system akan menghapus (prune) kombinasi itemset yang tidak termasuk dalam large itemset.

4. Setelah dilakukan operasi join, maka pasangan itemset baru dari hasil proses join tersebut juga dihitung supportnya.

5. Proses pembentukan kandidat yang terdiri dari proses join dan prune akan terus dilakukan hingga himpunan kandidat itemsetnya null, atau sudah tidak ada lagi kandidat yang akan dibentuk.

6. Setelah itu, dari hasil frequent itemset tersebut dibentuk association rule

yang memenuhi nilai support dan confidence yang telah ditentukan.

7. Pada pembentukan association rule nilai yang sama dianggap satu nilai

8. Association rule yang terbentuk harus memenuhi nilai minimum yang telah ditentukan

9. Untuk setiap large itemset L, dicari himpunan bagian L yang tidak kosong. Untuk setiap himpunan bagian tersebut, dihasilkan rule dengan bentuk a

(72)

3.8 Analisis Kebutuhan

3.8.1 Use Case

Diagram use case ini dapat menggambarkan kebutuhan dari Supervisor Lintasan PT. ASDP terhadap sistem yang akan dibangun. Gambar 3.13 merupakan gambar diagram use case untuk aplikasi gudang data PT. ASDP Kupang.

Melihat laporan rekapitulasi

Melihat laporan produksi <<depends on>>

Cari aturan asosiasi Supervisor Lintasan

Login

Melihat laporan pendapatan

Transfer data produksi dan pendapatan

(73)

3.8.2 Narasi Use Case

Tabel 3.4 Narasi use case login

ID Use case : Ferry_01 Nama use case Login

Aktor : Supervisor Lintasan Deskripsi Use

Case :

Use case ini menggambarkan proses dimana supervisor lintasan melakukan login sebelum masuk ke sistem. Pengguna harus memasukkan username dan password ke sistem.

Prakondisi : - Trigger : - Langkah

Umum

Kegiatan Aktor Respon Sistem

2. Petugas Operasional memilih menu “Login”

4. Memasukkan username dan password

6. Menampilkan halaman utama untuk petugas opersional

1.Menampilkan halaman utama

3.Menampilkan halaman login

5.sistem mengecek validasi di database

Langkah Alternatif

-

Kesimpulan Use case ini berhenti apabila pengguna akan memilih menu lain

Tabel 3.5 Narasi use case melihat laporan rekapitulasi ID Use case : Ferry_02

Nama use case Melihat laporan rekapitulasi Aktor : Supervisor Lintasan

(74)

Case : rekapitulasi pelayanan operasional Prakondisi : -

Trigger : - Langkah

Umum

1. Supervisor Lintasan

memilih menu

“Rekapitulasi Pelayanan” 2. Sistem

menampilkan hasil

Kesimpulan Use case ini berhenti apabila supervisor lintasan akan memilih menu lain

Tabel 3.6 Narasi use case melihat laporan produksi ID Use case : Ferry_03

Nama use case Melihat laporan produksi Aktor : Supervisor Lintasan Deskripsi Use

Case :

Use case ini berfungsi untuk melihat hasil pembentukan OLAP

Laporan Produksi dair pelayanan PT. ASDP Ferry Kupang Prakondisi : -

Trigger : - Langkah

Umum

1. Supervisor Lintasan memilih menu “Laporan

(75)

menampilkan hasil

Tabel 3.7 Narasi use case melihat laporan pendapatan ID Use case : Ferry_04

Nama use case Melihat laporan pendapatan Aktor : Supervisor Lintasan

Deskripsi Use Case :

Use case ini berfungsi untuk melihat hasil pembentukan OLAP

laporan pendapatan pelayanan PT. ASDP Ferry Kupang Prakondisi : -

Trigger : - Langkah

Umum

1. Supervisor Lintasan memilih menu “Laporan

Pendapatan” 2. Sistem

menampilkan hasil

(76)

menu lain

Tabel 3.8 Narasi use case transfer data produksi dan pendapatan ID Use case : Ferry_05

Nama use case Transfer data produksi dan pendapatan Aktor : Supervisor Lintasan

Deskripsi Use Case :

Use case ini berfungsi untuk melakukan transfer data produksi dan pendapatan

Prakondisi : - Trigger : - Langkah

Umum

1. Memilih menu

“Transformasi Data”

3. Supervisor Lintasan memilih tombol “transfer data”

2. Menampilkan halaman transfer data

4. Sistem melakukan proses transfer data

Langkah Alternatif

-

Tabel 3.9 Narasi use case Cari Aturan Asosiasi ID Use case : Ferry_06

Nama use case Cari aturan asosiasi Aktor : Supervisor Lintasan

(77)

Case : antara hari, lintasan, dan pendapatan Prakondisi : -

Trigger : - Langkah

Umum

1. Supervisor Lintasan memilih menu “Aturan Asosiasi”

3. Supervisor lintasan memasukkan support dan confidence

2.sistem menampilkan halaman aturan asosiasi

5.Sistem melakukan proses association dengan algoritma apriori

6.Menampilkan hasil perhitungan apriori

Langkah Alternatif

-

3.8.3 Desain Antar Muka

(78)

itu juga GUI yang terbentuk disediakan untuk layanan perhitungan asosiasi kapal yang beoperasi di PT. ASDP Ferry Kupang. Berikut ini rancangan antar muka yang disediakan dalam aplikasi

1. Halaman Login

Halaman login digunakan untuk memasukkan username dan

password pengelola sistem ini yakni Supervisor Lintasan. Halaman ini memiliki dua tombol yaitu Login dan Batal. Tombol logi digunakan untuk melakukan proses login untuk masuk ke halaman utama sistem. Tampilan halaman login dapat dilihat pada gambar 3.14

Username

Password

Login

PT. ASDP INDONESIA FERRY KUPANG

Gudang Data Pemantauan Pelayanan Operasional

Batal

Gambar 3.14 Halaman Login

2. Rancangan layar menu

(79)

sistem secara langsung akan menampilkan hasil mondrian rekapitulasi pelayanan. Tampilan rancangan menu dapat dilihat pada gambar 3.15

PT. ASDP Indonesia Ferry (Persero) Cabang Kupang

Rekapitulasi Pelayanan

Laporan Produksi

Laporan Pendapatan

Mondrian Rekapitulasi Pelayanan

Logout

Aturan Asosiasi Transformasi Data

Gambar 3.15 Halaman Home

3. Halaman Laporan Produksi

Halaman ini menampilkan hasil data analisis produksi PT. ASDP Ferry Kupang. Tampilan halaman laporan produksi ini tampak pada gambar 3.16

Rekapitulasi Pelayanan

Laporan Produksi

Laporan Pendapatan

Mondrian Laporan Produksi

Logout

(80)

4. Halaman Laporan Pendapatan

Halaman ini menampilkan hasil data analisis pendapatan PT. ASDP Ferry Kupang. Tampilan halaman laporan pendapatan ini tampak pada gambar 3.17

Laporan Produksi

Laporan Pendapatan

Mondrian Laporan Pendapatan

Logout

Gambar 3.17 Halaman Laporan Pendapatan 5. Halaman Transformasi Data

(81)

Laporan Produksi

Laporan Pendapatan

Transfer Data Produksi dan Pendapatan

Logout

Aturan Asosiasi Transformasi Data

Transfer Data

Gambar 3.18 Halaman Transfer Data

6. Halaman Aturan Asosiasi

(82)

Laporan Produksi

Laporan Pendapatan

Logout

Aturan Asosiasi

Transformasi Data

Minimum support

Minimum confidence

Hasil

confirm

Gambar 3.19 Halaman Hasil Perhitungan Asosiasi Kapal

3.9Kebutuhan Komponen dan Kebutuhan Sistem

Adapun kebutuhan komponen yang menunjang terbentuknya gudang data ini antara lain:

a. Pentaho merupakan komponen utama untuk melakukan eksekusi terhadap kettle, Mondrian, jpivot, dan schema workbench untuk mendukung fungsi-fungsi yang telah disediakan

b. Kettle merupakan komponen yang dibutuhkan untuk melakukan ETL (Extract, Transform, Load) data

(83)

d. Schema Workbench merupakan komponen yang digunakan untuk membuat file skema mondrian dalam format XML untuk memetakan kubus, dimensi, dan measure dengan tabel relasi

(84)

BAB IV

IMPLEMENTASI DAN ANALISIS SISTEM

Pada bab ini akan dijelaskan mengenai implementasi pembuatan gudang data dan pembahasannya. Pembuatan gudang data mengacu pada kebutuhan informasi yang dibutuhkan Supervisor Lintasan.

4.1 Implementasi Arsitektur Gudang Data

Pada bab sebelumnya telah dibahas mengenai rancangan arsitektur gudang data. Gudang data yang terbentuk akan dimanfaatkan untuk kebutuhan OLAP dan teknik Penambangan Data dengan algoritma Apriori. Arsitektur sistem tampak pada gambar 4.1

Clean Extract Transform Load Refresh

Gudang Data Pelayanan Produksi

ASDP Kupang

OLAP

Data Mining – Algoritma

Apriori

Report

Pola asosiasi antar kapal di tiap lintasan

Gambar 4.1 Arsitektur Sistem

Untuk mendukung arsitektur sistem diperlukan beberapa spesifikasi

software dan hardware yang mendukung yaitu:

(85)

digunakan pada satu tempat yaitu Kantor Pelayanan PT. ASDP Ferry Kupang

2. Gudang data pelayanan operasional PT. ASDP Ferry Kupang menggunakan jaringan LAN (Local Area Network).

3. Sistem yang dibangun menggunakan media antara lain:

 Database MySQL

 Bahasa pemrograman JAVA

 Tools : Kettle, Schema-Workbench, Mondrian, Apache Tomcat, Netbeans IDE 6.7 untuk pemrograman Java dan mySQL Connector untuk terhubung dengan program java

4. Spesifikasi hardware yang digunakan untuk pembuatan sistem antara lain:

 Processor : Intel Pentium Dual Core 1,86GHz

 Memory : 2 GB

4.2 Langkah Pembuatan Gudang Data

4.2.1 Membaca Data Legacy

Sumber data yang digunakan dalam pembuatan gudang data ini berbentuk file excel. Data yang diperoleh adalah rekapitulasi produksi dan pendapatan tiap bulan di tahun 2010 dan 2011. Berdasarkan data tersebut diketahui bahwa PT. ASDP Indonesia Ferry Cabang Kupang mengelola banyak lintasan antara lain AIMERE-KUPANG, AIMERE-WAINGAPU,

BARANUSA-KALABAHI, BARANUSA-LEWOLEBA,

(86)

KALABAHI-KUPANG, KALABAHI-LARANTUKA, KALABAHI-LEWOLEBA, KALABAHI-TELUK GURITA, KUPANG-AIMERE, KUPANG-ENDE, KUPANG-KALABAHI, KUPANG-LARANTUKA,

KUPANG-LEWOLEBA, KUPANG-ROTE, KUPANG-SABU,

KUPANG-WAINGAPU, KALABAHI,

LARANTUKA-KUPANG, LARANTUKA-LEWOLEBA,

LARANTUKA-WAIWERANG, LEWOLEBA-BARANUSA, LEWOLEBA-KALABAHI,

LEWOLEBA-KUPANG, LEWOLEBA-WAIWERANG,

ROTE-KUPANG, SABU-ROTE-KUPANG, SABU-WAINGAPU, TELUK

GURITA-KALABAHI, WAINGAPU-AIMERE, WAINGAPU-ENDE,

WAINGAPU-KUPANG, WAINGAPU-SABU,

WAIWERANG-LARANTUKA, dan WAIWERANG-LEWOLEBA. Kapal-kapal yang beroperasi di PT. ASDP Indonesia Ferry Cabang Kupang antara lain KMP. ILE APE, KMP. BALIBO, KMP. CUCUT, KMP.ROKATENDA, KMP.UMA KALADA, KMP.ILE MANDIRI, dan KMP. NAMPARNOS. Transaksi operasional terdapat 3 jenis kategori tiket yang disediakan oleh PT. ASDP Indonesia Ferry Cabang Kupang yakni tiket Penumpang, tiket Kendaraan, dan Tiket Barang. Tiket Penumpang terdiri dari tiket eksekutif, tiket bisnis, dan tiket ekonomi. Tiket Kendaraan terdiri dari beberapa golongan kendaraan lain antara lain :

 Golongan I, merupakan golongan kendaraan sejenis Sepeda pancal.