72
BAB 4
RANCANGAN DATA WAREHOUS E YANG D IUS ULKAN
4.1 Rencana Perancangan Data Warehouse
Berdasarkan analisis yang telah dilakukan sebelumnya , diperoleh suatu patokan yang menjadi pedoman dalam merancang data warehouse yang dibu-tuhkan oleh pihak Departemen Perindustrian. Dengan mengikuti pendekatan
Business Dimensional Lifecycle untuk merancang data warehouse pada
Depar-temen Perindustrian, maka beberapa tahap yang dilakukan dalam perancangan ini yaitu:
1. M engidentifikasi kebutuhan Departemen Perindustrian akan informasi.
Setelah pada bab sebelumnya diidentifikasi masalah serta kebutuhan informasi strategis yang diharapkan melalui suatu sistem data warehouse yang diusulkan, tahapan selanjutnya adalah mengkompromikan skala prioritas pengadaan informasi yang dapat dikembangkan pada skripsi ini dengan pihak Pusat Data Informasi Departemen Perindustrian (Pusdatin) sebagai pihak yang memiliki kewenangan dalam menangani kebutuhan data dan informasi pada lembaga ini. Pada akhirnya melalui kesepakatan bersama antara pihak Pusdatin dan tim skripsi, maka ditetapkanlah informasi-informasi yang akan coba disediakan pada pengembangan data warehouse pada skripsi ini yaitu:
a. Dibutuhkan informasi mengenai ekspor produk industri nasional b. Dibutuhkan informasi mengenai impor produk industri nasional c. Dibutuhkan informasi mengenai realisasi investasi PM A
73 d. Dibutuhkan informasi mengenai realisasi investasi PM DN
e. Dibutuhkan informasi mengenai hasil produksi industri nasional
f. Dibutuhkan informasi mengenai pemakaian bahan baku industri nasional
g. Dibutuhkan informasi mengenai penyerapan tenaga kerja industri h. Dibutuhkan informasi mengenai penyebaran unit industri
2. M erancang Pemodelan Dimensional Kebutuhan Informasi dengan Skema Bintang
Setelah mengetahui data-data yang akan dimasukkan, maka dibuatlah model dimensionalnya dengan menggunakan skema bintang. Skema bintang terdiri dari beberapa tabel fakta dan tabel dimensi. Tabel fakta yang mencerminkan informasi proses bisnis Depperin direfernsikan ke beberapa tabel dimensi sebagai bahan analisis proses secara multi-dimensi.
3. M erancang database fisik data warehouse
Tahap ini merancang kebutuhan fisik database relasional data
warehouse DDS. Rancangan kebutuhan fisik database ini meliputi
penentuan tipe data dan karakteristiknya setiap kolom pada setiap tabel baik dimensi maupun fakta.
4. M enentukan toolset dan arsitektur sistem
Tahap ini menentukan software yang akan dipergunakan untuk mendukung kegiatan pengembangan data warehouse dan usulan hardware yang dibutuhkan agar data warehouse dapat berjalan.
74 5. M erancang dan mengembangkan ETL data operasional (OLTP) ke dalam
data warehouse
Dalam tahap ini, data operasional dari berbagai sumber diekstraksi, transformasikan dan dimasukkan ke dalam data warehouse. 6. M embuat prototipe aplikasi
Prototipe aplikasi ini berfungsi memberi gambaran awal kepada pihak pimpinan sebuah aplikasi analisis industri pertumbuhan industri nasional sebagai media interaksi dengan data warehouse.
4.2 Arsitektur datawarehouse
Rancangan data warehouse yang diusulkan adalah menggunakan anatomi data warehouse terpusat, pengumpulan datanya akan dilakukan pada satu tempat saja. Alasan menggunakan anatomi data warehouse terpusat karena Departemen Perindustrian mengelola semua data yang dibutuhkan oleh semua bagian fungsionalnya dilakukan di suatu tempat terpusat yang dinamakan Pusat Data dan Informasi (Pusdatin). Gambaran umum anatomi data warehouse terpusat yang diusulkan adalah seperti gambar di bawah ini.
75 Perencanaan data warehouse pada Departement Perindustrian (Depperin) dimulai dengan melakukan pengumpulan data yang berhubungan dengan informasi yang dibutuhkan oleh pihak pimpinan. Data tersebut disaring dan hasilnya ditransfrmasikan, kemudian disimpan ke dalam media penyimpanan. Proses penyaringan dan transformasi itu diistilahkan dengan ETL. ETL yang merupakan singkatan dari extraction,transformation and loading adalah rangkaian proses pengambilan data tersaring (extraction) dari sumber data untuk disimpan ke suatu data store lain (loading) melalui beberapa perubahan bentuk data (transformation) untuk menyesuaikan dengan kebutuhan data di tujuan. Arsitektur aliran data dari data warehouse yang diusulkan seperti gambar di bawah ini.
Komponen-komponen yang terdapat pada data warehouse terpusat yang diusulkan antara lain:
1. Sumber data
Sumber data untuk data warehouse ini berasal dari database ap-likasi laporan indikator pertumbuhan nasional, seperti database
76 impor, realisasi investasi industri. Kebanyakan database sumber tersebut memiliki format ekstensi .mdb (file format M S.Access) dan sisanya memiliki format teks dan spreadsheet (excel). Data tersebut merupakan hasil olahan data mentah yang didapat Depperin dari institusi lainnya seperti Badan Pusat Statistik (BPS) dan Badan Pusat Kordinasi Penana-man M odal (BKPM ).
2. Stage ETL
File data dari berbagai database sumber tersebut diekstraksi dan di-load ke dalam sebuah folder di suatu server untuk memdahkan proses pemindahan data ke operational data store (ODS).
3. Stage
Stage adalah sebuah folder yang dinamakan ‘database_industri’ yang merupakan suatu tempat penyimpan data yang diperoleh dari berbagai aplikasi sumber data Departemen Perindustrian sebelum data tersebut ditransformasikan dan disimpan ke dalam operational data store (ODS).
4. Operational Data Store (ODS ) ETL
Kumpulan data sumber yang berada di folder ‘database_industri’ selanjutnya diekstrak sesuai dengan kebutuhan data warehouse dan di-load ke dalam satu file database (ODS). Semua baris dari data sumber untuk setiap master data atau transaksi dikumpulkan di dalam satu buah tabel. Contoh semua baris untuk nama sektor industri dikumpulkan di dalam suatu tabel sektor industri dan semua baris untuk setiap nilai transaksi ekspor dikumpul di dalam sebuah tabel transaksi ekspor.
77 ODS adalah sebuah database yang dinamakan ‘StageEktrDepperin’ dan bertujuan untuk menampung data hasil ekstraksi data sumber yang berada di stage atau folder ‘database. Setiap tabel di database ini mewakili setiap master data dan transaksi versi terbaru dari system operasional sumbernya. Penyimpanan ini bertujuan untuk memudahkan proses ETL ke data warehouse.
6. Dimesional Data Store (DDS) ETL
Proses ekstraksi dan transformasi data untuk disimpan di database relasional data warehouse. Proses ETL ini intinya merubah karakteristik data dari ODS yang masih bersifat normalisasi menjadi dimensional atau denormalisasi. Sehingga memudahkan fungsi analisis pada aplikasi data warehouse yang akan dikembangkan.
7. Dimesional Data Store (DDS)
DDS adalah sebuah database relasional yang dinamakan “DepperinDWH”. Database ini memiliki format dimensional yang memiliki beberapa tabel dimensi. Database ini cenderung bersifat denormalisasi untuk memudah akses query mudah dan cepat. Database ini merupakan jantung dari data warehouse karena semua aplikasi analisis menjadi DDS ini sebagai sumber datanya.
8. M ulti-dimensional Database (M DB)
MDB adalah sebuah database dengan format multidimensional. Format multidimensional yang digunakan untuk data warehouse ini menggunakan pendekatan kubus atau yang sering dikenal dengan istilah
78
cube. Cube dibuat untuk lebih memudahkan kebutuhan analisis pada
aplikasi data warehouse. 9. Aplikasi
Aplikasi yang dikembangkan pada skripsi ini adalah aplikasi analisis multidimensional berbasis web. Aplikasi ini dikembangan bertujuan untuk membantu pimpinan Depperin menganalisis indikator pertumbuhan industri nasional.
4.3 Perancangan Pemodelan Dimensional
Berdasarkan rancangan arsitektur aliran data yang diusulkan, DDS adalah jantung dari data warehouse. DDS merupakan sebuah database relasional dengan format dimensional yang menyesuaikan kebutuhan analisis yang mana merupakan tujuan utama dibangunnya data warehouse. Jadi, pada bagian ini intinya adalah membahas mengenai perancangan database untuk DDS.
4.3.1 Metodologi
M etodologi yang digunakan dalam merancang database data warehouse Departemen Perindustrian adalah Nine-Step Methodology yang dikemukakan oleh Kimball (Connoly, 2005, p1187).
Langkah-langkah perancangan data warehouse miliputi: 1. M enentukan proses
Berdasarkan kebutuhan pengguna informasi yang telah dianalisis dan diidentifikasi, maka proses-proses dari Depperin yang dijadikan informasi pada data warehouse depperin adalah: a. Ekspor produk industri nasional,
79 b. Impor produk industri nasional,
c. Realisasi investasi PMA, d. Realisasi investasi PMDN, e. Produksi industri nasional, f. Pemakaian bahan baku industri, g. Penyerapan tenaga kerja,
h. Penyebaran unit sektor industri, dan
i. Pertumbuhan dan kontribusi sektor industri.
2. M enentukan grain (butir)
M enentukan grain maksudnya adalah menentukan butir yang menjelaskan tiap fakta. Berikut ini adalah grain dari proses yang telah ditentukan:
a. Ekspor produk industri nasional yang dapat dilihat berdasarkan waktu, kelompok industri, komoditi, pelabuhan, negara tujuan ekspor,
b. Impor produk industri nasional yang dapat dilihat berdasarkan waktu, kelompok industri, komoditi, pelabuhan dan negara asal,
c. Realisasi investasi PM A yang dapat dilihat berdasarkan waktu, kelompok industri, kota proyek dan negara investor, d. Realisasi investasi PM DN yang dapat dilihat berdasarkan
waktu, kelompok industri dan kota proyek,
e. Produksi industri nasional yang dapat dilihat berdasarkan waktu, propinsi dan kelompok industri,
80 f. Pemakaian bahan baku industri yang dapat dilihat berdasarkan
waktu, propinsi dan kelompok industri,
g. Penyerapan tenaga kerja yang dapat dilihat berdasarkan waktu, propinsi dan kelompok industri, dan
h. Penyebaran unit sektor industri yang dapat dilihat berdasarkan waktu, propinsi dan kelompok industri.
3. M engidentifikasi dan menyesuaikan dimensi
Tahap selanjutnya adalah mengidentifikasi dan menyesuaikan dimensi dengan tabel fakta. Dimensi adalah kumpulan sudut pandang tentang suatu proses bisnis yang terdapat pada tabel fakta. Berikut ini adalah dimensi-dimensi yang diperlukan:
a. Dimensi Waktu (DimWaktu),
b. Dimensi Kelompok Industri (DimSektor), c. Dimensi Komoditi (DimKomoditi), d. Dimensi Kota (DimKota),
e. Dimensi Propinsi (DimPropinsi),
f. Dimensi Pelabuhan (DimPelabuhan), dan g. Dimensi Negara (DimNegara).
4. M enentukan fakta
Grain dari tabel fakta menentukan fakta-fakta yang dapat ditampilkan. Pada tahap ini, hal yang dilakukan adalah menentukan measure (ukuran) yang dibutuhkan tabel fakta. Berikut ini adalah measure dari masing-masing tabel fakta:
81 a. Measure untuk fakta ekspor produk industri nasional adalah
berat dan nilai,
b. Measure untuk fakta import adalah Bruto dan Nilai,
c. Measure untuk fakta realisasi investasi PM A adalah jumlah proyek dan nilai investasi,
d. Measure untuk fakta realisasi investasi PMDN adalah jumlah proyek dan nilai investasi,
e. Measure untuk fakta hasil produksi industri adalah nilai input, nilai output, nilai produksi dan nilai tambah,
f. Measure untuk fakta pemakaian bahan baku industri adalah bahan baku lokal, bahan baku impor dan bahan bakar pelumas,
g. Measure untuk fakta penyerapan tenaga kerja adalah jumlah tenaga kerja, dan
h. Measure untuk penyebaran unit industri adalah jumlah perusahaan.
5. M enyimpan pra-kalkulasi pada tabel fakta
Biasanya, hasil perhitungan dari atribut di database tidak disimpan pada suatu atribut khusus pada database tersebut, namun pada tahap ini, perlu dipertimbangkan kembali penyimpanan hasil perhitungan pada suatu atribut tersendiri di database dengan alasan mengurangi resiko kesalahan pada program setiap kali melakukan perhitungan pada atribut-atribut tersebut.
82 Berdasarkan fakta yang telah ditentukan sebelumnya, pada data warehouse Depperin tidak ada hasil perhitungan yang memerlukan penyimpanan.
6. M enambahkan atribut yang dibutuhkan dalam tabel dimensi
Berikut adalah nama atribut-atribut beserta deskripsinya yang akan digunakan pada Tabel-tabel dimensi yang disesuaikan dengan kebutuhan informasi Departemen Perindustrian:
Nama Dimensi Field Deskripsi
NamaKelompok Menampilkan nama kelompok industri
SubGolongan Menampilkan nama sub golongan industri
Golongan Menampilkan nama golongan industri
Golongan inti Menampilkan nama sektor utama industri
Direktorat Menampilkan nama direktorat di Depperin
DimKelompokIndustri
Dirjen Menampilkan nama direktorat jenderal di Depperin
DimKomoditi Uraian_HS6DG Menampilkan nama komoditi berdas arkan HS 6 digit Uraian_SITC2DG Menampilkan nama komoditi
berdas arkan SITC 2 digit DimPropinsi NamaPropinsi Menampilkan nama propinsi DimKota Kota Menampilkan nama kota
Negara Menampilkan nama negara dalam bahasa Indonesi a Negara_English Menampilkan nama negara
dalam bahasa inggris DimNegara
NM_Region Menampilkan nama region atau area kumpulan negara
83
7. M enentukan umur dari basis data yang digunakan dalam data
warehouse
Pada tahap ini ditentukan durasi atau periode waktu dari data yang akan dimasukkan untuk data warehouse Depperin. Data awal yang dimasukkan untuk data warehouse Depperin adaalh data mulai dari tahun 2002. Untuk selanjutnya, durasi yang ditentukan untuk transformasi data ke data warehouse adalah setiap awal bulan.
8. M elacak dimensi yang berubah perlahan
Dimensi dapat berubah, untuk mengantisipasinya ada 3 cara untuk mengubah data di dimensi, yaitu:
a. M enulis ulang atribut yang berubah. b. M embuat record baru pada dimensi.
c. M embuat suatu atribut alternatif untuk menampung nilai yang bar, sehingga nilai lama dan nilai baru dari atribut tersebut dapat diakses secara bersamaan.
Dalam hal ini, untuk data warehouse Depperin diterapkan cara kedua, yaitu membuat record baru pada dimensi.
9. M enentukan prioritas Query dan M ode Query
Pada tahap ini menentukan prioritas dalam penentuan laporan yang ingin ditampilkan. Untuk meningkatkan efektifitas dari laporan yang dihasilkan, ada beberapa hal penting yang perlu diperhatikan di dalam perancangan laporan, yaitu:
84
Data warehouse akan menghasilkan laporan yang akan dipakai oleh para pengambil keputusan perusahaan. Agar laporan yang dihasilkan selalu up-to-date dan akurat, dilakukan proses Extraction Transformation Loading (ETL) secara berkala tergantung kebutuhan. Proses ETL dapar dilakukan secara serentak setiap satu bulan sekali atau kurang tergantung kebutuhan para pengambil keputusan.
b. Backup
Backup merupakan salah satu proses untuk
membuat duplikat data. Proses backup sangat penting untuk mencegah hilangnya data secara permanen. Jika ada kegagalan sistem. Backup sebaiknya dilakukan hanya untuk data yang mengalami perubahan. Proses backup dapat dilakukan setiap satu bulan sekali atau kurang tergantung kebutuhan.
c. Security
Keamanan digunakan untuk menjaga kerahasiaan data agar pihak yang tidak memiliki hak akses tidak dapat melakukan akses data. Pada data warehouse yang dikem-bangkan kali ini, setiap pihak pimpinan memiliki akses ke semua laporan. Hanya saja yang dibatasi pada setiap lapo-ran tersebut adalah daftar nilai dimensi kelompok industri (DimKelompokIndustri) untuk setiap kelompok pengguna
85 dibedakan. Berikut merupakan tabel hak akses pimpinan untuk setiap laporan:
Kelompok Pengguna Hak Akses
ADMIN Dapat melihat semua baris Menteri Dapat melihat semua baris
Dirjen Ilmea Dapat melihat baris per dimensi kelompok industri yang memiliki nilai untuk dirjen Industri Logam Mesin, Tekstil dan Aneka Dirjen IATT Dapat melihat baris per dimensi kelompok industri yang memiliki nilai untuk dirjen industri Alat Transportasi dan T elematika Dirjen Argo Kimia Dapat melihat baris per dimensi kelompok
industri yang memiliki nilai untuk dirjen Industri Argo dan Kimia
Tabel 4. 2 Tabel Hak Akses Pimpinan
4.3.2 Perancangan S kema Bintang
Berikut ini adalah star schema (skema bintang) dari masing-masing tabel fakta:
86 1. Skema Bintang Ekspor
Gambar 4. 3 Skema Bintang Ekspor
Skema bintang ekspor menjelaskan tentang hasil ekspor produk industri nasional ke beberapa negara. Dalam skema bintang ini dapat dilihat informasi mengenai nama negara tujuan ekspor, nama pelabuhan produk diberangkatkan, nama komoditi
87 yang diekspor, nama kelompok industri perusahaan pengekspor serta waktu bulan ekspor itu terjadi. M easure dalam tabel fakta ekspor ini menjelaskan tentang berat total semua komoditi dalam kilogram dan nilai ekspor dalam dolar US.
2. Skema Bintang Impor
Gambar 4. 4 Skema Bintang Impor
Skema bintang impor ini menjelaskan tentang hasil impor produk industri nasional ke beberapa negara. Dalam skema
bin-88 tang ini dapat dilihat informasi mengenai nama negara asal pen-gimpor, nama pelabuhan produk didatangkan, nama jenis ko-moditinya, nama kelompok industri perusahaan pengimpor serta waktu bulan impor itu terjadi. M easure dalam tabel fakta ekspor ini menjelaskan tentang berat total semua komoditi dalam kilo-gram dan nilai impor dalam dolar US.
3. Skema Bintang Investasi PMA
Gambar 4. 5 Skema Bintang Investasi PMA
Skema bintang investasi PMA ini menjelaskan tentang realisasi investasi penanaman modal asing ke sektor industri. Dalam skema bintang ini dapat dilihat informasi mengenai nama negara investor, nama kota proyek investasi direncanakan, nama
89 kelompok industri proyek investasi serta waktu bulan investasi itu terealisasi. M easure dalam tabel fakta realisasi investasi PM A ini menjelaskan tentang jumlah proyek dan nilai investasi dalam dolar US.
4. Skema Bintang Investasi PMDN
Gambar 4. 6 Skema Bintang Investasi PMDN
Skema bintang investasi PM DN ini menjelaskan tentang realisasi investasi penanaman modal dalam negeri ke sektor industri. Dalam skema bintang ini dapat dilihat informasi mengenai nama kota proyek investasi direncanakan, nama kelompok industri proyek investasi serta waktu bulan investasi itu terealisasi. M easure dalam tabel fakta realisasi investasi PM DN ini menjelaskan tentang jumlah proyek dan nilai investasi dalam rupiah.
90
5. Skema Bintang Produksi Industri
Gambar 4. 7 Skema Bintang Produksi Industri
Skema bintang produksi ini menjelaskan tentang produksi industri nasional. Dalam skema bintang ini dapat dilihat informasi mengenai nama propinsi perusahaan berada, nama kelompok industrinya serta tahun produksi. M easure dalam tabel fakta realisasi produksi ini menjelaskan nilai input, nilai output, nilai produksi dan nilai tambah. Semuanya dalam rupiah.
91 6. Skema Bintang Pemakaian Bahan Baku Industri
Gambar 4. 8 Skema Bintang Pemakaian Bahan Baku Industri
Skema bintang pemakaian bahan baku industri ini menjelaskan tentang penggunaan bahan baku oleh industri nasional. Dalam skema bintang ini dapat dilihat informasi mengenai nama propinsi perusahaan berada, nama kelompok industrinya serta tahun pemakaian bahan baku tersebut. M easure dalam tabel fakta pemakaian bahan baku ini menjelaskan nilai dalam rupiah untuk bahan baku impor, bahan baku local dan bahan bakar pelumas.
92 7. Skema Bintang Penyerapan Tenaga Kerja
Gambar 4. 9 Skema Bintang Penyerapan Tenaga Kerja
Skema bintang penyerapan tenaga kerja ini menjelaskan tentang jumlah sumber daya manusia yang diperkerjakan di sektor industri. Dalam skema bintang ini dapat dilihat informasi mengenai nama propinsi perusahaan berada, nama kelompok industrinya serta tahun kondisi penyerapan tenaga kerja di industri nasional. M easure dalam tabel fakta penyerapan tenaga kerja ini menjelaskan jumlah tenaga kerja yang dipakai.
93 8. Skema Bintang Penyebaran Unit Industri
Gambar 4. 10 Skema Bintang Penyebaran Unit Industri
Skema bintang penyebaran unit industri ini menjelaskan tentang jumlah perusahaan dalam suatu kelompok industri. Dalam skema bintang ini dapat dilihat informasi mengenai nama propinsi perusahaan berada, nama kelompok industrinya serta tahun kondisi penyebaran unit industri nasional. M easure dalam tabel fakta penyebaran unit industri ini menjelaskan jumlah perusahaan
4.4 Pemilihan Toolset
Beberapa software tool digunakan dalam pengembangan data warehouse
ini. Tool yang digunakan adalah paket software data warehouse dari SQL Server 2005. Komponen SQL Server 2005 yang kami gunakan memiliki fungsi-fungsi masing :
• SQL Server 2005 Database Engine, menampung seluruh data pada data warehouse.
94 • SQL Server 2005 Integration Services, berfungsi membantu merancang dan mengembangkan sistem ektrasi, transformasi dan loading data dari sumber ke database dimensional tujuan di data warehouse.
• SQL Server 2005 Analysis Services, berfungsi membantu merancang database multidimensional (cubes) untuk keperluan analisis informasi.
Alasan memilih paket tool SQL Server 2005 selain Departemen Perindustrian memiliki Corporate License Agreement dengan pihak M icrosoft adalah lingkungan kerja Pusat Data Informasi sebagai penyedian layanan informasi pada Departemen Perindustrian telah terbiasa dengan lingkungan produk M icrosoft. M ulai dari sistem operasinya menggunakan Windows XP hingga perangkat office biasa menggunakan Excel, Word atau pengelolaan data dengan M S.Access. Ini akan menambah rasa keyakinan jika menggunakan tool microsoft bahwa semua komponen data warehouse akan bekerja secara bersama-sama.
Selain produk tool paket M icrosoft dalam membangun data warehouse, terdapat tool tambahan untuk memvisualisasikan data pada aplikasi analisis di sisi pengguna. Tool tersebut bernama Dundas OLAP Services. Tool ini digunakan dengan mengintegrasi dengan halaman web yang akan dibangun dengan A SP .NET/C#.
95
4.5 Metadata
Informasi mengenai struktur dari data yang terdapat di dalam data
ware-house terdapat di dalam metadata, yakni informasi tentang data yang digunakan,
apakah itu baik dalam bentuk hasil transformasi data yang dilakukan atau pun data yang diciptakan di dalam keperluan membangun data warehouse. Metadata diperlukan sebagai panduan atau indeks yang menjelaskan struktur atau isi data dalam proses transformasi dari data operasional ke data warehouse.
96 Berikut ini adalan metadata dari data warehouse Departemen Perindustrian:
Metadata Tabel Dimensi 1. Tabel Dimensi Waktu
a. Nama tabel: DimWaktu
b. Keterangan: Data-data mengenai waktu
c. Primary key: TimeKey (Surrogate Key)
Sumber Field Tipe Ukuran Keterangan
Field Tipe Ukuran Tabel
Transformasi
TimeKey Integer 4 Surrogate Key - - - - Create
Tahun Integer 4 - - - - - Create
Kuartal Integer 4 - - - - - Create
Bulan Integer 4 - - - - - Create
FullDateAlternateKey Datetime 8 - - - - - Create
97 2. Tabel Dimensi Propinsi
a. Nama tabel: DimPropinsi
b. Keterangan: Data-data mengenai propinsi
c. Primary key: PropinsiKey (Surrogate Key)
Sumber Field Tipe Ukuran Keterangan
Field Tipe Ukuran Tabel
Transformasi
PropinsiKey Integer 4 Surrogate Key - - - - Create
KDPropinsi Char 2 Application Key KDPROP Integer 4 MST_PROPINSI Copy NamaPropinsi Varch ar 20 - DESKRIPSI Varch ar 20 MST_PROPINSI Copy
98 3. Tabel Dimensi Kota
a. Nama tabel: DimKota
b. Keterangan: Data-data mengenai kota atau kabupaten
c. Primary key: KotaKey (Surrogate Key)
Sumber Field Tipe Ukuran Keterangan
Field Tipe Ukuran Tabel
Transformasi
KotaKey Integer 4 Surrogate Key - - - - Create
KotaKD Char 4 Application Key KD_KOTA_KAB Char 4 MST_KOTA_KAB Copy
Kota Varch ar 50 - URAI_KAB_KOTA Varch ar 50 MST_KOTA_KAB Copy
PropinsiKey Integer 4 - PropinsiKey Integer 4 DimPropinsi Copy
99 4. Tabel Dimensi Pelabuhan
a. Nama tabel: DimPelabuhan
b. Keterangan: Data-data mengenai pelabuhan
c. Primary key: PelabuhanKey (Surrogate Key)
Sumber Field Tipe Ukuran Keterangan
Field Tipe Ukuran Tabel
Transformasi
PelabuhanKey Integer 4 Surrogate Key - - - - Create
PortKD Char 3 Application Key KD_PEL Char 3 MST_PELABUHAN Copy
Pelabuhan Varch ar 30 - PELABUHAN Varch ar 30 MST_KOTA_KAB Copy
PropinsiKey Integer 4 - PropinsiKey Integer 4 DimPropinsi Copy
100 5. Tabel Dimensi Negara
a. Nama tabel: DimNegara
b. Keterangan: Data-data mengenai negara
c. Primary key: NegaraKey (Surrogate Key)
Sumber Field Tipe Ukuran Keterangan
Field Tipe Ukuran Tabel
Transformasi
NegaraKey Integer 4 Surrogate Key - - - - Create
KD_Neg ara Char 3 Application Key KD_Neg ara Char 3 MST_NEGARA Copy
Negara Varch ar 50 - URAI_INDO Varch ar 50 MST_NEGARA Copy
Negara_English Varch ar 50 - URAI_ASING Varch ar 50 MST_NEGARA Copy
KD_Region Smallint 2 - KD_REGION Smallint 2 MST_NEGARA Copy
NM_Region Varch ar 15 - NM_REGION Varch ar 15 MST_NEGARA Copy
101 6. Tabel Dimensi Komoditi
a. Nama tabel: DimKomoditi
b. Keterangan: Data-data mengenai komoditi
c. Primary key: KomoditiKey (Surrogate Key)
Sumber Field Tipe Ukuran Keterangan
Field Tipe Ukuran Tabel
Transformasi
KomoditiKey Integer 4 Surrogate Key - - - - Create
HS6DG Char 6 Application Key HS6DG Char 6 MASTER_HS Copy
Uraian_HS6DG Varch ar 150 - URAIAN Varch ar 150 MST_HS6DG Copy
SITC2DG Char 2 - SITC2DG Char 2 MASTER_HS Copy
Uraian_SITC2DG Varch ar 100 - URAIAN Varch ar 90 MST_SITC2DG Copy
102 7. Tabel Dimensi Kelompok Industri
a. Nama tabel: DimKelompokIndustri
b. Keterangan: Data-data mengenai kelompok industri
c. Primary key: SektorKey (Surrogate Key)
Sumber Field Tipe Ukuran Keterangan
Field Tipe Ukuran Tabel
Transformasi
SektorKey Integer 4 Surrogate Key - - - - Create
KelompokKD Char 5 Application Key KD_KLUI5 DG Char 5 KLUI5DGInd Copy
NamaKelompok Varch ar 100 - URAIAN_KLUI5DG Varch ar 100 KLUI5DGInd Copy
SubGolonganKD Char 4 - KD_KLUI4 DG Char 4 KLUI5DGInd Copy
SubGolongan Varch ar 100 - URAIAN_KLUI4DG Char 100 KLUI4DGInd Copy
GolonganKD Char 3 - KD_KLUI3 DG Char 3 KLUI4DGInd Copy
Golongan Varch ar 100 - URAIAN_KLUI3DG Varch ar 100 KLUI3DGInd Copy
GolonganIntiKD Char 2 - KD_KLUI2 DG Char 2 KLUI3DGInd Copy
GolonganInti Varch ar 100 - URAIAN_KLUI2DG Varch ar 100 KLUI2DGInd Copy
DirektoratKD Char 2 - KD_DIREKTORAT Char 2 KLUI5DGInd Copy
Direktorat Varch ar 60 - Nama_Direktorat Varch ar 60 MST_DIREKTORAT Copy
DirjenKD Char 2 - KD_DIRJEN Char 2 MST_DIREKTORAT Copy
Dirjen Varch ar 50 - NAMA_DIRJEN Varch ar 50 MST_DIR_JEND Copy
103
Metadata Tabel Fakta
1. Tabel fakta ekspor produk industri nasional a. Nama tabel: FactEksporIndustri.
b. Keterangan: Data mengenai informasi ekspor industri. c. Primary key: -
Nama field Tipe data Ukuran field Keterangan Proses Tabel sumber TimeKey Integer 4 Nomor Waktu Copy DimWaktu NegaraKey Integer 4 Nomor Negara Copy DimNegara PelabuhanKey Integer 4 Nomor Pelabuhan Copy DimPelabuhan KomoditiKey Integer 4 Nomor Komoditi Copy DimKomoditi SektorKey Integer 4 Nomor Sektor Copy DimSektor
JumlahBerat Float 8 - Create Stage_Ekspor
NilaiTotal Float 8 - Create Stage_Ekspor
Tabel 4. 10 Metadata Tabel Fakta Ekspor Ptoduk Industri Nasional Hasil transformasi tabel fakta persediaan
Transformasi:
Sumber Æ DimWaktu, DimNegara, DimPelabuhan, DimKomoditi, DimSektor
Tujuan Æ FactEksporIndustri Sumber data Nama Field
Tabel Field Tipe data Ukuran Field
TimeKey DimWaktu WaktuID Integer 4
NegaraKey DimNegara NegaraKey Integer 4
PelabuhanKey DimPelabuhan PelabuhanKey Integer 4 KomoditiKey DimKomoditi KomoditiKey Integer 4
SektorKey DimSektor SektorKey Integer 4
104 2. Tabel fakta impor produk industri nasional
a. Nama tabel: FactImporIndustri.
b. Keterangan: Data mengenai informasi impor industri. c. Primary key: -
Nama field Tipe data Ukuran field Keterangan Proses Tabel sumber TimeKey Integer 4 Nomor Waktu Copy DimWaktu NegaraKey Integer 4 Nomor Negara Copy DimNegara PelabuhanKey Integer 4 Nomor Pelabuhan Copy DimPelabuhan KomoditiKey Integer 4 Nomor Komoditi Copy DimKomoditi SektorKey Integer 4 Nomor Sektor Copy DimSektor
JumlahBerat Float 8 - Create Stage_Impor
NilaiTotal Float 8 - Create Stage_Impor
Tabel 4. 12 Metadata Tabel Fakta Impor Produk Incdustri Nasional Hasil transformasi tabel fakta persediaan
Transformasi:
Sumber Æ DimWaktu, DimNegara, DimPelabuhan, DimKomoditi, DimSektor
Tujuan Æ FactImporIndustri
Sumber data Nama Field
Tabel Field Tipe data Ukuran Field
TimeKey DimWaktu TimeKey Integer 4
NegaraKey DimNegara NegaraKey Integer 4
PelabuhanKey DimPelabuhan PelabuhanKey Integer 4 KomoditiKey DimKomoditi KomoditiKey Integer 4
SektorKey DimSektor SektorKey Integer 4
105 3. Tabel fakta investasi Penanaman M odal Dalam Negeri (PM DN)
a. Nama tabel: FactInvestasiPM DN.
b. Keterangan: Data mengenai informasi investasi PM DN. c. Primary key: -
Nama field Tipe data Ukuran field
keterangan Proses Tabel sumber
TimeKey Integer 4 Nomor Waktu Copy DimWaktu
KotaKey Integer 4 Nomor Kota Copy DimKota
SektorKey Integer 4 Nomor Sektor Copy DimSektor Jumlah Proyek Integer 4 - Create Stage_InvestasiPMDN Total Investasi Float 8 - Create Stage_InvestasiPMDN
Tabel 4. 14 Metadata Tabel Fakta Investasi PMDN Hasil transformasi tabel fakta persediaan
Transformasi:
Sumber Æ DimWaktu, DimKota, DimSektor Tujuan Æ FactInvestasiPMDN
Sumber data Nama Field
Tabel Field Tipe data Ukuran Field
TimeKey DimWaktu TimeKey Integer 4
KotaKey DimKota KotaKey Integer 4
SektorKey DimSektor SektorKey Integer 4
106 4. Tabel fakta investasi Penanaman M odal Asing (PM A)
a. Nama tabel: FactInvestasiPM A.
b. Keterangan: Data mengenai informasi investasi PM A. c. Primary key: -
Nama field Tipe data
Ukuran field
keterangan Proses Tabel sumber
TimeKey Integer 4 Nomor Waktu Copy DimWaktu
KotaKey Integer 4 Nomor Kota Copy DimKota
SektorKey Integer 4 Nomor Sektor Copy DimSektor NegaraKey Integer 4 Nomor Negara Copy DimNegara Jumlah Proyek Integer 8 - Create Stage_InvestasiPMDN Total Investasi Float 8 - Create Stage_InvestasiPMDN
Tabel 4. 16 Metadata Tabel Fakta Investasi PMA Hasil transformasi tabel fakta persediaan
Transformasi:
Sumber Æ DimWaktu, DimKota, DimSektor,DimNegara Tujuan Æ FactInvestasiPMA
Sumber data Nama Field
Tabel Field Tipe data Ukuran Field
TimeKey DimWaktu TimeKey Integer 4
NegaraKey DimNegara NegaraKey Integer 4
KotaKey DimKota KotaKey Integer 4
SektorKey DimSektor SektorKey Integer 4
107 5. Tabel fakta investasi pemakaian bahan baku
a. Nama tabel: FactPemakaianBahanBaku.
b. Keterangan: Data mengenai pemakaian bahan baku. c. Primary key: -
Nama field Tipe data Ukuran field
Keterangan Proses Tabel sumber
TimeKey Integer 4 Nomor Waktu Copy DimWaktu
PropinsiKey Integer 4 Nomor Propinsi Copy DimPropinsi SektorKey Integer 4 Nomor Sektor Copy DimSektor Bahan Baku Impor Float 8 - Create STAGE_BBKR Bahan Baku Lokal Float 8 - Create STAGE_BBKR Bahan Bakar Pelumas Float 8 - Create STAGE_BBKR
Tabel 4. 18 Metadata Tabel Fakta Pemakaian Bahan Baku Hasil transformasi tabel fakta persediaan
Transformasi:
Sumber Æ DimWaktu, DimPropinsi,DimSektor Tujuan Æ FactPemakaianBahanBaku
Sumber data Nama Field
Tabel Field Tipe data Ukuran Field
TimeKey DimWaktu TimeKey Integer 4
PropinsiKey DimPropinsi PropinsiKey Integer 4
SektorKey DimSektor SektorKey Integer 4
108 6. Tabel fakta penyerapan tenaga kerja
a. Nama tabel: FactPenyerapanTK.
b. Keterangan: Data mengenai penyerapan tenaga kerja. c. Primary key: -
Nama field Tipe data Ukuran field
Keterangan Proses Tabel sumber
TimeKey Integer 4 Nomor Waktu Copy DimWaktu
PropinsiKey Integer 4 Nomor Propinsi Copy DimPropinsi SektorKey Integer 4 Nomor Sektor Copy DimSektor
JumlahTenagaKerj a Integer 4 - Create STAGE_TK
Tabel 4. 20 Metadata Tabel Fakata Penyerapan Tenaga Kerja Hasil transformasi tabel fakta persediaan
Transformasi:
Sumber Æ DimWaktu, DimPropinsi,DimSektor Tujuan Æ FactPenyerapanTK
Sumber data Nama Field
Tabel Field Tipe data Ukuran Field
TimeKey DimWaktu TimeKey Integer 4
PropinsiKey DimPropinsi PropinsiKey Integer 4
SektorKey DimSektor SektorKey Integer 4
109 7. Tabel fakta penyebaran unit industri
a. Nama tabel: FactPenyUnitInd.
b. Keterangan: Data mengenai penyebaran unit industri. c. Primary key: -
Nama field Tipe data Ukuran field
Keterangan Proses Tabel sumber
TimeKey Integer 4 Nomor Waktu Copy DimWaktu
PropinsiKey Integer 4 Nomor Propinsi Copy DimPropinsi
SektorKey Integer 4 Nomor Sektor Copy DimSektor
JumlahPerusahaan Integer 4 - Create STAGE_UnitInd
Tabel 4. 22 Metadata Tabel Fakta Penyebaran Unit Industri Hasil transformasi tabel fakta persediaan
Transformasi:
Sumber Æ DimWaktu, DimKota, DimSektor,DimNegara Tujuan Æ FactPenyUnitInd
Sumber data Nama Field
Tabel Field Tipe data Ukuran Field
TimeKey DimWaktu TimeKey Integer 4
PropinsiKey DimPropinsi PropinsiKey Integer 4
SektorKey DimSektor SektorKey Integer 4
110 8. Tabel fakta utilisasi produksi
a. Nama tabel: FactUtilisasiProduksi.
b. Keterangan: Data mengenai penyebaran unit industri. c. Primary key: -
Nama field Tipe data Ukuran field
Keterangan Proses Tabel sumber
TimeKey Integer 4 Nomor Waktu Copy DimWaktu
PropinsiKey Integer 4 Nomor Propinsi Copy DimPropinsi
SektorKey Integer 4 Nomor Sektor Copy DimSektor
Nilai Tambah Float 8 - Create UtilProduksi Nilai Produksi Float 8 - Create UtilProduksi
Input Float 8 - Create UtilProduksi
Output Float 8 - Create UtilProduksi
Tabel 4. 24 Metadata Tabel Fakta Utilisasi Produksi Hasil transformasi tabel fakta persediaan
Transformasi:
Sumber Æ DimWaktu, DimKota, DimSektor,DimNegara Tujuan Æ FactPenyUnitInd
Sumber data Nama Field
Tabel Field Tipe data Ukuran Field
TimeKey DimWaktu TimeKey Integer 4
PropinsiKey DimPropinsi PropinsiKey Integer 4
SektorKey DimSektor SektorKey Integer 4
Tabel 4. 25 Sumber Data Tabel Fakta Utilisasi Produksi
4.6 Analisis Kapasitas Media Penyimpanan
Rumus yang digunakan untuk penghitungan jumlah space yang dibu-tuhkan untuk menyimpan data dalam sebuah tabel di SQL Server 2005 yang da-pat dilihat pada SQL Server Books Online adalah sebagai berikut:
111 1. M enghitung jumlah baris yang ada di tabel:
Num_Rows = jumlah baris dalam suatu tabel
2. M enghitung jumlah kolom yang memiliki panjang tetap (fixed-length) dan kolom yang memiliki panjang yang bervariasi (variable-length) dan hitung jumlah space yang dibutuhkan untuk penyimpanan kolom tersebut:
Num_Cols = total jumlah kolom dalam sebuah tabel.
Fixed_Data_Size = total byte untuk semua kolom fixed-length. Num_Variable_Cols = jumlah kolom variable-length.
Max_Var_Size = nilai byte maksimum untuk semua kolom variable-length.
3. Bagian dari baris, yang dikenal dengan bitmap null, dipesan untuk mengelola nullability kolom. Hitung ukurannya:
Null_Bitmap = 2 + ((Num_Cols + 7)/8)
4. Hitung variable-length data size:
Variable_Data_Size = 2 + (Num_Variable_cols x 2) + M ax_Var_Size
5. Hitung besarnya total baris (total row size):
Row_Size = Fixed_Data_Size + Variable_Data_Size + Null_Bitmap + 4
Nilai 4 dalam formula adalah ukuran tambahan header baris dari baris data.
6. Hitung jumlah baris per page (8096 free bytes per page):
Rows_Per_Page = 8096 / (Row_Size + 2)
7. Hitung jumlah page yang dibutuhkan untuk menyimpan semua baris:
112 8. Hitung Jumlah space yang dibutuhkan untuk menyimpan data di tabel (8192
total bytes per page):
Heap size (bytes) = 8192 x Num_Pages
Analasis perkiraan kapasitas media penyimpanan data untuk tabel fakta pada data warehouse yang dirancang adalah seperti berikut ini:
Rn =R*(n+1+i) n
), dengan R adalah jumlah record saat ini
I adalah persentase pertumbuhan record per tahun n adalah jangka waktu tahun
Berikut ini adalah perhitungan kapasitas media penyimpanan untuk fakta ekspor, fakta impor, fakta investasi PM A, fakta investasi PM DN, fakta hasil produksi industri dan fakta pemakaian bahan baku dengan tingkat pertumbuhan masing-masing adalh 10% dan dibatasi hanya untuk lima tahun mendatang. 1. Record Fakta Ekspor
Asumsi bahwa jumlah record data fakta ekspor bertambah sebanyak 35.000 record per bulan. Jumlah record yang telah berjalan saat ini di
data warehouse sebanyak 2.536.709 record. M aka jumlah record yang
diprediksi dalam 5 tahun ke depan: = 2.536.709 + (35.000 x 12 x 5 ) = 4.636.709 record
Selanjutnya, ukuran media penyimpanan yang dibutuhkan dalam jangka waktu lima tahun ke depan adalah :
Num_Rows = 4.636.709 baris Num_Cols = 7 kolom
113 Fixed_Data_Size = 4 + 4+4+4+4+8+8 = 36 bytes Null_Bitmap = 2 + ((7+7)/8) = 3 Row_Size = 36 + 3 + 4 = 43 bytes Rows_Per_Page = 8096/(43+2) = 179 baris Num_Pages = 4.636.709 /179 = 25.903 Pages
Ukuran Tabel = 8192 * 25.903 = 212.197.376 bytes = 207.224 Kbytes 2. Record Fakta Impor
Asumsi bahwa jumlah record data fakta impor bertambah sebanyak 44.000 record per bulan. Jumlah baris yang telah ada saat ini sebanyak 3.225.993 baris. M aka jumlah record yang diprediksi dalam 5 tahun ke depan:
= 3.225.993 + (44.000 x 12 x 5 ) = 5.865.923 record
Selanjutnya, ukuran media penyimpanan yang dibutuhkan dalam jangka waktu lima tahun ke depan adalah :
Num_Rows = 5.865.923 baris Num_Cols = 7 kolom Fixed_Data_Size = 4 + 4+4+4+4+8+8 = 36 bytes Null_Bitmap = 2 + ((7+7)/8) = 3 Row_Size = 36 + 3 + 4 = 43 bytes Rows_Per_Page = 8096/(43+2) = 179 baris Num_Pages = 5.865.923 /179 = 32.771 Pages
114 3. Record Fakta Investasi PM A
Asumsi bahwa jumlah record data fakta ekspor bertambah sebanyak 30 record per bulan. Jumlah record yang telah berjalan saat ini di data
warehouse sebanyak 1.594 record. M aka jumlah record yang diprediksi
dalam 5 tahun ke depan: = 1594 + (30 x 12 x 5 ) = 3.394 record
Selanjutnya, ukuran media penyimpanan yang dibutuhkan dalam jangka waktu lima tahun ke depan adalah :
Num_Rows = 3394 baris Num_Cols = 6 kolom Fixed_Data_Size = 4+4+4+4+4+8 = 28 bytes Null_Bitmap = 2 + ((6+7)/8) = 3 Row_Size = 28 + 3 + 4 = 35 bytes Rows_Per_Page = 8096/(35+2) = 219 baris Num_Pages = 3394 /219 = 15 Pages
Ukuran Tabel = 8192 * 15 = 122.880 bytes = 120 Kbytes 4. Record Fakta Investasi PM DN
Asumsi bahwa jumlah record data fakta ekspor bertambah sebanyak 10 record per bulan. Jumlah record yang telah berjalan saat ini di data
warehouse sebanyak 533 record. M aka jumlah record yang diprediksi
dalam 5 tahun ke depan: = 533 + (10 x 12 x 5 ) = 1.133 record
115 Selanjutnya, ukuran media penyimpanan yang dibutuhkan dalam jangka waktu lima tahun ke depan adalah :
Num_Rows = 1133 baris Num_Cols = 5 kolom Fixed_Data_Size = 4+4+4+4+8 = 24 bytes Null_Bitmap = 2 + ((5+7)/8) = 3 Row_Size = 24+ 3 + 4 = 31 bytes Rows_Per_Page = 8096/(31+2) = 245 baris Num_Pages = 1133 /245 = 5 Pages
Ukuran Tabel = 8192 * 5 = 40.960 bytes = 40 Kbytes 5. Record Fakta Hasil Produksi Industri
Asumsi bahwa jumlah record data fakta ekspor bertambah sebanyak 2700 record per tahun. Jumlah record yang telah berjalan saat ini di
data warehouse sebanyak 10.490 record. M aka jumlah record yang
di-prediksi dalam 5 tahun ke depan: = 10.490 + (2700 x 5 )
= 23.990 record
Selanjutnya, ukuran media penyimpanan yang dibutuhkan dalam jangka waktu lima tahun ke depan adalah :
Num_Rows = 23.990 baris Num_Cols = 7 kolom
Fixed_Data_Size = 4+4+4+8+8+8+8= 44 bytes Null_Bitmap = 2 + ((7+7)/8) = 3
116 Rows_Per_Page = 8096/(51+2) = 153 baris
Num_Pages = 23990 /153 = 157 Pages
Ukuran Tabel = 8192 * 157 = 1.286.144 bytes = 1024 Kbytes 6. Record Fakta Pemakaian Bahan Baku
Asumsi bahwa jumlah record data fakta ekspor bertambah sebanyak 2450 record per bulan. Jumlah record yang telah berjalan saat ini di
da-ta warehouse sebanyak 9.739 record. M aka jumlah record yang
dipre-diksi dalam 5 tahun ke depan: = 9739 + (2450 x 5 )
= 21.989 record
Selanjutnya, ukuran media penyimpanan yang dibutuhkan dalam jangka waktu lima tahun ke depan adalah :
Num_Rows = 21.989 baris Num_Cols = 6 kolom Fixed_Data_Size = 4+4+4+8+8+8 = 36 bytes Null_Bitmap = 2 + ((6+7)/8) = 3 Row_Size = 36+ 3 + 4 = 43 bytes Rows_Per_Page = 8096/(43+2) = 180 baris Num_Pages = 21.989 /180 = 122 Pages
117
4.7 Proses Extraction, Transformation and Loading (ETL)
Proses ETL pada departemen perindustrian menggunakan layanan pada M icrosoft SQL server 2005, yakni SQL Server Integration Services (SSIS). Dengan layanan ini, data operasional dapat diload ke dalam data warehouse se-suai dengan filter yang telah ditentukan.
Proses ETL melalui fasilitas SSIS ini juga bisa dijadwalkan sesuai den-gan keperluan dari pihak pimpinan. Dalam hal ini, kami menyarankan agar transformasi tabel dimensi dan fakta dilakukan secara per bulan. Hal ini dikarenakan kebutuhan waktu terkecil dari informasi yang diminta adalah bulan.
Pada rancangan arsitektur aliran data, proses pemindahan data dari sumber data ke database dimensional data warehouse DDS terdiri dari tiga proses ETL, yaitu:
1. Stage ETL
Data yang terkait dengan pertumbuhan sektor industri tersebar di beberapa tempat penyimpanan data. Data sumber yang berada di Departemen Peridustrian kebanyakan masih berada dalam format M icrosoft Acecess (ekstension mdb). Oleh karenanya, semua data operasional yang dibutuhkan dipindahkan dan dikumpulkan dalam sebuah folder untuk memudah transormasi data selanjutnya.
Nama-nama file-file data yang di-load ke stage folder “data-base_industri”:
a. ehsbkc: database mengenai ekspor. b. ihsbkc: database mengenai impor.
118 d. Perindustrian: database mengenai statis perindustrian nasional.
2. ODS ETL
Setiap data sumber yang berada di folder ‘database_industri’ se-lanjutnya diekstrak sesuai dengan kebutuhan data warehouse dan di-load ke dalam satu file database (ODS). Semua baris dari data sumber untuk setiap master data atau transaksi dimasukkan ke dalam satu buah tabel.
M engingat fokus yang terpenting dalam skripsi ini adalah trans-formasi data dari format transaksional di ODS ke format dimensional di data warehouse, kedua ETL diatas tidak dibahas terlalu mendalam untuk proses aliran data transformasinya. Bahasan ETL yang akan lebih dirinci adalah proses ETL ketiga yaitu DDS ETL
3. DDS ETL
Proses ETL ini intinya merubah karakteristik data dari ODS yang masih bersifat normalisasi menjadi dimensional atau denormalisasi. Se-hingga memudahkan fungsi analisis pada aplikasi data warehouse yang akan dikembangkan. Rancangan ETL ini menggunakan layanan pada M icrosoft SQL server 2005, yakni SQL Server Integration Services (SSIS).
119
Rancangan ETL Dimensi
1. Dimensi Propinsi
120 2. Dimensi Kota
121 3. Dimensi Pelabuhan
122 4. Dimensi Negara
123 5. Dimensi Komoditi
124 6. Dimensi Kelompok Industri
125
Rancangan ETL Fakta
1. Fakta Ekspor
126 2. Fakta Impor
127 3. Fakta Investasi PMA
128 4. Fakta Investasi PMDN
129 5. Fakta Hasil Produksi Industri
130 6. Fakta Pemakaian Bahan Baku
Gambar 4. 22 ETL Fakta Pemakaian Bahan baku
4.8 Perancangan Database Multidimensional
4.8.1 Peninjauan Kembali Struktur Data Warehouse
Database multidimensional ini dikembangkan untuk kebutuhan analisis data dan dibangun di SQL Server Analyze Service dimana databasenya terdiri da-ri beberapa cube. Sumber data untuk database multidimensional ini berasal dari database relational data warehouse. Oleh karena itu, sebelum merancang
cube yang dibutuhkan, perlu untuk meninjau kembali struktur database data
131 Nama tabel Keterangan Atribut
DimKelompokIndustri In formasi kelompok industri
SektorKey, KelompokID, Na-maKelompok, SubGolonganID, Sub-Golongan, GolonganID, Sub-Golongan, GolonganIntiID, GolonganInti, Direk-toratID, Direktorat, DirjenID, Dirjen DimKomoditi In formasi komoditi KomoditiKey, HS6DG,
URAIAN_HS6DG, SITC2DG, URAIAN_SITC2DG
DimKota In formasi kota KotaKabKey, KotaKD, Kota, Provin-siKey
DimNegara In formasi negara NegaraKey, KD_Negara, Negara, Ne-gara_English, KD_Region,
NM_Region
DimPelabuhan In formasi pelabuhan PelabuhanKey, PortID, Pelabuhan, PropinsiKey
DimPropinsi In formasi propinsi PropinsiKey, NamaPropinsi, KDPro-pinsi
DimWaktu In formasi mengenai
waktu terjadi transaksi
TimeKey, Tahun, Kuartal, Bulan, FullDateAlternateKey
FactEksporIndustri In formasi mengenai ekspor industri
TimeKey, NegaraKey, PelabuhanKey ,KomoditiKey, SektorKey, JUMLAH BERAT, NILAI TOTAL
FactImporIndustri In formasi mengenai impor industri
TimeKey, NegaraKey, PelabuhanKey, KomoditiKey, SektorKey, JUMLAH BERAT IMPOR, TOTAL NILAI IMPOR
FactInvestasiPMDN In formasi mengenai investasi penanaman
modal dalam negeri
JUMLAH PROYEK, TOTAL, INVESTASI (Rp), TimeKey, KotaKabKey, SektorKey FactPemakaianBah anBaku In formasi mengenai
pemakaian bah an baku
TimeKey, PropinsiKey, SektorKey, Bahan Baku Impor, Bahan Baku Lokal, Bahan Bakar Pelumas FactPenyerap anTK In formasi mengenai
penyerapan tenag a kerja
SektorKey, PropinsiKey, TimeKey, JumlahTenagaKerj a
FactPenyUnitInd In formasi mengenai penyebaran unit industri
TimeKey, SektorKey, PropinsiKey, JumlahPerusahaan
132 Nama tabel Keterangan Atribut
FactPertKontriIndustri In formasi mengenai pertumbuhan kontribusi industri
WaktuKey, SektorKey, GDP
FactRealisasiInvestasiPMA In formasi mengenai realisasi investasi pena-naman modal asing
TimeKey, NegaraKey, KotaKab Key, SektorKey, JUMLAH PROYEK, TOTAL INVESTASI
FactUtilisasiProduksi In formasi mengenai realisasi utilisasi pro-duksi
TimeKey, PropinsiKey, SektorKey, NILAI TAMBAH, NILAI
PRODUKSI, INPUT, OUTPUT Tabel 4. 26 Tabel-Tabel Data Warehouse
4.8.2 Perancangan Cube
Untuk memenuhi kebutuhan analisis pertumbuhan industri nasional, maka ditentukanlah beberapa cube yaitu :
1. Cube Ekspor, berisi informasi multidimensional mengenaik ekspor industri.
2. Cube Impor, berisi informasi multidimensional mengenai impor industri.
3. Cube Realisasi Investasi PM A, berisi informasi multidimensional mengenai realisasi investasi penanaman modal asing (PM A).
4. Cube Realisasi Investasi PM DN, berisi informasi multidimensional mengenai realisasi investasi penanaman modal dalam negeri (PM DN).
5. Cube Hasil Produksi Industri, berisi informasi multidimensional mengenai produksi industri nasional.
6. Cube Pemakaian Bahan Baku, berisi informasi multidimensional mengenai pemakaian bahan baku perindustrian nasional.
133 7. Cube Penyerapan Tenaga Kerja, berisi informasi multidimensional
mengenai penyerapan tenaga kerja pada sektor perindustrian.
8. Cube Penyebaran Unit Industri, berisi informasi multidimensional mengenai unit kelompok industri.
Selanjut akan dijabarkan secara mendalam rancangan setiap cube untuk ke-butuhan dimensi dan measure-nya.
4.8.2.1 Cube Ekspor
Dimensi beserta atribut dimensi yang digunakan : 1. DimNegara : Negara,Negara_English,Region 2. DimKomoditi : HS6DG,SITC2DG
3. DimPelabuhan : Pelabuhan, NamaPropinsi
4. DimKelompokIndustri : NamaKelompok, SubGolongan, Go-longan, GolonganInti, Direktorat, Dirjen
5. DimWaktu : Tahun, Kuartal, Bulan M easure yang ada :
1. [Jumlah Berat dalam K g] diambil dari FactEkporIndustri 2. [Nilai Total dalam USD] diambil dari FactEksporIndustri
4.8.2.2 Cube Impor
Dimensi beserta atribut dimensi yang digunakan : 1. DimNegara : Negara,Negara_English,Region 2. DimKomoditi : HS6DG,SITC2DG
3. DimPelabuhan : Pelabuhan, NamaPropinsi
4. DimKelompokIndustri : NamaKelompok, SubGolongan, Go-longan, GolonganInti, Direktorat, Dirjen
134 5. DimWaktu : Tahun, Kuartal, Bulan
M easure yang ada :
1. [Jumlah Berat Impor] diambil dari FactImporIndustri 2. [Nilai Total Impor] diambil dari FactImporIndustri
4.8.2.3 Cube Realisasi Investasi PMA
Dimensi beserta atribut dimensi yang digunakan : 1. DimNegara : Negara,Negara_English,Region
2. DimKelompokIndustri : NamaKelompok, SubGolongan, Go-longan, GolonganInti, Direktorat, Dirjen
3. DimWaktu : Tahun, Kuartal, Bulan 4. DimKota : Kota, NamaPropinsi M easure yang ada :
1. [Jumlah Proyek] diambil dari FactRealisasiInvestasiPM A
2. [Total Investasi USD] diambil dari FactRealisasiInvestasiPM A
4.8.2.4 Cube Realisasi Investasi PMDN
Dimensi beserta atribut dimensi yang digunakan :
1. DimKelompokIndustri : NamaKelompok, SubGolongan, Go-longan, GolonganInti, Direktorat, Dirjen
2. DimWaktu : Tahun, Kuartal, Bulan 3. DimKota : Kota, NamaPropinsi M easure yang ada :
135
2. [Total Investasi Rp] diambil dari FactRealisasiInvestasiPM DN
4.8.2.5 Cube Hasil Produksi Industri
Dimensi beserta atribut dimensi yang digunakan :
1. DimKelompokIndustri : NamaKelompok, SubGolongan, Go-longan, GolonganInti, Direktorat, Dirjen
2. DimWaktu : Tahun
3. DimPropinsi : NamaPropinsi M easure yang ada :
1. [Input] diambil dari FactUtilisasiProduksi
2. [Nilai Produksi] diambil dari FactUtilisasiProduksi 3. [Output] diambil dari FactUtilisasiProduksi
4. [Nilai Tambah] diambil dari FactUtilisasiProduksi
4.8.2.6 Cube Pemakaian Bahan Baku
Dimensi beserta atribut dimensi yang digunakan :
1. DimKelompokIndustri : NamaKelompok, SubGolongan, Go-longan, GolonganInti, Direktorat, Dirjen
2. DimWaktu : Tahun
3. DimPropinsi : NamaPropinsi M easure yang ada :
1. [Bahan Baku Lokal] diambil dari FactBBKR 2. [Bahan Baku Impor] diambil dari FactBBKR 3. [Bahan Bakar Pelumas] diambil dari FactBBKR
136
4.8.2.7 Cube Penyerapan Tenaga Kerja
Dimensi beserta atribut dimensi yang digunakan :
1. DimKelompokIndustri : NamaKelompok, SubGolongan, Go-longan, GolonganInti, Direktorat, Dirjen
2. DimWaktu : Tahun
3. DimPropinsi : NamaPropinsi M easure yang ada :
- [Jumlah Tenaga Kerja] diambil dari FactPenyerapan Tenaga Kerja
4.8.2.8 Cube Penyebaran Unit Industri
Dimensi beserta atribut dimensi yang digunakan :
1. DimKelompokIndustri : NamaKelompok, SubGolongan, Go-longan, GolonganInti, Direktorat, Dirjen
2. DimWaktu : Tahun
3. DimPropinsi : NamaPropinsi M easure yang ada :
- [Jumlah Perusahaan] diambil dari FactPenyUnitInd
4.8.3 Perancangan Dimensi dan Hierarki Atribut
Setelah mendefinisikan kebutuhan setiap cube terhadap dimensi dan atribut dimensi yang diperlukan, maka di dalam database multidi-mensional yang akan dibangun ini dapat didefinisikan dimensi beserta hierarki atribut yang digunakan dalam dimensi tersebut. Daftar dimensi yang ada dalam database multidimensional ini adalah :
137 Atribut : Negara, Negara_English, Nama Region
2. Dimensi Propinsi Atribut : Nama Propinsi 3. Dimensi Kota
Atribut : Kota, Nama Propinsi
Hierarki Atribut : Nama Propinsi -> Kota 4. Dimensi Pelabuhan
Atribut : Pelabuhan, Nama Propinsi
Hierarki Atribut : Nama Propinsi -> Pelabuhan 5. Dimensi Komoditi
Atribut : HS6DG, SITC2DG
Hierarki Atribut : SITC2DG -> HS6DG 6. Dimensi Kelompok Industri
Atribut : Kelompok Industri, Golongan, Sub Golongan, Golongan In-ti, Direktorat, Dirjen.
Hierarki Atribut : Dirjen -> Direktorat -> Golongan Inti ->Golongan ->Sub Golongan -> Kelompok Industri
7. Dimensi Waktu
Atribut : Tahun, Kuartal, Bulan
Hierarki Atribut : Tahun -> Kuartal -> Bulan 8. Dimensi Tahun
138
4.9 Perancangan Aplikasi
4.9.1 Rancangan Layar
4.9.1.1 Halaman Login
Rancangan layar login ini memeiliki dua buah textbox yang menyimpan input berupa username dan password dan tom-bol login untuk memeriksa hasil input tadi.
Gambar 4. 23 Rancangan layar halaman login
Logo Perusahaan
APLIKASI ANALISI PERTUMBUHAN INDUSTRI NASIONAL DEPARTEMEN PERINDUSTRIAN
USERNAME
PASSWORD
139
4.9.1.2 Halaman Analisis
Rancangan layar analisis memiliki beberapa control yang diperoleh dengan melakukan instalasi komponen Dundas Chart OLAP Services yaitu toolbar berupa OLAP toolbar, daftar filter berupa slicer axis, daftar kategori (sumbu vertikal) berupa series axis, daftar kategori (sumbu horizontal) berupa categorical axis, list cube berupa cube selector, list measure dan dimensi berupa cube dimension browser, chart atau grid berupa OLAP chart dan OLAP grid yang diletakkan dalam tab panel. Selain control dari komponen Dundas Chart OLAP Services, ada beberapa control
Gambar 4. 24 Rancangan layar halaman analisis
Logo Perusahaan
Analisis Ubah Password Daftar Baru
Welcome, User Logout
Toolbar
List Cube Daftar filter
List Measure dan Di-mensi
Chart atau Grid Analisis Daftar kategori (sumbu vertikal)
140 standar dan control navigasi antara lain log out dan daftar baru berupa link button. Analisis dan ubah password adalah sebuah menu.
4.9.1.3 Halaman Ubah Password
Rancangan layar ubah password memliliki tiga buah text-box yang menyimpan input berupa password lama, password baru dan validasi password baru, tombol cancel untuk kembali ke ha-laman analisis dan tombol save untuk memeriksa hasil input tadi.
Gambar 4. 25 Rancangan layar halaman ubah password
Logo perusahaan
Ubah Password
Password lama Password baru Re-enter password baru
141
4.9.1.4 Halaman Daftar Baru
Rancangan layar daftar baru memliliki tiga buah textbox yang menyimpan input berupa username, password dan validasi password, combo box yang berisi daftar grup, tombol cancel un-tuk kembali ke halaman analisis dan tombol save unun-tuk me-meriksa hasil input tadi.
4.9.2 Prototyping Aplikasi Data warehouse
4.9.2.1 Halaman Login
Berikut ini adalah tampilan yang keluar ketika pertama kali memasuki aplikasi:
Gambar 4. 26 Rancangan layar halaman daftar baru
Logo Perusahaan
Daftar Baru Username Password Re-enter password Grup V Cancel Save142
Gambar 4. 27 Tampilan halaman Login
Dalam halaman ini user harus login untuk dapat meng-gunakan aplikasi Analisis Pertumbuhan Industri Nasional dengan memasukkan username dan password yang telah diberikan oleh admin, apabila username dan password yang dimasukkan salah maka akan muncul peringatan seperti gambar di bawah ini:
Gambar 4. 28 Tampilan memasukkan username dan password yang salah
4.9.2.2 Halaman Analisis
Halaman analisis merupakan halaman pertama setelah me-lakukan login, halaman ini menampilkan aplikasi untuk mem-bantu melakukan analisis pertumbuhan industri nasional yang di-tampilkan dalam bentuk chart atau grid. Halaman ini menampil-kan data yang telah di bentuk oleh admin sesuai dengan group, cube dan dimensi yang telah dibatasi oleh admin dengan interval
143 waktu tiga tahun terakhir dari data yang ada di tiap-tiap fakta. Berikut ini adalah tampilan dari Halaman Analisis:
Pada halaman ini terdapat tiga menu yaitu menu analisis, ubah password dan daftar baru. M enu analisis adalah menu untuk menuju halaman analisis, menu ubah password untuk menuju ha-laman ubah password dan menu daftar baru untuk membuat user
144 baru namun menu ini akan muncul apabila yang memasuki ap-likasi ini adalah seorang administrator.
Halaman ini dikhususkan untuk membantu melakukan analisis pertumbuhan industri nasional dengan memberikan kebe-basan kepada user untuk mengolah data yang ada di data
ware-house dengan cara melakukan drag and drop dari measure dan
dimensi yang berada di dimension browser yang menampilkan daftar sesuai dengan cube yang dipilih pada cube selector ke-dalam chart atau grid, bila salah satu field dari dimensi yang di-tarik dari list maka secara otomatis akan ditempatkan di
catego-ries sedangkan bila measure yang ditarik dari list maka secara
otomatis ditempatkan di series. Drag and drop juga bisa dilakukan langsung ke daftar categories maupun series.
Categories berfungsi untuk membagi data secara parallel
berdasarkan dimensi yang dipilih oleh user sedangkan Series berfungsi membagi data secara serial berdasarkan dimensi atau measure yang dipilih oleh user dan filter/slicer berfungsi membatasi data yang ingin ditampilkan oleh user.
145
Berikut ini adalah contoh analisis untuk melihat pertumbuhan ni-lai ekspor dibawah naungan Direktorat Jendral Industri Logam, M esin, Tekstil dan Aneka dilihat berdasarkan region tujuannya yaitu Asia Ten-gah, propinsi asal pelabuhan yaitu propinsi DKI Jakrta dan Riau dan dili-hat berdasarkan beberapa komoditinya per tiga tahun terakhir.
146 Setelah melakukan login pengguna langsung masuk kehalaman analisis, sebagai contoh bila grup dari Dirjen Industri Logam, M esin, Tekstil dan Aneka maka tampilan awalnya seperti gambar di bawah ini.
Gambar 4. 31 Analisis nilai ekspor berdasarkan dimensi kelompok industri dan waktu tiga tahun tera khir dari data terakhir (tampilan awal untuk Dirjen industri logam, mesin, tekstil dan aneka)
147 Kemudian kita menarik dimensi waktu ke kolom series agar naik turunnya nilai ekspor per tahunnya lebih mudah dibedakan.
Selanjutnya kita melakukan analisis lebih dalam dengan menam-bahkan dimensi negara dalam hal ini pengguna melihat nilai ekspor ber-dasarkan region dimana barang itu diekspor. Pengguna pun dapat melihat lebih spesifik lagi yaitu ke negara mana barang itu di ekspor. Seluruh di-Gambar 4. 32 Analisis nilai ekspor berdasarkan dimensi kelompok industri per tiga tahun dari
148 mensi yang ada bias dikombinasikan sedemikian rupa hingga menjadi la-poran yang diinginkan oleh pengguna.
149
Gambar 4. 34 Analisis nilai ekspor berdasarkan dimensi kelompok industri, negara dan pelabuhan (propinsinya)
150
Gambar 4. 35 Analisis nilai ekspor berdasarkan dimensi kelompok industri, negara, pelabuhan dan komoditi
151 Selain bentuk diagram batang ada beberapa bentuk diagram yang bisa digunakan. M isalnya diagram pie, diagram doughnut, diagram point, diagram pyramid dan diagram lainnya yang dapat dilihat di lampiran. Cara mengubah diagram yang digunakan yaitu dengan menekan tombol "select chart type", seperti gambar dibawah.
Gambar 4. 36 Tombol Select Type Chart
Fitur lainnya yaitu pengguna dapat mengubah format datanya ke-dalam bentuk ekstensi dari M icrosoft Office Excel (.xls), yaitu dengan menekan logo dari M icrosoft Office Excel yang ada di toolbar.
Gambar 4. 37 Tombol Convert to Ex cel
4.9.2.3 Halaman Ubah Password
Halaman ini merupakan halaman untuk mengubah pass-word, halaman ini sangatlah penting karena tiap user di-create
152 oleh admin, sehingga username dan password user dibuat oleh admin. Untuk menjaga kerahasiaan password sebaiknya setelah mendapatkan username dan password dari admin, user harus se-gera mengubah password-nya guna menjaga keamanan dan priva-si user. Untuk mengubah password user diharuskan mengipriva-si tiga buah textbox yaitu password lama, password baru dan re-enter password baru. Password lama berfungsi untuk menjaga kea-manan password yang dimiliki user agar tidak mudah diubah oleh orang lain. Password baru adalah password yang akan menggan-tikan password lama, agar tidak terjadi kesalahan pengemenggan-tikan ma-ka password baru diproteksi dengan memasukma-kan password baru yang sama di field re-enter password baru, apabila tidak sama maka aplikasi akan memberikan peringatan bahwa username dan password tidak valid. Bentuk halaman ini dapat dilihat pada gam-bar dibawah ini:
153
4.9.2.4 Halaman Daftar Baru
Halaman daftar baru hanya dapat diakses oleh grup admin, karena tidak semua orang dapat mengakses aplikasi analisis per-tumbuhan industri nasional, sehingga diperlukannya akses user untuk membuatkan user baru. halaman ini memiliki empat control input yaitu username, password dan re-enter password dalam ben-tuk textbox dan grup dalam benben-tuk combobox. Username digu-nakan sebagai identitas user untuk masuk kedalam aplikasi anal-isis pertumbuhan industri nasional, sedangkan password adalah kata sandi yang digunakan sebagai ijin untuk menggunakan ap-likasi analisis pertumbuhan industri nasional.
Gambar 4. 39 Tampilan halaman daftar baru
4.10 Kebutuhan Sistem
Berikut ini adalah daftar kebutuhan perangkat keras dan perangkat lunak yang diusulkan agar data warehouse dapat berjalan dengan baik.
154
4.10.1 Perangkat keras
Komponen perangkat keras yang diperlukan untuk data
ware-house pada Departemen Perindustrian adalah sebagai berikut: • Server:
o PC dengan Processor Pentium Itanium 2 1,3 GHz o Memory 2 GB DDRAM
o Harddisk Storage 160 GB o Jaringan LAN
• Workstation
o PC dengan Processor Pentium IV 2.8 GHz o Memory 1 GB DDRAM
o Harddisk Storage 40 GB
4.10.2 Perangkat lunak
Spesifikasi yang dianjurkan adalah: • Server
o Sistem operasi: Windows 2003 Server Enterprise Edition SP2 o Database: SQL Server 2005
• Workstation
o Sistem operasi: Windows XP Professional
155
4.11 Evaluasi
Dari hasil wawancara dari perwakilan Pusat Data dan Informasi yaitu Kepala Sub Bagian Database Regional dapat disimpulkan hasil manfaat dari
pro-totype aplikasi data warehouse yang telah dibuat, sebagai berikut:
1. Data dari aplikasi-aplikasi yang dimiliki Departemen Perindustrian seperti BDEHBKC (penyedia database ekspor produk industri nasional), BDIHBKC (penyedia database impor produk industri nasional), SAIDP (penyedia layanan kordinasi informasi dari pusat ke daerah), BKPM -Investasi (penyedia basis data investasi penanaman modal di sektor industri) dan SIM STATIND (memberikan layanan informasi statistik industri) dapat diintegrasikan sehingga pencarian data historis dari pertumbuhan industri nasional dapat lebih mudah dan cepat karena dengan diintegrasikan seluruh data, pegawai yang berwenang atas data yang akan digunakan tidak perlu mencari data tersebut dari satu server ke server lain karena datanya sudah ada dalam satu server.
2. Laporan yang selama ini formatnya sudah ditetapkan sebelumnya atau den-gan mengajukan permintaan laporan kepada Pusdatin sangat tidak efektif ka-rena dengan format yang sudah ditetapkan Pimpinan tidak bisa mengetahui secara mendalam tentang informasi aktual dan historis dari data tersebut se-dangkan bila mengajukan permintaan laporan kepada Pusdatin Departemen Perindustrian memakan waktu yang lama dan sering terjadi kesalahan penaf-siran. Adanya aplikasi data warehouse dapat memperbaiki keterbatasan dari kedua jenis pembuatan laporan sebelumnya, yaitu Pimpinan dapat langsung menganalisis data untuk membuat suatu informasi yang dibutuhkan,