• Tidak ada hasil yang ditemukan

Analisis Data

Data yang digunakan berasal dari 6 sumber data yaitu basis data simak.sql, kumpulan data prestasi.xls, data tugas akhir.xls, kumpulan data index prestasi mahasiswa.xls, data kota/kabupaten.xls, dan data jalur masuk.xls.

1 Identifikasi Fitur dan Atribut

Tahap analisis pertama adalah mengidentifikasi fitur dan atribut. Pengidentifikasian ini menggunakan cara manual. Pada basis data ditemukan kesalahan ejaan yakni pada tabel biodata dengan kolom jenis kelamin. Pada umumnya, data jenis kelamin diisikan dengan notasi biner antara 0 atau 1. Namun, sebanyak 60 baris dari 1111 baris data terisi dengan notasi 2. Pada 60 baris tersebut seluruhnya adalah perempuan, sehingga data tersebut perlu diganti dengan notasi yang seharusnya.

Pada data kata kunci skripsi terdapat beberapa kesalahan ejaan sehingga perlu dipetakan ke katayang benar, misalkan: Belief Revison diganti ke Belief Revision. Kemudian, untuk data prestasi, atribut yang dibutuhkan dari data prestasi, yakni kategori, tingkat, bidang. Namun, 3 atribut tersebut tidak ada didalam fail sehingga harus menambahkannya sendiri. Pada data prestasi juga, terdapat merging pada kolom prestasi sehingga perlu diuraikan menjadi baris-baris tunggal. Selain itu, data kota yang terdapat pada tabel biodata, ada beberapa kota yang mengalami perubahan sehingga tidak lagi menjadi kota/kabupaten, seperti Bekasi Barat. Kabupaten Bekasi Barat sudah berubah menjadi kecamatan dan kini termasuk dalam Kabupaten Bekasi berdasarkan data yang didapat dari BPS.

Pada data jalur masuk, data yang tersedia hanya dari tahun 2007-2009, sedangkan data biodata dari tahun 2006-2013, sehingga ketika data tersebut di join akan menyebabkan terbuangnya data lebih banyak dari yang terseleksi. Selain

10

itu, pada data IPK ada beberapa fail di mana kolom IPK berisi banyak nilai (tidak hanya nilai IPK, tetapi juga predikat). Hal tersebut akan menyulitkan proses pengekstrakan data sehingga perlu dilakukan pemisahan data antara IPK dan predikat.

2 Pemetaan Atribut

Tahap analisis selanjutnya dilakukan pemetaan atribut terhadap data yang telah dipilih, yakni menyeleksi dan memetakan nama atribut. Atribut yang terlibat dalam setiap fail dapat dilihat pada Tabel 1-8. Untuk Tabel 1, 2, dan 3 atribut diambil dari basis data akademik. Untuk Tabel 4 atribut diambil dari fail prestasi. Untuk Tabel 5 atribut diambil dari fail kabupaten/kota. Untuk Tabel 6 atribut diambil dari fail jalur masuk. Untuk Tabel 7 atribut diambil dari fail tugas akhir. Untuk Tabel 8 atribut diambil dari fail IPK. Penyeleksian dan pemetaan nama atribut dilakukan untuk menghindari konflik nama pada atribut. Hasil pemetaan atribut dapat dilihat pada Tabel 9.

Tabel 1 Atribut tabel biodata

No Nama Atribut

1 Nim

2 Tahunmasuk 3 Jeniskelamin 4 Kotaortu

Tabel 2 Atribut tabel dosen

No Nama Atribut

1 Nip

2 Nama

Tabel 3 Atribut tabel bagian

No Nama Atribut

1 Kodebagian 2 Namabagian

Tabel 4 Atribut fail prestasi

No Nama Atribut

1 Kategori 2 Bidang 3 Tingkat

Tabel 5 Atribut tabel lokasi

No Nama Atribut

1 Pulau 2 Provinsi 3 kabupaten/kota

Tabel 6 Atribut jalur masuk

No Nama Atribut

1 NRP

2 Jalur

Tabel 7 Atribut fail tugas akhir

No Nama Atribut

1 kata_kunci 2 sub_lab 3 in_dosen

Tabel 8 Atribut fail IPK

No Nama Atribut

1 NRP

2 IPK

Tabel 9 Hasil pemetaan atribut Atribut Data Pemetaan Atribut Deskripsi

tahunmasuk tahun_masuk Tahun masuk mahasiswa jeniskelamin id_jk Jenis kelamin mahasiswa

11 Jalur jalur_masuk Jalur masuk mahasiswa

kodebagian id_lab Kode lab keilmuan

sub_lab id_lab Kode lab keilmuan

Namabagian lab_keilmuan Lab keilmuan

Nip id_dosen_ps Nomor induk pegawai (dosen) in_dosen id_dosen_ps Nomor induk pegawai (dosen)

Nama dosen_ps Nama dosen

kata_kunci kata_kunci_skripsi Kata kunci skripsi mahasiswa Kategori kategori_kompetensi Kategori kompetensi prestasi Bidang bidang_komp Bidang kompetensi prestasi Tingkat tingkat_kompetensi Tingkat kompetensi prestasi

Pulau Pulau Nama pulau

Provinsi Provinsi Nama provinsi Kabupaten Kabupaten Nama kabupaten

IPK rataan_ipk Rataan ipk mahasiswa

Untuk atribut nim/nrp tidak dilakukan pemetaaan karena atribut tersebut tidak akan dimasukkan ke dalam skema galaksi. Atribut tersebut hanya akan digunakan untuk menggabungkan data yang di dalamnya memiliki atribut nim/nrp.

3 Pembuatan Skema Galaksi

Pada tahapan ini dilakukan perbaikan skema multidimensi yang telah dibuat Fhatiyya (2014) dengan menghapus beberapa dimensi, yakni dimensi topik, dimensi nim, dimensi lama studi, dan dimensi IPK. Skema Fhatiyya (2014) dapat dilihat pada Gambar 8. Dimensi yang terhapus dan berubah ditandai dengan kotak warna merah.

Gambar 8 Skema galaksi (Fhatiyya 2014)

Penghapusan dimensi topik dikarenakan data yang berkaitan tidak didapatkan dan penghapusan dimensi nim dilakukan karena measures yang ingin dicari adalah jumlah mahasiswa sehingga kurang tepat jika terdapat dimensi nim.

12

Penghapusan dimensi lama studi dikarenakan data lama studi tidak dibutuhkan dalam penelitian ini. Selain itu, dimensi IPK pada skema terdapat dua sehingga perlu dihapus salah satunya.

Pada skema juga dilakukan penyatuan beberapa dimensi, yakni dimensi kabupaten, provinsi, dan pulau. Hal tersebut dikarenakan operasi OLAP seperti roll up dapat dilakukan lebih dari 1 kali sehingga akan lebih baik disatukan dalam dimensi yang sama.

Untuk dimensi kabupaten, provinsi, dan pulau pada penelitian ini dijadikan satu dimensi, yaitu dimensi lokasi. Untuk data status studi dan rataan IPK tidak terdapat pada 6 sumber data di atas sehingga akan dilakukan generate rows saat implementasi ETL.

Setelah dilakukan penghapusan dan perbaikan skema, maka pada skema yang baru terdapat 12 tabel dimensi dengan 3 tabel fakta. Skema perbaikan dapat dilihat pada Gambar 9.

kata_kunci_skripsi PK id_kata_kunci kata_kunci id_lab akademik id_kota (FK) id_jalur_masuk (FK) id_rataanIPK (FK) id_jk (FK) id_tahun (FK) jml_mhs ipk PK id_rataanIPK rataanIPK id_status_studi jalur_masuk PK id_jalur_masuk jalur_masuk jenis_kelamin PK id_jk jenis_kelamin lokasi PK id_lokasi kabupaten provinsi pulau lab_keilmuan PK id_lab lab_keilmuan status_studi PK id_status_studi status_studi tahun_masuk PK id_tahun tahun_masuk tugas_akhir id_kata_kunci (FK) id_dosen_ps (FK) id_lab (FK) id_tahun (FK) jml_mhs dosen_ps PK id_dosen_ps nama_dosen prestasi id_kat_komp (FK) id_bid_komp (FK) id_tkt_komp (FK) id_tahun (FK) jmlh_mhs tingkat_kompetensi PK id_tkt_komp tingkat_kompetensi kategori_kompetensi PK id_kat_komp kategori_kompetisi bidang_kompetensi PK id_bid_komp bidang_komp

Gambar 9 Perbaikan skema galaksi

Pemodelan ETL

1 Pemodelan Konseptual

Pada tahapan ini, setiap tabel fakta akan dibuatkan model konseptual yang memodelkan hubungan antara entitas, atribut dan transformasi yang terlibat dalam pembuatan data warehouse. Pemodelan konseptual untuk tabel fakta akademik dapat dilihat pada Gambar 10. Dalam pemodelan tersebut melibatkan 3 sumber data yaitu biodata, jalur masuk, dan IPK. Sumber data IPK memerlukan sebuah fungsi union untuk menggabungkan seluruh data IPK dari tahun 2006-2015. Selain itu, data IPK juga membutuhkan fungsi agregasi avg untuk mencari rata-rata nilai IPK dan juga fungsi range untuk mendapatkan range IPK.

13 Ga mbar 10 P emodela n k onsep tual tabe l fa kt a a ka de mi k

14

Pada data biodata diperlukan fungsi value mapper untuk memetakan nama kota yang sesuai dengan data BPS dan untuk mengubah angka 2 pada kolom jenis kelamin menjadi angka 1. Selain itu, data biodata juga memerlukan fungsi split rows untuk membuang baris yang kosong. Sebuah fungsi lookup dimensions diperlukan oleh seluruh sumber data karena untuk mendapatkan seluruh id dari atribut yang terlibat di dalam pemodelan ini.

Pemodelan konseptual untuk tabel fakta tugas akhir dan prestasi dapat dilihat pada Lampiran 1 dan 2.

2 Pemodelan Logical

Pada tahapan ini dilakukan pemodelan logical, yakni model yang mengadaptasi fungsi transformasi dari pemodelan konseptual kemudian mengubah notasi transformasi tersebut dengan notasi yang berlaku pada pemodelan logical. Dengan rancangan ini, dapat terlihat dengan jelas semua fungsi transformasi yang dilakukan per tahapan sebelum dimuat ke dalam data warehouse. Pemodelan logical untuk tabel fakta akademik dapat dilihat pada Gambar 11. Pemodelan logical untuk tabel fakta tugas akhir dan prestasi dapat dilihat pada Lampiran 3 dan 4.

Gambar 11 Pemodelan logical tabel fakta akademik

Pada pemodelan logical di atas, notasi concept yang terdapat dalam pemodelan konseptual diadaptasi menjadi notasi recordset, sedangkan notasi transformation diadaptasi menjadi notasi activities.

3 Pemodelan Fisik

Pada tahapan ini, dilakukan pemodelan fisik pada proses ETL berupa deployment diagram. Pemodelan fisik utuk proses ETL yang terjadi dapat dilihat pada Gambar 12.

15 <<Server>> SIMAK <<PC Staff>> «file» Penelitian Mahasiswa <<PC Staff>> «file» IPK Mahasiswa <<PC Staff>> «file» Prestasi Mahasiswa <<Server ETL>> <<Server DW>> SIMAK_SCHEMA_DWH * * * * * * * * * * <<PC Staff>> «file» Mahasiswa TPB * *

Gambar 12 Pemodelan fisik ETL

Implementasi ETL

Pada tahapan ini, proses ETL diimplementasikan dengan menggunakan perangkat ETL yaitu Kettle. Dalam Kettle, ETL dapat dibungkus dalam satu transformation dan dapat dijalankan secara bersamaan. Kettle memiliki GUI yaitu Spoon. Pada Spoon inilah, pemodelan modul transformation dan job dilakukan dengan menarik ikon yang diperlukan ke dalam kanvas yang tersedia. Modul transformation yang dihasilkan sebanyak 12 modul untuk tabel dimensi dan 3 moduluntuk tabel fakta serta 1 modul job.

Modul transformation untuk tabel fakta akademik membentuk 78 buah langkah dari proses ekstrak data sampai pemuatan data ke target. Proses ekstrak memakai 21 fungsi ekstrak data, proses transformasi memakai 56 fungsi transformasi dan proses loading memakai 1 fungsi untuk memuat data ke target. Modul transformation tersebut dapat dilihat pada Gambar 13.

Modul transformation untuk tabel fakta tugas akhir dan prestasi dapat dilihat pada Lampiran 5 dan 6. Semua fungsi transformasi utama yang terdapat dalam pemodelan konseptual, telah berhasil diimplementasikan. Meskipun dalam penerapannya ada fungsi transformasi tambahan yang dilakukan sebelum menjalankan fungsi utama.

Modul transformation yang berhasil dieksekusi akan menampilkan data dalam bentuk baris dan kolom. Hasil transformation tabel fakta akademik dapat dilihat pada Gambar 14. Hasil transformation tabel fakta tugas akhir dan prestasi dapat dilihat pada Lampiran 7 dan 8.

16 Ga mbar 13 Modul trans format ion tabe l fa kta a k ade mi k

17

Gambar 14 Hasil transformation tabel fakta akademik

Setelah modul transformation dibuat, maka diperlukan sebuah modul job untuk menjalankan seluruh modul transformation yang ada. Selain itu, modul job digunakan untuk memuat data bila terjadi perubahan pada data sumber, rancangan modul job dapat dilihat pada Gambar 15.

Pada rancangan job, apabila transformation berhasil diperbaharui maka dilaporkan sukses melalui ikon success, jika tidak berhasil maka transformation yang gagal akan dilaporkan melalui ikon mail failure.

18

Pencocokan fungsi transformasi yang ada pada pemodelan konseptual dengan yang ada pada implementasi ETL untuk tabel fakta akademik dapat dilihat pada Tabel 10.

Tabel 10 Pencocokan fungsi transformasi Fungsi Transformasi

Pemodelan Konseptual Implementasi ETL (Kettle)

(append stream 17)

(group by)

(number range)

(dimension lookup)

(split field to rows)

(value mapper)

(inner join)

Perancangan Data Warehouse

Pada tahapan ini dilakukan perancangan untuk data warehouse dengan menggunakan Pentaho Skema Workbench 3.8. Pada pemodelan ini, dilakukan pembuatan kubus data untuk tabel fakta. Pada penelitian ini, terdapat tiga tabel fakta maka kubus yang terbentuk sebanyak tiga, yakni kubus akademik, kubus prestasi, dan kubus tugas akhir. Hasil skema multidimensi dapat dilihat pada Gambar 17.

Tabel dimensi tahun dikategorikan sebagai dimension usage karena dimensi tersebut digunakan oleh seluruh tabel fakta. Untuk tabel dimensi yang memiliki relasi dengan tabel dimensi lainnya, yaitu seperti dimensi lab dan dimensi kata kunci skripsi dilakukan pendeskripsian fungsi join dalam perancangan. Hal tersebut dilakukan agar konsistensi data tetap terjaga.

19

Gambar 16 Skema multidimensi data warehouse akademik

Implementasi Data Warehouse

Pada tahapan ini rancangan data warehouse di publish ke dalam folder Pentaho BI Server. Setelah itu, dilakukan refresh skema pada Pentaho User Console. Refresh skema dapat dilihat pada Gambar 17.

Gambar 17 Refresh skema

Setelah selesai di refresh maka skema dapat divisualisasikan dalam OLAP dengan Mondrian. Hasil OLAP dapat dilihat pada Gambar 18.

20

Gambar 18 Visualisasi OLAP

Pengujian

Setelah tahapan implementasi ETL dan pemodelan data warehouse selesai, maka tahap selanjutnya adalah pengujian. Pengujian ini dilakukan dengan 2 tahap yaitu menguji ETL dan menguji data warehouse.

1 Pengujian ETL

Pada tahap ini dilakukan pengujian pada ETL untuk seluruh modul transformation tabel fakta. Hasil pengujian ETL untuk tabel fakta akademik dapat dilihat pada Gambar 19. Pada step metrics tersebut, pada bagian kolom active, proses ETL untuk tabel fakta akademik adalah finished atau berhasil dijalankan dengan menghasilkan 169 baris data. Hasil step metrics untuk tabel fakta tugas akhir dan prestasi dapat dilihat pada Lampiran 9 dan 10.

21

Gambar 19 Hasil step metrics untuk tabel fakta akademik 2 Pengujian data warehouse

Pada tahap ini dilakukan dua kali perngujian. Pengujian pertama dilakukan dengan membandingkan total jumlah mahasiswa per tabel fakta dan pengujian kedua dilakukan dengan membandingkan jumlah mahasiswa pada level terbawah dari sebuah dimensi.

o Pengujian pertama

Pengujian untuk tabel fakta akademik dapat dilihat pada Gambar 20 dan Gambar 21. Total jumlah mahasiswa yang dihasilkan dari kueri SQL dan OLAP adalah sesuai yaitu 208 mahasiswa. Total tersebut adalah total jumlah mahasiswa yang terdapat pada tabel fakta akademik. Pengujian untuk tabel fakta tugas akhir dapat dilihat pada Lampiran 11 dan 12. Pengujian untuk tabel fakta prestasi dapat dilihat pada Lampiran 13 dan 14.

22

Gambar 21 Hasil OLAP tabel fakta akademik

o Pengujian kedua

Pengujian kedua untuk tabel fakta akademik dapat dilihat pada Gambar 22 dan Gambar 23 Jumlah mahasiswa dari kabupaten Ciamis yang dihasilkan dari kueri SQL dan OLAP adalah sesuai yaitu 4 mahasiswa. Pengujian kedua untuk tabel fakta tugas akhir dapat dilihat pada Lampiran 15 dan 16. Pengujian kedua untuk tabel fakta prestasi dapat dilihat pada Lampiran 17 dan 18.

Hasil perbandingan data pada pengujian pertama dapat dilihat pada Tabel 11 dan hasil perbandingan data pada pengujian kedua dapat dilihat pada Tabel 12.

Tabel 11 Perbandingan data pada pengujian pertama Tabel Fakta Kueri SQL Mondrian Hasil

Akademik 208 data 208 data Sesuai Tugas Akhir 197 data 197 data Sesuai Prestasi 86 data 86 data Sesuai Gambar 22 Hasil kueri SQL untuk kabupaten Ciamis

23 Tabel 12 Perbandingan data pada pengujian kedua

Tabel Fakta Tabel Dimensi Kueri SQL Mondrian Hasil Akademik Kabupaten Ciamis 4 data 4 data Sesuai Tugas Akhir Kata kunci data warehouse 5 data 5 data Sesuai Prestasi Kategori PKM 49 data 49 data Sesuai

Dokumen terkait