Pada penelitian ini, sumber data diperoleh dengan format Excel (xls dan xlsx) berisi data skripsi mahasiswa tahun masuk 2001 dan 2005 sampai dengan 2008 sebanyak 318 record, data dosen sebanyak 38 record, data lab keilmuan sebanyak 28 record, dan data mahasiswa sebanyak 454 record. Data skripsi diperoleh dari perpustakaan IPB, data dosen dan data lab keilmuan diperoleh dari bagian administrasi Departemen Ilmu Komputer, sedangkan data mahasiswa didapat dari Tingkat Persiapan Bersama (TPB).
Proses analisis dilakukan untuk menemukan atribut-atribut yang tepat untuk perancangan desaindata warehouse. Atribut-atribut pada data skripsi, data dosen, data lab keilmuan, dan data mahasiswa masing-masing dapa dilihat pada Tabel 1, Tabel 2, Tabel 3, dan Tabel 4 sedangkan atribut hasil analisis dapat dilihat pada Tabel 5.
Proses analisis yang dilakukan sebagai berikut:
1 Pada data skripsi, atribut subjek dan judul tidak diambil karena topik skripsi sudah bisa diketahui dari setiap kata kunci.
2 Pada data dosen, atribut nomor, NIP, NIDN, dan keterangan tidak diambil karena pada data skripsi yang dipakai adalah nama dosen, sedangkan inisial dosen diambil untuk menjadi primary key pada entity dosen dan menjadi foreign keypadaentityskripsi.
3 Pada data lab keilmuan, atribut NIP dosen tidak diambil karena nama dosen sudah mewakili sebagai dosen pembimbing.
10
4 Pada data mahasiswa, atribut kode pos tidak diambil karena atribut kota sudah mewakili sebagai asal daerah mahasiswa.
Tabel 1 Atribut pada data skripsi No Atribut 1 NIM 2 Nama Mahasiswa 3 Kata Kunci 4 Subjek 5 Tahun 6 Judul 7 Dosen Pembimbing Tabel 2 Atribut pada data dosen No Atribut 1 No 2 Nama 3 NIP 4 NIDN 5 Inisial 6 Keterangan
Tabel 3 Atribut pada data lab keilmuan No Atribut
1 Nama dosen 2 Inisial Lab 3 NIP
Tabel 4 Atribut pada data mahasiswa No Atribut 1 NIM 2 Kota 3 Jenis Kelamin 4 Tahun Masuk 5 Jalur Masuk 6 IPK 7 Kode pos
Tabel 5 Atribut hasil analisis Nama Atribut Deskripsi NIM Nomor induk mahasiswa Nama mhs Nama mahasiswa
Kata kunci Kata kunci di setiap judul skripsi Tahun lulus Tahun mahasiswa lulus
Nama dosen Nama dosen di Departemen Ilmu Komputer Inisial dosen Inisial nama dosen
11 Tabel 5 Atribut hasil analisis (lanjutan)
Nama Atribut Deskripsi Nama lab Nama lab keilmuan
Inisial lab Inisial nama lab keilmuan Asal daerah Kota asal mahasiswa Jenis Kelamin Jenis kelamin mahasiswa Tahun masuk Tahun mahasiswa masuk IPB Jalur masuk Jalur masuk IPB
IPK IPK mahasiswa waktu TPB Klasifikasi
Klasifikasi digunakan untuk mengetahui keberadaan seorang mahasiswa masuk lab keilmuan mana. Contoh sebelum klasifikasi dapat dilihat pada Tabel 6. Setelah ditelusuri dengan melihat kata kunci dan dosen pembimbing, maka skripsi tersebut berasal dari lab keilmuan Computational Intelligence (CI). Tahap ini bertujuan mengetahui tren topik skripsi pada masing-masing lab keilmuan.
Tabel 6 Contoh klasifikasi untuk tabel fakta skripsi Nama
Mahasiswa Judul Skripsi Subjek
Kata
Kunci Dosbing Lab Muhammad Agung Nugroho Perbandingan beberapa metode praproses pada pengenalan karakter tulisan tangan menggunakan
jaringan syaraf tiruan propagasi balik - Jaringan syaraf tiruan Buono, Agus; Neyman Shelvie Nidya; ?
Desain Konseptual dan Desain Logikal
Tahap ini merujuk kepada tujuan penelitian, yaitu melihat pola-pola informasi yang berpotensi menunjang kelulusan mahasiswa tepat waktu. Sehingga membutuhkan tabel fakta skripsi yang akan menghasilkan faktor-faktor yang memengaruhi seorang mahasiswa lulus tepat waktu atau tidak. Faktor tersebut diimplementasikan dalam sebelas atribut (inisial_dosen, inisial_lab, nim, th_lulus, inisial_key, th_masuk, IPK, lama_studi, id_jm, id_jk, id_kab) dan dua measure (jumlah_judul_skripsi, rata_lama_studi). Data yang digunakan adalah data skripsi mahasiswa Ilmu Komputer yang sudah lulus sebanyak 318 record. Hasil dari sebelas atribut dan dua measure digunakan untuk melihat tren skripsi dan tujuh faktor (dosen, lab, kata kunci, IPK, jalur masuk, jenis kelamin, atau asal daerah) yang paling berpengaruh terhadap kelulusan mahasiswa.
Selanjutnya, dibuat skema multidimensi untuk data warehouse yang dapat dilihat pada Gambar 6. Skema data multidimensi yang dihasilkan merupakan hasil desain logikal.
12
Gambar 6 Skema galaksi dengan dua tabel fakta Integrasi Data, Reduksi Data, dan Pembersihan Data
Tahap ini diawali dengan melakukan penggabungan atribut-atribut yang menarik dari tabel-tabel yang dianalisis menjadi satu tabel besar untuk dijadikan tabel fakta. Penggabungan yang dilakukan adalah menggabungkan data skripsi, data dosen, data lab keilmuan, dan data mahasiswa.
Reduksi data dan pembersihan data dilakukan dengan membuang atribut-atribut yang tidak terpilih, record yang kosong (null), mengandung noise, dan tidak konsisten berdasarkan hasil analisis data. Nilai atribut yang berulang dalam tabel-tabel sumber tidak disertakan dalam proses selanjutnya. Praproses data menghasilkan tabel baru yaitu tabel skripsi dan tabel mahasiswa.
Hasil dari praproses data menghasilkan desain fisik final yang selanjutnya dijadikan tabel fakta dapat dilihat pada Tabel 7 dan Tabel 8. Setelah melakukan praproses data selanjutnya data dari format Excel (xls dan xlsx) diimpor menjadi file SQL.
Tabel 7 Desain fisik fakta skripsi Nama atribut Deskripsi
inisial_dosen Kode dosen pembimbing inisial_lab Kode lab keilmuan nim Nomor induk mahasiswa th_lulus Tahun lulus mahasiswa
inisial_key Kode kata kunci setiap judul skripsi th_masuk Tahun masuk mahasiswa
lama_studi Lama studi mahasiswa IPK TPB Nilai IPK saat TPB id_jm Kode jalur masuk IPB
id_jk Kode jenis kelamin mahasiswa id_kab Kode asal daerah mahasiswa
13 Tabel 8 Desain fisik fakta mahasiswa
Nama atribut Deskripsi
nim Nomor induk mahasiswa th_masuk Tahun masuk mahasiswa id_jm Kode jalur masuk IPB
id_jk Kode jenis kelamin mahasiswa id_kab Kode asal daerah mahasiswa
Transformasi data
Transformasi data meliputi penyeragaman nama atribut, generalisasi, agregasi, dan konstruksi atribut atau dimensi. Proses ini dilakukan dengan berpedoman pada skema data warehouse yang sudah dibuat. Langkah transformasi yang dilakukan antara lain:
1 Mengubah nama atribut pada tabel data hasil pembersihan sesuai dengan nama atribut dimensi yang ada pada skema galaksi.
2 Proses transformasi juga dilakukan dengan mengkontruksi atribut baru menggunakan data dari atribut yang sudah ada. Atribut NIM dari tabel skripsi digeneralisasi menjadi tahun_masuk dengan mengambil lima digit awal, kemudian dari digit tersebut diambil tiga digit awal dan dua digit terakhir. Misalnya NIM = ‘G64070101’→’G6407’→’G64’→’07 sehingga mahasiswa yang memiliki NIM tersebut adalah mahasiswa Departemen Ilmu Komputer IPB dengan tahun masuk 2007.
3 Langkah selanjutnya adalah menentukan nilai agregasi atribut-atribut menjadi ukuran (measure). Data tabel fakta skripsi ditentukan nilai agregasinya untuk menentukan ukuran rata-rata lama studi.
Pemuatan Data
Data warehouse yang sudah selesai dibuat, selanjutnya dimuat ke kubus data OLAP server Mondrian. Kemudian, skema data warehouse dimodelkan dengan menentukan dimensi-dimensi, ukuran-ukuran, dan kubus data. Kubus data yang dibuat yaitu, kubus skripsi dan kubus mahasiswa. Kubus skripsi dibuat untuk tabel fakta skripsi dan kubus mahasiswa dibuat untuk tabel fakta mahasiswa.
Eksplorasi dan Presentasi Hasil
Eksplorasi data dilakukan dengan menggunakan operasi OLAP untuk menghasilkan beberapa informasi yang diinginkan. Operasi OLAP yang dapat dijalankan dapat dilihat pada tiap kubus yang terbentuk.
Tampilan aplikasi dapat dilihat pada Gambar 7. Pada aplikasi ini dibuat dua modul yaitu modul skripsi untuk kubus skripsi pada Gambar 8 dan modul mahasiswa untuk kubus mahasiswa pada Gambar 9.
14
Gambar 7 Tampilan awal aplikasi
Gambar 8 Tampilan aplikasi untuk kubus skripsi
15 Pada kubus Skripsi dapat dilihat beberapa operasi OLAP misalnya operasi roll-up, drill-down, slice, dan dice. Berikut tampilan aplikasi untuk informasi penunjang kelulusan tepat waktu dilihat dari faktor:
a Topik skripsi
Pengguna memiliki dua pilihan untuk mengggunakan aplikasi ini yaitu, manual (menggunakanqueryMDX) dan praktis (menggunakan OLAP navigator). Gambar 10 merupakan tampilan editor query MDX. Untuk menggunakan editor tersebut pengguna cukup mengklik button MDX. Berikut keterangan dari setiap queryyang ditulis pada Gambar 10:
o select {[Measures].[Jumlah Skripsi]} ON COLUMNS - Ukuran atau measure yang digunakan yaitu Jumlah Skripsi yang ditampilkan dalam bentuk kolom.
o Hierarchize({[Kata kunci].[All]}) ON ROWS - Hirarki atau dimensi yang digunakan adalah Kata Kunci (topik skripsi) ditampilkan dalam bentuk baris.
o from [Skripsi]–diambil dari kubus Skripsi.
o where [Lama Studi].[4] – slicer untuk melihat mahasiswa dengan lama studi empat tahun.
Gambar 10 Tampilan editorqueryMDX topik skripsi
Gambar 11 merupakan tampilan OLAP navigator. Pada bagian columns terdapat Measure, pada bagian rows terdapat Kata Kunci, dan pada bagian filter terdapat slicer (Lama Studi = 4). Untuk menggunakan fungsi tersebut, pengguna cukup mengklikbuttonOpen OLAP Navigator.
16
Gambar 11 Tampilan OLAP Navigator topik skripsi
Gambar 12 merupakan potongan tampilan hasil topik skripsi mahasiswa dengan lama studi empat tahun. Kekurangan pada fungsi ini adalah kata kunci skripsi masih dalam bentuk hierarki. Contohnya dari Gambar 12, Natural language processingberada pada tingkatan ketiga di bawahKnowledge graphdan berada di bawah Adverb. Oleh karena itu dibutuhkan data hasil klasifikasi keberadaan suatu kata kunci masuk dalam sebuah kategori tertentu sesuai dengan bidang kajiannya.
Gambar 12 Tampilan hasil topik skripsi b Dosen pembimbing
Gambar 13 merupakan tampilan editor query MDX. Untuk menggunakan editor tersebut pengguna cukup mengklik button MDX. Berikut keterangan dari setiapqueryyang ditulis pada Gambar 13:
o select {[Measures].[Jumlah Skripsi]} ON COLUMNS, - Ukuran atau measure yang digunakan yaitu Jumlah Skripsi yang ditampilkan dalam bentuk kolom.
17 o Hierarchize({[Dosen Pembimbing].[All]}) ON ROWS - Hirarki atau dimensi yang digunakan adalah Dosen Pembimbing ditampilkan dalam bentuk baris.
o from [Skripsi]–diambil dari kubus Skripsi.
o where [Lama Studi].[4] – slicer untuk melihat mahasiswa dengan lama studi empat tahun.
Gambar 13 Tampilan editorqueryMDX Dosen pembimbing
Gambar 14 Tampilan OLAP Navigator Dosen Pembimbing
Gambar 14 merupakan tampilan OLAP navigator. Pada bagian columns terdapat Measure, pada bagian rows terdapat Dosen Pembimbing, dan pada bagian filter terdapatslicer(Lama Studi = 4). Untuk menggunakan fungsi tersebut, pengguna cukup mengklik button Open OLAP Navigator. Untuk hasilnya diketahui bahwa dosen pembimbing yang banyak meluluskan mahasiswa tepat waktu adalah Bapak Julio Adisantoso dapat dilihat pada Gambar 15.
18
Gambar 15 Tabel pivot menunjukkan dosen pembimbing yang meluluskan mahasiswa tepat waktu c Lab Keilmuan
Gambar 16 merupakan tampilan editor query MDX. Untuk menggunakan editor tersebut pengguna cukup mengklik button MDX. Berikut keterangan dari setiapqueryyang ditulis pada Gambar 16:
o select {[Measures].[Jumlah Skripsi]} ON COLUMNS, - Ukuran atau measure yang digunakan yaitu Jumlah Skripsi yang ditampilkan dalam bentuk kolom.
o Hierarchize({[Lab Keilmuan].[All]}) ON ROWS -Hirarki atau dimensi yang digunakan adalah Lab Keilmuan ditampilkan dalam bentuk baris. o from [Skripsi]–diambil dari kubus Skripsi.
o where [Lama Studi].[4] – slicer untuk melihat mahasiswa dengan lama studi empat tahun.
Gambar 17 merupakan tampilan OLAP navigator. Pada bagian columns terdapat Measure, pada bagian rows terdapat Lab Keilmuan, dan pada bagian filter terdapat slicer (Lama Studi = 4). Untuk menggunakan fungsi tersebut, pengguna cukup mengklik button Open OLAP Navigator. Untuk hasilnya diketahui bahwa lab keilmuan Computational Intelligence (CI) paling banyak meluluskan mahasiswa tepat waktu sedangkan lab keilmuan yang paling sedikit meluluskan mahasiswa tepat waktu adalah SEINS dapat dilihat pada Gambar 18.
19
Gambar 16 Tampilan editorqueryMDX Lab Keilmuan
Gambar 17 Tampilan OLAP Navigator Lab Keilmuan
Gambar 18 Tabel pivot dan grafik batang menunjukkan jumlah mahasiswa lulus tepat waktu berdasarkan lab keilmuan
20
d IPK
Gambar 19 merupakan tampilan editor query MDX. Untuk menggunakan editor tersebut pengguna cukup mengklik button MDX. Berikut keterangan dari setiapqueryyang ditulis pada Gambar 19:
o select {[Measures].[Jumlah Skripsi]} ON COLUMNS, - Ukuran atau measure yang digunakan yaitu Jumlah Skripsi yang ditampilkan dalam bentuk kolom.
o Hierarchize({[IPK TPB].[All]}) ON ROWS - Hirarki atau dimensi yang digunakan adalah IPK TPB ditampilkan dalam bentuk baris.
o from [Skripsi]–diambil dari kubus Skripsi.
o where [Lama Studi].[4] – slicer untuk melihat mahasiswa dengan lama studi empat tahun.
Gambar 19 Tampilan editorqueryMDX IPK TPB
21 Gambar 20 merupakan tampilan OLAP navigator. Pada bagian columns terdapat Measure, pada bagian rows terdapat IPK TPB, dan pada bagian filter terdapat slicer (Lama Studi = 4). Untuk menggunakan fungsi tersebut, pengguna cukup mengklik button Open OLAP Navigator. Untuk hasilnya diketahui bahwa IPK diatas 2.5 cenderung lulus tepat waktu, sedangkan IPK di bawah 2.5 hanya sedikit yang mampu lulus tepat waktu dilihat pada Gambar 21.
Gambar 21 Tabel pivot menunjukkan kelulusan tepat waktu berdasarkan IPK TPB
e Jenis Kelamin Mahasiswa
Gambar 22 merupakan tampilan editor query MDX. Untuk menggunakan editor tersebut pengguna cukup mengklik button MDX. Berikut keterangan dari setiapqueryyang ditulis pada Gambar 22:
o select {[Measures].[Jumlah Skripsi]} ON COLUMNS, - Ukuran atau measure yang digunakan yaitu Jumlah Skripsi yang ditampilkan dalam bentuk kolom.
o Hierarchize({[Jenis Kelamin].[All]}) ON ROWS - Hirarki atau dimensi yang digunakan adalah Jenis Kelamin ditampilkan dalam bentuk baris. o from [Skripsi]–diambil dari kubus Skripsi.
o where [Lama Studi].[4] – slicer untuk melihat mahasiswa dengan lama studi empat tahun.
Gambar 23 merupakan tampilan OLAP navigator. Pada bagian columns terdapatMeasure,pada bagianrowsterdapat Jenis Kelamin, dan pada bagian filter terdapat slicer (Lama Studi = 4). Untuk menggunakan fungsi tersebut, pengguna cukup mengklik button Open OLAP Navigator. Hasilnya pada Gambar 24 diketahui bahwa mahasiswa perempuan paling banyak lulus tepat waktu daripda mahasiswa laki-laki, tetapi perbedaannya tidak terlalu signifikan.
22
Gambar 23 Tampilan OLAP Navigator Jenis Kelamin Mahasiswa
Gambar 24 Tabel pivot dan grafik operasi drill-down menunjukkan jumlah mahasiswa lulus tepat waktu berdasarkan jenis kelamin
f Jalur Masuk
Gambar 25 merupakan tampilan editor query MDX. Untuk menggunakan editor tersebut pengguna cukup mengklik button MDX. Berikut keterangan dari setiapqueryyang ditulis pada Gambar 25:
o select {[Measures].[Jumlah Skripsi]} ON COLUMNS, - Ukuran atau measure yang digunakan yaitu Jumlah Skripsi yang ditampilkan dalam bentuk kolom.
o Hierarchize({[Jalur Masuk].[All]}) ON ROWS - Hirarki atau dimensi yang digunakan adalah Jalur Masuk ditampilkan dalam bentuk baris. o from [Skripsi]–diambil dari kubus Skripsi.
o where [Lama Studi].[4] – slicer untuk melihat mahasiswa dengan lama studi empat tahun.
Gambar 26 merupakan tampilan OLAP navigator. Pada bagian columns terdapatMeasure, pada bagianrows terdapat Jalur Masuk, dan pada bagian filter terdapat slicer (Lama Studi = 4). Untuk menggunakan fungsi tersebut, pengguna cukup mengklikbuttonOpen OLAP Navigator.
23
Gambar 25 Tampilan editorqueryMDX Jalur Masuk Mahasiswa
Gambar 26 Tampilan OLAP Navigator Jalur Masuk Mahasiswa
Gambar 27 menunjukkan kelulusan mahasiswa tepat waktu berasal dari jalur masuk USMI daripada jalur masuk SNMPTN, BUD. Sedangkan berdasarkan jalur masuk Prestasi Internasinal-Nasional (PIN), asing, dan Ujian Talenta Masuk (UTM) tidak ada mahasiswa yang lulus tepat waktu.
24
Gambar 27 Tabel pivot dan grafik operasi drill-down menunjukkan jumlah mahasiswa lulus tepat waktu berdasarkan jalur masuk
g Asal Daerah
Gambar 28 merupakan tampilan editor query MDX. Untuk menggunakan editor tersebut pengguna cukup mengklik button MDX. Berikut keterangan dari setiapqueryyang ditulis pada Gambar 28:
o select {[Measures].[Jumlah Skripsi]} ON COLUMNS, - Ukuran atau measure yang digunakan yaitu Jumlah Skripsi yang ditampilkan dalam bentuk kolom.
o Hierarchize({[Asal Daerah].[All]}) ON ROWS - Hirarki atau dimensi yang digunakan adalah Asal Daerah ditampilkan dalam bentuk baris. o from [Skripsi]–diambil dari kubus Skripsi.
o where [Lama Studi].[4] – slicer untuk melihat mahasiswa dengan lama studi empat tahun.
Gambar 29 merupakan tampilan OLAP navigator. Pada bagian columns terdapatMeasure, pada bagianrows terdapat Asal Daerah, dan pada bagian filter terdapat slicer (Lama Studi = 4). Untuk menggunakan fungsi tersebut, pengguna cukup mengklik button Open OLAP Navigator. Hasilnya pada Gambar 30 menunjukkan bahwa jumlah kelulusan tepat waktu terbanyak berasal dari Pulau Jawa, sedangkan dari daerah Maluku dan Sulawesi tidak ada mahasiswa yang lulus tepat waktu.
25
Gambar 28 Tampilan editorqueryMDX Asal Daerah Mahasiswa
Gambar 29 Tampilan OLAP Navigator Asal Daerah Mahasiswa
Gambar 30 Grafik batang kelulusan tepat waktu berdasarkan asal daerah mahasiswa
26