• Tidak ada hasil yang ditemukan

Pada penelitian ini, data diperoleh dengan format Access (.mdb). Proses analisis dilakukan terhadap data untuk mendapatkan atribut-atribut yang tepat untuk membangun data warehouse.

Data yang digunakan adalah data KRS mahasiswa (krs), data KRS mata kuliah (krsmk), dan data mahasiswa (mhs). Ketiga kelompok data tersebut dipilih karena sudah memenuhi beberapa kriteria dari informasi yang ingin ditampilkan. Tabel KRS mahasiswa berisi isian KRS mahasiswa tiap semester sedangkan tabel data KRS mata kuliah berisi perolehan nilai pada mata kuliah yang diambil tiap semester. Pada tabel mahasiswa berisi keterangan dari data mahasiswa yang masuk ke Program Studi S1 Ilmu Komputer. Dari tabel- tabel itu, kemudian dipilih atribut-atribut yang akan digunakan untuk membuat data warehouse.

Atribut yang akan digunakan dipilih berdasarkan ketentuan sebagai berikut:

1 Atribut yang dipilih menarik untuk dianalisis

2 Atribut tersebut berkaitan dengan atribut di tabel data yang lain

3 Data yang dianalisis tidak terlalu banyak mengandung nilai null

Setelah pemilihan atribut, maka langkah selanjutnya adalah menentukan atribut-atribut yang menjadi ukuran (measure) dan non ukuran Gambar 3 Arsitektur aplikasi OLAP

berbasis web (Sumber: diadopsi dari Herlambang 2007).

5

4 Web server mengakses kubus data Palo

server melalui Palo PHP API. Aplikasi OLAP menggunakan library JpGraph untuk menampilkan grafik. Palo Excel Add-In Data Warehouse Crosstab Lapis bawah: Data Warehouse DBMS Lapis tengah: Web server OLAP server Lapis atas: Web browser

Palo OLAP server JpGraph MDB MDB MDB Praproses data Apache PHP Web server Palo API Laptop PC Presentasi OLAP Grafik Line Plot

Data sumber

MsSQL Server

Lingkungan Pengembangan

Aplikasi OLAP berbasis web ini dibangun dengan menggunakan perangkat sebagai berikut:

Perangkat keras berupa komputer personal dengan spesifikasi :

 Prosessor AMD Sempron 2500 + 1.4 GHz

 Memori 512 MB DDR RAM

Harddisk 80 GB

Monitor 15” dengan resolusi 1024× 768

Mouse dan Keyboard

Perangkat lunak yang dibutuhkan untuk membuat sistem:

 Sistem Operasi Microsoft Windows XP Professional SP2

 Microsoft SQL Server 2000 (perangkat lunak bantu untuk pemrosesan data dan pembuatan skema data warehouse)

 Palo Server 2.0 (berfungsi sebagai OLAP

server yang melakukan fungsi agregasi dan tempat penyimpanan struktur dan kubus data multidimensi)

 Palo Excel Add-In 2.0 (tempat pembuatan atau pemodelan struktur kubus data dan proses pemuatan data dari data warehouse

ke kubus data)

Web Server package WAMPP versi 2.0

 Bahasa Pemrograman PHP 5.1.2

JpGraph 1.20 (library PHP untuk menghasilkan grafik)

Web browser Mozilla Firefox 3.0

HASIL DAN PEMBAHASAN Analisis Data

Pada penelitian ini, data diperoleh dengan format Access (.mdb). Proses analisis dilakukan terhadap data untuk mendapatkan atribut-atribut yang tepat untuk membangun data warehouse.

Data yang digunakan adalah data KRS mahasiswa (krs), data KRS mata kuliah (krsmk), dan data mahasiswa (mhs). Ketiga kelompok data tersebut dipilih karena sudah memenuhi beberapa kriteria dari informasi yang ingin ditampilkan. Tabel KRS mahasiswa berisi isian KRS mahasiswa tiap semester sedangkan tabel data KRS mata kuliah berisi perolehan nilai pada mata kuliah yang diambil tiap semester. Pada tabel mahasiswa berisi keterangan dari data mahasiswa yang masuk ke Program Studi S1 Ilmu Komputer. Dari tabel- tabel itu, kemudian dipilih atribut-atribut yang akan digunakan untuk membuat data warehouse.

Atribut yang akan digunakan dipilih berdasarkan ketentuan sebagai berikut:

1 Atribut yang dipilih menarik untuk dianalisis

2 Atribut tersebut berkaitan dengan atribut di tabel data yang lain

3 Data yang dianalisis tidak terlalu banyak mengandung nilai null

Setelah pemilihan atribut, maka langkah selanjutnya adalah menentukan atribut-atribut yang menjadi ukuran (measure) dan non ukuran Gambar 3 Arsitektur aplikasi OLAP

berbasis web (Sumber: diadopsi dari Herlambang 2007).

(non-measure). Hasil analisis data ditentukan dua tabel fakta (MataKuliah_Mutu dan IndexPrestasi) dan enam dimensi (Waktu, Angkatan, JenisKelamin, MataKuliah, Mutu, dan StatusStudi). Fakta terdiri dari foreign key

dari tabel dimensi, ukuran jumlah mahasiswa, rataan IP, dan rataan IPK. Selanjutnya dibuat skema model data multidimensi untuk data warehouse yang dapat dilihat pada Gambar 4.

Integrasi dan Reduksi Data

Proses integrasi diawali dengan mengkonversi seluruh data sumber dengan format Access (.mdb) menjadi format Microsoft SQL server (.mdf). Selanjutnya dilakukan penggabungan atribut-atribut yang menarik dari tabel-tabel yang dianalisis menjadi satu tabel besar untuk dijadikan tabel fakta. Penggabungan yang pertama adalah menggabungkan tabel data KRS mahasiswa (krs) dengan tabel KRS mata kuliah (krsmk) dan tabel mahasiswa (mhs). Penggabungan yang kedua adalah menggabungkan tabel KRS mahasiswa (krs) dengan tabel mahasiswa (mhs). Reduksi data dilakukan dengan membuang atribut-atribut yang tidak terpilih berdasarkan hasil analisis data dan menyeleksi data dengan hanya mengambil mahasiswa Ilmu Komputer. Nilai atribut yang redundan dalam tabel-tabel sumber tidak disertakan dalam proses selanjutnya.

Proses integrasi dan reduksi data membentuk tabel baru, yaitu tabel tempfakta1 dan tempfakta2. Tabel baru tempfakta1 merupakan hasil integrasi dan reduksi dari proses query tabel krs, krsmk, dan mhs.

Sedangkan tabel baru tempfakta2 merupakan hasil integrasi dan reduksi dari proses query

tabel krs dan mhs. Nama dan deskripsi atribut dari tabel-tabel tersebut dapat dilihat pada Tabel 1 dan Tabel 2.

Tabel 1 Nama dan deskripsi atribut tabel tempfakta1 hasil integrasi dan reduksi

Nama Atribut Deskripsi nokrs nomor KRS-tahun

akademik- semester nrp nomor registrasi pokok

mahasiswa sex kode jenis kelamin kodemk kode matakuliah mutu huruf mutu

Tabel 2 Nama dan deskripsi atribut tabel tempfakta2 hasil integrasi dan reduksi

Nama Atribut Deskripsi nokrs Nomor KRS - tahun

akademik - semester nrp nomor registrasi pokok

mahasiswa sex kode jenis kelamin

IP nilai IP

IPK nilai IPK

MataKuliah_Mutu FK1 id_waktu FK2 id_angkt FK3 id_jk FK4 id_mk FK5 id_mutu jml_mhs IndexPrestasi FK1 id_waktu FK2 id_angkt FK3 id_jk FK4 id_status jml_mhs RataanIP RataanIPK MataKuliah PK id_mk namamk kriteria Mutu PK id_mutu kategori_mutu Angkatan PK id_angkt angkatan StatusStudi PK id_status kelasIPK statusstudi JenisKelamin PK id_jk jeniskelamin Waktu PK id_waktu thakademik semester

7

Pembersihan Data

Proses pembersihan data dilakukan dengan mengidentifikasi data yang kosong (null), mengandung noise, dan tidak konsisten karena proses pengentrian data sumber maupun akibat proses integrasi data. Dalam pembersihan data terdapat beberapa nilai yang kosong (null).

Nilai kosong pada atribut IP dan IPK di-update

menjadi nilai rataan. Pada atribut mutu, nilai huruf mutu yang bernilai null di-update menjadi

nilai „BM‟ (Belum Masuk) dan huruf mutu F

dan T di-update menjadi nilai „E‟. Dalam

atribut nokrs dilakukan penghapusan terhadap

nilai atribut nokrs untuk tahun akademik „0708‟,

karena tahun akademik tersebut masih banyak nilai yang belum masuk sehingga bernilai null.

Sedangkan noise pada tabel krsmk dengan atribut nama mata kuliah (namamk) di-update

dengan menyeragamkan nilai dari atributnya. Penyeragaman nilai dilakukan dengan mengambil jumlah yang lebih dominan muncul dari nama tersebut. Hal itu dilakukan untuk menjaga konsistensi data, karena dalam data sumber terdapat satu kode mata kuliah yang mempunyai dua nama mata kuliah yang berbeda. Selain itu pembersihan data terhadap data yang tidak konsisten juga dilakukan pada atribut nokrs. Pada atribut ini dilakukan penghapusan data terhadap nokrs yang tidak sesuai antara kode tahun di nokrs dan di nrp. Misalnya mahasiswa angkatan 2001 dengan nokrs xxx-0102-1, yang berarti bahwa mahasiswa tersebut ada di tahun akademik 2001/2002 semester ganjil, seharusnya setiap angkatan 2001 yang baru masuk IPB hanya mempunyai nokrs TPB yaitu xxx-0102-2.

Setelah dilakukan proses pembersihan, tabel tempfakta1 berkurang 369 tuple menjadi 13308

tuple. Sedangkan pada tabel tempfakta2 berkurang 86 tuple menjadi 1684 tuple.

Transformasi Data

Proses transformasi data meliputi penyeragaman nama atribut, generalisasi, agregasi, dan konstruksi atribut atau dimensi. Proses ini dilakukan dengan berpedoman pada skema data warehouse yang sudah dibuat.

Langkah awal transformasi dilakukan dengan mengubah nama atribut dari tabel hasil pembersihan sesuai dengan nama atribut dimensi yang ada pada skema. Data untuk atribut nokrs dari tabel tempfakta1 digeneralisasi dengan mengubah nilainya menjadi tahun akademik dan semester dengan mengambil enam digit akhir dari nokrs. Atribut nrp dari tabel tempfakta2 digeneralisasi menjadi

kode tahun masuk IPB dengan mengambil 5 digit belakang, kemudian dari digit tersebut diambil 2 digit awal. Misalnya:

nrp=‟G64104008‟  „04008‟  „04‟. Proses

transformasi juga dilakukan dengan mengkonstruksi atribut baru menggunakan data dari atribut yang sudah ada. Data dari atribut IPK digunakan untuk mengkonstruksi atribut status dengan mengelompokkan range nilai IPK tertentu ke dalam status tertentu. Misalnya:

range nilai IPK dari 2,76 - 3,50 memiliki status tanpa syarat. Hasil transformasi dimasukkan ke dalam tabel baru, tabel tempfakta1 menjadi tabel fakta1 dan tabel tempfakta2 menjadi tabel fakta2.

Langkah berikutnya adalah menentukan nilai agregasi atribut-atribut yang menjadi ukuran (measure). Data tabel fakta1 ditentukan nilai agregasinya untuk mendapatkan ukuran jumlah mahasiswa dengan menghitung banyaknya nrp dari mahasiswa dan mengelompokkannya berdasarkan atribut- atribut yang ada. Kemudian membuat atribut baru untuk menampung ukuran jumlah mahasiswa hasil agregasi. Pada data tabel fakta2 dilakukan agregasi untuk mendapatkan ukuran jumlah mahasiswa, rataan nilai IP dan IPK. OLAP server Palo belum mendukung fungsi agregasi rataan. Oleh karena itu nilai agregasi rataan ditentukan dengan menentukan nilai total dari ukuran, kemudian membaginya dengan ukuran jumlah data. Untuk data atribut rataan IP dan IPK dari tabel fakta2 ditentukan nilai totalnya dan dihitung jumlah mahasiswa, dikelompokkan berdasarkan atribut-atribut non- ukuran. Atribut baru dikonstruksi untuk ukuran jumlah mahasiswa. Hasil dari transformasi dengan operasi agregasi ini dipindahkan ke tabel baru yang merupakan tabel fakta data warehouse sesungguhnya. Tabel-tabel fakta tersebut adalah tabel fact_mkmutu yang terdiri dari lima dimensi dan satu ukuran, dan tabel fact_indexprestasi yang terdiri dari empat dimensi dan tiga ukuran.

Tahap transformasi terakhir adalah melakukan konstruksi tabel-tabel dimensi. Keenam tabel dimensi tersebut dibuat dengan nama dim_time, dim_mk, dim_mutu, dim_angktn, dim_jk, dan dim_statusstudy. Tabel dimensi Waktu (dim_time) dibuat dari generalisasi kode nokrs, dimana empat digit awal dari enam digit akhir nokrs diidentifikasi sebagai tahun akademik dan satu digit terakhir dari enam digit akhir nokrs diidentifikasi sebagai semester. Tabel dimensi Angkatan (dim_angktn) dibuat dari generalisasi kode NRP, di dalamnya menjelaskan tahun masuk

mahasiswa ke IPB. Adapun model hierarki dari dimensi-dimensi tersebut dapat dilihat setiap Lampiran 1 dan data dalam tabel dimensi dapat dilihat setiap Lampiran 2.

Pemuatan Data

Data warehouse yang sudah dibuat selesai dibuat, selanjutnya di-load ke kubus data OLAP

server Palo. Kemudian, skema data warehouse

dimodelkan dengan menentukan dimensi- dimensi, elemen-elemen dari dimensi, ukuran- ukuran, dan kubus data. Kubus data yang dibuat yaitu, kubus MataKuliah-Mutu dan kubus IndexPrestasi. Kubus data MataKuliah-Mutu dibuat untuk tabel fakta fact_mkmutu sedangkan kubus data IndexPrestasi dibuat untuk tabel fakta fact_indexprestasi. Ukuran pada struktur Palo dimasukkan dalam struktur dimensi tabel fakta yang tidak mempunyai

id_key. Selanjutnya data dimuat menggunakan fasilitas Data Import dari Excel Add-In Palo. Nama dan deskripsi dari kubus data dapat dilihat pada Tabel 3 dan Tabel 4.

Tabel 3 Nama dan deskripsi dimensi dari kubus MataKuliah-Mutu

Nama Dimensi Deskripsi

Waktu Tahun akademik dan semester

Angkatan Angkatan masuk IPB Jenis Kelamin Jenis kelamin

mahasiswa Mata Kuliah Mata kuliah

Mutu Nilai mutu

Ukuran

Matakuliah_Mutu

Nama-nama ukuran (jumlah mahasiswa)

Tabel 4 Nama dan deskripsi dimensi dari kubus IndexPrestasi

Nama Dimensi Deskripsi Waktu Tahun akademik dan

semester

Angkatan Angkatan masuk IPB Jenis Kelamin Jenis kelamin mahasiswa Status Studi Status studi mahasiswa Ukuran

IndexPrestasi

Nama-nama ukuran (jumlah mahasiswa, rataan IP, rataan IPK)

Aplikasi OLAP yang dibuat menyediakan fasilitas-fasilitas berikut :

1 Menu OLAP, dimana pengguna dapat menentukan kubus data, ukuran, dan dimensi-dimensi yang akan ditampilkan untuk dianalisis.

2 Filter dimensi, fungsi ini menyaring dimensi yang ditampilkan pada sumbu x dan sumbu y untuk menampilkan elemen-elemen tertentu dari dimensi. Dimensi lainnya dapat dipilih satu elemen dari tiap-tiap dimensi. 3 Visualisasi Crosstab dan Graph, dimana

data hasil operasi OLAP yang dilakukan pengguna dapat ditampilkan ke dalam bentuk crosstab dan/atau grafik. Grafik yang ditampilkan berupa bar plot atau line plot. Eksplorasi dan Presentasi Hasil

Ekplorasi data dilakukan dengan menggunakan operasi OLAP untuk menghasilkan beberapa informasi yang diinginkan. Contohnya adalah operasi roll-up

untuk melihat dan menganalisis tren perkembangan indeks prestasi mahasiswa Ilmu Komputer pada setiap angkatan. Proses eksplorasi dan operasi ini menggunakan kubus IndexPrestasi yang mempunyai ukuran jumlah mahasiswa, rataan IP, dan rataan IPK. Untuk melihat nilai rataan IPK tiap angkatan, dapat dilakukan pemilihan dari kelas IPK ke status studi yang diinginkan. Hasil perkembangan rataan IPK tiap angkatan dapat dilihat pada Gambar 5.

Selain operasi roll up, dapat dilakukan operasi drill-down untuk melihat jumlah mahasiswa yang mendapatkan nilai mutu A dari semua mata kuliah pilihan. Hasil operasi tersebut dapat dilihat pada Gambar 6 dalam bentuk grafik garis.

Gambar 5 Crosstab dengan operasi OLAP

roll-up dengan ukuran rataan IPK, dimensi angkatan, dimensi status studi.

9

Operasi yang dapat dilakukan lainnya adalah mencari pola sebaran perkembangan huruf mutu mata kuliah Basis Data dari tahun akademik 2001/2002 sampai 2006/2007. Grafik pada Gambar 7 merupakan hasil operasi slice dengan peserta mata kuliah Basis Data pada semua angkatan dan tahun akademik. Untuk tahun

akademik 2003/2004 dan 2004/2005 nilai mutu mata kuliah tersebut umumnya B. Sedangkan pada tahun akademik 2005/2006 mahasiswa yang mengambil Basis Data lebih banyak mendapatkan nilai mutu C.

Gambar 6 Grafik hasil operasi drill-down dimensi mata kuliah pilihan dengan ukuran jumlah mahasiswa, dimensi angkatan, dan dimensi mutu untuk nilai mutu A.

Gambar 7 Grafik hasil operasi slice dengan ukuran jumlah mahasiswa, dimensi mutu, dimensi waktu, dan dimensi mata kuliah untuk Basis Data.

Selain itu juga dapat dilihat daftar jumlah mahasiswa pada angkatan dan tahun tertentu dengan kelas IPK yang diinginkan dengan operasi dice. Misalkan akan dilihat jumlah mahasiswa angkatan 2003-2004 pada rentang waktu tahun akademik 2001/2002 sampai 2006/2007 dengan kelas IPK lebih dari 3.51. Hasil operasi tersebut dapat dilihat pada Gambar 8.

Dari beberapa contoh eksplorasi yang ditampilkan dalam bentuk grafik, dapat dilihat bentuk kubus data dari operasi OLAP pada Lampiran 3.

KESIMPULAN DAN SARAN Kesimpulan

Pembangunan data warehouse dan OLAP berbasis web data akademik Ilmu Komputer menghasilkan dua kubus data, yaitu kubus data MataKuliah_Mutu dan IndexPrestasi. Kedua kubus data tersebut dapat divisualisasikan dengan tepat, cepat dan akurat dalam tiga jenis tampilan, yaitu tampilan grafik batang, grafik garisdan pie chart dengan menggunakan OLAP Palo 2.0.

Operasi OLAP yang dilakukan pada kubus data ini adalah roll-up (misalnya untuk melihat dan menganalisis tren perkembangan indeks prestasi mahasiswa Ilmu Komputer pada setiap angkatan), drill-down (misalnya untuk melihat jumlah mahasiswa yang mendapatkan nilai mutu A dari semua mata kuliah pilihan), dice

(misalnya untuk melihat jumlah mahasiswa angkatan 2003-2004 pada rentang waktu tahun akademik 2001/2002 sampai 2006/2007 dengan kelas IPK lebih dari 3.51), dan slice

(misalnya untuk mengetahui perkembangan huruf mutu mata kuliah Basis Data).

Hasil dari penelitian ini dapat memberikan manfaat bagi pengguna di Departemen Ilmu Komputer dalam mempermudah analisis data akademik ukuran besar sehingga dapat membantu dalam pengaksesan data tersebut, penyampaian informasi, pembuatan laporan dan pembuatan keputusan yang lebih baik.

Saran

Saran untuk penelitian data warehousing

dan OLAP selanjutnya adalah:

1 Memperbanyak jumlah data, yaitu dengan melibatkan semua data mahasiswa di setiap tahun akademik untuk masing-masing angkatan yang terdapat di Departemen Ilmu Komputer IPB. Data akademik tersebut lebih mencakup pada kurikulum mayor minor.

2 Dibangun modul program untuk pemasukan data baru yang nantinya diintegrasikan ke dalam aplikasi OLAP.

3 Dikembangkan operasi-operasi OLAP dalam aplikasi. Operasi dice dan slice lebih disempurnakan, sehingga setiap sumbudari

crosstab dapat diisi lebih dari dua dimensi. Penambahan operasi pivot untuk memutar sumbu.

4 Diintegrasikan dengan aplikasi pendukung untuk menambahkan link menu yang ketika dipilih, langsung menampilkan visualisasi sesuai perintah menu tersebut.

Gambar 8 Grafik hasil operasi dice dengan ukuran jumlah mahasiswa, dimensi angkatan, dimensi waktu.

10

Selain itu juga dapat dilihat daftar jumlah mahasiswa pada angkatan dan tahun tertentu dengan kelas IPK yang diinginkan dengan operasi dice. Misalkan akan dilihat jumlah mahasiswa angkatan 2003-2004 pada rentang waktu tahun akademik 2001/2002 sampai 2006/2007 dengan kelas IPK lebih dari 3.51. Hasil operasi tersebut dapat dilihat pada Gambar 8.

Dari beberapa contoh eksplorasi yang ditampilkan dalam bentuk grafik, dapat dilihat bentuk kubus data dari operasi OLAP pada Lampiran 3.

KESIMPULAN DAN SARAN Kesimpulan

Pembangunan data warehouse dan OLAP berbasis web data akademik Ilmu Komputer menghasilkan dua kubus data, yaitu kubus data MataKuliah_Mutu dan IndexPrestasi. Kedua kubus data tersebut dapat divisualisasikan dengan tepat, cepat dan akurat dalam tiga jenis tampilan, yaitu tampilan grafik batang, grafik garisdan pie chart dengan menggunakan OLAP Palo 2.0.

Operasi OLAP yang dilakukan pada kubus data ini adalah roll-up (misalnya untuk melihat dan menganalisis tren perkembangan indeks prestasi mahasiswa Ilmu Komputer pada setiap angkatan), drill-down (misalnya untuk melihat jumlah mahasiswa yang mendapatkan nilai mutu A dari semua mata kuliah pilihan), dice

(misalnya untuk melihat jumlah mahasiswa angkatan 2003-2004 pada rentang waktu tahun akademik 2001/2002 sampai 2006/2007 dengan kelas IPK lebih dari 3.51), dan slice

(misalnya untuk mengetahui perkembangan huruf mutu mata kuliah Basis Data).

Hasil dari penelitian ini dapat memberikan manfaat bagi pengguna di Departemen Ilmu Komputer dalam mempermudah analisis data akademik ukuran besar sehingga dapat membantu dalam pengaksesan data tersebut, penyampaian informasi, pembuatan laporan dan pembuatan keputusan yang lebih baik.

Saran

Saran untuk penelitian data warehousing

dan OLAP selanjutnya adalah:

1 Memperbanyak jumlah data, yaitu dengan melibatkan semua data mahasiswa di setiap tahun akademik untuk masing-masing angkatan yang terdapat di Departemen Ilmu Komputer IPB. Data akademik tersebut lebih mencakup pada kurikulum mayor minor.

2 Dibangun modul program untuk pemasukan data baru yang nantinya diintegrasikan ke dalam aplikasi OLAP.

3 Dikembangkan operasi-operasi OLAP dalam aplikasi. Operasi dice dan slice lebih disempurnakan, sehingga setiap sumbudari

crosstab dapat diisi lebih dari dua dimensi. Penambahan operasi pivot untuk memutar sumbu.

4 Diintegrasikan dengan aplikasi pendukung untuk menambahkan link menu yang ketika dipilih, langsung menampilkan visualisasi sesuai perintah menu tersebut.

Gambar 8 Grafik hasil operasi dice dengan ukuran jumlah mahasiswa, dimensi angkatan, dimensi waktu.

Dokumen terkait