PENGEMBANGAN
DATA WAREHOUSE
DAN OLAPUNTUK
METADATA PENELITIAN INSTITUT PERTANIAN BOGOR
WIWIEK DEWI ANGGRAENI
DEPARTEMEN ILMU KOMPUTER
FAKULTASMATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
PENGEMBANGAN
DATA WAREHOUSE
DAN OLAPUNTUK
METADATA PENELITIAN INSTITUT PERTANIAN BOGOR
WIWIEK DEWI ANGGRAENI
Skripsi
sebagai salah satu syarat untuk memperoleh gelar
Sarjana Komputer pada
Departemen Ilmu Komputer
DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
ABSTRACT
WIWIEK DEWI ANGGRAENI. Development of Data Warehouse and Olap for Metadata Research in Bogor Agricultural University. Supervised by FIRMAN ARDIANSYAH.
Data warehouse is a subject oriented, integrated, time variant, and nonvolatile collection of data used in strategic decision making. Bogor Agricultural University library has metadata. The activity of searching and browsing in the library Bogor Agricultural University can be based on metadata fields, such as title, author, faculty, department, subject, year, and keyword. This research develops a data warehouse and web-based OLAP (Online Analytical Processing) for undergraduate theses, master theses, disertations, and journal articles. Data warehouse and OLAP are part of Business Intelligence. Document corpus contains 65026 research metadata, 51389 undergraduate theses, 11260 master theses, 2377disertations, and 2000 journal articles from 1958 to 2011. The metadata are represented in a multidimensional model using galaxy scheme that consists of four data cube, with five dimension tables, i.e., faculty, department, time, lecturer, subject, and number of research. The result provides information that can be visualized into various types of graphic models, such as bar graphs, line graphs, and pie charts using Microsoft Sharepoint 2010. This application can be used to analyze undergraduate and graduate research as well as to provide a decision making support for research management in Bogor Agricultural University.
Judul Skripsi : PengembanganData Warehouse dan OLAP untuk Metadata Penelitian Institut Pertanian Bogor
Nama : Wiwiek Dewi Anggraeni NIM : G64070048
Menyetujui : Dosen Pembimbing,
Firman Ardiansyah, S. Kom, M. Si. NIP 19790522 200501 1 003
Mengetahui Ketua Departemen,
Dr. Ir. Agus Buono, M. Si, M. Kom NIP 19660702 199302 1 001
PRAKATA
Puji dan syukur penulis panjatkan kepada Allah Subhanahu Wata’alayang telah memberikan rahmat dan hidayah-Nya sehingga penulis dapat menyelesaikan tugas akhir dengan judul PengembanganData Warehouse dan OLAP untuk Metadata Penelitian Institut Pertanian Bogor. Sholawat serta salam selalu tercurah kepada Nabi Muhammad Shallalahu ‘Alahi Wassallam, keluarga, para sahabat, dan para pengikutnya.
Banyak orang yang berjasa dalam proses pembuatan skripsi ini. Terima kasih pertama penulis ucapkan kepada kedua orang tua atas semua cinta, kasih sayang, dan pengorbanan yang selalu diberikan tulus untuk penulis.Semoga karya sederhana ini dapat menjadi pemberat pahala serta timbangan amal kebaikan Papa dan Mama di akhirat nanti. Kepada dosen terbaik Bapak Firman Ardiansyah, S.Kom, M.Si selaku pembimbing yang telah memberikan saran, ide, inspirasi, keteladanan, bimbingan, dan nasihat kepada penulis dalam menyusun skripsi ini. Tak lupa kepada Bapak Toto Haryanto, S.Kom, M.Sidan Bapak Hari Agung Adrianto, S.Kom, M.Si sebagai penguji yang telah memberikan banyak kritik dan saran. Penulis juga mengucapkan terima kasih kepada:
1 Dekan Fakultas Matematika dan Ilmu Pengetahuan Alam, Ibu Dr. Ir Sri Nurdiati, M.Sc, terima kasih telah banyak membimbing selama 3 tahun dan mengajarkan banyak ilmu baik itu ilmu dunia maupun akhirat. Ibu adalah motivator terhebat yang pernah penulis kenal.
2 Kepala Perpustakaan Pusat IPB yang telah mengizinkan penulis untuk mengambil data penelitian IPB berupa skripsi, tesis, dan disertasi.
3 Sekretaris Perpustakaan IPB, Bapak Setyo Edy Susanto, S.Th.I. yang telah memberikan data lengkap sampai tahun 2011 untuk keperluan tambahan sistem yang dibuat penulis.
4 Bapak Ir. Abdul Rahman Saleh, M.Sc yang telah memberikan data yang penulis perlukan.
5 Seluruh staf pengajar yang telah membagikan ilmunya selama penulis menuntut ilmu di Departemen Ilmu Komputer dan juga terima kasih kepada seluruh staf administrasi dan staf perpustakaan atas bantuannya dalam melayani kebutuhan administrasi dan kepustakaan.
6 Rekan-rekan Ilkomerz 44 yang telah membagi ilmunya, mendoakan dan selalu memberi semangat kepada penulis.
7 Ikmal Saputra, terima kasih karena setiap saat selalu memberi dukungan, semangat, nasihat, dan doa dengan ikhlas agar penulis segera lulus dan mendapat gelar Sarjana Komputer.
8 Sahabat-sahabat Wisma Melati yang telah memberikan semangat ketika penulis jenuh dan bantuan ketika penulis sedang sakit.
9 Wa zul sekeluarga, Wa Oding sekeluarga, Wa Lili sekeluarga, Mang Nunu sekeluarga atas doa, dukungan, dan pengorbanannya selama penulis mengerjakan tugas akhir ini.
10 Teman-teman SMAN 1 Sindang Indramayu Kelas Standar Internasional yang selalu memberi motivasi dan membantu penulis dengan ikhlas.
11 Data Warehouse forum, OLAP forum, Business Intelligenceforum dan rekan-rekan dunia maya lainnya yang telah membantu serta mendukung penulis.
Terakhir terima kasih kepada semua pihak lainnya yang tidak dapat disebutkan satu per satu yang telah membantu penulis selama pengerjaan tugas akhir ini.Semoga Allah Subhanahu Wata’ala senantiasa membalas segala amal kebaikan kalian dengan balasan-Nya yang terbaik dan semoga hasil dari tugas akhir ini dapat memberikan manfaat.Jazakumullah khairan katsiran.
Bogor, November 2011
RIWAYATHIDUP
Wiwiek Dewi Anggraeni lahir di Bandung pada tanggal 13 Juni 1989 sebagai anak pertama dari dua bersaudara dengan ayah bernama Yusirwan dan Ibu bernama Nani Tresnaningsih.
Pada tahun 2007,penulis lulus dari Sekolah Menengah Atas SMA Negeri 1 Sindang dan diterima di Institut Pertanian Bogor melalui jalur USMI atau Undangan Seleksi Masuk IPB. Pada tahun 2008, penulis diterima di Departemen Ilmu Komputer, Institut Pertanian Bogor.Penulis aktif mengikuti berbagai kegiatan akademik maupun non akademik.Pada tahun 2010, penulis melaksanakan kegiatan praktik kerja lapangan di Pertamina UP VI Balongan Indramayu selama tujuh minggu.Pada tahun 2009-2011, penulis terpilih menjadi asisten Praktikum Basis Data, Metode Kuantitatif dan Penerapan Komputer.Pada tahun 2011, penulis bekerja selama 3 bulan di DKSI (Direktorat Komunikasi dan Informasi) untuk membuat website KMS (Knowledge Management System).Organisasi yang pernah diikuti adalah Omda Ikada, Kopma, dan Himalkom. Penulis pernahmenjadi Master of ceremony acara kampus yaitu pada saat wisuda departemen Ilmu Komputer IPB, temu bareng wong dermayu, halal bihalal, dan up grading Omda Ikada.
DAFTAR ISI
Halaman
DAFTAR GAMBAR ... vi
DAFTAR TABEL ... vi
DAFTAR LAMPIRAN ... vi
PENDAHULUAN Latar Belakang ... 1
Tujuan ... 1
Ruang Lingkup ... 1
Manfaat Penelitian ... 1
TINJAUAN PUSTAKA Metadata ... 2
CDS/ISIS (Computerised Documentation Service / Integrated Set Information Systems) ... 2
INDOMARC ... 2
Data Warehouse ... 2
Model Data Multidimensi ... 2
METODE PENELITIAN Analisis ... 3
Desain Konseptual ... 3
Desain Logikal ... 3
Desain Fisik ... 3
Ekstraksi Data ... 4
Transformasi Data ... 4
Pemuatan Data ... 4
Implementasi Business Intelligence ... 4
Uji Query ... 5
HASIL DAN PEMBAHASAN Analisis ... 6
Desain Konseptual ... 6
Desain Logikal ... 6
Desain Fisik ... 6
Ekstraksi Data ... 7
Transformasi Data ... 7
Pemuatan Data ... 7
Implementasi Business Intelligence ... 7
Uji Query ... 9
Gambaran Umum Aplikasi ... 9
Kelebihan dan kekurangan ... 9
Eksplorasi dan Presentasi Hasil ... 10
KESIMPULAN DAN SARAN Kesimpulan ... 11
Saran ... 11
LAMPIRAN ... 12
DAFTAR GAMBAR
Halaman
1 Skema galaksi (Han and Kamber 2006) ... 2
2 Diagram alir metode penelitian ... 3
3 Skema galaksi dengan empat tabel fakta dan lima tabel dimensi ... 6
4 Hirarki penelitian berdasarkan jenis penelitian. ... 6
5 Hirarki penelitian berdasarkan dimensi fakultas dan departemen ... 6
6 Hirarki penelitian berdasarkan dimensi tahun penelitian... 7
7 Hirarki penelitian berdasarkan dimensi jenjang pendidikan ... 7
8 Hirarki penelitian berdasarkan dimensi dosen. ... 7
9 Hirarki penelitian berdasarkan dimensi subjek ... 7
10Format ekspor XML ... 7
11Data yang mengandung nilai null ... 7
12Data yang mengandung nilai null yang sudah diisi dengan nilai subjek. ... 8
13Hasil pembersihan data penelitian ... 8
14Grafik garis skripsi sejak tahun 1958 sampai dengan 2011 ... 8
15Grafik batang skripsi berdasarkan dimensi tahun, fakultas, dan departemen ... 10
16Grafik batang jumlah skripsi berdasarkan dimensi tahun, fakultas, departemen, dan dosen. ... 10
17Grafik batang jumlah skripsi berdasarkan dimensi tahun, fakultas, departemen, dan subjek ... 10
DAFTAR TABEL
Halaman 1 Atribut pada data penelitian ... 52 Atribut hasil reduksi ... 5
3 Atribut yang digunakan ... 5
4 Dimensi pada data penelitian... 6
5 Atribut tabel fakta penelitian ... 6
6 Desain fisik tabel fakta penelitian ... 6
7 Atribut yang direduksi pada data penelitian ... 8
8 Hasil pengujian query... 9
DAFTAR LAMPIRAN
Halaman 1 Keterangan nomor tag MARC pada metadata tesis ... 132 Data tabel dimensi ... 14
3 Data tabel fakta ... 14
4 Data tabel jumlah penelitian ... 23
5 Desain logikal skema galaksi dengan empat tabel fakta... 26
6 Model hirarki dimensi ... 27
7 Hasil pengujian ... 30
PENDAHULUAN
Latar Belakang
Institut Pertanian Bogor (IPB) terdiri atas 9 Fakultas yaitu Pertanian, Kedokteran Hewan, Perikanan, Peternakan, Kehutanan, Teknologi Pertanian, Matematika dan Ilmu Pengetahuan Alam, Ekonomi dan Manajemen, Serta Ekologi Manusia. Program Sarjana terdiri atas 34 departemen, sedangkan Sekolah Pascasarjana terdiri atas 65 program mayor untuk program magister dan 43 mayor untuk program doktor. IPB memiliki visi “Menjadi perguruan tinggi bertaraf internasional dalam pengembangan IPTEKS dan sumberdaya manusia dengan kompetisi utama pertanian tropika.”IPB berusaha menghasilkan lulusan yang berkualitas dan mampu mengembangkan serta menerapkan IPTEKS sesuai dengan kebutuhan masyarakat masa kini serta mendatang. Hal ini bertujuan mendukung pembangunan nasional dan memperbaiki kesejahteraan umat manusia. Lulusan IPB yang kompeten dan berkualitas salah satunya dapat dilihat dari hasil penelitian atau tugas akhir yang telah ditempuhnya. Semakin banyak hasil penelitian IPB berbasis IPTEKS yang dapat dimanfaatkan, dikembangkan, dan diterapkan baik secara nasional maupun global maka akandapat terwujud visi IPB tersebut.
Salah satu cara mewujudkan visi tersebut dapat dilakukan penelitian mengenai Business Intelligence dengan menggunakan metadata hasil penelitian IPB untuk mengetahui pengembangan IPTEKS di IPB. Data Penelitian IPB dapatberupa skripsi, tesis, disertasi, dan jurnal ilmiah dari tahun 1958 sampai 2011.Data ini terdapat di perpustakaan pusat, perpustakaan tiap fakultas, perpustakaan tiap departemen, LPPM, RKS, dan pusat-pusat penelitian.Data tersimpan dalam bentuk metadata.Field yang terdapat dalam metadata adalah judul, penulis, subjek, kata kunci, departemen, fakultas, dosen pembimbing, dan tahun.Track record dan trendpenelitian IPB dapat dianalisis dari data tersebut.
Dari waktu ke waktu jumlah dokumen penelitian IPB selalu bertambah sehingga terjadi penumpukan data.Hal ini tidak menjadi masalah apabila dilihat dari sisi perangkat keras karena telah tersedia media penyimpanan data yang dapat menampung kapasitas data yang sangat besar.Namun saat ini terdapat tuntutan untuk menyajikan informasi yang akurat, cepat, dan menarik agar data tersebut dapat bermanfaat bagi pengguna.Business Intelligence merupakan salah satu solusi dari permasalahan penumpukan data.Business Intelligence adalah kegiatan untuk mengumpulkan dan menganalisis data sehingga dapat digunakan untuk memprediksi trend,
menentukan target, mengambil keputusan untuk para pengambil keputusan serta mengukur hasil dari setiap keputusan yang ada terhadap faktor pendukung eksternal maupun internal.Teknologi ini dapat mengolah data dan menampilkan informasi yang dibutuhkan untuk mengambil keputusan berdasarkan data historis yang ada.
Business Intelligence mencakup proses pembuatan Data warehouse dan OLAP (Online Analytical Processing). Proses pembuatan data
warehouse dilakukan dengancara
mengumpulkan, menyimpan, dan menyediakan data untuk aplikasi OLAP server yang bersifat query dan reporting. OLAP dapat membantu pengguna dalam menganalisis data pada sebuah data warehouse dengan menyediakan berbagai tampilan data grafik yang dinamis untuk mengetahui jumlah penelitian yang telah dilakukan oleh peneliti dari tahun ke tahun, fakultas dan departemen yang banyak meneliti, presentase subjek yang paling diminati untuk diteliti.Hasil dari penelitian ini diharapkan dapat memberikan manfaat bagi pengguna dalam mempermudah analisis data penelitian IPB sehingga dapat membantu pengaksesan data, penyampaian informasi, pembuatan laporan dan keputusan yang lebih baik.
Tujuan
Penelitian ini bertujuan membangun data warehousedan aplikasi online analytical processing dengan menggunakan Microsoft Business Intelligence berbasis web untuk menampilkan tren penelitian IPB berupa skripsi, tesis, disertasi, dan jurnal ilmiah.
Ruang Lingkup
Ruang lingkup penelitian ini adalah :
1 Data yang digunakan dalam penelitian ini berupa skripsi, tesis, disertasi, dan jurnal ilmiah tahun 1958-2011 yang terdapat di perpustakaan pusat IPB.
2 Pembuatan Data Warehouse dan aplikasi OLAP berbasis web. Tahapan yang akan dilakukan adalah pengumpulan, penyimpanan, pembersihan, integrasi, transformasi, penggabungan, dan peringkasan data.
3 Microsoft SQL Server 2008 R2 dan SharePoint Server 2010 adalah tools yang digunakan dalam penelitian ini.
Manfaat Penelitian
diharapkan dapat memberikan manfaat kepada pihak terkait di lingkungan IPB, seperti perpustakaan pusat, perpustakaan tiap fakultas, perpustakaan tiap departemen, LPPM, RKS, dan pusat-pusat penelitian dalam memberikan dan menyajikan analisis data secara cepat, interaktif, mudah dimengerti, dan menarik.
TINJAUAN PUSTAKA
Metadata
Metadata adalah informasi terstruktur yang menjelaskan, mengGambarkan, menempatkan sumber informasi yang membuat kemudahan dalam proses temu kembali, penggunaan, dan manajemen(NISO 2004).Di dalam lingkungan perpustakaan, metadata biasa digunakan untuk skema formal dari deskripsi sumber, menerapkan ke berbagai tipe objek, digital atau bukan digital.
CDS/ISIS (Computerised Documentation Service / Integrated Set Information Systems)
CDS/ISIS adalah sistem temu kembali dan penyimpanan informasi yang didesain secara spesifik untuk manajemen terkomputerisasi dari database non-numerik yang terstruktur.Salah satu keuntungan yang ditawarkan oleh sistem desain penyamarataan adalah CDS/ISIS dapat memanipulasi sejumlah database secara tak terbatas di mana setiap database dapat memiliki elemen-elemen yang berbeda (UNESCO 2004).
INDOMARC
Format INDOMARC merupakan implementasi dari International Standar Organization (ISO)Format ISO 2709 untuk Indonesia, sebuah format untuk tukar menukar informasi bibliografis melalui pita magnetik (magnetic tape), cakram padat (compact disc), atau media terbacakan mesin (machine-readable) lainnya.Informasi bibliografis secara umum mencakup pengarang, judul, subjek, catatan, data penerbitan, dan deskripsi fisik (PNRI 2005).
Data Warehouse
Data warehouse adalah sekumpulan data yang berorientasi subjek, terintegrasi, time-variant dan nonvolatile yang mendukung dalam manajemen pengambilan keputusan. Data warehouse menyediakan arsitektur dan alat bagi para eksekutif bisnis untuk mengatur secara sistematis, mengerti dan menggunakan data tersebut untuk pengambilan keputusan. Penjelasan secara rinci dari pengertian data warehouse (Han & Kamber 2006) :
Model Data Multidimensi
Model data multidimensi terdiri atas satu atau lebih tabel dimensi dan tabel fakta. Dimensi adalah perspektif atau entitas yang digunakan sebagai tempat menyimpan beberapa record yang saling berhubungan. Setiap dimensi memiliki tabel yang biasa disebut dengan tabel dimensi.Tabel dimensi dapat dispesifikasikan oleh pengguna atau para ahli, atau dihasilkan secara otomatis dan diatur berdasarkan distribusi data.Fakta adalah ukuran-ukuran numerik. Fakta merupakan kuantitas yang akan dianalisis hubungan antar dimensinya. Tabel fakta berisi nama dari fakta (ukuran) dan juga keys untuk setiap tabel dimensi yang berhubungan. Dalam data warehouse kubus data adalah n-dimensi. Kubus data disebut juga cuboid.Cuboid yang tingkat kesimpulannya paling rendah disebut base cuboid sedangkan cuboid dengan tingkat paling tinggi disebut apex cuboid.Data warehouse membutuhkan skema yang ringkas dan berorientasi subjek untuk memfasilitasi analisis data secara online. Tipe-tipe skema model multidimensional adalah star schema, snowflake schema, dan galaxy schema. Star schema merupakan skema data warehouse yang paling sederhana, terdiri atas satu tabel fakta yang dihubungkan dengan beberapa tabel dimensi yang polanya menyerupai bintang. Keuntungan star schema yaitu pada proses query dan waktu respons yang cepat. Snowflake schema merupakan variasi dari star schema dimana beberapa tabel dimensinya dinormalisasikan sehingga menghasilkan beberapa tabel tambahan. Keuntungan snowflake schema yaitu tabel dimensi dapat dijaga tetap dalam bentuk normal sehingga mengurangi redudancy.Penelitian ini menggunakan galaxy schema karena membutuhkan tabel fakta yang banyak untuk berbagi dengan tabel dimensi.Galaxy schema dapat dilihat Pada Gambar 1 (Han & Kamber 2006).
METODE PENELITIAN
Tahapan yang dilakukan pada penelitian ini dapat dilihat Pada Gambar 2.
Gambar 2 Diagram alir metode penelitian.
Analisis
Data penelitian terdapat di perpustakaan pusat, perpustakaan tiap fakultas, perpustakaan tiap departemen, LPPM, RKS, dan pusat-pusat penelitian.Data tersebut berupa skripsi, tesis, disertasi, dan jurnal yang telah diperoleh selanjutnya dianalisis untuk mendapatkan spesifikasi kebutuhan yang sesuai dengan keinginan pengguna. Spesifikasi kebutuhan ini akan menghasilkan desain konseptual, desain logikal, dan desain fisik. Desain tersebut digunakan untuk menentukan atribut, dimensi, fakta, dan skema untuk model data multidimensi dalam pembuatan data warehouse.Pengguna
sistem adalah administrator dan staf.Administrator memiliki akses ke dalam database dan antarmuka. Staf memiliki akses antarmuka dengan fasilitas dapat memilih dimensi drop-down list, menampilkan data dalam bentuk drill up,drill down, dan grafik.
Desain Konseptual
Pada tahapan inidilakukan desain skema dalam pembuatan data warehouse, analisis measure dan dimensi yang akan digunakan. Penelitian ini menggunakan galaxy schema.Terdapat empat tabel fakta yaitu skripsi, tesis, disertasi, dan jurnal IPB. Selain itu terdapat lima dimensi yaitu fakultas, departemen, dosen pembimbing, tahun dan subjek. Dalam tabel fakta terdiri atasforeign key dari tabel dimensi, danukuran jumlah penelitian.
Desain Logikal
Pada tahapan inidilakukan perancangan database dengan membuat relasi-relasi data dan menentukan hubungan satu atribut dangan atribut lainnya. Penyimpanan data pada database dengan penyimpanan multidimensional.
Desain Fisik
Pada tahapan ini menjelaskan kubus data yang sudah siap digunakan dalam data warehouse.Kubus data yang dibuat yaitu kubus skripsi, kubus tesis, kubus disertasi, dan kubus jurnal. Terdapat lima dimensi yaitu fakultas, departemen, dosen pembimbing, tahun, dan subjek. Jumlah skripsi, jumlah tesis, jumlah disertasi, dan jumlah jurnal merupakan ukuran. Skema sudah dapat diimplementasikan ke dalam data warehouse yang akan dibangun.
Ektraksi Data
Data yang digunakan seringkali bersifat noisy (data tidak jelas atau rusak), incomplete (data kekurangan nilai atribut atau hanya berisi agregasi), dan inconsistent (data tidak konsisten).Ekstraksi data dilakukan untuk ketepatan dan kesesuaian data terjaga.Proses ekstraksi mencakup integrasi, reduksi, dan pembersihan data.Reduksi dilakukan bersamaan dengan proses integrasi dengan membuang atribut-atribut yang tidak diperlukan dari tabel yang dianalisis. Setelah itu mengisi data yang hilang, mengatasi data yang kotor dan rusak, mengidentifikasi atau membuang data pencilan serta memperbaiki data yang tidak konsisten. Perpustakaan IPB menggunakan CDS/ISIS untuk menyimpan data penelitian. Hasil ekspor data penelitian dalam format XML. Sebelum diimpor ke Microsoft SQL Server 2008, atribut-atribut data yang relevan dipilih menggunakan bantuan Microsoft Excel.Pemilihan atribut ini berdasarkan tujuan pembuatan data warehouse.Dari 15 atribut Mulai
Analisis Data
Uji Query Ekstraksi Data
Transformasi Data
Pemuatan Data
yang ada pada data penelitian direduksi menjadi 8 atribut saja.
Transformasi Data
Proses transformasi dilakukan agar kondisi data tetap konsisten dan dapat digunakan untuk proses selanjutnya.Data dari semua sumber dikonversi ke dalam format yang umum sesuai dengan skema multidimensional yang telah dibuat.
Pemuatan Data
Pada tahap ini, data telah siap untuk dimuat (load) ke dalam data warehouse, bertujuan memuat data yang terseleksi dan membuat indeks yang diperlukan.
Data Warehouse
Data warehouse adalah sekumpulan data yang berorientasi subjek, terintegrasi, time-variant dan nonvolatile yang mendukung dalam manajemen pengambilan keputusan. Data warehouse menyediakan arsitektur dan alat bagi para eksekutif bisnis untuk mengatur secara sistematis, mengerti dan menggunakan data tersebut untuk pengambilan keputusan. Microsoft SQL Server 2008 merupakan platform untuk melakukan datawarehouse (Noviandi 2010).Arsitektur data warehouse yang umum digunakan adalah arsitektur three-tier. Arsitektur ini disebut three-tier karena terdiri atas tiga lapisan.Lapisan-lapisan arsitektur three-tier adalah sebagai berikut (Han & Kamber 2006) :
1 Lapisan Bawah (Bottom Tier)
Lapisan bawah merupakan tempat pengolahan sumber data warehouse yang bertujuan agar data tersebut dapat digunakan dengan baik. Pengolahan tersebut biasanya menggunakan sistem basis data relasional.Pada lapisan ini data diambil dari basis data operasional dan sumber eksternal lainnya, diekstrak, dibersihkan, ditransformasi, dan disimpan sebagai data warehouse.Sistem basisdata relasional (SQL Server 2008 R2) yang berfungsi sebagai tempat pengolahan data. 2 Lapisan Tengah (Middle Tier)
Lapisan tengah merupakan OLAP Server yang berfungsi menyimpan struktur dari kubus data.Dalam penelitian ini, digunakan Microsoft Business Intelligence (BI) sebagai OLAP server.Microsoft SQL Server 2008 R2 merupakan salah satu platform untuk melakukan data warehouse maupun data mart. Perbedaan data warehouse dan data mart memiliki batasan yang sangat tipis, namun perbedaan ini tidak perlu dikhawatirkan karena secara subtansi tujuan dari pembuatannya memiliki kesamaan (Noviandi 2010). Konsep data warehouse sudah dikenal sebagai platform yang
fundamental dari setiap solusi BI yang dikembangkan. Keberhasilan dalam merancang dan memasukkan data ke dalam data warehouse akan sangat berpengaruh terhadap berhasil atau tidaknya solusi BI yang dikembangkan dalam sebuah organisasi (Noviandi 2010).
3 Lapisan Atas (Top Tier)
Lapisan atas merupakan lapisan untuk end user yang berisi query dan menampilkan informasi atau perangkat analisis dan data mining (seperti: analisis tren, prediksi, dan lainnya) serta ringkasan dari isi data warehouse yang merupakan hasil dari operasi OLAP (SharePoint 2010). OLAP (Online Analitycal Processing)terdiri atas seperangkat tool untuk membantu proses analisis dan perbandingan data dalam basis data. Tool dan metode OLAP membantu pengguna menganalisis data pada sebuah data warehouse dengan menyediakan berbagai tampilan data, dan didukung dengan representasi data grafik yang dinamis (Han &Kamber 2006).
Implementasi Business Intelligence
Business Inteligence (BI) adalah kegiatan untuk mengumpulkan dan menganalisis data sehingga dapat digunakan untuk memprediksi trend, menentukan target, mengambil keputusan untuk para pengambil keputusan serta mengukur hasil dari setiap keputusan yang ada terhadap faktor pendukung eksternal maupun internal. BI diperlukan jika database disimpan dalam platform yang berbeda-beda (misalnya : SQL Server, Oracle, My SQL), akan menjadi sulit ketika menganalisis data dan jika akan melihat trend dari waktu ke waktu. Microsoft menyediakan alat yang dibutuhkan untuk mengelola dan menggunakan solusi BI. Microsoft SQL Server 2008 merupakan platform untuk melakukan datawarehouse (Noviandi 2010).
Ada 3 komponen penting yang diperlukan untuk membangun sebuah solusi BI dalam Microsoft BI Framework, 3 komponen ini adalah:
1 Proses ETL (extract, transform dan load) menggunakan data penelitian IPB berupa skripsi, tesis, disertasi, dan jurnal dari tahun 1958 sampai 2011 untuk keperluan ini Microsoft menyediakan SQL Server Integration Services yang memiliki kemampuan untuk melakukan proses ETL terhadap data yang ada.
3 Proses reporting yang digunakan sebagai representasi hasil analisis data yang sudah dilakukan yang dapat dibuat denganmenggunakan Tools SQL Server Reporting Services.
End-User dapat mempublikasikan solusi data melalui SharePoint 2010 untuk mengelola versi secara efektif, akses pengguna, pemanfaatan sumber daya yang ada, dan membantu ketersediaan data dan solusi secara konsisten.
Uji Query
Pada tahap ini dilakukan pengujian untuk melihat apakah operasi dasar OLAP berhasil diimplementasikan dan sesuai dengan informasi yang ditampilkan.Pengujian dilakukan dengan memvisualisasikan kubus data dengan grafik dan tabel pivot.
Lingkungan Pengembangan Sistem
Spesifikasi beberapa perangkat lunak dan perangkat keras yang digunakan dalam penelitian ini adalah sebagai berikut:
1 Perangkat Lunak :
• Windows 7 Ultimate 64 bit • Windows Server R2
• Windows Identify Foundation • Visual Studio
• Microsoft SQL Server 2008 • Microsoft SharePoint 2010 • Microsoft Filter Pack 2.0 • Microsoft Charts Controls
• Internet Information Services (IIS) • Notepad++
• Microsoft Visio, Excel, dan Powerpoint • Web Browser Internet Explorer
2 Perangkat Keras :
• Intel Core 2 Duo Processor 2.26GHz • Memori 256MB DDR3 SDRAM • Monitor resolusi 1280 x 800 pixels • Mouse dan keyboard
HASIL DAN PEMBAHASAN
Analisis
Penelitian ini menggunakan metadata penelitian IPB dengan jumlah data yaitu 51389 skripsi, 11260 tesis, 2377 disertasi, dan 2000 jurnal ilmiah dari tahun 1958-2011. Metadata terdapat dalam CDS/ISIS milik Perpustakaan Pusat IPB. Nama-nama field yang digunakan pada metadata mengikuti format INDOMARC dan setiap field memiliki nomor tag tersendiri. Contoh field yang terdapat pada metadata skripsi, tesis, disertasi, dan jurnal IPB dapat dilihat di Tabel 1.
Tabel 1 Atribut pada data penelitian.
Nomor Tag Field Metadata
999 No. Registrasi 985 Jumlah Eksemplar 998 Jenis Karya [D/T]
980 008/005 Tanggal Registrasi 981 Tanggal Input Pengolahan 35 No. Kendali Setempat
80 Nomor UDC
99 Nomor Panggil
100 Pengarang Utama
245 Judul
260(a,b,c) Impresum 300 Deskripsi Fisik 502 Catatan Karya (T/D)
650 Subjek
710(a,b,c) Badan Korporasi 712 Program Studi
759 Nama Pembimbing
695 Kata Kunci
986 Kode Operator
Atribut yang telah direduksi dapat dilihat pada Tabel 2.
Tabel 2 Atribut hasil reduksi
Nomor Tag Field Metadata
260(a,b,c) Impresum
650 Subjek
710(a,b,c) Badan Korporasi 759 Nama Pembimbing
Atribut yang akan digunakan pada Tabel 3 adalah sebagai berikut:
1 Atribut yang dipilih adalah atribut yang berkaitan dengan data penelitian secara spesifik untuk dianalisis
2 Atribut yang dapat direlasikan dengan atribut (foreign key)
3 Data tidak mengandung nilai null >50 % record.
Tabel 3 Atribut yang digunakan
Nomor Tag Field Metadata
260_c Tahun 759 Dosen Pembimbing
Spesifikasi kebutuhan yang ditentukan adalah sebagai berikut:
1 Tren jumlah penelitian setiap tahun
2 Tren jumlah penelitian berdasarkan fakultas setiap tahun
3 Tren jumlah penelitian berdasarkan departemen setiap tahun
5 Tren jumlah penelitian berdasarkan subjek setiap tahun
6 Tren jumlah penelitian berdasarkan jenjang pendidikan setiap tahun
7 Tren jumlah penelitian berdasarkan fakultas, departemen, dosen, subjek, dan tahun.
Desain Konseptual
Desain konseptual diawali dengan memilih atribut-atribut yang bisa dijadikan sebagai measure dan dimensi.Dimensi yang terbentuk adalah dimensi tahun, dimensi departemen, dimensi fakultas, dimensi dosen, dimensi subjek, dimensi tahun, dan dimensi strata.Atribut pada tabel-tabel fakta terdiri atas foreign key dari dimensi-dimensi dan measure.Desain konseptual dapat dilihat pada Tabel 4.
Tabel 4 Dimensi pada data penelitian
Desain Logikal
Pada desain logikal, terdapat empat tabel fakta yaitu skripsi, tesis, disertasi, dan jurnal IPB. Tabel fakta memiliki lima atribut yaitu tahun, fakultas, departemen, dosen pembimbing, dan subjek. Desain Logikal dapat dilihat pada Tabel 5.
Tabel 5 Atribut tabel fakta penelitian
Desain Fisik
Desain fisik dan atribut pada tabel fakta penelitian dapat dilihat pada Tabel 6.Penelitian ini menggunakan skema galaksi karena tabel fakta yang dihasilkan ada empat yaitu skripsi, tesis, disertasi, dan jurnal.Skema Galaksi dapat dilihat Pada Gambar 3.
Tabel 6 Desain fisik tabel fakta penelitian
Gambar 3 Skema galaksi dengan 4 tabel fakta dan 5 dimensi.
Dari dimensi pada fakta yang ada, terbentuk struktur hirarki.Hirarki adalah satu bagian dimensi.Dimensi merupakan hirarki berupa jenjang atau tingkatan dari dimensi tersebut.Dengan adanya hirarki tersebut, dimensi dapat menunjukkan tingkatannya (Han & Kamber 2006). Beberapa hirarki yang terbentuk ialah: •hirarki fakultas
•hirarki departemen • hirarki tahun • hirarki dosen • hirarki subjek
Hirarki jenis penelitian adalah hirarki dari jenis penelitian yang dilakukan oleh Mahasiswa IPB.Struktur hirarki dimensi jenis penelitian dapat dilihat Pada Gambar 4.
Gambar 4 Hirarki penelitian berdasarkan dimensi jenis penelitian.
Hirarki berdasarkan fakultas dan departemen adalah hirarki dari fakultas dan departemen yang terdapat di IPB. Struktur hirarki dimensi berdasarkan fakultas dan departemendapat dilihat Pada Gambar 5.
Nama Atribut Tipe Data
Waktu Int (4)
Fakultas Varchar (20)
Departemen Varchar (50
dosen_pembimbing Varchar (30)
Subjek Varchar (50)
Nama Dimensi Deskripsi
Tahun Tahun akademik
Fakultas Nama fakultas
Departemen Nama departemen
Dosen Pembimbing Nama dosen pembimbing
Subjek Kata subjek
Ukuran Skripsi Jumlah skripsi
Nama Atribut Deskripsi
Waktu Tahun akademik
Fakultas Nama fakultas
Departemen Nama departemen
dosen_pembimbing Nama dosen pembimbing
Subjek Kata subjek
PENELITIAN
SKRIPSI JURNAL
ILMIAH DISERTASI
Gambar 5 Hirarki penelitian berdasarkan dimensi fakultas dan departemen.
Hirarki waktu adalah hirarki dari tahun penelitian yang dilakukan oleh Mahasiswa IPB.Struktur hirarki dimensi jenis penelitian dapat dilihat Pada Gambar 6.
Gambar 6 Hirarki penelitian berdasarkan dimensi tahun penelitian.
Hirarki strata adalah hirarki dari jenis strata yang ada di IPB.Struktur hirarki dimensi strata dapat dilihat Pada Gambar 7.
Gambar 7 Hirarki penelitian berdasarkan dimensi jenjang pendidikan.
Hirarki dosen adalah hirarki dari dosen yang membimbing Mahasiswa IPB dalam melakukan penelitian.Struktur hirarki dimensi dosen dapat dilihat Pada Gambar 8.
Gambar 8 Hirarki penelitian berdasarkan dimensi dosen.
Hirarki subjek adalah hirarki darinama subjek yang telah diteliti oleh Mahasiswa IPB. Struktur
hirarki dimensi jenis penelitian dapat dilihat Pada Gambar 9.
Gambar 9 Hirarki penelitian berdasarkan dimensi subjek.
Ekstraksi Data
Data dalam CDS/ISIS tersebut diekspor ke dalam bentuk XML. Tedapat beberapa pilihan format untuk format XML yang akan diekspor. Format eksporXML yang digunakan ditunjukkan Pada Gambar10.
Gambar10 Format eksporXML.
Terdapat kesalahan-kesalahan pada XML yang dihasilkan, yaitu XML yang dihasilkan bukan termasuk XML yang well-formed dan terdapat banyak metadata yang memiliki illegal character pada XML tersebut. Ini artinya dokumen tersebut harus mematuhi peraturan , termasuk (Harold & Means 2004) :
1 Setiap start-tag harus memiliki end-tag. 2 Setiap element boleh bersarang tapi tidak
overlap.
3 Harus terdapat satu root element
4 Nilai atribut harus diberi tanda kutip dua. 5 Sebuah elemen tidak boleh memiliki dua
atribut dengan nama yang sama
6 Komentar dan instruksi processing tidak boleh ada di dalam tags.
7 Tidak boleh ada tanda “<” atau “&” yang tidak dilakukan escape di dalam data karakter dari elemen atau atribut.
Contoh element yang salah adalah sebagai berikut :
<Tag_759 _a="Manuwoto,Sjafrida"></RECORD>
Element XML tersebut seharusnya memiliki end-tag yang sesuai seperti berikut :
<Tag_759 _a="Manuwoto, Sjafrida"></Tag_759>
Oleh karena itu,element tersebut harus diperbaiki dengan memberikan end-tag yang sesuai.Mengubah simbol “&” menjadi kata “dan.”Terdapat satu baris kesalahan end-tag dan delapan belas baris kesalahan simbol.
Pada tahap ini dilakukan parsing XML untuk mengetahui tag-tag yang ada dalam data penelitian beserta isi dari tag tersebut.Hasil parsing disimpan dalam bentuk tabel dengan format .xls atau .csv.Tag-tag data dijadikan sebagai atribut-atribut.Integrasi data dilakukan dengan menganalisis atribut, memilih atribut yang diperlukan dan menggabungkan atribut tersebut untuk membentuk tabel fakta.Reduksi data dilakukan dengan membuang atribut-atribut yang tidak diperlukan berdasarkan hasil analisis data.Atribut yang direduksi dapat dilihat pada Tabel 7.
Tabel 7 Atribut yang direduksi pada data penelitian
Nomor Tag Field Metadata (Atribut)
999 No. Registrasi 985 Jumlah Eksemplar 850 Badan Pemilik 998 Jenis Karya [D/T]
980 008/005 Tanggal Registrasi 981 Tanggal Input Pengolahan 35 No. Kendali Setempat
80 Nomor UDC
99 Nomor Panggil
100 Pengarang Utama
245 Judul
300 Deskripsi Fisik 502 Catatan Karya (T/D) 712 Program Studi 986 Kode Operator
Nilai atribut yang redundant dalam tabel tidak diikutsertakan pada proses selanjutnya.Tahap pembersihan data dilakukan dengan mengidentifikasi data yang tidak konsisten dan kosong (null). Pada proses ini ditemukan banyak data yang kosong dan tidak konsisten akibat faktor human error pada saat pemasukan data penelitian. Contoh pembersihan data yang mengandung nilai nulldapat dilihat Pada Gambar 11 dan Gambar 12.Perlakuan terhadap nilai yang kosong lebih dari empat dalam atribut fakultas, departemen, dosen pembimbing, tahun, dan subjek yaitu dengan menghapus satu record dalam tabel dapat dilihat Pada Gambar 13, sedangkan perlakuan terhadap data yang tidak konsisten dengan menyeragamkan nilai atribut berdasarkan buku panduan sarjana dan pascasarjana IPB. Contoh nilai yang tidak konsisten antara lain :
• Program pascasarjana, pasca sarjana, pascasarjan, pascasarjanaa diubah menjadi pascasarjana
• Ilmu-ilmu Perencanaan Pembangunan Wilayah dan Pedesaan diubah menjadi Ilmu Perencanaan Pembangunan Wilayah dan Pedesaan
Hal ini dilakukan untuk menjaga konsistensi data, karena bisa jadi dalam satu kata subjek memiliki tiga kata subjek yang berbeda.Proses selanjutnya dilakukan penghapusan data yang redundant. Dalam data biasanya terjadi kemungkinan adanya nilai atribut yang muncul berkali-kali dengan nama yang sedikit berbeda, perlu diperhatikan hal-hal dalam mendeteksi dan menghilangkan duplikat data, kemungkinan adanya kesalahan pemasukan data. Contohnya ada dua dosen pembimbing yang berbeda dengan nama yang sama. Sebaliknya, ada satu dosen pembimbing dengan nama yang berbeda. Setelah dilakukan pembersihan, jumlah record data skripsi menyusut dari 51389 menjadi 28280, data tesis menyusut dari 11260 menjadi 8667, data disertasi menyusut dari 2377 menjadi 1779, data jurnal menyusut dari 2432 menjadi 697. Hal ini disebabkan pengambilan recordhanya dilakukan pada data yang memenuhi kriteria dan adanya penghapusan record yang tidak sesuai dengan ketentuan data yang akan dianalisis.Hasil pembersihan data penelitian dapat dilihat Pada Gambar 14.Hasil dari pembersihan data ini disimpan ke dalam DBMSMicrosoft SQL Server (.sql).
Gambar 11 Data yang mengandung nilai null.
Gambar 12 Data yang mengandung nilai null yang sudah diisi dengan nilai subjek sesuai dengan departemen.
Gambar 13 Data yang mengandung nilai null lebih dari 2 atribut.
Keterangan
1 D = jumlah data awal
2 Null = jumlah data bernilai null
3 Null (%) = jumlah data bernilai null dalam persen
4 D1 = hasil cleaning null 5 Redu = jumlah data redudansi
6 Redu (%) = jumlah data redudansi dalam persen
7 D2 = hasil cleaning redudansi
Transformasi Data
Proses transformasi data meliputi penyeragaman nama atribut, generalisasi, agregasi, dan konstruksi atribut atau dimensi dengan berpedoman pada skema data warehouse yaitu skema galaksi yang telah dibuat. Proses yang dilakukan antara lain :
1 Mengubah nama atribut sesuai dengan nama dimensi pada skema galaksi
2 Mengkonstruksi atribut baru menggunakan atribut yang sudah ada.
3 Menentukan nilai agregasi atribut-atribut yang menjadi ukuran (measure). Ukuran berupa jumlah penelitian yaitu jumlah skripsi, jumlah tesis, jumlah disertasi, dan jumlah jurnal. Fungsi agregat yang digunakan adalah fungsi sum untuk penjumlahan penelitian
Pemuatan Data
Penelitian ini menggunakan metadata penelitian IPB dari tahun 1958 sampai dengan 2011.Data warehouse yang sudah selesai dibuat selanjutnya dimuat dalam kubus data OLAP server, pada penelitian ini menggunakan Microsoft SQL Server 2008. Sebelum pemuatan data dilakukan, skema data warehouse dimodelkan dalam OLAP server SQL Server Analisys Services (SSAS).Proses ini menentukan dimensi, ukuran, dan kubus data. Kubus data yang dibuat diberi namaOlapPenelitianIPB. Cube yang berisi kubus data fakta skripsi, fakta tesis, fakta disertasi, dan fakta jurnal. Kubus data skripsi dibuat untuk tabel fakta_skripsi, kubus data tesis dibuat untuk tabel fakta_tesis, kubus data disertasi dibuat untuk tabel fakta_disertasi, dankubus data jurnal dibuat untuk table fakta_jurnal.
Data Warehouse
Penelitian ini mengadopsi arsitektur three-tier yaitu lapisan bawah, tengah, dan atas.Lapisan bawah adalah pembuatan skema data warehouse dengan DBMS SQL Server 2008. Lapisan tengah terdapat OLAP server SSAS yang menyimpan data dalam kubus data. Lapisan atas yang merupakan visualisasi dari aplikasi OLAP dilakukan oleh web browser, pengguna dapat melakukan pencarian data, mengevaluasi pola,
dan mendapatkan representasi informasi dalam bentuk grafik yang mudah dipahami.
ImplementasiBusiness Intelligence
Business Intelligence dalam penelitian ini menggunakan SQL Server 2008 dengan tool SQL Server Business Intelligence Development Studio (BIDS). BIDS membangun komponen dari Analysis Services (Data Source, Data Views, Dimensi, Value, dan Cube). Data hasil operasi BI dapat ditampilkan di Microsoft SharePoint Server 2010 ke dalam bentuk grafik, berupa bar plot, line plot, dan pie chart.
Gambaran Umum Aplikasi
Aplikasi pada penelitian ini menerapkan arsitektur three-tier :
1 Lapisan bawah, pemrosesan data, pembuatan skema data warehouse, dan pemuatan kubus data menggunakan MS-SQL Server 2008. 2 Lapisan tengah, Aplikasi OLAP dapat
dijalankan pada web server yang dapat mengakses kubus data pada MS-SQL Server 2008.
3 Lapisan atas, visualisasi business intelligence yang dilakukan web browser dan SharePoint 2010. Pengguna dapat melakukan pencarian data, mengevaluasi pola, mendapatkan representasi informasi yang mudah dipahami dalam bentuk grafik.
Kelebihan dan Kekurangan Sistem
Sistem yang telah dibuat memiliki kelebihan dan kekurangan diantaranya:
1 Kelebihan : Aplikasi business intelligence berbasis web dapat diterapkan dalam jaringan internet dan intranet. Web dapat mengurangi instalasi kebutuhan perangkat lunak pada komputer pengguna.
2 Kekurangan : Aplikasi terbatas hanya lima dimensi yang digunakan. Tidak ada pemodelan data baru ke dalam struktur kubus data.
Pengujian Query
Pengujian query dibantu dengan menggunakan grafik dan tabel dari kubus data. Hasil pengujian dapat dilihat pada Tabel 8.
Eksplorasi dan Presentasi Hasil
Tabel 8 Hasil pengujian query
Spesifikasi Keterangan Status
Tren jumlah skripsi setiap tahun
Lampiran 7 Berhasil
Tren jumlah skripsi pada tahun 2011.
Lampiran 8 Berhasil
Tren jumlah skripsi berdasarkan dimensi fakultas dan departemen.
Lampiran 9 Berhasil
Tren jumlah skripsi berdasarkan dimensi tahun, fakultas, departemen, dan dosen.
Lampiran 10 Berhasil
Tren jumlah skripsi berdasarkan dimensi tahun, fakultas, departemen, dosen, dan subjek.
Lampiran 11 Berhasil
Tren jumlah penelitian berdasarkan jenis penelitian.
Lampiran 12 Berhasil
Tren jumlah penelitian setiap tahun.
Lampiran 13 Berhasil
Tren jumlah penelitian setiap tahun berdasarkan fakultas.
Lampiran 14 Berhasil
Tren jumlah penelitian setiap tahun berdasarkan fakultas dan departemen
Lampiran 15 Berhasil
Tren jumlah penelitian setiap tahun berdasarkan fakultas, departemen, dan dosen.
Lampiran 16 Berhasil
Tren jumlah penelitian setiap tahun berdasarkan fakultas, departemen, dosen, dan subjek.
Lampiran 17 Berhasil
Pada Gambar 16 menunjukkan bahwa jumlah penelitian skripsi Fakultas Ekonomi dan Manajemen (H) menghasilkan jumlah penelitian paling banyak dibandingkan Fakultas lain. Jumlah penelitian Fakultas Kedokteran Hewan (B) paling sedikit.
Pada Gambar 17 menunjukkan jumlah penelitian skripsi dapat dipilih dimensinya berdasarkan dimensi tahun, fakultas, departemen, dan dosen. Pada Gambar 18 menunjukkan jumlah penelitian skripsi dapat dipilih dimensinya berdasarkan dimensi tahun, fakultas, departemen, dosen, dan subjek.
Gambar 15 Grafik garis skripsi sejak tahun 1958 sampai dengan 2011.
Gambar 16 Grafik batang skripsi berdasarkan dimensi tahun, fakultas, dan departemen.
Gambar 17 Grafik batang jumlah skripsi berdasarkan dimensi tahun, fakultas, departemen, dan dosen.
Gambar 18 Grafik batang jumlah skripsi berdasarkan dimensi tahun, fakultas, departemen, dosen, dan subjek.
KESIMPULAN DAN SARAN
Kesimpulan
Server 2010. Pengembangan data warehouse dan aplikasi OLAP pada data penelitian menghasilkan empat kubus data, yaitu kubus data skripsi, tesis, disertasi, dan jurnal. Kubus data yang telah terbentuk dapat divisualisasikan dengan tepat, cepat, dan akurat.Bentuk penyajian Gambar dapat dilihat dalam bentuk grafik.Data yang ada menunjukkan bahwa dari tahun ke tahun riset yang dihasilkan oleh IPB secara umum selalu meningkat dapat dilihat dengan bertambahnya jumlah penelitian berdasarkan tahun, fakultas, dan departemen.Hasil penelitian ini dapat memberikan manfaat kepada pusat-pusat penelitian IPB sebagai pengelolanya, serta dapat menganalisis data penelitian yang ukurannya sangat besar sehingga memudahkan proses pembuatan laporan dan pengambilan keputusan.
Saran
Pada penelitian selanjutnya, sebaiknya menggunakan dimensi lebih banyak, penambahan fitur yang dapat mengidentifikasi nama orang secara detail, dan dapat menelusuri data sehingga informasi yang disampaikan lebih lengkap. Pembuatan proses aplikasi ETL agar lebih akurat.
DAFTAR PUSTAKA
Han J, Kamber M. 2006. Data Mining Concepts & Techniques. San Francisco: Morgan Kaufman Publisher.
Harold ER, Means WS. 2004. XML in Nutshell. Sebastopool: O’Reilly Media, Inc.
[NISO] National Information Standards Organization. 2004. Understanding Metadata. Betehsda: NISO Press.
Noviandi KR. 2010. Microsoft Business Intelligence dengan SQL Server 2008 R2 dan SharePoint 2010. Jakarta: MVP
[PNRI] Perpustakaan Nasional Republik Indonesia. 2005. INDOMARC Format MARC Indonesia. Jakarta: Perpustakaan Nasional Republik Indonesia.
Lampiran 1 Keterangan nomor tag MARC pada metadata
Nomor Tag Field Metadata
999 No. Registrasi 985 Jumlah Eksemplar 850 Badan Pemilik 990 008/35-37 Bahasa 998 Jenis Karya [D/T]
980 008/005 Tanggal Registrasi 981 Tanggal Input Pengolahan 35 No. Kendali Setempat
80 Nomor UDC
99 Nomor Panggil
100 Pengarang Utama
245 Judul
260 Impresum
300 Deskripsi Fisik 502 Catatan Karya (T/D)
650 Subjek
Lampiran 2Data tabel dalam dimensi
a. Data tabel dim_fakultas (Dimensi Fakultas)
id_fakultas Nama_fakultas
A Pertanian
B Kedokteran Hewan
C Perikanan
D Peternakan
E Kehutanan
F Teknik Pertanian
G Matematika dan Ilmu Pengetahuan Alam H Ekonomi dan Management
I Ekologi Manusia
b. Data tabel dim_departemen (Dimensi Departemen)
id_departemen nama_departemen
TSL Ilmu Tanah dan Sumberdaya Lahan AGH Agronomi dan Hortikultura PTN Proteksi dan Tanaman ARL Arsitektur Lanskap
FKH Fakultas Kedokteran Hewan BDP Budidaya Perairan
MSP Manajemen Sumberdaya Perairan THP Teknologi Hasil Perairan
PSP Pemanfaatan Sumberdaya Perikanan ITK Ilmu dan Teknologi Kelautan
PTP Ilmu Produksi dan Teknologi Peternakan NTP Ilmu Nutrisi dan Teknologi Pakan
MNH Manajemen Hutan
THH Hasil Hutan
KSH Konservasi Sumberdaya Hutan dan Ekowisata
SVK Silvikultur
TEP Teknik Pertanian
ITP Ilmu dan Teknologi Pangan TIN Teknologi Industri Pertanian
STK Statistika
GFM Geofisika dan Meteorologi
BIO Biologi
KIM Kimia
MAT Matematika
KOM Ilmu Komputer
FIS Fisika
BIK Biokimia
MAN Manajemen
AGB Agribisnis
ESL Ekonomi Sumberdaya dan Lingkungan GIZ Gizi Masyarakat
IKK Ilmu Keluarga dan Konsumen
KPM Komunikasi dan Pengembangan Masyarakat
TNH Ilmu Tanah
ATT Agroteknologi Tanah
MBK Mitigasi Bencana Kerusakan Lahan BTL Bioteknologi Tanah dan Lingkungan DAS Pengelolaan Daerah Aliran Sungai PWL Ilmu Perencanaan Wilayah ITB Ilmu dan Teknologi Benih
PBT Pemulihan dan Bioteknologi Tanaman
ENT Entomologi
FIT Fitapatologi
IFO Ilmu-Ilmu Faal dan Khasiat Obat APH Anatomi dan Perkembangan Hewan KMV Kesehatan Masyarakat Veteriner PEK Parasitologi dan Entomologi Kesehatan MKM Mikrobiologi Medik
IBH Ilmu Biomedis Hewan BRP Biologi Reproduksi AKU Ilmu Akuakultur
SDP Pengelolaan Sumberdaya Perairan
SPL Pengelolaan Sumberdaya Pesisir dan Lautan TPT Teknologi Perikanan Tangkap
SPT Sistem dan Pemodelan Perikanan Tangkap
IKL Ilmu Kelautan
TEK Teknologi Kelautan
IPT Ilmu Produksi dan Teknologi Peternakan INP Ilmu Nutrisi dan Pakan
IPH Ilmu Pengelolaan Hutan TSK Teknologi Serat dan Komposit
RPM Rekayasa dan Peningkatan Mutu Hasil Hutan KVT Konservasi Biodiversitas Tropika
MEJ Manajemen Ekowisata dan Jasa Lingkungan SVKT Silvikultur Tropika
TMP Teknik Mesin Pertanian dan Pangan
TPP Teknologi Pascapanen
IKP Ilmu Keteknikan Pertanian
SIL Teknik Sipil dan Lingkungan
TIP Teknologi Industri Pertanian
KLI Klimatologi Terapan
MIK Mikrobiologi
BSH Biosains Hewan
BOT Biologi Tumbuhan
MIT Master Of Science in Information Technology for Natural Resouces Management
ESK Ekonomi Sumberdaya Kelautan Tropika
EPN Ilmu Ekonomi Pertanian
GMS Ilmu Gizi Masyarakat
GMA Ilmu Gizi Manusia
IKA Ilmu Keluarga dan Perkembangan Anak
IKO Ilmu Konsumen
PPN Ilmu Penyuluhan Pembangunan
KMP Komunikasi Pembangunan Pertanian Pedesaan
SPD Sosiologi Pedesaan
BTK Bioteknologi
PRM Primatologi
PSL Pengelolaan Sumberdaya Alam dan Lingkungan
c. Data tabel dim_waktu
id_tahun tahun
1 1958
2 1959
3 1960
4 1961
5 1962
6 1963
7 1964
8 1965
9 1966
10 1967
11 1968
12 1969
13 1970
14 1971
15 1972
16 1973
17 1974
18 1975
19 1976
20 1977
21 1978
22 1979
23 1980
25 1982
26 1983
27 1984
28 1985
29 1986
30 1987
31 1988
32 1989
33 1990
34 1991
35 1992
36 1993
37 1994
38 1995
39 1996
40 1997
41 1998
42 1999
43 2000
44 2001
45 2002
46 2003
47 2004
48 2005
49 2006
50 2007
51 2008
52 2009
53 2010
54 2011
d. Data tabel dim_subjek
id_subjek subjek
… …
d. Data tabel dim_dosen
Iid_dosen dosen
P218 Prof. Dr. Ir. Bungaran Saragih P219 Prof. Dr. Ir. E. Gumbira.Sa'id P220 Prof. Dr. Jr. Didiek J. Rachbini
P221
Prof. Dr. Sediono M.P. Tjondronegoro
Lampiran 3 Data tabel fakta a. Data tabel penelitian
tahun fak dept dosen subjek strata
2003 D IPT Priyanto Sapi S1
2003 D IMT Sumiati Domba S1
2003 D IMT Sumiati Paclobutrazol S1
2003 D IMT Sofyan Tanaman S1
2003 D IMT Sumiati Lidah S1
2003 D IMT Sumiati Bunga S1
2003 D IMT Amirroenas Kelapa S1
2003 D IPT Sihombing Buah S1
2003 D IPT Sumantri Jagung S1
2003 D IPT Noor Jagung S1
2003 A AGR Nasrullah Padi S1
2003 A AGR Susila Pepaya S1
2003 A AGR Harjadi Kedelai S1
… … … …
1982 A PTN Sukarti Field S3
1982 G BIK Besancon Field S3
1983 H ESL Nasoetion Economics S3 1983 G BIO Partodihardjo Animal S3 1983 G BIO Sosromarsono Gymnophiona S3 1983 B FKH Bahr Classification S3
1983 A AGH Guhardja Field S3
1983 A TSL Soepardi Field S3
1983 D PTP Sutardi Cattle S3
1984 F ITP Sosromarsono Insect S3
1984 E KSH Haeruman Forestry S3
1985 F TEP Soekarto Biological S3 1985 H ESL Sastrakusumah Animal S3 1985 F TEP Sosromarsono Entomology S3
1985 A PTN Rumawas Zea S3
1985 H ESL Eidman Aquatic S3
1985 H ESL Eidman Fisheries S3
1986 I KPM Tjondronegoro Social S3 1986 G BIO Partodihardjo Mollusca S3
1986 G BIO Sukra Rats S3
1986 A AGH Koswara Zea S3
1986 D PTP Anggorodi Animal S3
a. Data tabel fakta skripsi
id_fakultas id_departemen id_tahun nama_dosen nama_subjek
B FKH 47 Kusumorini, Nastiti Kambing
B FKH 47 NAim, Rochman Escherichia coli
B FKH 47 Farrudin, Mokhamad Kukang
B FKH 47 Biomed, Agustin Indrawati Kambing
B FKH 47 Supriatna, Iman Kambing
B FKH 47 Cahyaningsih, Umi Mencit
B FKH 47 Kusumorini, Nastiti Mencit
B FKH 47 Boediono, Arif Eimeria tenella
B FKH 47 Yusuf, Tuty Laswardi Ayam broiler
B FKH 47 Wibawan, I Wayan Teguh Daun Legundi
B FKH 47 Huminto, Hernomoadi Terminologi
B FKH 47 Esfandiari, Anita Ayam Pedaging
B FKH 47 Widhyari, Sus Derthi Ulat sutera
B FKH 47 Fahrudin, Mokhamad Ulat sutera
B FKH 47 Fahrudin, Mokhamad Ulat sutera
B FKH 47 Handajani, Sri Utami Itik
B FKH 47 Estuningsih, Sri Minyak sawit
B FKH 47 Amin, Arif Microcatchment
B FKH 47 Lelana, R.P Agus Pelet fungi
B FKH 47 Astuti, Dewi Apri Urease
B FKH 47 Santoso, Koekoeh C-Organik
B FKH 47 Santoso, Koekoeh Cocopith
B FKH 47 Santoso, Koekoeh Logam berat
B FKH 47 Surya, Widiyanto Dwi DAS
A TNH 47 Iskandar DAS
A TNH 47 Brata, Kamir R Herbisida Diuron
A TNH 47 Anas, Iswandi Tanah sulfat masam
A TNH 47 Djajakirana, Gunawan Microcatchment
A TNH 47 Sudarsono Tata ruang
A TNH 47 Anas, Iswandi Microcatchment
A TNH 47 Darmawan Hidrolik jenuh
A TNH 47 Sinukaban, Naik Tanah
A TNH 47 Gandasasmita, Komarsa Penutup Lahan
A TNH 47 Widiatmaka Calapogonium caeruleum
A TNH 47 Sumawinata, Basuki Lahan
A TNH 47 Rahman, Latief M Tanah Andosol
A TNH 47 Rustiadi, Ernan Konversi lahan
A TNH 47 Widiatmaka Digital Elevation Model
b. Data tabel fakta tesis
id_fakultas id_departemen id_tahun nama_dosen nama_subjek
G BIO 49 Tjitrosoedirdjo, Sri S. Palmae
G BIO 47 Rifai, Mien Botany
A AGH 43 Sopandie, Didy Rice
A AGH 48 Sopandie, Didy Fish crops
A AGH 43 Supandie, Didy Soybean
A AGH 41 Sopandie, Didy Rice
C TIK 43 Djokosetiyanto Totifers
G KOM 49 Buono, Agus Inference methods
H ESL 42 Adhi, Andriyono Kilat Farm Production
H ESL 34 Gani, Darwis S. Beverages
H ESL 40 Hubeis, Aida Vitayala S. Agricultural research
C TIK 41 Muchsin, Ismudi Ecosystems
G BIO 45 Guhardja, Edi Araceae
B FKH 32 Girindra, Aisyah
G BIO 45 Toelihere, Mozes R. Cattle greeds
F ITP 48 Astawan, Made Seaweed meal
G BIO 46 Poerwanto, Sri Budiarti Biological sciences
C ITK 43 Zairin, M. Fish
G BIK 47 Bintang, Maria Field crop
F ITP 47 Zakaria, Fransiska R Food technology
F ITP 48 Jenie, Betty Sri Laksmi Chemistry
B FKH 47 Sinaga, Meity Suradji Plant diseases
G BIK 48 Bintang, Maria Anthihiperglicemic
F ITP 46 Jenie, Betty Sri Laksmi Microbiology
G BIK 48 Bintang, Maria Antioxidants
F ITP 44 Wijaya, C.Hanny Antioxidants
F ITP 46 Zakaria, Fransisca Rungkat Medical plants
G BIO 43 Syafii, Wasrin Ebory
G BIO 43 Sudirman, Lisdar I. Basidiomycetes
F ITP 48 Dewanti-Hariyadi, Ratih Field crops
G KIM 48 Sajuthi, Dondin Field crops
G BIO 42 Sugiri, Nawangsari Echinoidea
F TEP 38
Zakaria, Fransiska
Rungkat Zingiber
G BIO 45 Poerwanto, Sri Budiarti
Bio organic Chemistry
G BIO 44 Poerwanto, Sri Budiarti
Industrial microbiology
G BIO 27 Partodihardjo, Soebadi Goats
A AGH 49 Ghulamahdi, Munif Field crops
c. Data tabel fakta disertasi
ID_Fak ID_Dept ID_Thn ID_Dosen ID_Subjek
A AGH 49 Sudradjat Tobacco
A AGH 49 Poerwanto, Roedhy Field crops
A AGH 49
Djoefrie, M.H
Bintoro Field crops
A AGH 49 Yahya, Sudirman Oleaginous plants
E MNH 49
Suratmo, F.
Gunarwan Fagaceae
B FKH 49 Malole Field crops
G BIO 49 Kiranadi, Bambang Medicinal plants
A AGH 49 Aswidinnoor, Hajrial Field crops
A AGH 49 Wattimena, G.A Horticulture
A AGH 49 Sopandie, Didy Garden plant
A AGH 49 Poerwanto, Roedhy Fruits
A AGH 49
Sastrosumarjo,
Sarsidi Gardening
D PTP 49 Toharmat, Toto Physiology
D PTP 49 Sutardi, Toha Ruminants
D PTP 49 Sofyan, Lily Amalia Ruminants
G BIO 49 Toelihere, Mozes R Ruminants
D PTP 49 Martojo, Harimurti Animal husbandry
D PTP 49 Martojo, Harimurti Animal husbandry
D PTP 49 Gurnadi, H.R. Eddie Animal husbandry
B FKH 49 Satrija, Fadjar Animal husbandry
D PTP 49 Gurnadi, Eddie Meat production
D PTP 49 Sihombing Insect breeding
A AGH 49 Rumawas, Fred Field crops
C ITK 49 Baskoro, Mulyono S Fisheries
C ITK 49 Sondita, M. Fedi A Fisheries
C ITK 49 Jaya, Indra Fisheries
C ITK 49 Monintja, Daniel R Fisheries
G BIO 49 Toelihere, Mozes R Fisheries
C ITK 49 Sondita, M. Fedi A Fisheries
C ITK 49 Monintja, Daniel R Fishing methods
C BDP 49 Dana, Darnas Fisheries
C BDP 49 Zairin, Muhammad Fisheries
C BDP 49 Zairin, Muhammad Fisheries
G BIO 49 Manalu, Wasmen Feeding
C BDP 49 Zairin, Muhammad Fisheries
C BDP 49 Affandi, Ridwan Fisheries
G BIO 49 Suwanto, Antonius Fisheries
C ITK 49 Monintja, Daniel R Fisheries
C ITK 49 Soedhrama, Dedi Fisheries
Lampiran 4 Data tabel jumlah penelitian
a. Data tabel jumlah penelitian berdasarkan tahun
Tahun Skripsi Tesis Disertasi
1958 0 0 5
1959 1 0 1
1960 1 0 1
1961 0 0 0
1962 4 0 2
1963 4 2 0
1964 15 3 4
1965 18 3 6
1966 11 4 2
1967 15 1 0
1968 29 0 1
1969 18 1 2
1970 15 0 3
1971 30 0 1
1972 62 1 4
1973 24 0 7
1974 52 0 4
1975 40 5 7
1976 72 5 9
1977 44 18 8
1978 32 29 9
1979 61 46 14
1980 92 60 12
1981 221 85 18
1982 396 116 23
1983 584 109 31
1984 751 101 21
1985 801 131 31
1986 913 154 29
1987 1147 165 33
1988 899 171 24
1989 1281 176 39
1990 1153 247 26
1991 1211 269 26
1992 1267 255 31
1993 865 360 34
1994 1371 324 29
1995 1409 308 32
1996 1306 258 47
1997 1427 264 48
Tahun Skripsi Tesis Disertasi
1999 1615 382 56
2000 1776 383 60
2001 2006 384 67
2002 2318 569 80
2003 2733 555 78
2004 2711 555 113
2005 2799 659 193
2006 2862 575 166
2007 2611 416 239
2008 2854 545 175
2009 2458 759 160
2010 2917 772 176
2011 2523 690 142
b. Data tabel jumlah penelitian berdasarkan fakultas
id_fakultas Fakultas
A 14797
B 2251
C 7102
D 4777
E 4954
F 7917
G 6440
H 2606
I 545
c. Data tabel jumlah penelitian berdasarkan departemen
id_dept Departemen
TSL 257
AGH 513
PTN 181
ARL 173
FKH 1524
BDP 2459
MSP 1315
THP 670
PSP 975
ITK 1177
PTP 347
NTP 119
MNH 1834
KSH 992
SVK 206
TEP 1664
ITP 572
TIN 1792
STK 1499
GFM 678
BIO 1127
KIM 1090
MAT 529
KOM 759
FIS 361
BIK 187
EKO 649
MAN 1064
AGB 594
ESL 144
GIZ 215
IKK 85
KPM 245
Lampiran 6 Model hirarki dimensi
a. Hirarki dimensi penelitian
IPB
PENELITIAN
FAKULTAS
A ... I
DEPARTEMEN
TSL ... KPM
TAHUN
1958 ... 2011
DOSEN
A... ... Z...
SUBJEK
A... ... Z...
STRATA
b. Hirarki dimensi fakultas
c. Hirarki dimensi departemen
PENELITIAN
A
B
C
D
E
F
G
H
I
PENELITIAN
d. Hirarki dimensi waktu
PENELITIAN
Lampiran 7 Hasil pengujian dengan spesifikasi tren jumlah skripsi setiah tahun
Lampiran 8 Hasil pengujian dengan spesifikasi tren jumlah skripsi pada tahun 2011.
Lampiran 10 Hasil pengujian dengan spesifikasi tren jumlah skripsi berdasarkan dimensi tahun, fakultas, departemen, dan dosen.
Lampiran 11 Hasil pengujian dengan spesifikasi tren jumlah skripsi berdasarkan dimensi tahun, fakultas, departemen, dosen, dan subjek.
Lampiran 13 Hasil pengujian dengan spesifikasi tren jumlah penelitian setiap tahun.
Lampiran 14 Hasil pengujian dengan spesifikasi tren jumlah penelitian setiap tahun berdasarkan fakultas.
Lampiran 16 Hasil pengujian dengan spesifikasi tren jumlah penelitian setiap tahun berdasarkan fakultas, departemen, dan dosen.