SIMULASI OPTIMASI QUERY PADA FEDERATED DATABASE
Andika Pratama Putra¹, Dhinta Darmantoro², Kusuma Ayu Laksitowening³
¹Teknik Informatika, Fakultas Teknik Informatika, Universitas Telkom
Abstrak
Salah satu kekurangan transaksi query yang menggunakan data yang sangat besar dan terdistribusi adalah waktu pengoperasiannya. Faktor utama penyebab lamanya waktu yang digunakan saat pengoperasian transaksi ini adalah cost baca dan cost pengiriman. Dimana sebenarnya, cost baca dan cost kirim ini dapat diminimalisasi dengan melakukan optimasi query terlebih dahulu. Optimasi query ini sendiri adalah sebuah metode yang dapat digunakan untuk memprediksi cost dengan mencoba beberapa metode yang beragam dan berbeda dalam cost based dan ruled based. Optimasi query ini membutuhkan informasi data katalog yang nantinya akan digunakan sebagai informasi awal untuk memprediksi cost. Selain itu, ada juga faktor-faktor yang mempengaruhi perhitungan prediksi cost pada database terdistribusi yaitu jenis operasi yang terlibat dalam query, metode pengiriman yang dilakukan, ukuran relasi, ukuran atribut, keberadaan indeks, clusterisasi indeks, faktor reduksi dan akurasi katalog
Kata Kunci : Database, Optimasi query, Query, Katalog, Faktor Reduksi, Indeks
Abstract
One of insuffiency of transaction query which is using a huge database and distributed, is the operation time. The primary factor that cause this transaction operation time taking so many times is the cost for read and the cost for delivery. Actually in fact, this cost for read and delivery can be more minimalise if we can doing query optimization first. This query optimization self is a method which we can used to predict the cost by trying some immeasurable and different method in cost based and ruled based. This query optimization is need an information from data
catalogue which later will be used as the first information to predict the cost. Beside that, there is another factors that can influence the prediction cost in distributed database. That factors are the type of operation which concerned in the query, the delivery method, the measure of relation, the measure of attribute, the existence of index, index clustering, reduction factor and the catalog accuration.
Keywords : Database , Query Optimization, Query, Catalog, Reduction Factor,
Powered by TCPDF (www.tcpdf.org)
1
1. Pendahuluan
1.1 Latar
Belakang
Dalam Database Management System (DBMS), Sistem distributed database atau database terdistribusi merupakan salah satu aspek penting dalam sistem database yang berkembang saat ini. Hal ini disebabkan database tersentralisasi kurang mampu menangani kasus-kasus pada data dengan data yang tersebar. Contoh kasus yang paling jelas yaitu pada database sebuah bank besar yang memilik cabang dimana-mana.
Federated database atau database terfederasi adalah logical unification dari
database yang bekerja di sistem masing-masing dan dihubungkan oleh jaringan. Dengan kata lain Federated database adalah perluasan dari distributed database dengan penggabungan semua view secara logic dari semua data yang secara fisik tersebar diberbagai site. Sehingga aplikasi melihatnya secara logical single view [7].
Semua operasi yang berhubungan dengan database harus menggunakan DBMS. Bila pemakai akan mengakses database, DBMS menyediakan penghubung (interface) antara pemakai dengan database. Hubungan antara pemakai dengan database ini secara interaktif menggunakan operasi query sehingga dalam pengoperasiannya, DBMS tentu tidak akan luput dengan pengoperasian query. Salah satu komponen dalam DBMS adalah optmasi query. Optimasi query adalah memperkirakan rencana pengoperasian query yang paling efisien dengan memperhitungkan cost/harga yang digunakan.
Pemrosesan query pada federated database akan sangat lebih rumit dan mahal, hal ini dikarenakan DBMS juga harus memperhitungkan jumlah record data yang dikirim dari satu situs ke situs lain karena cost komunikasi merupakan
cost yang signifikan dalam federated database [4]. Sehingga dibutuhkan rencana
untuk mensiasati pemrosesan query agar cost yang digunakan seoptimal mungkin. Optimasi query pada federated database juga harus memperkirakan cost secara global (keseluruhan site) bukan hanya memperkirakan cost terbaik dimasing-masing site.
1.2 Perumusan
Masalah
Berdasarkan latar belakang yang telah dikemukakan diatas, permasalahan yang dijadikan objek penelitian pada tugas akhir ini adalah melihat bagaimana mekanisme kerja dan mensimulasikan pemrosesan query pada federated database untuk menganalisis cost yang digunakan agar mendapatkan optimasi query yang terbaik.
Selain itu, tugas akhir ini juga terdapat batasan masalah, yaitu
1. Simulasi pemrosesan optimasi query dilakukan pada federated database yang diasumsikan sudah bersifat homogeneus.
2. Pengujian terhadap aplikasi dilakukan pada federated database dengan menggunakan 3 site database yang tersebar
3. Site database yang tersebar tersebut menggunakan arsitektur client-server. 4. Pada tugas akhir ini hanya membahas tentang optimasi query.
2 5. Tidak membahas dan mengeksplorasi lebih jauh tentang mekanisme locking
dan sinkronisasi pada federated database.
6. Tidak membahas tentang konektifitas dan keamanan jaringan antar site database.
1.3 Tujuan
Tujuan penulisan yang ingin dicapai dalam tugas akhir ini adalah :
1. Membuat perangkat lunak yang dapat mensimulasikan dan memperhitungkan
cost dalam proses optimasi query pada federated database.
2. Menganalisis dan membuktikan bahwa optimasi query pada federated
database dapat menghemat cost yang dibutuhkan.
3. Melakukan pengujian terhadap aplikasi melalui beberapa proses optimasi query dengan membandingkan jumlah data pada katalog dari ukuran kecil hingga besar.
4. Membandingkan hasil optimasi query dengan buku.
1.4 Metodologi
penyelesaian
masalah
Metodologi pembahasan yang digunakan dalam penelitian tugas akhir ini adalah : 1. Pengumpulan Bahan
Mengumpulkan bahan-bahan referensi yang akan menunjang proses penelitian, seperti jurnal-jurnal, artikel-artikel, paper tentang optimasi query dan database terdistribusi.
2. Studi Literatur
Mempelajari literatur yang berkaitan dengan permasalahan pada tugas akhir ini dan bertujuan untuk memahami teori dasar pemrograman.
3. Analisis dan Perancangan
Metode Waterfall (Pendekatan Top-Down atau Bottom-Up ) dipilih untuk menganalisa kebutuhan dan merancang perangkat lunak pendistribusian data. 4. Implementasi Perangkat Lunak dan Evaluasi
Bertujuan untuk mengimplemantasikan hasil perancangan yang telah dilakukan dan diadakan pengujian terhadap perangkat lunak yang telah dibuat dalam hal hasil implementasi dan performansi perangkat lunak.
Powered by TCPDF (www.tcpdf.org)
40
5. Kesimpulan dan Saran
5.1
Kesimpulan
Kesimpulan yang didapatkan dari implementasi aplikasi dan analisa ialah sebagai berikut
1. Faktor-faktor yang mempengaruhi optimasi query pada federated database adalah jenis operasi yang terlibat dalam query, metode pengiriman yang dilakukan, ukuran relasi, ukuran atribut, keberadaan indeks, clusterisasi indeks, faktor reduksi, dan akurasi katalog.
2. Pemilihan metode join yang tepat akan lebih menghemat cost yang akan digunakan, bahkan bisa 36 kali lebih kecil costnya.
3. Dalam federated database, sebelum melakukan pengiriman data, jika ada kondisi seleksi, sebaiknya dilakukan dahulu di masing-masing site, sehingga akan jauh lebih menghemat cost kirim yang akan digunakan.
4. Jumlah record mempengaruhi optimasi query, yaitu berbanding lurus dengan
cost yang digunakan, kecuali terdapat seleksi dengan persamaan pada primary key, karena pada umumnya primary key akan menggunakan indeks tercluster.
Namun untuk tiap masing-masing tabel hanya memiliki satu buah primary
key.
5. Keberadaan indeks yang tercluster akan menghemat cost dari full scan, tetapi penggunaan indeks tercluster hanya ada satu pada tiap tabel.
6. Optimasi query sangat membutuhkan informasi data katalog, sebagai modal untuk memprediksi cost .
5.2
Saran
Saran-saran untuk perbaikan dan pengembangan aplikasi yang dapat dilakukan ialah
1. Query yang akan diinputkan bersifat dinamis.
2. User dapat menambahkan site dan memilih site mana akan menginputkan query.
3. Penyebaran data lebih beragam dengan menggunakan replikasi dan fragmentasi dalam penyebarannya.
Powered by TCPDF (www.tcpdf.org)
41
Daftar Pustaka
[1] Beynon Paul, Davies. 2004. Database Systems. Third Edition : Palgrave Macmillan
[2] Chrismanaria, Harry. 2000. Simulasi Query Optimizer. Institut Teknologi Telkom.
[3] Darmantoro Dhinta, Slide Kuliah : Sistem Database. Institut Teknologi Telkom
[4] Fathansyah. 2004. Sistem Database, Lanjutan buku Database. Penerbit Informatika
[5] Gehrke Ramakrishnan, Johannes Raghu. 2003. Database Management
System. Third Edition, USA : Mc. Graw Hill.
[6]
[7]
Gehrke Ramakrishnan, Johannes Raghu. Database Management System
Solutions Manual. Third Edition.
Tersedia :
http://cs.wisc.edu/~dbbook.
[29 Mei 2008]
Oracle White Paper. 2002. Database Architecture: Federated vs.
Clustered
Tersedia :
http://www.oracle.com/technology/tech/windows/rdbms
[27 Januari 2007]
[8] Piattini Mario, Diaz Oscar. 2000. Advanced Database Technology and
Design, Artech House, Inc.
[9] Pornawan, Ogi. 2007. Perancangan dan Pembuatan Apliaksi
Pengoptimal SQL Query. Universitas Gajah Mada
[10] Wikipedia. 2008. Federated Database Tersedia :
http://en.wikipedia.org /wiki/federated_database
[1 Juli 2008]
[11] Yannis E. Ioannidis. Query Optimization. Computer Sciences Department, University of Wisconsin, Madison.
[12] Yuliawati, Hetty. 2003. Aplikasi Prediksi Cost Query dengan
Menggunakan Cost Based Optimizer. Institut Teknologi Telkom.
Powered by TCPDF (www.tcpdf.org)