• Tidak ada hasil yang ditemukan

ANALISIS PENGARUH URUTAN INSERTION/DELETION PADA PERFORMANSI R-TREE PADA SPATIAL DATABASE

N/A
N/A
Protected

Academic year: 2021

Membagikan "ANALISIS PENGARUH URUTAN INSERTION/DELETION PADA PERFORMANSI R-TREE PADA SPATIAL DATABASE"

Copied!
8
0
0

Teks penuh

(1)

ANALISIS PENGARUH URUTAN INSERTION/DELETION PADA PERFORMANSI R-TREE PADA SPATIAL DATABASE

Andi Syahrandi Dj¹, Kemas Rahmat Saleh Wiharja², Kiki Maulana³

¹Teknik Informatika, Fakultas Teknik Informatika, Universitas Telkom

Abstrak

Kunci utama dalam pengembangan basis data spasial yaitu seberapa efisien query spasial tersebut ditangani, sebab pemrosesan query spasial membutuhkan biaya komputasi yang lebih tinggi dibandingkan dengan query basis data relasional biasa. Karena data spasial cenderung bersifat dinamis, besar, dan kompleks, maka dibutuhkan sebuah struktur indeks yang efisien untuk meningkatkan kinerja query spasial.

R-Tree (Rectangle Tree) merupakan salah satu struktur indeks dinamis yang digunakan dalam efisiensi pengambilan objek basis data spasial sesuai dengan lokasi spasialnya. R-tree merupakan pengembangan lebih lanjut dari B+-Tree untuk pengindeksan objek spasial yang keduanya merupakan high-balanced tree, dimana node leaf akan berada pada level yang sama.

Penelitian sebelumnya mengatakan bahwa urutan insertion dan deletion dapat mempengaruhi perbedaan struktur indeks R-tree yang terbentuk. Tugas akhir ini menguji apakah perbedaan struktur indeks R-tree yang terbentuk dari urutan insertion dan deletion yang berbeda dapat mempengaruhi performansi dari R-tree tersebut. Pengujian dilakukan dengan menggunakan query spasial yakni range search pada masing-masing skema urutan insertion maupun deletion yang berbeda.

Hasil pengujian menunjukkan bahwa urutan insertion dan deletion objek yang memperhatikan kedekatan objek pada lokasi spasialnya akan menghasilkan indeks R-tree yang lebih baik ditinjau dari overlap antar node yang dihasilkan akan lebih minimal dibandingkan dengan yang tidak memperhatikan dedekatan objek. Selain itu variasi distribusi data spasial akan berpengaruh terhadap performansi R-tree. Penyebaran data yang tergolong sangat padat akan menghasilkan performansi yang cenderung lebih baik pada proses pembentukan indeks R-tree, namun

menghasilkan performansi yang buruk pada proses range search dibandingkan dengan data yang penyebarannya lebih jarang (sparse dataset).

Kata Kunci : R-Tree, spatial, indexing, urutan, insertion, deletion, query, performance

(2)

Abstract

One of the key issue in the development of spatial database is that how efficiently the spatial query is handled, because of processing spatial queries requires a higher computational cost compared to standard relational database queries. Because spatial data tend to be dynamic, large, and complex, an efficient index structure required to improve the performance of spatial queries. R-Tree (Rectangle Tree) is a dynamic index structure used for efficiency in the retrieval of spatial database objects according to their spatial location. R-tree is a further development of the B+-Tree for indexing spatial objects which are both high-balanced trees, where leaf nodes will be at the same level.

Previous research claims that the order of insertion and deletion can affect the differences form of R-tree index structure. This final project will prove whether the differences form in R-tree index structure made by the different ordering of insertion and deletion may affect the

performance of the R-tree. Experiments were done using the spatial query “range serach” at each different insertion and deletion ordering scheme.

The test results show that the sequence of objects that related to their spatial locations are shown to produce better performance in terms of minimal overlap produced more than the order of objects that are not related to the spatial location moreover the variation of the distribution of spatial data will affect the performance of R-tree. The distribution of data with very high dense will tend to produce better performance on constructing R-tree index, but produce poor performance on the range search as compared with dataset which object distribution is more sparse.

Keywords : R-Tree, spatial, indexing, order, insertion, deletion, query, performance

Powered by TCPDF (www.tcpdf.org)

(3)

1

1. Pendahuluan

1.1

Latar belakang

Salah satu persyaratan bagi database management systems (DBMS) saat ini adalah kemampuannya untuk menangani data-data spasial. Data spasial berisi informasi tentang objek multidimensi seperti identitas, lingkup, serta lokasinya dalam ruang [1]. Basis data spasial menjadi semakin populer dengan banyak aplikasi seperti komputer grafis, kartografi, computer aided design (CAD),

geographical information system (GIS), dan basis data multimedia [3].

Kunci utama dalam pengembangan basis data spasial yaitu seberapa efisien

query spasial ini ditangani, sebab pemrosesan query spasial membutuhkan biaya

komputasi yang lebih tinggi dibandingkan dengan query basis data relasional biasa. Karena data spasial cenderung bersifat dinamis, besar, dan kompleks, maka struktur indeks yang efisien dibutuhkan untuk meningkatkan kinerja query spasial [1].

Berbagai macam struktur indeks spasial telah diusulkan dalam berbagai literatur. Sebagian besar struktur indeks yang diusulkan umumnya berupa struktur hirarki berdasarkan prinsip dekomposisi rekursif dengan membagi-bagi ruang menjadi sub-region. Adapun elemen penting dalam indeks spasial yaitu bagaimana struktur indeksnya, bagaimana memodifikasi indeks (insert, update,

delete objek), bagaimana pemrosesan querynya, dan teknik pencarian yang

dilakukan dengan menggunakan indeks tersebut.

R-tree (Rectangle Tree) merupakan struktur indeks dinamis yang pertama

kali diusulkan oleh Antonin Guttman pada 1984 [GUT84] yang merupakan struktur indeks paling sering digunakan dalam efisiensi pengambilan objek basis data spasial sesuai dengan lokasi spasialnya [2]. R-tree merupakan pengembangan lebih lanjut dari B-tree untuk pengindeksan objek spasial yang keduanya merupakan high-balanced tree, dimana node leaf akan berada pada level yang sama [1]. Karena struktur indeks bersifat dinamis, maka insertion dan deletion dapat dicampurkan dalam pencarian, serta tidak perlu adanya reorganisasi secara periodik yang harus dilakukan [2].

Telah banyak penelitian yang menyebutkan bahwa urutan insertion dan

deletion yang berbeda untuk data-data spasial yang sama akan menghasilkan R-tree yang berbeda. Sebagai contoh jika akan memasukkan objek spasial dengan

urutan 1, 2, 3, 4, 5, maka R-tree yang terbentuk akan berbeda dengan objek yang dimasukkan dengan urutan 5, 4, 3, 2, 1 atau urutan lainnya. Permasalahan tadi memunculkan sebuah pertanyaan tentang bagaimana pengaruh urutan pemasukan objek spasial tadi terhadap performansi/cost yang dihasilkan jika diberikan query tertentu terhadap masing-masing R-tree yang terbentuk.

Tugas akhir ini akan membahas mengenai struktur indeks spasial, bagaimana query yang digunakan dalam basis data spasial, bagaimana algoritma

insertion/deletion berjalan dalam proses pembentukan R-tree, serta bagaimana

teknik restrukturisasi pada indeks spasial sehingga dapat dibuktikan apakah perbedaan struktur R-tree yang telah terbentuk tersebut dapat menimbulkan perbedaan dalam performansi/cost pada query yang diberikan.

(4)

2

1.2

Perumusan masalah

Dalam tugas akhir ini permasalahan yang akan dibahas antara lain:

1. Bagaimana algoritma insertion dan deletion berjalan pada proses pembentukan indeks R-Tree.

2. Bagaimana query pada R-tree dalam basis data spasial.

3. Bagaimana pengaruh urutan insertion/deletion pada performansi/cost indeks

R-Tree dengan urutan yang berbeda.

4. Seberapa jauh perbedaan performansi untuk masing-masing R-Tree yang terbentuk.

Batasan masalah

Dalam implementasi tugas akhir ini dibatasi oleh beberapa hal diantaranya adalah: 1. Teknik splitting yang akan digunakan dalam proses pembentukan minimun

bounding rectangle (MBR) adalah linear splitting sebab lebih efisien dalam

hal insert data dibandingkan dengan teknik splitting lainnya.

2. Teknik spatial indexing atau struktur indeks spasial yang digunakan adalah

basic R-tree melihat kesederhanaan yang dimilikinya.

3. Jenis spatial query yang digunakan adalah range query.

4. Data-data spasial yang akan dipakai sebagai dataset berupa data vektor spasial dua dimensi (2D-space spatial object) melihat ukuran file yang ekonomis dan presisi dalam lokasi.

1.3

Tujuan

Tujuan yang ingin dicapai dalam tugas akhir ini adalah:

1. Menganalisis pengaruh urutan insertion/deletion yang berbeda pada pembentukan struktur indeks R-tree.

2. Menganalisis pengaruh perbedaan struktur masing-masing R-Tree yang terbentuk terhadap performansi/cost jika diberikan query tertentu.

1.4

Metodologi penyelesaian masalah

Metodologi yang digunakan dalam memecahkan masalah di atas adalah dengan menggunakan langkah-langkah berikut:

1. Studi literatur

a. Mencari referensi yang berhubungan dengan topik tugas akhir yaitu konsep basis data spasial, konsep R-tree serta referensi-referensi penunjang lainnya.

b. Mempelajari dan memahami materi terkait yang berhubungan dengan tugas akhir.

2. Pengumpulan data

Melakukan pencarian data yang diperlukan untuk mendukung penyelesaian masalah.

3. Analisis dan perancangan kebutuhan sistem.

Melakukan analisis dan perancangan terhadap sistem yang dibangun, menganalisis metode yang akan digunakan untuk menyelesaikan

(5)

3 permasalahan, termasuk menentukan bahasa pemrograman yang digunakan, arsitektur, fungsionalitas, dan antarmuka sistem.

4. Implementasi sistem

Melakukan implementasi sistem berupa perangkat lunak yang sesuai dengan perancangan sistem yang telah dilakukan sebelumnya.

5. Testing dan analisa hasil

Melakukan pengujian sistem dan menganalisis hasil keluaran sistem yang berupa perbandingan performansi untuk masing-masing R-tree yang terbentuk.

Powered by TCPDF (www.tcpdf.org)

(6)

44

5. Kesimpulan dan Saran

5.1

Kesimpulan

Berdasarkan hasil analisis dan pengujian yang telah dilakukan, tugas akhir ini memiliki kesimpulan sebagai berikut:

1. Perbedaan urutan insertion dan deletion yang berbeda akan menghasilkan struktur R-tree yang berbeda baik dari jumlah node maupun tinggi R-tree yang terbentuk.

2. Urutan insertion dan deletion objek yang memperhatikan kedekatan objek pada lokasi spasialnya akan menghasilkan indeks R-tree yang lebih baik ditinjau dari ukuran MBR yang dihasilkan akan lebih kecil dibandingkan dengan yang tidak memperhatikan kedekatan objeknya sehingga dead area pada MBR yang dihasilkan akan lebih minimal.

3. Variasi distribusi data spasial akan berpengaruh terhadap performansi R-tree. Penyebaran data yang tergolong sangat padat akan menghasilkan performansi yang cenderung lebih baik pada proses pembentukan indeks R-tree, namun menghasilkan performansi yang lebih buruk pada proses range search dibandingkan dengan data yang penyebarannya lebih jarang (sparse dataset).

4. Jumlah node overlap yang dihasilkan pada indeks R-tree baik dari urutan

insertion maupun deletion yang berbeda dapat mempengaruhi performansi

dari query yang hasilkan. Jumlah node overlap yang lebih sedikit akan menghasilkan performansi yang lebih baik dibandingkan dengan jumlah node

overlap yang lebih banyak.

5.2

Saran

Untuk pengembangan sistem yang lebih baik, terdapat beberapa hal yang dapat dikembangkan, diantaranya :

1. Sistem dapat dikembangkan dengan menggunakan teknik indexing spasial lainnya yang merupakan pengembangan lebih lanjut dari basic R-tree seperti R*-Tree, Hilbert R-Tree, Linear R-tree, R+-Tree dan varian lainnya.

2. Pada tugas akhir ini, data spasial yang digunakan adalah data vektor spasial dua dimensi (2D-space spatial object), sehingga penelitian dapat dilanjutkan jika menggunakan data vektor spasial berdimensi lain.

Powered by TCPDF (www.tcpdf.org)

(7)

45

Daftar Pustaka

[1] Al-Badarneh, A., & Tawil, M. (2009). Linear R-Tree Revisited. International

Journal of Computers and Applications, Vol. 31, No. 2 .

[2] Arge, Lars, Hinrichs, Klaus H., Vahrenhold, Jan, Vitter, & Jeffrey Scott.

Effcient Bulk Operations on Dynamic R-trees.

[3] Guttman, A. (1984). R-trees: A Dynamic Index Structure for Spatial

Searching.

[4] Huang, P.W., Lin, P.L., & Lin, H.Y. Optimizing Storage Utilization in R-tree

Dynamic Index Structure for Spatial databases.

[5] Hutapea, Julia. (2011). Analisis dan Implementasi Spasial Indexing R*-Tree

pada Sistem Facility Monitoring Berbasis WebGIS. Bandung : Institut Teknologi

Telkom.

[6] Kamel, I., & Faloutsos, C. (1994). Hilbert R-tree: An improved R-tree using

fractals.

[7] Kemper, A. (2003). Algorithms and Datastructures for Database Systems. [8] Liu, Juhong, Panajoti, Gent, & Xiao, Huiyong. Indexing.

[9] Manolopoulos, Y., Nanopoulos, A., Papadopoulos, A. N., & Theodoridis, Y. (2006). R-Trees: Theory and Applications. Greece: Springer.

[10] Murugappan', A. (2001). Buffered R Trees.

[11] Manopoulos, Alexandros, Vassilakoupoulos, Michael, & Manolopoulos, Yannis. Performance Evaluation of Lazy Deletion Methods in R-trees. Greece : Aristotele University of Thessaloniki.

[12] Philippe, R., Scholl, M., & Voisard, A. (2002). Spatial Database with

Application to GIS. USA: Morgan Khaufmann.

[13] Penjadwalan CPU. (Online),

(http://bebas.vlsm.org/v06/Kuliah/SistemOperasi/2002/riene101/produk/Materi/Pe njadwalan_CPU.html , diakses 05 April 2012).

[14] Pramukanto, Q. (2010). Sistem Pengelolaan Basis Data (Database

Management System) Spasial. Bogor: Departemen Arsitektur Lanskap.

[15] Theodoridis, Y., & Sellis, T. A Model for the Prediction of R-tree

Performance.

[16] Theodoridis, Y., & Sellis, T. On the Performance Analysis of

Multi-dimensional R-tree-based Data Structures.

(8)

46 [17] Yeung, A. K., & Hall, G. B. (2007). Spatial Database Systems - Design,

Implementation and Project Management. Springer .

Powered by TCPDF (www.tcpdf.org)

Referensi

Dokumen terkait