BAB II LANDASAN TEORI
2.1 Basis Data Terdistribusi
2.1.3 Replikasi Basis Data
Replikasi basis data adalah proses menyalin dan memelihara hubungan objek basis data dalam beberapa database yang membentuk sebuah sistem basis data terdistribusi (Connolly, 2005). Replikasi basis data merupakan mekanisme penting karena memungkinkan organisasi untuk memberikan akses ke pengguna data saat di mana dan kapan mereka membutuhkannya. Replikasi menggunakan teknologi basis data terdistribusi untuk berbagi data antara beberapa site, tapi replikasi basis data dan basis data terdistribusi tidak sama. Dalam sebuah basis data terdistribusi, data tersedia di banyak lokasi, tapi hubungan tertentu berada di satu lokasi.
Replikasi basis data memiliki beberapa keuntungan, seperti (Connolly, 2005) :
1. Ketersediaan (availability), meningkatkan ketersediaan data untuk pengguna dan aplikasi melalui penyediaan alternative akses data.
2. Keandalan (reability), dengan beberapa salinan data yang tersedia dalam sistem, memberikan fasilitas pemulihan yang sangat baik dalam hal kegagalan satu atau lebuh site.
3. Kinerja (performance), replikasi menyediakan akses cepat ke beberapa site. Pengguna dapat mengakses satu server sementara pengguna lain mengakses server yang berbeda, dengan demikian bisa mempertahankan tingkat kinerja seluruh server.
4. Pengurangan beban (load reduction), replikasi dapat digunakan untuk mendistribusikan data ke beberapa lokasi. Kemudian, pengguna dapat mengakses berbagai remote server bukan mengakses satu server pusat.
5. Komputasi terputus (disconnected computing), replikasi dapat mendukung
snapshot. Sebuah snapshot adalah salinan lengkap atau parsial (replika) dari suatu relasi pada satu titik waktu tertentu. Snapshot memungkinkan pengguna untuk bekerja pada subset dari basis data perusahaan selama terputus dari server basis data utama.
6. Mendukung banyak pengguna (supports many users), mengacu pada bagaimana sebuah organisasi perlu menggunakan banyak aplikasi yang membutuhkan kemampuan untuk menggunakan dan memanipulasi data. Replikasi dapat membuat beberapa snapshot yang disesuaikan sesuai persyaratan setiap pengguna atau kelompok pengguna sistem.
7. Mendukung aplikasi canggih (supports advanced applications), mengacu pada bagaimana sebuah organisasi perlu untuk membuat data perusahaan yang tersedia tidak hanya untuk sistem Online Transaction Processing (OLTP) tetapi juga untuk aplikasi analisis data seperti data warehousing, Online Analytical Processing (OLAP), dan data mining.
Dalam replikasi basis data, terdapat komponen dasar di lingkungan replikasi basis data, yaitu obyek replikasi (replication object), grup replikasi (group replication) dan site replikasi (replication site).
Obyek replikasi (replication object) adalah sebuah obyek basis data seperti relasi, indeks, view, procedure atau function yang ada pada multiple server dalam
sistem basis data terdistribusi. Obyek replikasi dikelola menggunakan grup replikasi.
Grup replikasi (group replication) adalah sebuah koleksi atau kumpulan dari obyek-obyek replikasi yang terhubung secara logika.
Grup replikasi terdapat terdapat di banyak site replikasi (replication site). Lingkungan replikasi mendukung dua tipe dasar dari site, yaitu master sites dan
slave sites. Sebuah grup replikasi dapat berhubungan dengan satu atau lebih master sites dan dengan satu atau lebih slave sites.
Ada beberapa fitur penting dari lingkungan replikasi basis data seperti replikasi data dikelola menggunakan replikasi synchronous atau asynchronous dan jika satu atau lebih site memiliki kepemilikan dari salinan master dari data yang direplikasi.
Replikasi synchronous menggunakan protocol 2PC (two-phase commit). Salinan data di slave diupdate segera ketika data sumber diupdate. Proses replikasi
Gambar 2. 2 Ilustrasi Proses Replikasi Synchronous (Connolly, 2005)
Pada gambar 2.2 diilustrasikan proses replikasi synchronous dimana pengguna menjalankan query dan query dieksekusi di master dan slave, kemudian dilakukan commit di master dan slave lalusistem memberikan status ke pengguna.
Replikasi asynchronous adalah metode alternatif dari replikasi synchronous. Dengan mekanisme replikasi asynchronous, target basis data (salinan data) diperbarui setelah basis data sumber sudah diubah. Dengan metode seperti itu dapat terjadi penundaan (delay) untuk mendapatkan konsistensi data yang dapat berlangsung dari beberapa detik hingga beberapa jam atau bahkan berhari-hari. Proses Replikasi asynchronous digambarkan pada ilustrasi berikut.
Gambar 2. 3 Ilustrasi Proses Replikasi Asynchronous (Connolly, 2005)
Pada gambar 2.3 diilustrasikan proses replikasi asynchronous dimana pengguna menjalankan query dan sistem mengeksekusi query di server master dan memberikan status ke pengguna. Lalu query di salin ke server slave dengan proses yang berbeda, dan kemudian query tersebutdieksekusi di server slave.
Basis data terdistribusi mencangkup tentang kepemilikan data untuk masing-masing site. Jenis utama dari kepemilikan data adalah master/slave,
workflow, dan update-anywhere (Connolly, 2005). 1. Master/slave
Dengan kepemilikan metode master/slave, data direplikasi secara asynchronous di satu site yang disebut site utama (master site) dan hanya dapat diperbarui oleh site tersebut. Pendistribusian data dilakukan dengan mengguanakan cara publish-and-subscribe dimana master site (sebagai
melakukan subscribe data yang dimiliki oleh master site, yang berarti slave sites menerima salinan read-only pada sistem. Tiap site dapat menjadi master site bagi kumpulan data (data set) yang tidak overlapping sehingga konflik
update dapat dihindari.
Gambar 2. 4 Kepemilikan master/slave – Data Dissemination
2. Workflow
Metode kepemilikan workflow hampir sama seperti metode master/slave, metode ini juga menghindari konflik update yang terjadi pada waktu yang bersamaan dengan cara model kepemilikan yang dinamis. Metode workflow
memberi hak untuk memperbarui data yang direplikasi untuk berpindah dari satu site ke site lain. Meskipun demikian, hanya pada waktu tertentu, hanya boleh satu site yang memperbarui data set.
3. Update-anywhere
Pada kedua model sebelumnya, pada satu waktu yang sama hanya satu site
yang bisa memperbarui data dan seluruh site hanya memiliki akses read-only
pada replika. Tapi pada metode ini menciptakan lingkungan yang peer-to-peer
dimana semua site memiliki hak yang sama untuk memperbarui replikasi data. Metode ini juga mengijinkan site lokal memiliki fungsi otonomi bahkan ketika
site lain tidak dapat diakses.
2.2 Sistem Administrasi