Soal2 UTS SBD 2011, terdiri dari: 1. Teori -teori
2. B-Tree dan B+ Tree (Plus) 3. Alt Query AR (Aljabar Relasional) 4. Hitung cost I/Os
5. Hashing
6. Indexing, Primary, Sekundary, Sparse, dan Dense 7. Blocking Factor
8. DDL/SQL ( dan BTreenya)
Introduction :
---Elemet dasar dari suatu data , misal nama ○
Field
-Sekumpulan field yang bergambung sebagai sebuah unit yang memiliki ukuran tertentu
○ Record
-Kumpulan dari record yang sama ○
File
-Kumpulan fakta yang memiliki arti atau informasi ○
Data -Definisi :
Struktur media penyimpanan :
---Chace memori ○ Main memori ○ Primari Storage -Electrik disk ○ Magnetic disk ○ Secondary Storage -Optical Storage ○ Tape Storage ○ Tertiary Storage
-Hirarki media penyimpanan
Merupakan suatu sisi melingkar pada disk yag digunakan sebagai bagian untuk menyimpan data
○ Track
-Merupakan bagian dari track, dimana setiap sektor memiliki ukuran yang sama.
○ Sektor
-Block merupakan pembagian dari sebuah track / kumpulan raceod yang memiliki ukuran yang fix sesuai dengan OS
○ Block
-Bagian yang memisahkan antar block ○
Interblock Gaps
-Bagian dari storage yang bertugas untuk membaca dan menulis ○
Read/Write head
-Merupakan sebuah piringan atau kumpulan track dalam sebuah disk ○
Cylinder
-Istilah dalam Disk
Cara Akses Pada Disk
@wisnu
UTS SBD
25 Oktober 2011 21:46
Waktu yang dibutuhkan head untuk mencapai track
Seek time ○
Waktu yang diperlukan untuk menuju sektor/block yang dituju
Rotational delay ○
Waktu yang dibutuhkan menuju posisi disk yang akan dibaca/ditulis
Waktu yang diperlukan sebelum proses transfer berjalan
Seek + rotational
Acces time ○
Waktu yang diperlukan untuk transfer dari/ke disk
Transfer time ○
Skala tranfer data yang dapat dilakukan disk misal 100mbps
Data transfer rate ○
Waktu untuk akses
-Digunakan untuk meningkatkan reliablility, meningkatkan kemampuan untuk redudant arrays pada satu disk
○
Sistem RAID tersebut digunakan untuk kehandalan yang lebih tinggi dan kinerja yang lebih tinggi.
○
Ada 6 level dalam RAID ○
RAID
-Cara Akses Pada Disk
Blocking :
---Bla bla ○
Buffer management
-Merupakan sebuah unit struktur data ○
Sebuah record dapat memiliki ukuran yang fix maupun bebas ○
Tuple
Node pada tree
Misal ○ Record
-Adalah sekumpulan record yang tersimpan sebagai satu unit dalam disk ○
File
-Blocking
-Spanning organization : dengan cara ini bisa dipastikan tidak ada ruang kosong dalam sebuah block dikarenakan semua record/ sebuah recod dapat disimpan dalam block-block yang berbeda.
Non-spanning organization : dengan cara ini dalam sebuah block bisa saja terdapat ruang kosong dikarenakan recod yang
menempati block tersebut tidak sebesar block yang ada.
Blocking adalah proses pemnyimpanan sejumlah record dalam sebuah block. Merujuk pada cara penempatan record dalam block ada 2 cara: ○
Jumlah rocord per block ○
Blocking factor (bfr)
-Adalah sebuah unit data transfer dari DBMS ke view side. ○
Disk block merupakan bagian terkecil dari page size. ○
Ukuran page biasanya : 1-10Kbytes ○
Page
-Fixed Blocking
Variable-length spanned blocking
Variable-length unspanned blocking
Merupakan metode penempatan record dimana pada metode ini semua record data dianggap memiliki ukuran yang sama
□
Ukuran record harus lebih kecil dari block
Boros tempat, karena ukuran record pasti tidak sama dengan blovk
Penghapusan yang suklit dimana posisi awal data yang dihapus harus diisi.
Blocking facornya : Kelemahan □ Fixed Blocking
Merupakan metode penempatan record dimana ukuran record boleh beda2 dan record dapat ditaruh pada 2 block yang berbeda/ displit
□
Ukuran record >= block □
Tidak ada tempat yang terbuang □
Susah diimplementasikan □
Harus ada pointer (P) antar blok jika ada data yg displit □
Ukuran block efectif ( B - P) □
Ukuran Record + maker = (R + M) □
BFR = (B-P)/(R+M) □
Variable-length spanned blocking
Ukuran record bisa berbeda namun tidak bisa displit □
Ukuran record <=block □
Variable-length unspanned blocking
Merupakan tempat yang tidak bisa disimpan data □
Wg = tempat yang terbuang pada gap antar block □
Wr = tempat yang terbuang karenan blocking □
Wasted Space (W)
Merupakan rate dimana data dapat diambil atau disimpan dalam disk
□
Waktu untuk transfer record dengan ukuranan R
◊
Record transfer time
Waktu untuk transfer block ◊
Block transfer time
Ada 2 transfer rate : □
Waktu untuk transfer data yang banyak Bulk transfer □ Transfer rate Tipe Blocking ○
Satu set block di alokasikan bersamaan dengan waktu pembuatan file tersebut
□
Block mulai dan panjang file
Hanya ada satu entri dalam tabel alokasi □
Bisa terjadi ragmentasi external □
Contiguous allocation
Metode Alokasi File ○
Bisa terjadi ragmentasi external □
Alokasi pada block individu □
Setiap blok berisi pointer untuk block berikutnya dalam chain
□
Block mulai dan panjang file
Hanya ada satu entri dalam tabel alokasi □
Tidak ada externa fragmentasi □
Bagus untuk sequential file □
Chained allocation
Tabel alokasi file berisi salinan jumlah level index untuk setiap file
□
Index memiliki satu entri untuk setiap porsi alokasi untuk file
□
Tabel alokasi berisi number blok dan indexnya □
Indexed Allocation
Exercise : ○
Screen clipping taken: 27/10/2011 11:49
Screen clipping taken: 27/10/2011 11:49 File Organization: ---Pile -Sequential file
-Indexed sequential file
-Indexed file
-Direct (Hashed) file
-Pile Juga disebut dengan Heap file ○
Data baru dapat dimasukkan begitu saj ake dalam file ○
Ukuran record dan urutan field boleh beraneka ragam ○
Biasanya digunakan exhausetive search ○
Tidak memiliki structure tertentu ○
Peng-insertan data sangat efesien ○
Search sangat tidak efesien karena linier search ○
Penghapusan juga kurang efesien ○
Pile / heap
-Ukuran dan urutan yang tetap ○
Satu field adalah key field / ID unik dari record ○
Record di simpan berurutan berdasarkan key ○
Nama file dan ukuran merupakan atribut dari file ○
Harus menggunakan sequential search (batch system)
Binary search bisa digunakan namun harus tau ukuran dan posisi tengah dari file
Susah untuk insert data baru
Penanganan ○
Master file
Log Transaction file
Komponen : ○
Performance kurang bagus ○
Data baru ditempatkan ke transaction log terlebih dahulu ○
Jika log full atau dilakukan update maka log file akan di merge dengan master file
○
Sequential/Ordered file
-Menambahkan index untuk meningkatkan kecepatan pencarian ○ Index Main file Overflow file Komponen : ○ Proses pencarian Indexed Sequential File
Pertama index disearch untuk mencari nilai yang mendekati nilai yang akan dicari
Setelah menemukan itu, maka aka dilanjutkan search di main file dengan indikasi pointer dari index.
Proses pencarian ○
Index File :
---Dengan mengindexkan atribut2 yang ada, kita bisa mempercepat proses pencarian. Seacara konsep sama dengan metode index pada buku ○
Index File
-Memiliki index untuk setiap search key value yang berhubungan dengan data pada file utma
Contoh :
Screen clipping taken: 27/10/2011 12:25
Dense Index : ○
Hanya memiliki index untuk beberapa search key value, tidak semuanya memiliki index
Contoh :
Sparse (Nondense) ○
Klasifikasi Index File :
-Screen clipping taken: 27/10/2011 12:26
Digunakan untuk pengurutan key field di data records
adalah indeks yang didefinisikan terlebih dahulu untuk memesan sebuah kata kunci pada data.
Primary index ○
Merupakan index yang merupakan search key yang juga mendefinisikan sequential order dari file.
Pada clustering Index terdapat satu entri indeks untuk setiap nilai yang berbeda dari setiap field, titik entri indeks ke blok data pertama yang berisi catatan dari nilai field. Pada metode clustering index aktifitas insert dan delete relatif lebih mudah.
Contoh :
Clustering Index ○
Screen clipping taken: 27/10/2011 12:39
Sebuah indeks sekunder menyediakan sarana sekunder untuk mengakses sebuah file dimana akses utama file tersebut sudah ada.
Indeks sekunder mungkin terdapat pada bidang yang merupakan candidate key dan memiliki nilai unik dalam setiap catatan, atau non-kunci dengan nilai-nilai duplikat.
Secondary Indeks adalah file yang terurut menjadi dua bidang, dimana bidang pertama adalah tipe data yang sama seperti beberapa bidang tidak terurut. Sedangkan bidang kedua adalah pointer blok atau pointer record.
Dalam Secondary indexes terdapat satu entri untuk setiap record dalam file data, oleh karena itu secondary indexes merupakan dense Contoh : Secondary Index ○
Contoh :
Screen clipping taken: 27/10/2011 12:44
Screen clipping taken: 27/10/2011 12:46
Menambahkan index untuk memperkecil / mepersempit jarak pencarian dari dense / undense index.
Contoh :
Multi-Level Index ○
Screen clipping taken: 27/10/2011 12:49
Tree Access Structure :
---ISAM = Indexed Sequential Access Method ○
Memiliki struktur statis. ○
Tidak mendukung bulk loading ○
Memiliki overflow ○
Dimulai dari root dan melakukan perbandingan untuk mendapat leaf( tempat data)
Search : ○
Mencari leaf posisi yang tepat dari data
Insert : ○
Mencari posisi data pada leaf Delete ○ Strukture : ○ ISAM
-Screen clipping taken: 27/10/2011 13:11
Merupakan yang paling bnyak digunakan ○
Minimal harus terdapat 50% field dari node terisi, kecuali root ○
Mendukung Bulk Loading load data yang banyak ○
Search sama seperti ISAM namun perbedaanya B+tree memiliki struktur yang dynamic
○
Mencari posisi leaf yang pass
Jika pasisi masi tersisa maka selesai
Jika tempat pada leaf sudah full maka lakukan split
Bawa ke atas nilai yang berada pada posisi yang ditengah
Insert data pada B+tree ○
Split pada root membuat tingkat/tinggi tree bertambah ○
Melebar
Atau bertambah tinggi/level ke atas
Pertambahan tree membuat ree menjadi ○
Screen clipping taken: 27/10/2011 13:26
Contoh : ○
B+Tree
-http://www.scribd.com/doc/18210/B-TREE-TUTORIAL-PPT
http://www.youtube.com/watch?v=coRJrcIYbF4
Bisa dilihat contohnya di : ○
Hashing :
---Hashing adalah sebuah teknik dimana tempat peletakan data ditentukan oleh nilai pada hash field.
-Setiap halaman disebut dengan bucket ○
Bucket di beri nomor 0 sampai N-1 ○
Jika bucket telah penuh, sebuah overflow page harus dirangkai pada bucket tersebut
○
Pendekatan Hashing:
-Contoh Hash Index :
-Screen clipping taken: 27/10/2011 14:17