Sekumpulan field yang bergambung sebagai sebuah unit yang memiliki ukuran tertentu

(1)

Soal2 UTS SBD 2011, terdiri dari: 1. Teori -teori

2. B-Tree dan B+ Tree (Plus) 3. Alt Query AR (Aljabar Relasional) 4. Hitung cost I/Os

5. Hashing

6. Indexing, Primary, Sekundary, Sparse, dan Dense 7. Blocking Factor

8. DDL/SQL ( dan BTreenya)

Introduction :

---Elemet dasar dari suatu data , misal nama ○

Field

-Sekumpulan field yang bergambung sebagai sebuah unit yang memiliki ukuran tertentu

○ Record

-Kumpulan dari record yang sama ○

File

-Kumpulan fakta yang memiliki arti atau informasi ○

Data -Definisi :

Struktur media penyimpanan :

---Chace memori ○ Main memori ○ Primari Storage -Electrik disk ○ Magnetic disk ○ Secondary Storage -Optical Storage ○ Tape Storage ○ Tertiary Storage

-Hirarki media penyimpanan

Merupakan suatu sisi melingkar pada disk yag digunakan sebagai bagian untuk menyimpan data

○ Track

-Merupakan bagian dari track, dimana setiap sektor memiliki ukuran yang sama.

○ Sektor

-Block merupakan pembagian dari sebuah track / kumpulan raceod yang memiliki ukuran yang fix sesuai dengan OS

○ Block

-Bagian yang memisahkan antar block ○

Interblock Gaps

-Bagian dari storage yang bertugas untuk membaca dan menulis ○

Read/Write head

-Merupakan sebuah piringan atau kumpulan track dalam sebuah disk ○

Cylinder

-Istilah dalam Disk

Cara Akses Pada Disk

@wisnu

UTS SBD

25 Oktober 2011 21:46

(2)

Waktu yang dibutuhkan head untuk mencapai track 

Seek time ○

Waktu yang diperlukan untuk menuju sektor/block yang dituju 

Rotational delay ○

Waktu yang dibutuhkan menuju posisi disk yang akan dibaca/ditulis



Waktu yang diperlukan sebelum proses transfer berjalan 

Seek + rotational 

Acces time ○

Waktu yang diperlukan untuk transfer dari/ke disk 

Transfer time ○

Skala tranfer data yang dapat dilakukan disk misal 100mbps 

Data transfer rate ○

Waktu untuk akses

-Digunakan untuk meningkatkan reliablility, meningkatkan kemampuan untuk redudant arrays pada satu disk

○

Sistem RAID tersebut digunakan untuk kehandalan yang lebih tinggi dan kinerja yang lebih tinggi.

○

Ada 6 level dalam RAID ○

RAID

-Cara Akses Pada Disk

Blocking :

---Bla bla ○

Buffer management

-Merupakan sebuah unit struktur data ○

Sebuah record dapat memiliki ukuran yang fix maupun bebas ○

Tuple 

Node pada tree 

Misal ○ Record

-Adalah sekumpulan record yang tersimpan sebagai satu unit dalam disk ○

File

-Blocking

-Spanning organization : dengan cara ini bisa dipastikan tidak ada ruang kosong dalam sebuah block dikarenakan semua record/ sebuah recod dapat disimpan dalam block-block yang berbeda. 

Non-spanning organization : dengan cara ini dalam sebuah block bisa saja terdapat ruang kosong dikarenakan recod yang

menempati block tersebut tidak sebesar block yang ada. 

Blocking adalah proses pemnyimpanan sejumlah record dalam sebuah block. Merujuk pada cara penempatan record dalam block ada 2 cara: ○

Jumlah rocord per block ○

Blocking factor (bfr)

-Adalah sebuah unit data transfer dari DBMS ke view side. ○

Disk block merupakan bagian terkecil dari page size. ○

Ukuran page biasanya : 1-10Kbytes ○

Page

(3)

-Fixed Blocking 

Variable-length spanned blocking 

Variable-length unspanned blocking 

Merupakan metode penempatan record dimana pada metode ini semua record data dianggap memiliki ukuran yang sama

□

Ukuran record harus lebih kecil dari block 

Boros tempat, karena ukuran record pasti tidak sama dengan blovk



Penghapusan yang suklit dimana posisi awal data yang dihapus harus diisi.

 Blocking facornya :  Kelemahan □ Fixed Blocking 

Merupakan metode penempatan record dimana ukuran record boleh beda2 dan record dapat ditaruh pada 2 block yang berbeda/ displit

□

Ukuran record >= block □

Tidak ada tempat yang terbuang □

Susah diimplementasikan □

Harus ada pointer (P) antar blok jika ada data yg displit □

Ukuran block efectif ( B - P) □

Ukuran Record + maker = (R + M) □

BFR = (B-P)/(R+M) □

Variable-length spanned blocking 

Ukuran record bisa berbeda namun tidak bisa displit □

Ukuran record <=block □

Variable-length unspanned blocking 

Merupakan tempat yang tidak bisa disimpan data □

Wg = tempat yang terbuang pada gap antar block □

Wr = tempat yang terbuang karenan blocking □

Wasted Space (W) 

Merupakan rate dimana data dapat diambil atau disimpan dalam disk

□

Waktu untuk transfer record dengan ukuranan R

◊

Record transfer time 

Waktu untuk transfer block ◊

Block transfer time 

Ada 2 transfer rate : □

Waktu untuk transfer data yang banyak  Bulk transfer □ Transfer rate  Tipe Blocking ○

Satu set block di alokasikan bersamaan dengan waktu pembuatan file tersebut

□

Block mulai dan panjang file 

Hanya ada satu entri dalam tabel alokasi □

Bisa terjadi ragmentasi external □

Contiguous allocation 

Metode Alokasi File ○

(4)

Bisa terjadi ragmentasi external □

Alokasi pada block individu □

Setiap blok berisi pointer untuk block berikutnya dalam chain

□

Block mulai dan panjang file 

Hanya ada satu entri dalam tabel alokasi □

Tidak ada externa fragmentasi □

Bagus untuk sequential file □

Chained allocation 

Tabel alokasi file berisi salinan jumlah level index untuk setiap file

□

Index memiliki satu entri untuk setiap porsi alokasi untuk file

□

Tabel alokasi berisi number blok dan indexnya □

Indexed Allocation 

Exercise : ○

Screen clipping taken: 27/10/2011 11:49

(5)

Screen clipping taken: 27/10/2011 11:49 File Organization: ---Pile -Sequential file

-Indexed sequential file

-Indexed file

-Direct (Hashed) file

-Pile Juga disebut dengan Heap file ○

Data baru dapat dimasukkan begitu saj ake dalam file ○

Ukuran record dan urutan field boleh beraneka ragam ○

Biasanya digunakan exhausetive search ○

Tidak memiliki structure tertentu ○

Peng-insertan data sangat efesien ○

Search sangat tidak efesien karena linier search ○

Penghapusan juga kurang efesien ○

Pile / heap

-Ukuran dan urutan yang tetap ○

Satu field adalah key field / ID unik dari record ○

Record di simpan berurutan berdasarkan key ○

Nama file dan ukuran merupakan atribut dari file ○

Harus menggunakan sequential search (batch system) 

Binary search bisa digunakan namun harus tau ukuran dan posisi tengah dari file



Susah untuk insert data baru 

Penanganan ○

Master file 

Log Transaction file 

Komponen : ○

Performance kurang bagus ○

Data baru ditempatkan ke transaction log terlebih dahulu ○

Jika log full atau dilakukan update maka log file akan di merge dengan master file

○

Sequential/Ordered file

-Menambahkan index untuk meningkatkan kecepatan pencarian ○ Index  Main file  Overflow file  Komponen : ○ Proses pencarian Indexed Sequential File

(6)

Pertama index disearch untuk mencari nilai yang mendekati nilai yang akan dicari



Setelah menemukan itu, maka aka dilanjutkan search di main file dengan indikasi pointer dari index.



Proses pencarian ○

Index File :

---Dengan mengindexkan atribut2 yang ada, kita bisa mempercepat proses pencarian. Seacara konsep sama dengan metode index pada buku ○

Index File

-Memiliki index untuk setiap search key value yang berhubungan dengan data pada file utma



Contoh : 

Dense Index : ○

Hanya memiliki index untuk beberapa search key value, tidak semuanya memiliki index



Contoh : 

Sparse (Nondense) ○

Klasifikasi Index File :

(7)

-Screen clipping taken: 27/10/2011 12:26

Digunakan untuk pengurutan key field di data records 

adalah indeks yang didefinisikan terlebih dahulu untuk memesan sebuah kata kunci pada data.



Primary index ○

Merupakan index yang merupakan search key yang juga mendefinisikan sequential order dari file.



Pada clustering Index terdapat satu entri indeks untuk setiap nilai yang berbeda dari setiap field, titik entri indeks ke blok data pertama yang berisi catatan dari nilai field. Pada metode clustering index aktifitas insert dan delete relatif lebih mudah. 

Contoh : 

Clustering Index ○

(8)

Sebuah indeks sekunder menyediakan sarana sekunder untuk mengakses sebuah file dimana akses utama file tersebut sudah ada.



Indeks sekunder mungkin terdapat pada bidang yang merupakan candidate key dan memiliki nilai unik dalam setiap catatan, atau non-kunci dengan nilai-nilai duplikat.



Secondary Indeks adalah file yang terurut menjadi dua bidang, dimana bidang pertama adalah tipe data yang sama seperti beberapa bidang tidak terurut. Sedangkan bidang kedua adalah pointer blok atau pointer record.



Dalam Secondary indexes terdapat satu entri untuk setiap record dalam file data, oleh karena itu secondary indexes merupakan dense  Contoh :  Secondary Index ○

(9)

Contoh :

(10)

Menambahkan index untuk memperkecil / mepersempit jarak pencarian dari dense / undense index.



Contoh : 

Multi-Level Index ○

(11)

Tree Access Structure :

---ISAM = Indexed Sequential Access Method ○

Memiliki struktur statis. ○

Tidak mendukung bulk loading ○

Memiliki overflow ○

Dimulai dari root dan melakukan perbandingan untuk mendapat leaf( tempat data)

 Search : ○

Mencari leaf posisi yang tepat dari data 

Insert : ○

Mencari posisi data pada leaf  Delete ○ Strukture : ○ ISAM

(12)

Merupakan yang paling bnyak digunakan ○

Minimal harus terdapat 50% field dari node terisi, kecuali root ○

Mendukung Bulk Loading load data yang banyak ○

Search sama seperti ISAM namun perbedaanya B+tree memiliki struktur yang dynamic

○

Mencari posisi leaf yang pass 

Jika pasisi masi tersisa maka selesai 

Jika tempat pada leaf sudah full maka lakukan split 

Bawa ke atas nilai yang berada pada posisi yang ditengah 

Insert data pada B+tree ○

Split pada root membuat tingkat/tinggi tree bertambah ○

Melebar 

Atau bertambah tinggi/level ke atas 

Pertambahan tree membuat ree menjadi ○

Contoh : ○

B+Tree

(13)

-http://www.scribd.com/doc/18210/B-TREE-TUTORIAL-PPT



http://www.youtube.com/watch?v=coRJrcIYbF4



Bisa dilihat contohnya di : ○

Hashing :

---Hashing adalah sebuah teknik dimana tempat peletakan data ditentukan oleh nilai pada hash field.

-Setiap halaman disebut dengan bucket ○

Bucket di beri nomor 0 sampai N-1 ○

Jika bucket telah penuh, sebuah overflow page harus dirangkai pada bucket tersebut

○

Pendekatan Hashing:

-Contoh Hash Index :