Analisis Algoritma
Jimmy Tirtawangsa
Universitas Telkom 2014
Daftar Isi
(1) Motivasi
(2)
Kompleksitas dan Optimalitas
(3) Struktur data
(4) Teknik2 analisis algoritma
(5) Struktur graf
Kompleksitas dan Optimalitas
Saat menghadapi problem komputasi:
(1) Cari sebuah solusi algoritmik
(a) Cari ide, buat algoritma
(b) Buktikan algorima sesuai
(c) Analisis kompleksitasnya
(2) Kurang puas? Perbaikan solusi
(3) Apakah solusi optimal?
(4) Kiat apa jika optimal juga tidak cukup. Menembus batas
Contoh Ideal: Pengurutan Data
● Satu problem komputasi yang sangat
banyak manfaatnya
● Sudah diselidiki oleh banyak orang ● Berbagai solusi telah dikembangkan ● Optimalitas solusi sudah terbukti
● Berbagai cara untuk mengingkari batas
● Masukan: Sekumpulan data tersimpan dalam
array
● Keluaran: Salah satu permutasi data tersebut,
dimana data terurut monotonik membesar dari indek pertama s.d. indek terakhir
● Batasan: Algoritma menggunakan operator
pembandingan dua data untuk menguji relasi antar data (<, <=, >, atau >=)
Pengurutan Berbasis Seleksi
(SelectionSort)
● Ide: Pada setiap iterasi, cari data dengan
nilai terbesar dan taruh di lokasi terakhir.
● Algoritma SelectionSort: (1)i = n (2)while i > 1 do (3) j = Max(A, 1, i) (4) TukarPosisi(A, i, j) (5) i = i – 1
Pengurutan Berbasis Seleksi
● Dengan fungsi max sbb:
● fungsi Max( A, awal, akhir ) returns imax
(1)imax = awal
(2)j = imax + 1
(3)while j <= akhir do
(4) if A[j] > A[imax] then imax = j
(5) j = j + 1
(6)endwhile
Beberapa Obvervasi
● Pengurutan yang sama dapat diperoleh dengan
mencari nilai terkecil dan ditaruh diawal array
● Stabil adalah istilah untuk pengurutan, dimana
apabila ada data yang ekivalen (sama besar), setelah diurutkan, urutan semula tetap
dipertahankan.
Pengurutan Berbasis Seleksi
● Kebenaran algoritma tersebut dalam
mengurutkan data bergantung pada bukti untuk dua hal berikut:
– Algoritma tersebut akan berhenti setelah
mengurutkan data
Pengurutan Berbasis Seleksi
● Algoritma tersebut pasti akan berhenti karena:
– Semua instruksi didalam loop tersebut finite, atau
pasti akan selesai/berhenti
– Iterasi bergantung pada variabel i, dan variabel i
bergerak dari n s.d. 2 (sebelum i mencapai nilai
Loop Invarian Algoritma
SelectionSort
● Untuk membuktikan kebenaran algoritma pengurutan
diatas, perhatikan baris 3 (while i > 1 do)
● Apabila algoritma tersebut benar, maka setiap memasuki
loop tersebut, selalu berlaku kondisi (loop invarian)
– Data A[i+1..n] sudah terurut, dan – Data A[1..i] < data A[i+1..n]
● Sehingga pada saat keluar dari loop tersebut, atau i = 1,
maka
– A[2..n] sudah terurut, dan
Pembuktian dengan induksi
● Pada awal iterasi, i == n
– Basis: trivial karena belum ada data terurut
● Hipotesis: asumsi kondisi berlaku pada 1 < i==k < n
– A[k+1..n] terurut – A[1..k] < A[k+1..n]
● Induksi: Buktikan tetap berlaku untuk iterasi i==k-1 ● Proses didalam loop pada iterasi ke-i==k
– j berisi data terbesar diantara A[1..k]
– Karena TukarPosisi maka A[k,k+1, ..n] terurut dan
A[1..i-1] < A[k, k+1..n]
– Pada langkah terakhir i=i-1, maka kondisi diatas kembali
berlaku untuk i==k-1 ● Terbukti dengan induksi
Penggunaan Sumber Daya
● Biasanya dihitung terkait dengan
banyaknya data masukan
● Sumber daya dapat berupa waktu
eksekusi,
● Atau besar memori yang digunakan, ● Atau kebutuhan jaringan, dll
Perhitungan Sumber Daya
● Tidak menjumlahkan seluruh operasi yang
dilakukan:
– Terlalu rumit
– Waktu eksekusi setiap instruksi berbeda
untuk jenis prosesor berlainan
– Yang dicari adalah tren atau relasi antara
kebutuhan sumber daya terhadap pertumbuhan data
● Cukup menghitung operator yang relevan
– Pada proses pengurutan diatas, operator
Fungsi Kompleksitas
● Terhadap data masukan, adalah fungsi asimtot
untuk perkiraan kebutuhan sumber daya:
– Apabila merupakan perkiraan maksimum, fungsi
tersebut menjadi batas atas
– Sebaliknya,jika perkiraan kebutuhan minimum,
fungsi adalah batas bawah
● Dapat merupakan perkiraan kompleksitas:
– Rata-rata atas suatu distribusi data tertentu – Atas situasi terburuk yang mungkin terjadi
Batas Atas dan Batas Bawah
● Notasi O-Besar ● Notasi Omega-Besar ● Notasi Theta-Besar ● Notasi o-kecil ● Notasi omega-kecilAnalisis Kompleksitas
Pengurutan berbasis Seleksi
● Apabila fungsi Max memerlukan waktu
Θ(i) pada iterasi ke-i, dimana i=2..n
● Maka waktu yang diperlukan adalah
∑
i=2 nΘ(
i)=Θ(
(
n−1)(n+2)
2
)=Θ(
n
2)
Latihan
(1) Dengan induksi buktikan kebenaran fungsi Max
(2) Tunjukan Θ(n) adalah kebutuhan waktu eksekusi Max
(3) Mengapa hasil yang diperoleh dalam notasi-Θ?
(4) Pelajari dan lakukan eksperimen dengan
algoritma Selection sort, Bublesort, dan Insertion sort. Mengapa Bublesort lebih lambat daripada yang lain?
Pengurutan Yang Lebih Cepat
● Alasan perlu solusi yang lebih cepat
● Alasan saat solusi lebih cepat tidak diperlukan ● Percepatan dapat diperoleh dengan
menghilangkan redudansi proses
● Sumber redundansi proses:
– Pemeriksaan yang tidak perlu – Pengulangan pemeriksaan
Pengurutan dengan Heap
(HeapSort)
● Heap: Struktur berbentuk pohon, dimana nilai
data suatu node selalu lebih besar dari nilai data anak-anaknya
– Nilai data root selalu paling besar
● Representasi heap dalam array:
– Anak node i adalah node 2*i dan 2*i+1 – Root adalah node 1
● Dua operasi heap:
– BangunHeap – PerbaikiHeap
Algoritma Heapsort
● Ide: Memanfaatkan heap untuk mempercepat
proses seleksi ● Algoritma: (1)BangunHeap(A, n) (2)i = n (3)while i > 1 do (4) TukarPosisi(A, 1, i) (5) PerbaikiHeap(A, 1, i-1)
● PerbaikiHeap(A, i, n)
(1)lanjut = true
(2)while lanjut do
(3) lanjut = false
(4) p = i; l = 2*i; r = l+1
(5) if l <= n and A[l] > A[p] then p = l
(6) if r <= n and A[r] > A[p] then p= r
(7) if i != p then
(8) TukarPosisi(A, i, p)
(9) lanjut = true
● Prosedur BangunHeap(A, n) (1)i = floor(n/2) (2)while i >= 1 do (3) PerbaikiHeap(A, i, n) (4) i = i - 1 (5)endwhile
Pengurutan dengan Heap
● Bukti kebenaran algoritma Heapsort mirip
dengan bukti untuk algoritma sebelumnya
● Asalkan prosedur BangunHeap dan
PerbaikiHeap selalu menaruh data terbesar diposisi A[1]
Kebenaran PerbaikiHeap
● Prosedur ini berasumsi bahwa heap sudah benar, kecuali
pada posisi ke-i
● Baris 4-6 prosedur tersebut membandingkan node ke-i
dengan kedua anaknya, dan diperoleh node p dengan data terbesar.
● Jika node i bukan yang terbesar, baris 7-11 memastikan
sekarang kembali menjadi yang terbesar
● Baris 10 i menjadi p, sehingga asumsi kembali benar ● Proses berhenti jika
– node i tidak mempunyai anak node lagi
Kebenaran BangunHeap
● Pada awalnya, data belum membentuk heap ● Tapi, A[⌈n/2⌉..n] tidak mempunyai anak,
sehingga masing2 memenuhi definisi sebagai sub-heap yang benar
● Dimulai dari i == ⌈n/2⌉-1,dengan demikian pada
setiap iterasi, hanya node i yang mungkin
melanggar aturan heap, dan ini dapat diperbaiki oleh PerbaikiHeap
Pengurutan dengan Heap
● Kompleksitas PerbaikiHeap bergantung pada
jumlah iterasi 2-12:
– Berhenti jika i == p atau i > ⌊n/2⌋
– Atau berlanjut dengan i == 2*i atau 2*i+1
● Sehingga diperoleh O(log(n) – log(i))
Pengurutan dengan Heap
● Kompleksitas BangunHeap adalah
akumulasi dari PerbaikiHeap
● Kompleksitas BangunHeap adalah
O(n log(n))
∑
i=1 ⌊ n 2 ⌋Ο(
log(n)−log(i))≤
n
2
Ο(
log(n))
Algoritma Heapsort
● Algoritma:
(1)BangunHeap(A, n) O(n log n)
(2)i = n O(1)
(3)while i > 1 do n-1 iterasi
(4) TukarPosisi(A, 1, i) O(1)
(5) PerbaikiHeap(A, 1, i-1) O(log n – log i)
(6) i = i – 1 O(1)
Kompleksitas Heapsort
● Kompleksitas HeapsortΟ(
n log(n))+
∑
i=2 nΟ(
log(n)−log(i))
.≤Ο(n log(n))+(n−1)Ο(log(n))
.≤2Ο(n log(n))
Latihan
(1) Pelajari algoritma Quicksort dan Mergesort. Bandingkan dengan algoritma Heapsort!
Dalam kasus seperti apa Heapsort lebih baik, dan dalam kasus apa Quicksort lebih baik?
Begitu juga, bandingkan dengan Mergesort.
(2) Apakah Heapsort stabil atau tidak stabil?
Batas Optimal Pengurutan
● Perbaikan proses seleksi, meningkatkan
performa dari O(n2) menjadi O(n log n)
● Apakah mungkin untuk mendapatkan solusi
secara asimtot lebih cepat lagi? Atau solusi yang sudah diperoleh yang paling cepat?
● Dengan menganalisis masalah yang dihadapi,
dapat diketahui jumlah minimum operasi yang diperlukan!
Batas Optimal Pengurutan
● Proses pengurutan pada dasarnya adalah
proses permutasi dari data yang diberikan
● Untuk n data, maka akan ada n! (n faktorial)
kemungkinan permutasi data
● Salah satu permutasi akan memberikan susunan
data yang terurut
● Berapa banyak minimum operasi perbandingan
(dalam situasi terburuk) untuk melakukan
Pohon Keputusan
● Permutasi dari satu susunan data ke susunan
lain diperoleh melalui serangkaian operasi perbandingan.
● Setiap operasi menghasilkan dua alur berbeda,
akibat dari dari kondisi True/False
● Karena itu, dari susunan data semula, sejumlah
rangkaian operasi perbandingan kesemua kemungkinan n! permutasi susunan data membentuk graf pohon. (Pohon keputusan)
Pohon Keputusan
● Masing2 algoritma sorting dengan suatu input
susunan data awal akan membentuk pohon keputusan sendiri yang khas.
● Karena ide algoritma tersebut, sangat mungkin
beberapa operasi membandingkan dua data yang itu2 lagi lebih dari sekali dalam satu alur
untuk mencapai permutasi akhir yang diinginkan.
● Minimum operasi yang dibutuhkan untuk
algoritma tsb == maksimum tinggi pohon keputusannya
Optimalitas Proses Pengurutan
● Algoritma ideal akan mempunyai pohon keputusan yang
sangat balance dan tidak ada duplikasi operasi perbandingan dalam tiap jalurnya.
● Sehingga tinggi pohon adalah ⌈log(n!)⌉ atau Ω(n log n) ● Artinya hanya dengan operasi pembandingan, proses
pengurutan data secara asimtotik tidak dapat lebih cepat dari Ω(n log n)
● Dpl. diisimpulkan Heapsort adalah algoritma optimal, atau
Θ(n log n)
● Mungkin saja algoritma lain mempunyai eksekusi lebih
Latihan
● Lengkapi bukti pohon keputusan diatas
Menembus Batas
● Dalam beberapa situasi, algoritma optimal yang
paling efisienpun, mungkin masih belum mencukupi
● Kaji ulang masalah yang dihadapi
– Data mempunyai keterbatasan tertentu – Mungkin malah data tidak perlu diurutkan
● Mungkin pengurutan tidak perlu dengan operasi
perbandingan data
● Tetapi untuk menjamin keterurutan, setiap elemen
data harus terakses, sehingga
Pengurutan dengan Pencacahan
(CountingSort)
● Apabila rentang data (k) dari terkecil s.d.
terbesar, terbatas atau k = O(n)
● Untuk kemudahan pembahasan, data dianggap
bilangan integer
● Jumlah kemunculan data dapat dihitung, dan
Pengurutan dengan Pencacahan
● Algoritma CountingSort
(1)for i = terkecil to terbesar do
(2) C[i] = 0
(3)for i = 1 to n do
(4) C[A[i]]++
(5)for i = terkecil+1 to terbesar do
(6) C[A[i]] = C[A[i]] + C[A[i-1]]
(7)for i = n downto 1 do
(8) B[C[A[i]]] = A[i]
Pengurutan dengan Pencacahan
● Kebenaran CountingSort:
– Untuk data i dari terkecil s.d. terbesar,
– Setelah pencacahan, C[i] berisi jumlah kemunculan masing2
data i
– Setelah akumulasi, C[i] berisi jumlah data <= i
– Dpl, C[i] dapat menunjukkan indek terbesar dimana data i
disimpan setelah terurut (jika data i ada di A)
– Dengan memeriksa data di A satu persatu, data dapat
disimpan sesuai posisi di C[i], ke array B
– Isi C[i] disesuaikan setelah data disimpan di B
● Karena C[i] menunjuk posisi terbesar, dengan memulai
Kompleksitas CountingSort
● Proses inisialisasi array pencacah C
– O(k)
● Proses pencacahan isi array A
– O(n)
● Proses akumulasi hasil pencacahan di C
– O(k)
● Proses redistribusi data dari A ke B
– O(n)
Observasi CountingSort
● Counting Sort tergantung atas rentang
data yang diurutkan
● Counting Sort hanya membutuhkan waktu
linear
Pengurutan Bertahap Berdasar
Kolom Data
(RadixSort)
● Untuk data yang lebih besar
● Apabila data dapat dipecah terhadap
kolom/digit data
● Pengurutan dimulai dari digit yang lebih
kecil (least significant digit)
● Kemudian diulang, sampai ke digit terakhir
Pengurutan Bertahap
Berdasar Kolom Data
● Pengurutan per kolom dapat
menggunakan Counting Sort
● Karena rentang digit per kolom dapat jauh
Pengurutan Bertahap Berdasar
Kolom Data
Algoritma RadixSort
● Kompleksitas algoritma adalah
● dimana l adalah jumlah kolom
● Apabila l adalah konstan, maka diperoleh
O(n)
Latihan
(1) Apa yang perlu dilakukan jika data untuk CountingSort ternyata bukan integer?
(2)Apa yang terjadi jika pada RadixSort,
pengurutan dimulai dari digit kanan lebih dulu?
(3) Pelajari algoritma BucketSort. Mengapa waktu algoritma tersebut juga linear
Latihan
(4) Mengapa Ω(n) adalah batas bawah
proses sorting?
(5) Mengapa Counting Sort stabil? Bagaimana dengan Radixsort dan
Rangkuman
● Cari solusi efisien
● Cari solusi lebih baik jika dibutuhkan ● Batas atas usaha mencari solusi yang
lebih baik
● Alternatif solusi jika solusi optimum belum
Rujukan
● T. H. Cormen, C. E. Leiserson, R. L.
Rivest, dan C. Stein, “Introduction to Algorithms”, edisi 3, 2009.
● S Dasgupta, C. H. Papadimitrou, dan U.