[TTG4J3] KODING DAN KOMPRESI. Oleh : Ledya Novamizanti Astri Novianty. Prodi S1 Teknik Telekomunikasi Fakultas Teknik Elektro Universitas Telkom

(1)

[TTG4J3] KODING DAN KOMPRESI

Prodi S1 Teknik Telekomunikasi Fakultas Teknik Elektro

Oleh :

Ledya Novamizanti Astri Novianty

(2)

 Kode (Code) adalah sekumpulan rangkaian bit-bit  Codeword adalah representasi bit per simbol

 Kode terdiri atas kumpulan codewords  _Contoh: Letter/Symbol Codeword a₁ 0 a₂ 01 a₃ 11 Code! (7 codewords) 110001011101

(3)

 Berdasarkan panjang kodenya, ada 2 jenis Kode:

1. Fixed-Length Code 2. Variable-Length Code

(4)

 Setiap simbol atau karakter (letter)

direpresentasikan oleh codeword yang panjangnya tetap (fixed)

 Contoh: representasi ASCII

 Setiap codeword memiliki panjang 8 bit  Banyaknya bit dalam sebuah pesan teks =

(5)

 Umumnya kompresi tidak menggunakan

Fixed-length Code

 _{Fixed-Length Code menyebabkan jumlah simbol}

yang dapat diencode menjadi terbatas

(6)

 _{Yaitu kode yang codewords-nya memiliki panjang}

berbeda-beda

 _{Digunakan untuk mengurangi jumlah bit yang diperlukan}

dalam merepresentasikan pesan teks

 Prinsip dasar:

 Simbol/karakter yang sering muncul -> codeword pendek

 Simbol/karakter yang jarang muncul -> codeword panjang

 _{Codeword sebuah simbol dapat berbeda pada pesan yang}

berbeda

 Rata-rata jumlah bit per symbol pada sebuah kode disebut rate

(7)

 Encode -> mengubah simbol/karakter pada message

menjadi kode

 _{Decode -> mengubah kembali kode ke}

simbol/karakter awal

 Tahapan mendasar kompresi teks:

(8)

 _{Idealnya, setiap pesan dapat di-encode menjadi}

kode yang memiliki karakterisitik:

1. Memiliki codeword yang unik

2. Tidak menyebabkan ambiguitas dalam men-decode

(Unique decodable)

3. Instantaneous Decodable 4. Average Length kecil

(9)

 Terdapat message (pesan) yang mengandung 4

simbol a₁, a₂, a₃, a₄ dengan probabilitas masing-masing simbol di dalam pesan tersebut:

P(a₁) = ½, P(a₂) = ¼, P(a₃) = P(a₄) = 1/8

(10)

 Misalkan message tersebut di-encode ke dalam

beberapa skema code sbb:

 Rata-rata panjang bit per simbol untuk

masing-masing kode disebut Average Length kode tersebut

a₁ a₂ a₃ a₄

Code 1 0 0 1 10

Code 2 0 1 00 11

Code 3 0 01 011 0111

(11)

 Average Length untuk kode di atas dihitung

menggunakan:

dengan:

 L = average length (bits/simbol atau bits/sampel)

 _P(a_i_{) = probabilitas simbol a}_i

(12)

 Di antara 4 skema kode di atas, kode mana yang

memiliki karakteristik ideal?

a₁ a₂ a₃ a₄ Average Length

Code 1 0 0 1 10 1.125

Code 2 0 1 00 11 1.25

Code 3 0 01 011 0111 1.875

(13)

 _{Ingat, karakterisitik kode ideal:}

1. Memiliki codeword yang unik

2. Tidak menyebabkan ambiguitas dalam men-decode (Unique decodable)

3. Instantaneous Decodable 4. Average Length kecil

(14)

 Code 1 = {0, 0, 1, 10}

 Average length paling kecil, tetapi codewords tidak

unik

 a₁ = a₂  codeword tidak unik!

 Code 1 tidak ideal, dapat menyebabkan ambiguitas  Misalkan string hasil encode: 11100100, hasil

decode? a₁ a₂ a₃ a₄ Average Length Code 1 0 0 1 10 1.125 Code 2 0 1 00 11 1.25 Code 3 0 01 011 0111 1.875 Code 4 0 10 110 111 1.75

(15)

 Code 2 = {0, 1, 00, 11}  Codewords unik

 Punya potensi masalah

Contoh: encode rangkaian simbol a₂ a₁ a₁

• _{Hasil encode 100}

• _{Hasil decode: a}₂ _a₁ _a₁ _{atau a}₂ _a₃ _?

 Tidak unique decodable

Code 1 0 0 1 10 1.125

Code 2 0 1 00 11 1.25

Code 3 0 01 011 0111 1.875

(16)

 _{Code 3 = {0, 01, 011, 0111}}

 Codewords unik

 _{Unique decodable}

 Semua codewords berawal ‘0’, yang membedakan adalah jumlah bit ‘1’

 Contoh: 01100101011101011 didecode menjadi?

 _{Bukan instantaneous code (Ketika mendapati codeword tertentu,}

belum dapat dipastikan bahwa codeword yang dimaksud adalah codeword tersebut, harus menunggu bit selanjutnya)

Code 1 0 0 1 10 1.125

Code 2 0 1 00 11 1.25

Code 3 0 01 011 0111 1.875

(17)

 Code 4 = { 0, 10, 110, 111}  Codewords unik

 _{Unique decodable}

 Tiga codewords berakhir ‘0’

 Satu codeword terdiri atas 3 bit bernilai 1

 Contoh: 10011111010010 didecode menjadi?

 Instantaneous code

artinya kode tersebut dapat diencode secara langsung

(instan) pada saat menemukan codewords yang sesuai tanpa perlu menunggu bit selanjutnya

Code 1 0 0 1 10 1.125

Code 2 0 1 00 11 1.25

Code 3 0 01 011 0111 1.875

(18)

 Misalkan ada 2 buah codewords a dan b, dengan

panjang a = k bits, panjang b = n bits, dan k < n

 Jika k buah bit pertama dari b adalah a, maka

 _a_{adalah prefix dari b}

 Sisa bit pada b disebut dangling suffix

 Misal a = 010, b = 01011

 _a _{prefix dari} _b

(19)

1. List semua codewords pada kode yang akan diuji

2. Jika ada codeword yang menjadi prefix dari codeword

lainnya, tambahkan dangling suffix tersebut ke list

3. Lakukan kembali pengecekkan prefix pada langkah 2 4. Pengecekkan berhenti jika:

1. Dangling suffix yang harus ditambahkan merupakan codeword

 not unique decodability

2. Tidak terjadi kondisi 1 dan tidak ada lagi penambahan dangling

(20)

 Diketahui code 5 dan code 6 sebagai berikut.

 Mana yang unique decodable?

Simbol Codeword a₁ 0 a₂ 01 a₃ 11 Simbol Codeword a₁ 0 a₂ 01 a₃ 10

(21)

 Code 5 = {0, 01, 11}

 Berdasarkan Unique Decodability Test: Unique

Decodable

 Contoh sampel:

 Decode string berikut: 011111111111

 _{Code 5 unique decodable, tetapi tidak}

(22)

 Code 6 = {0, 01, 10}

 Berdasarkan Unique Decodability Test: Not Unique

Decodable

 Contoh sampel:

 Decode string berikut: 01010101010101010

(23)

 Tentukan apakah kode-kode berikut unique

decodable atau tidak:

1. {0, 01, 11, 111} 2. {0, 01, 110, 111} 3. {0, 10, 110, 111}

(24)

 _{Berdasarkan unique decodability test, sebuah kode}

tidak unique decodable jika terdapat dangling suffix yang merupakan codeword pada kode tersebut

 Langkah aman utk menjamin sebuah kode itu unique

decodable adalah menghindari adanya dangling suffix

 _{D. k. l => tidak ada codeword yang menjadi prefix}

(25)

 Karakteristik instanteneous code hanya dipenuhi

oleh prefix-free code

 _{Prefix-Free code = unique decodable + instaneous}

code

(26)

 Dapat direpresentasikan dalam bentuk pohon biner  Ciri khas: setiap simbol akan menjadi leaves nodes,

(27)

 _{Prefix-free Code {01, 10, 11, 000, 001}}

 _{Jika n}_i_{= banyaknya codeword yang memiliki panjang bit}_i_{, maka:}

 n₂= 3 (pada level 2, ada 3 codeword)

 n₃= 2 (pada level 3 ada 2 codeword

1 1 1 1 0 0 0 0 11 10 01 001 000

(28)

 Code {0, 01, 011, 0111}

 _{Bukan prefix-free code,}

tapi unique decodable

 Code {0, 01, 11}

 Bukan prefix-free code, tapi unique decodable

1 0 0111 011 01 1 1 1 1 1 0 11 01

(29)

 _{Teorema 1}

Jika C adalah sebuah kode yang unique decodable yang terdiri atas N buah codewords, maka panjang keseluruhan codewordsnya akan

memenuhi ketidaksamaan:

 N = banyaknya codewords

 _l_j_{= panjang codeword ke-j (dalam bit)}

 _n_i_{= banyaknya codeword yang memiliki panjang bit}_i_,  _{b = base (dalam hal ini = 2)}

(30)



{01, 10, 11, 000, 001}



{0, 01, 011, 0111}



{0, 01, 11, 111}



{1, 10, 110, 111}

(31)

 Setiap unique-decodable-code, pasti memenuhi

ketidaksamaan Kraft-McMillan

 Bisa prefix-free code, atau

 Bukan prefix-free code

 Setiap kode yang tidak memenuhi ketidaksamaan

Kraft-McMillan, pasti bukan unique-decodable-code

 Setiap kode yang memenuhi ketidak samaan

(32)



{0, 01, 110, 111}

 _{Decode : 01111110}



{1, 10, 110, 111}

(33)

 Teorema 2

Untuk setiap himpunan codewords yang panjangnya memenuhi ketidaksamaan Kraft-McMillan yaitu

akan selalu dapat dibentuk prefix free-code dengan panjang codewords yang memenuhi Kraft-McMillan tersebut.

(34)

 Dengan kata lain, setiap prefix-free code pasti

memenuhi ketidaksamaan Kraft-McMillan, dan

 _{Untuk setiap komposisi panjang codeword pada}

kode yang memenuhi ketidaksamaan Kraft-McMillan, pasti dapat dibentuk prefix-fre-code

(35)



{0, 01, 110, 111}

 Tidak unique decodable, tapi komposisi panjang codeword pada kode tersebut memenuhi ketidaksamaan KM



{0, 10, 110, 111}

 _{Prefix free code dengan komposisi panjang codeword}

(36)

1. Diketahui kode {1, 10, 011, 100, 111, 0011, 1011}

 _{Apakah unique decodable?}  Apakah instantenoues code?

 Dapatkah dibentuk prefix-free-code yang memiliki

komposisi panjang yang sama dengan codewords pada kode tersebut? Jika iya, buat prefix-free codenya.

(37)

2. Diketahui sebuah code S = {1, 01, 001, 1010, 0111}

 _{Apakah kita dapat membentuk prefix-free code dengan}

komposisi panjang codeword yang sama dengan code S? Alasannya?

 Jika dapat, sebutkan contoh prefix code-nya

 Apakah S unique decodable?

(38)