• Tidak ada hasil yang ditemukan

[TTG4J3] KODING DAN KOMPRESI. Oleh : Ledya Novamizanti Astri Novianty. Prodi S1 Teknik Telekomunikasi Fakultas Teknik Elektro Universitas Telkom

N/A
N/A
Protected

Academic year: 2021

Membagikan "[TTG4J3] KODING DAN KOMPRESI. Oleh : Ledya Novamizanti Astri Novianty. Prodi S1 Teknik Telekomunikasi Fakultas Teknik Elektro Universitas Telkom"

Copied!
38
0
0

Teks penuh

(1)

[TTG4J3] KODING DAN KOMPRESI

Prodi S1 Teknik Telekomunikasi Fakultas Teknik Elektro

Oleh :

Ledya Novamizanti Astri Novianty

(2)

 Kode (Code) adalah sekumpulan rangkaian bit-bit  Codeword adalah representasi bit per simbol

 Kode terdiri atas kumpulan codewords  Contoh: Letter/Symbol Codeword a1 0 a2 01 a3 11 Code! (7 codewords) 110001011101

(3)

 Berdasarkan panjang kodenya, ada 2 jenis Kode:

1. Fixed-Length Code 2. Variable-Length Code

(4)

 Setiap simbol atau karakter (letter)

direpresentasikan oleh codeword yang panjangnya tetap (fixed)

 Contoh: representasi ASCII

 Setiap codeword memiliki panjang 8 bit  Banyaknya bit dalam sebuah pesan teks =

(5)

 Umumnya kompresi tidak menggunakan

Fixed-length Code

Fixed-Length Code menyebabkan jumlah simbol

yang dapat diencode menjadi terbatas

(6)

Yaitu kode yang codewords-nya memiliki panjang

berbeda-beda

Digunakan untuk mengurangi jumlah bit yang diperlukan

dalam merepresentasikan pesan teks

 Prinsip dasar:

 Simbol/karakter yang sering muncul -> codeword pendek

 Simbol/karakter yang jarang muncul -> codeword panjang

Codeword sebuah simbol dapat berbeda pada pesan yang

berbeda

 Rata-rata jumlah bit per symbol pada sebuah kode disebut rate

(7)

 Encode -> mengubah simbol/karakter pada message

menjadi kode

Decode -> mengubah kembali kode ke

simbol/karakter awal

 Tahapan mendasar kompresi teks:

(8)

Idealnya, setiap pesan dapat di-encode menjadi

kode yang memiliki karakterisitik:

1. Memiliki codeword yang unik

2. Tidak menyebabkan ambiguitas dalam men-decode

(Unique decodable)

3. Instantaneous Decodable 4. Average Length kecil

(9)

 Terdapat message (pesan) yang mengandung 4

simbol a1, a2, a3, a4 dengan probabilitas masing-masing simbol di dalam pesan tersebut:

P(a1) = ½, P(a2) = ¼, P(a3) = P(a4) = 1/8

(10)

 Misalkan message tersebut di-encode ke dalam

beberapa skema code sbb:

 Rata-rata panjang bit per simbol untuk

masing-masing kode disebut Average Length kode tersebut

a1 a2 a3 a4

Code 1 0 0 1 10

Code 2 0 1 00 11

Code 3 0 01 011 0111

(11)

 Average Length untuk kode di atas dihitung

menggunakan:

dengan:

 L = average length (bits/simbol atau bits/sampel)

P(ai) = probabilitas simbol ai

(12)

 Di antara 4 skema kode di atas, kode mana yang

memiliki karakteristik ideal?

a1 a2 a3 a4 Average Length

Code 1 0 0 1 10 1.125

Code 2 0 1 00 11 1.25

Code 3 0 01 011 0111 1.875

(13)

Ingat, karakterisitik kode ideal:

1. Memiliki codeword yang unik

2. Tidak menyebabkan ambiguitas dalam men-decode (Unique decodable)

3. Instantaneous Decodable 4. Average Length kecil

(14)

 Code 1 = {0, 0, 1, 10}

Average length paling kecil, tetapi codewords tidak

unik

 a1 = a2  codeword tidak unik!

 Code 1 tidak ideal, dapat menyebabkan ambiguitas  Misalkan string hasil encode: 11100100, hasil

decode? a1 a2 a3 a4 Average Length Code 1 0 0 1 10 1.125 Code 2 0 1 00 11 1.25 Code 3 0 01 011 0111 1.875 Code 4 0 10 110 111 1.75

(15)

 Code 2 = {0, 1, 00, 11}  Codewords unik

 Punya potensi masalah

Contoh: encode rangkaian simbol a2 a1 a1

Hasil encode 100

Hasil decode: a2 a1 a1 atau a2 a3 ?

 Tidak unique decodable

a1 a2 a3 a4 Average Length

Code 1 0 0 1 10 1.125

Code 2 0 1 00 11 1.25

Code 3 0 01 011 0111 1.875

(16)

Code 3 = {0, 01, 011, 0111}

 Codewords unik

Unique decodable

 Semua codewords berawal ‘0’, yang membedakan adalah jumlah bit ‘1’

 Contoh: 01100101011101011 didecode menjadi?

Bukan instantaneous code (Ketika mendapati codeword tertentu,

belum dapat dipastikan bahwa codeword yang dimaksud adalah codeword tersebut, harus menunggu bit selanjutnya)

a1 a2 a3 a4 Average Length

Code 1 0 0 1 10 1.125

Code 2 0 1 00 11 1.25

Code 3 0 01 011 0111 1.875

(17)

 Code 4 = { 0, 10, 110, 111}  Codewords unik

Unique decodable

 Tiga codewords berakhir ‘0’

 Satu codeword terdiri atas 3 bit bernilai 1

 Contoh: 10011111010010 didecode menjadi?

 Instantaneous code

artinya kode tersebut dapat diencode secara langsung

(instan) pada saat menemukan codewords yang sesuai tanpa perlu menunggu bit selanjutnya

a1 a2 a3 a4 Average Length

Code 1 0 0 1 10 1.125

Code 2 0 1 00 11 1.25

Code 3 0 01 011 0111 1.875

(18)

 Misalkan ada 2 buah codewords a dan b, dengan

panjang a = k bits, panjang b = n bits, dan k < n

 Jika k buah bit pertama dari b adalah a, maka

a adalah prefix dari b

 Sisa bit pada b disebut dangling suffix

 Misal a = 010, b = 01011

a prefix dari b

(19)

1. List semua codewords pada kode yang akan diuji

2. Jika ada codeword yang menjadi prefix dari codeword

lainnya, tambahkan dangling suffix tersebut ke list

3. Lakukan kembali pengecekkan prefix pada langkah 2 4. Pengecekkan berhenti jika:

1. Dangling suffix yang harus ditambahkan merupakan codeword

 not unique decodability

2. Tidak terjadi kondisi 1 dan tidak ada lagi penambahan dangling

(20)

 Diketahui code 5 dan code 6 sebagai berikut.

 Mana yang unique decodable?

Simbol Codeword a1 0 a2 01 a3 11 Simbol Codeword a1 0 a2 01 a3 10

(21)

 Code 5 = {0, 01, 11}

 Berdasarkan Unique Decodability Test: Unique

Decodable

 Contoh sampel:

 Decode string berikut: 011111111111

Code 5 unique decodable, tetapi tidak

(22)

 Code 6 = {0, 01, 10}

 Berdasarkan Unique Decodability Test: Not Unique

Decodable

 Contoh sampel:

 Decode string berikut: 01010101010101010

(23)

 Tentukan apakah kode-kode berikut unique

decodable atau tidak:

1. {0, 01, 11, 111} 2. {0, 01, 110, 111} 3. {0, 10, 110, 111}

(24)

Berdasarkan unique decodability test, sebuah kode

tidak unique decodable jika terdapat dangling suffix yang merupakan codeword pada kode tersebut

 Langkah aman utk menjamin sebuah kode itu unique

decodable adalah menghindari adanya dangling suffix

D. k. l => tidak ada codeword yang menjadi prefix

(25)

 Karakteristik instanteneous code hanya dipenuhi

oleh prefix-free code

Prefix-Free code = unique decodable + instaneous

code

(26)

 Dapat direpresentasikan dalam bentuk pohon biner  Ciri khas: setiap simbol akan menjadi leaves nodes,

(27)

Prefix-free Code {01, 10, 11, 000, 001}

Jika ni= banyaknya codeword yang memiliki panjang bit i, maka:

 n2 = 3 (pada level 2, ada 3 codeword)

 n3 = 2 (pada level 3 ada 2 codeword

1 1 1 1 0 0 0 0 11 10 01 001 000

(28)

 Code {0, 01, 011, 0111}

Bukan prefix-free code,

tapi unique decodable

 Code {0, 01, 11}

 Bukan prefix-free code, tapi unique decodable

1 0 0111 011 01 1 1 1 1 1 0 11 01

(29)

Teorema 1

Jika C adalah sebuah kode yang unique decodable yang terdiri atas N buah codewords, maka panjang keseluruhan codewordsnya akan

memenuhi ketidaksamaan:

N = banyaknya codewords

lj= panjang codeword ke-j (dalam bit)

ni= banyaknya codeword yang memiliki panjang bit i, b = base (dalam hal ini = 2)

(30)

{01, 10, 11, 000, 001}

{0, 01, 011, 0111}

{0, 01, 11, 111}

{1, 10, 110, 111}

(31)

 Setiap unique-decodable-code, pasti memenuhi

ketidaksamaan Kraft-McMillan

 Bisa prefix-free code, atau

 Bukan prefix-free code

 Setiap kode yang tidak memenuhi ketidaksamaan

Kraft-McMillan, pasti bukan unique-decodable-code

 Setiap kode yang memenuhi ketidak samaan

(32)

{0, 01, 110, 111}

Decode : 01111110

{1, 10, 110, 111}

(33)

 Teorema 2

Untuk setiap himpunan codewords yang panjangnya memenuhi ketidaksamaan Kraft-McMillan yaitu

akan selalu dapat dibentuk prefix free-code dengan panjang codewords yang memenuhi Kraft-McMillan tersebut.

(34)

 Dengan kata lain, setiap prefix-free code pasti

memenuhi ketidaksamaan Kraft-McMillan, dan

Untuk setiap komposisi panjang codeword pada

kode yang memenuhi ketidaksamaan Kraft-McMillan, pasti dapat dibentuk prefix-fre-code

(35)

{0, 01, 110, 111}

 Tidak unique decodable, tapi komposisi panjang codeword pada kode tersebut memenuhi ketidaksamaan KM

{0, 10, 110, 111}

Prefix free code dengan komposisi panjang codeword

(36)

1. Diketahui kode {1, 10, 011, 100, 111, 0011, 1011}

Apakah unique decodable?  Apakah instantenoues code?

 Dapatkah dibentuk prefix-free-code yang memiliki

komposisi panjang yang sama dengan codewords pada kode tersebut? Jika iya, buat prefix-free codenya.

(37)

2. Diketahui sebuah code S = {1, 01, 001, 1010, 0111}

Apakah kita dapat membentuk prefix-free code dengan

komposisi panjang codeword yang sama dengan code S? Alasannya?

 Jika dapat, sebutkan contoh prefix code-nya

 Apakah S unique decodable?

(38)

Referensi

Dokumen terkait

[TTG4J3] Koding dan Kompresi Pengantar Kompresi Data  Untuk Lossless Compression, biasanya yang. dijadikan acuan performansi adalah

Berdasarkan uraian sebelumnya, maka teknik informatika membutuhkan sistem yang dapat membantu atau memberikan data yang informatif, yang menunjukkan capaian

Dari hasil proses pembelajaran yang dilakukan selama dua siklus dan berdasarkan hasil analisis yang telah dilakukan, yang menjadi kesimpulan pada penelitian ini adalah :

Kondisi air tanah di daernh penelitian mulai dari Bantar Gebang sampai Bekasi Selatan adalah baik, hat ini dapat dilihat dari peta potensi air tanah Bekasi yang

Fenomena tidak dikunjunginya ruang perlakuan yang diberi aroma minyak atsiri tersebut dapat dimungkinkan oleh beberapa alasan yaitu : Pertama, tikus tidak dapat

Meninjau sangat pentingnya peranan kurikulum, pemahaman dan pengembangannya dalam menentukan kualitas lulusan suatu program studi, maka kegiatan workshop kurikulum berbasis

Gambar 4 SIR LTE integrasi WiFi Gambar 5 Grafik PDF CDF SIR LTE integrasi WiFi Dari hasil simulasi SIR pada gambar (4) dan gambar (5) dapat dilihat bahwa parameter SIR

Kalau untuk yang sudah ikut latihan paling tidak 6 bulan atau lebih biasanya pelatih sudah bisa mapping kemampuan dia dan akan posisikan di posisi yang sesuai dengan fokus