Analisis Perbandingan Zero Compresion Dengan Difference Coding Pada Kompresi File Audio

(1)

ANALISIS PERBANDINGAN ALGORITMA ZERO COMPRESION DENGAN DIFFERENCE CODING PADA KOMPRESI FILE AUDIO

DRAFT SKRIPSI

DESSY FEBRIANI TRIAJIWATI 111421022

PROGRAM STUDI EKSTENSI S1 ILMU KOMPUTER

FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI

UNIVERSITAS SUMATERA UTARA

MEDAN

(2)

ANALISIS PERBANDINGAN ALGORITMA ZERO COMPRESION DENGAN DIFFERENCE CODING PADA KOMPRESI FILE AUDIO

SKRIPSI

Diajukan untuk melengkapi dan memenuhi syarat memperoleh ijazah

Sarjana Ilmu komputer

DESSY FEBRIANI TRIAJIWATI 111421022

PROGRAM STUDI EKSTENSI S1 ILMU KOMPUTER

FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI

UNIVERSITAS SUMATERA UTARA

MEDAN

(3)

PERSETUJUAN

Judul : ANALISIS PERBANDINGAN ZERO COMPRESION

DENGAN DIFFERENCE CODING PADA

KOMPRESI FILE AUDIO

Kategori : SKRIPSI

Nama : DESSY FEBRIANI TRIAJIWATI

Nomor Induk Mahasiswa : 111421022

Program Studi : EKSTENSI S1 ILMU KOMPUTER

Fakultas : ILMU KOMPUTER DAN TEKNOLOGI INFORMASI

UNIVERSITAS SUMATERA UTARA

Komisi Pembimbing :

Pembimbing 2 Pembimbing 1

Handrizal.S.Si.M.Comp.Sc Prof.Dr.Muhammad Zarlis

NIP. 19570701 198601 1 003

Diketahui/disetujui oleh

Program Studi S1 Ilmu Komputer

Ketua,

Dr. Poltak Sihombing, M.Kom

(4)

PERNYATAAN

ANALISIS PERBANDINGAN ZERO COMPRESION DENGAN DIFFERENCE CODING PADA KOMPRESI FILE AUDIO

SKRIPSI

Saya mengakui bahwa skripsi ini adalah hasil karya saya sendiri, kecuali beberapa

kutipan dan ringkasan yang masing-masing telah disebutkan sumbernya.

Medan, Maret 2014

Dessy Febriani Triajiwati

(5)

PENGHARGAAN

Alhamdulillahirrabbil’alamin. Segala puji dan syukur penulis panjatkan kepada Allah SWT, Tuhan semesta alam karena atas rahmat, taufik dan hidayah-Nya penulis

mampu menyelesaikan skripsi ini. Tidak lupa juga shalawat beriring salam penulis

ucapkan kepada Nabi Besar Muhammad SAW.

Skripsi ini diselesaikan sebagai salah satu syarat guna memperoleh gelar

Sarjana Ilmu Komputer Fakultas Ilmu Komputer dan Teknologi Informasi Universitas

Sumatera Utara. Penulis menyadari bahwa terselesaikannya penulisan skripsi ini

tentunya tidak terlepas dari dorongan berbagai pihak. Oleh karena itu, pada

kesempatan ini dengan kerendahan hati penulis mengungkapkan rasa terima kasih dan

penghargaan kepada:

1. Bapak Prof.Dr.dr Syahril Pasaribu,DTM&M.Sc(CTM),Sp.A(K) selaku Rektor

Universitas Sumatera Utara.

2. Bapak Prof.Dr.Muhammad Zarlis S.Kom selaku Dosen Dekan Program Studi

Ilmu Komputer sekaligus Pembimbing I yang telah memberikan banyak sekali

arahan, masukan serta motivasi yang membuat penulis memperoleh

pengetahuan sehingga dapat menyelesaikan skripsi ini dengan baik.

3. Bapak Dr. Poltak Sihombing, M.Kom selaku Ketua Program Studi Ilmu

Komputer sekaligus sebagai Dosen Pembanding I, yang telah memberikan

kritik dan saran yang membangun bagi penulis.

4. Ibu Maya Silvi Lydia B.Sc,M.Sc selaku Sekretaris Program Studi Ilmu

Komputer .

5. Bapak Handrizal.S.Si.M.Comp.Sc selaku Dosen Pembimbing II yang telah

memberikan banyak sekali arahan, masukan serta motivasi yang membuat

penulis memperoleh pengetahuan sehingga dapat menyelesaikan skripsi ini

dengan baik.

6. Ibu Dian Rachmawati selaku Dosen Pembanding II, yang telah memberikan

(6)

7. Orang tua tercinta, Mama,Papa dan Ayah serta Mama kisaran atas semua do’a,

dukungan dan motivasi yang tidak ternilai harganya.

8. Untuk Suami tercinta, Fahrurrozy Syahputra makasih atas doa serta

dukungannya

9. Serta Abang-abang dan Adik-adik tersayang yang telah mendo’akan dan

mendukung penulis.

10.Dan sahabat tersayang Qurbani, Nadra , Team Shop Sun Plaza(Telkomsel)

terima kasih atas dukungannya .

11.Keluarga Besar Ekstensi Ilmu Komputer, kawan-kawan angkatan 2011 yang

telah banyak membantu memotivasi penulis selama ini.

Semoga Allah SWT membalas semua kebaikan yang telah kalian berikan.

Penulis,

(7)

ANALISIS PERBANDINGAN ZERO COMPRESION DENGAN

DIFFERENCE CODING PADA KOMPRESI FILE AUDIO

ABSTRAK

Ukuran file audio khususnya berformat.Wav relatif besar dibandingkan file dengan format teks,yang membutuhkan memori yang besar dalam melakukan penyimpanan maupun dalam hal transmisi (pengiriman) melalui media komunikasi. Hal ini sangat mempengaruhi ketersediaan tempat (space) maupun pengolahan data khususnya data audio.Untuk itu perlu dikembangkan aplikasi untuk kompresi data yang bertujuan untuk minimalisasi memori menggunakan algoritma Zero Compression dan

Difference Coding. Pada metode Zero Compression, kompresi file audio dilakukan pada sampel audio yang bernilai nol (0) berurutan. Ada dua tahap utama kompresi dengan metode Zero Compression untuk data audio, yaitu reading redudance data

dan coding. Readingredudance data adalahmerepresentasikan frekuensi kemunculan setiap sampel audio kedalam bilangan eksak sedangkan Coding adalah menuliskan kode yang berisi nilai sampel dengan frekuensi kemunculannya.Sedangkan kompresi dengan metode Difference Coding adalah data difference yaitu adalah pengurangan nilai sampel audio dengan nilai sampel audio sebelumnya serta coding. Hasil kompresi file wav dengan kedua algoritma di atas dapat memberikan ukuran file yang lebih kecil yaitu dengan algoritma Zero Compression rata-rata rasio kompresi sebesar 24.43 % dan Difference Coding adalah 25.48 %.

.

(8)

ANALYSIS COMPARISON ZERO COMPRESION ALGORITHM

WITH DIFFERENCE CODING

COMPRESSION FOR FILE AUDIO

ABSTRACT

The Size of .wav audio file format in particular is relatively large compared with the text format file, which requires a large memory to perform in terms of storage and transmission (delivery) through the medium of communication. This greatly affects the availability of a place (space) as well as data processing, especially the audio data . so it is necessary to develop applications for data compression that aims to minimize memory by using Zero Compression Algorithm and Difference Coding. At Zero Compression method, the compression of audio files is done on the audio sample which has a value of zero sequentially .There are two main stages of compression using Zero compression method for audio data, that is reading redudance the data and coding. Reading redudance the data is representing the frequency of occurrence of each audio sample into exact numbers, while coding is to write code that contains the value of the sample with the frequency of occurrence. While the method of Difference Coding compression is data that difference is a reduction in the value of an audio sample with previous audio sample values and coding. Wav file compression Results with both algorithms above can give you a smaller file size that is used Zero Compression algorithms with an average compression ratio about 24.43% and 25.48% Difference Coding is.

keywords : Audio, Compression, Zero Compression, and Difference Coding .

(9)

DAFTAR ISI

PERSETUJUAN iii

PERNYATAAN iv

PENGHARGAAN v

ABSTRAK vii

ABSTRACT viii

DAFTAR ISI ix

DAFTAR GAMBAR xi

DAFTAR TABEL xii

BAB 1 PENDAHULUAN 1

1.1 Latar Belakang 1

1.2 Rumusan Masalah 3

1.3 Batasan Masalah 3

1.4 Tujuan Penelitian 3

1.5 Manfaat Penelitian 3

1.6 Metodologi Penelitian 4

1.7 Sistematika Penulisan 5

BAB 2 LANDASAN TEORI 6

2.1Pengertian Audio Digital 6

2.2 Kelebihan Audio Digital 8

2.3 Istilah dalam Audio Digital 9

2.3.1 Channel (Jumlah Kanal) 9

2.3.2 Sampling Rate (Laju Pencuplikan) 9

2.3.3 Bandwidth 10

2.3.4 Bit Per Sample (Banyaknya Bit Dalam Satu Sampel) 10

2.3.5 Bit Rate (Laju Bit) 11

2.4Data Audio 12

2.5 StrukturFile Wave 13

2.5.1 Header File Wave 15

2.5.2 Chunk FileWAVE 15

(10)

2.5.4 Chunk Data 19

2.5.5 Format Wave PCM 20

2.6 Hubungan Multimedia dengan Aplikasi Windows 24

2.7Kompresi Data 25

2.7.1 Teori Kompresi Data 25

2.7.2 Pemodelan Sumber (Source Modeling) 26

2.7.3 Entropi Rate Dari Suatu Sumber 29

2.7.4 Dalil Shannon Mengenai Lossless Source Coding 30 2.7.5 Perbedaan Antara Lossless dan Lossy Compression 33 2.7.6 Perbedaan Antara Compression Rate Dan Compression Ratio 32

2.8Kompresi Metode Zero Compression 34

2.9Kompresi Metode Difference Coding 35

BAB 3 ANALISIS DAN PERANCANGAN 37

3.1Analisis 35

3.1.1 Sampel Audio WAV 35

3.1.2 Kompresi dengan Algoritma Zero Compression 39 3.1.3 Kompresi dengan Algoritma Difference Coding 40

3.2Perancangan 41

3.2.1 Flow Chart Kompresi Algoritma Zero Compression 42 3.2.2 Flow Chart Dekompresi Algoritma Zero Compression 43 3.2.3 Flow Chart Kompresi Algoritma Difference Coding 45 3.2.4 Flow Chart Dekompresi Algoritma Difference Coding 46 3.2.5 Pemodelan Persyaratan Sistem dengan Use Case 47

3.2.6 Analisis Proses Sistem 55

3.2.7 Rancangan Antarmuka 57

3.2.7.1Rancangan Menu Utama 57

3.2.7.2Rancangan Kompresi 58

3.2.7.3Rancangan Help 59

3.2.7.4Rancangan About 60

3.2.9 Rancangan Hasil Pengujian 60

3.2.9.1Rancangan Grafik Hasil Kompresi 62

(11)

BAB 4 IMPLEMENTASI DAN PENGUJIAN 64

4.1Implementasi 64

4.1.1 Tampilan Menu Utama 64

4.1.2 Tampilan Zero Compression (Kompresi) 65

4.1.3 Tampilan Zero Compression (Dekompresi) 66

4.1.4 Tampilan Difference Coding (Kompresi) 66 4.1.5 Tampilan Difference Coding (Dekompresi) 67

4.1.6 Tampilan Help 68

4.1.7 Tampilan About 68

4.2Pengujian Sistem 69

4.2.1 Tampilan Hasil Pengujian Kompresi

Algoritma Zero Compression 69

4.2.2 Tampilan Hasil Pengujian Dekompresi

Algoritma Zero Compression 69

4.2.3 Tampilan Hasil Pengujian Kompresi

Algoritma Difference Coding 70

4.2.4 Tampilan Hasil Pengujian Dekompresi

Algoritma Difference Coding 71

4.2.5 Tampilan Grafik Hasil Kompresi Algoritma Zero Compression 72 4.2.6 Grafik Hasil Kompresi Algoritma Difference Coding 73 4.2.7 Grafik Hasil Perbandingan Rasio Algoritma Zero Compression 74

Dengan Difference Coding

BAB 5 KESIMPULAN DAN SARAN 75

5.1 Kesimpulan 75

5.2 Saran 76

(12)

DAFTAR GAMBAR

Gambar 2.1 Konversi Sinyal Analog ke Digital 7

Gambar 2.2 Konversi Sinyal Digital ke Analog 8

Gambar 2.3 Layout File Wave 14

Gambar 2.4 Diagram Format File Wave 20

Gambar 2.5 Interpretasi Tiap Byte pada File Wave 22 Gambar 2.6 Lapisan-Lapisan Multimedia dengan Windows 24

Gambar 2.7 Nilai Sample Audio 35

Gambar 3.1 Data Audio Wav dalam Hexa 38

Gambar 3.2 Flow Chart Kompresi File Audio Algoritma Zero Compression 42 Gambar 3.3 Flow Chart Dekompresi File Audio Algoritma Zero Compression 43 Gambar 3.4 Flow Chart Dekompresi File Audio Algoritma Zero Compression

(Lanjutan) 44

Gambar 3.5 Flow Chart Kompresi File Audio Algoritma Difference Coding 45 Gambar 3.6 Flow Chart Dekompresi File Audio Algoritma Difference Coding 46 Gambar 3.7 Flow Chart Dekompresi File Audio Algoritma Difference Coding

(Lanjutan) 47

Gambar 3.8 Use Case Diagram Sistem yang akan dikembangkan 48 Gambar 3.9 Activity Diagram Kontrol Proses Watermarking(Kompresi) 51 Gambar 3.10 Activity Diagram Kontrol Proses Watermarking(Dekompresi) 54 Gambar 3.11 Sequence Diagram Proses Kompresi 55 Gambar 3.12 Sequence Diagram Proses Dekompresi 56

Gambar 3.15 Rancangan Menu Utama 57

Gambar 3.16 Rancangan Kompresi 58

Gambar 3.17 Rancangan Help 59

Gambar 3.18 Rancangan About 60

Gambar 3.19 Rancangan Grafik Hasil Kompresi 62

Gambar 3.20 Rancangan Grafik Hasil Dekompresi 63

Gambar 4.1 Tampilan Menu Utama 64

Gambar 4.2 Tampilan Kompresi Zero Compression 65 Gambar 4.3 Tampilan Dekompresi Zero Compression 66 Gambar 4.4 Tampilan Kompresi Difference Coding 66 Gambar 4.5 Tampilan Dekompresi Difference Coding 67

Gambar 4.6 Tampilan Help 68

Gambar 4.7 Tampilan About 68

Gambar 4.8 Tampilan Grafik Hasil Kompresi Algoritma Zero Compression 72 Gambar 4.9 Tampilan Grafik Hasil Kompresi Algoritma Difference Coding 73 Gambar 4.10 Tampilan Grafik Hasil Perbandingan Rasio Kompresi Algoritma 74

(13)

DAFTAR TABEL

Tabel 2.1 Frekuensi Sampling dan Kualitas Suara yang Dihasilkan 10 Tabel 2.2 Tabel Penyimpanan Berbagai Konfigurasi Audio Digital 11

Tabel 2.3 Nilai Jenis Chunk RIFF 15

Tabel 2.4 Format Chunk RIFF 16

Tabel 2.5 Nilai-Nilai Chunk Format File Wave 16

Tabel 2.6 Kode Kompresi Wave 17

Tabel 2.7 Format Data Chunk 19

Tabel 2.8 Penjelasan Struktur File Wave 21

Tabel 2.9 Penambahan Chunk Lain Pada File Wave 23 Tabel 3.1 Hasil Kompesi Zero Compresion per Sampel Audio 40 Tabel 3.2 Hasil Kompesi Difference Coding per Sampel Audio 41 Tabel 3.3 Dokumentasi Naratif Use Case Kompresi 49 Tabel 3.4 Dokumentasi Naratif Use Case Dekompresi 52

Tabel 3.5 Rancangan Hasil Pengujian Kompresi 61

Tabel 3.4. Rancangan Hasil Pengujian Dekompresi 61 Tabel 4.1. Rancangan Hasil Pengujian kompresi Zero Compression 69 Tabel 4.2. Rancangan Hasil Pengujian Dekompresi Zero Compression 70

(14)

ANALISIS PERBANDINGAN ZERO COMPRESION DENGAN

DIFFERENCE CODING PADA KOMPRESI FILE AUDIO

ABSTRAK

Ukuran file audio khususnya berformat.Wav relatif besar dibandingkan file dengan format teks,yang membutuhkan memori yang besar dalam melakukan penyimpanan maupun dalam hal transmisi (pengiriman) melalui media komunikasi. Hal ini sangat mempengaruhi ketersediaan tempat (space) maupun pengolahan data khususnya data audio.Untuk itu perlu dikembangkan aplikasi untuk kompresi data yang bertujuan untuk minimalisasi memori menggunakan algoritma Zero Compression dan

Difference Coding. Pada metode Zero Compression, kompresi file audio dilakukan pada sampel audio yang bernilai nol (0) berurutan. Ada dua tahap utama kompresi dengan metode Zero Compression untuk data audio, yaitu reading redudance data

dan coding. Readingredudance data adalahmerepresentasikan frekuensi kemunculan setiap sampel audio kedalam bilangan eksak sedangkan Coding adalah menuliskan kode yang berisi nilai sampel dengan frekuensi kemunculannya.Sedangkan kompresi dengan metode Difference Coding adalah data difference yaitu adalah pengurangan nilai sampel audio dengan nilai sampel audio sebelumnya serta coding. Hasil kompresi file wav dengan kedua algoritma di atas dapat memberikan ukuran file yang lebih kecil yaitu dengan algoritma Zero Compression rata-rata rasio kompresi sebesar 24.43 % dan Difference Coding adalah 25.48 %.

.

(15)

ANALYSIS COMPARISON ZERO COMPRESION ALGORITHM

WITH DIFFERENCE CODING

COMPRESSION FOR FILE AUDIO

ABSTRACT

The Size of .wav audio file format in particular is relatively large compared with the text format file, which requires a large memory to perform in terms of storage and transmission (delivery) through the medium of communication. This greatly affects the availability of a place (space) as well as data processing, especially the audio data . so it is necessary to develop applications for data compression that aims to minimize memory by using Zero Compression Algorithm and Difference Coding. At Zero Compression method, the compression of audio files is done on the audio sample which has a value of zero sequentially .There are two main stages of compression using Zero compression method for audio data, that is reading redudance the data and coding. Reading redudance the data is representing the frequency of occurrence of each audio sample into exact numbers, while coding is to write code that contains the value of the sample with the frequency of occurrence. While the method of Difference Coding compression is data that difference is a reduction in the value of an audio sample with previous audio sample values and coding. Wav file compression Results with both algorithms above can give you a smaller file size that is used Zero Compression algorithms with an average compression ratio about 24.43% and 25.48% Difference Coding is.

keywords : Audio, Compression, Zero Compression, and Difference Coding .

(16)

BAB 1 PENDAHULUAN

Pada bab ini dijelaskan latar belakang permasalahan serta tujuan dari penelitian,

metodologi serta sistematika penulisan. Bab ini merupakan dasar dari penelitian

mengenai kompresi dan dekompresi file audio berformat wav.

1.8Latar Belakang

Perkembangan teknologi informasi yang pesat telah menjadi peran yang sangat

penting untuk pertukaran informasi yang cepat. Kecepatan pengiriman informasi

dalam bentuk perpaduan teks, audio maupun citra secara nyata akan menjadi bagian utama dalam pertukaran informasi. Kecepatan pengiriman ini sangat bergantung

kepada ukuran dari informasi tersebut. Salah satu solusi untuk masalah di atas adalah

dengan melakukan kompresi data sebelum ditransmisikan dan kemudian penerima

akan melakukan dekompresi yaitu merekonstruksinya kembali menjadi data aslinya.

Pada umumnya file audio digital memiliki ukuran (size) yang lebih besar dibandingkan dengan file teks. Jadi untuk mengurangi ukurannya dapat dilakukan

dengan cara kompresi. File Audio dengan format WAV memiliki data yang tidak terkompres sehingga seluruh sampel audio disimpan semuanya di harddisk (tidak di

coding). File audio ini jarang sekali digunakan di internet karena ukurannya yang relatif besar dengan batasan maksimal pada media player yang optimum adalah 2GB.

Seperti pada teknik kompresi pada umumnya, kompresi data audio, baik

lossy maupun lossless, memanfaatkan adanya redundansi informasi dengan

pengkodean, pengenalan pola, maupun prediksi linear seperti pada kompresi video.

Pada kompresi lossless, hasil kompresi dapat dikembalikan seperti data asli tanpa ada perubahan, maka rasio kompresi pun tidak dapat terlalu besar untuk memastikan

(17)

Kompresi lossy pada data audio berdasarkan pada psikoakustik, sebagaimana kompresi lossy pada gambar yang berdasarkan pada redundansi psikovisual. Keduanya memanfaatkan keterbatasan indera manusia yang hanya dapat menangkap

(perceive) kondisi lingkungannya dalam rentang tertentu, misalnya telinga manusia hanya dapat menangkap suara dengan frekuensi di antara 20 Hz hingga 20000 Hz.

Kompresi lossless pada data audio berarti bahwa hasil kompresi dari data tersebut dapat di-dekompres untuk menghasilkan data yang sama persis dengan data

asli, tanpa ada penurunan kualitas sama sekali. Kompresi lossless untuk data audio

agak mirip dengan algoritma kompresi lossless generik, dengan rasio kompresi sekitar 50% hingga 60%, meskipun dapat mencapai 35% pada data musik orkestra atau

paduan suara yang tidak terlalu banyak noise.

Kompresi lossless utamanya digunakan untuk pengarsipan, dan penyuntingan. Untuk keperluan pengarsipan, tentu kualitas yang diinginkan adalah kualitas

terbaik. Menyunting data yang terkompresi secara lossy menyebabkan turunnya kualitas suara pada setiap penyimpanan. Maka kompresi lossless selalu digunakan dalam sound engineering. Selain kedua kegunaan itu, kompresi lossless juga biasa digunakan oleh para audiophile, yaitu penggemar musik yang senang mendengarkan musik dengan kualitas tinggi dengan perangkat keras yang berkualitas tinggi pula.

Data audio yang terkompresi secara lossless juga digunakan untuk menghasilkan data audio versi lossy untuk didistribusikan. Saat ini, dengan semakin murahnya media penyimpanan data digital dan bandwidth, kompresi lossless pun

menjadi semakin populer di kalangan konsumen. Ada dua tahap utama dalam

kompresi lossless untuk data audio, yaitu prediction dan coding. Prediction

memanfaatkan sample-sample sebelumnya untuk memprediksi sample berikutnya. Kemudian selisih antara sample hasil prediksi dengan sample sebenarnya dikodekan (coding). Untuk setiap format, biasanya perbedaan hanya terdapat pada teknik

prediction dan/atau coding.

Teknik kompresi diperlukan karena ukuran dari data semakin lama semakin

besar, tetapi belum optimal karena tidak didukung oleh perkembangan dari teknologi

(18)

diperlukan kualitas kompresi yang baik yaitu ukuran yang minimum dengan tidak

mengurangi kualitas data tersebut. Melihat masalah-masalah tadi, maka

pemecahannya adalah maksimalisasi kompresi yaitu mengurangi ukuran data.

Algoritma Zero Compression adalah melakukan kompresi file audio untuk sampel audio yang bernilai nol (0) berurutan sedangkan Difference Coding adalah dengan mengurangi nilai sampel audio dengan nilai sampel audio sebelumnya. Sampel audio yang bernilai nol atau mendekati nol adalah sampel audio tidak dapat didengar telinga manusia jadi melakukan reduksi nilai nol pada sampel audio tidak akan mempengaruhi kualitas suaranya.

Berdasarkan hal yang telah diuraikan diatas maka penulis berniat membuat

skripsi dengan judul analisis perbandingan algoritma zero compression dengan

difference coding pada kompresi file audio.

1.9Rumusan Masalah

Berdasarkan latarbelakang di atas maka masalah yang akan di bahas pada penelitian

ini adalah bagaimana cara mendapatkan hasil perbandingan kompresi file audio

menggunakan algoritma Zero Compression dan Difference Coding.

1.10 Batasan Masalah

Agar tujuan penelitian ini dapat tercapai, maka penulis membuat batasan-batasan

antara lain adalah:

a. File audio yang dikompresi adalah berformat WAV.

b. Algoritma yang digunakan adalah Zero Compresion dan Difference Coding. c. Bahasapemrograman yang digunakan adalah Visual Basic .NET 2010.

(19)

1.11 Tujuan Penelitian

Pada penelitian ini yang menjadi tujuan adalah untuk menganalisis serta

membandingkan kompresi file audio dengan menggunakan algoritma Zero Compresion dan Difference Coding.

1.12 Manfaat Penelitian

Manfaat penelitian ini adalah:

a. Untuk memberi informasi hasil kompresi file audio terhadap masing-masing

algoritma diatas.

b. Untuk lebih memahami teknik kompresi file audio.

c. Sebagai bahan perbandingan untuk algoritma kompresi lossless yang lainnya.

1.13 Metodologi Penelitian

Dalam penelitian ini, tahapan-tahapan yang akan dilalui adalah sebagai berikut:

a. Studi Literatur

Metode ini dilaksanakan dengan melakukan studi tentang audio digital, teknik kompresi dan dekompresi serta algoritma Zero dan Difference Coding.

b. Analisis

Pada tahap ini digunakan untuk mengolah data yang ada dan kemudian

melakukan analisis terhadap hasil studi literatur yang diperoleh sehingga menjadi

suatu informasi.

c. Perancangan Perangkat Lunak

Pada tahap ini, digunakan seluruh hasil analisa terhadap studi literatur yang

dilakukan untuk merancang perangkat lunak yang akan dihasilkan. Dalam

tahapan ini juga dilakukan perancangan bagan arus proses kerja sistem (flow chart) serta antarmuka (user interface) untuk memudahkan dalam penulisan kode program.

(20)

Pada tahap ini dilakukan pemasukan data serta memproses data untuk

mendapatkan hasil apakah sudah sesuai dengan tujuan.

e. Implementasi

Pada tahap ini dilakukan pemanfaatan program dalam melakukan proses

kompresi file audio.

f. Dokumentasi serta Laporan Akhir

Tahap ini dilakukan pembuatan dokumen dari penelitian serta laporan dalam

bentuk skripsi.

1.14 Sistematika Penulisan

Sistematika penulisan skripsi ini adalah sebagai berikut:

BAB 1 PENDAHULUAN membahas latar belakang, rumusan masalah, batasan

masalah, tujuan penelitian, manfaat penelitian serta sistematika penulisan.

BAB 2 LANDASAN TEORI membahas tentang landasan teori tentang kompresi

audio, algoritma Zero dan Difference Coding, bahasa pemrograman VB NET

serta flow chart.

BAB 3 ANALISIS DAN PERANCANGAN pembahasan mengenai kompresi audio

dengan algoritma Zero Compression dan Difference Coding, flow chart

sistem serta perancangan antar muka aplikasi (user interface).

BAB 4 IMPLEMENTASI DAN PENGUJIAN membahas tentang implementasi dari

perancangan sistem yang dirancang pada BAB 3.

BAB 5 KESIMPULAN DAN SARAN merupakan kesimpulan dari semua

pembahasan yang ada dengan saran-saran yang ditujukan bagi para pembaca

(21)

BAB 2

LANDASAN TEORI

Sebelum melakukan penelitian, penulis mengumpulkan informasi berupa teori-teori

yang berkenaan atau yang relevan dengan objek penelitian yaitu kompresi file audio

berformat Wav serta algoritma kompresi yang digunakan. Adapun teori-teori yang

menyangkut penelitian ini adalah sebagai berikut.

2.10 Pengertian Audio Digital

Suara yang kita dengar sehari-hari adalah merupakan gelombang analog. Gelombang ini berasal dari tekanan udara yang ada di sekeliling kita, yang dapat kita dengar

dengan bantuan gendang telinga. Gendang telinga ini bergetar, dan getaran ini dikirim

dan diterjemahkan menjadi informasi suara yang dikirimkan ke otak, sehingga kita

dapat mendengarkan suara. Suara yang kita hasilkan sewaktu berbicara berbentuk

tekanan suara yang dihasilkan oleh pita suara. Pita suara ini akan bergetar, dan getaran

ini menyebabkan perubahan tekanan udara, sehingga kita dapat mengeluarkan suara

(Binanto,2010).

Komputer hanya mampu mengenal sinyal dalam bentuk digital. Bentuk digital

yang dimaksud adalah tegangan yang diterjemahkan dalam angka “0” dan “1”, yang

juga disebut dengan istilah “bit”. Tegangan ini berkisar 5 volt bagi angka “1” dan mendekati 0 volt bagi angka “0”. Dengan kecepatan perhitungan yang dimiliki

komputer, komputer mampu melihat angka “0” dan “1” ini menjadi kumpulan bit-bit

dan menerjemahkan kumpulan bit-bit tersebut menjadi sebuah informasi yang bernilai.

Bagaimana caranya memasukkan suara analog ini sehingga dapat dimanipulasi oleh peralatan elektronik yang ada? Alat yang diperlukan untuk melakukan ini adalah

transducer. Dalam hal ini, transducer adalah istilah untuk menyebut sebuah peralatan yang dapat mengubah tekanan udara (yang kita dengar sebagai suara) ke dalam

(22)

Contoh transducer adalah mikrofon dan speaker. Mikrofon dapat mengubah tekanan udara menjadi tegangan elektrik, sementara speaker melakukan pekerjaan sebaliknya.

Tegangan elektrik diproses menjadi sinyal digital oleh sound card. Ketika Anda merekam suara atau musik ke dalam komputer, sound card akan mengubah gelombang suara (bisa dari mikrofon atau stereo set) menjadi data digital, dan ketika suara itu dimainkan kembali, sound card akan mengubah data digital menjadi suara yang kita dengar (melalui speaker), dalam hal ini gelombang analog. Proses pengubahan gelombang suara menjadi data digital ini dinamakan Analog-to-Digital Conversion (ADC), dan kebalikannya, pengubahan data digital menjadi gelombang suara dinamakan Digital-to-Analog Conversion (DAC).

Proses pengubahan dari tegangan analog ke data digital ini terdiri atas beberapa tahap yang ditunjukkan pada Gambar 2.1, yaitu:

1. Membatasi frekuensi sinyal yang akan diproses dengan Low Pass Filter.

2. Mencuplik sinyal analog ini (melakukan sampling) menjadi beberapa potongan waktu.

3. Cuplikan-cuplikan ini diberi nilai eksak, dan nilai ini diberikan dalam bentuk data

digital.

Gambar 2.1 Konversi Sinyal Analog ke Digital (Binanto, 2010)

Proses sebaliknya, yaitu pengubahan dari data digital menjadi tegangan analog juga terdiri atas beberapa tahap, yang ditunjukkan pada gambar 2.2, yaitu:

1. Menghitung data digital menjadi amplitudo-amplitudo analog. 2. Menyambung amplitudo analog ini menjadi sinyal analog.

(23)

Gambar 2.2 Konversi Sinyal Digital ke Analog (Binanto, 2010)

Proses pengubahan sinyal analog menjadi digital harus memenuhi sebuah kriteria, yaitu kriteria Nyquist. Kriteria ini mengatakan bahwa untuk mencuplik

sebuah sinyal yang memiliki frekuensi X Hertz, maka harus mencupliknya minimal

dua kali lebih rapat, atau 2X Hertz. Jika tidak, sinyal tidak akan dapat dikembalikan

ke dalam bentuk semula.

2.11Kelebihan Audio Digital

Kelebihan audio digital adalah kualitas reproduksi yang sempurna. Kualitas reproduksi yang sempurna yang dimaksud adalah kemampuannya untuk

menggandakan sinyal audio secara berulang-ulang tanpa mengalami penurunan kualitas suara.

Kelebihan lain dari audiodigital adalah ketahanan terhadap noise (sinyal yang tidak diinginkan). Pada saat transmisi data dan pemrosesan dengan

komponen-komponen elektrik, pada sinyal analog sangat mudah sekali terjadi gangguan-gangguan berupa noise. Suara desis pada kaset rekaman merupakan salah satu contoh terjadinya noise berupa gangguan pada frekuensi tinggi.

(24)

2.12 Istilah dalam Audio Digital

Dalam dunia audio digital, ada beberapa istilah yaitu channel (jumlah kanal),

sampling rate (laju pencuplikan), bandwidth, bit per sample (banyaknya bit dalam satu sample), bit rate (laju bit) (Dangarwala, 2010).

2.12.1 Channel (Jumlah Kanal)

Jumlah kanal menentukan banyaknya kanal audio yang digunakan. Audio satu kanal dikenal dengan mono, sedangkan audio dua kanal dikenal dengan stereo. Saat ini untuk audio digital standar, biasanya digunakan dua kanal, yaitu kanal kiri dan kanal kanan. Audio untuk penggunaan theater digital menggunakan lebih banyak kanal. Ada yang menggunakan tiga kanal, yaitu 2 kanal depan dan surround. Ada yang menggunakan 6 kanal (dikenal dengan format audio 5.1) yaitu terdiri dari 2 kanal depan dan 2 kanal surround, 1 kanal tengah dan 1 kanal subwoofer. Bahkan ada yang menggunakan 8 kanal (formataudio 7.1) yaitu terdiri dari 2 kanal depan dan 2 kanal

surround, 1 kanal tengah dan 1 kanal subwoofer dan ditambah 2 buah speaker EX (Environmental Extended) untuk menghasilkan suara dari belakang.

2.12.2 Sampling Rate (Laju Pencuplikan)

Ketika sound card mengubah audio menjadi data digital, sound card akan memecah suara tadi menurut nilai menjadi potongan-potongan sinyal dengan nilai tertentu.

Proses sinyal ini bisa terjadi ribuan kali dalam satuan waktu. Banyak pemotongan

dalam satu satuan waktu ini dinamakan sampling rate (laju pencuplikan). Satuan

sampling rate yang biasa digunakan adalah KHz (kilo Hertz) (Binanto, 2010).

Kerapatan laju pencuplikan ini menentukan kualitas sinyal analog yang akan diubah menjadi data digital. Makin rapat laju pencuplikan ini, kualitas suara yang dihasilkan akan makin mendekati suara aslinya. Sebagai contoh, lagu yang disimpan

dalam Compact Disc Audio (CDA) memiliki sampling rate 44.1 KHz, yang berarti lagu ini dicuplik sebanyak 44100 kali dalam satu detik untuk memastikan kualitas

(25)

Tabel 2.1 Frekuensi Sampling dan Kualitas Suara yang Dihasilkan

Sampling Rate (KHZ) Aplikasi

8 Telepon

11,025 Radio AM

16 Kompromi antara 11,025 dan 22,025 KHz

22,025 Mendekati Radio FM

32,075 Lebih baik dari Radio FM

44,1 Compact Disc Audio (CDA)

48 Digital Audio Tape (DAT)

Sampling rate yang umumnya digunakan antara lain 8 KHz, 11 KHz, 16 KHz, 22 KHz, 24 KHz, 44 KHz, 88 KHz. Makin tinggi sampling rate, semakin baik kualitas audio. Teori Nyquist menyatakan bahwa sampling rate yang diperlukan minimal 2 kali bandwidth sinyal. Hal ini berkaitan dengan kemampuan untuk merekonstruksi ulang sinyal audio.

2.12.3 Bandwidth

Bandwitdth adalah selisih antara frekuensi tertinggi dan frekuensi terendah yang akan diolah. Misalnya sinyal audio pada telepon yang digunakan untuk menyampaikan sinyal dengan frekuensi 300 – 3400 Hz (ucapan manusia), berarti bandwidth-nya adalah 3100 Hz (3400 dikurangi 300). Maka sampling rate minimum yang diperlukan adalah 2 kali yaitu 6,2 KHz. Demikian pula dengan frekuensi suara secara umum,

frekuensi yang dapat didengar manusia adalah 20 – 20.000 Hz, dengan bandwidth

19.980. Berarti sampling rate minimum yang digunakan adalah 39.960 Hz. Jadi frekuensi sampling yang mencukupi adalah 44.100 Hz.

2.12.4 Bit Per Sample (Banyaknya Bit Dalam Satu Sampel)

Bit per sample menyatakan seberapa banyak bit yang diperlukan untuk menyatakan hasil sample tersebut, hal ini berkaitan dengan proses kuantisasi. Bit rate yang digunakan adalah 8 bit per sample atau 16 bit per sample. Proses kuantisasi akan mengubah amplitudo sinyal audio menjadi suatu level sinyal tertentu. Dengan 8 bit per sample akan ada 256 level pilihan sedangkan 16 bit per sample akan ada 65.536

(26)

ini, penggunaan 16 bit per sample dibandingkan penggunaan 8 bit per sample akan mempertinggi ketelitian kualitas kuantisasi sebanyak 256 kali.

2.12.5 Bit Rate (Laju Bit )

Istilah bit rate merupakan gabungan dari istilah sampling rate dan bit per sample. Bit rate menyatakan banyaknya bit yang diperlukan untuk menyimpan audio selama satu detik, satuannya adalah bit per detik. Bit rate (dengan satuan bit per detik) diperoleh dengan rumus yang sederhana yaitu perkalian antara jumlah kanal, sampling rate

(dengan satuan Hertz) dan bit per sample (dengan satuan bit).Seperti dapat dilihat di Tabel 2.2 di bawah ini

Tabel 2.2 Tabel Penyimpanan Berbagai Konfigurasi Audio Digital

Sampling rate

Bit per sample

Jumlah kanal

Bit rate Byte rate (1 byte = 8 bit)

Byte rate per menit

12 kHz 8 1 96.000 12.000 720 KB

12 kHz 8 2 192.000 24.000 1,44 MB

12 kHz 16 1 192.000 24.000 1,44 MB

12 kHz 16 2 348.000 48.000 2,88 MB

24 kHz 8 1 192.000 24.000 1,44 MB

24 kHz 8 2 348.000 48.000 2,88 MB

24 kHz 16 1 348.000 48.000 2,88 MB

24 kHz 16 2 768.000 96.000 5,76 MB

44.1 kHz 8 1 352.800 44.100 2,646 MB

44.1 kHz 8 2 705.600 88.200 5,292 MB

44.1 kHz 16 1 705.600 88.200 5,292 MB

44.1 kHz 16 2 1.411.200 176.400 10,584 MB

Audio sekualitas CD Audio menggunakan sampling rate 44,1 kHz, 16 bit per

(27)

menyimpan data audio lagu tersebut jika diasumsikan 1 KB = 1.000 byte dan 1 MB = 1.000 KB = 1.000.000 byte.

2.13 Data Audio

Salah satu tipe data multimedia adalah audio yang berupa suara ataupun bunyi, data

audio sendiri telah mengalami perkembangan yang cukup pesat seiring dengan semakin umumnya orang dengan perangkat multimedia. Tentunya yang merupakan syarat utama supaya komputer mampu menjalankan tipe data tersebut adalah adanya

speaker yang merupakan output untuk suara yang dihasilkan dan untuk menghasilkan maupun mengolah data suara yang lebih kompleks seperti *.WAV, *.MIDI tersebut

tentunya sudah diperlukan perangkat yang lebih canggih lagi yaitu sound card.

Tipe dari pelayanan audio memerlukan format yang berbeda untuk informasi

audio dan teknologi yang berbeda untuk menghasilkan suara. Windows menawarkan beberapa tipe dari pelayanan audio :

1. Pelayanan audio Waveform menyediakan playback dan recording untuk perangkat keras digital audio. Waveform digunakan untuk menghasilkan non -musikal audio seperti efek suara dan suara narasi. Audio ini mempunyai keperluan penyimpanan yang sedang dan keperluan untuk tingkat transfer paling

kecil yaitu 11 K/detik.

2. Midi Audio, menyediakan pelayanan file MIDI dan MIDI playback melalui

synthesizer internal maupun eksternal dan perekaman MIDI. MIDI digunakan untuk aplikasi yang berhubungan dengan musik seperti komposisi musik dan

program MIDI sequencer. Karena memerlukan tempat penyimpanan lebih kecil dan tingkat transfer yang lebih kecil daripada Waveform audio, maka sering digunakan untuk keperluan background.

3. Compact Disc Audio (CDA) menyediakan pelayanan untuk playback informasi

Red Book Audio dalam CD dengan drive CD-ROM pada komputer multimedia. CD menawarkan kualitas suara tertinggi, namun juga memerlukan daya

penyimpanan yang paling besar pula, sekitar 176 KB/detik.

(28)

ini telah menjadi standar format file audio komputer dari suara sistem dan

games sampai CD Audio. File Wave diidentifikasikan dengan nama yang berekstensi *.WAV. Format asli dari tipe file tersebut sebenarnya berasal dari bahasa C.

2.14 Struktur File Wave

Aplikasi multimedia seperti diketahui memerlukan manajemen penyimpanan dari sejumlah jenis data yang bervariasi, termasuk bitmap, data audio, data video, informasi mengenai kontrol device periperal. Rule Interchange File Format (RIFF) menyediakan suatu cara untuk menyimpan semua jenis data tersebut (Dangarwala,

2010). Tipe data pada sebuah file RIFF dapat diketahui dari ekstensi filenya. Sebagai contoh jenis-jenis file yang disimpan dalam bentuk format RIFF adalah sebagai berikut:

1. Audio/visual interleaved data (.AVI) 2. Waveform data (.WAV)

3. Bitmapped data (.RDI) 4. MIDI information (.RMI) 5. Color palette (.PAL) 6. Multimedia Movie (.RMN) 7. Animated cursor (.ANI)

Pada saat ini, file *.AVI merupakan satu-satunya jenis file RIFF yang telah secara penuh diimplementasikan menggunakan spesifikasi RIFF. Meskipun file

*.WAV juga menggunakan spesifikasi RIFF, karena struktur file *.WAV ini begitu sederhana maka banyak perusahaan lain yang mengembangkan spesifikasi dan standar

mereka masing-masing.

(29)

lingkungan Windows yang menggunakan prosesor Intel, maka format data dari file

WAVE disimpan dalam format urutan little-endian (least significant byte) dan sebagian dalam urutan big-endian.

File WAVE menggunakan struktur standar RIFF yang mengelompokkan isi

file (sampel format, sampel digital audio, dan lain sebagainya) menjadi “chunk” yang terpisah, setiap bagian mempunyai header dan byte data masing-masing. Header chunck menetapkan jenis dan ukuran dari byte data chunk. Dengan metoda pengaturan seperti ini maka program yang tidak mengenali jenis chunk yang khusus dapat dengan mudah melewati bagian chunk ini dan melanjutkan langkah memproses

chunk yang dikenalnya. Jenis chunk tertentu mungkin terdiri atas sub-chunk. Sebagai contoh, pada gambar 2.3 dapat dilihat chunk “fmt ” dan “data” sebenarnya merupakan

sub-chunk dari chunk “RIFF”.

Chunk pada file RIFF merupakan suatu string yang harus diatur untuk tiap kata. Ini berarti ukuran total dari chunk harus merupakan kelipatan dari 2 byte (seperti 2, 4, 6, 8 dan seterusnya). Jika suatu chunk terdiri atas jumlah byte yang ganjil maka harus dilakukan penambahan byte (extra padding byte) dengan menambahkan sebuah nilai nol pada byte data terakhir. Extra padding byte ini tidak ikut dihitung pada ukuran chunk. Oleh karena itu sebuah program harus selalu melakukan pengaturan kata untuk menentukan ukuran nilai dari header sebuah chunk untuk mengkalkulasi

offset dari chunk berikutnya. Layoutfile wave dapat dilihat seperti pada Gambar 2.3.

(30)

2.14.1 Header File Wave

Header file Wave mengikuti struktur format file RIFF standar. Delapan byte pertama dalam file adalah header chunk RIFF standar yang mempunyai chunk ID “RIFF” dan ukuran chunk didapat dengan mengurangkan ukuran file dengan 8 byte yang digunakan sebagai header. Empat byte data yaitu kata “RIFF” menunjukkan bahwa

file tersebut merupakan file RIFF. File Wave selalu menggunakan kata “WAVE” untuk membedakannya dengan jenis file RIFF lainnya sekaligus digunakan untuk mendefinisikan bahwa file tersebut merupakan file audio waveform

(Dangarwala,2010). Seperti terlihat pada Tabel 2.3.

Tabel 2.3 Nilai Jenis Chunk RIFF

Offset Ukuran Deskripsi Nilai

0x00 4 Chunk ID "RIFF" (0x52494646)

0x04 4 Ukuran Data Chunk (ukuran file) – 8

0x08 4 Jenis RIFF "WAVE" (0x57415645)

0x10 Chunk WAVE

2.14.2 Chunk File WAVE

Ada beberapa jenis chunk untuk menyatakan file Wave. Kebanyakan file Wave hanya terdiri atas 2 buah chunk, yaitu Chunk Format dan Chunk Data. Dua jenis chunk ini diperlukan untuk menggambarkan format dari sampel digital audio. Meskipun tidak diperlukan untuk spesifikasi file Wave yang resmi, lebih baik menempatkan Chunk Format sebelum Chunk Data. Kebanyakan program membaca chunk tersebut dengan urutan di atas dan jauh lebih mudah dilakukan streaming digital audio dari sumber yang membacanya secara lambat dan linear seperti Internet. Jika Chunk Format lebih dulu ditempatkan sebelum Chunk Data maka semua data dan format harus di-stream

(31)

Tabel 2.4 Format Chunk RIFF

Offset Ukuran (byte) Deskripsi

0x00 4 Chunk ID

0x04 4 Ukuran Data Chunk

0x08 Byte Data Chunk

2.14.3 Chunk Format

Chunk format terdiri atas informasi tentang bagaimana suatu data waveform disimpan dan cara untuk dimainkan kembali, termasuk jenis kompresi yang digunakan, jumlah

kanal, laju pencuplikan (sampling rate), jumlah bit tiap sampel dan atribut lainnya.

Chunk format ini ditandai dengan chunnk ID “fmt“ (Kadhim, 2012). Seperti dapat kita lihat Tabel 2.5.

Tabel 2.5 Nilai-Nilai Chunk Format File Wave (Kadhim, 2012)

Offset Ukuran Deskripsi Nilai

0x00 4 Chunk ID "fmt " (0x666D7420)

0x04 4 Ukuran Data Chunk 16 + extra format bytes

0x08 2 Kode Kompresi 1 - 65,535

0x0a 2 Jumlah Kanal 1 - 65,535

0x0c 4 Laju Pencuplikan 1 - 0xFFFFFFFF

0x10 4 Jumlah rata-rata byte tiap detik 1 - 0xFFFFFFFF

0x14 2 Block align 1 - 65,535

0x16 2 Bit Significant tiap sampel 2 - 65,535

0x18 2 Extra format bytes 0 - 65,535

(32)

A. Chunk ID dan Ukuran Data

Chunk ID selalu ditandai dengan kata “fmt “ (0x666D7420) dan ukurannya sebesar data format Wave (16 byte) ditambah dengan extra format byte yang diperlukan untuk format Wave khusus, jika tidak terdiri atas data PCM tidak terkompresi. Sebagai catatan string chunk ID ini selalu diakhir dengan karakter spasi (0x20). Chunk ID “fmt “ digunakan sebagai informasi file Wave, informasi ini berupa: Compression Code, Number of Channels, Sample Rate, Average Bytes perSecond, Block Align, Significant Bits per Sample, Extra Format Bytes.

B. Compression Code

Setelah chunk ID dan ukuran data chunk maka bagian pertama dari format data file Wave menyatakan jenis kompresi yang digunakan pada data Wave. Seperti terlihat pada Table 2.6.

Tabel 2.6 Compression Code Wave (Gunawan, 2005)

Kode Deskripsi

0 (0x0000) Tidak Diketahui

1 (0x0001) PCM / Tidak Terkompresi

2 (0x0002) Microsoft ADPCM

6 (0x0006) ITU G.711 a-law

7 (0x0007) ITU G.711 µ-law

17 (0x0011) IMA ADPCM

20 (0x0016) ITU G.723 ADPCM (Yamaha)

49 (0x0031) GSM 6.10

64 (0x0040) ITU G.721 ADPCM

80 (0x0050) MPEG

65,536 (0xFFFF) Tahap Uji Coba

C. Number of Channels

Jumlah kanal menyatakan berapa banyak signal audio terpisah yang di-encode

(33)

D. Sampling Rate

Menyatakan jumlah potongan sampel tiap detik. Nilai ini tidak dipengaruhi oleh

jumlah kanal.

E. Average Bytes Per Second

Nilai ini mengindikasikan berapa besar byte data Wave harus di-stream ke konverter D/A (Digital Audio) tiap detik sewaktu suatu file Wave dimainkan. Informasi ini berguna ketika terjadi pengecekan apakah data dapat di-stream

cukup cepat dari suatu sumber agar sewaktu playback pembacaan data tidak terhenti. Nilai ini dapat dihitung dengan menggunakan rumus di bawah ini:

... (2.1)

F. Block Align

Menyatakan jumlah byte tiap potongan sampel. Nilai ini tidak dipengaruhi oleh jumlah kanal dan dapat dikalkulasi dengan rumus di bawah ini:

... (2.2)

G. Significant Bits Per Sample

Nilai ini menyatakan jumlah bit yang digunakan untuk mendefinisikan tiap sampel. Nilai ini biasanya berupa 8, 16, 24 atau 32 (merupakan kelipatan 8). Jika

jumlah bit tidak merupakan kelipatan 8 maka jumlah byte yang digunakan tiap sampel akan dibulatkan ke ukuran byte paling dekat dan byte yang tidak digunakan akan diset 0 (nol) dan diabaikan.

H. Extra Format Byte

Nilai ini menyatakan berapa banyak format byte tambahan. Nilai ini tidak ada jika kode kompresi adalah 0 (file PCM yang tidak terkompresi). Jika terdapat suatu nilai pada bagian ini maka ini digunakan untuk menentukan jenis file Wave yang memiliki kompresi dan ini memberikan informasi mengenai jenis kompresi apa

yang diperlukan untuk men-decode dataWave. Jika nilai ini tidak dilakukan word aligned (merupakan kelipatan 2), penambahan byte (padding) pada bagian akhir data ini harus dilakukan.

AvgBytesPerSec = SampleRate * BlockAlign

(34)

2.14.4 Chunk Data

Chunk ini ditandai dengan adanya string “data”. Chunk Data pada file Wave terdiri atas sampel digital audio yang mana dapat didecode kembali menggunakan metode kompresi atau format biasa yang dinyatakan dalam chunk format Wave. Jika kode kompresinya adalah 1 (jenis PCM tidak terkompresi), maka “Data Wave” terdiri atas nilai sampel mentah (raw sample value).Seperti terlihat pada Tabel 2.7.

Tabel 2.7 Format Data Chunk (Gunawan,2005)

Offset Ukuran Tipe Deskripsi Nilai

0x00 4 char[4] chunk ID "data" (0x64617461)

0x04 4 dword Ukuran chunk Tergantung pada panjang sampel dan jenis kompresi

0x08 Sampel data

Sampel digital audio multi-channel disimpan dalam bentuk data wave Interlaced. File wave multi-channel (seperti stereo dan surround) disimpan dengan mensiklus tiap kanal sampel audio sebelum melakukan pembacaan lagi untuk tiap waktu cuplik berikutnya. Dengan cara seperti ini maka file audio tersebut dapat dimainkan atau di-stream tanpa harus membaca seluruh isi file. Lebih praktis dengan cara seperti ini ketika sebuah filewave dengan ukuran yang besar dimainkan dari disk (mungkin tidak dapat dimuat seluruhnya ke dalam memori) atau ketika melakukan

streaming sebuah file wave melalui jaringan internet.

(35)

2.14.5 Format Wave PCM

Jenis format Wave ini merupakan jenis file Wave yang paling umum dan hampir dikenal oleh setiap program. Format Wave PCM (Pulse Code Modulation) adalah file wave yang tidak terkompresi, akibatnya ukuran file sangat besar jika file mempunyai durasi yang panjang. Berikut ini diagram (Gambar 2.4) yang menggambarkan format

file Wave PCM. (Kadhim,2012).

(36)

Berikut ini penjelasan mengenai struktur file Wave yang dimulai dengan header RIFF: Seperti terlihat pada Tabel 2.8.

Tabel 2.8 Penjelasan Struktur File Wave (Gunawan,2005)

Offset Size Nama Field Deskripsi

0 4 ChunkID Terdiri atas kata “RIFF” dalam bentuk ASCII

(0x52494646 dalam bentuk big-endian). 4 4 Chunksize 36 + SubChunk2Size atau lebih tepatnya:

4 + (8 + SubChunk1Size) + (8 + SubChunk2Size).

Ini adalah besar seluruh file dalam byte dikurangi 8

byte untuk 2 field yang tidak termasuk dalam hitungan: ChunkID dan ChunkSize

8 4 Format Terdiri atas kata “WAVE” (0x57415645 dalam

bentuk big-endian).

12 4 SubChunk1ID Terdiri atas kata “fmt “ (0x666d7420 dalam bentuk

big-endian).

16 4 SubChunk1Size 16 untuk jenis PCM.

20 2 AudioFormat PCM = 1 (Linear quantization). Nilai lebih dari 1 mengindikasikan fileWave kompresi.

22 2 NumChannels Mono = 1, Stereo = 2 dan seterusnya

24 4 SampleRate 8000, 44100, dan seterusnya dalam satuan Hz

28 4 ByteRate = SampleRate * NumChannels * BitsPerSample / 8

32 2 BlockAlign = NumChannels * BitsPerSample / 8

Jumlah byte untuk satu sampel termasuk semua

channel.

34 2 BitsPerSample 8 bits = 8, 16 bits = 16, dan seterusnya.

36 4 SubChunk2ID Terdiri atas kata “data” (0x64617461 dalam bentuk

big-endian).

40 4 SubChunk2Size = NumSamples * NumChannels * BitsPerSample / 8

(37)

Keterangan: Format “WAVE” terdiri atas 2 buah SubChunk2: “fmt ” dan “data”.

SubChunk “fmt “ menggambarkan format data sound.

SubChunk “data” terdiri atas ukuran besar data dan data sound

sebenarnya.

Sebagai contoh, berikut ini merupakan 72 byte pertama dari sebuah file Wave

yang ditampilkan dalam heksadesimal:

52 49 46 46 24 08 00 00 57 41 56 45 66 6d 74 20 10 00 00 00 01 00 02 00 22 56 00 00 88 58 01 00 04 00 10 00 64 61 74 61 00 08 00 00 00 00 00 00 24 17 1e f3 3c 13 3c 14 16 f9 18 f9 34 e7 23 a6 3c f2 24 f2 11 ce 1a 0d

Berikut ini (Gambar 2.5) interpretasi dari tiap byte pada fileWave di atas:

Gambar 2.5 Interpretasi tiap Byte pada File Wave (Gunawan, 2005)

Selain bentuk standar dari file Wave di atas, seperti yang dikemukakan sebelumnya file Wave dapat ditambahkan chunk-chunk lain. Penambahan ini tidak berpengaruh sebab suatu program yang membaca file Wave jika tidak memerlukan informasi pada chunk ini akan mengabaikannya dan mencari chunk lain yang diperlukannya. Sebagai contoh berikut ini ditampilkan suatu tabel sebuah file Wave

(38)

Tabel 2.9 Penambahan Chunk Lain Pada File Wave(Gunawan,2010)

Start

Byte

Chunk Chunk Field Name contents contents

(HEX)

bytes Format

0 RIFF Name "RIFF" 52 49 46 46 4 ASCII

4 Size 176444 3C B1 02

00

4 uInt32

8 WAVE Name "WAVE" 57 41 56 45 4 ASCII

12 Fmt Name "fmt " 66 6D 74

20

4 ASCII

16 Size 16 10 00 00 00 4 uInt32

20 wFormatTag 1 01 00 2 uInt16

22 nChannels 2 02 00 2 uInt16

24 nSamplesPerSec 44100 44 AC 00

00

4 uInt32

28 nAvgBytesPerSec 176400 10 B1 02

00

4 uInt32

32 nBlockAlign 4 04 00 2 uInt16

34 nBitsPerSample 16 10 00 2 uInt16

36 Rgad name "rgad" 72 67 61 64 4 ASCII

40 size 8 08 00 00 00 4 uInt32

44 fPeakAmplitude 1 00 00 80 3F 4 float32

48 nRadioRgAdjust 10822 46 2A 2 uInt16

50 nAudiophileRgAdjust 18999 37 4A 2 uInt16

52 Data name "data" 64 61 74 61 4 ASCII

56 size 176400 10 B1 02

00

4 uInt32

(39)

2.15 Hubungan Multimedia dengan Aplikasi Windows

Arsitektur dari pelayanan multimedia dirancang berdasarkan konsep dari extensibilitas (ekstensibility) dan device independence (kebebasan alat). Berdasarkan kata

multimedia dapat diasumsikan bahwa multimedia merupakan suatu wadah atau penyatuan beberapa media menjadi satu. Elemen-elemen dalam pembentukan aplikasi

multimedia adalah teks, gambar, suara dan video. Untuk itu ekstensibilitas memungkinkan arsitektur perangkat lunak dengan mudah mengakomodasikan lebih

canggih dalam teknologi tanpa perubahan pada arsitektur itu sendiri (Santi,2010).

Kebebasan alat memungkinkan aplikasi multimedia menjadi lebih mudah dikembangkan yang akan berjalan pada perangkat keras yang berbeda-beda. 3 (tiga)

elemen desain dari perangkat lunak sistem mendukung ekstensibilitas dan kebebasan

alat yaitu:

1. Lapisan translasi (MMSystem) yang mengisolasikan aplikasi dari driver peralatan dan memusatkan pada kode kebebasan alat.

2. Hubungan run-time yang memungkinkan lapisan translasi untuk menghubungkan dengan driver yang dibutuhkan.

3. Suatu bentuk yang diatur sesuai dan driver konsisten interface yang meminimalkan kode khusus dan membuat instalasi dan meningkatkan proses

menjadi lebih mudah.

Untuk lebih jelasnya maka digambarkan bagaimana lapisan translasi

menterjemahkan sebuah fungsi multimedia menjadi panggilan kepada driver alat

audio:

Gambar 2.6 Lapisan-Lapisan Multimedia dengan Windows

Level Aplikasi

Level Translasi

(40)

2.7 Kompresi Data

Kompresi data dilakukan untuk mereduksi ukuran data atau file. Dengan melakukan kompresi atau pemadatan data maka ukuran file atau data akan lebih kecil sehingga dapat mengurangi waktu transmisi sewaktu data dikirim dan tidak banyak

menghabiskan ruang media penyimpan (Nadarajan, 2008).

2.7.1 Teori Kompresi Data

Dalam makalahnya di tahun 1948, “A Mathematical Theory of Communication”,

Claude E. Shannon merumuskan teori kompresi data. Shannon membuktikan adanya

batas dasar (fundamental limit) pada kompresi data jenis lossless. Batas ini, disebut dengan entropy rate dan dinyatakan dengan simbol H. Nilai eksak dari H bergantung pada informasi data sumber, lebih terperinci lagi, tergantung pada statistikal alami dari

data sumber. Adalah mungkin untuk mengkompresi data sumber dalam suatu bentuk

lossless, dengan laju kompresi (compression rate) mendekati H. Perhitungan secara matematis memungkinkan ini dilakukan lebih baik dari nilai H (Adhitama, 2009).

Shannon juga mengembangkan teori mengenai kompresi data lossy. Ini lebih dikenal sebagai rate-distortion theory. Pada kompresi data lossy, proses dekompresi data tidak menghasilkan data yang sama persis dengan data aslinya. Selain itu, jumlah

distorsi atau nilai D dapat ditoleransi. Shannon menunjukkan bahwa, untuk data sumber (dengan semua properti statistikal yang diketahui) dengan memberikan

pengukuran distorsi, terdapat sebuah fungsi R(D) yang disebut dengan rate-distortion function. Pada teori ini dikemukakan jika D bersifat toleransi terhadap jumlah distorsi, maka R(D) adalah kemungkinan terbaik dari laju kompresi (Dangarwala, 2010).

Ketika kompresi lossless (berarti tidak terdapat distorsi atau D = 0), kemungkinan laju kompresi terbaik adalah R(0) = H (untuk sumber alphabet yang

(41)

Teori kompresi data lossless dan teori rate-distortion dikenal secara kolektif sebagai teori pengkodean sumber (source coding theory). Teori pengkodean sumber menyatakan batas fundamental pada unjuk kerja dari seluruh algoritma kompresi data.

Teori tersebut sendiri tidak dinyatakan secara tepat bagaimana merancang dan

mengimplementasikan algoritma tersebut. Bagaimana pun juga algoritma tersebut

menyediakan beberapa petunjuk dan panduan untuk memperoleh unjuk kerja yang

optimal. Dalam bagian ini, akan dijelaskan bagaimana Shannon membuat model dari

sumber informasi dalam istilah yang disebut dengan proses acak (random process). Di bagian selanjutnya akan dijelaskan mengenai teorema pengkodean sumber lossless

Shannon, dan teori Shannon mengenai rate-distortion. Latar belakang mengenai teori probabilitas diperlukan untuk menjelaskan teori tersebut.

2.7.2 Pemodelan Sumber (Source Modeling)

Pada umumnya perpustakaan mempunyai pilihan buku-buku yang banyak, misalnya

terdapat 100 juta buku dalam perpustakaan tersebut. Tiap buku dalam perpustakaan ini

sangat tebal, sebagai contoh tiap buku mempunyai 100 juta karakter (atau huruf).

Ketika anda pergi ke perpustakaan tersebut, mengambil sebuah buku secara acak dan

meminjamnya. Buku yang dipilih tersebut merupakan informasi sumber yang akan

dikompresi. Buku yang terkompresi tersebut disimpan pada zip disk untuk dibawa pulang, atau ditransmisi secara langsung melalui internet ke rumah anda ataupun

bagaimana kasusnya.

Secara matematis buku yang dipilih tersebut didenotasikan sebagai:

X = (X1, X2, X3, X4, …)

Dimana X merepresentasikan seluruh buku, dan X1 merepresentasikan karakter pertama dari buku tersebut, X2 merepresentasikan karakter kedua, dan seterusnya. Meskipun pada kenyataannya panjang karakter dalam buku tersebut terbatas, secara

matematis diasumsikan mempunyai panjang karakter yang tidak terbatas. Alasannya

adalah buku tersebut terlalu tebal dan dapat dibayangkan jumlah karakternya terlalu

banyak. Untuk menyederhanakan hal tersebut, misalkan diasumsi semua karakter

dalam buku tersebut terdiri atas huruf kecil (‘a’ hingga ‘z’) atau SPACE. Sumber

(42)

A={a, b, c, d, e, f, g, h, i, j, k, l, m, n, o, p, q, r, s, t, u, v, w, x, y, z, SPACE}

Sekarang jika seorang yang ingin merancang suatu algoritma kompresi maka

sangat sulit baginya untuk mengetahui buku yang mana yang akan dipilih. Orang

tersebut hanya mengetahui bahwa seseorang akan memilih sebuah buku dari

perpustakaan tersebut. Dengan cara pandangnya, karakter-karakter dalam buku

merupakan (Xi, i = 1, 2 , …) merupakan variabel acak yang diambil dari nilai alphabet A. Keseluruhan buku, X merupakan urutan tak berhingga dari variabel acak, makanya X merupakan suatu proses acak. Ada beberapa cara untuk menyatakan model statistik dari buku tersebut:

A. Zero-Order Model. Tiap karakter distatistik secara bebas dari semua karakter dan 27 kemungkinan nilai dalam alphabet A dinyatakan sama seperti yang muncul. Jika model tersebut akurat, maka cara tipikal untuk membuka sebuah

buku adalah seperti berikut (Dangarwala, 2010)

rxkhrjffjuj zlpwcfwkcyj ffjeyvkcqsghyd qpaamkbzaacibzlhjqd

B. First-Order Model. Dalam bahasa Inggris diketahui beberapa huruf muncul lebih sering dibandingkan huruf yang lain. sebagai contoh, huruf ‘a’ dan ‘e’

lebih umum daripada huruf ‘q’ dan ‘z’. Jadi dalam model ini karakter masih

secara bebas terhadap satu sama lain, tetapi distribusi probabilitas dari

karakter-karakter tersebut menurut distribusi statistikal urutan pertama dari

teks bahasa Inggris. Teks yang secara tipikal dari model ini berbentuk seperti

ini:

ocroh hli rgwr nmielwis eu ll nbnesebya th eei alhenhttpa oobttva nah brl

C. Second-Order Model. Dua model sebelumnya diasumsi menurut statistik secara bebas dari satu karakter hingga karakter berikutnya. Ini tidak begitu

akurat dibandingkan dengan bahasa alami Inggris. Sebagai contoh, beberapa

huruf dalam kalimat tersebut hilang. Bagaimanapun juga, kita masih dapat

menerka huruf-huruf tersebut dengan mencarinya pada konteks kalimat. Ini

mengimplikasikan beberapa ketergantungan antara karakter-karakter. Secara

(43)

daripada karakter yang berhubungan jauh satu sama lainnya. Pada model ini,

karakter yang ada Xi bergantung pada karakter sebelumnya Xi−1, tetapi secara kondisional tidak bergantung dengan semua karakter (X1, X2, …, Xi−2). Menurut model ini, distribusi probabilitas dari karakter Xi beragram menurut karakter sebelumnya Xi−1. Sebagai contoh, huruf ‘u’ jarang muncul (probabilitas = 0.022). Bagaimanapun juga, jika dinyatakan karakter

sebelumnya adalah ‘q’ maka probabilitas dari ‘u’ dalam karakter berikutnya

lebih tinggi (probabilitas = 0.995). Teks tipikal untuk model ini terlihat seperti

berikut:

on ie antsoutinys are t inctore st be s deamy achin d ilonasive tucoowe at teasonare fuso tizin andy tobe seace ctisbe

D. Third-Order Model. Ini merupakan pengembangan model sebelumnya. Berikut ini merupakan karakter Xi yang bergantung pada dua karakter sebelumnya (Xi−2, Xi−1) tetapi secara kondisional tidak bergantung pada semua karakter sebelumnya sebelum: (X1, X2,…, Xi−3). Pada model ini, distribusi dari

Xi beragam menurut (Xi−2, Xi−1). Teks tipikal dari model ini seperti bentuk

berikut ini:

in no ist lat whey cratict froure birs grocid pondenome of demonstures of the reptagin is regoactiona of cre

Penyusunan kembali menjadi teks Inggris asli akan memudahkan tiap teks di

atas dapat dibaca.

E. General Model. Pada model ini, buku X merupakan proses acak seimbang yang berubah-ubah. Properti statistikal pada model seperti ini terlalu kompleks

untuk dipertimbangkan sebagai tujuan praktikal. Model ini disukai hanya

dalam sudut pandang teoritikal saja.

Model A di atas merupakan kasus khusus dari model B. Model B merupakan

kasus spesial dari Model C. Model C merupakan kasus spesial dari model D. Model D

(44)

2.7.3 Entropi Rate Dari Suatu Sumber

Entropy rate dari suatu sumber adalah suatu bilangan yang bergantung hanya pada statistik alami sumber. Jika sumber mempunyai suatu model sederhana, maka nilai

tersebut dapat dengan mudah dikalkulasi. Berikut ini, contoh dari sumber yang

berubah-ubah:

X = (X1, X2, X3, X4, ...),

Dimana X merupakan teks dalam bahasa Inggris. Maka model statistik sumber di atas adalah sebagai berikut:

A. Zero-Order Model. Karakter-karakter secara statistik bersifat bebas untuk setiap alphabet A dan secara bersamaan muncul. Misalkan m merupakan ukuran dari alphabet. Dalam kasus ini, entropy rate dapat dinyatakan dengan persamaan:

H= log2m bits/char ... (2.3) Untuk teks dalam bahasa Inggris, ukuran alphabet m = 27. Jadi, jika ini merupakan model akurat untuk teks dalam bahasa Inggris, maka entropy rate

akan bernilai H = log2 27 = 4,75 bits/character.

B. First-Order Model. Karakter-karakter secara statistik bersifat bebas. Misalkan

m adalah ukuran dari alphabet dan misalkan Pi merupakan probabilitas dari huruf ke-i dalam alphabet.

Entropy ratenya adalah: H= ∑�_�=1�_��₂�_� bits/char ... (2.4) Dengan menggunakan first-order distribution, entropy rate dari teks Inggris sebesar 4,07 bits/character.

A. Second-Order Model. Misalkan Pji adalah probabilitas yang berkondisi untuk karakter yang berlaku saat ini dan merupakan huruf ke-j dalam alphabet yang

merupakan karakter sebelumnya yaitu huruf ke-i. maka entropy ratenya adalah:

H= ∑_�=1� �_�∑_�=1� �_�_|_��₂�_�_|_� bits/char ... (2.5)

(45)

D. Third-Order Model. Misalkan Pkj,i adalah probabilitas berkondisi yang berlaku untuk karakter saat ini dan merupakan karakter ke-k dalam alphabet

yang didapat dari karakter sebelumnya yaitu huruf ke-j dan satu karakter

sebelum huruf ke-i. Entropy rate untuk model tersebut adalah:

H= ∑�_�=1�_�∑_�=1� �_�_|_�∑_�=1� �_�_|_�_,_��₂�_�_|_�_,_� bits/char ... (2.6)

Dengan menggunakan third-order distribution, entropy rate dari teks Inggris dengan model di atas adalah 2,77 bits/character.

B. General Model. Misalkan Bn merepresentasikan karakter n pertama. Entropy

rate dalam kasus yang umum dinyatakan dengan persamaan berikut ini:

H = lim_�→∞1

�∑ �(�)��2�(�)� bits/char ... (2.7) Dimana seluruh jumlah dari semua mn merupakan kemungkinan nilai dari Bn.

Adalah tidak mungkin untuk menghitung entropy rate menurut persamaan di atas. Dengan menghitung metoda prediksi, Shannon mampu memperkirakan

entropy rate dari ke-27 teks Inggris adalah 2,3 bits/character.

Hanya terdapat satu entropy rate untuk suatu sumber yang diberikan. Semua definisi di atas untuk entropy rate saling bersesuaian satu sama lainnya.

2.7.4 Dalil Shannon Mengenai Lossless Source Coding

Dalil Shannon mengenai Lossless Source Coding berdasarkan pada konsep dari block coding. Untuk mengilustrasikan konsep tersebut, diperkenalkan suatu sumber informasi khusus dimana suatu alphabet terdiri atas hanya dua huruf:

A = {a,b}

Di sini, huruf ‘a’ dan ‘b’ sama-sama mempunyai kemungkinan untuk muncul.

Bagaimanapun juga, misalkan ‘a’ muncul dalam karakter sebelumnya, probabilitas ‘a’

untuk muncul lagi dalam karakter saat ini adalah 0,9. Sama halnya dengan ‘b’ muncul

sebagai karakter sebelumnya, probabilitas ‘b’ akan muncul sekali lagi sebagai karakter

saat ini adalah 0,9. Ini dikenal sebagai Binary Symmetric Markov Source.

(46)

1. First-Order Block Code. Tiap karakter dipetakan sebagai suatu bit tunggal.

B1 P(B1) Codeword

a 0.5 0

b 0.5 1

R =1 bit/character