METODE PENELITIAN - Codebook Excited Linear Prediction (CELP)

B. Codebook Excited Linear Prediction (CELP)

III. METODE PENELITIAN

Bab ini membahas mengenai bagaimana metode pengerjaan tugas akhir ini

dilakukan dan langkah-langkah pengerjaan yang dilakukan.

BAB IV HASIL DAN PEMBAHASAN

Bab ini berisi analisis dan simulasi mengenai pemrosesan sinyal suara

menggunakan teknik pengkodean CELP pada sinyal suara dengan laju bit

rendah.

BAB VI SIMPULAN DAN SARAN

Bab ini berisi simpulan dan saran yang diperoleh berdasarkan hasil

II. DASAR TEORI

A. Pengkodean Sinyal Suara 1. Gambaran Umum

Pengkodean sinyal suara adalah suatu bidang penelitian yang banyak diteliti

didalam pengolahan sinyal suara sejak adanya telepon - telepon yang

koneksinya menggunakan kawat. Banyak teknik - teknik pengkodean suara

telah secara menyeluruh diteliti dan dikembangkan, namun ditolak lebih lanjut

oleh kemajuan di dalam didunia internet, dan teknologi komunikasi nirkabel.

Pengkodean menjadi suatu dasar dari unsur komunikasi-komunikasi digital

yang secara terus-menerus menarik perhatian peneliti karena

permintaan-permintaan akan jasa telekomunikasi yang meningkat.

Pengkodean suara sudah menjadi suatu keperluan yang pokok karena adanya

pembatasanbandwidth pada kebanyakan sistem transmisi sinyal. Pengkodean

suara merupakan suatu penyajian digital sinyal suara dengan kode yaitu

menggunakan suatu nomor yang minimum dari bit-bit untuk mencapai

kualitas suara yang baik dan tetap memelihara kompleksitas. Pengkodean

suara mempunyai dua aplikasi utama yakni transmisi digital dan penyimpanan

mutu sinyal suara, atau untuk memperbaiki mutu suara pada suatu laju bit

tertentu.

3. Sinyal Suara Manusia (Sinyal Wicara)

3.1. Pembangkitan Sinyal Wicara pada Manusia

Speech (wicara) dihasilkan dari sebuah kerjasama antara lungs

(paru-paru), glottis (dengan vocal cords) dan articulation tract (mouth/mulut

dannose cavity/rongga hidung).

Gambar 1 menunjukkan penampang melintang dari organ wicara

manusia. Untuk menghasilkan sebuah voiced sounds (suara ucapan),

paru-paru lungs menekan udara melalui epiglottis, vocal cords bergetar,

menginterupsi udara melalui aliran udara dan menghassilkan sebuah

gelombang tekananquasi-periodic.

Impuls tekanan pada umumnya disebut sebagai pitch impulses dan

frekuensi sinyal tekanan adalah pitch frequency atau fundamental

frequency. Di dalam Gambar 2a sederetan impuls (fungsi tekanan suara)

dihasikan olehvocal cordsuntuk sebuah suara.

Ini merupakan bagian dari sinyal voice (suara) yang mendefinisikan

speech melody (melodi wicara). Ketika kita berbicara dengan sebuah

frekuensi pitch konstan, suara sinyal wicara monotonous tetapi dalam

kasus normal sebuah perubahan permanen pada frekuensi terjadi. Variasi

frekuensipitchdapat dilihat seperti pada Gambar 2b.

a. Sederetan impulse yang sama

b. Variasi pada frekuensi pitch

Impuls pitch merangsang udara di dalam mulut, dan untuk suara tertentu

(nasals) juga merangsang nasal cavity (rongga hidung). Ketika rongga

beresonansi, akan menimbulkan radiasi sebuah gelombang suara yang

mana merupakan sinyal wicara. Kedua rongga beraksi sebagai resonators

dengan karacteristik frekuensi resonansi masing-masing, yang disebut

formant frequencies. Pada saat rongga mulut dapat mengalami perubahan

besar, kita mampu untuk menghasilkan beragam pola ucapan suara yang

berbeda.

Di dalam kasus unvoiced sounds (suara tak terucap), exitasi pada vocal

tract lebih menyerupai noise (derau). Gambar 3 menampilkan proses

produksi suara-suara /a/, dan /f/. Untuk sementara perbedaan bentuk dan

posisi pada organarticulationdiabaikan saja.

a) pembangkitan ucapan /a/

b) pembangkitan ucapan /f/

2.2. Bentuk Sinyal Wicara dalam Domain Waktu

Sinyal wicara merupakan sinyal yang bervariasi lambat sebagai fungsi

waktu, dalam hal ini ketika diamati pada durasi yang sangat pendek (5

sampai 100 mili detik) karakteristiknya masih stasioner. Tetapi bilamana

diamati dalam durasi yang lebih panjang (>1/5 detik) karakteristik

sinyalnya berubah untuk merefleksikan suara ucapan yang keluar dari

pembicara [7].

Gambar 4. Contoh sinyal wicara ucapan “Selamat Datang”

Salah satu cara dalam menyajikan sebuah sinyal wicara adalah dengan

menampilkannya dalam tiga kondisi dasar, yaitusilence(S) atau keadaan

tenang dimana sinyal wicara tidak diproduksi, unvoice (U) dimanavocal

cord tidak berfibrasi, dan yang ketiga adalah voiced (V) dimana vocal

kerongkongan melalui mekanisme akustik sampai keluar mulut dan

menghasilkan sinyal wicara.

2.3. Proses Sampling

Berikut ini sinyal sinus:

x(t) = A cos(ωt +φ)... (1)

Sinyal tersebut merupakan contoh sinyal waktu kontinyu. Seringkali

digunakan terminologi sinyal analog untuk menyebutnya.

Untuk proses komputasi, sinyal waktu kontinyu harus dirubah menjadi

bentuk waktu diskrit dan dilanjutkan dengan proses digitalisasi. Untuk

memperoleh bentuk sinyal waktu diskrit, sinyal waktu kontinyu harus

di-sampel.

Gambar 5.Blok diagram konversi sinyal kontinyu menjadi sinyal diskrit

Sekuen x[n] didapatkan setelah proses perubahan dari continues to

discrete(C-to-D). Kondisi realnya secarahardwareadalah menggunakan

Gambar 6.Rangkaian Sampling

Rangkaian sampling diatas merupakan sebuah ujung tombak dari sebuah

analog to digital conversion(ADC).

Gambar 7. Blok diagram rangkaian ADC

Persyaratan frekuensi sampling menurut teorema Shannon harus sama

dengan atau melebihi 2 kali frekuensi sinyal yang di sample.

fs > 2xfi ... (2)

Jika sinyal informasi yang menjadi sample memiliki komponen frekuensi

beragam, misalnya untuk sinyal wicara memungkinkan untuk memiliki

frekuensi dari 20 sampai 4000 Hz, maka sinyal informasi tersebut bisa

dituliskan sebagai:

. ... (3)

fs > 2xfimax ... (4)

Frekuensi sampling seringkali dikatakan dengan terminology sampling

rate, yaitu jumlah sample yang diambil setiap detik, fs=1/Ts yang juga

dikenal sebagaiNyquist rate.

2.4. Energi Suatu Sinyal

Berikut ini sinyal sinus:

x(t) = A cos(2πt +φ) ... (5)

Bentuk persamaan (5) diatas merepresentasikan nilai magnitudo sinyal

sebagai fungsi waktu. Di dalam kondisi real seringkali dinyatakan dalam

besaran volt. Nilai x(t) dalam parameter yang umum untuk pengukuran

dinyatakan dalam V(t) yang menunjukkan nilai simpangan sinyal atau

magnitudonya pada suatu waktu t.

Sedangkan untuk besaran lain dari sinyal dalam hal ini daya dinyatakan

sebagai:

... (6)

Dalam hal ini nilai nilai R biasanya dinyatakan sebesar 1 Ω . Dan

parameter ini seringkali tidak dituliskan, sehingga persamaan 6 menjadi

lebih sederhana.

... (7)

Sedangkan besarnya energi dari suatu sinyal diketahui sebagai total daya

pada suatu durasi waktu tertentu. Dengan mengacu pada persamaan (6)

yang sudah dimodifikasi, maka dapat dinyatakan sebagai:

... (8)

dan energi rata-rata untuk suatu durasi tertentu T, dinyatakan sebagai

... (9)

Untuk sinyal sinus diatas dalam bentuk energi dapat diberikan seperti

Gambar 9.Sinyal sinus dalam bentuk energi

2.5. Energi Pada Sinyal Wicara

Untuk pengukuran nilai energi pada sinyal wicara harus melibatkan

fungsi window. Hal ini karena dalam pengukuran energi sinyal wicara

harus disusun dalam frame-frame tertentu. Ini merupakan standar dalam

teknologi speech processing, sebab secara umum dalam pengolahan

sinyal wicara akan berkaitan dengan sinyal dengan durasi yang terlalu

panjang bila dihitung dalam total waktu pengukuran. Fenomena ini juga

dikenal sebagaishort term speech signal energy.

Untuk menghitung energi sinyal wicara digunakan formulasi dasar seperti

... (10)

dimana:

E = Energi Sinyal

V(t) = Nilai Simpangan Sinyal (Magnitudo)

w(t) = Merupakan fungsi window seperti hamming, hanning,

bartlett, danboxcarr.

Panjang window dalam hal ini adalah m, untuk durasi dari t=0 sampai

t=T akan didapatkan window sebanyak n=T/m apabila tidak ada

overlappingantara window satu dengan yang lain.

Jika terjadi overlapping antara window satu dengan yang lain, misalnya

sebesar m/2, maka jumlah window dalam satu durasi T adalah sebanyak :

n = 1 + T/(m/2).

Untuk suatu pengamatan energi pada frame ke-k bentuk persamaan (10)

menjadi:

... (11)

dimana k akan menentukan posisi titik-titik window pada sinyal tersebut,

Gambar 10.Sinyal wicara

Dengan menggunakan model short time measurement dapat digunakan

untuk memilah bagian dari sinyal wicara yang merupakan voiced atau

unvoiced. Sebab pada umumnya unvoiced speech memiliki durasi yang

lebih pendek. Untuk pengukuran sinyal wicara menggunakan window

biasanya dipilih panjang window dengan durasi 10 s/d 20 mili detik.

Apabila menggunakan frekuensisamplingsebesar 16 KHz, maka nilainya

akan ekuivalen dengan sampel sebanyak 160 sampai 320 sampel setiap

Gambar 11.Segmen sinyal wicara ‘a’ dan window hamming 20 mili detik per frame window

2.6. Representasi Sinyal Wicara dalam Domain Waktu dan Domain Frekuensi

Salah satu cara untuk mencirikan sinyal wicara dan mereprensetasikan

suaranya adalah melalui representasi spectral. Cara yang paling popular dalam hal ini adalah sound spectrogram yang mana merupakan suatu bentukgray scale imageyang merepresentasikan nilai freukensi sinyal pada waktu tertentu [9].

Gambar 12. Bentukspectrogramdanwaveform“a-i-u-e-o”

Intensitas spectral pada suatu titik waktu ditunjukkan dengan tingkat

keabuan yang merupakan suatu bentuk analisis frekuensi particular dari

sinyal wicara yang sedang diamati. Perhatikan Gambar 12 pada nilai t =

1,5 detik. Tampak bahwa banyak nilai frekuensi muncul pada bagian

spectrogram-nya, ini sesuai dengan tampilan grafik domain waktu yang

menunjukkan simpangan gelombang pada waktu tersebut cukup tinggi

dan beragam. Sedangkan pada nilai t = 2,3 detik tampak spectrogram

menunjukkan sedikit sekali warna hitam, yang menunjukkan komponen

frekuensi yang muncul sangat sedikit, ini sesuai dengan bentuk

2.7.Discrete Fourier Transform(DFT)

Salah satu cara mentransformasi sinyal dari domain waktu ke dalam domain

frekuensi adalah dengan meggunakandiscrete fourier transform(DFT).

... (12)

Persamaan (12) diatas menyatakan bahwa sinyal akan periodik pada

setiap nilai N. Implementasi DFT dapat diwujudkan dengan sebuah Bank

Filter seperti Gambar 13 berikut ini.

Gambar 13.Blok diagram system Bank Filter Spectrum Analyzer untuk menghitung DFT

Untuk mengoptimalkan proses komputasi, DFT bias dimodifikasi dengan

satu algorithma yang disebut sebagai fast fourier transform (FFT).

Dengan FFT proses komputasi bias direduksi dari N² menjadi N log₂ N.

Misalnya dengan menggunakan DFT akan melakukan transformasi

sebanyak N=1024 titik, maka diperlukan perkalian sebanyak N² =

1.048.567. Sedangkan dengan menggunakan FFT perkalian yang

diperlukan sebanyak N log2N = 5120 perkalian.

Sebuah contoh hasil penggunakan algorithma FFT untuk system yang

lebih komplek adalah untuk mengolah sinyal wicara. Pada gambar 14

ditunjukkan sebuah hasil proses FFT untuk kalimat“a-i-u-e-o”.

4. Filter Pada Sinyal Suara

3.1. Filter IIR

Infinite inpulse response (IIR) dalam hal ini bukan berarti filter yang

bekerja dari nilai negatif tak hingga sampai positif tak hingga. Pengertian

sederhana untuk infinite impulse respon filter disini adalah bahwa output

filter merupakan fungsi dari kondisi input sekarang, input sebelumnya

dan output di waktu sebelumnya. Konsep ini kemudian lebih kita kenal

sebagairecursive filter, yang mana melibatkan proses feedback dan feed

forward. Dalam bentuk persamaan beda yang menghubungkan input

dengan output dinyatakan seperti persamaaan (13) berikut ini.

... (13)

dimana:

- {bk} koefisienfeed forward

- {al} koefisienfeed back

- banyaknya (total koefisien) = M+N+1

- N ditetapkan sebagai orde filter IIR

Untuk merealisasikan ke dalam sebuah program simulasi atau perangkat

keras maka bentuk persamaan diatas dapat disederhanakan ke dalam

Untuk implementasi sebuah low pass filter bersifat narrow-band

menggunakan sebuah filter IIR merupakan pilihan yang sangat sulit tetapi

masih mungkin dilakukan. Satu alasannya adalah penentuan orde yang

tepat sehingga menghasilkan bentuk yang tajam pada respon frekuensi

relative sulit. Pada domain unit circle bidang-z sering ditandai dengan

letakpole-poleyang ada diluar lingkaran, hal ini secara fisis memberikan

arti bahwa filter yang dihasilkan tidak stabil.

Gambar 15.Diagram blok Filter IIR

3.2. Filter FIR

Sebuah finite impulse respon filter (filter FIR) memiliki hubungan input

dan output dalam domain waktu diskrit sebagai berikut:

dimana:

-{bk}= koefisienfeed forward

- banyaknya (total koefisien) L = M + 1

- M ditetapkan sebagai orde filter FIR

Dalam realisasi diagram blok akan dapat digambarkan seperti pada

Gambar 16 berikut ini,

Gambar 16.Diagram blok FIR Filter

Untuk tujuan simulasi perangkat lunak dapat memanfaatkan fungsi

standar berikut ini: B = FIR1(N,Wn)

Ini merupakan sebuah langkah untuk merancang filter digital FIR dengan

orde sebesar N, dan frekuensi cut off Wn. Secara default oleh Matlab

ditetapkan bahwa perintah tersebut akan menghasilkan sebuah low pass

sepanjang (N+1) dan akan disimpan pada vektor B. Karena dalam domain

digital, maka nilai frekuensi cut off harus berada dalam rentang

0<Wn<1.0. Nilai 1.0 akan memiliki ekuivalensi dengan nilai 0,5 dari

sampling rate (fs/2).Yang perlu anda ketahui juga adalah bahwa B

merupakan nilai real dan memiliki fase yang linear. Sedangkan gain

ternormalisasi filter pada Wn sebesar -6 dB.

3.3. Filter Pre-Emphasis

Dalam proses pengolahan sinyal wicara pre emphasis filter diperlukan

setelah proses sampling. Tujuan dari pemfilteran ini adalah untuk

mendapatkan bentuk spectral frekuensi sinyal wicara yang lebih halus.

Dimana bentuk spectral yang relatif bernilai tinggi untuk daerah rendah

dan cenderung turun secara tajam untuk daerah fekuensi diatas 2000 Hz.

Gambar 17.Posisi FilterPre-Emphasispada sistem pengolah wicara

Filter pre-emphasis didasari oleh hubungan input/output dalam domain

waktu yang dinyatakan dalam persamaan seperti berikut:

dimanaamerupakan konstanta filterpre-emhasis, biasanya bernilai 0.9 < a < 1.0. Dalam bentuk dasar operator z sebagai unit filter, persamaan

diatas akan memberikan sebuah transfer function filter pre-emphasis

seperti berikut.

H(z) = 1− az

⁻¹ ... (16)

Bentuk ini kemudian akan memberikan dasar pembentukan diagram blok

yang menggambarkan hubungan input dan output seperti pada Gambar

18.

Gambar 18.Diagram blokpre-emphasisfilter

Dengan memanfaatan perangkat lunak Matlab akan dengan mudah

mendapatkan bentuk respon frekuensi filterpre-empasis.

clear all; w=0:.01:3.14; a=0.93; H=1-a*exp(-j*w); plot(w/3.14,20*log10(abs(H)),'linewidth',2) grid axis([0 1.00 -25 10])

xlabel('frekuensi ternormalisasi') ylabel('magnitudo (dB)')

title('Pre-Emphasis filter')

Gambar 19. Respon frekuensi filter pre-emphasis

Dengan nilai a = 0,93 akan mampu melakukan penghalusan spectral

sinyal wicara yang secara umum mengalami penurunsan sebesar 6

dB/octav.

Pengaruh filter ini pada sebuah sinyal wicara dapat memanfaatkan

program dibawah ini.

clear all;

fs=10000;[x,fs]=wavread('a.wav'); xx=length(x)+1;x(xx)=0; alpha=0.96; for i=2:xx

end

for i=1:xx

y(i) = x(i) - alpha*y0(i); end subplot(211) t=1:xx; plot(t/fs,y);legend('input');grid xlabel('waktu (dt)'); ylabel('magnitudo');axis([0 0.7 -0.25 0.25]); subplot(212) plot(t/fs,y0); legend('output');grid

xlabel('waktu (dt)'); ylabel('magnitudo'); axis([0 0.7 -1 ...1.5])

Hasilnya adalah berupa sebuah gambaran bentuk sinyal input dan output

dari file sinyal wicara’a.wav’ dalam domain waktu.

Gambar 20.Sinyal input dan output daripre-emphasisfilter dalam domain waktu

Sedangkan hasil yang didapatkan dalam bentuk domain frekuensi adalah

seperti berikut.

Gambar 21.Sinyal input dan output daripre-emphasisfilter dalam domain frekuensi

4. Analisa sinyal suara

4.1. Auto Korelasi Sinyal Wicara

Tujuan melakukan estimasi dalam domain waktu adalah untuk

mendapatkan nilai autokorelasi sinyal wicara. Nilai autokorelasi suatu

sinyal wicara akan menunjukkan bagaimana bentuk gelombang itu

membentuk suatu korelasi pada dirinya sendiri sebagai fungsi perubahan

waktu ke waktu. Bentuk-bentuk yang sama atau mirip pada setiap delay

waktu tertentu menunjukkan perulangan bentuk atau periodisitas pola

sinyal wicara. Dengan demikian akan dapat dilakukan estimasi nilai

Gambar 22. Sinyal wicara dalam bentuk gelombang, dan fungsi auto korelasi

4.2. AnalisaSpectralSinyal Wicara

Proses ekstraksi ciri sinyal wicara didasarkan pada sebuah diagram blok

yang cukup popular seperti berikut.

Gambar 23.Diagram blok extraksi ciri sinyal wicara.

Dengan mengikuti diagram blok diatas, akan didapatkan langkah-demi

analisys dari sinyal wicara, atau yang juga kita kenal sebagai power

spectral density (PSD) sebuah sinyal wicara pada durasi atau frame

tertentu. Dengan mengetahui bentuk PSD sinyal wicara kita akan mampu

melakukan ekstraksi ciri sinyal wicara tersebut.

Sebelum proses pada gambar diatas dilakukan sebelumnya melihat

gambaran sebuah sinyal wicara yang telah disimpan dalam bentuk file

“a.wav”. Setelah didapatkan bentuknya dalam domain waktu seperti pada

gambar 24, selanjutnya melihatnya sebagai fungsi dari sampling. Dalam

hal ini bentuk sinyal wicara akan sesuai dengan urutan sampel yang ada.

Seperti kita lihat bahwa untuk nilai sampel ke-700 sampai dengan sampel

ke-8200, menunjukkan nilai magnitudo sinyal yang relatif stabil.

Selanjutkan dengan melakukan pembentukanframesebuah sinyal wicara

seperti pada gambar 25. Dengan melakukan windowing akan didapatkan

bentuk frame sinyal wicara terwindow seperti pada Gambar 25.

Sebelumnya harus sudah dipahami proses windowing yang dilakukan.

Dengan dapat diambil satu frame sinyal dari sampel ke-2000 sampai

dengan sampel ke 2480. Karena dalam satu frame terbentuk dari:

Sampel/frame = (sample/detik)*(detik/frame) = 8000 * 0,02= 160 sampel/frame

Hal ini dilakukan dengan menetapkan bahwa satu frame sinyal wicara

Gambar 24.Sinyal wicara dalam domain waktu dan sebagai fungsi sample ke-n

Gambar 25.Satu frame sinyal wicara dalam domain waktu

Proses dilanjutkan dengan melakukan transformasi sinyal ke dalam

didapatkan nilai power spectral density (PSD) sinyal wicara seperti pada

gambar26.

Gambar 26.Power spectral densitysinyal wicara

4.3.CepstrumSinyal Wicara

Cepstrum (c(τ)) didefinisikan sebagai inverse transformasi Fourier pada short-time nilai logarithmik spektrum amplitudo sebuah sinyal, |X(ω)|.

Jika log amplitudo spectrum tersusun dari banyak spasi harmonik yang

teratur, maka analisis Fourier pada spectrum ini akan menunjukkan sebuah

puncak yang berhubungan dengan jarak antar harmonisa tersebut, yang

juga dikenal sebagai frekuensi fundamental [2].

Dengan melakukan proses mengikuti diagram blok pada Gambar 23, maka

proses berkutnya adalah melakukan ifft nilai PSD yang sudah diperoleh. Proses ini menghasilkan sebuah nilai frekuensi dari sinyal wicara.

Gambar 27.Gambaran frekuensi sinyal wicara ”a.wav”

Langkah ini dilanjutkan dengan lifter window, yaitu proses pengambilan

sebagian saja dari nilaifrekuensisinyal wicara yang terdapat pada Gambar

27. Dalam hal ini dapat diambil kuefrensi sinyal 16 sampai 20 nilai

pertama yang muncul. Nilai ini sudah cukup representatif untuk

mendapatkan ciri dari sinyal wicara.

Yang terakhir adalah melakukan transformasi fourier pada hasil lifter

window yang selanjutnya akan menghasilkan sebuah cepstrumdari sinyal

Gambar 28.Perbandingan nilai psd dan cepstrum sinyal wicara ”a.wav”

Dari Gambar 28 diatas didapatkan gambaran bentuk cepstrum sinyal

wicara menunjukkan pola yang mirip dengan pola PSD. Disini tampak

bahwa bentuk cepstrum merupakan penghalusan dari bentuk PSD sebuah

sinyal wicara.

Representasi Sinyal Dalam Domain Waktu Dan Domain Frekuensi

5.1 Penyajian Daerah Waktu

Analisa sinyal digital gelombang suara yaitu dengan memisahkan suara

voice dan unvoice. Untuk suara yang diucapkan, pembukaan dan

penutupan celah suara mengakibatkan satu rangkaian pulsa yang

berhubungan dengan celah suara. Proses eksitasi ini meliputi suatu

perilaku periodik, dimana masing-masing siklus opening dan closing

periode waktu. Suatu dawai pulsa berhubungan dengan celah suara yang

berurutan, yang dikenal sebagai pembangkitan pulsa, mengakibatkan suatu

bentuk gelombang eksitasi periodik. Satu contoh dari suara yang berisi

kata [ dia ] dapat dilihat pada gambar 29 [2].

Gambar29. perbandingan dari suara voice dan unvoice

5.2 Penyajian Daerah Frekuensi

Pada umumnya dapat dipahami bahwa saluran suara menghasilkan sinyal

suara berisi semua karakteristik-karakteristik filter [1]. Didalam persepsi

suara, telinga manusia secara normal bertindak sebagai suatu bank filter

dan menggolongkan isyarat-isyarat yang masuk kedalamnya sebagai

komponen-komponen frekuensi yang terpisah. Pada keadaan paralel

perilaku dari sistem persepsi suara manusia adalah sinyal suara terpisah

menjadi gelombang sinusoidal berdasarkan daerah frekuensi yang berbeda

secara serempak. Secara teknis, telinga manusia mampu mendengar sinyal

berkisar antara 20 Hz sampai 20 kHz, tergantung pada amplitudonya.

Bagaimanapun juga hal itu dikenal sebagai pendengaran paling sensitif

untuk frekuensi di sekitar 1 sampai 5 kHz [3]. Karenanya distorsi

amplitudo didalam bandwidth-bandwidth frekuensi tinggi lebih sedikit

yang dapat manusia dengar dibandingkan distorsi amplitudo yang sama

didalam daerah frekuensi rendah. Karena karakteristik ini, kinerja dari

teknik pengkodean CELP tidak hanya semata-mata berdasarkan pada nilai

kesalahan rata-rata (MSE). Ukuran MSE yang sesuai persepsi akan

dimasukkan untuk mengevaluasi kinerja dari pengkodean berdasar pada

kejelasan dan mutu sinyal yang direkonstruksi.

B.Codebook Excited Linear Prediction(CELP) 1. Pengertian CELP

Codebook Excited Linear Prediction (CELP) adalah salah satu teknik

pengkodean yang paling luas digunakan dengan kelas pengkode suara yang

didasarkan pada konsep dari LPC (Linear Prediction Coding). Peningkatannya

adalah bahwa pada suatu codebook, sinyal-sinyal eksitasi yang berbeda akan

dipelihara atau dipertahankan di encoder dan decoder. Encoder menemukan

indeks sinyal eksitasi paling cocok dan mengirimkannya kepada decoderyang

kemudian digunakan untuk reproduksi sinyal. Karenanya nama Codebook

Prinsip kerjanya adalah mendeskripsikan sinyal suara yang menjadi input

untuk diubah dalam bentuk bit-bit kode pada encoder, sinyal suara yang

masuk akan dieksitasi, yaitu membangkitkan sinyal pada codebook untuk

memperkecil derau dan noise suara yang akan dikirimkan pada decoder. Laju

bit yang digunakan pun lebih kecil agar dapat menghemat bandwidth pada

kanal transmisi.

Ada banyak varian dari CELP yang digunakan dalam berbagai

aplikasi-aplikasi. Low-DelayCELP (LD-CELP) danAlgebraic CELP (ACELP) secara

umum digunakan pada panggilan suara internet. Perbedaan utama di dalam

varian-varian ini adalah pembuatan sinyal eksitasi yang digunakan di dalam

dekoder beserta informasi yang lain untuk merekonstruksi sinyal suara.

Perbedaan-perbedaan lain meliputi di dalamnya adalah pengolahan sebelum

proses dan sesudah proses untuk menyaring pembentukan sinyal-sinyal asli

Dalam dokumen ANALISA DAN SIMULASI TEKNIK PENGKODEAN SUARA CELP (CODE EXCITED LINEAR PREDICTIVE CODING) DENGAN PEMROGRAMAN MATLAB (Halaman 29-73)