• Tidak ada hasil yang ditemukan

2.1 Voice over Internet Protocol (VoIP)

2.1.4 Compressor-decompressor (Codec) pada VoIP

Pengkodean suara merupakan pengalihan kode analog menjadi kode digital

agar suara dapat dikirim dalam jaringan komputer (Purbo, 2007). Pengkodean dikenal dengan istilah codec, yang merupakan singkatan dari coder-decoder atau

compressor-decompressor. Berbagai jenis codec dikembangkan untuk memampatkan suara agar bisa menggunakan bandwidth secara hemat tanpa mengorbankan kualitas suara (suara yang keluar masih dapat didengar dengan baik) (Wahyuddin M. I. 2009). Perbedaan skema kompresi dapat dibandingkan dengan 4 parameter, yaitu (Boger, Y.):

1. Compressed voice rate, codec mengkompres suara berkisar dari 64 kbps sampai bit rate yang lebih rendah.

2. Complexity, semakin tinggi tingkat kerumitan codec, semakin tinggi resource

komputer yang diminta.

3. Voice quality, pengompresan suara di beberapa codec menghasilkan kualitas yang sangat bagus, sedangkan yang lain menyebabkan degradasi yang signifikan.

4. Digitalizing delay, setiap algoritma membutuhkan waktu untuk mem-buffer

percakapan sebelum pengompresan, inilah yang disebut dengan digitalizing delay. Delay ini dimasukkan ke dalam delay end-to-end secara keseluruhan.

Codec mempengaruhi kebutuhan bandwidth untuk VoIP, semakin kecil bit rate sinyal digital yang dihasilkan codec, maka semakin baik codec tersebut. Namun perhitungan matematis yang dilakukannya menjadi semakin rumit dan ini mempengaruhi kualitas suara setelah di-decode. Kualitas suara biasanya dihitung dengan metode Mean Opinion Score (MOS). Metode ini memberi nilai rata-rata kualitas suara antara 1 sampai 5 dimana 1 artinya buruk dan 5 artinya baik. Codec

mengconverter sinyal analog menjadi digital untuk pemancaran melalui rangkaian data.

1. Codec G.711

G.711 adalah suatu standar Internasional untuk kompresi audio dengan menggunakan teknik Pulse Code Modulation (PCM) dalam pengiriman suara. PCM mengkonversikan sinyal analog kebentuk digital dengan melakukan

sampling sinyal analog tersebut 8000 kali perdetik dan dikodekan dalam kode angka. Jarak antar sampel adalah 125 μ detik. Sinyal analog pada suatu percakapan diasumsikan berfrekuensi 300 Hz-3400 Hz. Sinyal tersampel lalu dikonversikan ke bentuk diskrit. Sinyal diskrit ini direpresentasikan dengan kode yang disesuaikan dengan amplitudo dari sinyal sampel. Format PCM menggunakan 8 bit untuk pengkodeannya. Laju transmisi diperoleh dengan mengkalikan 8000 sampel perdetik dengan 8 bit persampel, menghasilkan 64.000 bit perdetik. Bit rate 64 Kbps ini merupakan standar transmisi untuk satu kanal telepon digital.

Percakapan berupa sinyal analog yang melalui jaringan PSTN mengalami kompresi dan pengkodean menjadi sinyal digital oleh PCM G.711 sebelum memasuki VoIP gateway. Pada VoIP gateway, di bagian terminal, terdapat audio

codec melakukan proses framing (pembentukan frame datagram IP yang dikompresi) dari sinyal suara terdigitasi (hasil PCM G.711) dan juga melakukan rekonstruksi pada sisi receiver. Frame yang merupakan paket-paket informasi ini lalu ditransmisikan melalui jaringan IP dengan suatu standar komunikasi jaringan

packetbased. Standar G.711 merupakan teknik kompresi yang tidak efisien, karena akan memakan bandwidth 64 Kbps untuk kanal pembicaraan.

Codec G.711 dibagai menjadi 2, yaitu G.711 U-law (standar Amerika Serikat dan Jepang) dan G.711 A-law (standar Eropa dan negara lainnya selain Amerika Serikat dan Jepang). U-law berkaitan dengan penggunaan kabel T1 yang digunakan di Amerika Utara dan Jepang sedangkan A-law berkaitan dengan

kabel E1 yang digunakan di Eropa dan negara – negara lainnya. Kabel T1 terdiri dari 24 kanal dengan kecepatan keseluruhan 1544 Mbit per detik. Sedangkan kabel E1 terdiri dari 31 kanal dengan kecepatan total 2048 Mbit per detik.

G.711 A-law dan G.711 U-law memiliki perbedaan pada algoritma yang digunakan. Codec G.711 A-law melakukan sampling sinyal suara menjadi 13 bit, sedangkan codec G.711 U-law melakukan sampling sinyal suara menjadi 14 bit

(Brokish, C.W. & Lewis, M. 1997). Perbedaan kualitas suara yang dihasilkan juga terjadi antara codec G.711 A-law dan U-law walaupun sedikit, dimana kedua codec tersebut memiliki bit rate yang hampir sama besar. Perbedaan ini disebabkan karena perbedaan algoritma yang digunakan oleh kedua codec

tersebut, codec G.711 A-law menggunakan algoritma yang lebih sederhana dibandingkan dengan yang digunakan oleh G.711 U-law.

Proses encoder dan decoder pada codec G.711 A-Law dan U-Law dapat dilihat pada block diagram di bawah ini :

Penjelasan dari block diagram di atas adalah :

• Konversi sinyal A-Law atau U-Law ke uniform (linear) PCM.

• Menghitung perbedaan sinyal dengan mengurangkan perkiraan sinyal input dari sinyal input itu sendiri.

• Mengeksekusi adaptif 31-, 15-, 7- atau 4-level kuantisasi untuk menetapkan lima, empat, tiga atau dua digit biner, untuk nilai sinyal yang digunakan pada transmisi.

• Menghitung perkiraan sinyal input yang diharapkan.

Gambar 2.3 Block diagram decoder pada G.711 Penjelasan block diagram decoder di atas adalah :

• Sebuah quantizer menghasilkan perbedaan sinyal terkuantisasi dari lima, empat, tiga atau dua digit biner.

• Perkiraan sinyal ditambahkan pada perbedaan sinyal terkuantisasi untuk menghasilkan versi rekonstruksi dari sinyal input.

• Kedua sinyal tersebut diproses oleh adaptive predictor yang menghitung perkiraan sinyal yang diharapkan, menyusun sinyal dari yang berbeda menjadi seragam (linear) PCM.

• Mengkompresi sinyal PCM linear sesuai dengan A-Law atau U-Law.

2. Codec GSM 06.10

Codec GSM 06.10 adalah suatu standar internasional yang dimiliki oleh

European Telecommunications Standards Institute (ETSI). GSM 06.10 memiliki

bit rate yang jauh berbeda dari codec G.711 A-law maupun G.711 U-law. Codec

GSM 06.10 memiliki bit rate 13 kbps sedangkan codec G.711 A-law dan G.711 U-law memiliki bit rate sebesar 64 kbps (Purbo, O.W. & Raharja, A. 2010). Hal inilah yang menyebabkan besarnya perbedaan kualitas suara yang dihasilkan oleh

codec GSM 06.10 dan G.711.

GSM yang digunakan pada asterisk merupakan GSM-FR yang biasa disebut juga GSM 06.10. Codec ini menggunakan Linear Predictive Coding with Regular Pulse Excitation (LPC-RPE). GSM-FR merupakan codec suara yang beroperasi pada 13.2 kbps dengan lebar paket 20ms. Setiap paket berisi payload

sebesar 264 bit atau sekitar 33 byte. Perhitungan pemakaian bandwidth untuk codec ini dapat dijabarkan sebagai berikut (Zuhdan, 2008).

Bit rate (Br) = 13,2 kbps = 13200 bps Packet length = 20 ms Packet/s (Ps) = 1/20ms = 1/0.02s = 50 packet/s Payload = Br / Ps = 13200 bps / 50 = 264bit = 33 Byte

IP header ( IP + UDP + RTP ) = 40 Byte

Bandwidth = (payload + IP header) X packet/s X 8 bit/Byte

Linear Prediction Synthesis Filter Long term prediction Excitation analysis Packet Suara 20 ms 36 bit 36 bit 206 bit error - +

Gambar 2.4 Diagram codec GSM Encoder

• input speech frame, terdiri dari 160 sample sinyal (uniform 13 bit PCM sample), pertama kali di pre-proses untuk menghasilkan offset free signal yang akan menjadi urutan pertama dalam pre-emphasis filter.160 sample sinyal yang diperoleh kemudian dianalisa untuk menentukan koefisien untuk filter analisis jangka pendek (analisis LPC). Parameter ini kemudian digunakan untuk penyaringan 160 sampe yang sama. Hasilnya adalah 160 sample dari short term residu signal. Filter parameter, disebut koefisien refleksi ditransformasikan ke area log rasio, LARs sebelum ditransmisikan. Speech frame dibagi menjadi 4 sub-frame dengan 40 sample pada setiap frame. Setiap sub frame diproses berdasarkan blok oleh elemen fungsional berikutnya.

• sebelum pemrosesan sub-blok dari 40 short term sample, parameter dari long term analisis filter, LTP lag dan LTP gain diperkirakan dan diupdate pada blok LTP analisis, pada dasar sub blok yang sekarang dan urutan yang tersimpan dari 120 sample short term sebelumnya.

• sebuah blok dari 40 sample long term residual didapatkan dengan mengurangi perkiraan 40 short term residual signal itu sendiri. Menghasilkan 40 blok long term residual sample diumpankan ke Regular Pulse Excitation Analysis yang menghasilkan kompresi dasar dari algoritma

• Sebagai hasil dali RPE-analysis, 40 blok input long term residual signal diwakili oleh salah satu dari 4 kandidat dari masing-masing 13 getaran. Sub-urutan terpilih diidentifikasi ole RPE grid position (M). 13 getaran RPE diencode menggunakan Adaptive Pulse Code Modulation (APCM) dengan perkiraan dari amplitudo sub-blok yang ditransmisikan ke decoder sebagai informasi tambahan. RPE parameter juga diumpankan ke sebuah decoing RPE lokal dan modul rekonstruksi yang menghasilkan 40 blok short term residual signal baru dari versi kuantisasi dari long term residual signal.

• Dengan menambahkan 40 sample terkuantisasi dari long term residual signal ke blok sebelumnya dari short term residual signal memperkirakan, sebuah versi rekonstruksi dari short term residual signal yang sekarang yang dihasilkan. Blok dari short term residual signal yang direkonstruksi ini

kemudian diumpankan ke long term analysis filter yang menghasilkan 40 blok baru dari short term residual signal yang digunakan untuk sub blok selanjutnya untuk melengkapi feedback loop.

Decoder

• Decoder memiliki feedback loop yang sama dengan encoder. Dalam transmisi bebas error, output dari tahap ini adalah short term residual sample yang telah direkonstruksi. Sample ini kemudian diterapkan pada short term synthesis filter diikuti dengan de-emphasis filter menghasilkan speech signal yang direkonstruksi.

• GSM 06.10 menjelaskan pemetaan detail antara input blok dari 160 speech sample dalam bentuk 13 bit uniform PCM ke 260 bit blok yang diencode dan dari 260 bit blok yang diencode ke output blok yang terdiri dari 160 sample yang telah direkonstruksi. Sampling 8000 sample/detik menghasilkan rata-rata bit rate untuk bit stream encode sebesear 13 kbit/s

Dokumen terkait