SIMULASI GLOBAL SYSTEM FOR MOBILE COMMUNICATION ADAPTIVE MULTI RATE SPEECH CODEC

(1)

JETri,

Volume 3, Nomor 1, Agustus 2003, Halaman 49-60, ISSN 1412-0372

SIMULASI GLOBAL SYSTEM FOR MOBILE

COMMUNICATION ADAPTIVE MULTI

RATE SPEECH CODEC

Suhartati Agoes & Aulia Satianingrum*

Dosen Jurusan Teknik Elektro-FTI, Universitas Trisakti Abstract

As the wireless technology continuing developing enormously, within it the development of speech signal compression joining too, which is implemented in digital communication system. Among the aim is privileged to minimize the channel capacity or bandwidth usage and the speed of transmission. So the use of smaller bits, which brings maximised voice quality, are the most important factor to this technology. One of the speech signal compression techniques which is implemented in GSM network is called Adaptive Multi Rate (AMR) speech codec or known as GSM-AMR speech codec. There are 8 (eight) bit rates 12.2, 10.2, 7.95, 7.40, 6.70, 5.90, 5.15 and 4.75 kbps which is used by GSM-AMR. The bit rates have abilities to adapt to the situation and condition of the network and also ability to tailor the operator needs and requirement. The result of a non real-time simulation is shown that GSM-AMR has a good enough quality of speech signal reconstruction with range of SNR between 18.78 and 20.35 dB and also range of MSE between 0.053 and 0.079. The smaller the bitrate, the better the SNR and the MSE. It was also proven with the comparison of original signal and constructed signal which is shown that the reconstructed signal has similarities figure with the original signal. Overall, the performance of the speech codec gives a good speech quality.

Keyword: Speech Codec, GSM-AMR, Adaptive Multi Rate, SNR, MSE.

1. Pendahuluan

Suara (speech) merupakan hal yang sangat berpengaruh terhadap terciptanya komunikasi antar manusia. Terciptanya sistem komunikasi seluler bergerak memungkinkan manusia untuk saling berkomunikasi one to

one, dimana kita dapat berbicara langsung dengan orang yang ingin kita

tuju secara pribadi, serta dapat dilakukan dimanapun dan kapanpun sehingga menjadikan hal tersebut bagian dari kehidupan manusia sehari-hari.

Pada teknologi komunikasi seluler, informasi suara ditransmisikan melalui medium gelombang radio. Sinyal suara merupakan sinyal analog yang ditransmisikan. Ketika mempertimbangkan sumber-sumber penting pada semua sistem komunikasi, yaitu kekuatan transmisi dan utilitas

(2)

JETri,

Tahun Volume 3, Nomor 1, Agustus 2003, Halaman 49-60, ISSN 1412-0372

spektral, pengiriman sinyal analog ke tujuan menjadi suatu proses yang lambat, tidak efisien dan tidak fleksibel. Atau dengan kata lain terdapat kendala-kendala yang mempengaruhi kuantitas dan kualitas dari sinyal informasi serta kapasitas bandwidth yang tersedia dan kecepatan transmisi yang dibutuhkan. Semakin besar sinyal informasi yang akan ditransmisikan maka semakin besar pula kebutuhan akan kapasitas bandwidth.

Kebutuhan akan bandwidth terus bertambah seiring dengan pesatnya pertumbuhan teknologi telekomunikasi dan informasi. Seperti dalam teknologi MMS (Multimedia Messaging Service) yang membutuhkan

bandwidth yang lebar yang dapat mengakomodasikan seluruh layanan dari

MMS.

Ilmu pengetahuan dan teknologi memungkinkan dilakukannya banyak penelitian dalam mencapai efisiensi spektral dalam penggunaan

bandwidth pada transmisi sinyal suara. Salah satunya adalah dengan

terciptanya sistem kompresi suara digital (digital speech compression) dalam merepresentasikan sinyal suara.

Dengan menggunakan teknik kompresi digital maka jumlah data yang besar dapat ditekan tanpa mengurangi kualitas suara asli. Selain itu tekonik kompresi digital memungkinkan terjadinya manipulasi data dan penyimpanan data pada tempat-tempat tertentu untuk diolah lebih lanjut (Grag & Wilkes, 1996: 123).

Saat ini, terdapat beberapa teknik kompresi suara. Diantara teknik kompresi tersebut adalah AMR (Adaptive Multi Rate), digunakan pada sistem telekomunikasi seluler digital GSM (Global System For Mobile

Communication). GSM AMR speech codec akan terus berkembang dan

merupakan teknik kompresi esensial untuk generasi telekomunikasi seluler yang akan datang.

2. Tinjauan Umum Sistem GSM-AMR Speech Codec

Codec didesain untuk beroperasi pada channel mode Global System For Mobile Communication (GSM) full-rate bit-rate 22,8 kb/s dan channel

mode GSM half-rate pada 11,4 kb/s. Untuk setiap channel mode terdapat

codec mode masing-masing seperti pada table 1. (ETSI. GSM 06.71, 1999:

(3)

Suhartati Agoes & Aulia Satianingrum, Simulasi Global System For Mobile Communication

Tabel 1. Codec mode AMR untuk tiap channel GSM

Channel Source Codec Bit Rate

TCH/FS/AMR (TCH/AFS) 12.2 kbit/s 10.2 kbit/s 7.95 kbit/s 7.40 kbit/s 6.70 kbit/s 5.90 kbit/s 5.15 kbit/s 4.75 kbit/s TCH/HS/AMR (TCH/AHS) 7.95 kbit/s 7.40 kbit/s 6.70 kbit/s 5.90 kbit/s 5.15 kbit/s 4.75 kbit/s

3. GSM-AMR Speech Codec

AMR (Adaptive Multi Rate) merupakan salah satu sistem kompresi suara esensial yang digunakan oleh sistem telekomunikasi selular digital UMTS (Universal Mobile Telecommunication Services) atau 3G (The Third

Generation). Namun demikian AMR sudah dapat diterapkan pada sistem

2G yaitu GSM (Global System For Mobile Communication).

Pada sistem AMR terkait banyak elemen didalamnya dan yang merupakan faktor terpenting dari sistem AMR adalah AMR speech codec itu sendiri. AMR speech codec terdiri dari encoder dan decoder yang

(4)

JETri,

memungkinkan penyedian kualitas suara yang superior dengan bitrate rendah. Selain itu AMR decoder mempunyai kompleksitas peralatan yang modest.

Tidak seperti speech codec GSM sebelumnya (HR, FR, EFR) dimana beroperasi pada rate yang tetap dan level eror proteksi yang konstan, AMR speech codec mengadaptasikan level eror proteksinya terhadap channel radio lokal dan kondisi trafik. AMR memilih channel yang optimum (half atau full rate) dan codec mode nya (bit rate speech dan

channel) dalam mengirimkan kombinasi yang terbaik antara kualitas dari speech dan kapasitas dari sistem. Sehingga AMR fleksibel atau dengan kata

lain adaptive terhadap lingkungannya dalam hal ini yaitu terhadap sistem GSM.Hal ini menyediakan beberapa keuntungan:

1. Peningkatan kualitas speech baik untuk mode half maupun full rate dengan adanya adaptasi codec mode yaitu memvariasikan keseimbangan antara speech dan channel coding untuk gross bit rate yang sama.

2. Kemampuan untuk bertukar kualitas dan kapasitas dari speech secara halus dan fleksibel dengan menggunakan kombinasi dari adaptasi mode

channel dan codec dimana dapat dikontrol oleh operator jaringan

berbasiskan antara sel dengan sel.

Konsep AMR speech codec tidak hanya dapat beradaptasi dengan kemampuannya untuk merespon kondisi radio dan trafik yang berubah melainkan juga dapat disesuaikan terhadap kebutuhan operator jaringan (ETSI. GSM 06.75, 1999: 8).

Setiap codec mode menggunakan CELP codec standardisasi GSM Enhanced Full-Rate dan mempunyai beberapa fitur yang sama dengan

codec mode EFR tersebut.

Dalam analisis LPC (Linear Prediction Coefficient), ukuran frame untuk semua source code adalah 20 ms dengan lookahead 5 ms. Parameter LPC dikodekan satu kali per frame pada domain LSF (Line Spectral

Frequency) dengan menggunakan 4 tahap. Untuk mode 12.2 kbit/s

digabung-kuantisasikan dengan 38 bit SMQ (Split Matrix Quantization) sedangkan untuk mode yang lainnya dikuantisasikan dengan 18 bit SVQ (Split Vector Quantization). SVQ dicari dengan menggunakan algoritma pencarian M-Best. Sinyal eksitasi dipilih dengan menggunakan sistem analisis–sintesis dimana error yang terjadi antara sinyal suara original (asli)

(5)

dengan sinyal suara sintesa diminimalisasikan dengan menggunakan pengukuran distorsi perceptual weighting. Hal ini dilakukan dengan memfilter sinyal error tersebut melalui filter (tapis) perceptual weighting yang koefisiennya didapatkan dari koefisien LP yang belum dikuantisasi. Dalam perceptual weighting dilakukan pemberatan eror tersebut dengan mengekploitasi noise masking dari formant. Sisa parameter diupdate satu kali per subframe.

Semua source code mempunyai empat buah subframe berukuran 5 ms per subframe. Pada semua codec mode, pitch lag dikodekan dengan menggunakan delta-search, algoritma pencarian adaptive codebook dimana pitch lag yang pertama pada setiap frame, dikodekan menggunakan 8 bit dan beberapa lag yang tersisa dikodekan secara berbeda tanpa mengganggu pengkodean sebelumnya untuk setiap 5 bit.

Untuk tanda serta lokasi pulsa dikodekan dan ditransmisikan dalam mendapatkan fixed excitation. Gain pada fixed dan adaptive excitation secara bersama-sama divektor-kuantisasikan dengan 7-bit codebook, dimana gain komponen dari fixed excitation dikodekan secara berbeda tanpa mengganggu predicted gain terestimasi dari nilai gain sebelumnya (ETSI. GSM 06.90. 2000: 14).

Bit-bit yang tersedia dialokasikan secara berbeda diantara source

coding, channel coding dan signaling pada setiap codec mode. Hal ini dapat

dilihat pada tabel 2 pada halaman berikut ini [ETSI. GSM 06.90; 2000: 16].

4. Simulasi dan Analisis Hasil Simulasi Sinyal AMR Speech Codec

Simulasi dilakukan pada GSM-AMR speech codec berdasarkan simulasi non real-time berbasiskan personal komputer (PC). Terdiri dari beberapa komponen simulasi dengan tiap-tiap tahapnya sehingga menghasilkan hal-hal yang mendukung teori yang berlaku pada GSM-AMR

speech codec. Dikarenakan GSM-AMR merupakan teknologi GSM seluler

pendukung suara maka suara digunakan sebagai sumber utama dalam melakukan simulasi.

Suara pendukung didapatkan dari 2 kelompok responden berumur sekitar 20-23 tahun, pria dan wanita, dengan tiap-tiap kelompok terdiri dari 2 (dua) orang pria dan 2 (dua) orang wanita. Pengambilan suara dilakukan pada lab Telekomunikasi FTI-Elektro Universitas Trisakti, tanpa mengindahkan kondisi yang ada pada lab tersebut.

(6)

JETri,

Tabel 2. Alokasi bit AMR Speech Codec

Mode Parameter 1st subframe 2nd subframe 3rd subframe 4th subframe Total Perframe 12.2 kbit/s 2 LSP sets 38 Pitch delay 9 6 9 6 30 Pitch gain 4 4 4 4 16 Algebraic code 35 35 35 35 140 Codebook gain 5 5 5 5 20 Total 244 10.2 kbit/s LSP set 26 Pitch delay 8 5 8 5 26 Algebraic code 31 31 31 31 124 Gains 7 7 7 7 28 Total 204 7.95 kbit/s LSP sets 27 Pitch delay 8 6 8 6 28 Pitch gain 4 4 4 4 16 Algebraic code 17 17 17 17 68 Codebook gain 5 5 5 5 20 Total 159 7.40 kbit/s LSP set 26 Pitch delay 8 5 8 5 26 Algebraic code 17 17 17 17 68 Gains 7 7 7 7 28 Total 148 6.70 kbit/s LSP set 26 Pitch delay 8 4 8 4 24 Algebraic code 14 14 14 14 56 Gains 7 7 7 7 28 Total 134

(7)

Suhartati Agoes & Aulia Satianingrum, Simulasi Global System For Mobile Communication Mode Parameter 1st subframe 2nd subframe 3rd subframe 4th subframe Total Perframe 5.90 kbit/s LSP set 26 Pitch delay 8 4 8 4 24 Algebraic code 11 11 11 11 44 Gains 6 6 6 6 24 Total 118 5.15 kbit/s LSP set 23 Pitch delay 8 4 4 4 20 Algebraic code 9 9 9 9 36 Gains 6 6 6 6 24 Total 103 4.75 kbit/s LSP set 23 Pitch delay 8 4 4 4 20 Algebraic code 9 9 9 9 36 Gains 8 8 16 Total 95

Simulasi menghasilkan bahwa pada suara terkodekan GSM-AMR

speech codec mempunyai karakteristik tidak jauh berbeda dari karakteristik

suara asli. Hal ini diketahui dengan adanya kemiripan bentuk amplitudo suara asli dengan suara rekonstruksi sesuai gambar 1. dan gambar 2. (pada halaman berikut) dan kualitas suara yang mirip berdasarkan pendengaran. Kemudian diperkuat dengan dengan mengguna kan metode sinyal error dimana diperhitungkan selisih antara sinyal rekontruksi dengan sinyal suara asli seperti yang dihasilkan pada gambar 3 (pada halaman berikutnya).

Kemudian untuk lebih mendukung hal tersebut diatas maka dilakukan analisis berdasarkan penghitungan objektif pada perangkat lunak MATLAB® menggunakan metode MSE (Mean Squared Error) dan SNR (Signal To Noise Ratio). Analisis dilakukan sepanjang sampel suara dimana berdurasi 1 (satu) detik dengan frekuensi sampling sebesar 8000 Hz.

Secara umum analisis MSE merupakan pengukuran tingkat kesalahan dari suatu sistem sesuai dengan rumus [Terrel & Shark, 1996: 203] seperti persamaan (1) pada halaman berikut:

(8)

JETri,





n

s

n

s

MSE



n





2

)

(

'

)

(

(1)

MSE tidak mempunyai besaran nilai. Suatu sistem dikatakan mempunyai kinerja yang baik apabila nilai MSE mendekati nol ( 0) atau dapat dikatakan tidak ada nya kesalahan pada sistem tersebut.

Gambar 1. Grafik Sinyal Suara Asli

(9)

Gambar 3. Grafik Sinyal Erorr

Dengan didukung nilai-nilai yang tertera pada tabel 3 dan diperkuat pada gambar 4 terlihat bahwa semakin kecil codec mode, MSE yang dihasilkan semakin mendekati nol. Sehingga dapat disimpulkan bahwa AMR speech codec mampu merekonstruksi suara mendekati suara asli

Kemudian pada analisis SNR diberi perlakuan yang sama seperti pada analisis MSE sesuai rumus yang berlaku [Terrel & Shark, 1996: 203] seperti pada persamaan (2):







  n n n s n s n s dB SNR ₂ 2 10 ) ( ' ) ( ) ( log 10 ) ( (2)

dimana SNR mempunyai besaran decibel. Desibel adalah besaran relatif yang mengacu pada pendengaran manusia dan merupakan salah satu cara yang tepat dalam mengetahui penguatan dari suatu sistem dengan menampilkan perbandingan antara 2 sinyal [Smith, 1999: 264]. Dalam hal ini ditetapkan agar nilai yang dihasilkan mempunyai persentase cukup besar, dengan demikian sistem mempunyai kinerja cukup baik dalam menghasilkan suara rekonstruksi berdasarkan suara asli.

(10)

JETri,

S

NR (dB)

Tabel 3. Hasil Perhitungan MSE

Codec Mode (kbit/s) Sampel Suara Pria I Sampel Suara Pria II Sampel Suara Wanita I Sampel Suara Wanita II 4.75 0.075236 0.071144 0.055147 0.073474 5.15 0.075126 0.070004 0.052333 0.072278 5.90 0.076955 0.071481 0.05225 0.06968 6.70 0.078601 0.072314 0.05351 0.069859 7.40 0.080172 0.072525 0.053822 0.071332 7.95 0.081607 0.074744 0.054305 0.07227 10.2 0.0814 0.0756 0.0552 0.0723 12.2 0.083658 0.077218 0.055243 0.072418 0,05 0,055 0,06 0,065 0,07 0,075 0,08 0,085 4,75 5,15 5,9 6,7 7,6 7,95 10,2 12,2

Sampel Suara Pria I Sampel Saura Wanita I Sampel Suara Pria II Sampel Saura Wanita II

Gambar 4. Grafik MSE Tiap Codec Mode

Dari nilai-nilai pada tabel 4 dan gambar 5 pada halaman berikut, nilai persentase SNR yang dihasilkan cukup besar, dengan demikian kinerja AMR speech codec cukup baik dalam merekonstruksi suara berdasarkan suara aslinya

(11)

Tabel 4. Hasil Perhitungan SNR

Codec Mode (kbit/s) Sampel Suara Pria I (dB) Sampel Suara Pria II (dB) Sampel Suara Wanita I (dB) Sampel Suara Wanita II (dB)

4.75 18.9913

19.3435

21.5077

20.3079

5.15 19.0037

19.3975

21.584 20.3969

5.90 18.8889

19.4018

21.5688

20.5147

6.70 18.7744

19.2825

21.4658

20.3945

7.40 18.7292

19.2822

21.4354

20.3778

7.95 18.6292

19.1002

21.3408

20.3451

10.2 18.6858

19.0895

21.2875

20.2239

12.2 18.5633

18.9937

21.2716

20.2935

Hasil tersebut dapat dilihat pada grafik pada halaman berikut:

18 18.5 19 19.5 20 20.5 21 21.5 22 4.75 5.15 5.9 6.7 7.6 7.95 10.2 12.2

MR PAHLIVI (PRIA I) ANDRITA I (WANITA I) ERI NUGRAHA (PRIA II) SEKARSARI (WANITA II)

Gambar 5. Grafik SNR Tiap Codec Mode

Codec Mode (kbit/s)

S

(12)

JETri,

Dari gambar 4 dan 5 juga dapat disimpulkan bahwa semakin kecil

codec mode semakin baik kinerja GSM-AMR speech codec.

5. Kesimpulan

GSM-AMR speech codec merupakan standarisasi teknologi kompresi suara pada jaringan seluler GSM. Codec tersebut menghasilkan kinerja cukup baik dan dapat diandalkan sesuai dengan yang diinginkan. Hal ini dibuktikan dengan perlakuan simulasi. Simulasi GSM-AMR speech

codec berbasis PC non real-time untuk tiap-tiap codec mode; 12.2, 7.95,

7.40, 6.70, 5.90, 5.15, dan 4.75 kbit/s, menghasilkan parameter simulasi semakin baik ketika codec mode semakin kecil. Dengan begitu faktor terpenting dalam teknologi kompresi suara yaitu penggunaan bit rate yang kecil dengan hasil suara maksimal dapat dicapai.

Daftar Pustaka

1. ETSI. GSM 06.71. 1999. Digital cellular telecommunications system

(Phase 2+); AMR (Adaptive Multi Rate) General Description.

(Phase 2+); Performance Characterization of GSM AMR (Adaptive Multi Rate).

(Phase 2+); AMR (Adaptive Multi Rate) Study Phase Report.

(Phase 2+); AMR (Adaptive Multi Rate) Speech Transcoding.

5. Garg, Vijay K. & Joseph E. Wilkes. 1999. Principles and Applications

of GSM. New Jersey: Prentice Hall

6. ICASSP99. Erdal Paksoy, Juan Carlos De Martin, etc. Adaptive Multi

Rate Speech Coder. USA

7. Schweber & William. 1999. Electronic Communication System. 2nd Edition. New Jersey: Prentice Hall International, Inc.

8. Smith & Steven W. 1999. The Scientist and Engineer's Guide to Digital