JETri,
Volume 3, Nomor 1, Agustus 2003, Halaman 49-60, ISSN 1412-0372SIMULASI GLOBAL SYSTEM FOR MOBILE
COMMUNICATION ADAPTIVE MULTI
RATE SPEECH CODEC
Suhartati Agoes & Aulia Satianingrum*
Dosen Jurusan Teknik Elektro-FTI, Universitas Trisakti Abstract
As the wireless technology continuing developing enormously, within it the development of speech signal compression joining too, which is implemented in digital communication system. Among the aim is privileged to minimize the channel capacity or bandwidth usage and the speed of transmission. So the use of smaller bits, which brings maximised voice quality, are the most important factor to this technology. One of the speech signal compression techniques which is implemented in GSM network is called Adaptive Multi Rate (AMR) speech codec or known as GSM-AMR speech codec. There are 8 (eight) bit rates 12.2, 10.2, 7.95, 7.40, 6.70, 5.90, 5.15 and 4.75 kbps which is used by GSM-AMR. The bit rates have abilities to adapt to the situation and condition of the network and also ability to tailor the operator needs and requirement. The result of a non real-time simulation is shown that GSM-AMR has a good enough quality of speech signal reconstruction with range of SNR between 18.78 and 20.35 dB and also range of MSE between 0.053 and 0.079. The smaller the bitrate, the better the SNR and the MSE. It was also proven with the comparison of original signal and constructed signal which is shown that the reconstructed signal has similarities figure with the original signal. Overall, the performance of the speech codec gives a good speech quality.
Keyword: Speech Codec, GSM-AMR, Adaptive Multi Rate, SNR, MSE.
1. Pendahuluan
Suara (speech) merupakan hal yang sangat berpengaruh terhadap terciptanya komunikasi antar manusia. Terciptanya sistem komunikasi seluler bergerak memungkinkan manusia untuk saling berkomunikasi one to
one, dimana kita dapat berbicara langsung dengan orang yang ingin kita
tuju secara pribadi, serta dapat dilakukan dimanapun dan kapanpun sehingga menjadikan hal tersebut bagian dari kehidupan manusia sehari-hari.
Pada teknologi komunikasi seluler, informasi suara ditransmisikan melalui medium gelombang radio. Sinyal suara merupakan sinyal analog yang ditransmisikan. Ketika mempertimbangkan sumber-sumber penting pada semua sistem komunikasi, yaitu kekuatan transmisi dan utilitas
JETri,
Tahun Volume 3, Nomor 1, Agustus 2003, Halaman 49-60, ISSN 1412-0372spektral, pengiriman sinyal analog ke tujuan menjadi suatu proses yang lambat, tidak efisien dan tidak fleksibel. Atau dengan kata lain terdapat kendala-kendala yang mempengaruhi kuantitas dan kualitas dari sinyal informasi serta kapasitas bandwidth yang tersedia dan kecepatan transmisi yang dibutuhkan. Semakin besar sinyal informasi yang akan ditransmisikan maka semakin besar pula kebutuhan akan kapasitas bandwidth.
Kebutuhan akan bandwidth terus bertambah seiring dengan pesatnya pertumbuhan teknologi telekomunikasi dan informasi. Seperti dalam teknologi MMS (Multimedia Messaging Service) yang membutuhkan
bandwidth yang lebar yang dapat mengakomodasikan seluruh layanan dari
MMS.
Ilmu pengetahuan dan teknologi memungkinkan dilakukannya banyak penelitian dalam mencapai efisiensi spektral dalam penggunaan
bandwidth pada transmisi sinyal suara. Salah satunya adalah dengan
terciptanya sistem kompresi suara digital (digital speech compression) dalam merepresentasikan sinyal suara.
Dengan menggunakan teknik kompresi digital maka jumlah data yang besar dapat ditekan tanpa mengurangi kualitas suara asli. Selain itu tekonik kompresi digital memungkinkan terjadinya manipulasi data dan penyimpanan data pada tempat-tempat tertentu untuk diolah lebih lanjut (Grag & Wilkes, 1996: 123).
Saat ini, terdapat beberapa teknik kompresi suara. Diantara teknik kompresi tersebut adalah AMR (Adaptive Multi Rate), digunakan pada sistem telekomunikasi seluler digital GSM (Global System For Mobile
Communication). GSM AMR speech codec akan terus berkembang dan
merupakan teknik kompresi esensial untuk generasi telekomunikasi seluler yang akan datang.
2. Tinjauan Umum Sistem GSM-AMR Speech Codec
Codec didesain untuk beroperasi pada channel mode Global System For Mobile Communication (GSM) full-rate bit-rate 22,8 kb/s dan channel
mode GSM half-rate pada 11,4 kb/s. Untuk setiap channel mode terdapat
codec mode masing-masing seperti pada table 1. (ETSI. GSM 06.71, 1999:
Suhartati Agoes & Aulia Satianingrum, Simulasi Global System For Mobile Communication
Tabel 1. Codec mode AMR untuk tiap channel GSM
Channel Source Codec Bit Rate
TCH/FS/AMR (TCH/AFS) 12.2 kbit/s 10.2 kbit/s 7.95 kbit/s 7.40 kbit/s 6.70 kbit/s 5.90 kbit/s 5.15 kbit/s 4.75 kbit/s TCH/HS/AMR (TCH/AHS) 7.95 kbit/s 7.40 kbit/s 6.70 kbit/s 5.90 kbit/s 5.15 kbit/s 4.75 kbit/s
3. GSM-AMR Speech Codec
AMR (Adaptive Multi Rate) merupakan salah satu sistem kompresi suara esensial yang digunakan oleh sistem telekomunikasi selular digital UMTS (Universal Mobile Telecommunication Services) atau 3G (The Third
Generation). Namun demikian AMR sudah dapat diterapkan pada sistem
2G yaitu GSM (Global System For Mobile Communication).
Pada sistem AMR terkait banyak elemen didalamnya dan yang merupakan faktor terpenting dari sistem AMR adalah AMR speech codec itu sendiri. AMR speech codec terdiri dari encoder dan decoder yang
JETri,
Tahun Volume 3, Nomor 1, Agustus 2003, Halaman 49-60, ISSN 1412-0372memungkinkan penyedian kualitas suara yang superior dengan bitrate rendah. Selain itu AMR decoder mempunyai kompleksitas peralatan yang modest.
Tidak seperti speech codec GSM sebelumnya (HR, FR, EFR) dimana beroperasi pada rate yang tetap dan level eror proteksi yang konstan, AMR speech codec mengadaptasikan level eror proteksinya terhadap channel radio lokal dan kondisi trafik. AMR memilih channel yang optimum (half atau full rate) dan codec mode nya (bit rate speech dan
channel) dalam mengirimkan kombinasi yang terbaik antara kualitas dari speech dan kapasitas dari sistem. Sehingga AMR fleksibel atau dengan kata
lain adaptive terhadap lingkungannya dalam hal ini yaitu terhadap sistem GSM.Hal ini menyediakan beberapa keuntungan:
1. Peningkatan kualitas speech baik untuk mode half maupun full rate dengan adanya adaptasi codec mode yaitu memvariasikan keseimbangan antara speech dan channel coding untuk gross bit rate yang sama.
2. Kemampuan untuk bertukar kualitas dan kapasitas dari speech secara halus dan fleksibel dengan menggunakan kombinasi dari adaptasi mode
channel dan codec dimana dapat dikontrol oleh operator jaringan
berbasiskan antara sel dengan sel.
Konsep AMR speech codec tidak hanya dapat beradaptasi dengan kemampuannya untuk merespon kondisi radio dan trafik yang berubah melainkan juga dapat disesuaikan terhadap kebutuhan operator jaringan (ETSI. GSM 06.75, 1999: 8).
Setiap codec mode menggunakan CELP codec standardisasi GSM Enhanced Full-Rate dan mempunyai beberapa fitur yang sama dengan
codec mode EFR tersebut.
Dalam analisis LPC (Linear Prediction Coefficient), ukuran frame untuk semua source code adalah 20 ms dengan lookahead 5 ms. Parameter LPC dikodekan satu kali per frame pada domain LSF (Line Spectral
Frequency) dengan menggunakan 4 tahap. Untuk mode 12.2 kbit/s
digabung-kuantisasikan dengan 38 bit SMQ (Split Matrix Quantization) sedangkan untuk mode yang lainnya dikuantisasikan dengan 18 bit SVQ (Split Vector Quantization). SVQ dicari dengan menggunakan algoritma pencarian M-Best. Sinyal eksitasi dipilih dengan menggunakan sistem analisis–sintesis dimana error yang terjadi antara sinyal suara original (asli)
Suhartati Agoes & Aulia Satianingrum, Simulasi Global System For Mobile Communication
dengan sinyal suara sintesa diminimalisasikan dengan menggunakan pengukuran distorsi perceptual weighting. Hal ini dilakukan dengan memfilter sinyal error tersebut melalui filter (tapis) perceptual weighting yang koefisiennya didapatkan dari koefisien LP yang belum dikuantisasi. Dalam perceptual weighting dilakukan pemberatan eror tersebut dengan mengekploitasi noise masking dari formant. Sisa parameter diupdate satu kali per subframe.
Semua source code mempunyai empat buah subframe berukuran 5 ms per subframe. Pada semua codec mode, pitch lag dikodekan dengan menggunakan delta-search, algoritma pencarian adaptive codebook dimana pitch lag yang pertama pada setiap frame, dikodekan menggunakan 8 bit dan beberapa lag yang tersisa dikodekan secara berbeda tanpa mengganggu pengkodean sebelumnya untuk setiap 5 bit.
Untuk tanda serta lokasi pulsa dikodekan dan ditransmisikan dalam mendapatkan fixed excitation. Gain pada fixed dan adaptive excitation secara bersama-sama divektor-kuantisasikan dengan 7-bit codebook, dimana gain komponen dari fixed excitation dikodekan secara berbeda tanpa mengganggu predicted gain terestimasi dari nilai gain sebelumnya (ETSI. GSM 06.90. 2000: 14).
Bit-bit yang tersedia dialokasikan secara berbeda diantara source
coding, channel coding dan signaling pada setiap codec mode. Hal ini dapat
dilihat pada tabel 2 pada halaman berikut ini [ETSI. GSM 06.90; 2000: 16].
4. Simulasi dan Analisis Hasil Simulasi Sinyal AMR Speech Codec
Simulasi dilakukan pada GSM-AMR speech codec berdasarkan simulasi non real-time berbasiskan personal komputer (PC). Terdiri dari beberapa komponen simulasi dengan tiap-tiap tahapnya sehingga menghasilkan hal-hal yang mendukung teori yang berlaku pada GSM-AMR
speech codec. Dikarenakan GSM-AMR merupakan teknologi GSM seluler
pendukung suara maka suara digunakan sebagai sumber utama dalam melakukan simulasi.
Suara pendukung didapatkan dari 2 kelompok responden berumur sekitar 20-23 tahun, pria dan wanita, dengan tiap-tiap kelompok terdiri dari 2 (dua) orang pria dan 2 (dua) orang wanita. Pengambilan suara dilakukan pada lab Telekomunikasi FTI-Elektro Universitas Trisakti, tanpa mengindahkan kondisi yang ada pada lab tersebut.
JETri,
Tahun Volume 3, Nomor 1, Agustus 2003, Halaman 49-60, ISSN 1412-0372Tabel 2. Alokasi bit AMR Speech Codec
Mode Parameter 1st subframe 2nd subframe 3rd subframe 4th subframe Total Perframe 12.2 kbit/s 2 LSP sets 38 Pitch delay 9 6 9 6 30 Pitch gain 4 4 4 4 16 Algebraic code 35 35 35 35 140 Codebook gain 5 5 5 5 20 Total 244 10.2 kbit/s LSP set 26 Pitch delay 8 5 8 5 26 Algebraic code 31 31 31 31 124 Gains 7 7 7 7 28 Total 204 7.95 kbit/s LSP sets 27 Pitch delay 8 6 8 6 28 Pitch gain 4 4 4 4 16 Algebraic code 17 17 17 17 68 Codebook gain 5 5 5 5 20 Total 159 7.40 kbit/s LSP set 26 Pitch delay 8 5 8 5 26 Algebraic code 17 17 17 17 68 Gains 7 7 7 7 28 Total 148 6.70 kbit/s LSP set 26 Pitch delay 8 4 8 4 24 Algebraic code 14 14 14 14 56 Gains 7 7 7 7 28 Total 134
Suhartati Agoes & Aulia Satianingrum, Simulasi Global System For Mobile Communication Mode Parameter 1st subframe 2nd subframe 3rd subframe 4th subframe Total Perframe 5.90 kbit/s LSP set 26 Pitch delay 8 4 8 4 24 Algebraic code 11 11 11 11 44 Gains 6 6 6 6 24 Total 118 5.15 kbit/s LSP set 23 Pitch delay 8 4 4 4 20 Algebraic code 9 9 9 9 36 Gains 6 6 6 6 24 Total 103 4.75 kbit/s LSP set 23 Pitch delay 8 4 4 4 20 Algebraic code 9 9 9 9 36 Gains 8 8 16 Total 95
Simulasi menghasilkan bahwa pada suara terkodekan GSM-AMR
speech codec mempunyai karakteristik tidak jauh berbeda dari karakteristik
suara asli. Hal ini diketahui dengan adanya kemiripan bentuk amplitudo suara asli dengan suara rekonstruksi sesuai gambar 1. dan gambar 2. (pada halaman berikut) dan kualitas suara yang mirip berdasarkan pendengaran. Kemudian diperkuat dengan dengan mengguna kan metode sinyal error dimana diperhitungkan selisih antara sinyal rekontruksi dengan sinyal suara asli seperti yang dihasilkan pada gambar 3 (pada halaman berikutnya).
Kemudian untuk lebih mendukung hal tersebut diatas maka dilakukan analisis berdasarkan penghitungan objektif pada perangkat lunak MATLAB® menggunakan metode MSE (Mean Squared Error) dan SNR (Signal To Noise Ratio). Analisis dilakukan sepanjang sampel suara dimana berdurasi 1 (satu) detik dengan frekuensi sampling sebesar 8000 Hz.
Secara umum analisis MSE merupakan pengukuran tingkat kesalahan dari suatu sistem sesuai dengan rumus [Terrel & Shark, 1996: 203] seperti persamaan (1) pada halaman berikut:
JETri,
Tahun Volume 3, Nomor 1, Agustus 2003, Halaman 49-60, ISSN 1412-0372
n
n
s
n
s
MSE
n
2)
(
'
)
(
(1)MSE tidak mempunyai besaran nilai. Suatu sistem dikatakan mempunyai kinerja yang baik apabila nilai MSE mendekati nol ( 0) atau dapat dikatakan tidak ada nya kesalahan pada sistem tersebut.
Gambar 1. Grafik Sinyal Suara Asli
Suhartati Agoes & Aulia Satianingrum, Simulasi Global System For Mobile Communication
Gambar 3. Grafik Sinyal Erorr
Dengan didukung nilai-nilai yang tertera pada tabel 3 dan diperkuat pada gambar 4 terlihat bahwa semakin kecil codec mode, MSE yang dihasilkan semakin mendekati nol. Sehingga dapat disimpulkan bahwa AMR speech codec mampu merekonstruksi suara mendekati suara asli
Kemudian pada analisis SNR diberi perlakuan yang sama seperti pada analisis MSE sesuai rumus yang berlaku [Terrel & Shark, 1996: 203] seperti pada persamaan (2):
n n n s n s n s dB SNR 2 2 10 ) ( ' ) ( ) ( log 10 ) ( (2)dimana SNR mempunyai besaran decibel. Desibel adalah besaran relatif yang mengacu pada pendengaran manusia dan merupakan salah satu cara yang tepat dalam mengetahui penguatan dari suatu sistem dengan menampilkan perbandingan antara 2 sinyal [Smith, 1999: 264]. Dalam hal ini ditetapkan agar nilai yang dihasilkan mempunyai persentase cukup besar, dengan demikian sistem mempunyai kinerja cukup baik dalam menghasilkan suara rekonstruksi berdasarkan suara asli.
JETri,
Tahun Volume 3, Nomor 1, Agustus 2003, Halaman 49-60, ISSN 1412-0372S
NR (dB)
Tabel 3. Hasil Perhitungan MSE
Codec Mode (kbit/s) Sampel Suara Pria I Sampel Suara Pria II Sampel Suara Wanita I Sampel Suara Wanita II 4.75 0.075236 0.071144 0.055147 0.073474 5.15 0.075126 0.070004 0.052333 0.072278 5.90 0.076955 0.071481 0.05225 0.06968 6.70 0.078601 0.072314 0.05351 0.069859 7.40 0.080172 0.072525 0.053822 0.071332 7.95 0.081607 0.074744 0.054305 0.07227 10.2 0.0814 0.0756 0.0552 0.0723 12.2 0.083658 0.077218 0.055243 0.072418 0,05 0,055 0,06 0,065 0,07 0,075 0,08 0,085 4,75 5,15 5,9 6,7 7,6 7,95 10,2 12,2
Sampel Suara Pria I Sampel Saura Wanita I Sampel Suara Pria II Sampel Saura Wanita II
Gambar 4. Grafik MSE Tiap Codec Mode
Dari nilai-nilai pada tabel 4 dan gambar 5 pada halaman berikut, nilai persentase SNR yang dihasilkan cukup besar, dengan demikian kinerja AMR speech codec cukup baik dalam merekonstruksi suara berdasarkan suara aslinya
Suhartati Agoes & Aulia Satianingrum, Simulasi Global System For Mobile Communication
Tabel 4. Hasil Perhitungan SNR
Codec Mode (kbit/s) Sampel Suara Pria I (dB) Sampel Suara Pria II (dB) Sampel Suara Wanita I (dB) Sampel Suara Wanita II (dB)
4.75
18.9913
19.3435
21.5077
20.3079
5.15
19.0037
19.3975
21.584
20.3969
5.90
18.8889
19.4018
21.5688
20.5147
6.70
18.7744
19.2825
21.4658
20.3945
7.40
18.7292
19.2822
21.4354
20.3778
7.95
18.6292
19.1002
21.3408
20.3451
10.2
18.6858
19.0895
21.2875
20.2239
12.2
18.5633
18.9937
21.2716
20.2935
Hasil tersebut dapat dilihat pada grafik pada halaman berikut:
18 18.5 19 19.5 20 20.5 21 21.5 22 4.75 5.15 5.9 6.7 7.6 7.95 10.2 12.2
MR PAHLIVI (PRIA I) ANDRITA I (WANITA I) ERI NUGRAHA (PRIA II) SEKARSARI (WANITA II)
Gambar 5. Grafik SNR Tiap Codec Mode
Codec Mode (kbit/s)
S
JETri,
Tahun Volume 3, Nomor 1, Agustus 2003, Halaman 49-60, ISSN 1412-0372Dari gambar 4 dan 5 juga dapat disimpulkan bahwa semakin kecil
codec mode semakin baik kinerja GSM-AMR speech codec.
5. Kesimpulan
GSM-AMR speech codec merupakan standarisasi teknologi kompresi suara pada jaringan seluler GSM. Codec tersebut menghasilkan kinerja cukup baik dan dapat diandalkan sesuai dengan yang diinginkan. Hal ini dibuktikan dengan perlakuan simulasi. Simulasi GSM-AMR speech
codec berbasis PC non real-time untuk tiap-tiap codec mode; 12.2, 7.95,
7.40, 6.70, 5.90, 5.15, dan 4.75 kbit/s, menghasilkan parameter simulasi semakin baik ketika codec mode semakin kecil. Dengan begitu faktor terpenting dalam teknologi kompresi suara yaitu penggunaan bit rate yang kecil dengan hasil suara maksimal dapat dicapai.
Daftar Pustaka
1. ETSI. GSM 06.71. 1999. Digital cellular telecommunications system
(Phase 2+); AMR (Adaptive Multi Rate) General Description.
2. ETSI. GSM 06.75. 1999. Digital cellular telecommunications system
(Phase 2+); Performance Characterization of GSM AMR (Adaptive Multi Rate).
3. ETSI. GSM 06.75. 1999. Digital cellular telecommunications system
(Phase 2+); AMR (Adaptive Multi Rate) Study Phase Report.
4. ETSI. GSM 06.90. 2000. Digital cellular telecommunications system
(Phase 2+); AMR (Adaptive Multi Rate) Speech Transcoding.
5. Garg, Vijay K. & Joseph E. Wilkes. 1999. Principles and Applications
of GSM. New Jersey: Prentice Hall
6. ICASSP99. Erdal Paksoy, Juan Carlos De Martin, etc. Adaptive Multi
Rate Speech Coder. USA
7. Schweber & William. 1999. Electronic Communication System. 2nd Edition. New Jersey: Prentice Hall International, Inc.
8. Smith & Steven W. 1999. The Scientist and Engineer's Guide to Digital
Signal Processing. 2nd (electronic) Edition. California: California Technical Publishing.
9. Terrel, T.J. & Lik-Kwan Shark. 1996. Digital Signal Processing, A