You are on page 1of 12

JETri, Volume 3, Nomor

1, Agustus 2003, Halaman 49-60, ISSN 1412-0372

SIMULASI GLOBAL SYSTEM FOR MOBILE


COMMUNICATION ADAPTIVE MULTI
RATE SPEECH CODEC
Suhartati Agoes & Aulia Satianingrum*
Dosen Jurusan Teknik Elektro-FTI, Universitas Trisakti
Abstract
As the wireless technology continuing developing enormously, within it the development of
speech signal compression joining too, which is implemented in digital communication
system. Among the aim is privileged to minimize the channel capacity or bandwidth usage
and the speed of transmission. So the use of smaller bits, which brings maximised voice
quality, are the most important factor to this technology. One of the speech signal
compression techniques which is implemented in GSM network is called Adaptive Multi Rate
(AMR) speech codec or known as GSM-AMR speech codec. There are 8 (eight) bit rates
12.2, 10.2, 7.95, 7.40, 6.70, 5.90, 5.15 and 4.75 kbps which is used by GSM-AMR. The bit
rates have abilities to adapt to the situation and condition of the network and also ability to
tailor the operator needs and requirement. The result of a non real-time simulation is shown
that GSM-AMR has a good enough quality of speech signal reconstruction with range of
SNR between 18.78 and 20.35 dB and also range of MSE between 0.053 and 0.079. The
smaller the bitrate, the better the SNR and the MSE. It was also proven with the comparison
of original signal and constructed signal which is shown that the reconstructed signal has
similarities figure with the original signal. Overall, the performance of the speech codec
gives a good speech quality.
Keyword: Speech Codec, GSM-AMR, Adaptive Multi Rate, SNR, MSE.

1. Pendahuluan
Suara (speech) merupakan hal yang sangat berpengaruh terhadap
terciptanya komunikasi antar manusia. Terciptanya sistem komunikasi
seluler bergerak memungkinkan manusia untuk saling berkomunikasi one to
one, dimana kita dapat berbicara langsung dengan orang yang ingin kita
tuju secara pribadi, serta dapat dilakukan dimanapun dan kapanpun
sehingga menjadikan hal tersebut bagian dari kehidupan manusia seharihari.
Pada teknologi komunikasi seluler, informasi suara ditransmisikan
melalui medium gelombang radio. Sinyal suara merupakan sinyal analog
yang ditransmisikan. Ketika mempertimbangkan sumber-sumber penting
pada semua sistem komunikasi, yaitu kekuatan transmisi dan utilitas

* Alumni Jurusan Teknik Elektro FTI, Universitas Trisakti

JETri, Tahun Volume 3, Nomor 1, Agustus 2003, Halaman 49-60, ISSN 1412-0372

spektral, pengiriman sinyal analog ke tujuan menjadi suatu proses yang


lambat, tidak efisien dan tidak fleksibel. Atau dengan kata lain terdapat
kendala-kendala yang mempengaruhi kuantitas dan kualitas dari sinyal
informasi serta kapasitas bandwidth yang tersedia dan kecepatan transmisi
yang dibutuhkan. Semakin besar sinyal informasi yang akan ditransmisikan
maka semakin besar pula kebutuhan akan kapasitas bandwidth.
Kebutuhan akan bandwidth terus bertambah seiring dengan
pesatnya pertumbuhan teknologi telekomunikasi dan informasi. Seperti
dalam teknologi MMS (Multimedia Messaging Service) yang membutuhkan
bandwidth yang lebar yang dapat mengakomodasikan seluruh layanan dari
MMS.
Ilmu pengetahuan dan teknologi memungkinkan dilakukannya
banyak penelitian dalam mencapai efisiensi spektral dalam penggunaan
bandwidth pada transmisi sinyal suara. Salah satunya adalah dengan
terciptanya sistem kompresi suara digital (digital speech compression)
dalam merepresentasikan sinyal suara.
Dengan menggunakan teknik kompresi digital maka jumlah data
yang besar dapat ditekan tanpa mengurangi kualitas suara asli. Selain itu
tekonik kompresi digital memungkinkan terjadinya manipulasi data dan
penyimpanan data pada tempat-tempat tertentu untuk diolah lebih lanjut
(Grag & Wilkes, 1996: 123).
Saat ini, terdapat beberapa teknik kompresi suara. Diantara teknik
kompresi tersebut adalah AMR (Adaptive Multi Rate), digunakan pada
sistem telekomunikasi seluler digital GSM (Global System For Mobile
Communication). GSM AMR speech codec akan terus berkembang dan
merupakan teknik kompresi esensial untuk generasi telekomunikasi seluler
yang akan datang.

2. Tinjauan Umum Sistem GSM-AMR Speech Codec


Codec didesain untuk beroperasi pada channel mode Global System
For Mobile Communication (GSM) full-rate bit-rate 22,8 kb/s dan channel
mode GSM half-rate pada 11,4 kb/s. Untuk setiap channel mode terdapat
codec mode masing-masing seperti pada table 1. (ETSI. GSM 06.71, 1999:
9).

50

Suhartati Agoes & Aulia Satianingrum, Simulasi Global System For Mobile Communication

Tabel 1. Codec mode AMR untuk tiap channel GSM

Channel

Source Codec Bit Rate


12.2 kbit/s
10.2 kbit/s
7.95 kbit/s

TCH/FS/AMR

7.40 kbit/s

(TCH/AFS)

6.70 kbit/s
5.90 kbit/s
5.15 kbit/s
4.75 kbit/s
7.95 kbit/s
7.40 kbit/s

TCH/HS/AMR

6.70 kbit/s

(TCH/AHS)

5.90 kbit/s
5.15 kbit/s
4.75 kbit/s

3. GSM-AMR Speech Codec


AMR (Adaptive Multi Rate) merupakan salah satu sistem kompresi
suara esensial yang digunakan oleh sistem telekomunikasi selular digital
UMTS (Universal Mobile Telecommunication Services) atau 3G (The Third
Generation). Namun demikian AMR sudah dapat diterapkan pada sistem
2G yaitu GSM (Global System For Mobile Communication).
Pada sistem AMR terkait banyak elemen didalamnya dan yang
merupakan faktor terpenting dari sistem AMR adalah AMR speech codec
itu sendiri. AMR speech codec terdiri dari encoder dan decoder yang

51

JETri, Tahun Volume 3, Nomor 1, Agustus 2003, Halaman 49-60, ISSN 1412-0372

memungkinkan penyedian kualitas suara yang superior dengan bitrate


rendah. Selain itu AMR decoder mempunyai kompleksitas peralatan yang
modest.
Tidak seperti speech codec GSM sebelumnya (HR, FR, EFR)
dimana beroperasi pada rate yang tetap dan level eror proteksi yang
konstan, AMR speech codec mengadaptasikan level eror proteksinya
terhadap channel radio lokal dan kondisi trafik. AMR memilih channel
yang optimum (half atau full rate) dan codec mode nya (bit rate speech dan
channel) dalam mengirimkan kombinasi yang terbaik antara kualitas dari
speech dan kapasitas dari sistem. Sehingga AMR fleksibel atau dengan kata
lain adaptive terhadap lingkungannya dalam hal ini yaitu terhadap sistem
GSM.Hal ini menyediakan beberapa keuntungan:
1. Peningkatan kualitas speech baik untuk mode half maupun full rate
dengan adanya adaptasi codec mode yaitu memvariasikan
keseimbangan antara speech dan channel coding untuk gross bit rate
yang sama.
2. Kemampuan untuk bertukar kualitas dan kapasitas dari speech secara
halus dan fleksibel dengan menggunakan kombinasi dari adaptasi mode
channel dan codec dimana dapat dikontrol oleh operator jaringan
berbasiskan antara sel dengan sel.
Konsep AMR speech codec tidak hanya dapat beradaptasi dengan
kemampuannya untuk merespon kondisi radio dan trafik yang berubah
melainkan juga dapat disesuaikan terhadap kebutuhan operator jaringan
(ETSI. GSM 06.75, 1999: 8).
Setiap codec mode menggunakan CELP codec standardisasi GSM
Enhanced Full-Rate dan mempunyai beberapa fitur yang sama dengan
codec mode EFR tersebut.
Dalam analisis LPC (Linear Prediction Coefficient), ukuran frame
untuk semua source code adalah 20 ms dengan lookahead 5 ms. Parameter
LPC dikodekan satu kali per frame pada domain LSF (Line Spectral
Frequency) dengan menggunakan 4 tahap. Untuk mode 12.2 kbit/s
digabung-kuantisasikan dengan 38 bit SMQ (Split Matrix Quantization)
sedangkan untuk mode yang lainnya dikuantisasikan dengan 18 bit SVQ
(Split Vector Quantization). SVQ dicari dengan menggunakan algoritma
pencarian M-Best. Sinyal eksitasi dipilih dengan menggunakan sistem
analisissintesis dimana error yang terjadi antara sinyal suara original (asli)

52

Suhartati Agoes & Aulia Satianingrum, Simulasi Global System For Mobile Communication

dengan sinyal suara sintesa diminimalisasikan dengan menggunakan


pengukuran distorsi perceptual weighting. Hal ini dilakukan dengan
memfilter sinyal error tersebut melalui filter (tapis) perceptual weighting
yang koefisiennya didapatkan dari koefisien LP yang belum dikuantisasi.
Dalam perceptual weighting dilakukan pemberatan eror tersebut dengan
mengekploitasi noise masking dari formant. Sisa parameter diupdate satu
kali per subframe.
Semua source code mempunyai empat buah subframe berukuran 5
ms per subframe. Pada semua codec mode, pitch lag dikodekan dengan
menggunakan delta-search, algoritma pencarian adaptive codebook dimana
pitch lag yang pertama pada setiap frame, dikodekan menggunakan 8 bit
dan beberapa lag yang tersisa dikodekan secara berbeda tanpa mengganggu
pengkodean sebelumnya untuk setiap 5 bit.
Untuk tanda serta lokasi pulsa dikodekan dan ditransmisikan dalam
mendapatkan fixed excitation. Gain pada fixed dan adaptive excitation
secara bersama-sama divektor-kuantisasikan dengan 7-bit codebook,
dimana gain komponen dari fixed excitation dikodekan secara berbeda
tanpa mengganggu predicted gain terestimasi dari nilai gain sebelumnya
(ETSI. GSM 06.90. 2000: 14).
Bit-bit yang tersedia dialokasikan secara berbeda diantara source
coding, channel coding dan signaling pada setiap codec mode. Hal ini dapat
dilihat pada tabel 2 pada halaman berikut ini [ETSI. GSM 06.90; 2000: 16].

4. Simulasi dan Analisis Hasil Simulasi Sinyal AMR Speech Codec


Simulasi dilakukan pada GSM-AMR speech codec berdasarkan
simulasi non real-time berbasiskan personal komputer (PC). Terdiri dari
beberapa komponen simulasi dengan tiap-tiap tahapnya sehingga
menghasilkan hal-hal yang mendukung teori yang berlaku pada GSM-AMR
speech codec. Dikarenakan GSM-AMR merupakan teknologi GSM seluler
pendukung suara maka suara digunakan sebagai sumber utama dalam
melakukan simulasi.
Suara pendukung didapatkan dari 2 kelompok responden berumur
sekitar 20-23 tahun, pria dan wanita, dengan tiap-tiap kelompok terdiri dari
2 (dua) orang pria dan 2 (dua) orang wanita. Pengambilan suara dilakukan
pada lab Telekomunikasi FTI-Elektro Universitas Trisakti, tanpa
mengindahkan kondisi yang ada pada lab tersebut.

53

JETri, Tahun Volume 3, Nomor 1, Agustus 2003, Halaman 49-60, ISSN 1412-0372

Tabel 2. Alokasi bit AMR Speech Codec


Mode

Parameter

2 LSP sets
Pitch delay
12.2
Pitch gain
kbit/s
Algebraic code
Codebook gain

st

nd

rd

th

1
2
3
4
subframe subframe subframe subframe

9
4
35
5

6
4
35
5

9
4
35
5

6
4
35
5

38
30
16
140
20
244

5
31
7

26
26
124
28
204

6
4
17
5

27
28
16
68
20
159

Total
LSP set
10.2 Pitch delay
kbit/s Algebraic code
Gains
Total
7.95
kbit/s

LSP sets
Pitch delay
Pitch gain
Algebraic code
Codebook gain
Total

LSP set
7.40 Pitch delay
kbit/s Algebraic code
Gains
Total
LSP set
6.70 Pitch delay
kbit/s Algebraic code
Gains
Total

54

8
31
7

8
4
17
5

5
31
7

6
4
17
5

8
31
7

8
4
17
5

8
17

5
17

8
17

5
17

8
14
7

4
14
7

8
14
7

Total
Perframe

4
14
7

26
26
68
28
148
26
24
56
28
134

Suhartati Agoes & Aulia Satianingrum, Simulasi Global System For Mobile Communication

Mode

5.90
kbit/s

5.15
kbit/s

4.75
kbit/s

Parameter
LSP set
Pitch delay
Algebraic code
Gains
Total
LSP set
Pitch delay
Algebraic code
Gains
Total
LSP set
Pitch delay
Algebraic code
Gains
Total

st

nd

rd

th

1
2
3
4
subframe subframe subframe subframe

8
11
6

4
11
6

8
11
6

4
11
6

8
9
6

4
9
6

4
9
6

4
9
6

8
9

4
9

4
9

4
9

Total
Perframe

26
24
44
24
118
23
20
36
24
103
23
20
36
16
95

Simulasi menghasilkan bahwa pada suara terkodekan GSM-AMR


speech codec mempunyai karakteristik tidak jauh berbeda dari karakteristik
suara asli. Hal ini diketahui dengan adanya kemiripan bentuk amplitudo
suara asli dengan suara rekonstruksi sesuai gambar 1. dan gambar 2. (pada
halaman berikut) dan kualitas suara yang mirip berdasarkan pendengaran.
Kemudian diperkuat dengan dengan mengguna kan metode sinyal error
dimana diperhitungkan selisih antara sinyal rekontruksi dengan sinyal suara
asli seperti yang dihasilkan pada gambar 3 (pada halaman berikutnya).
Kemudian untuk lebih mendukung hal tersebut diatas maka
dilakukan analisis berdasarkan penghitungan objektif pada perangkat lunak
MATLAB menggunakan metode MSE (Mean Squared Error) dan SNR
(Signal To Noise Ratio). Analisis dilakukan sepanjang sampel suara dimana
berdurasi 1 (satu) detik dengan frekuensi sampling sebesar 8000 Hz.
Secara umum analisis MSE merupakan pengukuran tingkat
kesalahan dari suatu sistem sesuai dengan rumus [Terrel & Shark, 1996:
203] seperti persamaan (1) pada halaman berikut:

55

JETri, Tahun Volume 3, Nomor 1, Agustus 2003, Halaman 49-60, ISSN 1412-0372

MSE

s(n) s' (n)

(1)

MSE tidak mempunyai besaran nilai. Suatu sistem dikatakan


mempunyai kinerja yang baik apabila nilai MSE mendekati nol ( 0) atau
dapat dikatakan tidak ada nya kesalahan pada sistem tersebut.

Gambar 1. Grafik Sinyal Suara Asli

Gambar 2. Grafik Sinyal Suara Rekonstruksi

56

Suhartati Agoes & Aulia Satianingrum, Simulasi Global System For Mobile Communication

Gambar 3. Grafik Sinyal Erorr


Dengan didukung nilai-nilai yang tertera pada tabel 3 dan diperkuat
pada gambar 4 terlihat bahwa semakin kecil codec mode, MSE yang
dihasilkan semakin mendekati nol. Sehingga dapat disimpulkan bahwa
AMR speech codec mampu merekonstruksi suara mendekati suara asli
Kemudian pada analisis SNR diberi perlakuan yang sama seperti
pada analisis MSE sesuai rumus yang berlaku [Terrel & Shark, 1996: 203]
seperti pada persamaan (2):
SNR ( dB) 10 log10

s
n

( n)

s(n) s' (n) 2

(2)

dimana SNR mempunyai besaran decibel. Desibel adalah besaran relatif


yang mengacu pada pendengaran manusia dan merupakan salah satu cara
yang tepat dalam mengetahui penguatan dari suatu sistem dengan
menampilkan perbandingan antara 2 sinyal [Smith, 1999: 264]. Dalam hal
ini ditetapkan agar nilai yang dihasilkan mempunyai persentase cukup
besar, dengan demikian sistem mempunyai kinerja cukup baik dalam
menghasilkan suara rekonstruksi berdasarkan suara asli.

57

JETri, Tahun Volume 3, Nomor 1, Agustus 2003, Halaman 49-60, ISSN 1412-0372

Tabel 3. Hasil Perhitungan MSE


Codec
Mode
(kbit/s)

Sampel
Suara Pria
I

Sampel
Suara Pria
II

Sampel
Suara
Wanita I

Sampel
Suara
Wanita II

4.75
5.15
5.90
6.70
7.40
7.95
10.2
12.2

0.075236
0.075126
0.076955
0.078601
0.080172
0.081607
0.0814
0.083658

0.071144
0.070004
0.071481
0.072314
0.072525
0.074744
0.0756
0.077218

0.055147
0.052333
0.05225
0.05351
0.053822
0.054305
0.0552
0.055243

0.073474
0.072278
0.06968
0.069859
0.071332
0.07227
0.0723
0.072418

0,085

SNR (dB)

0,08
0,075
0,07
0,065
0,06
0,055
0,05
4,75

5,15

5,9

6,7

7,6

7,95

10,2

12,2

Codec Mode (kbit/s)


Sampel Suara Pria I

Sampel Saura Wanita I

Sampel Suara Pria II

Sampel Saura Wanita II

Gambar 4. Grafik MSE Tiap Codec Mode


Dari nilai-nilai pada tabel 4 dan gambar 5 pada halaman berikut,
nilai persentase SNR yang dihasilkan cukup besar, dengan demikian kinerja
AMR speech codec cukup baik dalam merekonstruksi suara berdasarkan
suara aslinya

58

Suhartati Agoes & Aulia Satianingrum, Simulasi Global System For Mobile Communication

Tabel 4. Hasil Perhitungan SNR


Codec
Mode
(kbit/s)

Sampel
Suara Pria I
(dB)

Sampel
Suara Pria
II (dB)

Sampel
Suara
Wanita I
(dB)

Sampel
Suara
Wanita II
(dB)

4.75
5.15
5.90
6.70
7.40
7.95
10.2
12.2

18.9913
19.0037
18.8889
18.7744
18.7292
18.6292
18.6858
18.5633

19.3435
19.3975
19.4018
19.2825
19.2822
19.1002
19.0895
18.9937

21.5077
21.584
21.5688
21.4658
21.4354
21.3408
21.2875
21.2716

20.3079
20.3969
20.5147
20.3945
20.3778
20.3451
20.2239
20.2935

Hasil tersebut dapat dilihat pada grafik pada halaman berikut:


22
21.5

SNR (dB)

21
20.5
20
19.5
19
18.5
18
4.75

5.15

5.9

6.7

7.6

7.95

10.2

12.2

Codec Mode (kbit/s)


MR PAHLIVI (PRIA I)

ANDRITA I (WANITA I)

ERI NUGRAHA (PRIA II)

SEKARSARI (WANITA II)

Gambar 5. Grafik SNR Tiap Codec Mode

59

JETri, Tahun Volume 3, Nomor 1, Agustus 2003, Halaman 49-60, ISSN 1412-0372

Dari gambar 4 dan 5 juga dapat disimpulkan bahwa semakin kecil


codec mode semakin baik kinerja GSM-AMR speech codec.

5. Kesimpulan
GSM-AMR speech codec merupakan standarisasi teknologi
kompresi suara pada jaringan seluler GSM. Codec tersebut menghasilkan
kinerja cukup baik dan dapat diandalkan sesuai dengan yang diinginkan.
Hal ini dibuktikan dengan perlakuan simulasi. Simulasi GSM-AMR speech
codec berbasis PC non real-time untuk tiap-tiap codec mode; 12.2, 7.95,
7.40, 6.70, 5.90, 5.15, dan 4.75 kbit/s, menghasilkan parameter simulasi
semakin baik ketika codec mode semakin kecil. Dengan begitu faktor
terpenting dalam teknologi kompresi suara yaitu penggunaan bit rate yang
kecil dengan hasil suara maksimal dapat dicapai.

Daftar Pustaka
1. ETSI. GSM 06.71. 1999. Digital cellular telecommunications system
(Phase 2+); AMR (Adaptive Multi Rate) General Description.
2. ETSI. GSM 06.75. 1999. Digital cellular telecommunications system
(Phase 2+); Performance Characterization of GSM AMR (Adaptive
Multi Rate).
3. ETSI. GSM 06.75. 1999. Digital cellular telecommunications system
(Phase 2+); AMR (Adaptive Multi Rate) Study Phase Report.
4. ETSI. GSM 06.90. 2000. Digital cellular telecommunications system
(Phase 2+); AMR (Adaptive Multi Rate) Speech Transcoding.
5. Garg, Vijay K. & Joseph E. Wilkes. 1999. Principles and Applications
of GSM. New Jersey: Prentice Hall
6. ICASSP99. Erdal Paksoy, Juan Carlos De Martin, etc. Adaptive Multi
Rate Speech Coder. USA
7. Schweber & William. 1999. Electronic Communication System. 2nd
Edition. New Jersey: Prentice Hall International, Inc.
8. Smith & Steven W. 1999. The Scientist and Engineer's Guide to Digital
Signal Processing. 2nd (electronic) Edition. California: California
Technical Publishing.
9. Terrel, T.J. & Lik-Kwan Shark. 1996. Digital Signal Processing, A
Student Guide. London: MacMillan Press.

60

You might also like