P. 1
Serviço fone@RNP

Serviço fone@RNP

4.67

|Views: 2,065|Likes:
Material didático de apoio ao curso Serviço fone@RNP da Escola Superior de Redes. Neste curso o aluno aprende a instalar e configurar os servidores necessários para a implantação do serviço fone@RNP em sua instituição.
Material didático de apoio ao curso Serviço fone@RNP da Escola Superior de Redes. Neste curso o aluno aprende a instalar e configurar os servidores necessários para a implantação do serviço fone@RNP em sua instituição.

More info:

Published by: Escola Superior de Redes on Feb 01, 2013
Copyright:Traditional Copyright: All rights reserved

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
See more
See less

12/03/2015

q

1Pulse Code Modulation (PCM).

1Como converter áudio analógico em digital?

3Exemplo com símbolos de 3 bits.

2Sinal é discretizado (gera erro de amostragem).

2Como minimizar o erro de quantização (duas formas)?

2Que taxa de amostragem deve ser utilizada, supondo que:

3Frequência da voz humana: 20 Hz – 6.000 Hz (banda de 4 kHz fornece inteligibi-
lidade perfeita).

3Frequência do ouvido humano: 20 Hz – 20.000 Hz.

2Qual o número de níveis e amostras no PCM comercial?

O primeiro passo para a codifcação de áudio consiste na captura dos sinais sonoros (ondas
sonoras) e transformação destes em sinais digitais. Como é feita a conversão de sinais ana-
lógicos para sinais digitais?

Uma técnica bastante utilizada em telefonia é o Pulse Code Modulation (PCM). Ele analisa
o sinal analógico em instantes uniformes de tempo, obtém a magnitude do sinal nesses
instantes e representa essa magnitude de forma numérica e binária. A imagem seguinte

mostra um exemplo de um sinal de áudio analógico que será convertido para digital:

42

Serviço fone@RNP

O eixo y do gráfco mostra a magnitude do sinal e o eixo x do gráfco denota o tempo. A linha
azul representa a onda sonora, enquanto as linhas verticais ao longo do gráfco marcam os
momentos em que serão obtidas amostras da onda sonora, ou seja, os momentos onde a
magnitude da onda será representada por um número binário.

O próximo gráfco mostra o resultado da aplicação do PCM sobre a primeira parte da onda:

111
110
101
100
011
010
001
000

0
0
0

0
1
1

0
1
1

0
1
1

1
0
0

1
1
0

1
1
1

1
0
1

O eixo y mostra uma escala com um número para cada linha horizontal. Esse número
está representado em binário (com 3 bits para facilitar o entendimento) e corresponde ao

símbolo que será utilizado pelo PCM para representar cada uma das oito linhas horizontais.

A cada instante de tempo (linhas verticais) o PCM verifca a magnitude da onda e encontra a

linha horizontal que mais se aproxima desse valor. Ele usa então o símbolo associado a essa
linha para representar a magnitude da onda nesse instante. Esse processo vai se repetindo

em instantes de tempo uniformes, gerando os símbolos que representam a onda. Esses
símbolos estão exibidos no gráfco ao longo do eixo x (000, 011, 100 etc.). A linha vermelha

mostra o formato com que a onda passa a ser representada após ser convertida para o
formato digital pelo PCM.

Cada valor obtido pelo PCM ao longo do tempo é chamado de uma amostra do sinal, e por
isso esse processo é chamado de amostragem da onda sonora. A defnição do número de
amostras obtidas é um parâmetro muito importante no processo, que infuencia direta-
mente na qualidade do sinal digital. Quanto maior o número de amostras, maior será a
proximidade do sinal digital com o sinal analógico, mas também maior será a quantidade de
dados necessários para representar esse sinal. Há um teorema, o teorema de Nyquist, que
indica que a taxa de amostragem do sinal deve ser o dobro ou mais do que a frequência do
sinal. Esse teorema é muito usado como base para defnição da taxa de amostragem que

será utilizada.

A defnição da taxa de amostragem normalmente é baseada na frequência da voz humana e
na sensitividade do ouvido humano. A voz humana pode variar entre 20 Hz e 6.000 Hz, apro-
ximadamente. Entretanto, limitando em 4 kHz a conversa fca totalmente inteligível, pois

Figura 2.13

Amostragem de

sinal analógico.

Figura 2.14

Quantização e

codifcação de sinal
analógico.

43

Capítulo 2 - Tecnologia VoIP

frequências altas são mais raras. Portanto, muitos sistemas que trabalham com voz humana
tomam como base a frequência 4 kHz, que, aplicando o teorema de Nyquist, indica o uso de

uma taxa de amostragem de 8 kHz ou 8.000 amostras por segundo.

Já o ouvido humano é capaz de perceber sons entre 20 Hz e 20 kHz, aproximadamente, ou
seja, sons com frequências acima de 20 kHz não podem ser ouvidos. Esse conhecimento
costuma ser utilizado na digitalização de sons mais complexos que a voz, onde se deseja
a capacidade de representação de todo o espectro de frequências que pode ser ouvido
pelo homem. Em CDs de áudio, por exemplo, é utilizada a taxa de amostragem de 44.1 kHz,
pouco mais que o dobro da frequência máxima ouvida pelo homem.

Outro parâmetro que infuencia diretamente na qualidade do sinal digital é o número de bits

utilizado em cada amostra. No exemplo anterior foram utilizados 3 bits por motivos didá-
ticos. Com um número maior de bits é possível representar mais felmente o sinal analógico
(mais linhas horizontais no gráfco), reduzindo a diferença entre os sinais, o que é chamado
de erro de quantização. Em CDs de áudio, são utilizados 16 bits para cada amostra. Em tele-
fonia se trabalha com 8 bits por amostra.

q

Compansão do sinal:

1Voz pode variar 10 mil vezes, pois o ser humano pode falar baixinho ou gritando e o
outro lado deve ouvir perfeitamente. Como lidar com isso?
Outra técnica aplicada durante a digitalização de sinais sonoros é a compansão do sinal, repre-
sentada na fgura a seguir. Esse processo é necessário, pois a amplitude dos sinais sonoros
pode variar muito. A voz humana pode variar 10 mil vezes, pois o ser humano pode falar muito
baixo ou gritando, e em ambos os casos deve ser totalmente entendido no destino. Isso cria
um problema para a digitalização, pois seriam necessários muitos bits para representar cada
amostra (o ideal seriam 13 bits por amostra, mas comercialmente são usados 8).

No processo de compansão, os sinais mais fracos são elevados e os mais fortes são redu-
zidos, e assim todos podem ser representados por um número fxo de bits, pois o sinal
analógico da voz é “homogeneizado”. Dessa forma, se a pessoa fala baixo, sua voz é ampli-
fcada antes da digitalização, e se fala alto, não é amplifcada. Assim, todos os sinais podem
ser representados com os 8 bits, economizando na taxa de transmissão via rede. As duas
formas mais utilizadas de compansão são chamadas de lei A (mais usada na Europa) e lei μ
(mais usada nos Estados Unidos e Japão).

Vs

Ve

• Compansão segundo lei A ou µ (analógico)
• Usar 13 bits e comprimir segundo lei A ou µ (digital)

Figura 2.15

Compressão do

PCM.

Saiba mais

Tutorial de VoIP dispo-
nível em: http://www.
teleco.com.br/tutoriais/
tutorialtelip/pagina_1.

asp

w

44

Serviço fone@RNP

Codec

q

1Codec é uma abreviação de codifcador-decodifcador.

1Codecs especifcam como os sinais analógicos da voz devem ser codifcados

em dados digitais.

1Codecs permitem compressão dos dados.

1Grande parte dos padrões usa técnicas baseadas na codifcação da forma de onda (PCM).

O codec comprime os dados, eliminando informações redundantes e previsíveis, tanto em
áudio como em vídeo. Os dados passam por uma conversão analógica-digital, compreen-
dendo a amostragem do sinal. Gera-se, então, um formato digital, denominado Pulse Code
Modulation (PCM), usado em vídeo e áudio conferência e em meios de comunicação digital.

O codec realiza 8 mil amostras por segundo (125µsec/amostra), devido ao teorema de
Nyquist, que diz que essa medida é sufciente para capturar toda a informação em um canal
telefônico com largura de banda de 4 KHz. Em uma amostragem menor, a informação trans-
mitida seria perdida; já em uma amostragem maior, nenhuma informação adicional seria
acrescentada. A técnica PCM é o coração do sistema moderno de telefonia. Como consequ-
ência, todos os intervalos de tempo dentro do sistema telefônico são múltiplos de 125 µsec.

O processo de codifcação envolve uma transformação conhecida como conversão analógico-
-digital ou conversão A/D. Durante o processo de reprodução, deve ser adotada uma trans-
formação no sentido inverso, conhecida como conversão digital analógica ou simplesmente
D/A. O processo A/D consiste em capturar amostras da informação original em pequenos
intervalos de tempo, criando uma representação para cada uma das amostras, com base em
um código de representação bem conhecido. Na conversão D/A, com base no mesmo código
de representação, cada amostra é restaurada em seu formato original e reproduzida.

A seguir veremos três técnicas de codifcação: a codifcação de forma de onda, codifcação
paramétrica e codifcação híbrida.

Codificação de forma de onda

q

1Na origem: conversão A/D -> Analógico-Digital.

1No destino: conversão D/A -> Digital-Analógico.

1O esquema mais utilizado é o ADPCM.

1Baseada em predição linear.

A codifcação de forma de onda de sinais de voz é baseada principalmente na predição
linear, e o esquema mais utilizado é o Adaptive Diferential Pulse Code Modulation (ADPCM).
Os codifcadores de forma de onda são os que propiciam voz de melhor qualidade, mas são
os que despendem a maior taxa de bits, em geral com taxas superiores a 30 kbps.

Codificação paramétrica

q

1Codifcadores paramétricos também são denominados vocoders.

1 A classe de vocoders mais utilizada é a Linear Predictive Coding (LPC).

A natureza do sinal (voz) é essencial para obter máxima compressão, embora com sensível
perda de qualidade. Os codifcadores paramétricos, também denominados vocoders (voice
coders), utilizam no decodifcador um modelo de produção de voz, cujos parâmetros são
estimados e transmitidos pelo codifcador a intervalos curtos de tempo (10 a 30 ms).

45

Capítulo 2 - Tecnologia VoIP

A classe de codifcadores paramétricos mais utilizada é a dos vocoders Linear Predictive
Coding (LPC). Os vocoders conseguem codifcar os sinais de voz a taxas de no máximo cerca
de 2 kbps, mas com qualidade entre ruim e regular.

Codificação híbrida

q

1Codifcadores híbridos combinam características dos codifcadores de forma de onda

e dos vocoders.

1 A maioria dos codifcadores híbridos utiliza o modelo de codifcação Code Excited
Linear Predictive (Celp).
A codifcação híbrida usa conceitos das duas outras formas de codifcação (paramétrica e
em forma de onda), procurando um balanço entre qualidade e taxa de compressão. Os codi-
fcadores híbridos são esquemas que combinam características dos codifcadores de forma
de onda e dos vocoders. Atualmente, a maioria dos codifcadores híbridos utiliza o modelo
de codifcação Code Excited Linear Predictive (Celp), com taxas de bits entre 4 e 16 kbps,

proporcionando qualidade muito melhor do que a dos vocoders. Alguns deles propiciam

qualidade muito próxima da obtida com os codifcadores de forma de onda.

Com base nos tipos de codifcação citados, concluímos que os codifcadores de forma de
onda são os que proporcionam voz com melhor qualidade, mas despendem maior taxa de
bits. Em geral, taxas superiores a 30 kbps. Como vimos, um fator a ser considerado é o delay
inserido pelo codifcador, onde de maneira geral quanto menor for a taxa do codec, maior

será seu delay.

Em uma rede de pacote, onde os pacotes de voz podem sofrer grandes delays, a escolha do

codec em função do seu atraso pode ser um diferencial do projeto em enlaces onde o delay

é crítico, como em uma conexão via satélite.

Em redes com grande disponibilidade de banda, um codec indicado é o G.711, que possui taxa
de transmissão a 64 Kbits/seg, mas com delay próximo de zero, boa qualidade e livre de licença.

You're Reading a Free Preview

Download
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->