Professional Documents
Culture Documents
Estandares de Voz
Estandares de Voz
FISICC-IDEA
CEI: QUETZALTENANGO
CURSO: NORMAS Y
ESTÁNDARES EN
TELECOMUNICACIONES TUTOR:
LIC. JULIO SANTIZO HORARIO:
SÁBADO 16:00- 17:00
INVESTIGACION EN INTERNET
“ESTÁNDARES DE CODIFICACIÓN DE VOZ”
Codificar la voz consiste en transformar las ondas sonoras que la representan a otro tipo de
representación que, aunque menos natural, sí resulta más adecuada para determinadas
tareas. Veamos un posible ejemplo de codificación de voz: supongamos que disponemos de
un ordenador que tiene conectado un micrófono, las ondas sonoras se pueden traducir a
valores numéricos (que el ordenador puede almacenar) sin más que ir midiendo
periódicamente el resultado de la excitación del micrófono. Posteriormente, los valores
almacenados podrían utilizarse para excitar un altavoz, y así reproducir la voz.
La codificación también estudia, una vez que se ha transformado la señal de voz a otra
representación, cuál es la mejor forma de tratar esa nueva representación para que el
tratamiento de la información obtenida sea el óptimo.
Las primeras implementaciones del vocoder eran analógicas, sin embargo, con el
nacimiento de los sistemas digitales y de las posibilidades que éstos ofrecen, pronto se
pasó a las implementaciones digitales. Durante la década de los 40 hubo una gran
actividad en la Codificación por Modulación de Impulsos (PCM). Este tipo de codificación
no sigue la filosofía del vocoder de Dudley (y de los vocoders en general), sino que
simplemente muestrea la voz. A partir del PCM se desarrollaron el DPCM y el ADPCM,
que fueron propuestos como estandar por la CCITT (International Consultative Committee
for Telephone and Telegraph).
Gracias a la flexibilidad de los sistemas digitales, se pudo experimentar con formas más
sofisticadas de representación de la voz. Fant, a finales de los 50, trabajó en el modelo de
producción de voz lineal.
Los estándares especificados por la ITU-T para la codificación de audio son G.711,
G.722, G.723, G.728 y G.729.
G.711
Es el estándar de codificación de audio para telefonía y videotelefonía. Se basa en
codificar muestras de la señal de audio a 8 KHz y asignar a esas muestras un código de 8
bits con el que conseguimos tener 256 posibles valores de la muestra con flujos de 64
Kbps. Es lo que se llama modulación por impulsos codificados (PCM).
Es el estándar más apropiado para conexiones de alta velocidad.
G.722
Este estándar utiliza la técnica ADCPM, es decir, no codifica el valor de la muestra sino la
diferencia con el valor anterior de la muestra que se puede codificar con menos bits al ser
una diferencia muy pequeña. Así, en este estándar se muestrea la señal a 16 KHz y se
asignan códigos de 4 bits consiguiendo tener 16 posibles valores de la señal y obteniendo
así mayor calidad que con el estándar G.711.
Si en el anterior estándar se convertían frecuencias de 3.1 KHz a 64 Kbps, este consigue
convertir frecuencias de entre 50 Hz y 7 KHz a 5.3 y 6.3 Kbps reduciendo así el empleo
de ancho de banda.
G.728
Este estándar se basa en fórmulas matemáticas para reproducir la señal y lo que
codifica son los parámetros predictores utilizados en esas fórmulas para los que sólo son
necesarios 2 bits con los que conseguimos sólo 4 niveles de cuantificación para la señal
con 16 Kbps. Consigue codificar frecuencias de 3.1 KHz a flujos de 16 Kbps.
G.729
Estándar equivalente a G.728 pero se reduce el régimen binario de 16 Kbps a 8 Kbps
permitiendo comprimir así los 64 Kbps.
Desde hace tiempo, los responsables de comunicaciones de las empresas tienen en mente la
posibilidad de utilizar su infraestructura de datos, para el transporte del tráfico de voz
interno de la empresa. No obstante, es la aparición de nuevos estándares, así como la
mejora y abaratamiento de las tecnologías de compresión de voz, lo que está provocando
finalmente su implantación.
Los esfuerzos por establecer estándares se concentran en tres elementos principales del
internet telefónico: el formato de codificación de audio, el transporte de los protocolos de
información y los servicios de directorio.
Ésta imagen muestra cómo funciona el protocolo H.323, para realizar la conexión entre
PC’s, y como se incrementa el número de protocolos que intervienen en la transmisión de
acuerdo al tipo de datos que se desea intercambiar.
La siguiente tabla muestra los protocolos utilizados en la transmisión de voz sobre IP así
como su función correspondiente:
Protocolos Función
Direcciona el conjunto de aplicaciones internet- telefónicas,
definiendo la sensibilidad de retraso en el tráfico de las
H.323 señales de voz y video, tiene prioridad
de transporte para asegurar comunicaciones en tiempo real
por internet.
Esta especificación define el transporte de las
H.324
señales de voz, datos y video, sobre redes
Direccionamiento:
1. RAS (Registration, Admision and Status). Protocolo de comunicaciones que
permite a una estación H.323 localizar otra estación H.323 a través del Gatekeeper.
2. DNS (Domain Name Service). Servicio de resolución de nombres en direcciones IP
con el mismo fin que el protocolo RAS pero a través de un servidor DNS
Señalización:
1. Q.931 Señalización inicial de llamada
2. H.225 Control de llamada: señalización, registro y admisión, y
paquetización / sincronización del stream (flujo) de voz
3. H.245 Protocolo de control para especificar mensajes de apertura y cierre de
canales para streams de voz
Compresión de voz:
1. Requeridos: G.711 y G.723
2. Opcionales: G.728, G.729 y G.722
Control de la transmisión:
1. RTCP (Real Time Control Protocol). Se utiliza principalmente para detectar
situaciones de congestión de la red y tomar, en su caso, acciones correctoras