Professional Documents
Culture Documents
NDICE
Codificacin de voz Paquetizacin de voz Protocolos H.323 y SIP Telefona sobre IP (ToIP)
NDICE
Codificacin de voz Paquetizacin de voz Protocolos H.323 y SIP Telefona sobre IP (ToIP)
Codificacin de voz
Ruido (o error) de cuantizacin Digitalizacin
El error de cuantizacin depende del nmero de bits por muestra.
En telefona se utilizan 8 bits por muestra, lo cual da 28 = 256 posibles valores de amplitud.
100100111011001
Codificacin de voz
Conceptos bsicos: Espectro de voz y msica
Lmite superior de la radio AM Canal telefnico 0 dB MSICA Lmite superior de la radio FM
Potencia relativa
VOZ
10 Hz
100 Hz
1 KHz
10 KHz
100 KHz
Frecuencia
Codificacin de voz
Conceptos bsicos: Canal telfonico
Se transmite una seal de 3,1 KHz (de 300 a 3.400 Hz). Se reduce ancho de banda (caben ms usuarios) Se reducen requerimientos en el sistema de transmisin (ms tolerancia a distorsin):
Ancho de banda 3 KHz 5 KHz 10 KHz 15 KHz Distorsin perceptible 1,4 % 1,2 % 1,0 % 0,7 % Distorsin molesta 18-20 % 8,0 % 4,0 % 2,6 %
Codificacin de voz
Audio digital no comprimido
Tipo Sonido telefnico (G.711) CD-DA (Compact Disc Digital Audio) Frec. de muestreo 8 KHz 44,1 KHz Bits por muestra 8 16 Canales 1 2 Caudal 64 Kb/s (RDSI) 1,411 Mb/s (CD-ROM 1x)
48 KHz
16
1,536 Mb/s
Codificacin de voz
Clasificacin de algoritmos de compresin
Por su fidelidad:
Sin prdidas (lossless): usada para datos (ej.: norma V.42bis en mdems, ficheros .zip) Con prdidas (lossy): usada normalmente en audio y vdeo. Inaceptable para datos Simtricos: necesitan aproximadamente la misma potencia de CPU para comprimir que para descomprimir
Siempre se necesita ms CPU para comprimir que para descomprimir. Generalmente los algoritmos que consiguen mayor compresin gastan ms CPU.
Codificacin de voz
Tipos de compresin de audio
La codificacin de la voz (digitalizacin + compresin) puede ser realizada mediante 3 tcnicas principales: por codificacin de forma de onda, por codificacin basada en modelos matemticos sobre la produccin de la voz y en modelos hbridos que combinan ambas tcnicas. Codificacin por forma de onda (apta para todo tipo de sonidos):
Psicoacstica (MPEG) Adaptativa Diferencial (ADPCM) Code Excited Linear Prediction (CELP) CS-ACELP (Conjugate-Structure Algebraic Code Excited Linear Prediction GSM
Codificacin de voz
Codecs de voz
Cdec Algoritmo Tasa (kbps) 64 16/24/ 32/40 8 6,4 Tamao de trama (bits) 80 192 Duracin de trama (ms) 10 30 Retardo del algoritmo (ms) 0,75 1 15 37,5
G.723.1ACELP GSM
AMR Speex
ACELP RPE-LTP
ACELP ACELP
5,3 13
4,75 12,2 244
160 260
95 244
30 20
20
37,5 20
20 30
Codificacin de voz
Codecs de voz
Otras funcionalidades de los codecs para reducir el ancho de banda en periodos de silencio
Transmisin discontinua (DTX - Discontinuous Transmission) Deteccin de actividad de voz (VAD - Voice Activity Detection)
NDICE
Codificacin de voz Paquetizacin de voz Protocolos H.323 y SIP Telefona sobre IP (ToIP)
Paquetizacin de voz
Estructura del paquete RTP
20
Cabecera IP
8
Cabecera UDP
12
Cabecera RTP
Variable
Datos (Audio o Vdeo digital)
Con esto el receptor puede:
Paquetizacin de voz
Cabecera RTP (RFC 1889)
32 bits
Ver P X
CC
Nmero de secuencia
Paquetizacin de voz
Cabecera RTP (RFC 1889)
Ver: Indica la versin P: (Padding, relleno). Este bit indica si el paquete contiene bytes de relleno (a veces el paquete ha de tener una longitud mltiplo entero de algn nmero).
X: (Extensin). Este bit indica si la cabecera RTP va seguida de una cabecera de extensin.
CC: (CSRC Count). Este campo indica cuantos Identificadores de fuente colaboradora contiene la cabecera. M: (Marker). Este bit sirve para marcar eventos considerados como importantes por el nivel de aplicacin. Por ejemplo uno de esos eventos podra ser en una transmisin de vdeo MPEG el paquete que corresponde a un cambio de fotograma. Tipo de carga til: Identificar el tipo de informacin recibida (ej.: audio G.722) Nmero de secuencia: Ordenar datagramas recibidos, detectar perdidos Timestamp: Reproducir en el instante adecuado,sincronizar audio y vdeo Identificador de sincronizacin de la fuente: sello que identifica los paquetes que corresponden a una fuente de informacin dada, lo que podemos denominar un flujo RTP.
Por ejemplo una videoconferencia genera tpicamente dos flujos, uno de audio y uno de vdeo, y cada uno vendr identificado por un valor diferente de este campo. No se puede utilizar el campo Tipo de carga til para identificar el flujo ya que el emisor podra decidir en cualquier momento cambiar la codificacin de un flujo (por ejemplo de G.711 a G.729).
Paquetizacin de voz
Flujos RTP en una videoconferencia
A 25 fps se emite un fotograma cada 40 ms
Un fotograma Un fotograma Un fotograma
Tipo H.263 Tipo H.263 Tipo H.263Tipo H.263 Tipo H.263 Tipo H.263 Seq. 32 Seq. 31 Seq. 30 Seq. 29 Seq. 28 Seq. 27 TS 955 TS 955 TS 635 TS 635 TS 315 TS 315 Ident. 653 Ident. 653 Ident. 653 Ident. 653 Ident. 653 Ident. 653
Cada paquete de audio contiene 80 ms (640 muestras) que corresponde a dos fotogramas
Paquetizacin de voz
Compresin de cabeceras (RFC 2508)
Los paquetes de voz no pueden ser muy grandes (retardo de paquetizacin) Con la compresin de la voz el problema se acenta. G.729 genera 8 Kb/s (20 bytes cada 20 ms) Cabeceras: IP: 20 bytes UDP: 8 bytes RTP: 12 bytes 200% de overhead. La mayora de los campos no cambian durante la sesin La compresin reduce las cabeceras a 2-4 bytes. Se aplica a nivel de enlace.
Paquetizacin de voz
Compresin de cabeceras (RFC 2508)
Paquetizacin de voz
RTC Control Protocol (RTCP)
RTP Control Protocol (RTCP) es un protocolo de comunicacin que proporciona informacin de control que est asociado con un flujo de datos para una aplicacin multimedia (flujo RTP).
Trabaja junto con RTP en el transporte y empaquetado de datos multimedia, pero no transporta ningn dato por s mismo, sino informacin de control.
Los mensajes de control pueden ser de varios tipos:
SR (Sender Report): ofrece estadsticas de transmisin y recepcin de los participantes que son emisores activos. RR (Receiver Report): ofrece estadsticas de recepcin de los participantes que no son emisores activos. SDES (Source Description): describe a un emisor activo. Lo utilizan los emisores para anunciarse de manera no ambigua.
Con la informacin de RTCP los emisores pueden ajustar el caudal segn el estado de la red.
Paquetizacin de voz
Codecs y su ancho de banda
30 25 20 15 10 5 0 G.723.1 a G.723.1 a 5,3K 6,4K G.729A VoFR VoIP CRTP VoATM VoIP RTP
NDICE
Codificacin de voz Paquetizacin de voz Protocolos H.323 y SIP Telefona sobre IP (ToIP)
Para garantizar la interoperabilidad entre la red telefnica y las redes de transmisin de datos se requiere utilizar grupos de protocolos especficos. Los ms conocidos son H.323 y SIP.
H.323 es una recomendacin del ITU-T, que define los protocolos para proveer sesiones de comunicacin audiovisual sobre redes de conmutacin de paquetes. Es una parte de la serie de protocolos H.32x, los cuales tambin gestionan comunicaciones multimedia sobre RDSI, RTC o UMTS.
Los terminales H.323 pueden ser utilizados en configuraciones mltiples, y su vez pueden comunicarse con terminales que sean parte de redes diferentes a la suya.
H.323 es utilizado principalmente para Voz sobre IP y para videoconferencia basada en IP.
Es un conjunto de normas (recomendacin paraguas) ITU para comunicaciones multimedia que hacen referencia a los terminales, equipos y servicios estableciendo una sealizacin en redes IP.
H.323 fue diseado con un objetivo principal: Proveer a los usuarios con comunicaciones multimedia que soportan voz, vdeo y datos sobre redes de conmutacin de paquetes. El estndar fue diseado especficamente con los siguientes objetivos:
Basarse en los estndares existentes, incluyendo H.320, RTP y Q.931. Incorporar algunas de las ventajas que las redes de conmutacin de paquetes ofrecen para transportar datos en tiempo real. Solucionar la problemtica que plantea el envo de datos en tiempo real sobre redes de conmutacin de paquetes.
H.322
H.323 H.324
IsoEthernet
Ethernet Mdem analgico
TDM
Paquete Circuito 1996
Los H.32x son estndares paraguas. Cada uno de ellos se basa en una serie de estndares previos para especificar todos los servicios necesarios en una videoconferencia. Ej.: Codificacin de audio G.711
RDSI
IP
Vdeo Datos
H.323 establece los estndares para la compresin y descompresin de audio y vdeo, asegurando que los equipos de distintos fabricantes se intercomuniquen.
As, los usuarios no se tienen que preocupar de cmo el equipo receptor acta, siempre y cuando cumpla este estndar. Los componentes ms relevantes de H.323 son:
Un terminal H.323 es un extremo de la red que proporciona comunicaciones bidireccionales en tiempo real con otro terminal H.323, gateway o unidad de control multipunto (MCU).
Esta comunicacin consta de seales de control, indicaciones, audio, imagen en color en movimiento y /o datos entre los dos terminales. Un terminal H.323 puede proporcionar slo voz, voz y datos, voz y vdeo, o voz, datos y vdeo.
Gateway
Un gateway H.323 es un extremo que proporciona comunicaciones bidireccionales en tiempo real entre terminales H.323 en la red IP y otros terminales ITU o gateways en una red conmutada.
Terminales ITU son los incluidos en las recomendaciones H.320 (ISDN), H.321 (ATM), H.322 (GQOS, Guaranteed Quality of Service), H.324 M (mvil).
El gatekeeper es una entidad que proporciona la traduccin de direcciones y el control de acceso a la red de los terminales H.323, gateways y MCUs. El gatekeeper puede tambin ofrecer servicios de gestin del ancho de banda: fija el nmero de conferencias que pueden estar dndose simultneamente en la LAN (red H.323) y rechaza las nuevas peticiones por encima del nivel establecido.
punto terminal que se encarga de la centralizacin del flujo informativo en una conferencia multicast bajo el estndar H.323
Gestiona la negociacin entre terminales para determinar las capacidades comunes para el proceso de audio y vdeo y controlar la multidifusin.
Los gateways son los encargados de conectar dos redes dismiles. Realiza la traduccin de la sealizacin, de las codificaciones de audio y vdeo y de los protocolos de transmisin entre las diferentes redes.
Los gatekeepers proveen los servicios de directorio, autorizacin e identificacin de terminales y gateways, manejo de ancho de banda, conversin de direcciones, control de llamadas, tarificacin, etc. Aunque los gatekeepers son opcionales, resultan ser esenciales para los sistemas H.323 de gran escala. Los gatekeepers, los gateways y los MCUs son componentes lgicos separados pero que pueden ser implementados en un mismo dispositivo fsico.
RTP/RTCP: Protocolos de transporte en tiempo real que proporcionan servicios de entrega punto a punto de datos.
Agrega a cada trama la identificacin del tipo de informacin que contiene, el nmero de secuencia y la hora en que fue generada. Esto permite que el receptor transmita la informacin al usuario al mismo ritmo en que fue generada y permite conocer si hubo descartes de informacin.
Entre dos puntos finales H.323 (terminal o gateway) o entre un punto final y un gatekeeper. Est basada en los procedimientos de establecimiento de llamada de RDSI, Recomendacin Q.931/Q.932. Se establece un canal de control de llamadas fiable (TCP) en el puerto 1720.
Sealizacin RAS (Registration, Admission and Status): registro, admisin, cambios de ancho de banda, estado y desconexin entre puntos finales y un Gatekeeper H.323.
La funcin de sealizacin RAS usa un canal separado (canal RAS), que se abre antes del establecimiento de ningn otro canal.
H.245 es un protocolo de control para comunicaciones multimedia. Sus funciones principales son:
1. Intercambio de capacidades: Los terminales definen los cdecs de los que disponen y se lo comunican al otro extremo de la comunicacin. 2. Apertura y cierre de canales lgicos: Los canales de audio y video H.323 son punto a punto y unidireccionales. Por lo tanto, en funcin de las capacidades negociadas, se tendrn que crear como mnimo dos de estos canales. Esto es responsabilidad de H.245. 3. Control de flujo cuando ocurre algn tipo de problema. 4. Multitud de otras pequeas funciones.
Ofrece la posibilidad de ser tunelizado dentro de los mensajes de sealizacin de llamada de H.225.0. Esto facilita su paso a travs de los cortafuegos.
1) Registro mediante protocolo RAS del llamante 2) SETUP para iniciar una llamada H.323. 3) CALL PROCEEDING advirtiendo del intento de establecer una llamada. 4) Registro mediante protocolo RAS del llamado. 5) ALERTING indica inicio de la fase de generacin de tono. 6) CONNECT indica el comienzo de la conexin.
1) Negociacin mediante el protocolo H.245 (capacidades de los participantes y codecs de audio y video a utilizar. 2) Apertura del canal de comunicacin (direcciones IP, puerto).
Los terminales inician la comunicacin y el intercambio de audio (o video) mediante el protocolo RTP/RTCP.
1) Cualquiera de los participantes activos en la comunicacin puede iniciar el proceso de finalizacin de llamada (H.245). 2) Se cierra la conexin con el mensaje RELEASE COMPLETE (H.225) 3) Se liberan los registros con el gatekeeper (RAS)
G.711: Modulacin PCM para frecuencia de voz Audio hasta 3KHZ a 48, 56 64 kbps. G.722: ancho de banda hasta 7 kHz con tasas de 48 to 64 kbps. G.723.1: Codificacin para Comunicacin Multimedia a 5.3 y 6.3 kbps. G.728: Codificacin de 15 kbps usando Low-Delay code Excited Linear Prediction. G.729: Codificacin para Transmisin Multimedia a 8 13 kbps. H.261 H.263 H.264
IP
Control H.245
Interfaz de usuario para control del sistema H.225.0 Control llamada H.225.0 Control RAS
UDP
GK
Alias H.323
Direccin IP
147.156.2.15
Arrancar Netmeetig GW 147.156.2.69
963972386
Llamar a 963972386
ADSL
BRI
Internet
GW
RDSI
Control de llamada
IVR
IP
H . 3 2 3
H.245 H.225
H.242 Q.931
H . 3 2 0
RDSI
Internet
GW
PRI
RDSI
Usuario
Alicia
IP
147.156.2.15
Ext.
60
Internet Registro
GW
PRI
RDSI
Usuario
Alicia
IP
147.156.2.15
Ext.
60
RDSI
BRI
Terminal sin soporte H.263
3*BRI PRI
Atenas
Internet
PRI Pasarela
GW
RDSI
PRI 3*BRI
GK Gatekeeper
MBone
Internet
Alicia
Luis
Lnea E1
SIP (Session Initiation Protocol) fue desarrollado por el grupo MMUSIC (Multimedia Session Control) del IETF (RFC 2543 (Febrero 1996); RFC 3261 (Junio 2002)).
SIP es un protocolo de sealizacin a nivel de aplicacin para establecimiento y gestin de sesiones con mltiples participantes:
Localizacin del terminal llamado objetivo (resolucin de direcciones, redireccin de llamadas) Determinacin de las capacidades del terminal objetivo (se elige el menor nivel comn SDP)
El propsito de SIP es la comunicacin entre dispositivos multimedia. SIP hace posible esta comunicacin gracias a dos protocolos: RTP/RTCP y SDP.
Es independiente del protocolo de transporte. Se basa en mensajes de peticin y respuesta y reutiliza muchos conceptos de estndares anteriores como HTTP y SMTP. Es un protocolo basado en texto (a diferencia de H.323), lo que permite leer fcilmente los mensajes SIP. Utiliza el puerto 5060 en TCP y UDP. Dos terminales SIP puedan comunicarse directamente sin infraestructuras SIP, pero este enfoque es impracticable para un servicio pblico.
RTP/RTCP: Protocolos de transporte en tiempo real que proporcionan servicios de entrega punto a punto de datos.
SDP (Session Description Protocol - RFC 2327): Protocolo que se utiliza para describir sesiones multicast en tiempo real, siendo til para invitaciones, anuncios, y cualquier otra forma de inicio de sesiones.
Se usa para la negociacin de las capacidades de los participantes, puertos, tipo de codificacin, etc.
Las entidades SIP identifican a un usuario con las SIP URI (Uniform Resource Identifiers) definido en el RFC 2396 (formato similar al e-mail):
sip:usuario@dominio, donde dominio es un nombre de dominio completo. sip:usuario@equipo, donde equipo es el nombre de la mquina. sip:usuario@direccin_ip, donde direccin_ip es la direccin IP del dispositivo. sip:nmero_telfono@gateway, donde el gateway permite acceder al nmero de telfono a travs de la red telefnica pblica.
Una de las funciones de los servidores SIP es la localizacin de los usuarios y resolucin de nombres. Normalmente, el agente de usuario no conoce la direccin IP del destinatario de la llamada, sino su URI.
User Agent Client (UAC): entidad lgica que genera peticiones SIP y recibe respuestas a esas peticiones
User Agent Server (UAS): entidad lgica que genera respuestas a las peticiones SIP.
Un terminal SIP puede funcionar indistintamente como UAC o UAS en una determinada sesin, dependiendo si es o no el terminal que inicia la llamada.
Proxy Server:
Dispositivo intermedio que recibe mensajes SIP y los retransmite al siguiente servidor SIP en la red, alterando los campos de la solicitud en caso necesario. 2 tipos:
Statefull Proxy: mantienen informacin de estado de las transacciones durante el procesamiento de las peticiones. Son los dispositivos ms cercanos a los UA y se encargan del control de los dominios de usuario. Stateless Proxy: no mantienen el estado de las transacciones durante el procesamiento de las peticiones, nicamente reenvan mensajes. Constituyen el backbone de la infraestructura SIP.
Registrar Server:
Servidor que acepta peticiones de registro de los usuarios y guarda la informacin de estas peticiones. Suministra un servicio de localizacin y traduccin de direcciones en el dominio que controla (en otras notaciones se considera que esto lo da el Location Server). Suele estar asociado a un Proxy o Redirect Server. Servidor que proporciona informacin al UAC sobre el o los siguientes saltos que el mensaje SIP debe seguir.
Redirect Server:
El cliente entonces contacta con el servidor del siguiente salto o con el UAS directamente.
SIP define la comunicacin a travs de dos tipos de mensajes. Las solicitudes (mtodos) y las respuestas (cdigos de estado)
Mtodos SIP: seis mtodos bsicos (definidos en RFC 254) que describen las peticiones de los clientes:
INVITE: Permite invitar un usuario o servicio para participar en una sesin o para modificar parmetros en una sesin ya existente. ACK: Confirma el establecimiento de una sesin. OPTION: Solicita informacin sobre las capacidades de un servidor. BYE: Indica la terminacin de una sesin. CANCEL: Cancela una peticin pendiente. REGISTER: Registrar al User Agent.
El cdigo de la respuesta est compuesto por tres dgitos que permiten clasificar los diferentes tipos existentes:
Usuario A
Proxy SIP
Usuario B
Usuario A
Proxy SIP
Usuario B
Usuario A
Proxy SIP
Usuario B
Usuario A
Proxy SIP
Usuario B
Protocolo de sealizacin
Protocolo de datos Codificacin Otros protocolos Direccionamiento
Las comunidades existentes en torno a SIP (IETF) y H.323 (ITU-T) tienen tradiciones distintas.
H.323:
Especifica servicios, mientras que SIP slo es un protocolo de sealizacin e inicializacin (es la base para dar servicios).
SIP:
Existen gateways SIP H.323: implantar SIP no requiere desprenderse de infraestructuras H.323 en funcionamiento.
Comparaciones detalladas:
http://www.packetizer.com/ipmc/h323_vs_sip/
http://www.voipforo.com/H323vsSIP.php SIP Iris Mmedia GT RedIRIS 2003.
NDICE
Codificacin de voz Paquetizacin de voz Protocolos H.323 y SIP Telefona sobre IP (ToIP)
Pretende aprovechar la infraestructura desplegada para la transmisin de datos para para establecer una comunicacin telefnica, utilizando el protocolo IP.
Requiere una red con bajo retardo y calidad de servicio o QoS (caudal garantizado). Adems de digitalizar la voz es necesario ofrecer todas las funciones propias de una red telefnica:
Generacin de la sealizacin requerida por la red telefnica. Funciones avanzadas: reenvo de llamadas, mensajera, etc. Conversin de nmeros telefnicos a direcciones IP y viceversa. Control de admisin, Tarificacin y Facturacin
Manejo de Fax.
Adems de digitalizar la voz es necesario ofrecer todas las funciones propias de una red telefnica:
Generacin de la sealizacin requerida por la red telefnica. Funciones avanzadas: reenvo de llamadas, mensajera, etc. Conversin de nmeros telefnicos a direcciones IP y viceversa. Control de admisin, Tarificacin y Facturacin Manejo de Fax.
Cisco 7960G Audio G.711 y G.729a Incorpora conmutador de dos puertos 10/100
Supresin de silencios.
Convergencia de las comunicaciones de datos y voz en una plataforma nica, facilitando la gestin, el mantenimiento y el entrenamiento del personal.
Los retardos de cientos de ms, comunes en redes de datos, son inaceptables en una conversacin telefnica.
Las redes IP estn diseadas para descartar paquetes en caso de congestin y retransmitirlos en caso de error. Esto no es adecuado para la voz.
Telefona Tradicional
Voz comprimida
Voz comprimida
Telefona IP
Ethernet Lnea E1 (2.048 Kb/s) Lnea telefnica
1 3
2
Red Telefnicap blica Red Telefnicap blica
2
Red Telefnicap blica
Salamanca
Zaragoza
Pamplona
http://en.wikipedia.org/wiki/List_of_commercial_voice_ over_IP_network_providers Vonage de N.J. y AT&T ofrecen tarifa plana en todo EEUU y Canad por $25/mes.
Skype (de los fundadores de Kazaa) ofrece llamadas gratuitas sobre Internet utilizando peer to peer
Se pretende que sea casi indistinguible del telfono convencional. Tpicamente tarifa plana Software en PC Llamadas gratuitas sobre Internet utilizando P2P