You are on page 1of 7

INTRODUCCIÓN

MPEG (formalmente ISO/IEC JTC1/SC29/WG11) es un grupo formado para el desarrollo de una técnica de codificación y compresión de vídeo/audio digital. Inicialmente surgió el estándar ISO 11172, conocido como MPEG-1. Este estándar se divide en tres partes principales, en las que se describe el algoritmo de descompresión de vídeo, audio, y una trama para el transporte de los datos. Se da libertad en los procedimientos de compresión. Este estándar está pensado para entornos libres de errores como el almacenamiento digital, o aplicaciones multimedia. Posteriormente apareció el estándar MPEG-2, o ISO/IEC IS 13818, que mantiene una estructura muy parecida a MPEG-1, pero mejora el procedimiento, y abarca más formatos de codificación, pudiéndose utilizar para la distribución de señales digitales de TV y HDTV. Volver al índice de esta página

TRAMA DE SISTEMA
Los estándares MPEG permiten la multiplexación de diferentes canales de vídeo, audio y datos, junto con la información temporal necesaria para lograr una reproducción sincronizada, en una sola trama, llamada trama de sistema. Volver al índice de esta página

TRAMA DE SISTEMA MPEG-1
Además de la multiplexación de los diferentes canales, esta trama permite:
y y y y y

Presentación sincronizada de los diferentes canales. Facilidades para el acceso aleatorio dentro de la trama. Identificación de tiempo. Manejo de los buffers de los decodificadores. ...

La sincronización y el manejo de buffers se pueden realizar gracias a marcas temporales (time-stamps) incluidas en la propia trama. Estas marcas pueden ser : PTS (Presentation Time Stamp), DTS (Decoding Time Stamp) y SCR (SourceClock Reference) y se miden en unidades del reloj del sistema. La trama de sistema MPEG-1 consta de una o más tramas elementales de audio, vídeo y datos multiplexadas conjuntamente. Las tramas están formadas por unidades de acceso

Los canales individuales de audio. si se trata de vídeo. que tiene un tamaño fijo de 188 bytes. Cada uno de estos paquetes se divide en dos partes : . vídeo y datos. La cabecera del pack tiene el código de identificación del pack (Pack StartCode) más información sobre la velocidad binaria (bit rate) y el SCR. Las tramas tienen un número variable de PES packets de audio. o un grupo de muestras si es audio.(UA). Soporte para la transmisión de canales criptografiados. tanto en capacidad como en funcionalidad de la trama MPEG-1. Es para entornos libres de errores. Definición de un sistema de información que identifica los contenidos de la trama. Se combinan varios programas con varias bases de tiempos comunes o independientes. Cada trama individual se divide en packets. Trama de programa. que son datos más una cabecera en la que está el código de identificación del packet (PacketStartCode) e información de sincronización (PTS y DTS). Volver al índice de esta página TRAMA DE SISTEMA MPEG-2 Es una ampliación. Es para entornos en los que hay errores. Una UP es una imagen. que se multiplexan en estructuras llamadas TransportPackets. que son unidades de presentación (UP) comprimidas. Todos los canales comparten la misma base de tiempos. y luego los decodificadores de audio y vídeo. Primero se recupera la base de tiempos del sistema a partir del SCR. realizan una presentación sincronizada de los diferentes canales. Un pack es una cabecera y cero o más packets de tramas individuales. Es similar a la de MPEG-1. Entre las funciones adicionales que aporta la trama de sistema MPEG-2 están las siguientes : y y y y Dos tipos de trama de sistema :Trama de programa (para entornos libres de errores) y trama de transporte (para entornos en los que existen errores). Trama de transporte. La sincronización se consigue gracias a las marcas temporales. que permite gobernar la reproducción de tramas de sistema guardadas en medios de almacenamiento digital. por ejemplo la transmisión vía satélite. vídeo y datos se organizan en PES packets (PacketizedElementaryStreams) que se multiplexan de una forma diferente dependiendo de si es una trama de programa o de transporte. gracias a los DTS y PTS contenidos en los packets. por ejemplo aplicaciones interactivas multimedia. Definición del sistema DSMCC (Digital Storage Media Command Control).

para su reducción. Mediante la estimación de movimiento se aprovecha la redundancia temporal. predictivos (P). También se trata de un algoritmo asimétrico. ya que la mayor carga de procesamiento la tiene el codificador.y y Cabecera : formada por los cuatro primeros bytes. así se simplifica el decodificador. Volver al índice de esta página TRAMA DE VIDEO Modelo de sistema de codificación de vídeo MPEG: Volver al índice de esta página TRAMA DE VIDEO MPEG-1 El algoritmo de codificación de vídeo es genérico y sirve para muchos tipos de aplicaciones. Los cuadros I se codifican sin ninguna referencia . El primero de estos bytes es de sincronismo y tiene siempre un valor fijo y predeterminado. y bidireccionales o interpolados (B). Se consigue una alta tasa de compresión a costa de unas pérdidas de calidad aceptables. Se definen tres tipos de cuadros de imagen: Intra (I). Información : formada por el resto de bytes. Los otros tres indican qué tipo de información va en los 184 bytes restantes. basándose en dos características de las imágenes en movimiento :la redundancia temporal y la redundancia espacial.

emplean compensación de movimiento sobre cuadros I o P. Lo primero que se hace en el codificador es la provisión de imágenes de vídeo con la resolución deseada y muestreadas por separado las componentes de luminancia (Y) y crominancia (U/V). Los coeficientes que se obtienen se transforman en otros mediante tablas en las que los eventos más probables se codifican con un número menor de bits (codificación entrópica). Así se incrementa la eficiencia del proceso. Tras el proceso anterior. la imagen diferencia entre la entrante y la predicha se codifica empleando la técnica DCT a nivel de macrobloque. La trasnformada discreta de coseno. Los cuadros B no se pueden emplear como referencias temporales. y puede ser visualizado independientemente y aleatoriamente.. tanto pasados como futuros (predicción bidireccional o interpolación no causal). . en las que hay que perder menos información. La complejidad del decodificador es muy inferior a la del codificador debido a eso. excepto la codificación entrópica. los cuadro B son los que más se comprimen. Esta técnica consiste en la transformación espacio-frecuencia. y por tanto. Por último. en las que el ojo es más sensible. que permite concentrar la mayor parte de la información en los coeficientes de baja frecuencia. Una secuencia de imágenes que contiene un cuadro I en su origen (IBBPBBP. buscando en cuadros de referencia anteriores o posteriores dicho patrón y proporcionando finalmente los vectores del movimiento detectado.) se llama grupo de cuadros (GOP). El proceso de decodificación es como la codificación pero a la inversa. Esto se aplica en menor medida a las zonas de baja frecuencia. Variable LengthCoding) antes de pasar al buffer de salida. Tras la reordenación se hace una predicción. con pérdidas de información controladas por el nivel de llenado del buffer de salida de datos codificados.. Después se pasa a la cuantificación. DCT. Por último se realiza la codificación entrópica (VLC. Las compensaciones de movimiento se realizan sobre zonas muy pequeñas de imagen de 16x16 pixels (macrobloques).. La codificación y la decodificación de las secuencias de imágenes se pueden ver en el diagrama de bloques.BBI.. se pueden tomar como referencia para futuros cuadros P (predicciones causales).. y se calcula el error de predicción. Después se reordena la secuencia de imágenes para permitir la codificación previa de las referencias futuras (I o P) de los cuadros B: I1 B2 B3 P4 B5 B6 P7 B8 B9 I10 .temporal a cuadros anteriores o posteriores. Después se cuantifica (Q) la DCT del error de predicción. ==> I1 P4 B2 B3 P7 B5 B6 I10 B8 B9 . aprovecha la redundancia espacial que tienen las imágenes en movimiento. esto provoca una compresión menor aunque hace que se puedan usar estos cuadros como puntos de acceso en busquedas aleatorias. Los cuadros P se codifican más eficientemente debido a que se emplea predicción por compensación de movimiento sobre un cuadro I o P anterior.

Abarca los formatos progresivo (1:1) y entrelazado (2 campos/cuadro). y el formato SIF (352 puntos por 288 líneas. temporal o de calidad. Así una misma trama puede proporcionar diferentes resultados según la parte de la misma que se decodifique. Permite en algunos modos avanzados escalabilidad espacial. Volver al índice de esta página TRAMA DE AUDIO Modelo de sistema de codificación de audio MPEG: .2 .3 4 .40 Las velocidades anteriores se refieren sólo a las señales de vídeo. Tiene las siguientes mejoras : y y y y El algoritmo está orientado para la codificación de señales de televisión convencional (SDTV). 25 cuadros por segundo). televisión mejorada (EDTV).10 6 . Los rangos de velocidades binarias son: Tamaño de imagen Velocidad binaria Formato Imágenes/s (puntos*líneas) SIF TV (o SDTV) EDTV HDTV 25 50 50 50 352 * 288 720 * 576 960 * 576 1920 * 1152 (Mbit/s) 1. Calidad de imagen igual o superior a las actuales transmisiones analógicas.15 20 .Ejemplos de películas en formato MPEG-1: y y ejemplo 1 ejemplo 2 Volver al índice de esta página TRAMA DE VIDEO MPEG-2 Es compatible con MPEG-1. televisión de alta definición (HDTV).

Se determinan qué señales están enmascaradas. para poder eliminarlas sin que se produzca una pérdida apreciable en la calidad de la señal acústica percibida. A cada banda se le asigna un número de bits para reducir el ruido total de cuantificación. esto se realiza en el bloque de asignación de bits y cuantificación. Esta señal se divide en 32 subbandas de frecuencia con un banco de filtros. que ofrecen. Simultáneamente se calcula para cada subbanda. una mayor calidad a costa de una mayor complejidad de los procesos de codificación y decodificación. La trama puede incluir datos auxiliares además de la información de audio. En el proceso de descodificación de la señal de audio MPEG-1 se realizan las funciones inversas a las del proceso de codificación. sino que se basa en un modelo de percepción del oído humano. En el diagrama de bloques del modelo de sistema de codificación de audio MPEG-1 se puede ver el proceso básico de codificación/decodificación de la señal de audio digital. Hay tres capas (Layer I.1 y 48 kHz. 44. II y III) en el algoritmo. El último bloque empaqueta la información anterior y añade los datos auxiliares en la trama. en el modelo psicoacústico. estéreo y join estéreo. Velocidades binarias de salida de 32 a 192 Kb/s por canal. Principales características del algoritmo MPEG-1: y y y y y Frecuencias de muestreo de 32. El algoritmo no aprovecha la redundancia de información de la señal de audio. los coeficientes entre los niveles de señal y umbral de enmascaramiento (los sonidos no se distinguen por debajo de este umbral). con 16 bits por muestra. Uno o dos canales de audio con cuatro modos de funcionamiento: mono. dual.Volver al índice de esta página TRAMA DE AUDIO MPEG-1 La codificación de audio MPEG-1 proporciona un método de compresión de alta calidad. . en orden creciente.

Se introduce el sonido envolvente (surround) análogo al de las salas cinematográficas. el resto de información necesaria para los canales surround o los canales multilingües se incluye en la zona de datos auxiliares. central y derecho).05 y 24 kHz) y valores más bajos de flujo binario (hasta 16 Kb/s). 2 canales traseros (izquierdo y derecho) y un canal de refuerzo de graves. Soporte para audio multilingüe. para que sea compatible con la trama MPEG-1. El sistema está formado por 3 canales frontales (izquierdo.Volver al índice de esta página TRAMA DE AUDIO MPEG-2 Algunas de las funciones nuevas aportadas son: y y y Audio multicanal. La trama MPEG-2 se construye en torno a dos canales principales (izquierdo y derecho). Así se puede utilizar para servicios que requieran menos calidad de audio. . 22. mientras que un decodificador MPEG-2 puede obtener todos los canales. Así un decodificador que siga la norma MPEG-1 obtendrá los canales izquierdo y derecho. Nuevas frecuencias de muestreo (16. Se pueden introducir en la trama hasta 8 canales de voz.