You are on page 1of 92

INTRODUCCION A LA TELEVISION DIGITAL

Constantino Prez Vega


Dpto. de Ingeniera de Comunicaciones Universidad de Cantabria Santander Espaa perezvr@unican.es http://personales.unican.es/perezvr Junio 2009

Secuencia de desarrollo de la charla

1. Seal digital de video y estndares de digitalizacin 2. Formatos de codificacin. 3. Criterios de calidad 4. Seales a codificar y estructuras de muestreo 5. Codificacin de fuente: Compresin 6. Formatos de compresin 7. Flujo de transporte.

1. SEAL DIGITAL DE VIDEO Y ESTANDARES DE DIGITALIZACION

Parmetros de la seal digital definidos por ITU-R BT.601-5 (Televisin de definicion estndard SDTV) NTSC Campos/seg Cuadros/seg Lneas/cuadro Muestras/linea (Y) Muestras/lnea (Cr, Cb) Bits/muestra Tasa binaria Lneas activas/cuadro Muestras activas/lnea (Y) Muestras activas/lnea (Cr, Cb) 60 30 525 858 429 8 216 Mb/s 480 720 360 PAL 50 25 625 864 432 8 216 Mb/s 576 720 360

La frecuencia de muestreo es la misma para PAL y para NTSC: 13.5 MHz para luminancia 6.75 MHz para cada una de las dos componentes de crominancia (Cr y Cb)

El nmero total de muestras por lnea es de 864 en PAL y de 858 en NTSC

El nmero de muestras por lnea activa es el mismo en PAL que en NTSC (720 muestras)

inicio de blanking horizontal

Inicio de lnea digital activa

T(ns) = 1000/13.5

OH

12T

132T

720T

Blanking digital

Lnea activa de vdeo digital Muestras de luminancia Muestras de crominancia

SAV (Start of Active Video)

EAV (End of Active Video)

Intervalo de borrado (blanking) horizontal 144 muestras (bytes)

La seal TRS utiliza slo cuatro smbolos (bytes) del intervalo de borrado

AnchodeBandarequeridoporlasealdigital:
Radiodifusin Terrestre de TV y Cable: 6 MHz (NTSC) y 7 u 8 MHz (PAL) Seal digital en el entorno del estudio, sin modulacin digital: 216 MHz (4:2:2) 324 MHz (4:4:4) 27 canales PAL de 8 MHz 40 canales PAL de 8 MHz

PARA UNA SOLA SEAL DE VDEO

Satlite: Suponiendo transpondedores de 36 MHz :

9 canales de satlite (4:2:2) 6 canales de satlite (4:4:4)

2. FORMATOS DE CODIFICACION

Debido al desarrollo de otros sistemas de transmisin de imgenes digitales, aparte de la televisin, se han establecido diversos formatos para codificacin digital, con diferentes nmeros de elementos, por ejemplo para televisin de alta definicin, televisin de definicin estndard, videoconferencia, transmisin a imgenes en dispositivos mviles, etc. designados genricamente como multimedia.

Formatos de codificacin (no deben confundirse con formatos de compresin) CIF (Common Intermediate Format) Usado para estandarizar las resoluciones horizontal y vertical en pxels de secuencias de vdeo en componentes YCbCr. Se dise para convertir fcilmente PAL NTSC y se propuso inicialmente en el estndard H.261. Define una secuencia de vdeo con resolucin de 352(H)x288(V) y una frecuencia de cuadro de 30000/1100 (aprox. 29.97 cuadros/seg) con codificacin de color YCbCr 4:2:0.

QCIF (Quarter CIF). Significa "un cuarto de CIF" y ocupa la cuarta parte del rea en CIF. La altura y el ancho se reducen a la mitad. Tambin se utilizan SQCIF (Sub Quarter CIF), 4CIF (4 CIF) and 16CIF (16 CIF).

Formato SQCIF QCIF CIF 4CIF 16CIF

Resolution (HxV) 128 96 176 144 352 288 704 576 1408 1152

Todos los formatos XCIF resultan en imgenes con relacin de aspecto 4:3 Los tamaos de imgen XCIF son mltiplos de macrobloques (16x16 pxels) Por ejemplo, una imagen CIF (352x288) corresponde a 22x18 macrobloques. 4CIF es adecuado para SDTV (TV estndard) y DVD 16CIF para imgenes de alta definicin CIF y QCIF se usan generalmente para videoconferencia QCIF o SQCIF son adecuados para aplicaciones multimedia mviles

1408x1056 16CIF

704 x 528 4CIF

352 x 264 CIF 176 x132 QCIF

Estas imgenes, en general, se someten a compresin subsecuente

128 x 96 SQCIF

3. CRITERIOS DE CALIDAD

Sin compresin

138 kbit

18 kbit

18 kbits

18 kbits

QCIF (176 x 132) Misma imagen ampliada

Muestreo 4:4:4

Esto se debe a que la respuesta espectral del ojo es menor a la informacin de color que a la de luminancia, lo que permite prescindir de la mitad o ms de las muestras de color o crominancia.

Muestreo 4:2:2 : Se tiran la mitad de las muestras horizontales (lnea) de crominancia.

Muestreo 4:2:0: Se tiran la mitad de las muestras horizontales de crominancia y la mitad de las verticales

Tasas binarias segn el formato de muestreo. Vdeo digital 4:4:4 324 Mbit/s RGB Seal analgica Recomendacin UIT BT.601-5 4:2:2 216 Mbit/s YCrCb 4:2:0 162 Mbit/s YCrCb

COMPRESION H.261 MPEG1, MPEG2, H.263 MPEG4 Visual, H.264/MPEG4 AVC VC-1 (WMV9)

La unidad bsica para el procesado y compresin de imgenes digitalizadas en MPEG-1 y MPEG-2 es el bloque de 8 x 8 elementos de imagen y el macrobloque de 16 x 16 elementos de imagen. Los estndares desarrollados recientemente (H.264, MPEG-4, VC-1 y otros), pueden trabajar con bloques de 4 x 4 y otros tamaos, mejorando la eficiencia de compresin.

Generacin y CAD

Produccin/Postproduccin

4:4:4 4:2:2 4:2:0 Flujo MPEG-2

Audio comprimido

Flujo de transporte de programa

Compresin

MUX

Audio digital Otros datos

Contexto de la compresin en televisin digital

3. CODIFICACION DE FUENTE: COMPRESION DE VIDEO Aspectos comunes a todos los sistemas

Los esquemas anteriores corresponden a imgenes digitales de televisin no comprimidas, independientemente del formato de codificacin. De ellas es necesario eliminar una gran cantidad de informacin para conseguir la compresin

Arquitectura general de un sistema de transmisin digital

Paquetes de transporte MPEG Video analgico de programa CODIFICACION DE CANAL Y MODULACION

CODIFICACION DE FUENTE

MULTIPLEXADO

Conversin A/D Compresin Otros programas en el mismo canal de RF

Compresin de vdeo: Se basa en aprovechar las propiedades de las imgenes y las caractersticas perceptuales del sistema visual humano: Redundancia espacial Redundancia temporal Compactacin de energa Eliminacin de informacin irrelevante Respuesta visual humana Compresin de audio Se basa principalmente en la explotacin de las caractersticas psicofisiolgicas del sistema auditivo humano: Enmascaramiento Respuesta en frecuencia del odo interno (cclea) Compactacin de energa

Compresin: Es la reduccin del flujo o tasa binaria: Reduciendo la informacin redundante Eliminando la informacin irrelevante Informacin redundante: Informacin superflua, presente varias veces en el flujo binario, o que no contiene informacin, o que puede recuperarse fcilmente sin prdidas, mediante un proceso matemtico simple en el receptor. Informacin irrelevante: Es la que no puede ser percibida por el sistema visual humano, de modo que puede ser eliminada sin prdida de la calidad subjetiva.

Procesos en MPEG que permiten alcanzar elevados niveles de compresin


Resolucin a 8 bits/muestra en lugar de 10 (reduccin de irrelevancia) Omisin de intervalos de blanking H & V (reduccin de redundancia) Reduccin de resolucin de color H & V (4:2:0) (reduccin de irrelevancia) Codificacin DPCM de imgenes en movimiento (redundancia). DCT seguida de cuantificacin perceptual (irrelevancia). Barrido en zig-zag con VLC (redundancia) Codificacin Huffman (redundancia).

Redundancia Espacial

Zonas con elementos de imagen similares, aunque con algunas variaciones ms notorias perceptualmente

Zonas en que los elementos de imagen son prcticamente iguales con muy pocas variaciones entre uno y otro

Redundancia temporal

Cuadros sucesivos

Objetos en movimiento

Entre cuadros sucesivos la informacin entre cuadros es la misma, excepto en la posicin de los objetos en movimiento. La informacin redundante entre cuadros se puede eliminar

La unidad bsica para el procesamiento de la imagen es el bloque de 8x8 elementos de imagen, tanto para luminancia como para crominancia. Un macrobloque (16x16) est formado por cuatro bloques de luminancia y dos bloques de crominancia. Los bloques de la seal original constituyen matrices de 8x8 elementos cuyos valores corresponden a los niveles de brillo (luminancia) de la escena o imagen original. La correlacin entre esos valores suele ser elevada y la distribucin de energa es bastante uniforme. Esta seal no est comprimida. Para comprimir la seal es necesario utilizar alguna tcnica que compacte la energa en unos pocos coeficientes. Las transformadas, como Fourier, DCT y otras tienen esa propiedad.

Transformadas:

Transformada del coseno discreto (DCT) Cuantificacin Perceptual Codificacin de longitud variable (VLC) - Entropa Estimacin y compensacin de movimiento

Transformadas: Propiedades de compactacin de energa de los coeficientes transformados

Imagen original

Fourier

DCT

Seno discreto

Hadamard

Karhunen-Loeve

Transformada del Coseno Discreto (DCT)

7 7 1 (2 x + 1)u (2 y + 1)v F (u , v ) = C (u ) C (v ) f ( x , y ) cos cos 4 16 16 x =0 y =0

1 C (w ) = 2 =1

para w = 0 para w = 1, 2 ,...,7

1 7 7 (2 x + 1)u (2 y + 1)v f ( x , y ) = C (u ) C (v ) F (u ,v ) cos cos 4 u =0 v =0 16 16

la DCT parte el rea de la imagen en frecuencias discretas en dos dimensiones

Imagen Original

1 pixel = 1 muestra Y+ Cr + Cb

Dominio espacial 8x8 pixels

Dominio de la transformada 8x8 coeficientes

DCT

Procesado en el Estudio Calidad de contribucin

Cuantificacin perceptual Algoritmos de compresin Seal comprimida

Cuantificacin perceptual

:
Matriz transformada Matriz de coeficientes perceptuales

=
Matriz cuantificada perceptualmente

DCT

Cuantificacin

Codificacin de recorrido

Coeficientes de cuantificacin perceptual de luminancia

Codificacin de recorrido (RLC)

Flujo de Transporte

Estructura de un macrobloque MPEG

16 x 16 muestras 8 x 8 muestras c/u

Cr

Cb Crominancia

Luminancia (Y)

Segmentacin (slicing)
Segmento (slice): secuencia de macrobloques contiguos en orden del barrido Macrobloque

Compensacin de movimiento
tiempo

Imagen de referencia Prediccin hacia adelante

Imagen actual

Imagen de referencia Prediccin hacia atrs

Reduccin de redundancia temporal

Codificacin hbrida

Vdeo digital no comprimido Modelo temporal

Residuo Modelo espacial

Coeficientes Codificador de entropia

Salida codificada

Vectores de movimiento
(cdigos binarios cortos)

Imgenes previas y futuras

Flujo ptico

Cuadro n

Cuadro n k

Diferencia

Residuos

bloques de 16 x 16

bloques de 8 x 8

El residuo es la resta de la prediccin del codificador y de la seal actual de entrada

bloques de 4 x 4

Vectores de movimiento

bloques de16 x 16

bloques de 4 x 4 vectores de pixel

Fuente: Richardson, I.E.G. H.264 and MPEG-4 Video Compression. John Wiley & Sons, 2003.

Secuencia de codificacin
Grupo de imgenes (GOP)

Jerarqua de los datos de video

8x8 Bloque Macrobloque Segmento Cuadro

Grupo de Imgenes (GOP) Secuencia de vdeo

Evolucin de los estndares de compresin

Evolucion de la capacidad de compresin

Formatos de Compresin UIT H.261 Diseado para comunicacin bidireccional sobre lneas ISDN. Emplea compresin intracuadro e intercuadro y soporta resoluciones CIF y QCIF. Fue el primer estndard prctico de codificacin de vdeo H.262 El estndard es prcticamente igual a MPEG-2

H.263 Diseado en 1995. Basado en H.261 con prestaciones que mejoran la calidad de vdeo. Soporta resoluciones CIF, QCIF, SQCIF, 4CIF y 16CIF. Se utiliza en video conferencia y en clips de vdeo como YouTube, Google Video, etc.

MPEG-1 Diseado para tasas binarias hasta de 1.5 Mbit/s. Basado en aplicaciones de CD-ROM, es un estndard popular para vdeo sobre Internet, transmitidos como archivos .mpg. El nivel 3 de MPEG-1 (MP3), se ha convertido en el estndard ms popular para compresin de audio. Cuadros de 352 x 240 pxeles. 20 Mbit/s sin compresin y de 1 a 3 Mbps con compresin.

MPEG-2 Diseado para tasas binarias entre 1.5 y 15 Mbit/s. Es el estndard adoptado para televisin digital en el que se basan todas las terminales de abonado. Tambin se emplea para grabacin en DVD. LL (Low Level) 352 x 240 pxeles. Main Level (Rec. 601 UIT-R): 720 x 480 pxeles luminancia y 352 x 480 crominancia.

MPEG-4 Inicialmente MPEG-4 tuvo como objetivo la codificacin de audio y vdeo a tasas binarias muy bajas. El estndard se optimiz explcitamente para tres rangos: <64 kbit/s 64 a 384 kbit/s 384 kbit/s a 4 Mbit/s

La primera versin de MPEG-4 (1999) se designa como MPEG-4 Visual, MEG-4 Parte 2 y no debe confundirse con MPEG-4 AVC MPEG-4 no es compatible con MPEG-2

H.264/AVC (MPEG-4 Parte 10 H.264 se inici por el VCEG (Video Coding Experts Group) en el seno de la UIT (Unin Internacional de Telecomunicaciones). Las etapas finales de H.264 se desarrollaron conjuntamente por los grupos MPEG y VCEG. El estndard final fue designado como H.264/AVC (Advanced Video Coding) y se incorpor al estndar MPEG-4 como Parte 10 o MPEG-4 AVC H.264/MPEG-4 Parte 10 se public en 2003. MPEG-4 Visual y H.264 tienen aspectos relacionados pero significativamente diferentes. MPEG-4 hace nfasis en la flexibilidad. H.264 enfatiza la eficiencia y fiabilidad. H.264/AVC no es compatible con MPEG-2

Todos los sistemas anteriores tienen semejanzas en el algoritmo de codificacin que emplea: Estimacin y prediccin de movimiento inter-cuadro Codificacin espacial por transformada (DCT) Cuantificacin escalar Exploracin en zig-zag Codificacin por entropa (VLC) Sin embargo hay diferencias entre MPEG-2 y MPEG-4 y en las propias implementaciones de las versiones de cada uno

OBJETO VISUAL
Parte de la escena a la que se puede acceder o manipular independientemente

OBJETO DE VIDEO
Area de textura que cambia con el tiempo

OBJETO MALLADO
(MESH) Superficie 2D o 3D que cambia con el tiempo

OBJETO DE TEXTURA FIJA


Area de textura que no cambia con el tiempo

OBJETO DE ANIMACION DE CARA Y CUERPO


Objeto mallado humanoide que puede cambiar con vectores de expresin y postura

Textura: Apariencia de la escena

Mallado: Con estructura de malla, coordinado de forma tal que todas las partes funcionen juntas en armona

Codificacin en MPEG-4 y H.264

Bloques FONDO Objeto 2

Objeto 1 Cuadro compuesto

Originales

Compuestas

Mallado.

10. INTRODUCCION A LA COMPRESION POR WAVELETS

Dominio del tiempo

Dominio de frecuencia

Transformada wavelet Es la utilizada en el estndard JPEG-2000 para imgenes fijas. Se emplea en MPEG-4 para codificacin de textura.

CWTx ( , s ) = x ( , s ) = x(t ) (t )dt



* ,s

,s

1 t = s s

Nivel de descomposicin

Reconstruccin

Introduccin a las wavelets

Electroencefalograma de una persona normal

Electroencefalograma de un paciente con Alzheimer

Wavelet vertical
Wavelet horizontal

Frecuencias H altas Frecuencias V altas

HH

Frecuencias H altas Todas las frecuencias V


Funcin de escala vertical

Frecuencias H altas Frecuencias V bajas

HL

Imagen
Wavelet vertical
Funcin de escala horizontal

Frecuencias H bajas Frecuencias V altas

LH

Frecuencias H bajas Todas las frecuencias V


Funcin de escala vertical

Frecuencias H bajas Frecuencias V bajas

LL

Proceso de de descomposicin de una imagen mediante wavelets Ly Lx 2 Hy 2 LH 2

LL

Ly Hx 2 Hy

HL

HH

Y por qu todo esto de la compresin?

Una seal analgica de TV ocupa un ancho de banda de 4.2 MHz Esa misma seal digitalizada a 4:2:2 genera un flujo binario, sin compresin de 162 Mbit/s. Suponiendo que se empleara modulacin 16 QAM (4 bits/Hz) el ancho de banda requerido sera de 40.5 MHz, lo que hace impensable su transmisin en un canal de 6 MHz. Si de la seal digital se elimina la informacin redundante o irrelevante se puede reducir, por ejemplo a unos 5 Mbit/s. Que con 16 QAM requerira un ancho de banda de 1.25 MHz. Con ello en un canal de RF de 6 MHz cabran 4 seales digitales comprimidas. La compresin permite multiplicar por cuatro (con MPEG-2) el nmero de programas que se pueden transmitir en un canal analgico.

$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$

You might also like