Primera Sesión

INTRODUCCION A LA TELEVISION DIGITAL
Constantino Prez Vega

Dpto. de Ingeniera de Comunicaciones Universidad de Cantabria Santander Espaa perezvr@unican.es http://personales.unican.es/perezvr Junio 2009
Secuencia de desarrollo de la charla
1. Seal digital de video y estndares de digitalizacin 2. Formatos de codificacin. 3. Criterios de calidad 4. Seales a codificar y estructuras de muestreo 5. Codificacin de fuente: Compresin 6. Formatos de compresin 7. Flujo de transporte.
1. SEAL DIGITAL DE VIDEO Y ESTANDARES DE DIGITALIZACION
Parmetros de la seal digital definidos por ITU-R BT.601-5 (Televisin de definicion estndard SDTV) NTSC Campos/seg Cuadros/seg Lneas/cuadro Muestras/linea (Y) Muestras/lnea (Cr, Cb) Bits/muestra Tasa binaria Lneas activas/cuadro Muestras activas/lnea (Y) Muestras activas/lnea (Cr, Cb) 60 30 525 858 429 8 216 Mb/s 480 720 360 PAL 50 25 625 864 432 8 216 Mb/s 576 720 360
La frecuencia de muestreo es la misma para PAL y para NTSC: 13.5 MHz para luminancia 6.75 MHz para cada una de las dos componentes de crominancia (Cr y Cb)
El nmero total de muestras por lnea es de 864 en PAL y de 858 en NTSC
El nmero de muestras por lnea activa es el mismo en PAL que en NTSC (720 muestras)
inicio de blanking horizontal
Inicio de lnea digital activa
T(ns) = 1000/13.5
OH
12T
132T
720T
Blanking digital
Lnea activa de vdeo digital Muestras de luminancia Muestras de crominancia
SAV (Start of Active Video)
EAV (End of Active Video)
Intervalo de borrado (blanking) horizontal 144 muestras (bytes)
La seal TRS utiliza slo cuatro smbolos (bytes) del intervalo de borrado
AnchodeBandarequeridoporlasealdigital:
Radiodifusin Terrestre de TV y Cable: 6 MHz (NTSC) y 7 u 8 MHz (PAL) Seal digital en el entorno del estudio, sin modulacin digital: 216 MHz (4:2:2) 324 MHz (4:4:4) 27 canales PAL de 8 MHz 40 canales PAL de 8 MHz
PARA UNA SOLA SEAL DE VDEO
Satlite: Suponiendo transpondedores de 36 MHz :
9 canales de satlite (4:2:2) 6 canales de satlite (4:4:4)
2. FORMATOS DE CODIFICACION
Debido al desarrollo de otros sistemas de transmisin de imgenes digitales, aparte de la televisin, se han establecido diversos formatos para codificacin digital, con diferentes nmeros de elementos, por ejemplo para televisin de alta definicin, televisin de definicin estndard, videoconferencia, transmisin a imgenes en dispositivos mviles, etc. designados genricamente como multimedia.
Formatos de codificacin (no deben confundirse con formatos de compresin) CIF (Common Intermediate Format) Usado para estandarizar las resoluciones horizontal y vertical en pxels de secuencias de vdeo en componentes YCbCr. Se dise para convertir fcilmente PAL NTSC y se propuso inicialmente en el estndard H.261. Define una secuencia de vdeo con resolucin de 352(H)x288(V) y una frecuencia de cuadro de 30000/1100 (aprox. 29.97 cuadros/seg) con codificacin de color YCbCr 4:2:0.
QCIF (Quarter CIF). Significa "un cuarto de CIF" y ocupa la cuarta parte del rea en CIF. La altura y el ancho se reducen a la mitad. Tambin se utilizan SQCIF (Sub Quarter CIF), 4CIF (4 CIF) and 16CIF (16 CIF).
Formato SQCIF QCIF CIF 4CIF 16CIF
Resolution (HxV) 128 96 176 144 352 288 704 576 1408 1152
Todos los formatos XCIF resultan en imgenes con relacin de aspecto 4:3 Los tamaos de imgen XCIF son mltiplos de macrobloques (16x16 pxels) Por ejemplo, una imagen CIF (352x288) corresponde a 22x18 macrobloques. 4CIF es adecuado para SDTV (TV estndard) y DVD 16CIF para imgenes de alta definicin CIF y QCIF se usan generalmente para videoconferencia QCIF o SQCIF son adecuados para aplicaciones multimedia mviles
1408x1056 16CIF
704 x 528 4CIF
352 x 264 CIF 176 x132 QCIF
Estas imgenes, en general, se someten a compresin subsecuente
128 x 96 SQCIF
3. CRITERIOS DE CALIDAD
Sin compresin
138 kbit
18 kbit
18 kbits
18 kbits
QCIF (176 x 132) Misma imagen ampliada
Muestreo 4:4:4
Esto se debe a que la respuesta espectral del ojo es menor a la informacin de color que a la de luminancia, lo que permite prescindir de la mitad o ms de las muestras de color o crominancia.
Muestreo 4:2:2 : Se tiran la mitad de las muestras horizontales (lnea) de crominancia.
Muestreo 4:2:0: Se tiran la mitad de las muestras horizontales de crominancia y la mitad de las verticales
Tasas binarias segn el formato de muestreo. Vdeo digital 4:4:4 324 Mbit/s RGB Seal analgica Recomendacin UIT BT.601-5 4:2:2 216 Mbit/s YCrCb 4:2:0 162 Mbit/s YCrCb
COMPRESION H.261 MPEG1, MPEG2, H.263 MPEG4 Visual, H.264/MPEG4 AVC VC-1 (WMV9)
La unidad bsica para el procesado y compresin de imgenes digitalizadas en MPEG-1 y MPEG-2 es el bloque de 8 x 8 elementos de imagen y el macrobloque de 16 x 16 elementos de imagen. Los estndares desarrollados recientemente (H.264, MPEG-4, VC-1 y otros), pueden trabajar con bloques de 4 x 4 y otros tamaos, mejorando la eficiencia de compresin.
Generacin y CAD
Produccin/Postproduccin
4:4:4 4:2:2 4:2:0 Flujo MPEG-2
Audio comprimido
Flujo de transporte de programa
Compresin
MUX
Audio digital Otros datos
Contexto de la compresin en televisin digital
3. CODIFICACION DE FUENTE: COMPRESION DE VIDEO Aspectos comunes a todos los sistemas
Los esquemas anteriores corresponden a imgenes digitales de televisin no comprimidas, independientemente del formato de codificacin. De ellas es necesario eliminar una gran cantidad de informacin para conseguir la compresin
Arquitectura general de un sistema de transmisin digital
Paquetes de transporte MPEG Video analgico de programa CODIFICACION DE CANAL Y MODULACION
CODIFICACION DE FUENTE
MULTIPLEXADO
Conversin A/D Compresin Otros programas en el mismo canal de RF
Compresin de vdeo: Se basa en aprovechar las propiedades de las imgenes y las caractersticas perceptuales del sistema visual humano: Redundancia espacial Redundancia temporal Compactacin de energa Eliminacin de informacin irrelevante Respuesta visual humana Compresin de audio Se basa principalmente en la explotacin de las caractersticas psicofisiolgicas del sistema auditivo humano: Enmascaramiento Respuesta en frecuencia del odo interno (cclea) Compactacin de energa
Compresin: Es la reduccin del flujo o tasa binaria: Reduciendo la informacin redundante Eliminando la informacin irrelevante Informacin redundante: Informacin superflua, presente varias veces en el flujo binario, o que no contiene informacin, o que puede recuperarse fcilmente sin prdidas, mediante un proceso matemtico simple en el receptor. Informacin irrelevante: Es la que no puede ser percibida por el sistema visual humano, de modo que puede ser eliminada sin prdida de la calidad subjetiva.
Procesos en MPEG que permiten alcanzar elevados niveles de compresin

Resolucin a 8 bits/muestra en lugar de 10 (reduccin de irrelevancia) Omisin de intervalos de blanking H & V (reduccin de redundancia) Reduccin de resolucin de color H & V (4:2:0) (reduccin de irrelevancia) Codificacin DPCM de imgenes en movimiento (redundancia). DCT seguida de cuantificacin perceptual (irrelevancia). Barrido en zig-zag con VLC (redundancia) Codificacin Huffman (redundancia).
Redundancia Espacial
Zonas con elementos de imagen similares, aunque con algunas variaciones ms notorias perceptualmente
Zonas en que los elementos de imagen son prcticamente iguales con muy pocas variaciones entre uno y otro
Redundancia temporal
Cuadros sucesivos
Objetos en movimiento
Entre cuadros sucesivos la informacin entre cuadros es la misma, excepto en la posicin de los objetos en movimiento. La informacin redundante entre cuadros se puede eliminar
La unidad bsica para el procesamiento de la imagen es el bloque de 8x8 elementos de imagen, tanto para luminancia como para crominancia. Un macrobloque (16x16) est formado por cuatro bloques de luminancia y dos bloques de crominancia. Los bloques de la seal original constituyen matrices de 8x8 elementos cuyos valores corresponden a los niveles de brillo (luminancia) de la escena o imagen original. La correlacin entre esos valores suele ser elevada y la distribucin de energa es bastante uniforme. Esta seal no est comprimida. Para comprimir la seal es necesario utilizar alguna tcnica que compacte la energa en unos pocos coeficientes. Las transformadas, como Fourier, DCT y otras tienen esa propiedad.
Transformadas:
Transformada del coseno discreto (DCT) Cuantificacin Perceptual Codificacin de longitud variable (VLC) - Entropa Estimacin y compensacin de movimiento
Transformadas: Propiedades de compactacin de energa de los coeficientes transformados
Imagen original
Fourier
DCT
Seno discreto
Hadamard
Karhunen-Loeve
Transformada del Coseno Discreto (DCT)
7 7 1 (2 x + 1)u (2 y + 1)v F (u , v ) = C (u ) C (v ) f ( x , y ) cos cos 4 16 16 x =0 y =0
1 C (w ) = 2 =1
para w = 0 para w = 1, 2 ,...,7
1 7 7 (2 x + 1)u (2 y + 1)v f ( x , y ) = C (u ) C (v ) F (u ,v ) cos cos 4 u =0 v =0 16 16
la DCT parte el rea de la imagen en frecuencias discretas en dos dimensiones
Imagen Original
1 pixel = 1 muestra Y+ Cr + Cb
Dominio espacial 8x8 pixels
Dominio de la transformada 8x8 coeficientes
DCT
Procesado en el Estudio Calidad de contribucin
Cuantificacin perceptual Algoritmos de compresin Seal comprimida
Cuantificacin perceptual
:
Matriz transformada Matriz de coeficientes perceptuales
=
Matriz cuantificada perceptualmente
DCT
Cuantificacin
Codificacin de recorrido
Coeficientes de cuantificacin perceptual de luminancia
Codificacin de recorrido (RLC)
Flujo de Transporte
Estructura de un macrobloque MPEG
16 x 16 muestras 8 x 8 muestras c/u
Cr
Cb Crominancia
Luminancia (Y)
Segmentacin (slicing)
Segmento (slice): secuencia de macrobloques contiguos en orden del barrido Macrobloque
Compensacin de movimiento
tiempo
Imagen de referencia Prediccin hacia adelante
Imagen actual
Imagen de referencia Prediccin hacia atrs
Reduccin de redundancia temporal
Codificacin hbrida
Vdeo digital no comprimido Modelo temporal
Residuo Modelo espacial
Coeficientes Codificador de entropia
Salida codificada
Vectores de movimiento
(cdigos binarios cortos)
Imgenes previas y futuras
Flujo ptico
Cuadro n
Cuadro n k
Diferencia
Residuos
bloques de 16 x 16
bloques de 8 x 8
El residuo es la resta de la prediccin del codificador y de la seal actual de entrada
bloques de 4 x 4
Vectores de movimiento
bloques de16 x 16
bloques de 4 x 4 vectores de pixel
Fuente: Richardson, I.E.G. H.264 and MPEG-4 Video Compression. John Wiley & Sons, 2003.
Secuencia de codificacin
Grupo de imgenes (GOP)
Jerarqua de los datos de video
8x8 Bloque Macrobloque Segmento Cuadro
Grupo de Imgenes (GOP) Secuencia de vdeo
Evolucin de los estndares de compresin
Evolucion de la capacidad de compresin
Formatos de Compresin UIT H.261 Diseado para comunicacin bidireccional sobre lneas ISDN. Emplea compresin intracuadro e intercuadro y soporta resoluciones CIF y QCIF. Fue el primer estndard prctico de codificacin de vdeo H.262 El estndard es prcticamente igual a MPEG-2
H.263 Diseado en 1995. Basado en H.261 con prestaciones que mejoran la calidad de vdeo. Soporta resoluciones CIF, QCIF, SQCIF, 4CIF y 16CIF. Se utiliza en video conferencia y en clips de vdeo como YouTube, Google Video, etc.
MPEG-1 Diseado para tasas binarias hasta de 1.5 Mbit/s. Basado en aplicaciones de CD-ROM, es un estndard popular para vdeo sobre Internet, transmitidos como archivos .mpg. El nivel 3 de MPEG-1 (MP3), se ha convertido en el estndard ms popular para compresin de audio. Cuadros de 352 x 240 pxeles. 20 Mbit/s sin compresin y de 1 a 3 Mbps con compresin.
MPEG-2 Diseado para tasas binarias entre 1.5 y 15 Mbit/s. Es el estndard adoptado para televisin digital en el que se basan todas las terminales de abonado. Tambin se emplea para grabacin en DVD. LL (Low Level) 352 x 240 pxeles. Main Level (Rec. 601 UIT-R): 720 x 480 pxeles luminancia y 352 x 480 crominancia.
MPEG-4 Inicialmente MPEG-4 tuvo como objetivo la codificacin de audio y vdeo a tasas binarias muy bajas. El estndard se optimiz explcitamente para tres rangos: <64 kbit/s 64 a 384 kbit/s 384 kbit/s a 4 Mbit/s
La primera versin de MPEG-4 (1999) se designa como MPEG-4 Visual, MEG-4 Parte 2 y no debe confundirse con MPEG-4 AVC MPEG-4 no es compatible con MPEG-2
H.264/AVC (MPEG-4 Parte 10 H.264 se inici por el VCEG (Video Coding Experts Group) en el seno de la UIT (Unin Internacional de Telecomunicaciones). Las etapas finales de H.264 se desarrollaron conjuntamente por los grupos MPEG y VCEG. El estndard final fue designado como H.264/AVC (Advanced Video Coding) y se incorpor al estndar MPEG-4 como Parte 10 o MPEG-4 AVC H.264/MPEG-4 Parte 10 se public en 2003. MPEG-4 Visual y H.264 tienen aspectos relacionados pero significativamente diferentes. MPEG-4 hace nfasis en la flexibilidad. H.264 enfatiza la eficiencia y fiabilidad. H.264/AVC no es compatible con MPEG-2
Todos los sistemas anteriores tienen semejanzas en el algoritmo de codificacin que emplea: Estimacin y prediccin de movimiento inter-cuadro Codificacin espacial por transformada (DCT) Cuantificacin escalar Exploracin en zig-zag Codificacin por entropa (VLC) Sin embargo hay diferencias entre MPEG-2 y MPEG-4 y en las propias implementaciones de las versiones de cada uno
OBJETO VISUAL
Parte de la escena a la que se puede acceder o manipular independientemente
OBJETO DE VIDEO
Area de textura que cambia con el tiempo
OBJETO MALLADO
(MESH) Superficie 2D o 3D que cambia con el tiempo
OBJETO DE TEXTURA FIJA

Area de textura que no cambia con el tiempo
OBJETO DE ANIMACION DE CARA Y CUERPO

Objeto mallado humanoide que puede cambiar con vectores de expresin y postura
Textura: Apariencia de la escena
Mallado: Con estructura de malla, coordinado de forma tal que todas las partes funcionen juntas en armona
Codificacin en MPEG-4 y H.264
Bloques FONDO Objeto 2
Objeto 1 Cuadro compuesto
Originales
Compuestas
Mallado.
10. INTRODUCCION A LA COMPRESION POR WAVELETS
Dominio del tiempo
Dominio de frecuencia
Transformada wavelet Es la utilizada en el estndard JPEG-2000 para imgenes fijas. Se emplea en MPEG-4 para codificacin de textura.
CWTx ( , s ) = x ( , s ) = x(t ) (t )dt

* ,s
,s
1 t = s s
Nivel de descomposicin
Reconstruccin
Introduccin a las wavelets
Electroencefalograma de una persona normal
Electroencefalograma de un paciente con Alzheimer
Wavelet vertical
Wavelet horizontal
Frecuencias H altas Frecuencias V altas
HH
Frecuencias H altas Todas las frecuencias V

Funcin de escala vertical
Frecuencias H altas Frecuencias V bajas
HL
Imagen
Wavelet vertical
Funcin de escala horizontal
Frecuencias H bajas Frecuencias V altas
LH
Frecuencias H bajas Todas las frecuencias V

Funcin de escala vertical
Frecuencias H bajas Frecuencias V bajas
LL
Proceso de de descomposicin de una imagen mediante wavelets Ly Lx 2 Hy 2 LH 2
LL
Ly Hx 2 Hy
HL
HH
Y por qu todo esto de la compresin?
Una seal analgica de TV ocupa un ancho de banda de 4.2 MHz Esa misma seal digitalizada a 4:2:2 genera un flujo binario, sin compresin de 162 Mbit/s. Suponiendo que se empleara modulacin 16 QAM (4 bits/Hz) el ancho de banda requerido sera de 40.5 MHz, lo que hace impensable su transmisin en un canal de 6 MHz. Si de la seal digital se elimina la informacin redundante o irrelevante se puede reducir, por ejemplo a unos 5 Mbit/s. Que con 16 QAM requerira un ancho de banda de 1.25 MHz. Con ello en un canal de RF de 6 MHz cabran 4 seales digitales comprimidas. La compresin permite multiplicar por cuatro (con MPEG-2) el nmero de programas que se pueden transmitir en un canal analgico.
$$$$$$$$$$$$$$$$$$$$$$$$$$$$$$

Primera Sesión

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Primera Sesión

Uploaded by

Copyright:

Available Formats

INTRODUCCION A LA TELEVISION DIGITAL

Constantino Prez Vega

Secuencia de desarrollo de la charla

1. SEAL DIGITAL DE VIDEO Y ESTANDARES DE DIGITALIZACION

El nmero total de muestras por lnea es de 864 en PAL y de 858 en NTSC

inicio de blanking horizontal

Inicio de lnea digital activa

Lnea activa de vdeo digital Muestras de luminancia Muestras de crominancia

SAV (Start of Active Video)

EAV (End of Active Video)

Intervalo de borrado (blanking) horizontal 144 muestras (bytes)

PARA UNA SOLA SEAL DE VDEO

Satlite: Suponiendo transpondedores de 36 MHz :

9 canales de satlite (4:2:2) 6 canales de satlite (4:4:4)

Formato SQCIF QCIF CIF 4CIF 16CIF

704 x 528 4CIF

352 x 264 CIF 176 x132 QCIF

Estas imgenes, en general, se someten a compresin subsecuente

QCIF (176 x 132) Misma imagen ampliada

Muestreo 4:2:2 : Se tiran la mitad de las muestras horizontales (lnea) de crominancia.

4:4:4 4:2:2 4:2:0 Flujo MPEG-2

Flujo de transporte de programa

Audio digital Otros datos

Contexto de la compresin en televisin digital

3. CODIFICACION DE FUENTE: COMPRESION DE VIDEO Aspectos comunes a todos los sistemas

Arquitectura general de un sistema de transmisin digital

Paquetes de transporte MPEG Video analgico de programa CODIFICACION DE CANAL Y MODULACION

Conversin A/D Compresin Otros programas en el mismo canal de RF

Procesos en MPEG que permiten alcanzar elevados niveles de compresin

Transformadas: Propiedades de compactacin de energa de los coeficientes transformados

Transformada del Coseno Discreto (DCT)

7 7 1 (2 x + 1)u (2 y + 1)v F (u , v ) = C (u ) C (v ) f ( x , y ) cos cos 4 16 16 x =0 y =0

para w = 0 para w = 1, 2 ,...,7

1 7 7 (2 x + 1)u (2 y + 1)v f ( x , y ) = C (u ) C (v ) F (u ,v ) cos cos 4 u =0 v =0 16 16

la DCT parte el rea de la imagen en frecuencias discretas en dos dimensiones

Dominio espacial 8x8 pixels

Dominio de la transformada 8x8 coeficientes

Procesado en el Estudio Calidad de contribucin

Cuantificacin perceptual Algoritmos de compresin Seal comprimida

Coeficientes de cuantificacin perceptual de luminancia

Codificacin de recorrido (RLC)

Estructura de un macrobloque MPEG

16 x 16 muestras 8 x 8 muestras c/u

Imagen de referencia Prediccin hacia adelante

Imagen de referencia Prediccin hacia atrs

Reduccin de redundancia temporal

Vdeo digital no comprimido Modelo temporal

Residuo Modelo espacial

Coeficientes Codificador de entropia

Imgenes previas y futuras

El residuo es la resta de la prediccin del codificador y de la seal actual de entrada

bloques de 4 x 4 vectores de pixel

Jerarqua de los datos de video

8x8 Bloque Macrobloque Segmento Cuadro

Grupo de Imgenes (GOP) Secuencia de vdeo

Evolucin de los estndares de compresin

Evolucion de la capacidad de compresin

OBJETO DE TEXTURA FIJA

OBJETO DE ANIMACION DE CARA Y CUERPO

Textura: Apariencia de la escena

Codificacin en MPEG-4 y H.264

Bloques FONDO Objeto 2

Objeto 1 Cuadro compuesto