You are on page 1of 116

2010

Creative Commons Deed


LaSalleOnLine

TELEVISIÓ DIGITAL I
ENGINYERIES

Guia d’estudi
Gabriel Fernàndez i Ubiergo
Creative Commons License Deed
Reconeixement-No comercial-Sense obres derivades 3.0 Espanya

 Vostè és lliure de:

Copiar, distribuir i comunicar públicament l’obra.

 Sota els següents condicionants:

Reconeixement.
S’ha de referenciar aquesta obra a Gabriel Fernàndez i Ubiergo -
Enginyeria La Salle (Semipresencial)

No comercial.
No es pot utilitzar aquesta obra per a finalitats comercials.

Sense obres derivades.


No es pot alterar, transformar o generar una obra derivada a partir
d’aquesta.

Quan reutilitzeu o distribuïu l'obra, heu de deixar ben clar els termes
de la llicència de l'obra.

Alguna d'aquestes condicions pot no aplicar-se si obteniu el permís


del titular dels drets d'autor.

No hi ha res en aquesta llicència que menyscabi o restringeixi els


drets morals de l'autor.

Els drets derivats d'usos legítims o altres limitacions reconegudes


per llei no queden afectats per l'anterior

Això és un resum fàcilment llegible del text legal (la llicència completa) disponible en els
idiomes següents:
Català Castellà Basc Gallec
Crèdits

 Autor: Gabriel Fernàndez i Ubiergo

 Editor: Lluís Vicent

 Coordinació lingüística: Sara Laso

 Revisió lingüística: Núria Mateo

 Maquetació: Víctor Ballesteros

 Disseny de portada: Víctor Ballesteros

Aquesta edició ha comptat amb el suport de l’Agència de Gestió


d’Ajuts Universitaris i de Recerca (AGAUR) de la Generalitat de
Catalunya en la Convocatòria d’ajuts a l’edició i la difusió de llibres
de text o manuals universitaris i llibres cientificotècnics, en suport
paper o en suport electrònic, escrits en llengua catalana (DILL 2010)

ISBN: 978-84-937712-5-6
Índex

SESSIÓ  1:  Introducció  als  sistemes  de  TV  ....................................................................  3  


1.  Introducció  als  sistemes  de  televisió  ......................................................................  3  
1.1.1.  La  televisió  com  a  sistema  de  comunicacions  ...........................................................................  3  
1.1.2.  La  digitalització  de  la  televisió  ...................................................................................................  6  
1.1.3.  Sistemes  de  televisió  analògics  i  digitals  ...................................................................................  7  

SESSIÓ  2:  Percepció  visual  -­‐  1  .....................................................................................  9  


2.  Percepció  visual  .....................................................................................................  9  
2.1.1.  La  llum  .......................................................................................................................................  9  
2.1.2.  Quantitats  radiomètriques  ......................................................................................................  10  
2.1.3.  Quantitats  fotomètriques  .......................................................................................................  12  
2.1.4.  Sensibilitat  a  la  lluentor  del  sistema  visual  humà  ...................................................................  13  

SESSIÓ  3:  Percepció  visual  -­‐  2  ...................................................................................  15  


2.2.1.  L’ull:  retina,  cons  i  bastons  ......................................................................................................  15  
2.2.2.  Fenòmens  visuals  ....................................................................................................................  17  

SESSIÓ  4:  Colorimetria  -­‐  1  ........................................................................................  21  


2.3.1.  Especificació  del  color.  Teoria  triestímul  ................................................................................  21  
2.3.2.  Coeficients  de  luminància  i  crominància  .................................................................................  23  
2.3.3.  Mescla  de  llums  .......................................................................................................................  25  

SESSIÓ  5:  Colorimetria  -­‐  2  ........................................................................................  27  


2.3.4.  Representació  espacial  del  color  .............................................................................................  27  
2.3.5-­‐  Models  de  color  ......................................................................................................................  29  

SESSIÓ  6:  Principis  bàsics  de  la  televisió  ...................................................................  31  


3.  Senyal  de  vídeo  analògic  .....................................................................................  31  
3.1.1.  Paràmetres  bàsics  ...................................................................................................................  31  
3.1.2.  Relació  d’aspecte  ....................................................................................................................  32  
3.1.3.  Nombre  de  línies  per  imatge  ...................................................................................................  32  
3.1.4.  L’entrellaçat  ............................................................................................................................  33  

SESSIÓ  7:  Senyal  de  TV  B/N   .....................................................................................  37  


3.2.1.  Estructura  del  senyal  de  vídeo  ................................................................................................  37  
3.2.2.  Ample  de  banda  teòric  de  senyal  de  TV  ..................................................................................  40  
3.2.3.  Resolució  vertical  i  horitzontal  ................................................................................................  41  

SESSIÓ  8:  Transformada  del  senyal  B/N  ...................................................................  45  


3.2.4.  Transformada  del  senyal  de  TV  ...............................................................................................  45  
3.2.5.  Senyal  d’àudio  .........................................................................................................................  47  

SESSIÓ  9:  Característiques  d’un  sistema  de  TV  color   ................................................  49  
3.3.1.  Fonaments  del  senyal  color  ....................................................................................................  49  

SESSIÓ  10:  El  senyal  de  vídeo  color  ..........................................................................  57  


3.3.2.  Senyal  de  vídeo  color  NTSC  .....................................................................................................  57  

SESSIÓ  11:  El  senyal  color  PAL  ..................................................................................  61  


3.3.3.  Senyal  de  vídeo  color  PAL  .......................................................................................................  62  
3.3.4.  Senyal  de  vídeo  color  SECAM  ..................................................................................................  65  

1
SESSIÓ  12:  Senyal  de  vídeo  digital  ...........................................................................  67  
4.  Senyal  de  vídeo  digital  .........................................................................................  67  
4.1.1.  Digitalització  d’un  senyal  analògic  ..........................................................................................  67  
4.1.2.  Mostratge  ................................................................................................................................  68  
4.2.1.  Introducció  ..............................................................................................................................  69  
4.3.1.  Introducció  ..............................................................................................................................  69  
4.3.2.  Freqüència  de  mostratge  ........................................................................................................  70  
4.3.3.  Quantificació  de  les  components  ............................................................................................  71  
4.3.5.  Mostres  actives  per  imatge  .....................................................................................................  72  
4.3.6.  Patrons  de  mostratge  ..............................................................................................................  73  

SESSIÓ  13:  Interconnexió  de  vídeo  digital  ................................................................  75  


4.4.1.  Interfície  paral·∙lela  ..................................................................................................................  75  
4.4.2.  Interconnexió  de  vídeo  digital  en  components.  Interfície  sèrie  (SDI)  .....................................  76  

SESSIÓ  14:  Fonaments  de  compressió  ......................................................................  79  


5.  Compressió  de  vídeo  ............................................................................................  79  
5.1.1.  Necessitat  de  la  compressió  ....................................................................................................  79  
5.2.1.  Mètodes  estadístics  ................................................................................................................  81  
5.2.2.  Mètodes  predictius  .................................................................................................................  83  

SESSIÓ  15:  Mètodes  de  compressió  transformats  .....................................................  87  


5.2.3.  Mètodes  transformats  ............................................................................................................  87  
5.3.1.  Estàndard  H.261  ......................................................................................................................  89  

SESSIÓ  16:  Introducció  al  MPEG  ...............................................................................  91  


5.3.2.  Estàndard  MPEG-­‐1  ..................................................................................................................  91  
5.3.3.  Estàndard  MPEG2  ...................................................................................................................  93  
5.4.4.  MPEG4  Part-­‐10/H.264  .............................................................................................................  97  

Bibliografia  .............................................................................................................  99  


Glossari  .................................................................................................................  101  

2
SESSIÓ 1: Introducció als sistemes de
TV
FITXA DE LA SESSIÓ
v Nom: Introducció als sistemes de TV
v Tipus: teòrica
v Format: no presencial
v Durada: 2 hores
v Dedicació: 2 hores
v Treball a lliurar: no
v Material:
o Bibliografia bàsica:
§ [Fernàndez2001]
§ [Torres1993]

PRECEDENTS
Per estudiar aquesta assignatura cal que l’alumne tingui uns coneixements bàsics de
comunicacions i electrònica.

OBJECTIUS
L’objectiu d’aquesta sessió és introduir a l’alumne els paràmetres i tecnologies que
intervenen en un sistema de televisió de principi a fi.

CONTINGUTS

1. Introducció als sistemes de televisió

1.1. Els sistemes de televisió

1.1.1. La televisió com a sistema de comunicacions


En la Figura 1. La televisió com a sistema de comunicacions podeu observar un
diagrama on es presenta una cadena genèrica de transmissió de televisió, des de la
càmera fins al televisor. Aquest sistema és vàlid també per a altres sistemes de
comunicacions, tant analògics com digitals. En aquesta sessió l’objectiu principal és el
d’avaluar cadascun dels elements d’aquest sistema de comunicacions, explicant
breument el seu funcionament.

3
Figura 1. La televisió com a sistema de comunicacions

El transductor d’entrada
El transductor d’entrada té per objectiu transformar el senyal òptic i acústic en elèctric,
per tal que pugui ser tractat i transmès a través d’un canal. L’exemple més evident de
transductor d’entrada és la càmera on, generalment, mitjançant sensors CCD (Charge
Coupled Device) converteix l’energia dels fotons incidents en una acumulació de
càrrega d’electrons per a cada punt de la imatge. Més tard, aquesta càrrega
acumulada es converteix en un senyal elèctric que descriu la imatge formada en el
sensor línia a línia. Segons el tipus de càmera podem trobar un únic sensor CCD
(càmeres domèstiques) o bé de 3 CCD (càmeres professionals) on cada sensor capta
el senyal d’un color diferent (vermell, verd i blau).

Altres transductors d’entrada són el micròfon per l’àudio, o bé els capçals reproductors
de magnetoscopis de vídeo o làsers lectors de CDROM o DVD si la informació ha
estat prèviament enregistrada en un d’aquests formats.

A més de captar el senyal, el transductor d’entrada ha d’amplificar-lo i adaptar-lo per a


la següent etapa.

El transmissor
El següent mòdul en la cadena de comunicacions és el transmissor que efectua
l’adaptació del senyal al canal pel qual el senyals es propagarà. Per això requereix un
senyal suplementari que li faci d’ona portadora de la informació. Aquest procés és
conegut com modulació i com a resultat el senyal és desplaçat a freqüències superiors
dins del canal que té reservat per a la seva transmissió. Els mètodes de modulació són
diferents segons la forma en què es modula la portadora:

Tipus de modulacions analògiques: el missatge que cal transmetre és una funció


continua en el temps.

Modulacions lineals: són aquelles modulacions que modifiquen l’amplitud del senyal
portador.
- AM: modulació en amplitud (ràdio).
- BLU: banda lateral única (ràdio).
- DBL: doble banda lateral (per a la crominància en TV color).

4
- BLV: banda lateral vestigial (TV analògica).

Modulacions no lineals:
- FM: modulació en freqüència (ràdio, TV satèl·lit).
- PM: modulació en fase.

Modulacions digitals: el missatge que cal transmetre és un seguit de polsos


d’amplituds discretes.
- ASK (Amplitude Shift Keying) / QAM (Quadrature Amplitud Modulation) (TV
digital cable).
- FSK : Frequency Shift Keying.
- PSK : Phase Shift Keying.
- QPSK: Quaternary Phase Shift Keying (TV digital satèl·lit).
- DPSK: Differential Phase Shift Keying (NICAM i modulació àudio en estèreo).

Totes les modulacions mostrades fins ara són uniportadores. Es poden utilitzar també
modulacions multiportadora on, com el seu nom indica, utilitzen un gran nombre de
portadores simultànies per modular diferents símbols d’un mateix senyal. És el cas de
la Orthogonal Frequency Division Multiplexing (OFDM) utilitzada en la televisió digital
terrestre.

Canal de transmissió
És el medi físic pel qual es transmet la informació. Pot ser de dos tipus: guiat o via
“aèria”:

De canals guiats n’hi ha de diversos tipus: el cable coaxial, la fibra òptica, les xarxes
híbrides coaxial i òptiques (HFC) i el cable bifil·lar de coure.

De canals no guiats en trobem de diferents tipus segons les bandes radioelèctriques


utilitzades:

- Banda VHF: Banda I, II, III; 30 a 300 MHz. Aquesta banda és utilitzada per
transmissió de TV (canals de 7 MHz) i FM de ràdio.
- Banda UHF: Banda IV, V; 300 MHz a 3 Ghz. Utilitzada per transmissió de
senyal de TV (canals de 8 MHz), radar i ràdio enllaços.
- Banda SHF: 3 Ghz a 30 Ghz. Utilitzada per transmissió de senyal per satèl·lit
(banda C: 4-6 GHz, Ku12-14 GHz).

Tots els canals de transmissió introdueixen un seguit d’atacs al senyal, en major o


menor mesura. Aquests atacs es poden agrupar en: soroll, interferència i distorsió.

Soroll: són els diferents senyals elèctrics aleatoris de caràcter natural que contaminen
el senyal que transmetem. El soroll afecta de forma diferent a un senyal de TV
analògic que digital. Per exemple, en TV analògica, en utilitzar una modulació lineal on
el soroll afecta directament al missatge (amplitud del senyal), les imatges es veuen
amb neu; en una transmissió de TV digital, el soroll induirà alguns bits erronis que
podran ser recuperats en alguns casos i en altres faran aparèixer blocs amb informació
errònia a la pantalla; altrament la imatge serà perfecta.

Interferència: contaminació causada per altres senyals creats per l’home (màquines,
altres emissions de TV, etc.) que per la seva similitud al nostre senyal a transmetre fa

5
que el senyal rebut es vegi modificat. Per exemple, un canal de TV que interfereix un
altre pel fet d’estar en canals adjacents. Un cas especial d’interferència és la multicamí
o multitrajectòria, produïda pel fet que el senyal rebut en una antena (especialment
terrestre) és la suma dels mateixos senyals que han recorregut diverses trajectòries (a
causa de rebots en edificis o altres elements). Aquest fenomen és especialment greu
en el cas de la recepció terrestre.

Distorsió: deformació que pateix la forma d’ona del senyal a causa de les diferents
atenuacions que efectua el canal a diferents freqüències.

Cada canal de transmissió té unes característiques diferents que fan que la modulació
que cal dur a terme prèviament hagi d’estar adaptada a aquestes característiques. Per
exemple, el medis guiats per cable no pateixen de gaire soroll i disposen de la
possibilitat de reamplificar el senyal, amb la qual cosa una modulació en amplitud com
al QAM és perfectament vàlida. En canvi, en el medi satèl·lit, cal una modulació més
robusta, com la QPSK que modula la informació amb quatre possible fases, a canvi de
reduir l’eficiència espectral (ample de banda més gran), la qual cosa no resulta un
problema en les transmissions satèl·lit a bandes de GHz. Finalment, en la transmissió
terrestre tenim problemes de relativa baixa potència i ample de banda i interferència
multicamí, amb la qual cosa cal aplicar una modulació robusta i eficient a la vegada,
com la OFDM.

El receptor
Adapta el senyal rebut pel canal a senyal elèctric. El seu funcionament dependrà de la
transmissió i canal utilitzats. Bàsicament ha de fer tres funcions:

- Seleccionar el canal.
- Amplificar.
- Desmodular.

Transductor de sortida
Transforma el senyal elèctric en imatges que pugui rebre l’usuari. Es tracta del monitor
de televisió amb tecnologies de tub de raigs catòdics (TRC), projectors o pantalles
planes de plasma o LCD. En el cas de l’àudio es tracta de l’altaveu.

1.1.2. La digitalització de la televisió


La tendència dels darrers anys ha estat la d’anar digitalitzant els cinc blocs del sistema
de la televisió. Els motius principals pels quals es prefereixi treballar amb senyals
digitals són:

- Possibilitat de corregir errors: pot incorporar sistemes basats en algorismes


matemàtics per recuperar possibles errors causats durant la transmissió.
- Facilitat per processar el vídeo digital. Possibilitat de replicar la informació de
forma idèntica.

6
- Possibilitat de la compressió del vídeo digital: sistema que redueix el volum
d’informació digital (reducció d’informació binària), fent així una reducció de
l’ample de banda que retransmetem.
- Factor econòmic: circuits barats, potents i de grans prestacions.
- Control per software: els programes utilitzats es poden actualitzar amb més
facilitat.
- Oferiment de serveis afegits: ofereix serveis com la possibilitat d’enviar dades,
interactivitat, encriptació de serveis, etc.

En contrapartida, la digitalització provoca l’error de quantificació: quan discretitzem un


senyal realitzem la quantificació que produeix el denominat error de quantificació.
Aquest tipus d’error és acumulatiu i irreversible.

1.1.3. Sistemes de televisió analògics i digitals


A la Figura 2. Classificació dels diversos sistemes de TV analògics i digitalspodem
veure un quadre-resum dels diferents sistemes de televisió analògica i digital existents.
D’esquerra a dreta, els diferents sistemes augmenten en prestacions, des de televisió
de definició estàndard (SDTV) com el NTSC, PAL o SECAM, passant pels IDTV
(Improved Definition Television) que incorporen millores en la recepció i els EDTV
(Extended Definition Television) com el sistemes MAC o PAL Plus fins els sistemes
d’alta definició analògics (HDTV) Muse i HD-MAC. Aquest fou d’alguna forma l’evolució
de la televisió fins a principis de la dècada dels 90. A partir d’aleshores, començaren a
instaurar-se els sistemes de televisió digital que, entre d’altres avantatges, permeten
que el mateix sistema pugui abarcar totes les qualitats, des de la definició estàndard a
l’alta definició. El sistema europeu DVB i americà ATSC són els més importants en
aquest àmbit, sense menysprear el japonès ISDB. Tots ells són incompatibles però
tenen elements comuns, com el fet que es basen en la codificació MPEG com a base
per a la compressió del senyal.

7
Figura 2. Classificació dels diversos sistemes de TV analògics i digitals

8
SESSIÓ 2: Percepció visual - 1
FITXA DE LA SESSIÓ
v Nom: Percepció visual - 1
v Tipus: teòrica
v Format: no presencial
v Durada: 2 hores
v Dedicació: 2 hores
v Treball a lliurar: no
v Material:
o Bibliografia bàsica:
§ [Fernàndez2001]
§ [Torres1993]

PRECEDENTS
En la sessió anterior hem introduït els conceptes generals de la televisió com a
sistema de telecomunicacions complert.

OBJECTIUS
L’objectiu d’aquesta sessió és introduir els conceptes vinculats a la llum i la percepció
que els sistema visual humà en té d’aquesta. La formació d’una imatge consisteix,
bàsicament, a detectar la llum procedent de cada punt de la imatge. És cabdal, doncs,
conèixer els fonaments físics de la llum i com el sistema visual la percep, per tal de
convertir-la, d’alguna forma, en senyal elèctric que es pugui transmetre a distància.

CONTINGUTS

2. Percepció visual

2.1. Paràmetres d’una llum

2.1.1. La llum
La llum és una radiació electromagnètica que estimula la nostra resposta visual.
Aquesta radiació ocupa una zona de l’espectre electromagnètic molt estreta que va
d’uns 400 nm a 780 nm. Els diferents colors que podem percebre estan vinculats a les
diferents longituds d’ona incloses en aquesta regió, començant pel violeta, passant pel
blau, cyan, verd, groc i taronja fins arribar al vermell. Vegeu la Figura 3. Espectre
visible de la llum

9
Figura 3. Espectre visible de la llum

D’una llum en distingirem dos tipus de quantitats: aquelles que estan referides a
quantitats físiques de la llum, que es poden mesurar quantitativament (quantitats
radiomètriques), i les quantitats referides a la sensació subjectiva perceptual que en
tenim de la llum, que difícilment podrem mesurar i que dependran de l’individu
(quantitats fotomètriques).

2.1.2. Quantitats radiomètriques


Les quantitats radiomètriques estan vinculades a paràmetres físics de la llum. A
continuació se’n descriuen les més importants.

Distribució energètica de la llum


Com tota radiació, la llum està caracteritzada per una distribució energètica C(x, y, t, λ)
on x i y són les variables espacials del pla que travessa la llum, t és la variable
temporal i λ és la longitud d’ona. Aquesta funció rep el nom d’irradiància per longitud
d’ona i es mesura en watts/m3.

En general, ens fixarem només en la variació de la distribució d’energia en la longitud


d’ona, simplificant l’expressió a C(λ). Cada llum té una distribució C(λ) d’energia
diferent. A la Figura 4. Diverses distribucions d’energia de llums on (b) i (c) són llums
monocromàtica i blanca, respectivament. podeu veure alguns exemples de
distribucions d’energia d’algunes llums.

10
Figura 4. Diverses distribucions d’energia de llums on (b) i (c) són llums monocromàtica
i blanca, respectivament.

Distingirem dos casos extrems de distribucions:

Llum monocromàtica: quan una llum té únicament energia en una sola longitud d’ona,
és a dir, la seva distribució d’energia és una delta a una longitud d’ona concreta.
Aleshores direm que es tracta d’una llum monocromàtica.

Llum blanca: contràriament a la llum monocromàtica, quan una llum té igualtat


d’energia a totes les longituds d’ona visibles, aleshores tindrem la llum blanca.

En general, la majoria de llums seran un cas intermedi entre aquests dos casos
extrems i es caracteritzaran per tenir una distribució on hi haurà una longitud d’ona
principal (longitud d’ona dominant), on s’acumularà la major part de l’energia amb certa
amplada de banda.

§ [Fernàndez2001] p. 7-9

§ [Torres1993] p. 15-17

Irradiància i energia total


Altres quantitats radiomètriques són la irradiància i l’energia total. La irradiància
consisteix a integrar la funció de distribució per totes les longituds d’ona i es mesura en
watts/m2.

Irrandiancia = ∫ C ( x, y, λ, t )dλ

L’energia total la podem obtenir de fer tota la integral en x, y, t i λ de la distribució


d’energia. Es mesura en Joules.

Energia total = ∫ C( x, y, λ, t )dxdydλdt

§ [Fernàndez2001] p. 9

§ [Torres1993] p. 16

11
2.1.3. Quantitats fotomètriques
Ens referim com quantitats fotomètriques a aquelles que tenen en compte la percepció
que tenim de la llum a través del sistema visual humà. Es tracta, per tant, de quantitats
no mesurables quantitativament, ja que depenen del individu. Malgrat tot, es poden fer
estimacions d’aquests valors i establir una relació bastant directa entre les quantitats
fotomètriques i les radiomètriques mencionades anteriorment.

Lluentor
La lluentor és la sensació que tenim d’intensitat d’una llum. De forma planera podríem
dir que és la informació que veuríem d’una llum en un monitor de TV en blanc i negre.
Podem tenir dues llums de diferent color, però que en lluentor siguin iguals. La lluentor,
com a paràmetre subjectiu que és, depèn de les condicions de l’observador, estat
d’ànim, il·luminació de l’escena, etc.

La lluentor té una relació directa amb l’energia de la llum, tot i que, com ja hem dit, no
es tracta de la mateixa cosa. La primera és una quantitat subjectiva (fotomètrica) i la
segona és objectiva (radiomètrica).

Matís
El matís és la sensació que ens permet identificar un color; el que ens permet distingir
una llum d’un to blavós d’una de verdós. Ho podríem definir com la percepció que
tenim del color d’una llum.

El matís d’una llum està molt relacionat amb el valor radiomètric de la longitud d’ona
dominant de la distribució.

Saturació
Finalment, el tercer paràmetre fotomètric és la saturació que ens descriu la sensació
que tenim de la vivor d’un color. Un color poc saturat el veurem pàl·lid i tindrà molta
quantitat de llum blanca (el blau cel). En canvi, un color molt saturat és un color molt
viu, sense gens de llum blanca (el blau marí). Fixeu-vos que podem tenir una llum amb
el mateix matís (el blau) però amb diferent saturació (blau cel o blau marí). Tampoc cal
confondre la saturació amb la lluentor, ja que podem tenir un blau marí molt poc lluent i
un blau cel molt lluent.

La saturació està molt lligada amb l’ample de banda de la distribució d’energia. Quan
més petit sigui l’ample de banda, més tendirem a tenir una llum monocromàtica que té
màxima saturació. A l’inrevés, quan menor sigui la saturació, més tendirem a tenir una
llum blanca que és la de mínima saturació i ample de banda infinit.

12
2.1.4. Sensibilitat a la lluentor del sistema visual
humà
Ja s’ha mencionat en l’apartat anterior que el sistema visual humà percep una lluentor
que està relacionada amb l’energia de la llum, però que aquesta relació no és directa,
ja que hi ha la subjectivitat i la resposta del sistema visual humà que entren en joc. En
aquest apartat veurem l’intent que s’ha efectuat per tal de normalitzar aquesta
sensibilitat a la lluentor que tenim els humans.

Adaptació en lluentor
Anomenem adaptació en lluentor al fet de visualitzar dues distribucions diferents, però
que des del punt de vista del sistema visual humà es percebin amb igual lluentor.

Corba de sensibilitat, V(λ)


La corba de sensibilitat de l’ull humà, també anomenada d’eficiència lluminosa relativa
V(λ), ens indica la sensibilitat a la lluentor que tenim de mitjana els humans a
cadascuna de les longituds d’ona. Per calcular la corba es feren diferents tests, on uns
observadors havien de comparar la llum monocromàtica de test (λt) amb una altra de
referència (λr) i modificar-les per tal d’obtenir l’adaptació en lluentor. Es calcula,
aleshores, la relació C(λr)/C(λt) i s’obté el punt de la corba per λt. Repetint el test per
diferents llums de test s’obté la corba de sensibilitat, Figura 5. Corba de sensibilitat de
l’ull humà

Figura 5. Corba de sensibilitat de l’ull humà

La corba de sensibilitat es normalitza al seu màxim que resulta ser a λr = 555 nm.
Observem, doncs, que el sistema visual humà es comporta a nivell de longituds d’ona

13
com un filtre passa-bandes, on a les freqüències al voltant de 555 nm (groc) tenim
màxima sensibilitat i als extrems de l’espectre (vermell i violeta) en tenim mínima.

§ [Torres1993] p. 17-18

Luminància
Una vegada tenim una modelització de la sensibilitat que tenim a la lluentor ja podem
fer una estimació de la lluentor que percebem per a qualsevol distribució C(λ). La
luminància és, doncs, aquesta aproximació matemàtica que es fa de la sensació de
lluentor que tenim els humans. Aquesta luminància no deixa de ser una aproximació a
la lluentor ja que, com hem dit abans, la lluentor és un paràmetre subjectiu que depèn
de molts altres paràmetres.

La luminància (Y) es calcula com la integral per tot l’espectre visible del producte V(l)
per C(l) multiplicat per una constant. La luminància es mesura en lumens/m2 on k pren
el valor de 680.

Y = k ∫ C (λ )V (λ )dλ

Aquest paràmetre de luminància serà de molt important posteriorment, ja que serà el


senyal que utilitzarem per transmetre la informació en B/N d’una imatge.

§ [Torres1993] p. 18-19

§ [Fernàndez2001] p. 10-11

RESUM
En aquesta sessió hem vist els paràmetres radiomètrics (físics) i els paràmetres
fotomètrics (perceptuals) de la llum. Aquest conceptes, especialment els fotomètrics,
juntament amb la luminància seran molt importants per la resta del curs.

14
SESSIÓ 3: Percepció visual - 2
FITXA DE LA SESSIÓ
v Nom: Percepció visual - 2
v Tipus: teòrica
v Format: no presencial
v Durada: 2 hores
v Dedicació: 2 hores
v Treball a lliurar: no
v Material:
o Bibliografia bàsica:
§ [Fernàndez2001]
§ [Torres1993]

PRECEDENTS
En la sessió anterior hem vist els paràmetres principals que determinen una llum. Hem
classificat aquests paràmetres en radiomètrics (físics) i fotomètrics (perceptuals). Dels
perceptuals, els més importants són la lluentor, matís i saturació. També hem calculat
la luminància com una aproximació matemàtica a la sensació de lluentor.

OBJECTIUS
En la present sessió veurem amb detall el sistema visual humà, el seu funcionament i
la percepció que tenim de certes coses que fan que realment puguem adonar-nos de
les nostres limitacions visuals; característiques que són fonamentals per definir un
sistema de televisió.

CONTINGUTS
Bàsicament, en aquesta sessió analitzarem la fisiologia i funcionament del sistema
visual humà (SVH). L’estudi del SVH ens determinarà més endavant la definició del
sistema de televisió.

2.2. Sistema visual humà

2.2.1. L’ull: retina, cons i bastons


El sistema visual humà és un dels sistemes més complexes que existeixen a la natura.
Consisteix en dos nivells ben diferenciats:

1. El nivell perifèric: que transforma la llum en senyals neuronals; l’element


principal és l’ull.

15
2. El nivell central: que processa els senyals neuronals i els converteix en
“informació visual”. Això succeeix en la part posterior del cervell anomenada
còrtex.

El nervi òptic té la funció de transportar els senyals neuronals entre una part i l’altra.
Mentre que el funcionament del nivell perifèric és bastant conegut, el del nivell central
és encara una incògnita.

§ [Torres1993] p. 35

Fisiologia de l’ull
Atés que les sensacions de color i lluminositat són percebudes pel cervell per mitjà de
l’ull, és interessant descriure aquest últim amb un cert detall. La part anterior de l’ull
està constituïda per un cos transparent anomenat còrnia. La llum circularà a través
d’ella, penetrant fins una lent convergent anomenada cristal·lí. Entre la còrnia i el
cristal·lí es troba la pupil·la de l’iris, una espècie de diafragma fotogràfic que es s’obre
o es tanca, en una certa mesura, d’acord amb la intensitat lluminosa incident.

L’interior del globus ocular està constituït per una massa gelatinosa coneguda com
humor vitri , mentre que la pròpia paret interna disposa d’una pel·lícula sensible a les
radiacions visibles i que rep el nom de retina. Per últim, el nervi òptic, connectat amb el
cervell, transmet a aquest les impressions que han estat recollides per la retina. La
imatge exterior és enfocada sobre la retina gràcies al cristal·lí que, deformant-se sota
l’acció d’uns certs músculs, adapta l’enfoc abans esmentat per a compensar les
diferents profunditats de la visió. Podeu veure un esquema de les parts de l’ull a
[Fernàndez2001], pàgina 13.

§ [Fernàndez2001] p. 13

§ [Torres1993] p. 35-36

La retina
La retina conté les cèl·lules sensibles a la llum i que converteixen l’energia lluminosa
en senyals neuronals. Es coneixen dos tipus de cèl·lules sensibles a la llum que es
diferencien per la forma: els cons i els bastons. En un punt de la retina hi surt el nervi
òptic que va cap al cervell. En aquest punt no hi ha cèl·lules de cap tipus i, per tant, és
un punt de ceguesa.

Les cèl·lules tipus bastó són uns 100 milions i estan situades més o menys
uniformement en tota la retina, excepte a la part central anomenada fóvea. Són molt
sensibles a la intensitat de la llum, però no són capaces de distingir els colors.
Podríem dir que són les responsables de la visió en blanc i negre. La seva connexió al
nervi òptic es produeix amb grups de moltes cèl·lules a una mateixa fibra, comportant
poca capacitat de definició espacial.

Les cèl·lules con, en canvi, són les responsables de la visió en color i no de la


intensitat. Són uns 6 milions i es centren bàsicament a la fóvea. La connexió al nervi

16
òptic és molt més directa i, per tant, es dota de major definició espacial. Es coneixen
tres conjunts de cèl·lules tipus con segons la sensibilitat a diferent longituds d’ona.
Simplificant, es pot dir que hi ha les cèl·lules con sensibles al vermell, al verd i al blau.

La distribució de cons i bastons es pot observar a la Figura 6. Distribució de bastins i


cons a la retina. Observeu el punt de ceguesa al voltant dels 20 º.

Figura 6. Distribució de bastins i cons a la retina

De tot això se’n desprèn alguns efectes que podem observar sense gaire dificultat,
com el fet que en condicions de poca il·luminació hi vegem sense color ni definició, ja
que, aleshores, només treballen els bastons. També podem observar que la visió de
detall que ens aporten els cons només la tenim en la part central de la retina, ja que és
allà on es situen els cons.

Finalment, cal afegir que l’ull humà és més sensible a les variacions produïdes a nivell
de lluentor, és a dir, informació blanc i negre, que a les variacions de color. Això ens
obligarà més endavant a millor “tractar” el senyal referent a la lluentor que els senyals
referents al color.

§ [Fernàndez2001] p. 114-15

§ [Torres1993] p. 36-37

2.2.2. Fenòmens visuals


En l’apartat anterior hem estudiat el funcionament de l’ull humà a nivell fisiològic que
explica, aproximadament, com veiem les coses. Tot i així, hi ha un munt de fenòmens
visuals, alguns dels quals resten inexplicables, i que ens ajuden a acabar de veure el
funcionament del sistema visual humà.

17
Adaptació en lluentor
L'ull es capaç de diferenciar 1010 nivells diferents de lluentor, però de forma simultània
només en pot captar uns 50. L’ull adapta el nivell mínim (negre) i el màxim (blanc) en
funció de les condicions d’il·luminació de la sala. Aquest procés d’adaptació no és
immediat i explica el fet que inicialment ens costi veure-hi dins d’una habitació poc
il·luminada i que més tard, en adaptar-se els marges de visió, comencem a veure
millor.

El fet que només puguem diferenciar 50 nivell de lluentor simultanis ens indica també
la precisió en què podrem quantificar el senyal de luminància en un sistema digital.
Podem assegurar que si quantifiquem a 128 nivells o 256 (7 o 8 bits) per a l‘ull humà,
aquella luminància serà com una funció continua sense discretització.

§ [Torres1993] p. 38-40

§ [Fernàndez2001] p. 17

Les bandes de Mach


Un altre efecte important referent al canvi en la lluentor percebuda en una escena és
l’efecte de les bandes de Mach. Aquest efecte visual consisteix a mirar unes barres
verticals de luminàncies creixents. Malgrat que la luminància dins de cada barra és
constant, dóna la sensació de que les barres tenen una certa degradació de la
luminància als laterals. La part esquerra de cada barra, per comparació amb la barra
del costat esquerra més fosca, apareix més lluenta i la part dreta, més fosca. Aquest
efecte fa pensar que l’ull humà realitza com un filtrat espacial on la informació que
recollim de cada punt de la imatge depèn també dels punts veïns; de forma anàloga
que quan s’aplica a un senyal un filtre amb grans discontinuïtats, es produeixen
fenòmens de sobreoscilació. Aquest fenomen es pot veure a la Figura 7. Bandes de
Mach

Figura 7. Bandes de Mach

§ [Torres1993] p. 40-41

§ [Fernàndez2001] p. 18

18
Emmascarament visual
Per emmascarament visual entenem la reducció d’un estímul visual enfront de canvis
temporals i espacials. És a dir, tenim menor capacitat de percepció visual quan es
produeixen canvis a la imatge. Existeixen dos tipus d’emmascarament visual: el
temporal i l’espacial.

Emmascarament temporal: en presència de moviments bruscs en la imatge o en


l’objecte representat, o en presència de canvis de pla, tenim menor capacitat de
discernir els detalls de la imatge. Per exemple, a un atleta no li podem discernir els
detalls de la roba quan està corrent ràpidament davant una càmera.

Emmascarament temporal: en presència de canvis en el domini espacial de la imatge


(un contorn d’un objecte) tenim menor percepció. Això es pot observar, per exemple,
en una imatge contaminada per soroll uniforme. Allà on hi hagi els contorns de
l’objecte representat (discontinuïtats espacials de la imatge) ens semblarà que hi ha
menys sorolls. Això és degut a que la discontinuïtat del contorn ens emmascara el
soroll i ens fa semblar que no n’hi hagi tant.

§ [Torres1993] p. 42-43

Freqüència crítica de flícker


Suposem que disposem d’un focus d’intensitat intermitent i variem la seva cadència
d’intermitència. En anar augmentant la freqüència arriba un moment que veurem que
la llum és contínua. Això és degut a que en la retina hi ha una certa persistència visual,
on l’impacte lluminós roman durant un cert temps. La freqüència, a partir de la qual
això es produeix, és la freqüència crítica de flícker (Fcf). Per freqüències inferiors a la
Fcf es produeix el flícker, un fenomen de pampallugueig molt ràpid i molest.

No hi ha una única Fcf, ja que el seu valor depèn de diferents factors com la
il·luminació, mida de l’objecte, condicions de visió, etc. Per exemple, si la luminància
de l’objecte és molt gran la Fcf augmenta, com també ho fa si l’objecte il·luminat té una
gran superfície.

En general podem dir que la Fcf està al voltant de 40 Hz, és a dir, que cal mostrar més
de 40 imatges per segon en una pantalla per tenir un impressió de llum continua. Com
hem dit, aquesta freqüència varia davant certs factors. A la figura 1.3.7 a [Torres1993]
es veu com augmenta la Fcf en funció de la intensitat lluminosa de la llum.

§ [Torres1993] p. 43-44

Sensació de moviment
Definim sensació de moviment el fet que la visualització seqüencial d’imatges ens
produeixi la sensació que els objectes de l’escena estan descrivint moviments reals.
S’ha pogut comprovar que aquesta il·lusió visual es produeix a partir de 15 imatges per
segon.

19
Com s’ha vist anteriorment, per evitar el flícker hem de procurar tenir, més o menys, 40
imatges per segon; i per crear sensació de moviment hem de tenir més de 15 imatges
per segon. Per tant, en definir un sistema de televisió caldria que treballés a més de 40
imatges per segon, que assegura complir els dos criteris. En el sistema de TV europeu
es fa servir una cadència de 25 imatges per segon, mentre que als Estats Units
d’Amèrica utilitzen una cadència de 30 imatges per segon. Com es pot comprovar,
aquestes freqüències no compleixen el criteri mencionat anteriorment. Això és possible
gràcies a que cada imatge es desglossa en dos camps: un camp conté les línies parell
i l’altre camp, les línies senars. Aquests camps es mostren alternativament obtenint,
aleshores, 25 imatges per segon * 2 camps/imatge = 50 camps/segon, és a dir, una
freqüència d’impactes lluminosos superior a la freqüència crítica de flícker i un nombre
d’imatges per segon superior a 15.

Al cinema es treballa a 24 fotogrames per segon, i el que es fa és il·luminar cada


fotograma dos cops, obtenint 24 fotogrames per segon * 2 il·luminacions/fotograma =
48 il·luminacions/segon i, per tant, una visualització lliure de flícker.

§ [Torres1993] p. 43-44

RESUM
En aquesta sessió hem repassat el funcionament del sistema visual humà, tant
fisiològicament com a nivell dels fenòmens visuals. Aquesta introducció ens permet
entendre la forma com funciona el nostre sistema de visió i ens permetrà, més
endavant, definir els sistemes de televisió.

20
SESSIÓ 4: Colorimetria - 1
FITXA DE LA SESSIÓ
v Nom: Colorimetria - 1
v Tipus: teòrica
v Format: no presencial
v Durada: 2 hores
v Dedicació: 2 hores
v Treball a lliurar: no
v Material:
o Bibliografia bàsica:
§ [Fernàndez2001]
§ [Torres1993]

PRECEDENTS
En les sessions anteriors hem estudiat el sistema visual humà. Les seves
característiques fonamentals i limitacions que ens ajudaran a definir els sistemes de
televisió.

OBJECTIUS
L’objectiu de la present sessió és introduir els conceptes relacionats amb el color d’una
llum, com podrem reproduir una llum a partir de la combinació d’unes llums primàries.

CONTINGUTS

2.3. Especificació del color. Colorimetria

2.3.1. Especificació del color. Teoria triestímul


Ja hem comentat en la sessió anterior, dedicada a l’estudi de la llum, que la informació
de color d’una llum venia determinada pel seu matís i la seva saturació. Aquesta
informació de matís i saturació de la llum l’anomenem crominància de la llum, en
contraposició a la luminància, que ens mesura la lluentor (informació en blanc i negre).

Fent un repàs ràpid podem dir que tota llum té una distribució espectral determinada
(C(λ)) amb una amplada de banda que podem associar a la saturació de la llum
(quantitat de llum blanca) i una longitud d’ona dominant que associem al matís. Vàrem
parlar de llums monocromàtiques quan la distribució era una delta (energia acumulada
en una sola longitud d’ona), però generalment les llums no són monocromàtiques sinó
que responen a una distribució, més o menys “gaussiana”, amb una longitud d’ona
dominant (valor mig) i una certa saturació (variància). Vist d’aquesta forma, qualsevol
color es podria aconseguir mitjançant la mescla de la llum monocromàtica
corresponent (saturat al 100 %) i una certa quantitat de llum blanca.

21
Una propietat interessant de l’ull és que distribucions espectrals diferents poden
produir-nos la mateixa sensació visual. En aquest cas direm que aquestes
distribucions són metàmers.

Teoria triestímul
La teoria triestimul estableix que un color es pot reproduir a partir de la mescla de les
quantitats adequades de tres primaris. Com hem vist en la sessió anterior existeixen
tres tipus de cèl·lules con: un tipus és sensible a les radiacions vermelles, un altre a
les blaves i uns tercers a les verdes. D’aquesta manera, l’ull pot percebre d’altres
colors diferents als tres fonamentals. Per exemple, el groc es rep com a tal si s’exciten
simultàniament, i a la proporció adequada, els cons sensibles al vermell i al verd. En la
figura 1.2.1 a [Torres93] o bé a la pàgina 28 de [Fernàndez2001] podeu trobar les
corbes de sensibilitat de cada tipus de cèl·lula con.

D’alguna forma l’ull humà treballaria com un banc de filtres on la distribució espectral
d’una determinada llum (C(λ)) es filtrada per cada tipus de cel·lular resultant tres
quantitats que mesuren la quantitat de vermell, verd i blau de la distribució en qüestió.

§ [Torres93] p. 19-21

§ [Fernàndez2001] p. 27-29

Reproducció del color


És possible reproduir o adaptar un color com a mescla de tres llums primàries. Per a
tal fet, la Comissió Internacional de la Il·luminació (CIE) va escollir tres colors primaris
amb l’objectiu de fixar una normativa universal que permetés reproduir tots els colors
espectrals. Aquests primaris anomenats R, G i B, es van escollir de manera que cap
d’ells no pogués ser obtingut per barreja d’altres colors, resultant les longituds d’ona
següents:

- R: vermell de 700 nm.


- G: verd de 546,1 nm.
- B: blau de 435,8 nm.

Més tard, quan es desenvolupà la televisió en color, la adaptació del colors s’havia de
fer a partir dels fòsfors disponibles per a tubs de raig catòdics que emetien a longituds
d’ona diferents de les establertes pel CIE. En la pantalla del televisor, cada píxel es
composa de tres punts de fòsfor (R, G i B); el que veiem és la integració dels tres. Això
va obligar a utilitzar uns nous primaris per l’ús de la televisió en color. Les seves
longituds d’ona són les següents:

- R: Vermell de 610 nm.


- G: Verd de 537 nm.
- B: Blau de 472 nm.

Una vegada disposem dels primaris, ja podem passar a la part de la reproducció del
color que s’efectua mitjançant l’experiment del colorímetre.

22
El colorímetre és l’aparell per aconseguir llums monocromàtiques a partir dels tres
colors primaris. El seu funcionament consisteix en ajustar les intensitats de les tres
llums primàries fins aconseguir un efecte igual a la llum monocromàtica desitjada amb
una energia radiant d’1 W. Les tres quantitats necessàries de cada primari R, G i B
reben el nom de valor tricromàtics. A la figura de la pàgina 33 de [Fernàndez2001] es
pot observar la configuració del colorímetre, i a la Figura 8. Corbes tricromàtiques per
a cada primari les corbes que obtenim, on per cada llum monocromàtica adaptada
s’indica la quantitat necessària de cada primari.

Figura 8. Corbes tricromàtiques per a cada primari

Com podeu observar hi ha llums que precisen de quantitats negatives de certs


primaris, això vol dir que aquella llum no es pot adaptar amb aquells primaris. A nivell
experimental això equival a canviar de costat en la pantalla del colorímetre el primari
en qüestió.

Els valors tricromàtics obtinguts es normalitzen perquè tinguin àrea 1; així passen a
ser els coeficients triestímul.

2.3.2. Coeficients de luminància i crominància


Els valors triestímul R, G i B són molt útils per a reproduir un color, però per si
mateixos no ens donen informació de la luminància o la crominància d’una llum. És per
això que es defineixen els coeficients de luminància i crominància.

Coeficient de luminància
Recordem que anteriorment hem definit la luminància com una adaptació a la lluentor
a partir de l’equació:

23
Y = K ∫ V (λ ) C(λ ) dλ

A partir d’aquesta expressió podem posar la luminància en funció del valors triestímul
R, G i B ens queda definida com a Y = l * R + m * G + n * B. (Vegeu la explicació a
[Torres1993], pàgina 24. Observeu el canvi de nomenclatura utilitzat).

Els valors l, m i n dependran del conjunt de primaris utilitzats, segons si són


estandarditzats per CIE o bé per a TV color, i representen la luminància de cada
primari per poder adaptar un blanc de referència.

CIE : l = 0,17, m = 0,81, n = 0,01.


TVC: l = 0,3, m = 0,59, n = 0,11.

Nosaltres utilitzarem sempre els coeficients definits per a TV color. Cal observar que
els tres coeficients sumen 1. En barrejar els tres colors primaris amb la mateixa
quantitat de cadascun s’obté el color blanc, això vol dir que en cas d’una llum blanca
on R = G = B = k, la Y també valdrà k.

§ [Fernàndez2001] p. 38

Coeficients de crominància
Els coeficients de crominància ens donen la informació sobre el matís i la saturació de
forma independent de la luminància de la llum. Per aconseguir aquesta independència
el que es fa és normalitzar els coeficients triestímul obtinguts anteriorment obtenint r, g
i b.

R G B
r= ;g = ;b = ;
R+G+ B R+G+ B R+G+ B

De l’expressió anterior es dedueix que r + g + b = 1. S’ha de recordar que els tres


primaris del sistema R G B, (amb longituds d’ones definides al principi d’aquesta
secció), obtenen el blanc (W, blanc d’igual energia) quan es barregen en proporcions
iguals. Sota aquestes condicions, amb R = G = B, el càlcul dels coeficients tricromàtics
porta immediatament a la següent conclusió:

R
r = = 0.33 = g = b
R+G+ B

Ja es coneix que els coeficients tricromàtics compleixen la condició r + g + b = 1.


D’aquí es dedueix que conegut dos d’ells, el tercer queda definit inequívocament. Per
exemple, b = 1 – r - g. D’aquesta manera, un color pot representar-se en un sistema
de coordenades on es relacioni únicament g i r. El tercer coeficient queda definit pels
altres dos. En la següent sessió veurem que a partir d’aquests coeficients en podem
trobar una relació amb el matís i la saturació del color.

§ [Fernàndez2001] p. 39

§ [Torres1993] p. 21-24

24
2.3.3. Mescla de llums
Abans d’acabar aquesta sessió, aturem-nos un moment a explicar com funciona la
mescla de llums. Les característiques que regeixen una mescla de llums han estat
recollides en les anomenades lleis de Grassman.

Lleis de Grassman
1. Dues llums són equivalents si produeixen sensacions visuals equivalents.
(Recordeu el concepte de les distribucions metàmers).

2. Els valor triestímul d’una llum resultant d’una mescla es poden calcular com la suma
dels coeficients triestímuls de cada llum:

C1(R1, G1, B1) + C2(R2, G2, B2) = C3(R1 + R2, G1 + G2, B1 + B2).

En una barreja de llums com l’anterior si substituïm alguna llum per la seva equivalent,
el resultat no variarà

3. La luminància d’una mescla de llums és la suma de les luminàncies de les llums:

Y (C1) + Y (C2) = Y (C3).

4. La crominància (matís i saturació) d’una barreja de llums no varia si multipliquem o


dividim per un mateix factor els components de la barreja. En canvi, a la luminància
variarà proporcionalment al factor pel qual haguem multiplicat o dividit.

Posem un exemple: Si tenim una llum amb R = 3, G = 4 i B= 5, per tant C(3, 4, 5) i ens
demanen calcular la luminància: el primer que farem serà substituir els valors que ens
han donat en la formula de coeficients de Y:

Y(C) = 0,3R + 0,59G + 0,11B


Y(C) = 0,3*3 + 0,59*4 + 0,11*5 = 3,81.

Si ara ens fan calcular els coeficients de crominància r, g i b:

r = R/(R + G + B)= 3/(3 +4 + 5)= 3/12


g = G/(R + G+ B)= 4/(3 + 4 + 5)= 4/12
b = B/(R + G + B)= 5/(3 + 4 + 5)= 5/12.

Suposem ara que multipliquem per 2 les proporcions de cada primari i que, per tant,
C2(6, 8, 10), veurem que la luminànca el duplica, però la crominància resta igual.

Y(C2)=0,3*6 +0,59*8 + 0,11*10 = 2*Y(C)


r2 = r, g2 = g i b2 = b.

25
RESUM
En aquesta sessió hem estudiat la forma d’especificar un color i, per tant, reproduir-lo
a partir d’un conjunt de tres primaris. Això ens ha donat els coeficients triestímul de la
llum. A partir d’aquest coeficients hem deduït els coeficients de luminància i de
crominància associats a aquesta llum. Finalment, també hem repassat la teoria de la
mescla de llums.

26
SESSIÓ 5: Colorimetria - 2
FITXA DE LA SESSIÓ
v Nom: Colorimetria – 2
v Tipus: teòrica
v Format: no presencial
v Durada: 2 hores
v Dedicació: 2 hores
v Treball a lliurar: no
v Material:
o Bibliografia bàsica:
§ [Fernàndez2001]
§ [Torres1993]

PRECEDENTS
En la sessió anterior hem estudiat els conceptes de colorimetria bàsica, coeficients
triestímul i coeficients de crominància.

OBJECTIUS
L’objectiu d’aquesta sessió és el de completar els coneixements de colorimetria
necessaris per a més endavant entendre la televisió en color.

CONTINGUTS

2.3.4. Representació espacial del color


Gràcies als coeficients de crominància explicats en la sessió anterior, podrem fer una
representació bidimensional de les llums, que ens serà bastant útil a l’hora d’entendre
les relacions entre els coeficients de crominància i el matís i la saturació de la llum.

Lloc en l’espectre d’una llum


Sabem que els coeficients de crominància r, g i b estan relacionats entre ells per la
relació r + g + b = 1. Això vol dir que sempre podrem posar una component en funció
de les altres dues i que, per tant, és possible representar qualsevol color dins d’un pla
on cada color és un punt d’aquest pla r-g. (Per exemple, com es mostra a la
figuraFigura 9. Triangle de cromaticitat r-g). En aquest diagrama, l’origen de
coordenades correspondrà al primari blau (r = g = 0, b = 1), el punt (1, 0) al primari
vermell (b = g = 0, r= 1) i el punt (0, 1) al primari verd (r = b = 0, g = 1). A la regió que
formen aquests tres vèrtexs se l’anomena triangle de cromaticitat on el blanc està al
punt (1/3, 1/3), ja que r = g = b = 1/3. Tots els colors que podem reproduir amb els tres
primaris estaran confinats dins d’aquest triangle.

27
Figura 9. Triangle de cromaticitat r-g

Si pintéssim un punt per a cada color visible dins aquest espai bidimensional, en
resultaria el diagrama de cromaticitat (DdC) que podem observar a la figura 1.2.6 a
[Torres1993] o bé a la pàgina 43 de [Fernàndez2001]. Observem que el conjunt de
punts descriu una regió similar a una llengua. Aquesta llengua sobrepassa el triangle
de cromaticitat. Això vol dir que no tots els colors visibles són reproduïbles amb els
tres primaris que disposem i que si en disposéssim d’altres els color reproduïbles
serien els del triangle que formarien aquest tres nous punts.

Les llums corresponents al perímetre de la línia corba del DdC representa a tots els
colors espectrals, és a dir, les llum monocromàtiques. En aquest sentit, la recta inferior
de tancament entre el vermell i el blau, anomenada línia de porpres, no forma part
d’aquest conjunt. Els púrpures o magentes no són colors espectrals, és a dir, no es
poden trobar com a llum monocromàtica i solament es poden obtenir com a barreja del
vermell i el blau.

Si les llums del perímetre són els monocromàtiques vol dir que allà la saturació és
màxima; els punts de l’interior de la corba representen colors obtinguts a partir de
mescla de llums amb una longitud d’ona dominat i una saturació determinada. El
blanc, situat al (1/3, 1/3) és el punt de mínima saturació.

Amb tot això podem dir que si tracem un línia entre qualsevol llum (punt A) i el blanc
(punt W) i projectem la recta fins al perímetre de la corba, la llum situada en aquest
punt (punt B) serà una llum del mateix matis que A però de saturació màxima. Totes
les llums que estiguin situades en el segment que va de W a B passant per A
comparteixen el mateix matís, però en canvi van canviant de saturació: a W tenen
saturació nul·la i a B del 100 %. Canviant el pendent de la recta i deixant que passi
sempre pel blanc anirem obtenint diferent matisos.

Numèricament podem dir que el percentatge de saturació de la llum es pot calcular


com la següent relació entre distàncies:

____
WA
% saturació = ____
x100
WB

28
Generalment treballarem amb el triangle de cromaticitat i no el diagrama de
cromaticitat complert ja que el triangle és el que ens representa els color que nosaltres
podrem reproduir, donats els primaris que disposem per fer les mescles.

§ [Fernàndez2001] p. 47

§ [Torres1993] p. 25-27

Mescla de llums
Com hem vist, el triangle de cromaticitat és molt útil per treballar amb les llums i
conèixer el seu matís i la seva saturació. La mescla de dues llums també es pot
representar en el triangle. Donades dues llums, la llum resultant de la mescla ha
d’estar situada en algun punt sobre el segment que les uneix. El punt exacte es pot
calcular gràficament fent algunes triangulacions com es pot veure en la figura de la
pàgina 49 a [Fernàndez2001].

Un punt a destacar és el de les llums complementàries. Diem que dues llums L1(R1,
G1, B1) i L2(R2, G2, B2) són complementàries quan la seva suma dóna la llum blanca.
Això vol dir que la seva suma, component a component, dóna el mateix valor:

R1 + R2 = K.
G1 + G2= K.
B1 + B2 = K.

En el triangle de cromaticitat això quedarà representat com que les dues llums i la llum
blanca estaran alineades formant un angle de 180 º.

Finalment, existeix el concepte de gamma de colors. Anomenem gamma de colors al


conjunt de colors reproduïbles a partir de tres colors; gràficament al conjunt de punts
dins del triangle format pels tres colors.

§ [Fernàndez2001] p. 48-49

2.3.5- Models de color


L’objectiu d’un model de color és poder especificar tots els colors d’una gamma
determinada, d’una manera pràctica. Els models més populars són l’RGB, per a la
reproducció de colors en pantalles, el CMY, per dispositius d’impressió en color.

Model RGB
És el model utilitzat per una mescla de llums i el que hem estat utilitzant fins ara en
una mescla de llums. Es basa en la barreja additiva dels tres primaris vermell (R), verd
(G) i blau (B). La mescla additiva consisteix a sumar les distribucions de cada llum de
la mescla per a obtenir la distribució de la mescla resultant. D’aquesta forma la mescla

29
dels tres primaris dóna la llum blanca que consisteix a tenir una distribució uniforme. A
més, l’addició dels primaris dos a dos dóna com a resultat els colors complementaris,
el cyan, el magenta i el groc:

Ye = R + G ; Mg = R + B ; Cy = B + G.

Depenent del matís d’R, G i B que ens proporcionin els fòsfors del nostre monitor,
tindrem una gamma de colors diferents.

§ [Fernàndez2001] p. 52

Model CMY
És el model utilitzat en fer mescles de pintures o substàncies de diversos colors. Es
basa en el fet que quan nosaltres observem una substància d’un determinat color, és
que aquesta determinada substància absorbeix totes les radiacions, excepte la
corresponent a aquell color que percebem. Si mesclem dues substàncies de diferents
colors, la substància resultant absorbirà les radiacions d’una i de l’altra. En al cas límit,
la mescla de tots els colors ens donarà una substància negra. Aquest fenomen és el
que es coneix com a mescla substractiva, ja que a nivell de distribucions espectrals el
que fem cada cop que mesclem és multiplicar les distribucions espectrals.

Els colors complementaris del model RGB (cyan, magenta y groc) actuen ara com a
primaris en el model CMY, i el primaris del RGB ara seran els secundaris, ja que la
suma dos a dos de cada primari CMY dona un primari RGB.

Ex: Cy + Ye = (W – R) + (W – B) = W – R – B = G.

Tant els pintors com els dispositius d’impressió gràfica en color utilitzen aquest model
per a crear colors com a barreja dels tres secundaris.

§ [Fernàndez2001] p. 54

RESUM
En aquesta sessió hem acabat de veure els conceptes relacionats amb la colorimetria,
principalment el concepte de la representació espacial d’una llum, mescles de llums i
models de color.

30
SESSIÓ 6: Principis bàsics de la
televisió
FITXA DE LA SESSIÓ
v Nom: Principis bàsics de la televisió
v Tipus: teòrica
v Format: no presencial
v Durada: 2 hores
v Dedicació: 2 hores
v Treball a lliurar: no
v Material:
o Bibliografia bàsica:
§ [Fernàndez2001]
o Bibliografia complementària:
§ [Bethencourt1990]
§ [Torres1993]

PRECEDENTS
En les sessions anteriors vàrem estudiar els diferents paràmetres físics de la llum, les
característiques del sistema visual humà i la colorimetria.

OBJECTIUS
L’objectiu d’aquesta sessió és el d’aprendre els paràmetres fonamentals que
defineixen un sistema de televisió. Estudiarem els paràmetres bàsics del senyal de
televisió en blanc i negre, que vénen determinats per les característiques del sistema
visual humà. Aquests paràmetres es poden resumir en relació d’aspecte, nombre de
línies per imatge i sistema entrellaçat.

CONTINGUTS

3. Senyal de vídeo analògic

3.1. Principis bàsics de la televisió

3.1.1. Paràmetres bàsics


Tal com hem vist en les sessions anteriors, el sistema visual humà (SVH) presenta una
sèrie de limitacions que permet que les imatges de televisió no requereixin una
resolució infinita per resultar visualment realistes.

Les principals limitacions del SVH són l’angle de visió, la compressió en la transmissió
de la informació òptica al cervell, el poder de resolució i la persistència visual a la llum i
al moviment. També cal remarcar que solament la visió frontal és en detall.

31
Els paràmetres bàsics del senyal de televisió són:
- la relació d’aspecte.
- el nombre de línies per imatge.
- l’entrellaçat.

3.1.2. Relació d’aspecte


La relació d’aspecte (quocient entre l’amplada i l’alçada de la imatge) sempre és major
que 1. ja que l’home disposa de dos ulls sobre un eix horitzontal donant lloc a un angle
de visió horitzontal d’ aproximadament 140 º; molt més gran que el vertical. A més a
més, la majoria de moviments es realitzen en aquesta direcció.

En els sistemes estàndards de televisió, la relació d’aspecte és W/H = 4/3, i en els


sistemes moderns i d’alta definició, W/H = 16/9. Les noves tendències són, doncs,
d’aconseguir una major immersió de l’espectador en el contingut adaptant la imatge al
seu camp de visió i, com veurem més endavant, fent que l’espectador s’acosti més a la
pantalla.

3.1.3. Nombre de línies per imatge

Condicions de visió
Com veurem, una imatge de televisió es composarà d’un seguit de línies disposades
horitzontalment. Cal definir, doncs, el nombre de línies que ens asseguri una sensació
d’uniformitat i continuïtat de la imatge. Aquest nombre dependrà del poder de resolució
de l’ull i de la distància a què estiguem de la pantalla.

El poder de resolució de l’ull humà (capacitat de l’ull humà de distingir dos focus de
llum molt propers) és d’un minut de grau (1/60 part d’un grau).

Empíricament s’ha trobat que la distància de visió òptima a la pantalla, en els sistemes
de resolució estàndard és entre 6 i 10 vegades la seva alçària. En els sistemes d’alta
definició, la distància òptima només és 3 vegades l’alçària de la pantalla.

Nombre de línies per imatge


Tenint en compte el poder de resolució de l’ull humà, podem relacionar la distància
entre l’espectador i el monitor, d, i l’alçària de cadascuna de les línies, h. En la Figura
10. Distància de visió d’una pantallaes pot observar la relació de distàncies.

32
Figura 10. Distància de visió d’una pantalla

On el triangle rectangle format pels catets h i d han de formar, com a molt, un angle de
1’.:
Π
h = d ⋅ tg1' ≈ d ⋅ 1' = d ⋅
60 ⋅ 180

Aquesta aproximació es pot realitzar, ja que per angles molt petits es pot aproximar la
tangent pel valor de l’angle.

Si H és l’alçària del monitor, el nombre de línies, N, serà:


H H
N≥ =
h Π
d⋅
60 ⋅ 180

Si prenen el cas més crític, on la distància entre l’observador i la pantalla és d = 6H:

H 1800
N≥ = = 572.9
Π Π
6H ⋅
60 ⋅ 180

En el sistema PAL s’ha pres 575 línies actives. El nombre de línies per imatge ha de
ser senar per tal de simplificar l’entrellaçat. Vegeu les figures de la pàgina 63 de
[Fernàndez2001].

Més endavant veurem que caldrà afegir unes línies per tal de sincronitzar les imatges,
augmentant el nombre total a 625 línies/imatge.

D’aquí surt una freqüència de línia o horitzontal, com el nombre de línies per segon a
mostrar Fh = N Fi = 625 línies/imatge x 25 imatges/s = 15625 línies/s (Hz) i un període
o temps de línia de Th = 1/Fh = 64 µs.

En el sistema americà, el nombre total de línies és de 575 línies/imatge.

§ [Fernàndez2001] p. 63-65

3.1.4. L’entrellaçat

33
L’entrellaçat
En els sistemes PAL i SECAM es disposa de 25 imatges per segon, i en el sistema
NTSC, de 30 imatges per segon. En ambdós sistemes, es compleix el criteri de
moviment, ja que disposem de més de 15 imatges/segon.

En disposar de menys de 40 imatges/segon detectem flícker, fluctuació de la llum. Per


solucionar-ho, subdividim la imatge en dos camps que mostrarem seqüencialment,
cadascun format per la meitat de les línies, com es mostra a la Figura 11. Sistema
entrellaçat

Figura 11. Sistema entrellaçat

D’aquesta manera no detectem fluctuacions de llum, ja que tenim 50 impactes


lluminosos/segon (60 en el cas americà) que està per sobre de la freqüència crítica de
flícker, però no augmentem la informació a transmetre, mantenint l’ample de banda.
L’oposat del sistema entrellaçat és un sistema progressiu, on no es desglossen les
imatges en camps.

En haver un nombre senar de línies (625), obtenim dos camps de 312,5 línies
cadascun, fet que facilita la presentació del senyal entrellaçat.

§ [Fernàndez2001] p. 61

Sistema d’exploració
Les línies es pinten d’esquerra a dreta, i de dalt a baix. Aquesta exploració és producte
de la conjunció de dos moviments periòdics: un d’horitzontal, d’esquerra a dreta, amb
un període de 64 µs, i un de vertical amb un període de 20 ms (durada d’un camp). El
fet que hi hagi dos moviments simultanis, un en cada direcció, fa que les línies no
siguin perfectament horitzontals, sinó que estiguin lleugerament inclinades perquè
mentre el feix escombra d’esquerra a dreta, també es va desplaçant de dalt a baix.

En acabar de pintar una línia, cal retornar ràpidament a l’esquerra (temps de retorn
horitzontal o flyback).

34
Una vegada pintat un camp, cal retornar a dalt per començar el següent camp (temps
de retorn vertical). Durant aquest temps se segueix produint la deflexió horitzontal. El
temps de retorn resultant en els dos camps és idèntic.

L’inici de l’exploració de cada camp té la mateixa posició horitzontal, tenint el marge


dinàmic pels dos camps. Aquest aspecte simplifica la circuiteria electrònica. En la
Figura 12. Exemple d’imatge entrellaçada amb 7 línies totals, 5 d’actives (2,5 per a
cada camp) i 2 de no actives (1 per camp)es mostra un exemple d’exploració d’un
sistema entrellaçat de només 7 línies totals.

Figura 12. Exemple d’imatge entrellaçada amb 7 línies totals, 5 d’actives (2,5 per a cada
camp) i 2 de no actives (1 per camp)

RESUM
En aquesta sessió hem vist els paràmetres principals del sistema de televisió com són
la relació d’aspecte, el nombre de línies per imatge i el sistema d’exploració entrellaçat.

35
36
SESSIÓ 7: Senyal de TV B/N
FITXA DE LA SESSIÓ
v Nom: Senyal de TV B/N
v Tipus: teòrica
v Format: no presencial
v Durada: 2 hores
v Dedicació: 3 hores
v Treball a lliurar: no
v Material:
o Bibliografia bàsica:
§ [Fernàndez2001]
§ [Torres1993]
o Bibliografia complementària:
§ [Kuhn1995]

PRECEDENTS
En la sessió anterior hem vist els fonaments bàsics que determinen un sistema de
televisió. S’han revisat paràmetres bàsics com la relació d’aspecte o el nombre de
línies per imatge i nombre d’imatges per segon necessàries per tal de fer un sistema
de TV, que des del punt de vista del sistema visual humà sigui atractiu i realista. En la
sessió anterior hem vist també les bases del sistema entrellaçat i el sistema
d’exploració de la imatge.

OBJECTIUS
En aquesta sessió veurem en què consisteix el senyal de TV en blanc i negre (B/N).
Estudiarem el senyal, tant a nivell de luminància (amplitud) com a nivell temporal, fent
especial èmfasi als sincronismes. Finalment, també estudiarem l’ample de banda
teòric del senyal de TV B/N i els conceptes relacionats amb el detall observable de la
imatge (resolució).

CONTINGUTS
Bàsicament, en aquesta sessió explicarem el senyal de televisió B/N, el sistema de
sincronització, l’ample de banda teòric del senyal de TV i la resolució del senyal.

3.2. Senyal TV B/N

3.2.1. Estructura del senyal de vídeo


El senyal de televisió B/N consisteix en la transmissió seqüencial línia a línia de la
informació de luminància corresponent a la imatge, seguint el sistema entrellaçat; és a
dir, fent la divisió d’una imatge en dos camps amb la meitat de línies cadascun i la
transmissió seqüencial de cada camp. El senyal haurà de transportar la informació de
luminància i també de sincronismes per tal que el receptor pugui reproduir la imatge en

37
pantalla correctament. Com ja s’ha comentat en sessions anteriors la durada de cada
línia en el sistema europeu és de 64 µs, i que cada camp en tenir 312,5 línies té una
durada de 20 ms.

L’amplitud del senyal de televisió


El senyal de TV B/N acostuma a tenir una amplitud de 1 Vpp de tensió. Aquest volt de
tensió es divideix en dues parts, la part corresponent a informació de luminància i la
part corresponent a sincronisme. Generalment, prenent 0 Volts com a nivell de mínima
luminància (nivell de negre), el nivell de màxima luminància (nivell de blanc) és de 0,7
Volts. Els nivells intermedis entre 0 i 0,7 Volts correspondran a diferents nivells de gris.
Els sincronismes tenen reservats amplituds entre 0 i –0,3 Volts. El receptor de TV
haurà de mostrar per pantalla tota la informació que estigui per sobre els 0 Volts,
també anomenat nivell de Blanking, mentre que tot el que resti per sota d’aquest nivell
no s’haurà de visualitzar. Vegeu la Figura 13. Línia d’un senyal de televisió en B/N

Figura 13. Línia d’un senyal de televisió en B/N

Informació de sincronismes
Els sincronismes són imprescindibles per a una correcta representació de les imatges
en la pantalla de televisió. Són necessaris dos tipus de sincronisme: l’horitzontal, que
ens indica el final de línia i que obliga al sistema d’exploració a canviar de línia, i el
vertical, que està situat al final de cada camp i que indica que el sistema d’exploració o
ràster ha de situar-se a la seva posició original vertical.

Els sincronismes pròpiament són polsos de –0,3 V d’amplitud, i la única forma de


diferenciar un sincronisme horitzontal d’un de vertical és per la diferent durada que
tenen. Els sincronismes estan proveïts d’un pòrtic anterior de protecció i d’un pòrtic
posterior per deixar que el ràster efectuï el canvi de posició (retorn cap a l’esquerra o
bé cap a dalt, segons el cas). Durant el temps total de pòrtic anterior + sincronisme +
pòrtic posterior no s’ha de mostrar informació, per això a tot aquest interval se
l’anomena interval d’esborrat, horitzontal o vertical, segons el cas.

L’interval d’esborrat horitzontal té una durada total de 12 µs, la qual cosa farà que
cada línia de 64 µs quedi dividida en dues parts: una part activa amb informació de
vídeo de 52 µs i una per esborrat horitzontal de 12 µs. En la Figura 14. Interval
d’esborrat horitzontal.

38
Figura 14. Interval d’esborrat horitzontal

L’interval d’esborrat vertical té una durada de 160 ms i es situa al final de cada camp;
aquest temps és l’equivalent a 25 línies (160 ms/64 µs). Això implica que de les 625
línies per imatge que teníem, 50 línies són utilitzades pels dos esborrats verticals que
hi ha en una imatge i que, per tant, el nombre de línies actives a cada imatge són 575.
La Figura 15. Interval d'esborrat vertical.

Figura 15. Interval d'esborrat vertical

§ [Fernàndez2001] p. 70-75

§ [Torres1993] p. 56

Esborrat vertical. Polsos de preigualació i postigualació


Degut al fet que l’interval d’esborrat vertical és d’una durada superior a una línia
(exactament dura 25 línies) caldrà que durant l’interval vertical hi continuïn apareixent
impulsos de sincronisme horitzontal. Així doncs, l’esborrat vertical (incloent l’impuls de
sincronisme vertical) es veurà asserrat per impulsos de sincronisme horitzontal.
Aquesta barreja d’impulsos de sincronisme durant l’esborrat vertical suposa alguns
problemes al detector de sincronismes. Els detectors de sincronismes ja es veuran
més endavant, però per entendre la problemàtica direm que el sincronisme vertical es
detecta mitjançant un integrador de senyal. Si la integració de l’àrea de l’impuls de

39
sincronisme és superior a un cert llindar, es determinarà l’arribada d’un sincronisme
vertical.

La problemàtica existeix perquè en un camp i en l’altre la corba d’integració no és


idèntica per la presencia del sincronismes horitzontals barrejats amb el vertical,
provocant una detecció del sincronisme vertical a instants diferents en cada camp.
Això obliga a asserrar l’esborrat vertical amb uns polsos de sincronisme horitzontal a
una freqüència doble de la de línia, concretament durant 2,5 línies abans (pre-
igualació), durant i 2,5 línies després (postigualació) de l‘impuls de sincronisme
vertical, donant lloc a una detecció idèntica del sincronisme vertical en cada camp.

§ [Fernàndez2001] p. 75

§ [Torres1993] p. 57-59

3.2.2. Ample de banda teòric de senyal de TV


Un cop hem estudiat l’estructura temporal del senyal de televisió, passem a fer un
estudi freqüencial del mateix. En una primera etapa farem un càlcul aproximat i teòric
de la freqüència màxima (ample de banda) que hauria de tenir el senyal de TV.

Hipòtesis del càlcul


Per començar a fer aquest càlcul teòric de l’ample de banda, reduirem el problema a
calcular la freqüència màxima que podrà prendre el senyal, atés que la freqüència
mínima la suposarem nul·la. També suposarem que per aquest càlcul no tenim en
compte els esborrats horitzontals o verticals, és a dir, tota la informació és activa. Per
acabar, suposarem que la màxima freqüència representable en una imatge serà la
mateixa en direcció vertical i en horitzontal.

Càlcul de la freqüència màxima


Donades les hipòtesis de l’apartat anterior, la freqüència màxima serà aquella
freqüència on es representi una màxima variació temporal de la imatge
horitzontalment. Per tant haurem de definir un mínim element d’imatge representable
(píxel). La freqüència màxima serà aquella que ens ofereixi un píxel negre i un de
blanc, alternativament.

Figura 16. Imatge de máxima freqüència representable amb píxels quadrats

40
Si considerem que al llarg d’una línia hi haurà NxW/H píxels i la línia dura Th, la
freqüència màxima representable serà aquella que tingui un període dues vegades
Th/(NxW/H):
1 1 NFh W
f = = = x
max T min 2Th /( NxW / H ) 2 H

Tenint en compte que la Fh = N Fi obtenim l’expressió final de la freqüència màxima:

N2 W
f = ⋅f
max 2 H i

Com es pot observar, substituint pels valors N = 625, fi = 25 imatges/s i W/H = 4/3, la
freqüència màxima teòrica pel sistema europeu seria d’uns 6,5 MHz; a la realitat,
aquest valor es limita a 5 MHz.

§ [Fernàndez2001] p. 67-68

3.2.3. Resolució vertical i horitzontal


La resolució és un paràmetre íntimament relacionat amb la qualitat de la imatge.
Denota el mínim detall observable en una imatge. Cal tenir en compte que la resolució
és un paràmetre que tracta del detall observable, és a dir, que ha de tenir en compte el
comportament del sistema visual humà. Per simplificar el problema del càlcul de la
resolució, ens limitarem a fer-ho només en dues direccions, l’horitzontal i la vertical.

Paràmetres pel càlcul de la resolució


Abans de calcular els valors de resolució, ens cal calcular alguns altres factors. En
l’apartat anterior hem vist la freqüència màxima del senyal com una aproximació, en el
cas que la imatge estès dividida en píxels quadrats. Això ens donava una freqüència
màxima teòrica. Ja hem vist que generalment el senyal es limita a una freqüència
menor. Això farà que el nombre de píxels disminueixi. Si prenem la fórmula de la
freqüència màxima i la utilitzem per a extreure'n el nombre de píxels per imatge
(NxNxW/H) trobem la següent expressió:

1 W 1 2f
f max = fi ⋅ N 2 = f i ⋅ Pix / Im ⇒ Pix / Im = max
2 W 2 fi

Per fer el càlcul encara més real caldria que tinguéssim en compte els temps
d’esborrat vertical i horitzontal que ens fan perdre línies i píxels actius. En la Figura 17.
Part activa d’una imatges’il·lustra esquemàticament.

41
Figura 17. Part activa d’una imatge

Caldrà, doncs, calcular uns factors de quantitat d’informació activa en cada direcció de
la forma següent:

575 52
ρV = ; ρH =
625 64

on 575 son les línies actives/imatge respecte les totals i 52 són els microsegons
actius/línia respecte els totals d’una línia. Afegint aquests factors correctors, el nombre
total de píxels actius/imatge seran:

2 f max
Pix actius / imatge = ρV ρ H
fi

Substituint els valors del sistema europeu a la formula ens surt que els píxels actius
per imatge són uns 300.000.

§ [Fernàndez2001] p. 77-80

Resolució horitzontal
La resolució horitzontal està referida a la quantitat de punts o píxels que podem
observar al llarg d’una línia. Amb el càlcul de l’apartat anterior aquest valor es pot
obtenir fàcilment dividint els píxels actius/imatge pel nombre de línies actives.

Pix actius / imatge


Pix / lin = = 520 píxels / unitat amplada
575

Atés que la pantalla és més ampla que alta, per tal de comparar de manera equitativa
les resolucions H i V hem de ponderar la primera per la relació d’aspecte. És a dir,
calculem els píxels que tindrem en horitzontal dins d’una distància equivalent a l’alçària
del televisor:

3 3
Re s H = Pix / lin = ⋅ 520 = 390 píxels / unitat alçada
4 4

42
Cal mencionar que aquest valor de la resolució horitzontal està directament relacionat
amb l’amplada de banda que li deixem al senyal de vídeo. Com més gran sigui l’ample
de banda, major són les variacions possibles del senyal dins d'una línia i, per tant, la
capacitat de representar petits detalls de la imatge. Una regla pràctica és recordar que
cada MHz afegit al senyal aporta nus 80 píxels de resolució (5 MHz ≅ 400 píxels).

§ [Fernàndez2001] p 82-83

Resolució vertical. El factor de Kell


La resolució vertical té una relació directa amb el nombre de línies actives en una
imatge. Malgrat tot, en tractar-se d’un paràmetre perceptual, no podem dir que totes
les línies actives siguin directament observables pel sistema visual humà; només un
percentatge de les línies ho són. Aquest percentatge és l’anomenat factor de Kell i
quantifica els errors que pot tenir el sistema d’exploració en representar les línies i la
pèrdua de detall observable en un sistema entrellaçat respecte a un de progressiu.
Podem expressar la resolució en línies/píxels/punts/cicles per cm/m/alçària/polzades
del televisor.

Així doncs, a la pràctica, de les 575 línies teòricament visibles, només se n’aprecia una
fracció determinada pel factor de Kell.

Re sv = N actives Kell
Per Kell = 0,7, la resolució vertical és 575 x 0,7 = 400 línies/alçària de televisor (línies
que realment es veuen). A diferència de la resolució horitzontal, la resolució vertical és
independent de la fmax.

§ [Fernàndez2001], p. 81-82

RESUM
En aquesta sessió hem vist l’estructura general del senyal de vídeo, tant a nivell
d’amplitud com temporal. També hem estudiat l’ample de banda del senyal i el
concepte de resolució.

43
44
SESSIÓ 8: Transformada del senyal B/N
FITXA DE LA SESSIÓ
v Nom: Transformada del senyal B/N
v Tipus: teòrica
v Format: no presencial
v Durada: 2 hores
v Dedicació: 3 hores
v Treball a lliurar: no
v Material:
o Bibliografia bàsica:
§ [Fernàndez2001]
§ [Torres1993]
o Bibliografia complementària:
§ [Kuhn1995]

PRECEDENTS
Fins ara hem vist els paràmetres bàsics de la televisió i l’estructura del senyal de TV
B/N.

En la sessió anterior hem vist en què consisteix el senyal de TV en blanc i negre (B/N).
S’ha estudiat el senyal, tant a nivell de luminància (amplitud) com a nivell temporal,
fent especial èmfasi als sincronismes. Finalment, s’han vist els conceptes d’ample de
banda teòric del senyal de TV B/N i els conceptes relacionats amb el detall observable
de la imatge (resolució).

OBJECTIUS
En aquesta sessió veurem en què consisteix la transformada del senyal de TV en B/N

CONTINGUTS

3.2.4. Transformada del senyal de TV


En l’apartat 3.2.2 hem vist l’ample de banda teòric del senyal de TV que a la pràctica
en el sistema europeu es limitava a 5 MHz. Del que es tracta ara és de veure amb
detall la forma de l’espectre del senyal de TV B/N. Per fer-ho haurem d’utilitzar la
transformada de Fourier d’un senyal bidimensional i passar-ho a una dimensió.

Transformada del senyal bi-dimensional


Un sistema de televisió consisteix en la transmissió seqüencial d’imatges que varien
en el temps. Les imatges en B/N es poden veure com funcions que depenen de dues
dimensions espacials (x i y) que representen la luminància d’una escena. El senyal de

45
TV el que fa és explorar unidimensionalment aquestes imatges obtenint finalment un
senyal d’una dimensió.

Per trobar l’expressió matemàtica de la transformada del senyal de TV haurem, doncs,


de partir de la transformada de les imatges com a funcions bidimensionals. Per
començar, i per simplificar el problema, considerarem que les imatges són estàtiques i
que el fet que siguin explorades d’esquerra a dreta i de dalt a baix es com si
tinguéssim un senyal bidimensional periòdic de duració infinita. (Vegeu Figura 18.
Exploració d’una imatge mitjançant l’extensió periòdica del senyal bidimensional.

Figura 18. Exploració d’una imatge mitjançant l’extensió periòdica del senyal
bidimensional.

Un senyal bidimensional periòdic es pot expressar com un desenvolupament en sèrie


de Fourier bidimensional, com el que s’indica a la fórmula següent:
∞ ∞ ⎛ mx ny ⎞
j 2π ⎜ + ⎟
⎝ W H ⎠
f (X ,Y ) = ∑ ∑C mn e
m = −∞ n = −∞
on
⎛ mx ny ⎞
1 H V − j 2π ⎜ + ⎟
⎝ W H ⎠
C mn = ∫ ∫ f ( x, y ) e dxdy
WH 0 0

i W i H són els períodes fonamentals en cadascuna de les dimensions espacials. Si


efectuem el canvi de variable de x = Vx·t on Vx és la velocitat d’exploració en x i t és el
temps, aleshores el període W = Vx·Th on Th és el període de línia, dividint les
expressions de x i W trobem la relació on x/W = t/Th = t·Fh, efectuant el canvi
equivalent en l’eix vertical arribem a l’expressió en una sola dimensió temporal
següent:

∞ ∞
f (t ) = ∑ ∑C mn e j 2π (mf h + nf v )t
m = −∞ n = −∞

46
§ [Fernàndez2001] p. 86-88

§ [Torres1993] p. 83-85

Forma de l’espectre del senyal B/N


Acabem de veure l’expressió tancada del senyal de televisió en B/N. La seva
representació gràfica ens serà molt útil per a entendre conceptes que vindran més
endavant en el curs.

De la expressió matemàtica deduïda a l’apartat anterior observem que es tracta d’un


senyal doblement periòdic amb harmònics a múltiples de la freqüència horitzontal nFh,
a partir dels quals hi haurà harmònics desplaçats mFv. A la Figura 19. Espectre del
senyal B/Npodem observar l’acumulació d’energia a múltiples de Fh i com l’energia
decreix a mida que augmenta la freqüència. L’espectre anirà decreixent fins a arribar
als 5 MHz, on el senyal quedarà filtrat.

Figura 19. Espectre del senyal B/N

Observem, doncs, que l’espectre presenta uns espais buits, on la freqüència central
compleix la característica de ser un múltiple senar de la meitat de la freqüència de
línia. Aquests espais buits s’anomenen espais de Gray i ens serviran més endavant
per inserir la informació del color.

§ [Fernàndez2001] p. 89

§ [Torres1993] p. 85

3.2.5. Senyal d’àudio


El senyal d’àudio monofònic de televisió en el sistema europeu s’envia modulat en
freqüència a una portadora de 5,5 MHz per tal d’evitar que hi hagi solapament
freqüencial amb el senyal de vídeo que arriba fins a 5 MHz. El senyal d’àudio queda,
doncs, sempre 5,5 MHz més amunt de la portadora de vídeo i s’utilitza modulació en
freqüència en ser més robusta al soroll i a interferències. La freqüència de desviació és
de +/-50 KHz.

47
RESUM
En aquesta sessió hem repassat el concepte de l’espectre del senyal de vídeo en
blanc i negre i la seva transmissió en banda lateral vestigial. També hem vist la
correcció en gamma, un concepte que més endavant ens produirà algun efecte no
desitjat.

48
SESSIÓ 9: Característiques d’un sistema
de TV color
FITXA DE LA SESSIÓ
v Nom: Característiques d’un sistema de TV color
v Tipus: teòrica
v Format: no presencial
v Durada: 2 hores
v Dedicació: 2 hores
v Treball a lliurar: no
v Material:
o Bibliografia bàsica:
§ [Fernàndez2001]
§ [Torres1993]
o Bibliografia complementària:
§ [Bethencourt1990]

PRECEDENTS
En les sessions anteriors hem estat estudiant les característiques del sistema visual
humà i el senyal de televisió en blanc i negre.

OBJECTIUS
En aquesta sessió estudiarem les característiques generals del senyal en color, quins
requisits ha de complir i com s’envia la informació de color.

CONTINGUTS

3.3. Senyal de vídeo color

3.3.1. Fonaments del senyal color


Els requisits que han de complir els sistemes de televisió en color van encaminats a
mantenir la compatibilitat amb els sistemes de televisió que els precedeixen. Cal fer
possible la recepció del senyal en color, en els receptors antics, en blanc i negre.

Això implica que els sistemes en color han de transmetre la mateixa informació i en el
mateix format que ho feien en el senyal en blanc i negre. La informació de color ha de
ser transparent en els receptors en blanc i negre, respectant l’assignació i distribució
dels canals, mantenint l’ample de banda del senyal de vídeo a 5 MHz. La Figura 20.
Relació de compatibilitats entre TV B/N i color

49
Figura 20. Relació de compatibilitats entre TV B/N i color

§ [Fernàndez2001] p. 107-109

Components del color


Tal com es va veure en les sessions dedicades a la colorimetria, gairebé qualsevol
color es pot representar com una combinació lineal de llums primaries. Existeixen,
doncs, diferents possibilitats per enviar la informació de color.

Es podrien enviar els tres primaris (R, G i B). Aquesta opció, però, no compleix amb el
primer criteri de compatibilitat, ja que no s’envia la informació de luminància que
permet visualitzar el senyal de vídeo en els monitors en blanc i negre.

També podríem enviar la informació de luminància conjuntament amb dos primaris, o


bé la luminància amb dos senyals diferència (R-Y, B-Y o G-Y). Aquestes dues opcions
són vàlides. Es va optar per la segona opció, ja que en imatges en blanc i negre, els
senyals diferència s’anul·len, desapareixent el cross-color en els receptors en blanc i
negre, la interferència del senyal de color en el senyal de luminància.

Dels tres senyals diferència, es va descartar el senyal G-Y ja que presenta amplituds
menors que els altres senyals i per tant, és més vulnerable al soroll.

S’utilitza una matriu resistiva per aconseguir el senyals i recuperar els senyals R, G i B,
tal i com es mostra en la Figura 21. Matriu per a l'obtenció de les components Y, R-Y i
B-Y

Figura 21. Matriu per a l'obtenció de les components Y, R-Y i B-Y

Per a descodificar les components R, G i B en recepció s’utilitzen dues matrius com les
que s’indiquen a la Figura 22. Descodificació de Y, R-Y i B-Y

50
Figura 22. Descodificació de Y, R-Y i B-Y

On la matriu 1 permet obtenir G-Y a partir de R-Y i B-Y, a partir de la següent


expressió. (La seva demostració es deixa com a exercici de l’alumne):

− 0.3 0.11
(G − Y ) = (R − Y ) − (B − Y )
0.59 0.59

§ [Fernàndez2001] p. 110-112

Principi de luminància constant


El principi de luminància constant estableix la independència entre els canals de croma
i luminància en un sistema de televisió en color. Encara que el senyal de crominància
es perdi o es modifiqui per soroll o qualsevol altre motiu, el senyal de luminància ha de
mantenir-se immune.

En cas que aquest principi no es complís, els receptors B/N no serien capaços de
recuperar el senyal de luminància correcta en no poder desmodular el senyal de
crominància.

A més, la major sensibilitat de l’ull a les variacions de luminància causaria que el soroll
al canal de crominància es traduís en variacions de luminància molt més perceptibles
per a l’ull humà.

Per comprovar que les components Y, R-Y i B-Y compleixen el principi de luminància
constant, suposarem que en el senyal de crominància s’hi afegeix un soroll additiu N,
com es mostra a la Figura 23. Descodificació de Y, R-Y i B-Y davant la presència de
soroll N en el canal de crominància

51
Figura 23. Descodificació de Y, R-Y i B-Y davant la presència de soroll N en el canal de
crominància

La sortida del senyal G-Y es veu afectada pel soroll N de la següent forma:

− 0.3 0.11 0.41


(G − Y ) rec = (R + N − Y ) − (B + N − Y ) = G − Y − N
0.59 0.59 0.59

Si calculem la luminància resultant de les components entregades a la pantalla:

0.41
Yrep = 0.3( R + N ) + O.59(G − N ) + 0.11( B + N ) = Y
0.59

Comprovem que la luminància representada és la mateixa que la luminància


transmesa. Veiem, doncs, que el sistema de codificació amb components diferència
compleix el principi de luminància constant.

§ [Fernàndez2001] p. 113-114

Correcció en gamma en televisió en color

Recordant la secció 3.3.2 del curs on s’explicava en concepte de correcció en gamma,


en un sistema de TV color aquesta correcció s’ha de mantenir per cadascuna de les
components R, G i B. Això fa que mantenir la compatibilitat amb la correcció en
gamma efectuada en un sistema B/N sigui una mica complexa.

Sistema compatible
Podeu observar el diagrama de blocs d’un esquema compatible en la Figura 24.
Esquema de transmissor i receptors en un sistema compatibleCom indica el seu nom
aquesta seria la millor forma de mantenir una correcció en gamma compatible en
sistema B/N i color.

52
Figura 24. Esquema de transmissor i receptors en un sistema compatible

En els monitors en B/N la luminància representada és la correcta i és un sistema


completament transparent respecte el senyal de color.

En els monitors en color es recuperen els primaris transmesos i per tant, és el receptor
ideal, però no és implementable per tenir 4 blocs no lineals, esdevenint un receptor
complicat i car.

§ [Fernàndez2001] p. 115

Sistema quasi compatible


En la Figura 25. Esquema de transmissor i receptors en un sistema quasi compatible
podeu observar un sistema quasi compatible. El sistema es basa en corregir en
gamma a partir del primaris, això fa que la luminància que es transmeti no sigui
exactament la mateixa que tindríem en un sistema B/N. La denotem com a Yq’ per
diferenciar-la de la Y’ que obtindríem en un sistema compatible.

Figura 25. Esquema de transmissor i receptors en un sistema quasi compatible

53
En aquest cas, en els monitors en blanc i negre, la luminància representada no és
exactament la luminància correcta, perdent la total compatibilitat i violant el principi de
luminància constant. Com es pot observar a continuació:

0.41 γ
Yrep = 0.3( R'+ N )γ + O.59(G'− N ) + 0.11( B'+ N )γ ≠ Y
0.59
En emissions en B/N se segueix mantenint la compatibilitat que es perd en les
emissions en color. El pitjor cas es dóna pel blau 100 % saturat. En aquest cas, es
perd un 12 % de la luminància original. A la pràctica això resulta menyspreable, ja que
els colors altament saturats només s’emeten en un 1 % del temps.

En els monitors en color se segueix recuperant els primaris transmesos correctament.

En sistemes on hi ha una correcció en gamma es viola el principi de luminància


constant, ja que part de la informació de luminància viatja pel canal de crominància (la
Y que hi ha a les components (B-Y) i (R-Y)). Si hi ha soroll al canal de croma, la
luminància es veurà afectada.

L’índex de luminància constant (ILC) permet quantificar la dependència entre els


canals de croma i luminància. Podeu observar com es calcula aquest índex en la
pàgina 124 de [Fernàndez2001]. Bàsicament es tracta de veure de la luminància
representada (Yrep) en un monitor color, quina es la part que ha “viatjat” en el canal de
luminància (Yl) i quina és la que ha viatjat en el de crominància (Ycr) El ILC es calcula
com ILC = Yl/(Yl + Ycr) = Yl/Yrep. Com més gran sigui el ILC, o sigui la proporció
Yl/Yrep, menys susceptible serà el sistema a violar el principi de luminància constant.
De nou el pitjor cas és el blau saturat. En el cas d’una llum B/N, Ycr = 0, ja que les
components de color s’anul·len i en aquest cas el ILC = 100 % i no hi ha risc de
violació del principi de luminància constant.

§ [Fernàndez2001] p. 116-124

El senyal de crominància
Per mantenir la compatibilitat, la informació de crominància ha d’anar inserida dins del
canal de televisió. El senyal de croma es modula amb una subportadora per traslladar
el seu espectre a la zona de mínima interferència amb l’espectre de luminància.
S’utilitzen els espais de Gray de la zona d’alta freqüència de l’espectre de luminància.

L’elecció de la subportadora depèn de cada sistema. Ja que la sensibilitat a la llum


dels cons és inferior a la dels bastons, es limita l’ample de banda del senyal de
crominància a 1,3-1,5 MHz segon el sistema.

Els dos senyals diferència es modulen en quadratura, a la mateixa freqüència i amb 90


º de desfasament, fent que la interferència entre R-Y i B-Y sigui nul·la.

54
Figura 26. Modulació en quadratura de les components B-Y i R-Y

En modular en quadratura obtenim un vector de crominància, la fase del qual ens


indica el matís, el mòdul i la saturació.

Y = 0.3R + 0.59G + 0.11B


| Cr |= ( R − Y ) 2 + ( B − Y ) 2
R −Y
ϕCr = tan −1
B −Y

Figura 27. Vector de crominància

Un cop generat el senyal de crominància, aquest senyal es suma al senyal de Y ja


existent del sistema B/N. Aquesta composició de senyals (d’aquí ve el nom de senyal
de vídeo compost) fa que el marge dinàmic del senyal compost sobrepassi els límits
previstos. Per tal d’evitar una sobremodulació, els senyals diferència es ponderen,
evitant que sobrepassin en més d’un 33 % els nivells de blanc i negre.

Els senyals ponderats reben el nom de senyals U i V i es calculen de la següent forma:

U = 0,493 (B-Y); V = 0,877 (R-Y).

§ [Fernàndez2001] p. 125-131

55
RESUM
En aquesta sessió hem repassat la problemàtica d’inserir el senyal de crominància
dins del senyal de televisió B/N, tot mantenint la compatibilitat dels sistemes B/N.

56
SESSIÓ 10: El senyal de vídeo color
FITXA DE LA SESSIÓ
v Nom: El sistema de TV color NTSC
v Tipus: teòrica
v Format: no presencial
v Durada: 2 hores
v Dedicació: 2 hores
v Treball a lliurar: no
v Material:
o Bibliografia bàsica:
§ [Fernàndez2001]
§ [Torres1993]
o Bibliografia complementària:
§ [Bethencourt1990]

PRECEDENTS
En la sessió anterior varem estudiar les característiques generals dels sistemes de
televisió en color, quins requisits havien de seguir i com es podia enviar la informació
de crominància.

OBJECTIUS
En aquesta sessió estudiarem el sistema NTSC, les seves característiques generals i
com es codifica el senyal de color.

CONTINGUTS

3.3.2. Senyal de vídeo color NTSC


El sistema americà NTSC (National Television System Committee) va ser el primer
sistema de televisió en color. És compatible amb el sistema en B/N americà de 525
línies i 60 camps/s.

En el sistema en color, calgué modificar lleugerament la freqüència de camp a 59,94


camps/s per tal de minimitzar les interferències produïdes per la intermodulació entre
les subportadores de color i so sobre la luminància.

L’ample de banda del canal està limitat a 6 MHz, i la luminància, a 4,2 MHz. S’envia
luminància i els senyals diferència de color, modulades en quadratura.

Podeu veure una explicació detallada del sistema NTSC a [Torres1993], pàgines 120-
129 i algunes explicacions a [Fernàndez2001], pàgines 132-153.

57
Senyals I i Q
L’ull no és igualment sensible a les diferències de color en totes les zones del
diagrama de cromaticitat. Per aquesta raó en el sistema NTSC no s’envien els senyals
diferència (R-Y) i (B-Y) directament, sinó que s’envien uns senyals que representen la
croma en funció dels eixos de màxima i mínima sensibilitat a les variacions de color.

En la pàgina 141 de [Fernàndez2001] podeu observar les el·lipses de McAdam,


definides com les regions de l’espai de color, dins de les quals els colors són
indistingibles. Un color adjacent a una el·lipse per la part de fora és tot just distingible
(JND) respecte el color al centre de l’el·lipse.

El sistema NTSC defineix dos eixos segons la màxima i mínima resolució de l’ull
respecte del color. L’eix de màxima resolució és I (in phase) i el de mínima, l’eix Q
(quadrature), que es modulen amb amples de banda diferents en funció de la resolució
del color. Pel senyal I, on tenim major sensibilitat, tenim un ample de banda de 1,5
MHz, i pel senyal Q, de 0,5 MHz.

Per convertir els senyals R-Y i B-Y en I i Q, cal realitzar una rotació dels eixos de 33 º.

En la Figura 28. Espectre del senyal de vídeo NTSC podeu observar l’espectre del
senyal de vídeo NTSC. Per tal de no superar l’ample de banda del senyal de
luminància, la banda lateral superior de I s’atenua, utilitzant una modulació en banda
lateral vestigial, amb una banda lateral inferior completa. El senyal Q s’envia en doble
banda lateral.

Figura 28. Espectre del senyal de vídeo NTSC

Ja que els senyals Y, I i Q disposen de diferent ample de banda, davant d’una variació
brusca (contorn), el senyal amb major ample de banda tindrà un temps de pujada
menor, provocant un retard dels senyals I i Q. Per tal de minimitzar aquest problema,
cal retardar la luminància.

§ [Fernàndez2001] p. 149-145

Patró d’interferència

58
Definim el patró d’interferència com la imatge que il·lustra la interferència que ens
provocarà la crominància sobre de la luminància. En els semiperiodes positius de la
crominància aquesta interferència afectarà en un augment de la llluentor, mentre que
en els semiperiodes negatius serà a l’inrevés.

Podeu veure els criteris per a seleccionar la subportadora de color en la pàgina 134 de
[Fernàndez2001]. Seguint aquests criteris, en NTSC es va prendre una freqüència de
portadora de 3,583125 MHz, que més endavant es va modificar molt lleugerament.

Tenint una freqüència de subportadora múltiple senar de la freqüència de línia,


obtenim un patró d’interferència fàcilment integrable per a l’ull. Podeu observar els
patrons d’interferència en les pàgines 136 i 137 de [Fernàndez2001]

Aquesta freqüència de la subportadora de color, però, presenta un problema, ja que


els batuts (intermodulacions) entre les portadores d’àudio i croma creen interferències
d’alta visibilitat en la luminància. Observeu la pàgina 138 de [Fernàndez2001]. Per tal
de no perdre la compatibilitat amb els sistemes existents, la freqüència de portadora
de so no es pot modificar, per la qual cosa, es va optar per modificar la freqüència de
subportadora de color.

Es força que els batuts siguin a una freqüència múltiple senar de la freqüència de línia,
concretament 117 * fH, fent que la freqüència de so sigui 572 * fH. D’aquí obtenim que
les línies són una mica més llargues que en el sistema monocrom ja que la fH ara és
de 15734,26 Hz.

Podeu veure el desenvolupament matemàtic en la pàgina 139 de [Fernàndez2001].

§ [Fernàndez2001] p. 134-139

Sincronisme de color
Consisteix en una ràfega de subportadora de color que es transmet en el pòrtic
posterior i permet sincronitzar l’oscil·lador local de subportadora de color.

El senyal de burst consta de 10-12 cicles de subportadora de color inserits al pòrtic


posterior de l‘esborrat horitzontal, i permet la sincronització en fase de l’oscil·lador
local del receptor.

§ [Fernàndez2001] p. 147

Codificador NTSC
Podeu trobar una explicació i diagrama del sistema NTSC a [Torres1993], pàgina 125.
Bàsicament consisteix en un modulador en quadratura dels senyals I i Q que es suma
al senyal de luminància. Per tal de poder recuperar la portadora de color amb la fase
correcta, s’envia el senyal de burst al pòrtic posterior del sincronisme horitzontal.

59
§ [Torres1993] p. 125

RESUM
En aquesta sessió hem estudiat els fonaments del sistema NTSC, els senyals
utilitzats, la freqüència de subportadora i el diagrama de blocs del codificador.

60
SESSIÓ 11: El senyal color PAL
FITXA DE LA SESSIÓ
v Nom: El senyal color PAL
v Tipus: teòrica
v Format: no presencial
v Durada: 2 hores
v Dedicació: 2 hores
v Treball a lliurar: no
v Material:
o Bibliografia bàsica:
§ [Fernàndez2001]
§ [Torres1993]
o Bibliografia complementària:
§ [Bethencourt1990]

PRECEDENTS
En la sessió anterior vam estudiar les característiques generals del sistema NTSC.

OBJECTIUS
En aquesta sessió estudiarem el principal problema que presenta el sistema NTSC: el
crosstalk. També estudiarem el sistema PAL, el codificador i els receptors PAL-S.

CONTINGUTS

Distorsions en el sistema NTSC: el crosstalk i l’error de


fase

A causa de la asimetria en l’amplada de banda de la I i la Q (1,5 MHZ i 0,5 MHz,


respectivament) en inserir la Cr dins de l’espectre de la Y, la component Q queda
modulada en doble banda lateral, mentre la I queda asimètrica, en banda lateral
vestigial, com es pot observar en la Figura 29. Espectre del senyal NTSC.

Figura 29. Espectre del senyal NTSC

61
En la representació vectorial dels vectors de crominància, la informació Q és la suma
de dos vectors simètrics en l’ample de banda que sumats només tenen component en
Q.

En estar I modulat en banda lateral vestigial, hi ha components atenuades, perdent la


simetria en els vectors i interferint el senyal Q provocant un crosstalk. La component I
queda desplaçada i la part projectada sobre l’eix I se suma a Q.

Figura 30. Interferència I sobre Q en el sistema NTSC

Això provoca un canvi de fase del vector de croma, que provoca un canvi en el matís
de color.

A més a més del crosstalk, el sistema NTSC és molt sensible als errors de fase, ja que
una variació de fase fa variar els color. Per això, els televisors NTSC tenen l’ajust hue
que permet sincronitzar la fase de l’oscil·lador local amb el de l’emissora.

§ [Fernàndez2001] p. 150-152

3.3.3. Senyal de vídeo color PAL


El sistema PAL (Phase Alternating Line) és una varietat del sistema NTSC americà,
desenvolupat pel Dr. Walter Bruch a Alemanya. Al 1963, Telefunken va introduir
aquest nou sistema. El PAL és utilitzat a Europa, a excepció de França on s’utilitza el
SECAM.

El PAL resol el problema principal del sistema NTSC provocat per errors de fase entre
l’oscil·lador local i el generador de subportadora.

Els errors de fase entre l’oscil·lador local del receptor i el generador de subportadora
provoca variacions de matís, detectables per l’ull humà a partir de 5 º i molèsties a
partir de 10 º. El sistema PAL corregeix automàticament els defectes deguts als errors
de fase. (Vegeu a [Fernàndez2001], pàgines 155-156).

62
Codificador PAL
La croma s’envia en doble banda lateral, modulant els senyals diferència en
quadratura, i variant el signe de la component V, en cada línia, canviant el signe de la
fase del senyal de crominància com es mostra a la Figura 31. Modulació de la Cr en un
sistema PAL

Figura 31. Modulació de la Cr en un sistema PAL

La correcció dels errors de fase es basa en la hipòtesi que la croma de dues línies
consecutives no varia significativament. En desmodular la croma, es canviarà el signe
de la component V i es promitjarà la Cr de dues línies consecutives. La resultant té la
mateixa fase que el vector original. Es pot veure una il·lustració del fenomen a la
Figura 32. Il·lustració de la correcció de l’error de fase en el sistema PAL

Figura 32. Il·lustració de la correcció de l’error de fase en el sistema PAL

Hem cancel·lat l’error de fase (matís) però hem introduït un error en el mòdul
(saturació) que ha quedat lleugerament atenuat.

L’ull, però, no és tan sensible a variacions de saturació com a les variacions de fase.
Un desfasament de 10 º del matís (molest) es converteix en una variació d’entre un 1 i
1,5 % del valor de la saturació.

Podeu trobar una explicació més detallada a [Torres1993], en les pàgines 129-133, i a
[Fernàndez2001], pàgines 157-158.

63
Elecció de la subportadora de color
Cal seguir els criteris que s’havien exposat en el sistema NTSC. La freqüència de
subportadora de color ha de ser el més alta possible, ha de respectar l’ample de banda
de la luminància, i respectar el principi d’imbricació de l’espectre.

En PAL, en commutar la fase de la component V, línia a línia, no podem agafar una


freqüència que sigui un múltiple senar de la fH/2. Recordem que tenim un senyal de Cr
del següent tipus:

Cr(t) = U(t) sinWspt ± V(t) cosWspt.

Si canviem l’alternança de signe per un senyal signe S(t):

Cr(t) = U(t) sinWspt + S(t)V(t) cosWspt

on S(t) és:

Figura 33. Senyal S(t) que implementa el canvi de signe de V

Si fem el desenvolupament en serie de Fourier de S(t), obtenim:

2 ω 1 3ω 1 5ω 2 ω
S (t ) = (cos H t − cos H t + cos H t + ) ≅ cos H t
Π 2 3 2 5 2 Π 2

Si substituïm a Cr(t):

ωH
Cr (t ) = U (t ) sin ω sp t + V (t )[cos(ω sp ± )t ]
2
El canvi de signe, provoca un desplaçament de freqüència de la component V respecte
a la V de fh/2. Si escollíssim fsc = (2n + 1)fH/2. Aleshores, la component V aniria a
parar a sobre de la Y.

Figura 34. Interferència Y i V en el cas Fsp = (2n + 1)Fh/2

Per tal de no interferir el senyal de luminància, aleshores es tria una freqüència de


subportadora de color de fsc = (2n + 1)fH/4.

64
Figura 35. Espectre PAL amb Fsp =(2n + 1)Fh/4

Podeu trobar més informació a [Fernàndez2001], pàgines 176-180 i a [Torres1993],


pàgines 134-136.

Patrons d’interferència PAL


Si triem una freqüència de subportadora (2n + 1)Fh/2, el senyal de crominància
provocaria una interferència d’alta visibilitat com es pot observar a la pàgina 181 de
[Fernàndez2001], on el patró consisteix a unes barres més lluentes una mica
esbiaixades.

Amb (2n + 1)Fh/4, el patró d’interferència PAL té una periodicitat de quatre imatges,
massa lent per tal que pugui ser integrat per l’ull.

Si afegim 25 Hz a la Fsc = (2n + 1)Fh/4 + 25 Hz s’assoleix un patró molt més dispers i


més fàcilment integrable per a l’ull humà. El motiu d’això es que en sumar 25 Hz =
(Fh/625) el que estem fent és, al llarg de 625 línies, augmentar en un cicle més el
nombre total de períodes de Fc dins d’una imatge. Això implica que a meitat de la
imatge hi tinguem mig cicle, l’equivalent a un canvi de fase de 180 º. Aconseguint
finalment tenir un patró d’interferència del camp I complementaria del camp 2 i així el
patró d’interferència final és menys visible (més semblant a un tauler d’escacs), la
figura de la pàgina 183 a [Fernàndez2001] il·lustra el patró obtingut.

Amb totes les modificacions el valor final de la Fsc del sistema PAL és 4,43361875
MHz. Podeu veure més informació a [Fernàndez2001], pàgines 182-183.

3.3.4. Senyal de vídeo color SECAM


El sistema SECAM (Séquentiel à Couleur avec Memoire) és un sistema TVC utilitzat a
França i a l’antiga Unió Soviètica. És un sistema molt semblant al sistema PAL (25
imatges/s, 625 línies/imatge, sistema entrellaçat).

Una primera diferència la trobem en l’ample de banda del senyal de luminància. En el


sistema SECAM, l’ample de banda de la luminància és de 6 MHz, permetent una
resolució horitzontal major que en el sistema PAL.

65
L’altra gran diferència és en la transmissió del senyal de color. Els senyals diferència
es modulen en FM, utilitzant dues subportadores a freqüències diferents. A mes a
més, a cada línia s’envia només un dels dos senyals diferència.

En modular el senyals en FM s’elimina el crosstalk i els errors de fase, però en ocupar


més ample de banda, s’augmenten les interferències sobre la Y respecte el sistema
PAL.

En alternar les components a cada línia, la resolució del color en vertical és pitjor que
en el sistema PAL.

S’usen dues portadores, una per a cada component, per limitar l’ample de banda
limitant l’amplitud del senyal d’entrada (es tracta de modulació FM). Es tria una
freqüència de subportadora específica per a cada freqüència per a disminuir la
distorsió que es produeix en limitar el senyal en amplitud.

Per tal de poder identificar les línies parells de les línies senars, en el modulador
SECAM s’insereix l’identificador, format per una seqüència d’impulsos inserits al
sincronisme vertical.
En el desmodulador SECAM, un retard de 64 µs permet memoritzar la línia anterior.
Segons arribi R-Y o B-Y, commutarem els senyals directe o memoritzat.

Pel fet de modular el senyal de croma en FM, tenim més interferència del color
respecte el senyal de luminància quan menys color hi ha a l’escena, ja que la potència
es concentra a la freqüència de subportadora.

A les pàgines 189-193 de [Fernàndez2001] hi ha alguns diagrames i explicacions del


sistema SECAM.

§ [Fernàndez2001], p. 189-193

RESUM
En aquesta sessió hem repassat el sistema PAL i quines són els seus principals
avantatges. Hem discutit també l’elecció de la freqüència de subportadora de color.
Finalment, hem vist el funcionament bàsic del sistema SECAM.

66
SESSIÓ 12: Senyal de vídeo digital
FITXA DE LA SESSIÓ
v Nom: Senyal de vídeo digital
v Tipus: teòrica
v Format: no presencial
v Durada: 2 hores
v Dedicació: 2 hores
v Treball a lliurar: no
v Material:
o Bibliografia bàsica:
§ [Fernàndez2001]
§ [Benoit1998]
o Bibliografia complementària:
§ [Bethencourt1990]

PRECEDENTS
En les sessions anteriors hem estudiat el senyal de televisió analògic. A partir
d’aquesta sessió comencem a veure les característiques i funcionament dels sistemes
de televisió digital.

OBJECTIUS
En aquesta sessió farem una introducció al senyal digital, basant-nos en la norma ITU-
R601 que fixa els paràmetres per la codificació del senyal.

CONTINGUTS

4. Senyal de vídeo digital

4.1. Introducció al senyal digital

4.1.1. Digitalització d’un senyal analògic


El senyal analògic és susceptible al soroll i a les distorsions, afectant directament a la
qualitat de la imatge. Qualsevol tractament o manipulació suposa una degradació del
senyal, introduint una distorsió.

El senyal digital és aquell que està codificat en dos nivells (0 i 1). Com que el món real
és analògic, sempre caldrà una conversió d’analògic a digital.

En el senyal digital ens importa la seqüència binària i polaritat, però no la forma, per la
qual cosa les distorsions no alteren el missatge i són possible múltiples còpies sense
degradació. En cas que el senyal digital presenti errors, en alguns casos és possible
corregir-ne algun, sense perdre qualitat.

67
També hi ha efectes especials possibles de realitzar amb el senyal analògic que sí que
es poden fer, un cop el senyal de vídeo és digitalitzat, i facilita la compatibilitat entre
equips, malgrat disposar de sistemes diferents.

El principal problema és l’important volum de dades a transmetre quan aquestes no


estan comprimides. L’ample de banda que ocupa el senyal digital és major que el que
ocupa el senyal analògic.

Els passos per a digitalitzar un senyal són el filtratge passa baixes, el mostratge, la
quantificació i la codificació, com es mostra a la Figura 36. Esquema de
digitalitzacióEn els següents apartats discutirem els diferents paràmetres que
intervenen en la digitalització del senyal.

Figura 36. Esquema de digitalització

4.1.2. Mostratge

El criteri de Nyquist-Shannon estableix que per aconseguir un mostratge-recuperació


sense distorsió es requereix que la freqüència de mostratge sigui almenys dues
vegades la freqüència màxima present en el senyal analògic mostrejat:

Fm ≥ 2 F max
De no complir aquest criteri es pot caure en el fenomen conegut com aliasing, on el
senyal recuperat després de la digitalització és de freqüència menor a la real a causa
de la manca de mostres suficients per a fer una bona reconstrucció.

L’altre criteri a tenir en compte és el de la quantificació en N nivells i el nombre de bits


a codificar el senyal on:

N = 2b

68
4.2. Senyal de vídeo digital compost

4.2.1. Introducció
El senyal digital compost s’obté de digitalitzar directament el senyal de vídeo compost
analògic (NTSC, PAL o SECAM).

El senyal digital compost no resol la incompatibilitat entre sistemes de televisió


diferents, malgrat mantenir la mateixa freqüència de mostratge i codificació. La
descodificació ens tornaria els senyals NTSC, PAL o SECAM. Tampoc elimina les
interferències típiques del vídeo compost analògic (crosstalk, cross-color, cross-
luminance).

Es pren una freqüència de mostratge que és 4 vegades la freqüència de subportadora


(freqüència de mostreig = 17,734475 MHz). Disposem de 1135 mostres total, de les
quals 948 són mostres actives.

La quantificació pot ser amb 8 o 10 bits.

El nivell de blanc 100 % (700 mV) es codifica en el valor 211 (8 bits) i 844 (10 bits).
El nivell de negre (0 V) es codifica amb els valors 64 i 256, respectivament.
El nivell de sincronismes (-300 mV) es codifica amb els valors 1 i 4, respectivament.
El valor 0 (en 8 bits) i els valors 0-3 (en 10 bits) estan reservats per a altres usos.

La transmissió pot ser en sèrie o en paral·lel. Vegeu les il·lustracions a


[Fernàndez2001], pàgines 335-338.

Aquest sistema de vídeo digital compost no soluciona les limitacions que ja existien en
l’analògic, pel que fa a les interferències del cross-color i cross-luminance i, per tant,
és un sistema d’implantació reduïda.

Vegeu la figura 2.2 ,a la pàgina 18 de [Benoit1998] i la pàgina 335 a [Fernàndez2001].

§ [Fernàndez2001] p. 333

§ [Benoit1998] p. 18

4.3. Senyal de vídeo digital en components

4.3.1. Introducció

Per tal de resoldre la problemàtica del senyal digital compost, es proposa digitalitzar
cadascuna de les components per separat. El senyals mostrejats són els senyals
corregits en gamma Y’, R’-Y’, B’-Y’.

69
El principal avantatge d’aquest sistema és la compatibilitat entre els sistemes PAL,
SECAM i NTSC. La ITU (Unió Internacional de Telecomunicacions) va establir el 1982
la norma 4:2:2 ITU-R 601 de televisió digital en components. La Figura 37. Esquema
de la digitalització del senyal en mostra l’esquema de la digitalització segons aquesta
norma.

El tractament digital en components elimina les interferències entre luminància i


crominància, i desapareixen els problemes derivats de l’estructura de 4 i 8 camps, en
edició. Solament cal tenir en compte l’estructura de dos camps entrellaçats.

Figura 37. Esquema de la digitalització del senyal en


components segons la norma ITU-R 601

4.3.2. Freqüència de mostratge

La freqüència de mostratge a utilitzar per a digitalitzar el senyal en components ha de


complir dos criteris. El criteri de mostratge ortogonal i el ja conegut criteri de Nyquist.

Seguint el criteri de Nyquist, la freqüència de mostratge ha de ser més gran que el


doble de la freqüència màxima de la banda base de vídeo. El sistema SECAM és el
sistema més restrictiu en aquest cas, ja que presenta el major ample de banda, de 6
MHz, per la qual cosa cal prendre una freqüència de mostratge de 12 MHz, com a
mínim, per trobar un estàndard internacional.

Per tal que el mostratge sigui ortogonal (mateix nombre de mostres per a totes les
línies i que estiguin alineades, com es mostra a la Figura 38. Patró de mostratge
ortogonal), cal que el temps de línia, Th, sigui un múltiple del període de mostratge, el
que comporta que la freqüència de mostratge hagi de ser múltiple enter de la
freqüència de línia.

70
Figura 38. Patró de mostratge ortogonal

Per raons de compatibilitat internacional, caldrà, doncs, que la freqüència de mostratge


triada sigui múltiple enter de totes les freqüències de línia existents (NTSC i
PAL/SECAM). Considerant que la freqüència de línia dels sistemes PAL i SECAM és
15,625 Hz i que la del NTSC és 15.734,2657Hz, cal trobar una freqüència múltiple a la
vegada d’aquests dos valors. La freqüència 2,25 MHz és a la vegada múltiple de
15,625Hz (144 x 15.625 Hz = 2,25 MHz) i de 15.734,2657Hz (143 x 15.734,2657 Hz) =
2,25 MHz).

Com que 2,25 MHz no compleix el criteri de Nyquist, cal cercar el múltiple més petit de
2,25 MHz que si que ho compleixi. En aquest cas 6 x 2,25 MHz = 13,5. La freqüència
de mostratge triada per a la luminància és, doncs 13,5 MHz, que compleix les
condicions requerides.

Com que la freqüència màxima del senyal de crominància es fixa a la meitat de la de la


Y, la freqüència de mostratge de la croma és 6,75 MHz (13,5 MHz/2).

4.3.3. Quantificació de les components

Seguint l’esquema de la Figura 37. Esquema de la digitalització del senyal en, el


senyals sortint de la càmera estan normalitzats i corregits en gamma. Observant la
Taula 1. Valors a l’entrada i a la sortida de la matriu en componentses pot veure que,
tot i que els valors R’, G’ i B’ estan normalitzats, només la Y’ ho està; els valors R’-Y’ i
B’-Y’ tenen un marge dinàmic de {-0,701...0,701} i {-0,886...0,886}, respectivament.

71
Taula 1. Valors a l’entrada i a la sortida de la matriu en components

Els valors de luminància estan compresos entre 0 i 1. Es codifiquen amb 8 bits, amb
220 nivells per quantificar la luminància i la resta reservats com a guarda.

Els nivells 0 i 255 estan reservats per sincronització. El nivell de blanc es codifica amb
el valor 235 i el nivell de negre, amb el valor 19.

Yq = round (219 * Y’ + 16).

Els valors de R’-Y’ estan compresos entre +0,701 i –0,701, i els valors de B’-Y’, entre
+0,886 i –0,886. Per tal de restablir l’excursió dels senyals diferència a la unitat (de
+0,5 a –0,5) cal emprar els següents coeficients de ponderació:

Kr = 0,5/0,701 = 0,713.
Kb = 0,5/0,886 = 0,564.

Les mostres de crominància també es codifiquen amb 8 bits, amb 225 nivells assignats
als colors i la resta reservats com a guarda.

El nivell màxim de croma es codifica amb el valor 240, el nivell zero, amb el valor 128 i
el nivell mínim de croma, amb el valor 16.

Cr = round (224* 0.713*(R’-Y’)) + 128 = round (160*(R’-Y’)) + 128.


Cb = round (224* 0.564*(B’-Y’)) + 128 = round (126*(B’-Y’)) + 128.

§ [Fernàndez2001] p. 345-350

4.3.5. Mostres actives per imatge


Durant el blanking no hi ha mostratge, ja que la informació en aquest interval és
coneguda.

En definir el nombre de mostres actives per línia, i tot cercant certa compatibilitat entre
sistemes de 525 línies (amb un temps de línia activa de 53,33 µs) i els de 625 línies
(amb un temps de línia activa de 52 µs), es va triar la major de les dues. De forma que
les mostres actives de luminància per línia seran 53,33 µs x 13,5 M most/s = 720
mostres actives de Y/ línia en tots els sistemes.

72
Aquesta decisió implica que en la digitalització del senyal analògic d’un sistema a 625
línies hi apareguin unes poques mostres negres a principi i final de línia, corresponent
al mostratge de l’esborrat horitzontal que apareixen pel fet d’agafar un temps de línia
activa una mica superior que l’estàndard.

Pel que fa a les mostres en vertical, aquestes haurien de correspondre a les línies
actives (575 en un sistema de 625 línies). El problema està en el fet que les 575 estan
organitzades en dos camps, i que, per tant, cada camp té un nombre no enter de línies
(287,5 línies exactament). Aquest fet ocasiona problemes per a emmagatzemar
digitalment les mitges línies de cada camp i es prefereix que aquestes línies es
completin, donant lloc al nombre de línies actives en un sistema digital de 576 línies.
En un sistema a 525 passa el mateix, donant lloc a 480 línies.

En la Figura 39. Mostres actives per imatge en sistemes de 525 i 625 línieses mostren
les mostres actives de Y per a cada sistema.

Figura 39. Mostres actives per imatge en sistemes de 525 i 625 línies

§ [Fernàndez2001] p. 351-354

4.3.6. Patrons de mostratge

El patró definit per la ITU-R 601 s’anomena 4:2:2. Tot i així, existeixen 4 patrons de
mostratge on es relacionen les mostres de color amb les de luminància.

- 4:2:2: on la informació de Y i Cr té la mateixa resolució vertical però la Cr té la


meitat de resolució horitzontal. És emprat en l’enregistrament professional en cinta
o disc i per a la transmissió del senyal entre televisions.
- 4:2:0: on es parteix del 4:2:2 i es redueix la resolució vertical de color a la meitat.
Es el patró més emprat en la transmissió de televisió digital (sigui satèl·lit, terrestre
o cable) o per a la distribució de vídeo en DVD.
- 4:1:1: on es parteix també del 4:2:2, però en aquest cas es redueix la resolució
horitzontal de la Cr a una quarta part de la Y. És emprat en l’enregistrament en
alguns formats d’enregistrament en cinta.

73
- 4:4:4: la Y i la Cr tenen la mateixa resolució horitzontal i vertical. Permet alta
qualitat i no és utilitzat en difusió, només en entorns de producció de molt alta
qualitat.

En la Figura 40. Patrons de mostratgees mostres els patrons de mostratge 4:2:2, 4:1:1
i 4:2:0, on les “X” indiquen les mostres de luminància i les “O” les mostres de
crominància (R-Y i B-Y).

Figura 40. Patrons de mostratge

RESUM
En aquesta sessió hem pogut veure la digitalització del senyal de vídeo analògic, tant
del senyal compost com el de components.

74
SESSIÓ 13: Interconnexió de vídeo
digital
FITXA DE LA SESSIÓ
v Nom: Interconnexió de vídeo digital
v Tipus: teòrica
v Format: no presencial
v Durada: 2 hores
v Dedicació: 2 hores
v Treball a lliurar: no
v Material:
o Bibliografia bàsica:
§ [Fernàndez2001]
§ [Benoit1998]
o Bibliografia complementària:
§ [Bethencourt1990]

PRECEDENTS
En la sessió anterior vam estudiar el mostratge, la quantificació i la codificació del
senyal analògic, obtenint el senyal de vídeo digital compost i en components.

OBJECTIUS
En aquesta sessió veurem les dues interfícies que permeten connectar equips digitals
de producció, permetent als fabricants dissenyar les característiques d’entrada i sortida
dels seus equips.

CONTINGUTS

4.4. Interconnexió de vídeo digital en


components

4.4.1. Interfície paral·lela


Aquesta interfície consisteix en una connexió unidireccional de 9 o 11 cables (8 o 10
per a dades, senyal de televisió o dades auxiliars, i un pel rellotge de 27 MHz).

És utilitzat en edició, en interconnexió entre equips que es troben a poca distància (fins
a un màxim de 100 metres) i ha caigut darrerament en desús. La circuiteria és simple, i
per tant, els equips són barats. En canvi els cables i connectors són cars, i la
commutació per connectar múltiples aparells, cara i complicada.

75
Altres desavantatges és el fet que es pot produir diafonia (interferència entre senyals) i
si les velocitats de propagació són diferents, a gran distància, hi poden haver
problemes.
Pels motius anteriorment descrits, es prefereix utilitzar el senyal digital en sèrie que
veurem en el següent apartat.

4.4.2. Interconnexió de vídeo digital en components.


Interfície sèrie (SDI)
El 1985, la UER va establir l’interfície sèrie per a l’acoblament entre equips de
producció de televisió. Aquest interfície rep el nom de Serial Digital Interface (SDI) i
consisteix en una connexió unidireccional entre dos equips.

Com a punt positiu del SDI és que els cables i connectors són senzills i barats, podent-
se utilitzar cable coaxial de qualitat. La commutació és senzilla.

A més a més, el senyal es autosincronitzable i sense polaritat, la qual cosa fa que sigui
fàcil d’instal·lar i d’utilitzar.

En contrapartida, la circuiteria dels equips és cara i complexa (cal serialitzar el senyal i


fer-lo autosincronitzable). La freqüència de transmissió és major i hi ha poca flexibilitat
per allargar la paraula de codi (de 8 a 10 bits).

El senyal de vídeo, les referències temporals i els senyals d’identificació estan


multiplexats en el temps. La luminància i la crominància s’envien multiplexades en el
temps a 27 MHz, ja que multiplexem 13,5 M mostres de luminància i 6,75 M mostres
per cadascuna dels senyals diferència, per segon. Se segueix l’ordre següent:

Cb Y Cr Y Cb Y ...

En cadascuna de les línies tenim 720 mostres de luminància, 360 mostres U i 360
mostres V. En total, doncs, tenim 1440 mostres/línia.

Una vegada multiplexats els senyals, aquests es serialitzen considerant que s’utilitzen
10 bits/mostra encara que la senyal d’origen sigui en 8 bits. D’aquesta forma la
interfície SDI té un bitrate total de 270 Mbps, independentment de si transporta vídeo
digital a 8 bit/mostra o 10 bit/mostra (si es treballa en 8 bits/mostra es posen dos bits a
zero).

Els senyals de referència temporals


Permeten identificar l’inici de les línies digitals i el començament de les dades de vídeo
actiu, de la mateixa manera que feien els sincronismes, en el senyal de televisió
analògic.

Existeixen dues referències temporals que indica el començament de la línia activa


(SAV) i el final (EAV). Cada referència temporal està formada per una seqüència de
quatre paraules, que prenen els valors hexadecimals

76
FF 00 00 XX.

Les tres primeres paraules adverteixen la presència d’una referència temporal. La


quarta paraula de la referència temporal informa si la línia actual pertany a l’esborrat
vertical, a quin camp pertany i si la referència temporal és EAV o SAV.

Els codis 00 i FF estan reservats per a la identificació dels sincronismes i no es poden


trobar enlloc més del senyal.

Dades auxiliars

Partint d’una freqüencia de 27 mostres/s, en una línia de durada 64 µs tindrem 270


mostres/s x 64 µs/línia = 1728 mostres/línia.

D’aquestes 1728 mostres/línia, 1440 són de mostres actives (720 Y + 360 B-Y + 360
R-Y), 8 són per als sincronismes (4 pel SAV i 4 pel EAV). La resta, 280, s’utilitzen per
transmetre altres dades, com per exemple àudio digital. Hi ha capacitat per a
transmetre fins 8 canals estèreo d’àudio dins del senyal SDI.

Aleatorització i autosincronització
El senyal resultant ha de ser robust als errors i autosincronitzable, i per això
s’aleatoritza i es codifica mitjançant una codificació NRZI.

L’aleatorització permet evitar ràfegues de 0 i 1 que podrien donar problemes de


sincronització en el descodificador. Amb l’aleatoritzador aconseguim un senyal
autosincronitzable.

El codificador NRZI permet obtenir un senyal sense polaritat. La informació està


codificada en les transicions, fent que el senyal resultant no tingui polaritat i sigui més
fàcil de manipular.

§ [Fernàndez2001] p. 359

Senyals HDTV
A més a més del senyal SDI de definició estàndard, existeixen altres senyals d’alta
definició amb les corresponents interfícies d’interconnexió. Com a quadre resum
podem obtenir els següents formats:

77
Bitrate-­‐
total   Bitrate-­‐net  
Standard   Nom   Mostres/   Línies/   Frame   (4:2:2,  10   (4:2:2,  10  
ITU   comercial   línia   imatge   rate   Fmy   bit)   bit)   Interfície  
ITU-­‐R  601   576i   720   576   25   13,5  MHz   270  Mbps   207,3  Mbps   SDI  
1,485  
ITU-­‐R  1543   720p   1280   720   50   74,25  MHz   Gbps   921,6  Mbps   HD-­‐SDI  
1,485   1,0368  
ITU-­‐R  709   1080i   1920   1080   25   74,25  MHz   Gbps   Gbps   HD-­‐SDI  
2  x  HD-­‐
2,0736   SDI/  3G-­‐
ITU-­‐R  709   1080p   1920   1080   50   148,5  MHz   2,97  Gbps   Gbps   SDI  

RESUM
En aquesta sessió hem vist les dues interfíces principals d’interconnexió de vídeo
digital, la interfície paral·lela i la interfície sèrie.

78
SESSIÓ 14: Fonaments de compressió
FITXA DE LA SESSIÓ
v Nom: Fonaments de compressió
v Tipus: teòrica
v Format: no presencial
v Durada: 2 hores
v Dedicació: 2 hores
v Treball a lliurar: no
v Material:
o Bibliografia bàsica:
§ [Fernàndez2001]
§ [Benoit1998]
§ [Torres1993]
o Bibliografia complementària:
§ [Bethencourt1990]

PRECEDENTS
En les sessions anteriors, vàrem fer una introducció del senyal digital de televisió i
estudiar la norma ITU-R601.

OBJECTIUS
En aquesta sessió veurem la necessitat de comprimir per tal de poder transmetre el
senyal de televisió digital, i estudiarem els mètodes estadístics i predictius que ens
permeten fer aquesta compressió.

CONTINGUTS

5. Compressió de vídeo

5.1. Necessitat de la compressió

5.1.1. Necessitat de la compressió


La digitalització del senyal de vídeo genera un gran volum de dades. Per un altre
costat, sabem que els amples de banda disponibles en les diferents xarxes de
transmissió són limitats, i per tant, es fa necessari comprimir el senyal de vídeo digital,
existint un compromís entre compressió i qualitat de la imatge.

Afortunadament, les dades a transmetre presenten grans dosis de redundància. Els


mètodes de compressió permeten eliminar la redundància per tal que la informació
sigui més compacta i que, per tant, es pugui representar amb menys bits.

79
En una seqüència de vídeo existeixen tres tipus de redundància: l’estadística, la
temporal i l’espacial. En les properes seccions en parlarem amb més detall.

Factor de compressió
Un sistema de compressió es caracteritza pel seu factor de compressió. El factor de
compressió és el paràmetre bàsic que ens indica el nombre de vegades que reduïm el
volum d’informació després de la compressió, es defineix, doncs, com:

volum dades original


Factor de compressió =
volum dades comprimides

Evidentment per tenir compressió cal que el factor de compressió sigui major que la
unitat.

Tipus de compressors
Existeixen diverses formes de classificar les tècniques de compressió. Una d’elles és
en funció de la distorsió introduïda en el procés de compressió.

Anomenem sistemes reversibles, sense pèrdua o lossless a aquells sistemes que no


introdueixen cap distorsió en el procés. Normalment, el factor de compressió obtingut
és relativament baix (2-4). Les aplicacions que requereixen d’aquest tipus de
compressió són aquelles on generalment qui les consumeix és una màquina (fitxers
binaris i executables) o un expert (imatges mèdiques o científiques).

En contraposició, els mètodes irreversibles, amb pèrdua o lossy són aquells que
introdueixen una certa distorsió en el procés. Permeten grans factors de compressió,
que són variables en funció de la distorsió que la nostra aplicació accepti.
Generalment, s’apliquen a contingut digitalitzat com l’àudio, les imatges o el vídeo, on
l’usuari final és l’esser humà que està disposat a acceptar certa distorsió en el resultat
final.

Aquests sistemes de compressió seran, més o menys, eficients en funció de la


redundància existent en el senyal. A continuació, es descriuen les diverses
redundàncies.

Redundància estadística
En qualsevol volum de dades hi ha símbols que apareixen més que altres. Els
mètodes de compressió reversibles (tipus ZIP, ARJ, etc.) permeten eliminar aquesta
redundància, utilitzant mètodes de codificació de longitud variable. Aquesta
compressió és totalment reversible.

80
Redundància temporal
En una seqüència d’imatges, el contingut entre imatges no varia excessivament, a
excepció de quan hi ha canvis de pla o moviments bruscos. Aquesta repetició
d’informació al llarg del temps és la redundància temporal. Per eliminar la redundància
temporal generalment s’utilitzen mètodes anomenats predictius. Utilitzant mostres de
la imatge anterior, i mitjançant tècniques predictives, podrem deduir de manera
aproximada quina és la situació dels píxels en la imatge actual. L’eliminació de la
redundància temporal és el procés que comprimirà més en una seqüència de vídeo.

Redundància espacial
En una imatge, els píxels propers en l’espai presenten valors de luminància i
crominància molt semblants. Aquesta semblança és la redundància espacial. Els
contorns trenquen aquesta redundància. L’eliminació de la redundància espacial
generalment es realitza mitjançant tècniques transformades que concentren l’energia
del senyal en pocs coeficients decorrelats entre ells.

Redundància psicofísica i psicovisual


Els nostres sistemes de percepció estan limitats. Hi ha informació, visual i audible que
no detectem i que pot ser eliminada. Per exemple, hi ha detalls fins d’una imatge que
són imperceptibles visualment i que, per tant, poden ser considerats redundants o
superflus des del punt de vista visual.

§ [Fernàndez2001], p. 368-370

5.2. Fonaments de la compressió de vídeo

5.2.1. Mètodes estadístics


Els mètodes estadístics s’utilitzen per eliminar la redundància estadística. En general,
els mètodes estadístics són mètodes de compressió reversible (lossless). Permeten
recuperar la imatge original, mantenint el 100 % de la seva qualitat, però presenten
factors de compressió petits (entre 2 i 3). D’entre els diversos mètodes estadístics
podem mencionar els codis de longitud variable, els codis basats en diccionaris i el
codificador aritmètic. Un dels més utilitzats en vídeo, i a la vegada simple, és el codi de
longitud variable.

Vegeu [Benoit1998], pàgines 25-28

81
Codis de longitud variable. Huffman
En els codis de longitud variable (VLC, Variable Length Code) es defineix una taula de
símbols obtinguda estadísticament a partir de la freqüència d’aparició de cada símbol
en una seqüència. La base del codi consisteix en assignar codis curts als símbols més
probables, i codis més llargs als símbols que apareixen amb menys freqüència.
Aconseguint reduir la longitud mitja del senyal codificat final.

Per que un codi d’aquest tipus funcioni cal que ens assegurem que la descodificació
no té cap ambigüitat. Per aconseguir-ho cal que cap codi sigui prefix de cap altre. Per
entendre el concepte suposem que volem comprimir la següent seqüència de lletres:

a e c e d f a a c d.

Aquests 10 símbols provenen d’un alfabet de només 5 lletres. Si els volguéssim


codificar binàriament amb un codi de longitud fix ens caldrien 3 bits/símbol i per tant 30
bits en total. Una possible assignació de codis seria aquesta:

símbol codeword
a 000
e 001
c 010
d 011
f 100

Tot i així podem cercar un codi més eficient que codifiqui amb un codi binari més curt
aquells símbols que són més probables:

símbol probabilitat codeword


a 3/10 0
e 2/10 1
c 2/10 00
d 2/10 01
f 1/10 11

Aquest codi presenta una longitud mitja per símbol de 1,5 bits/símbol i per tant
comprimiria amb 15 bits la seqüència de 10 símbols. Obtenint un factor de compressió
respecte el codi de longitud fix de FC = 30/15 = 2. Malgrat tot, aquest codi no és vàlid.
La seva descodificació no és única, ja que davant d’un 0, el descodificador no té forma
de saber si ha de descodificar un a o es tracta del principi d’una c o d.

Per construir un codi vàlid cal que cap codi sigui prefix de cap altre. Podríem construir
molts codis que tinguessin aquesta propietat, però de tots ells el que té millors
prestacions de compressió és el codi de Huffman. Consisteix en ordenar els símbols
de major a menor probabilitat i després, iterativament, anar agrupant els dos símbols
de menor probabilitat. A cada agrupació, sumem les probabilitats de cada símbol o
grups de símbols que agrupem. Finalment, resta només una sola branca que haurà de
tenir la suma de totes les probabilitats, és a dir, la unitat.

82
Un cop aquest arbre està fet, cal assignar, començant per la branca arrel, un 0 o un 1
a cada branca. Construint el codi final a partir de la lectura de cada camí, des de l’arrel
a les fulles:

Així doncs, el codi obtingut assegura descodificació unívoca, tot oferint la màxima
compressió possible que podem obtenir amb un codi de longitud variable. En aquest
cas, la longitud promig del codi és de 2,3 bits/símbol, que correspon a un factor de
compressió de FC = 30/23 = 1,3.

De forma similar, i complementaria a l’anterior, hi ha el codi de longitud de segment


(RLC; Run Lenght Code) que evita la transmissió consecutiva de valors repetits.
Vegeu [Benoit1998], a les pàgines 25-26.

5.2.2. Mètodes predictius


Els mètodes predictius són mètodes de compressió irreversibles (lossy), només
aplicables a dades digitalitzades, com és el cas del senyal de televisió. Introdueixen
certa distorsió en la qualitat de la imatge, podent recuperar una aproximació de
l’original, amb un grau de qualitat inversament proporcional al factor de compressió.
Ofereixen factors de compressió majors. Els mètodes predictius s’encarreguen
d’eliminar la redundància temporal existent entre imatges.

83
Els mètodes predictius eviten enviar informació redundant que es pot predir amb les
imatges anteriors, enviant només l’error de predicció. Vegeu l’explicació a
[Torres1993], pàgines 168-181.

La clau dels sistemes predictius consisteix a predir la informació, a codificar en funció


de les mostres ja codificades i enviar només la diferencia entre l’original i la predicció,
anomenat error de predicció. L’error de predicció, en tenir una estadística amb valors
propers a zero, es pot comprimir molt més que no pas la imatge original.

L’aplicació dels mètodes predictius per codificar imatges consecutives té el problema


que en cas que hi hagi moviment entre una imatge i l’altra la predicció és errònia. És
per això que, abans de fer la predicció, el que cal és detectar el moviment entre les
imatges (estimació de moviment) i després fer una predicció que contempli el
moviment que hi ha hagut entre imatges (compensació de moviment).

Estimació de moviment
El primer pas per tal de reduir la redundància temporal entre imatges és l’estimació de
moviment, comparant dues imatges consecutives. La informació de moviment
s’expressa mitjançant vectors de moviment, associats a cada bloc, generalment
particions de 16 x 16 píxels de la imatge.

Per tal de poder trobar el vector de moviment òptim per a cadascun dels blocs
existeixen diferents mètodes, entre els quals podem destacar l’estimació de moviment
per la tècnica del block matching. Aquesta tècnica consisteix a trobar, per a cada bloc
de la imatge, un bloc que sigui el més semblant possible a l’inicial, dins d’una àrea de
cerca en la imatge que ens serveix de referència per a fer la predicció.

Per tal de poder aplicar aquest mètode, cal que es compleixin unes condicions: el
moviment ha de tenir lloc en el pla perpendicular a l’eix de la càmera i només en forma
de translacions, la il·luminació ha de ser espacialment i temporalment uniforme i les
oclusions d’objectes han de ser infreqüents.

El block matching es pot aplicar de diverses formes, el mètode de cerca exhaustiva


(full search) consisteix a buscar en la imatge de referència el bloc que més s’assembla
de formar exhaustiva (tenint en compte totes les possibilitats dins de l’àrea de cerca).
Aquest mètode permet obtindre una molt bona solució, però mitjançant un alt cost de
computació.

Una simplificació de la cerca exhaustiva és la cerca en tres passes que consisteix a


seleccionar només un conjunt de punts de forma iterada en tres passes per a fer la
comparació entre els blocs. El sistema és molt més ràpid a costa d’obtenir una solució
subòptima.

§ [Fernàndez2001] p. 373-376

§ [Benoit1998] p. 42-43

84
Compensació de moviment
Abans de codificar la imatge, tenim en compte la informació proporcionada per la
imatge anterior i el vector de moviment. Només cal enviar l’error entre aquesta
predicció i la imatge real, podent codificar més eficientment la imatge actual.

Quan més exacte sigui el vector de moviment, menys error de predicció hi haurà i més
eficient serà el compressor.

§ [Fernàndez2001] p. 377

RESUM
En aquesta sessió hem vist la necessitat de comprimir el senyal de vídeo digital,
eliminant la redundància. Hem estudiat els mètodes estadístics i predictius que
permeten eliminar la redundància estadística i temporal, respectivament.

85
86
SESSIÓ 15: Mètodes de compressió
transformats
FITXA DE LA SESSIÓ
v Nom: Mètodes de compressió transformats
v Tipus: teòrica
v Format: no presencial
v Durada: 2 hores
v Dedicació: 2 hores
v Treball a lliurar: no
v Material:
o Bibliografia bàsica:
§ [Fernàndez2001]
§ [Benoit1998]
§ [Torres1993]
o Bibliografia complementària:
§ [Bethencourt1990]

PRECEDENTS
En la sessió anterior vam estudiar els mètodes estadístics (codis de longitud variable) i
predictius (estimació i compensació del moviment) que ens permetien comprimir el
senyal de vídeo.

OBJECTIUS
En aquesta sessió estudiarem els mètodes transformats que permeten eliminar la
redundància espacial. També estudiarem els estàndards de compressió de vídeo per a
videoconferència.

CONTINGUTS

5.2.3. Mètodes transformats


Els mètodes transformats són mètodes de compressió irreversibles en el quals es fa
un canvi de base per tal que el nombre de bits a transmetre sigui menor que el de la
imatge sense transformar.

Introdueixen certa distorsió en la qualitat de la imatge, podent recuperar una


aproximació de l’original, amb un grau de qualitat inversament proporcional al factor de
compressió. Ofereixen factors de compressió majors i s’encarreguen d’eliminar la
redundància espacial i temporal.

Els sistemes irreversibles només són aplicables a dades digitalitzades, com és el cas
del senyal de televisió.

87
Els objectius d’aquestes tècniques són concentrar l’energia del senyal en el menor
nombre possibles de coeficients, i descorrelar aquests. En tenir uns coeficients
descorrelats, aquests es poden quantificar de forma independent, podent aplicar més o
menys quantificació, d’acord amb la corba de sensibilitat de l’ull. Vegeu [Torres1993],
pàgines 182-188

La transformada discreta del cosinus


La DCT (Discrete Cosine Transform) deriva de la transformada discreta de Fourier
(DFT, Discrete Fourier Transform) però compacta millor l’energia, havent de
transmetre menys coeficients.

La DCT no redueix directament el nombre de bits a transmetre sinó que s’aplica a


blocs de 8 x 8 píxels. La reducció en el nombre de bits prové de la ponderació
d’aquests valors segons la resposta de l’ull humà, en la qual prenen més importància
els coeficients de baixa freqüència.

Cada coeficient de la DCT original és dividit pel seu valor corresponent en la matriu de
quantificació, que no és única. Com que la divisió no és exacta, produeix pèrdues que
fan que el procés no sigui reversible.

La matriu de quantificació s’envia conjuntament amb la imatge, empitjorant el bitrate.


Realment només s’envia la matriu de quantificació cada cop que es canviï.

La magnitud de cada coeficient DCT indica la contribució de freqüències horitzontals i


verticals del bloc. El primer coeficient és l’anomenat coeficient de contínua (DC). A
mesura que ens movem en l’eix X, la freqüència horitzontal augmenta, i en moure’ns
per l’eix Y, augmenta la freqüència vertical.

Els coeficients transformats són codificats seguint el camí d’energia decreixent,


començant pel coeficient de contínua, i seguint amb un escombrat en forma de zig-
zag.

La manera d’enviar els coeficients contribueix a reduir el bitrate. Un buffer fa el control


del flux de dades per tal d’obtenir un bitrate constant. Si el buffer està molt ple, proper
a l’overflow, s’augmenten els valors de la matriu de quantificació, provocant una
disminució de les dades a transmetre, empitjorant la qualitat de la imatge. Si una
imatge està per sota d’aquest bitrate constant, el que es fa és disminuir els coeficients
de la matriu de quantificació, o afegir bits de farciment (stuffing bits).

§ [Fernàndez2001], p. 383-390

§ [Torres1993], p. 188-194

§ [Benoit1998], p. 28-35

88
5.3. Estàndards de compressió de vídeo

5.3.1. Estàndard H.261


Els estàndards H.261 i H.263 estan concebuts per aplicacions audiovisuals a p x 64
kbps, on p és el nombre de canals XDSI utilitzats. El bitrate va des de 64 kbps a 1,5
Mbps. Concretament són utilitzats en videotelefonia (p = 1, 2) i videoconferència sobre
XDSI (p>2).

Són estàndards que operen en temps real, amb un retard inferior a 150 ms, oferint un
factor de compressió unes tres vegades superior al JPEG. Vegeu [Fernàndez2001],
pàgines 379-381 i [Torres1993], pàgines 210-216.

Formats d’imatge
Els formats utilitzats són el CIF (Common Intermediate Format) i el QCIF (Quarter of
CIF).

En el CIF, la freqüència de mostratge de la luminància és de 6,75 MHz, i la dels


senyals diferència, la meitat, 3,375 MHz. El patró de mostratge utilitzat és 4:2:0,
obtenint imatges de 352 x 288 mostres de luminància, i 176 x 144 mostres d’U i V.

El QCIF està orientat a videotelefonia, on l’ample de banda és menor. Les imatges


tenen 176 x 144 mostres de luminància, i 88 x 72 mostres d’U i V.

§ [Benoit1998], p. 21-22

Mètodes utilitzats
Per tal de comprimir la informació s’utilitza la codificació de longitud variable que
permet eliminar la redundància estadística. S’aplica sobre macroblocs d’imatge de 16 x
16 píxels.

Amb la predicció temporal eliminem la redundància entre imatges consecutives. Es fa


sobre macroblocs d’imatge de 16 x 16 píxels i dins de finestres de recerca de +- 15.

Finalment, la DCT, aplicada en blocs de 8 x 8 píxels, permet reduir la redundància


espacial.

Modes de codificació
En el mode intraframe, els valors de luminància i crominància es codifiquen sense cap
tipus de predicció. S’aplica directament la DCT als valors Y, U i V de la imatge.
D’aquesta manera disposem de punts de partida i evitem arrossegar errors que s’hagin
pogut produir durant la transmissió.

89
En el mode interframe, només es codifica l’error de predicció, després d’haver
comparat la imatge amb la predicció. Si la predicció no és prou bona, s’utilitza el mode
intraframe.

A la pàgina 382 de [Fernàndez2001] podeu veure el diagrama de blocs del codificador


H.261, i a la pàgina 391, del descodificador.

RESUM
En aquesta sessió hem estudiat els mètodes transformats que permeten eliminar la
redundància espacial. També hem estudiat l’estàndard H.261 de compressió de vídeo
per a videoconferència.

90
SESSIÓ 16: Introducció al MPEG
FITXA DE LA SESSIÓ
v Nom: Introducció al MPEG
v Tipus: teòrica
v Format: no presencial
v Durada: 2 hores
v Dedicació: 2 hores
v Treball a lliurar: no
v Material:
o Bibliografia bàsica:
§ [Fernàndez2001]
§ [Benoit1998]
o Bibliografia complementària:
§ [Bethencourt1990]

PRECEDENTS
En les sessions anteriors vam estudiar els diferents mètodes: estadístics, predictius i
transformats que ens permetien comprimir el senyal de vídeo. També vàrem estudiar
els estàndards utilitzats per a videoconferències.

OBJECTIUS
En aquesta sessió estudiarem els estàndards MPEG. Estudiarem el MPEG2 vídeo, els
perfils i nivells que utilitza, i la sintaxi emprada.

CONTINGUTS

5.3.2. Estàndard MPEG-1


El comitè MPEG (Motion Picture Experts Group) sorgeix de la col·laboració competitiva
entre empreses per definir els estàndards per a la codificació eficient d’informació
audiovisual en format digital.

Aquest concepte d’eficiència en la codificació ha anat evolucionant i es refereix a que


la informació ocupi el mínim espai amb la màxima qualitat, un accés ràpid a la
informació, possibilitat de mètodes de cerca flexible, etc.

Els estàndards MPEG no descriuen mètodes, ni el procés de codificació, ni els detalls


del codificador. En canvi, sí especifiquen els formats en què es presentaran les dades
al descodificador i un conjunt de regles per interpretar aquestes dades.

Els formats de dades reben el nom de sintaxi i s’utilitzen per crear diferents tipus de
bitstreams. Les regles per a interpretar les dades s’anomenen semàntica. L’únic
requeriment que MPEG disposa al codificador és que generi un bitstream
sintàcticament correcte i que pugui ser interpretat seguint la semàntica de
descodificació de qualsevol descodificador compatible.

91
El fet que el descodificador no sigui estàndard implica que poden coexistir codificadors
compatibles amb nivells de prestació diferents.

Els estàndards MPEG són jeràrquics: els nivells superiors sempre són compatibles
amb els anteriors. L’estàndard MPEG1 és utilitzat en sistemes d’emmagatzematge
(CD-ROM, etc.) i ofereix una qualitat VHS. El seu bitrate és petit, entre 1,5 i 3 Mbps, i
el format d’imatge utilitzat és el SIF. MPEG2 està orientat a la transmissió de TV digital
i HDTV. El bitrate és entre 4 i 25 Mbps i el format d’imatge, el ITU601. MPEG3 està
orientat a la compressió HDTV, però no s’utilitza ja que el nivell anterior (MPEG2) és
prou flexible. MPEG4 està dissenyat per sistemes de compressió multimèdia.

§ [Fernàndez2001], p. 392-394

MPEG1
L’estàndard MPEG1 (ISO11172) va sorgir d’un comitè constituït al 1988 per 15
participants. La primera redacció es va presentar el 1990. En aquell moment, el comitè
ja estava constituït per 150 participants.

És un estàndard orientat a l’emmagatzematge de vídeo en medis digitals i aplicacions


multimèdia. Parteix de la filosofia H.261 que vam veure a la sessió anterior, però
introdueix lleugeres modificacions per treballar a velocitats més elevades. Proporciona
una qualitat semblant al VHS amb un bitrate de 1,5 Mbps.

§ [Fernàndez2001] p. 395-397

§ [Torres1993], p. 217-221.

MPEG1 Systems
El MPEG1 Systems defineix una estructura de paquets per multiplexar dades de vídeo
i àudio en un únic stream, mantenint la seva sincronització.

La sintaxi garanteix la correcta sincronització entre vídeo i àudio (mitjançant segells


temporals), l’accés aleatori (en punts de la seqüència amb codificació intraframe) i la
coexistència de diferents streams de vídeo i àudio.

§ [Fernàndez2001], p. 398

§ [Benoit1998], p. 65-69

92
MPEG1 vídeo
MPEG1 vídeo especifica la sintaxi de l’stream de vídeo i el procés de codificació
corresponent. Inicialment va ser concebut per a codificar vídeo a resolució CIF, encara
que accepta resolucions majors. El format SIF emprat és el següent:

En PAL, tenim 25 imatges per segon, de 352 x 288 píxels. En NTSC, disposem de 30
imatges per segon, de 352 x 240 píxels. En ambdós casos, el patró de mostratge és
4:2:0, les imatges, progressives i el bitrate sense compressió, de 30 Mbps.

Els mètodes de codificació per eliminar les redundàncies espacial i temporal són molt
similars als emprats en H.261.

§ [Fernàndez2001], p. 399

§ [Benoit1998], p. 36-44

MPEG1 àudio
El MPEG1 àudio especifica la sintaxi de l’stream d’àudio i el procés de codificació
corresponent. El sistema de compressió es basa en una descomposició en subbandes
del senyal, aconseguint bitrates de 64, 128 o 192 kbps.

§ [Fernàndez2001], p. 400

§ [Benoit1998], p. 58-61

5.3.3. Estàndard MPEG2


L’estàndard MPEG2 és compatible amb el seu antecessor, MPEG1, però suporta
l’escombrat entrellaçat. Està orientat a vídeo d’alta qualitat (NTSC, PAL, SECAM,
HDTV) i disposa de múltilples formats, tamanys i patrons de mostratge.

El bitrate del MPEG2 va des de 1,5 a 25 Mbps i es poden recuperar errors


d’emmagatzematge o transmissió.

El sistema de predicció de moviment és millor que en el MPEG1 i tenim la possibilitat


de disposar de múltiples qualitats i resolucions a partir d’un únic stream, gràcies a
l’escalabilitat.

Les principals aplicacions del MPEG2 són la distribució de senyal de televisió digital
terrestre, per cable o satèl·lit, HDTV, DVD, vídeo sota demanda, vídeo professional
(edició no lineal, postproducció, etc.).

En les pàgines 404 i 405 de [Fernàndez2001] podeu observar les diferències principals
entre els estàndards MPEG1 i MPEG2.

L’anatomia del MPEG2 la podeu veure a la pàgina 403 de [Fernàndez2001].

93
MPEG2 vídeo
El desenvolupament de l’estàndard MPEG2 vídeo es va realitzar en dues fases. En
una primera, les empreses competien per tal de treure el seu estàndard.
Posteriorment, van decidir col·laborar entre elles per tal de crear un estàndard únic.

L’MPEG2 suporta vídeo entrellaçat, vídeo escalable amb diferents resolucions i


formats d’imatge.

L’àmplia funcionalitat de l’estàndard està estructurada entorn de 5 perfils bàsics


orientats a aplicacions diferents. Vegeu [Fernàndez2001], pàgines 408-409 i
[Benoit1998], pàgines 44-46.

Perfils i nivells MPEG2


MPEG2 és un estàndard genèric que suporta una gran quantitat d’eines i algorismes.
La construcció de descodificadors que suportessin totes aquestes eines no és
econòmicament viable.

La solució consisteix en agrupar totes les aplicacions possibles en un conjunt de


classes (perfils) organitzades en una estructura jeràrquica. Actualment existeixen 5
perfils (profiles): simple, principal, escalable en SNR, espacialment escalable i alt. Les
seves característiques generals les trobareu a la pàgina 417 de [Fernàndez2001].

A més dels perfils es defineixen el nivells. Els nivells són les diferents resolucions amb
les quals poden treballar cadascun dels perfils. Es defineixen 4 nivells (baix, principal,
alt 1440 i alt) i van des de resolucions tipus CIF fins a alta definició.

No totes les combinacions perfil-nivell són possibles, les que l’estàndard permet són
els punts de conformitat, que podeu trobar a la pàgina 419 de [Fernàndez2001]. Els
dissenyadors de descodificadors s’han d’adherir a aquests parells, ja que no totes les
combinacions són permeses. Només ho són aquelles que tenen sentit des del punt de
vista aplicatiu. Els nivells inferiors també es poden descodificar, encara que no es
poden considerar pròpiament punts de conformitat.

En les pàgines 420-426 de [Fernàndez2001] podeu trobar les característiques,


paràmetres, aplicacions i requeriments dels perfils simple i principal. En les pàgines
424-428 podeu trobar les característiques, aplicacions i requeriments del perfil
escalable en SNR. A les pàgines 427 i 428 podeu trobar les característiques i
requeriments del perfil espacialment escalable i a la pàgina 429, les característiques
del perfil alt.

Malgrat que MPEG2 està finalitzat, el procés de definició de perfils segueix obert per
tal d’acomodar noves eines que poden ser necessàries en un futur. Actualment hi ha
dues àrees per les quals s’estan definint nous perfils: el vídeo professional d’alta
qualitat i el vídeo amb múltiples punts de vista. A les pàgines 431-434 de
[Fernàndez2001] podeu trobar informació sobre aquests nous perfils.

§ [Fernàndez2001], p. 415-434

§ [Benoit1998], p. 46-48

94
Sintaxi del MPEG2 vídeo
La sintaxi especifica com han de ser les dades. Està organitzada entorn d’una
estructura jeràrquica de 6 nivells: seqüència, grup d’imatges, imatge, slice, macrobloc i
bloc. Observeu aquesta jerarquia a la pàgina 436 de [Fernàndez2001].

El nivell superior d’aquesta jerarquia és la seqüència, formada per la seqüència de


vídeo completa. La informació que porta la seva capçalera la podeu veure en la pàgina
438 de [Fernàndez2001]. En aplicacions de radiodifusió, la capçalera es retransmet
cada 500 ms, com a mínim, seguida d’una imatge I, per tal que els nous usuaris
disposin de la informació que transporta.

§ [Fernàndez2001], p. 435-456

Grup d’imatges
Els grups d’imatges (group of pictures, GOP) és la base per a realitzar la codificació
temporal de les imatges. Un GOP està format habitualment per 12 imatges. Si agafem
un nombre més gran, aconseguirem taxes de compressió major però els errors es
propagaran durant més temps.

Les imatges estan constituïdes per slices i és la unitat de codificació bàsica. Podem
distingir tres tipus d’imatges: imatges I (intraframe), imatges P (predicted) i imatges B
(bidirectional).

Les imatges I són les imatges que s’utilitzen en un principi de seqüència d’imatges o
de GOP. En aquestes imatges només s’apliquen tècniques de compressió de
redundància espacial i estadística, per la qual cosa són les que menys compressió
presenten. Permeten definir punts d’accés aleatori a la seqüència, la recerca ràpida i
edició, i eviten la propagació d’errors.

Les imatges P utilitzen la predicció i compensació de moviment, a partir de la imatge I


o P anterior. L’ordre de visualització i transmissió són el mateix. (Vegeu pàgina 440 de
[Fernàndez2001]).

Les imatges B utilitzen predicció bidireccional a partir de les imatges I i P anterior i


posterior. L’ordre de transmissió difereix de l’ordre de visualització. (Vegeu les pàgines
441 i 442 de [Fernàndez2001]). El procés per reordenar les imatges el podeu trobar a
la pàgina 446.

Les imatges I, P i B relacionades entre elles formen un GOP. El factor N és la distància


entre imatges I i el factor M, la distància entre imatges I i P. Aquests factors són
flexibles: un major nombre d’imatges B augmentarà la relació de compressió, però ens
separa les imatges P de les seves referències I, empitjorant la predicció de les imatges
P.

Per escenes amb moviment ràpid, en què els errors de codificació són difícils de
detectar, les imatges P proporcionen un millor compromís entre qualitat i velocitat
d’actualització de la imatge.

95
Els GOP són oberts o tancats en funció de si la primera imatge B necessita o no de
l’anterior imatge P (del GOP anterior) per poder ser predita. Observeu l’exemple de la
pàgina 443 de [Fernàndez2001].

La informació que porta la capçalera de la imatge la podeu trobar a la pàgina 448 de


[Fernàndez2001].

Slice
Un slice (llesca) és una cadena de macroblocs consecutius de longitud arbitrària.

En les imatges I, transmetem tots els macroblocs dins d’un slice, i en les imatges P i B,
els macroblocs nuls (o amb poca informació) poden no ser enviats, però sempre cal
transmetre el primer i darrer macrobloc de l’slice.

Un slice pot ser tan llarg com l’amplada de la imatge, però normalment es divideix per
evitar la propagació d’errors i ja que hi ha informació que es transmet de forma
diferencial de MB a MB (vectors de moviment, component DC). Aleshores, en cas
d’error, aquest es propaga per tot l’slice. Dissenyarem, doncs, la longitud del slice en
funció dels errors de transmissió.

Els vectors de moviment es codifiquen diferencialment dins d’un slice, enviant-se el


primer de forma absoluta. El nivell de DC de la DCT de cada bloc també s’envia de
forma diferencial. Cada nova capçalera de slice es reinicialitza el nivell de DC i els
predictors de vectors de moviment.

A la pàgina 450 de [Fernàndez2001] podeu trobar la capçalera de l’slice.

Macrobloc
És la unitat emprada per a la predicció i compensació de moviment. A cada MB s’hi
associa un vector de moviment.

Per tal d’augmentar la compressió, el codificador pot decidir no enviar alguns MB.

En imatges P, els MB no transmesos són reproduïts pel mateix MB en la imatge


anterior. En imatges B, s’estimen a partir del vector de moviment del MB previ.

A la pàgina 452 de [Fernàndez2001] podeu trobar la capçalera del macrobloc. La seva


estructura per MP@ML la podeu trobar a la pàgina 455.

Tipus de macrobloc
En imatges I només hi ha dos tipus de MB possibles: intra o intra+macroblock_quant.

En imatges P, quan hi ha moviment, s’utilitzen MB inter (amb compensació de


moviment). Si el fons és fix, no es transmet la informació de moviment sinó que es fa la

96
diferència entre MB situats en la mateixa posició. També es poden utilitzar MB intra
quan l’error de predicció és gran i convé més enviar els valors originals.

En imatges B, s’utilitza la compensació de moviment cap endavant (forward, a partir


d’una imatge I o P anterior), cap endarrere (backward, a partir d’una P o I posterior) o
bidireccional (interpolated, fent una mitjana de les dues prediccions anteriors). Això
permet evitar errors de predicció elevats quan hi ha oclusions o aparicions o
desaparicions d’objectes en l’escena. Malgrat tot, si l’error de predicció és massa
elevat, sempre hi ha l’opció d’utilitzar un MB intra.

§ [Fernàndez2001] p. 452-453

Bloc
Els blocs consten de les dades dels coeficients de la DCT quantificats d’un bloc de 8 x
8 píxels. En el MP@ML consta de 6 blocs per MB (4 de luminància i un per cada
component de color).

Existeix una taula de quantificació dels coeficients de la DCT diferent per a MB inter i
per MB intra, ja que tenen estadistiques diferents.

La capçalera de bloc la podeu veure a la pàgina 456 de [Fernàndez2001].

5.4.4. MPEG4 Part-10/H.264

El sistema MPEG4 Part 10 (nomenclatura ISO) o bé H.264 (nomenclatura ITU) és el


sistema de compressió d’imatge de millors prestacions actualment. S’utilitza per a
HDTV i també per a vídeo de baix bitrate, per exemple per a Internet. La base del
codificador és molt semblant als anteriors sistemes, tot incorporant un conjunt de
millores:
• Compensació de moviment amb mida de bloc variable (4 x 4, 8 x 8, 8 x 16,
to 16 x 16).
• Estimació de moviment amb precisió de ¼ de píxel.
• Possibilitat de tenir referència temporal a partir de múltiples imatges.
• Aplicació de predicció espacial en les imatges intra.
• Transformada DCT amb coeficients enters i sobre blocs de 4 x 4 píxels.
• Codificació estadística adaptativa.
• Introducció d’un filtre anti-efecte de bloc en el llaç predictiu.

97
RESUM
En aquesta sessió hem estudiat l’estàndard MPEG1. Hem introduït el MPEG2 i
estudiat els nivells i perfils, i sintaxi del MPEG2 vídeo. Finalment, hem comentat els
principals aspectes del H.264/MPEG4-Part 10.

98
Bibliografia

LLIBRES

Sistemas analógicos y digitales de televisión


Torres, Luis; Lleida, Eduardo; Casas, Josep Ramon
Edicions UPC
Barcelona, 1993
[Torres1993]

Television Measurements. PAL System


Craig, Margaret
Tektronix
Beaverton, 1991
[Craig1991]

La calidad y sus medidas en la señal de televisión


Pérez López, Emilio
Instituto Oficial de Radiotelevisión Española
Madrid, 1993
[Pérez1993]

PAL Plus
Pareja Carrascal, Emilio
Instituto Oficial de Radiotelevisión Española
Madrid, 1995
[Pareja1995]

Sistemas de televisión. Clásicos y avanzados


Bethencourt Machado, Tomás
Instituto Oficial de Radio y Televisión
Madrid, 1990
[Bethencourt1990]

Televisión digital. MPEG-1, MPEG-2, Sistema europeo DVB


Benoit, Hervé
Editorial Paraninfo
Madrid, 1998
[Benoit1998]

99
APUNTS

Sistemes de Televisió
Fernàndez, Gabriel
Enginyeria i Arquitectura La Salle
Barcelona, 2001
[Fernàndez2001]

Televisió. Pràctiques
Güell, Jaume; Ribas, Josep
Enginyeria i Arquitectura La Salle
Barcelona, 2001
[Güell2001]

Encoding Parameters of Digital Television for Studios, ITU-R 601


Unió Internacional de Telecomunicacions
ITU
1990
[itu601]

Conventional Analog Television – An introduction


Kuhn, Kelin J.
1995
www.ee.washington.edu/conselec/CE/kuhn/ntsc/95x4.htm
Referència: [Kuhn1995]

100
Glossari

3-STEP-SEARCH
Mètode d’implementació del block matching en el qual es busca dins un subconjunt de
punts. Menys costós que el full-search però la solució és subòptima.

Aliasing PAL-Plus.
La recepció d’una imatge en 16:9 en una pantalla en 4:3 posa la informació d’alta
freqüència del senyal (detalls de la imatge) en una modulació ultranegra en la part
superior i inferior de la pantalla. Aquestes bandes són les que ajuden als receptors
PAL Plus a fer la reconstrucció de la imatge (ja que sinó hi hauria molt poca resolució).
Mentre enviem el vertical helper no podem enviar color.

BANDES DE MACH
Són les barres de color que a vegades veiem en les cartes d’ajust. La luminància en
aquestes barres és constant, però nosaltres la percebem diferent perquè tendim a
comparar-les amb les del voltant.

BLOCK
Cada macroblock està format per un conjunt de 4 blocks de 8 x 8 píxels sobre els
quals es fa la DCT.

BLOCK MATCHING
Tècnica d’estimació de moviment. És el més usat per la seva senzillesa. Consisteix a
dividir la imatge en blocs. Té dues modalitats: full-search i 3-step-search (cerca en tres
passes).

BURST
Sincronització de color. Té la funció de sincronitzar la Fsp del OL i informar del tipus de
línia senar o parell. És un sincronisme perfecte de 0,3 V d’amplitud en fase entre el
senyal de l’emissor i el receptor (l’ha de conèixer el receptor per agafar-lo com a
referència). Consta de 10 a 12 cicles de subportadora inserits al pòrtic posterior del
senyal en color per transmetre la sincronització local del receptor (senyal de vídeo
compost).

CAMP
Per tal d’aconseguir unes imatges contínues hem d’arribar a veure més de 40 imatges
per segon. Degut al fet que la freqüència de xarxa seria massa crítica, desdoblem les
imatges formades per 625 línies en dos camps, un d’ells formats per 312,5 línies
parelles i l’altre per les 312,5 línies senars. En la pantalla, primer apareixerà un camp i
llavors l’altre, donant l’efecte que tenim el doble d’imatges per segon i podem veure les
imatges més contínues (sense la sensació de pampallugueig).

CODI DE HUFFMAN

101
Codi de longitud variable de descodificació unívoca. És òptim basat a partir de
probabilitats.

CODIFICACIÓ DUOBINÀRIA
Reduir l’ample de banda a la meitat passant de dos a tres nivells. Amb aquest sistema
l’ample de banda varia segons la component que estem transmetent.

COEFICIENTS TRIESTÍMULS
A causa del tipus de cèl·lules con, tots els colors els podem definir com una
combinació del vermell (R), verd (G) i blau (B). La llum blanca és quan R = G = B.

COFMD
Coded Orthogonal Frequency Division Multiplexing. S’utilitza en el DVB-T i permet
aprofitar molt bé l’espectre. Es basa amb una modulació multiportadora on els ecos es
poden cancel·lar fàcilment.

COMPRESSIÓ
La compressió intenta eliminar la redundància que podem trobar en determinades
fonts d’informació. La compressió pot ser reversible (quan no hi ha pèrdua amb el que
comprimeixes) o irreversible (amb pèrdua, lossy, són els que l’original i el reconstruït
no són idèntics).

CORRECCIÓ EN GAMMA
La correcció en gamma consisteix a aplicar en el transmissor una no linealitat al senyal
del tipus elevat a 1/gamma. Això es fa per compensar la no linealitat que existeix al
tubs de raigs catòdics dels receptors que generalment són del tipus elevat a gamma.
Gamma és un factor que dependrà de la no linealitat del receptor i acostuma a prendre
valors al voltant de 2. D’aquesta forma la resposta global del sistema emissor-receptor
serà lineal.

CROMINÀNCIA
És la especificació del color (matís i saturació).

CROSS-COLOR
Interferència del color sobre la luminància. Per molt que s’utilitzin els espais de Gray,
com que compartim el mateix ample de banda entre la luminància i el color sempre
tenim alguna interferència.

CROSS-LUMINÀNCIA
Interferència de la luminància sobre el color. Per molt que s’utilitzin els espais de Gray,
com que compartim el mateix ample de banda entre la luminància i el color sempre
tenim alguna interferència.

CROSSTALK
Interferència entre els senyals I i Q, els quals haurien de ser independents. Això
produeix un canvi en el matís del color (igualment que els errors de fase).

DATACAST

102
Servei de lloguer per transmetre dades utilitzant els les línies 20 – 21 del camp I i les
línies 333 – 334 del camp II.

DCT
Discrete Cosine Transform. És una transformada real i fixa. Proporciona resultats molt
similars als que obtindrem amb KLT. Els seus coeficients ens permeten codificar les
imatges en blocs sobre els quals es farà la DCT.

DEFLEXIÓ
És el fet de desviar el feix d’electrons d’esquerra a dreta en un TRC. Això
s’aconsegueix creant un camp magnètic, donant una rampa de corrent a les bobines
de deflexió horitzontals. Existeix també la deflexió vertical que serveix perquè el feix
faci el moviment de dalt a baix.

DFT
Discrete Fourier Transform. Transformada complexa que s’utilitza en l’anàlisi espectral.

DIGITALITZACIÓ
Un senyal digital és més robust al soroll que un d’analògic i necessita menys potència
per ser transmès. L’ús de circuits electrònics digitals ens permeten manipular més
fàcilment el senyal, aplicar codis correctors d’errors, comprimir, utilitzar canals
adjacents (amb més ample de banda).

DISTORSIÓ
La distorsió és una malformació del senyal a causa d’una resposta imperfecta del
sistema.

DISTORSIÓ DE COIXÍ
Per solucionar el fet que la pantalla d’un televisor és aproximadament plana (els punts
dels extrems estan en un punt més llunyà del centre de la pantalla i les imatges
queden bombades en forma de coixí), es col·loquen imants a cada banda, en la
televisió en blanc i negre, o bé ajustem el corrent de deflexió electrònicament, en el
cas de la televisió en color.

DISTORSIÓ DE LINEALITAT
Causada per la no curvatura de la pantalla de televisió (la separació entre línies de
l’extrem superior i inferior és major que la separació que hi ha entre les del centre de la
pantalla). Es pot solucionar fent una correcció en “S” que suavitzarà la corba de la
deflexió horitzontal.

EDTV
Extended Definition Television. Sistemes analògics que milloren el senyal transmès.
Els més importants són PAL PLUS i MAC.

EFECTE PERSIANA
Barres de Hannover. En la imatge hi ha línies que es veuen més lluents que d’altres.
Quan la correcció en gamma és major que 5 º part de la informació de luminància
viatja en el senyal de croma. L’entrellaçat agreuja aquest fenomen.

103
EL·LIPSES DE MC.ADAM
Fa una reorientació dels eixos U i V i els anomena I i Q. Aquesta reorientació es basa
en què cada llum dins el gràfic d’eixos u i v té forma d’el·lipse. Si travessem les
el·lipses pel cantó curt, la variació d’el·lipses és molt més ràpida i tindrem més
sensibilitat al color. Per tenir una sensibilitat màxima cal que els nous eixos tinguin un
angle superior de 33 º respecte els antics.

EMMASCARAMENT VISUAL
Reducció visual d’un cert estímul per la producció d’un canvi espacial (poc sensibles al
contorn) i temporal (poc sensibles al detall en imatges que es mouen).

ENTRELLAÇAT
Desdoblament de les imatges en dos camps amb la meitat de línies cadascun.
L’objectiu de l’entrellaçat és el de proveir d’un sistema de visualització lliure de flícker
però amb un nombre d’imatges per segon relativament petit.

ESBORRAT (BLANKING)
L’esborrat és l’interval de temps durant el qual el TRC no ha de pintar res per pantalla,
ja que el feix d’electrons està retornant horitzontalment o verticalment. L’esborrat
horitzontal està format per dos pòrtics i un sincronisme que en total ocupen 12
microsegons de cada línia. L’esborrat vertical té una durada de 25 línies, formades per
un conjunt de polsos de preigualació, sincronisme vertical i postigualació. Durant
l’esborrat vertical es contínua enviant el sincronisme horitzontal.

ESTIMACIÓ DE MOVIMENT
Els objectes en moviment tenen un error de predicció molt gran. Per solucionar-ho
tindrem en compte el moviment en la predicció amb vectors de moviments. Existeixen
diferents mètodes per tal de realitzar aquesta estimació, com són els mètodes de
gradient, correlació de fase i block matching. L’estimació es realitza sobre la Y. Els de
la Cr es basen en els de la Y dividits entre 2.

FACTOR DE COMPRESSIÓ
Relació que ens indica el nombre de vegades que reduïm la informació en un sistema
de compressió de dades.

FACTOR DE KELL
Factor que defineix la pèrdua de definició vertical. És degut al sistema d’entrellaçat i a
deficiències mecàniques del sistema d’entrellaçat dels televisors.

FLÍCKER
La freqüència crítica de flícker és el nombre d’imatges discontínues que calen rebre en
un segon perquè ens sembli veure una imatge constant. Aquesta freqüència és de 40
Hz. (40 imatges/segon) i pot augmentar si augmenta la luminància o augmenta el
tamany de la superfície il·luminada. Flícker de grans àrees i flícker de línia.

FULL-SEARCH

104
Mètode d’implementació del block matching. Consisteix en buscar totes les possibles
posicions del bloc de referència. Molt costós però trobem el resultat òptim.

GOP
Group of pictures. Forma part de la sintaxi del stream del MPEG. Un GOP conté la
informació d’una sèrie d’imatges codificades. Un GOP és obert quan es pot relacionar
amb un altre; en canvi, és tancat quan no podem fer-ho.

HD-MAC
Sistema d’alta definició HDTV que es compon de 1250 línies/imatge, 25
imatges/segon, 2 camps imatge i relació 16:9. Treballa amb vectors de moviment per
interpolar una fusió de les 2 trames sols al lloc on hi ha hagut moviment.

HDTV
Sistemes analògics d’alta definició. Permet obtenir més resolució espacial, relació
d’aspecte panoràmica 16:9, millora del color i so digital. N’hi ha dos tipus: HD-MAC
(1250 línies/imatge, 25 imatges/segon, 2 camps imatge i relació 16:9). MUSE (1050
línies/imatge, 30 imatges/segon, 2 camps/imatge i relació 16:9). S’aconsegueix
augmentar la resolució espacial, millora del color, so digital i relació d’aspecte
panoràmica 16:9. Mostratge subNyquist.

IDTV
Improved Definition Television. Millora feta en els receptors a partir de filtres COMB,
cancel·ladors d’eco i sistemes de 100 Hz. Amb això s’aconsegueix eliminar totalment
el flícker (però apareix un problema temporal que es manifesta com una tremolor).

ILC
Índex de luminància constant. Serveix per quantificar la dependència entre els canals
de croma i de luminància i veure en quin grau es pot violar el principi de luminància
constant.

IMATGE PROGRESSIVA
S’utilitza en el cinema. El cinema capta les imatges fotograma a fotograma, la imatge
des de l’inici ja és una foto de 576 línies.

IMATGES I, B, P
Són les imatges que poden portar un GOP dins la seqüència del MPEG. Les imatges I
(intra) estan codificades sense predicció temporal, les imatges P (predicted) la
codificació és amb predicció temporal a partir d’una altre imatge I o P anterior, i les
imatges B (bidirectional) estan codificades amb predicció temporal a partir d’una I o P
posterior.

INTEGRADOR ELECTRÒNIC
Es troba en el sistema PAL-D per solucionar els problemes del PAL-S. Realitza la
integració de les línies electrònicament. Com a conseqüència s’elimina totalment

105
l’efecte persiana i la línia de retard és ultrasònica, però tenim una pèrdua de resolució
vertical del color.

INTERFERÈNCIA
La interferència és un senyal molt similar al nostre (generalment freqüencialment) que
afecta al nostre senyal.

INTERFRAME
Per poder comprimir utilitza vàries imatges de vídeo (extreu la redundància de vàries
imatges de vídeo).

INTRAFRAME
Quan la compressió de vídeo es realitza en una sola imatge (extreu la redundància de
cada imatge).

ITU-R 601
Norma estandarditzada per tal d’obtenir la Y, U i V digitalitzades en paral·lel. Els tres
senyals R, G i B després de passar per un filtre FPB de 5,5 MHz es transformen a
causa d’una matriu en Y’, B’-Y’ i R’-Y’. Cada una d’elles actua per separat. A la Y’ se li
aplica un retard, en canvi als altres senyals se’ls multiplica per un factor de 0,5643 i
0,713 respectivament. Llavors en la Y’ li apliquem un altre filtre FPB de 5,5 MHz, se la
mostreja a 13,5 MHz i ja se la pot quantificar per obtenir un senyal digital·litzat de 8 o
10 bits. Les altres dos el FPB que se’ls aplica és de 2,75 MHz i la freqüència de
mostratge de 6,75 MHz.

KLT
Karhunen Lloeve Transform. És la transformada òptima, ja que calcula els coeficients
de la transformada adaptats a unes dades concretes. És òptim per imatges estàtiques,
ja que per cada nova imatge ha de calcular nous coeficients.

LÍNIA
Les imatges es composen de línies. Cada línia dura 64 microsegons, 52 dels quals són
d’informació, i recorre d’esquerra a dreta de la pantalla donant-li la informació de
luminància i de color. Cada imatge ocupa 625 línies.

LLUM MONOCROMÀTICA
És la llum que té tota l’energia (informació) en una longitud d’ona concreta. La seva
oposada és la llum blanca que té la informació per igual a totes les longituds d’ona.

LUMINÀNCIA
És la informació blanc i negre d’una imatge (aproximació a la lluentor).

MAC
Multiplexed Analog Components. Objectius: millorar el sistema PAL, millorar la qualitat
sobretot via satèl·lit amb un millor aprofitament de l’espectre, mantenir certa
compatibilitat amb el sistema PAL, eliminar interferències Y/Cr, millorar resolució
horitzontal i augmentar el nombre i qualitat de canals de so.

106
METÀMERS
Distribucions físicament diferents, però que tenen la percepció visual (sensació de
color) igual cadascuna d’elles.

MÈTODES PREDICTIUS
Basat en predicció. Consisteixen a predir la informació a partir de mostres prèvies.
Generalment, les mostres directament no tenen redundància però es mouen dins un
marge (són similars). Aquests mètodes no transmeten el valor sinó l’error del que
havia de transmetre i el que ha predit, esperant que aquests siguin aprox. 0.

MÈTODES TRANSFORMATS
Serveixen per eliminar la redundància espacial. Basen el seu funcionament en treballar
en un domini transformat on la informació es descriu de forma més compacta. Aquests
mètodes són més complexos que els predictius, però també més òptims.

MFO
Monitor de Forma d’Ona. És un instrument dissenyat per l’anàlisi i mesura directa dels
diferents paràmetres del senyal de televisió.

MOSTRATGE ORTOGONAL
Aquest mostratge consisteix a agafar les mostres d’una imatge línia a línia de manera
que unes mostres estiguin a sobre de les altres. Perquè sigui ortogonal cal que Fm =
K•Fh.

MOSTRATGE SUBNYQUIST
Aquests sistemes agafen no totes les mostres sinó alternatives. Aquestes mostres es
recuperaran en el receptor mitjançant mètodes d’interpolació.

MPEG-2
Digital. Algorisme de compressió de la informació de vídeo per poder transmetre la
informació, comú a tots els països.

MUSE
Sistema HDTV. 1050 línies/imatge, 30 imatges/segon, 2 camps/imatge i relació 16:9.
S’aconsegueix augmentar la resolució espacial, millora del color, so digital i relació
d’aspecte panoràmica 16:9. Mostratge subNyquist.

NTSC
Sistema de TV americà. Compost de 525 línies/imatge, 30 imatges/segon i 2
camps/imatge. Relació d’aspecte 4:3. – resolució espacial + temporal. Com a principal
problema les distorsions de color causades pels errors de fase entre l’oscil·lador del
receptor i la portadora que provoquen canvis de matís en el color (botó hue: ajust
manual de la fase).

PAL

107
Phase alternating line. Europeu. Sistema analògic compost de 625 línies/imatge, 25
imatges/segon i 2 camps/imatge. Relació d’aspecte 4:3. La combinació de fase entre
línies més l’integrador electrònic cancel·la els canvis de matís en el color a causa dels
errors de fase (receptors PAL inclouen el control de croma). Elimina el crosstalk.
Sistema més car i patró interferent més molest que en el NTSC.

PAL PLUS
Sistema analògic que millora el senyal PAL convencional. Permet la compatibilitat
entre 4:3 i 16:9 (en format panoràmic).

PATRONS D’INTERFERÈNCIA
En funció de la freqüència subportadora que escollim, per tal de transmetre el nostre
senyal, podem tenir interferències diferents que ens afecten al color. El tipus
d’interferència que menys ens afecti serà el que ens condicionarà la nostra Fsp.

PATRONS DE MOSTRATGE
Plantilles que seguim per tal d’eliminar mostres d’un senyal i així poder-los comprimir.
Aquests patrons s’escullen en funció del tipus de resolució que vulguem tenir. Un cop
haguem mostrejat el senyal, seguint un d’aquests patrons, podrem enviar-lo pel canal
o bé guardar-lo (ocupant el mínim d’espai). La simbologia d’aquests patrons
s’expressa amb tres nombres X : Y : Z. El primer d’ells (X) indica el nombre de
mostres, el segon (Y) indica les mostres de Y que agafem de cada Y mostres i el
tercer (Z) les de crominància. Els patrons de mostratge més comuns són el 4:2:2 (el
color agafa la meitat de mostres per línia que la luminància), 4:1:1 (elimina 1 de cada
dues columnes de crominància), 4:2:0 i 4:4:4 (agafem mostres de Y i de Cr de tot
arreu).

PERCEPCIÓ VISUAL
La llum es caracteritza perquè té una freqüència a la qual nosaltres som sensibles. La
llum la podem especificar amb unes quantitats radiomètriques i fotomètriques. Les
quantitats radiomètriques són els factors físics de la energia, la longitud d’ona
dominant i l’ample de banda que podem arribar a mesurar físicament amb un
instrument. Les fotomètriques són els factors amb els quals la percebem, lluentor
(sensació de luminància), matís (sensació de saber distingir diferents colors) i
saturació (més o menys vida d’un color), els quals a diferència dels anteriors, són
diferents per cada persona.

PMT
Program Map Table. Forma part del PSI. Ens indica el nombre d’streams que forma un
programa i el PID de cadascun d’ells.

PRINCIPI DE LUMINÀNCIA CONSTANT


Les pertorbacions, sorolls o contaminacions del color no poden afectar a la luminància.

REDUNDÀNCIA

108
Fonaments de la compressió. Gràcies al fet que existeix una redundància en les fonts
d’informació existeixen mètodes de compressió per tal d’eliminar els diferents tipus de
redundància: temporal, espacial, estadística, psicofísica.

SDI
Serial Digital Interface. És agafar el senyal paral·lel i serialitzar-lo (en comptes d’anar
amb 8 fils va en 1). Es treballa a 270 Mbps i és necessari autosincronitzar-lo.

SECAM
Sequentiel a couleur avec memoire. Sistema analògic compost per 625 línies/imatge.
La modulació en FM de la crominància elimina errors de crosstalk i de fase, però fa
impossible l’entrellaçat de l’espectre. La resolució de color en sentit vertical disminueix.

SENSACIÓ DE MOVIMENT
És el nombre mínim de imatges/segon necessàries perquè un seguit de fotogrames
sembli un moviment real. El seu valor està al voltant de 15.

SENYALS DE TEST VITS.


Vertical Interval Test Signals. Senyals que ajudaran a verificar la qualitat de la imatge.
Es troben a la línia 17-18 del camp I i la 330-331 del camp II.

SINCRONISME
Són els impulsos existents en el senyal de televisió que ens diuen quan acaba una
línia i quan acaba el camp. Indiquen al feix d’electrons que impacte sobre el TRC (tub
de raigs catòdics), l’inici d’una nova línia (sincronisme de línia o horitzontal) o bé l’inici
d’un nou camp (sincronisme de camp o vertical).

SISTEMA COMPATIBLE
Es basa en transmetre la informació que ens dóna la càmera en 3 senyals que seran Y
(corregida en gamma Y^1/γ), R-Y i B-Y. Tant el receptor en B/N com en color
aconseguiran Y.

SISTEMA QUASI COMPATIBLE


En els tres senyals que envia la càmera els aplicarà la ()^1/γ i llavors trobarà la Y a
partir d’aquests. Transmetrà Y’, R’-Y’ i B’-Y’. Aquest sistema no és compatible, és a dir,
perd la compatibilitat en receptors B/N i viola el principi de luminància constant.

SOROLL
El soroll és un senyal elèctric, aleatori amb naturalesa natural que ens contamina el
nostre senyal quan aquest viatja a través d’un canal.

SVH
(Sistema Visual Humà). Es compon del nivell perifèric (converteix la llum en senyals
neuronals) i nivell central (passa dels senyals neuronals a la informació visual). Les
cèl·lules encarregades de percebre la llum són les cèl·lules bastó (responsables de la
visió monocromàtica, poca llum; es troben uniformement distribuïdes en la retina

109
exceptuant la fòrea que gairebé no n’hi ha), i les cèl·lules con (responsables de la visió
en color i la definició espacial; n’existeixen tres tipus segons la sensibilitat al vermell,
verd i blau ; es troben concentrades a la fòvea).

TELETEXT
Servei d’informació unidireccional en format de text. Aquest format disposa en la
pantalla de 25 línies i 40 columnes, un total de 1000 caràcters/pàgina de teletext.
Aquesta informació viatja en les línies VBI corresponents al camp I de la 7 a la 22 i al
camp II de la 320 a la 337.

TELEVISIÓ
Sistema de comunicació electrònic per transmetre imatges amb moviment amb el seu
corresponent so a distància.

TRC
Tub de raigs catòdics. És un aparell format per un coll, con i una pantalla. Els electrons
que es generen al coll fins arribar a la pantalla impactaran sobre una capa de fòsfor
que resideix en ella, la qual convertirà l’energia dels electrons en energia lluminosa.

VBI
Vertical Blanking Interval. Està format per les senyals de test (ajudaran a verificar la
qualitat de la imatge), senyals de teletext (transmetre informació digital dins un senyal
analògic), senyalització PAL Plus (formats panoràmics), senyals de Datacast (servei
de transmissió de dades per a empreses) i VPS (Video Programming System,
enregistrament de vídeo).

VECTORSCOPI
El vectorscopi permet la visualització de la informació de color del senyal de TV,
representades en coordenades polars.

VÍDEO DIGITAL
Digitalització d’un senyal analògic que proporciona: alta qualitat, robustesa al soroll,
emmagatzematge sense pèrdua i transmissió en xarxes telemàtiques d’alta velocitat.

110

You might also like