Professional Documents
Culture Documents
Ebook Televisio Digital 1 PDF
Ebook Televisio Digital 1 PDF
TELEVISIÓ DIGITAL I
ENGINYERIES
Guia d’estudi
Gabriel Fernàndez i Ubiergo
Creative Commons License Deed
Reconeixement-No comercial-Sense obres derivades 3.0 Espanya
Reconeixement.
S’ha de referenciar aquesta obra a Gabriel Fernàndez i Ubiergo -
Enginyeria La Salle (Semipresencial)
No comercial.
No es pot utilitzar aquesta obra per a finalitats comercials.
Quan reutilitzeu o distribuïu l'obra, heu de deixar ben clar els termes
de la llicència de l'obra.
Això és un resum fàcilment llegible del text legal (la llicència completa) disponible en els
idiomes següents:
Català Castellà Basc Gallec
Crèdits
ISBN: 978-84-937712-5-6
Índex
SESSIÓ
9:
Característiques
d’un
sistema
de
TV
color
................................................
49
3.3.1.
Fonaments
del
senyal
color
....................................................................................................
49
1
SESSIÓ
12:
Senyal
de
vídeo
digital
...........................................................................
67
4.
Senyal
de
vídeo
digital
.........................................................................................
67
4.1.1.
Digitalització
d’un
senyal
analògic
..........................................................................................
67
4.1.2.
Mostratge
................................................................................................................................
68
4.2.1.
Introducció
..............................................................................................................................
69
4.3.1.
Introducció
..............................................................................................................................
69
4.3.2.
Freqüència
de
mostratge
........................................................................................................
70
4.3.3.
Quantificació
de
les
components
............................................................................................
71
4.3.5.
Mostres
actives
per
imatge
.....................................................................................................
72
4.3.6.
Patrons
de
mostratge
..............................................................................................................
73
2
SESSIÓ 1: Introducció als sistemes de
TV
FITXA DE LA SESSIÓ
v Nom: Introducció als sistemes de TV
v Tipus: teòrica
v Format: no presencial
v Durada: 2 hores
v Dedicació: 2 hores
v Treball a lliurar: no
v Material:
o Bibliografia bàsica:
§ [Fernàndez2001]
§ [Torres1993]
PRECEDENTS
Per estudiar aquesta assignatura cal que l’alumne tingui uns coneixements bàsics de
comunicacions i electrònica.
OBJECTIUS
L’objectiu d’aquesta sessió és introduir a l’alumne els paràmetres i tecnologies que
intervenen en un sistema de televisió de principi a fi.
CONTINGUTS
3
Figura 1. La televisió com a sistema de comunicacions
El transductor d’entrada
El transductor d’entrada té per objectiu transformar el senyal òptic i acústic en elèctric,
per tal que pugui ser tractat i transmès a través d’un canal. L’exemple més evident de
transductor d’entrada és la càmera on, generalment, mitjançant sensors CCD (Charge
Coupled Device) converteix l’energia dels fotons incidents en una acumulació de
càrrega d’electrons per a cada punt de la imatge. Més tard, aquesta càrrega
acumulada es converteix en un senyal elèctric que descriu la imatge formada en el
sensor línia a línia. Segons el tipus de càmera podem trobar un únic sensor CCD
(càmeres domèstiques) o bé de 3 CCD (càmeres professionals) on cada sensor capta
el senyal d’un color diferent (vermell, verd i blau).
Altres transductors d’entrada són el micròfon per l’àudio, o bé els capçals reproductors
de magnetoscopis de vídeo o làsers lectors de CDROM o DVD si la informació ha
estat prèviament enregistrada en un d’aquests formats.
El transmissor
El següent mòdul en la cadena de comunicacions és el transmissor que efectua
l’adaptació del senyal al canal pel qual el senyals es propagarà. Per això requereix un
senyal suplementari que li faci d’ona portadora de la informació. Aquest procés és
conegut com modulació i com a resultat el senyal és desplaçat a freqüències superiors
dins del canal que té reservat per a la seva transmissió. Els mètodes de modulació són
diferents segons la forma en què es modula la portadora:
Modulacions lineals: són aquelles modulacions que modifiquen l’amplitud del senyal
portador.
- AM: modulació en amplitud (ràdio).
- BLU: banda lateral única (ràdio).
- DBL: doble banda lateral (per a la crominància en TV color).
4
- BLV: banda lateral vestigial (TV analògica).
Modulacions no lineals:
- FM: modulació en freqüència (ràdio, TV satèl·lit).
- PM: modulació en fase.
Totes les modulacions mostrades fins ara són uniportadores. Es poden utilitzar també
modulacions multiportadora on, com el seu nom indica, utilitzen un gran nombre de
portadores simultànies per modular diferents símbols d’un mateix senyal. És el cas de
la Orthogonal Frequency Division Multiplexing (OFDM) utilitzada en la televisió digital
terrestre.
Canal de transmissió
És el medi físic pel qual es transmet la informació. Pot ser de dos tipus: guiat o via
“aèria”:
De canals guiats n’hi ha de diversos tipus: el cable coaxial, la fibra òptica, les xarxes
híbrides coaxial i òptiques (HFC) i el cable bifil·lar de coure.
- Banda VHF: Banda I, II, III; 30 a 300 MHz. Aquesta banda és utilitzada per
transmissió de TV (canals de 7 MHz) i FM de ràdio.
- Banda UHF: Banda IV, V; 300 MHz a 3 Ghz. Utilitzada per transmissió de
senyal de TV (canals de 8 MHz), radar i ràdio enllaços.
- Banda SHF: 3 Ghz a 30 Ghz. Utilitzada per transmissió de senyal per satèl·lit
(banda C: 4-6 GHz, Ku12-14 GHz).
Soroll: són els diferents senyals elèctrics aleatoris de caràcter natural que contaminen
el senyal que transmetem. El soroll afecta de forma diferent a un senyal de TV
analògic que digital. Per exemple, en TV analògica, en utilitzar una modulació lineal on
el soroll afecta directament al missatge (amplitud del senyal), les imatges es veuen
amb neu; en una transmissió de TV digital, el soroll induirà alguns bits erronis que
podran ser recuperats en alguns casos i en altres faran aparèixer blocs amb informació
errònia a la pantalla; altrament la imatge serà perfecta.
Interferència: contaminació causada per altres senyals creats per l’home (màquines,
altres emissions de TV, etc.) que per la seva similitud al nostre senyal a transmetre fa
5
que el senyal rebut es vegi modificat. Per exemple, un canal de TV que interfereix un
altre pel fet d’estar en canals adjacents. Un cas especial d’interferència és la multicamí
o multitrajectòria, produïda pel fet que el senyal rebut en una antena (especialment
terrestre) és la suma dels mateixos senyals que han recorregut diverses trajectòries (a
causa de rebots en edificis o altres elements). Aquest fenomen és especialment greu
en el cas de la recepció terrestre.
Distorsió: deformació que pateix la forma d’ona del senyal a causa de les diferents
atenuacions que efectua el canal a diferents freqüències.
Cada canal de transmissió té unes característiques diferents que fan que la modulació
que cal dur a terme prèviament hagi d’estar adaptada a aquestes característiques. Per
exemple, el medis guiats per cable no pateixen de gaire soroll i disposen de la
possibilitat de reamplificar el senyal, amb la qual cosa una modulació en amplitud com
al QAM és perfectament vàlida. En canvi, en el medi satèl·lit, cal una modulació més
robusta, com la QPSK que modula la informació amb quatre possible fases, a canvi de
reduir l’eficiència espectral (ample de banda més gran), la qual cosa no resulta un
problema en les transmissions satèl·lit a bandes de GHz. Finalment, en la transmissió
terrestre tenim problemes de relativa baixa potència i ample de banda i interferència
multicamí, amb la qual cosa cal aplicar una modulació robusta i eficient a la vegada,
com la OFDM.
El receptor
Adapta el senyal rebut pel canal a senyal elèctric. El seu funcionament dependrà de la
transmissió i canal utilitzats. Bàsicament ha de fer tres funcions:
- Seleccionar el canal.
- Amplificar.
- Desmodular.
Transductor de sortida
Transforma el senyal elèctric en imatges que pugui rebre l’usuari. Es tracta del monitor
de televisió amb tecnologies de tub de raigs catòdics (TRC), projectors o pantalles
planes de plasma o LCD. En el cas de l’àudio es tracta de l’altaveu.
6
- Possibilitat de la compressió del vídeo digital: sistema que redueix el volum
d’informació digital (reducció d’informació binària), fent així una reducció de
l’ample de banda que retransmetem.
- Factor econòmic: circuits barats, potents i de grans prestacions.
- Control per software: els programes utilitzats es poden actualitzar amb més
facilitat.
- Oferiment de serveis afegits: ofereix serveis com la possibilitat d’enviar dades,
interactivitat, encriptació de serveis, etc.
7
Figura 2. Classificació dels diversos sistemes de TV analògics i digitals
8
SESSIÓ 2: Percepció visual - 1
FITXA DE LA SESSIÓ
v Nom: Percepció visual - 1
v Tipus: teòrica
v Format: no presencial
v Durada: 2 hores
v Dedicació: 2 hores
v Treball a lliurar: no
v Material:
o Bibliografia bàsica:
§ [Fernàndez2001]
§ [Torres1993]
PRECEDENTS
En la sessió anterior hem introduït els conceptes generals de la televisió com a
sistema de telecomunicacions complert.
OBJECTIUS
L’objectiu d’aquesta sessió és introduir els conceptes vinculats a la llum i la percepció
que els sistema visual humà en té d’aquesta. La formació d’una imatge consisteix,
bàsicament, a detectar la llum procedent de cada punt de la imatge. És cabdal, doncs,
conèixer els fonaments físics de la llum i com el sistema visual la percep, per tal de
convertir-la, d’alguna forma, en senyal elèctric que es pugui transmetre a distància.
CONTINGUTS
2. Percepció visual
2.1.1. La llum
La llum és una radiació electromagnètica que estimula la nostra resposta visual.
Aquesta radiació ocupa una zona de l’espectre electromagnètic molt estreta que va
d’uns 400 nm a 780 nm. Els diferents colors que podem percebre estan vinculats a les
diferents longituds d’ona incloses en aquesta regió, començant pel violeta, passant pel
blau, cyan, verd, groc i taronja fins arribar al vermell. Vegeu la Figura 3. Espectre
visible de la llum
9
Figura 3. Espectre visible de la llum
D’una llum en distingirem dos tipus de quantitats: aquelles que estan referides a
quantitats físiques de la llum, que es poden mesurar quantitativament (quantitats
radiomètriques), i les quantitats referides a la sensació subjectiva perceptual que en
tenim de la llum, que difícilment podrem mesurar i que dependran de l’individu
(quantitats fotomètriques).
10
Figura 4. Diverses distribucions d’energia de llums on (b) i (c) són llums monocromàtica
i blanca, respectivament.
Llum monocromàtica: quan una llum té únicament energia en una sola longitud d’ona,
és a dir, la seva distribució d’energia és una delta a una longitud d’ona concreta.
Aleshores direm que es tracta d’una llum monocromàtica.
En general, la majoria de llums seran un cas intermedi entre aquests dos casos
extrems i es caracteritzaran per tenir una distribució on hi haurà una longitud d’ona
principal (longitud d’ona dominant), on s’acumularà la major part de l’energia amb certa
amplada de banda.
§ [Fernàndez2001] p. 7-9
§ [Torres1993] p. 15-17
Irrandiancia = ∫ C ( x, y, λ, t )dλ
§ [Fernàndez2001] p. 9
§ [Torres1993] p. 16
11
2.1.3. Quantitats fotomètriques
Ens referim com quantitats fotomètriques a aquelles que tenen en compte la percepció
que tenim de la llum a través del sistema visual humà. Es tracta, per tant, de quantitats
no mesurables quantitativament, ja que depenen del individu. Malgrat tot, es poden fer
estimacions d’aquests valors i establir una relació bastant directa entre les quantitats
fotomètriques i les radiomètriques mencionades anteriorment.
Lluentor
La lluentor és la sensació que tenim d’intensitat d’una llum. De forma planera podríem
dir que és la informació que veuríem d’una llum en un monitor de TV en blanc i negre.
Podem tenir dues llums de diferent color, però que en lluentor siguin iguals. La lluentor,
com a paràmetre subjectiu que és, depèn de les condicions de l’observador, estat
d’ànim, il·luminació de l’escena, etc.
La lluentor té una relació directa amb l’energia de la llum, tot i que, com ja hem dit, no
es tracta de la mateixa cosa. La primera és una quantitat subjectiva (fotomètrica) i la
segona és objectiva (radiomètrica).
Matís
El matís és la sensació que ens permet identificar un color; el que ens permet distingir
una llum d’un to blavós d’una de verdós. Ho podríem definir com la percepció que
tenim del color d’una llum.
El matís d’una llum està molt relacionat amb el valor radiomètric de la longitud d’ona
dominant de la distribució.
Saturació
Finalment, el tercer paràmetre fotomètric és la saturació que ens descriu la sensació
que tenim de la vivor d’un color. Un color poc saturat el veurem pàl·lid i tindrà molta
quantitat de llum blanca (el blau cel). En canvi, un color molt saturat és un color molt
viu, sense gens de llum blanca (el blau marí). Fixeu-vos que podem tenir una llum amb
el mateix matís (el blau) però amb diferent saturació (blau cel o blau marí). Tampoc cal
confondre la saturació amb la lluentor, ja que podem tenir un blau marí molt poc lluent i
un blau cel molt lluent.
La saturació està molt lligada amb l’ample de banda de la distribució d’energia. Quan
més petit sigui l’ample de banda, més tendirem a tenir una llum monocromàtica que té
màxima saturació. A l’inrevés, quan menor sigui la saturació, més tendirem a tenir una
llum blanca que és la de mínima saturació i ample de banda infinit.
12
2.1.4. Sensibilitat a la lluentor del sistema visual
humà
Ja s’ha mencionat en l’apartat anterior que el sistema visual humà percep una lluentor
que està relacionada amb l’energia de la llum, però que aquesta relació no és directa,
ja que hi ha la subjectivitat i la resposta del sistema visual humà que entren en joc. En
aquest apartat veurem l’intent que s’ha efectuat per tal de normalitzar aquesta
sensibilitat a la lluentor que tenim els humans.
Adaptació en lluentor
Anomenem adaptació en lluentor al fet de visualitzar dues distribucions diferents, però
que des del punt de vista del sistema visual humà es percebin amb igual lluentor.
La corba de sensibilitat es normalitza al seu màxim que resulta ser a λr = 555 nm.
Observem, doncs, que el sistema visual humà es comporta a nivell de longituds d’ona
13
com un filtre passa-bandes, on a les freqüències al voltant de 555 nm (groc) tenim
màxima sensibilitat i als extrems de l’espectre (vermell i violeta) en tenim mínima.
§ [Torres1993] p. 17-18
Luminància
Una vegada tenim una modelització de la sensibilitat que tenim a la lluentor ja podem
fer una estimació de la lluentor que percebem per a qualsevol distribució C(λ). La
luminància és, doncs, aquesta aproximació matemàtica que es fa de la sensació de
lluentor que tenim els humans. Aquesta luminància no deixa de ser una aproximació a
la lluentor ja que, com hem dit abans, la lluentor és un paràmetre subjectiu que depèn
de molts altres paràmetres.
La luminància (Y) es calcula com la integral per tot l’espectre visible del producte V(l)
per C(l) multiplicat per una constant. La luminància es mesura en lumens/m2 on k pren
el valor de 680.
Y = k ∫ C (λ )V (λ )dλ
§ [Torres1993] p. 18-19
§ [Fernàndez2001] p. 10-11
RESUM
En aquesta sessió hem vist els paràmetres radiomètrics (físics) i els paràmetres
fotomètrics (perceptuals) de la llum. Aquest conceptes, especialment els fotomètrics,
juntament amb la luminància seran molt importants per la resta del curs.
14
SESSIÓ 3: Percepció visual - 2
FITXA DE LA SESSIÓ
v Nom: Percepció visual - 2
v Tipus: teòrica
v Format: no presencial
v Durada: 2 hores
v Dedicació: 2 hores
v Treball a lliurar: no
v Material:
o Bibliografia bàsica:
§ [Fernàndez2001]
§ [Torres1993]
PRECEDENTS
En la sessió anterior hem vist els paràmetres principals que determinen una llum. Hem
classificat aquests paràmetres en radiomètrics (físics) i fotomètrics (perceptuals). Dels
perceptuals, els més importants són la lluentor, matís i saturació. També hem calculat
la luminància com una aproximació matemàtica a la sensació de lluentor.
OBJECTIUS
En la present sessió veurem amb detall el sistema visual humà, el seu funcionament i
la percepció que tenim de certes coses que fan que realment puguem adonar-nos de
les nostres limitacions visuals; característiques que són fonamentals per definir un
sistema de televisió.
CONTINGUTS
Bàsicament, en aquesta sessió analitzarem la fisiologia i funcionament del sistema
visual humà (SVH). L’estudi del SVH ens determinarà més endavant la definició del
sistema de televisió.
15
2. El nivell central: que processa els senyals neuronals i els converteix en
“informació visual”. Això succeeix en la part posterior del cervell anomenada
còrtex.
El nervi òptic té la funció de transportar els senyals neuronals entre una part i l’altra.
Mentre que el funcionament del nivell perifèric és bastant conegut, el del nivell central
és encara una incògnita.
§ [Torres1993] p. 35
Fisiologia de l’ull
Atés que les sensacions de color i lluminositat són percebudes pel cervell per mitjà de
l’ull, és interessant descriure aquest últim amb un cert detall. La part anterior de l’ull
està constituïda per un cos transparent anomenat còrnia. La llum circularà a través
d’ella, penetrant fins una lent convergent anomenada cristal·lí. Entre la còrnia i el
cristal·lí es troba la pupil·la de l’iris, una espècie de diafragma fotogràfic que es s’obre
o es tanca, en una certa mesura, d’acord amb la intensitat lluminosa incident.
L’interior del globus ocular està constituït per una massa gelatinosa coneguda com
humor vitri , mentre que la pròpia paret interna disposa d’una pel·lícula sensible a les
radiacions visibles i que rep el nom de retina. Per últim, el nervi òptic, connectat amb el
cervell, transmet a aquest les impressions que han estat recollides per la retina. La
imatge exterior és enfocada sobre la retina gràcies al cristal·lí que, deformant-se sota
l’acció d’uns certs músculs, adapta l’enfoc abans esmentat per a compensar les
diferents profunditats de la visió. Podeu veure un esquema de les parts de l’ull a
[Fernàndez2001], pàgina 13.
§ [Fernàndez2001] p. 13
§ [Torres1993] p. 35-36
La retina
La retina conté les cèl·lules sensibles a la llum i que converteixen l’energia lluminosa
en senyals neuronals. Es coneixen dos tipus de cèl·lules sensibles a la llum que es
diferencien per la forma: els cons i els bastons. En un punt de la retina hi surt el nervi
òptic que va cap al cervell. En aquest punt no hi ha cèl·lules de cap tipus i, per tant, és
un punt de ceguesa.
Les cèl·lules tipus bastó són uns 100 milions i estan situades més o menys
uniformement en tota la retina, excepte a la part central anomenada fóvea. Són molt
sensibles a la intensitat de la llum, però no són capaces de distingir els colors.
Podríem dir que són les responsables de la visió en blanc i negre. La seva connexió al
nervi òptic es produeix amb grups de moltes cèl·lules a una mateixa fibra, comportant
poca capacitat de definició espacial.
16
òptic és molt més directa i, per tant, es dota de major definició espacial. Es coneixen
tres conjunts de cèl·lules tipus con segons la sensibilitat a diferent longituds d’ona.
Simplificant, es pot dir que hi ha les cèl·lules con sensibles al vermell, al verd i al blau.
De tot això se’n desprèn alguns efectes que podem observar sense gaire dificultat,
com el fet que en condicions de poca il·luminació hi vegem sense color ni definició, ja
que, aleshores, només treballen els bastons. També podem observar que la visió de
detall que ens aporten els cons només la tenim en la part central de la retina, ja que és
allà on es situen els cons.
Finalment, cal afegir que l’ull humà és més sensible a les variacions produïdes a nivell
de lluentor, és a dir, informació blanc i negre, que a les variacions de color. Això ens
obligarà més endavant a millor “tractar” el senyal referent a la lluentor que els senyals
referents al color.
§ [Fernàndez2001] p. 114-15
§ [Torres1993] p. 36-37
17
Adaptació en lluentor
L'ull es capaç de diferenciar 1010 nivells diferents de lluentor, però de forma simultània
només en pot captar uns 50. L’ull adapta el nivell mínim (negre) i el màxim (blanc) en
funció de les condicions d’il·luminació de la sala. Aquest procés d’adaptació no és
immediat i explica el fet que inicialment ens costi veure-hi dins d’una habitació poc
il·luminada i que més tard, en adaptar-se els marges de visió, comencem a veure
millor.
El fet que només puguem diferenciar 50 nivell de lluentor simultanis ens indica també
la precisió en què podrem quantificar el senyal de luminància en un sistema digital.
Podem assegurar que si quantifiquem a 128 nivells o 256 (7 o 8 bits) per a l‘ull humà,
aquella luminància serà com una funció continua sense discretització.
§ [Torres1993] p. 38-40
§ [Fernàndez2001] p. 17
§ [Torres1993] p. 40-41
§ [Fernàndez2001] p. 18
18
Emmascarament visual
Per emmascarament visual entenem la reducció d’un estímul visual enfront de canvis
temporals i espacials. És a dir, tenim menor capacitat de percepció visual quan es
produeixen canvis a la imatge. Existeixen dos tipus d’emmascarament visual: el
temporal i l’espacial.
§ [Torres1993] p. 42-43
No hi ha una única Fcf, ja que el seu valor depèn de diferents factors com la
il·luminació, mida de l’objecte, condicions de visió, etc. Per exemple, si la luminància
de l’objecte és molt gran la Fcf augmenta, com també ho fa si l’objecte il·luminat té una
gran superfície.
En general podem dir que la Fcf està al voltant de 40 Hz, és a dir, que cal mostrar més
de 40 imatges per segon en una pantalla per tenir un impressió de llum continua. Com
hem dit, aquesta freqüència varia davant certs factors. A la figura 1.3.7 a [Torres1993]
es veu com augmenta la Fcf en funció de la intensitat lluminosa de la llum.
§ [Torres1993] p. 43-44
Sensació de moviment
Definim sensació de moviment el fet que la visualització seqüencial d’imatges ens
produeixi la sensació que els objectes de l’escena estan descrivint moviments reals.
S’ha pogut comprovar que aquesta il·lusió visual es produeix a partir de 15 imatges per
segon.
19
Com s’ha vist anteriorment, per evitar el flícker hem de procurar tenir, més o menys, 40
imatges per segon; i per crear sensació de moviment hem de tenir més de 15 imatges
per segon. Per tant, en definir un sistema de televisió caldria que treballés a més de 40
imatges per segon, que assegura complir els dos criteris. En el sistema de TV europeu
es fa servir una cadència de 25 imatges per segon, mentre que als Estats Units
d’Amèrica utilitzen una cadència de 30 imatges per segon. Com es pot comprovar,
aquestes freqüències no compleixen el criteri mencionat anteriorment. Això és possible
gràcies a que cada imatge es desglossa en dos camps: un camp conté les línies parell
i l’altre camp, les línies senars. Aquests camps es mostren alternativament obtenint,
aleshores, 25 imatges per segon * 2 camps/imatge = 50 camps/segon, és a dir, una
freqüència d’impactes lluminosos superior a la freqüència crítica de flícker i un nombre
d’imatges per segon superior a 15.
§ [Torres1993] p. 43-44
RESUM
En aquesta sessió hem repassat el funcionament del sistema visual humà, tant
fisiològicament com a nivell dels fenòmens visuals. Aquesta introducció ens permet
entendre la forma com funciona el nostre sistema de visió i ens permetrà, més
endavant, definir els sistemes de televisió.
20
SESSIÓ 4: Colorimetria - 1
FITXA DE LA SESSIÓ
v Nom: Colorimetria - 1
v Tipus: teòrica
v Format: no presencial
v Durada: 2 hores
v Dedicació: 2 hores
v Treball a lliurar: no
v Material:
o Bibliografia bàsica:
§ [Fernàndez2001]
§ [Torres1993]
PRECEDENTS
En les sessions anteriors hem estudiat el sistema visual humà. Les seves
característiques fonamentals i limitacions que ens ajudaran a definir els sistemes de
televisió.
OBJECTIUS
L’objectiu de la present sessió és introduir els conceptes relacionats amb el color d’una
llum, com podrem reproduir una llum a partir de la combinació d’unes llums primàries.
CONTINGUTS
Fent un repàs ràpid podem dir que tota llum té una distribució espectral determinada
(C(λ)) amb una amplada de banda que podem associar a la saturació de la llum
(quantitat de llum blanca) i una longitud d’ona dominant que associem al matís. Vàrem
parlar de llums monocromàtiques quan la distribució era una delta (energia acumulada
en una sola longitud d’ona), però generalment les llums no són monocromàtiques sinó
que responen a una distribució, més o menys “gaussiana”, amb una longitud d’ona
dominant (valor mig) i una certa saturació (variància). Vist d’aquesta forma, qualsevol
color es podria aconseguir mitjançant la mescla de la llum monocromàtica
corresponent (saturat al 100 %) i una certa quantitat de llum blanca.
21
Una propietat interessant de l’ull és que distribucions espectrals diferents poden
produir-nos la mateixa sensació visual. En aquest cas direm que aquestes
distribucions són metàmers.
Teoria triestímul
La teoria triestimul estableix que un color es pot reproduir a partir de la mescla de les
quantitats adequades de tres primaris. Com hem vist en la sessió anterior existeixen
tres tipus de cèl·lules con: un tipus és sensible a les radiacions vermelles, un altre a
les blaves i uns tercers a les verdes. D’aquesta manera, l’ull pot percebre d’altres
colors diferents als tres fonamentals. Per exemple, el groc es rep com a tal si s’exciten
simultàniament, i a la proporció adequada, els cons sensibles al vermell i al verd. En la
figura 1.2.1 a [Torres93] o bé a la pàgina 28 de [Fernàndez2001] podeu trobar les
corbes de sensibilitat de cada tipus de cèl·lula con.
D’alguna forma l’ull humà treballaria com un banc de filtres on la distribució espectral
d’una determinada llum (C(λ)) es filtrada per cada tipus de cel·lular resultant tres
quantitats que mesuren la quantitat de vermell, verd i blau de la distribució en qüestió.
§ [Torres93] p. 19-21
§ [Fernàndez2001] p. 27-29
Més tard, quan es desenvolupà la televisió en color, la adaptació del colors s’havia de
fer a partir dels fòsfors disponibles per a tubs de raig catòdics que emetien a longituds
d’ona diferents de les establertes pel CIE. En la pantalla del televisor, cada píxel es
composa de tres punts de fòsfor (R, G i B); el que veiem és la integració dels tres. Això
va obligar a utilitzar uns nous primaris per l’ús de la televisió en color. Les seves
longituds d’ona són les següents:
Una vegada disposem dels primaris, ja podem passar a la part de la reproducció del
color que s’efectua mitjançant l’experiment del colorímetre.
22
El colorímetre és l’aparell per aconseguir llums monocromàtiques a partir dels tres
colors primaris. El seu funcionament consisteix en ajustar les intensitats de les tres
llums primàries fins aconseguir un efecte igual a la llum monocromàtica desitjada amb
una energia radiant d’1 W. Les tres quantitats necessàries de cada primari R, G i B
reben el nom de valor tricromàtics. A la figura de la pàgina 33 de [Fernàndez2001] es
pot observar la configuració del colorímetre, i a la Figura 8. Corbes tricromàtiques per
a cada primari les corbes que obtenim, on per cada llum monocromàtica adaptada
s’indica la quantitat necessària de cada primari.
Els valors tricromàtics obtinguts es normalitzen perquè tinguin àrea 1; així passen a
ser els coeficients triestímul.
Coeficient de luminància
Recordem que anteriorment hem definit la luminància com una adaptació a la lluentor
a partir de l’equació:
23
Y = K ∫ V (λ ) C(λ ) dλ
A partir d’aquesta expressió podem posar la luminància en funció del valors triestímul
R, G i B ens queda definida com a Y = l * R + m * G + n * B. (Vegeu la explicació a
[Torres1993], pàgina 24. Observeu el canvi de nomenclatura utilitzat).
Nosaltres utilitzarem sempre els coeficients definits per a TV color. Cal observar que
els tres coeficients sumen 1. En barrejar els tres colors primaris amb la mateixa
quantitat de cadascun s’obté el color blanc, això vol dir que en cas d’una llum blanca
on R = G = B = k, la Y també valdrà k.
§ [Fernàndez2001] p. 38
Coeficients de crominància
Els coeficients de crominància ens donen la informació sobre el matís i la saturació de
forma independent de la luminància de la llum. Per aconseguir aquesta independència
el que es fa és normalitzar els coeficients triestímul obtinguts anteriorment obtenint r, g
i b.
R G B
r= ;g = ;b = ;
R+G+ B R+G+ B R+G+ B
R
r = = 0.33 = g = b
R+G+ B
§ [Fernàndez2001] p. 39
§ [Torres1993] p. 21-24
24
2.3.3. Mescla de llums
Abans d’acabar aquesta sessió, aturem-nos un moment a explicar com funciona la
mescla de llums. Les característiques que regeixen una mescla de llums han estat
recollides en les anomenades lleis de Grassman.
Lleis de Grassman
1. Dues llums són equivalents si produeixen sensacions visuals equivalents.
(Recordeu el concepte de les distribucions metàmers).
2. Els valor triestímul d’una llum resultant d’una mescla es poden calcular com la suma
dels coeficients triestímuls de cada llum:
C1(R1, G1, B1) + C2(R2, G2, B2) = C3(R1 + R2, G1 + G2, B1 + B2).
En una barreja de llums com l’anterior si substituïm alguna llum per la seva equivalent,
el resultat no variarà
Posem un exemple: Si tenim una llum amb R = 3, G = 4 i B= 5, per tant C(3, 4, 5) i ens
demanen calcular la luminància: el primer que farem serà substituir els valors que ens
han donat en la formula de coeficients de Y:
Suposem ara que multipliquem per 2 les proporcions de cada primari i que, per tant,
C2(6, 8, 10), veurem que la luminànca el duplica, però la crominància resta igual.
25
RESUM
En aquesta sessió hem estudiat la forma d’especificar un color i, per tant, reproduir-lo
a partir d’un conjunt de tres primaris. Això ens ha donat els coeficients triestímul de la
llum. A partir d’aquest coeficients hem deduït els coeficients de luminància i de
crominància associats a aquesta llum. Finalment, també hem repassat la teoria de la
mescla de llums.
26
SESSIÓ 5: Colorimetria - 2
FITXA DE LA SESSIÓ
v Nom: Colorimetria – 2
v Tipus: teòrica
v Format: no presencial
v Durada: 2 hores
v Dedicació: 2 hores
v Treball a lliurar: no
v Material:
o Bibliografia bàsica:
§ [Fernàndez2001]
§ [Torres1993]
PRECEDENTS
En la sessió anterior hem estudiat els conceptes de colorimetria bàsica, coeficients
triestímul i coeficients de crominància.
OBJECTIUS
L’objectiu d’aquesta sessió és el de completar els coneixements de colorimetria
necessaris per a més endavant entendre la televisió en color.
CONTINGUTS
27
Figura 9. Triangle de cromaticitat r-g
Si pintéssim un punt per a cada color visible dins aquest espai bidimensional, en
resultaria el diagrama de cromaticitat (DdC) que podem observar a la figura 1.2.6 a
[Torres1993] o bé a la pàgina 43 de [Fernàndez2001]. Observem que el conjunt de
punts descriu una regió similar a una llengua. Aquesta llengua sobrepassa el triangle
de cromaticitat. Això vol dir que no tots els colors visibles són reproduïbles amb els
tres primaris que disposem i que si en disposéssim d’altres els color reproduïbles
serien els del triangle que formarien aquest tres nous punts.
Les llums corresponents al perímetre de la línia corba del DdC representa a tots els
colors espectrals, és a dir, les llum monocromàtiques. En aquest sentit, la recta inferior
de tancament entre el vermell i el blau, anomenada línia de porpres, no forma part
d’aquest conjunt. Els púrpures o magentes no són colors espectrals, és a dir, no es
poden trobar com a llum monocromàtica i solament es poden obtenir com a barreja del
vermell i el blau.
Si les llums del perímetre són els monocromàtiques vol dir que allà la saturació és
màxima; els punts de l’interior de la corba representen colors obtinguts a partir de
mescla de llums amb una longitud d’ona dominat i una saturació determinada. El
blanc, situat al (1/3, 1/3) és el punt de mínima saturació.
Amb tot això podem dir que si tracem un línia entre qualsevol llum (punt A) i el blanc
(punt W) i projectem la recta fins al perímetre de la corba, la llum situada en aquest
punt (punt B) serà una llum del mateix matis que A però de saturació màxima. Totes
les llums que estiguin situades en el segment que va de W a B passant per A
comparteixen el mateix matís, però en canvi van canviant de saturació: a W tenen
saturació nul·la i a B del 100 %. Canviant el pendent de la recta i deixant que passi
sempre pel blanc anirem obtenint diferent matisos.
____
WA
% saturació = ____
x100
WB
28
Generalment treballarem amb el triangle de cromaticitat i no el diagrama de
cromaticitat complert ja que el triangle és el que ens representa els color que nosaltres
podrem reproduir, donats els primaris que disposem per fer les mescles.
§ [Fernàndez2001] p. 47
§ [Torres1993] p. 25-27
Mescla de llums
Com hem vist, el triangle de cromaticitat és molt útil per treballar amb les llums i
conèixer el seu matís i la seva saturació. La mescla de dues llums també es pot
representar en el triangle. Donades dues llums, la llum resultant de la mescla ha
d’estar situada en algun punt sobre el segment que les uneix. El punt exacte es pot
calcular gràficament fent algunes triangulacions com es pot veure en la figura de la
pàgina 49 a [Fernàndez2001].
Un punt a destacar és el de les llums complementàries. Diem que dues llums L1(R1,
G1, B1) i L2(R2, G2, B2) són complementàries quan la seva suma dóna la llum blanca.
Això vol dir que la seva suma, component a component, dóna el mateix valor:
R1 + R2 = K.
G1 + G2= K.
B1 + B2 = K.
En el triangle de cromaticitat això quedarà representat com que les dues llums i la llum
blanca estaran alineades formant un angle de 180 º.
§ [Fernàndez2001] p. 48-49
Model RGB
És el model utilitzat per una mescla de llums i el que hem estat utilitzant fins ara en
una mescla de llums. Es basa en la barreja additiva dels tres primaris vermell (R), verd
(G) i blau (B). La mescla additiva consisteix a sumar les distribucions de cada llum de
la mescla per a obtenir la distribució de la mescla resultant. D’aquesta forma la mescla
29
dels tres primaris dóna la llum blanca que consisteix a tenir una distribució uniforme. A
més, l’addició dels primaris dos a dos dóna com a resultat els colors complementaris,
el cyan, el magenta i el groc:
Ye = R + G ; Mg = R + B ; Cy = B + G.
Depenent del matís d’R, G i B que ens proporcionin els fòsfors del nostre monitor,
tindrem una gamma de colors diferents.
§ [Fernàndez2001] p. 52
Model CMY
És el model utilitzat en fer mescles de pintures o substàncies de diversos colors. Es
basa en el fet que quan nosaltres observem una substància d’un determinat color, és
que aquesta determinada substància absorbeix totes les radiacions, excepte la
corresponent a aquell color que percebem. Si mesclem dues substàncies de diferents
colors, la substància resultant absorbirà les radiacions d’una i de l’altra. En al cas límit,
la mescla de tots els colors ens donarà una substància negra. Aquest fenomen és el
que es coneix com a mescla substractiva, ja que a nivell de distribucions espectrals el
que fem cada cop que mesclem és multiplicar les distribucions espectrals.
Els colors complementaris del model RGB (cyan, magenta y groc) actuen ara com a
primaris en el model CMY, i el primaris del RGB ara seran els secundaris, ja que la
suma dos a dos de cada primari CMY dona un primari RGB.
Ex: Cy + Ye = (W – R) + (W – B) = W – R – B = G.
Tant els pintors com els dispositius d’impressió gràfica en color utilitzen aquest model
per a crear colors com a barreja dels tres secundaris.
§ [Fernàndez2001] p. 54
RESUM
En aquesta sessió hem acabat de veure els conceptes relacionats amb la colorimetria,
principalment el concepte de la representació espacial d’una llum, mescles de llums i
models de color.
30
SESSIÓ 6: Principis bàsics de la
televisió
FITXA DE LA SESSIÓ
v Nom: Principis bàsics de la televisió
v Tipus: teòrica
v Format: no presencial
v Durada: 2 hores
v Dedicació: 2 hores
v Treball a lliurar: no
v Material:
o Bibliografia bàsica:
§ [Fernàndez2001]
o Bibliografia complementària:
§ [Bethencourt1990]
§ [Torres1993]
PRECEDENTS
En les sessions anteriors vàrem estudiar els diferents paràmetres físics de la llum, les
característiques del sistema visual humà i la colorimetria.
OBJECTIUS
L’objectiu d’aquesta sessió és el d’aprendre els paràmetres fonamentals que
defineixen un sistema de televisió. Estudiarem els paràmetres bàsics del senyal de
televisió en blanc i negre, que vénen determinats per les característiques del sistema
visual humà. Aquests paràmetres es poden resumir en relació d’aspecte, nombre de
línies per imatge i sistema entrellaçat.
CONTINGUTS
Les principals limitacions del SVH són l’angle de visió, la compressió en la transmissió
de la informació òptica al cervell, el poder de resolució i la persistència visual a la llum i
al moviment. També cal remarcar que solament la visió frontal és en detall.
31
Els paràmetres bàsics del senyal de televisió són:
- la relació d’aspecte.
- el nombre de línies per imatge.
- l’entrellaçat.
Condicions de visió
Com veurem, una imatge de televisió es composarà d’un seguit de línies disposades
horitzontalment. Cal definir, doncs, el nombre de línies que ens asseguri una sensació
d’uniformitat i continuïtat de la imatge. Aquest nombre dependrà del poder de resolució
de l’ull i de la distància a què estiguem de la pantalla.
El poder de resolució de l’ull humà (capacitat de l’ull humà de distingir dos focus de
llum molt propers) és d’un minut de grau (1/60 part d’un grau).
Empíricament s’ha trobat que la distància de visió òptima a la pantalla, en els sistemes
de resolució estàndard és entre 6 i 10 vegades la seva alçària. En els sistemes d’alta
definició, la distància òptima només és 3 vegades l’alçària de la pantalla.
32
Figura 10. Distància de visió d’una pantalla
On el triangle rectangle format pels catets h i d han de formar, com a molt, un angle de
1’.:
Π
h = d ⋅ tg1' ≈ d ⋅ 1' = d ⋅
60 ⋅ 180
Aquesta aproximació es pot realitzar, ja que per angles molt petits es pot aproximar la
tangent pel valor de l’angle.
H 1800
N≥ = = 572.9
Π Π
6H ⋅
60 ⋅ 180
En el sistema PAL s’ha pres 575 línies actives. El nombre de línies per imatge ha de
ser senar per tal de simplificar l’entrellaçat. Vegeu les figures de la pàgina 63 de
[Fernàndez2001].
Més endavant veurem que caldrà afegir unes línies per tal de sincronitzar les imatges,
augmentant el nombre total a 625 línies/imatge.
D’aquí surt una freqüència de línia o horitzontal, com el nombre de línies per segon a
mostrar Fh = N Fi = 625 línies/imatge x 25 imatges/s = 15625 línies/s (Hz) i un període
o temps de línia de Th = 1/Fh = 64 µs.
§ [Fernàndez2001] p. 63-65
3.1.4. L’entrellaçat
33
L’entrellaçat
En els sistemes PAL i SECAM es disposa de 25 imatges per segon, i en el sistema
NTSC, de 30 imatges per segon. En ambdós sistemes, es compleix el criteri de
moviment, ja que disposem de més de 15 imatges/segon.
En haver un nombre senar de línies (625), obtenim dos camps de 312,5 línies
cadascun, fet que facilita la presentació del senyal entrellaçat.
§ [Fernàndez2001] p. 61
Sistema d’exploració
Les línies es pinten d’esquerra a dreta, i de dalt a baix. Aquesta exploració és producte
de la conjunció de dos moviments periòdics: un d’horitzontal, d’esquerra a dreta, amb
un període de 64 µs, i un de vertical amb un període de 20 ms (durada d’un camp). El
fet que hi hagi dos moviments simultanis, un en cada direcció, fa que les línies no
siguin perfectament horitzontals, sinó que estiguin lleugerament inclinades perquè
mentre el feix escombra d’esquerra a dreta, també es va desplaçant de dalt a baix.
En acabar de pintar una línia, cal retornar ràpidament a l’esquerra (temps de retorn
horitzontal o flyback).
34
Una vegada pintat un camp, cal retornar a dalt per començar el següent camp (temps
de retorn vertical). Durant aquest temps se segueix produint la deflexió horitzontal. El
temps de retorn resultant en els dos camps és idèntic.
Figura 12. Exemple d’imatge entrellaçada amb 7 línies totals, 5 d’actives (2,5 per a cada
camp) i 2 de no actives (1 per camp)
RESUM
En aquesta sessió hem vist els paràmetres principals del sistema de televisió com són
la relació d’aspecte, el nombre de línies per imatge i el sistema d’exploració entrellaçat.
35
36
SESSIÓ 7: Senyal de TV B/N
FITXA DE LA SESSIÓ
v Nom: Senyal de TV B/N
v Tipus: teòrica
v Format: no presencial
v Durada: 2 hores
v Dedicació: 3 hores
v Treball a lliurar: no
v Material:
o Bibliografia bàsica:
§ [Fernàndez2001]
§ [Torres1993]
o Bibliografia complementària:
§ [Kuhn1995]
PRECEDENTS
En la sessió anterior hem vist els fonaments bàsics que determinen un sistema de
televisió. S’han revisat paràmetres bàsics com la relació d’aspecte o el nombre de
línies per imatge i nombre d’imatges per segon necessàries per tal de fer un sistema
de TV, que des del punt de vista del sistema visual humà sigui atractiu i realista. En la
sessió anterior hem vist també les bases del sistema entrellaçat i el sistema
d’exploració de la imatge.
OBJECTIUS
En aquesta sessió veurem en què consisteix el senyal de TV en blanc i negre (B/N).
Estudiarem el senyal, tant a nivell de luminància (amplitud) com a nivell temporal, fent
especial èmfasi als sincronismes. Finalment, també estudiarem l’ample de banda
teòric del senyal de TV B/N i els conceptes relacionats amb el detall observable de la
imatge (resolució).
CONTINGUTS
Bàsicament, en aquesta sessió explicarem el senyal de televisió B/N, el sistema de
sincronització, l’ample de banda teòric del senyal de TV i la resolució del senyal.
37
pantalla correctament. Com ja s’ha comentat en sessions anteriors la durada de cada
línia en el sistema europeu és de 64 µs, i que cada camp en tenir 312,5 línies té una
durada de 20 ms.
Informació de sincronismes
Els sincronismes són imprescindibles per a una correcta representació de les imatges
en la pantalla de televisió. Són necessaris dos tipus de sincronisme: l’horitzontal, que
ens indica el final de línia i que obliga al sistema d’exploració a canviar de línia, i el
vertical, que està situat al final de cada camp i que indica que el sistema d’exploració o
ràster ha de situar-se a la seva posició original vertical.
L’interval d’esborrat horitzontal té una durada total de 12 µs, la qual cosa farà que
cada línia de 64 µs quedi dividida en dues parts: una part activa amb informació de
vídeo de 52 µs i una per esborrat horitzontal de 12 µs. En la Figura 14. Interval
d’esborrat horitzontal.
38
Figura 14. Interval d’esborrat horitzontal
L’interval d’esborrat vertical té una durada de 160 ms i es situa al final de cada camp;
aquest temps és l’equivalent a 25 línies (160 ms/64 µs). Això implica que de les 625
línies per imatge que teníem, 50 línies són utilitzades pels dos esborrats verticals que
hi ha en una imatge i que, per tant, el nombre de línies actives a cada imatge són 575.
La Figura 15. Interval d'esborrat vertical.
§ [Fernàndez2001] p. 70-75
§ [Torres1993] p. 56
39
sincronisme és superior a un cert llindar, es determinarà l’arribada d’un sincronisme
vertical.
§ [Fernàndez2001] p. 75
§ [Torres1993] p. 57-59
40
Si considerem que al llarg d’una línia hi haurà NxW/H píxels i la línia dura Th, la
freqüència màxima representable serà aquella que tingui un període dues vegades
Th/(NxW/H):
1 1 NFh W
f = = = x
max T min 2Th /( NxW / H ) 2 H
N2 W
f = ⋅f
max 2 H i
Com es pot observar, substituint pels valors N = 625, fi = 25 imatges/s i W/H = 4/3, la
freqüència màxima teòrica pel sistema europeu seria d’uns 6,5 MHz; a la realitat,
aquest valor es limita a 5 MHz.
§ [Fernàndez2001] p. 67-68
1 W 1 2f
f max = fi ⋅ N 2 = f i ⋅ Pix / Im ⇒ Pix / Im = max
2 W 2 fi
Per fer el càlcul encara més real caldria que tinguéssim en compte els temps
d’esborrat vertical i horitzontal que ens fan perdre línies i píxels actius. En la Figura 17.
Part activa d’una imatges’il·lustra esquemàticament.
41
Figura 17. Part activa d’una imatge
Caldrà, doncs, calcular uns factors de quantitat d’informació activa en cada direcció de
la forma següent:
575 52
ρV = ; ρH =
625 64
on 575 son les línies actives/imatge respecte les totals i 52 són els microsegons
actius/línia respecte els totals d’una línia. Afegint aquests factors correctors, el nombre
total de píxels actius/imatge seran:
2 f max
Pix actius / imatge = ρV ρ H
fi
Substituint els valors del sistema europeu a la formula ens surt que els píxels actius
per imatge són uns 300.000.
§ [Fernàndez2001] p. 77-80
Resolució horitzontal
La resolució horitzontal està referida a la quantitat de punts o píxels que podem
observar al llarg d’una línia. Amb el càlcul de l’apartat anterior aquest valor es pot
obtenir fàcilment dividint els píxels actius/imatge pel nombre de línies actives.
Atés que la pantalla és més ampla que alta, per tal de comparar de manera equitativa
les resolucions H i V hem de ponderar la primera per la relació d’aspecte. És a dir,
calculem els píxels que tindrem en horitzontal dins d’una distància equivalent a l’alçària
del televisor:
3 3
Re s H = Pix / lin = ⋅ 520 = 390 píxels / unitat alçada
4 4
42
Cal mencionar que aquest valor de la resolució horitzontal està directament relacionat
amb l’amplada de banda que li deixem al senyal de vídeo. Com més gran sigui l’ample
de banda, major són les variacions possibles del senyal dins d'una línia i, per tant, la
capacitat de representar petits detalls de la imatge. Una regla pràctica és recordar que
cada MHz afegit al senyal aporta nus 80 píxels de resolució (5 MHz ≅ 400 píxels).
§ [Fernàndez2001] p 82-83
Així doncs, a la pràctica, de les 575 línies teòricament visibles, només se n’aprecia una
fracció determinada pel factor de Kell.
Re sv = N actives Kell
Per Kell = 0,7, la resolució vertical és 575 x 0,7 = 400 línies/alçària de televisor (línies
que realment es veuen). A diferència de la resolució horitzontal, la resolució vertical és
independent de la fmax.
§ [Fernàndez2001], p. 81-82
RESUM
En aquesta sessió hem vist l’estructura general del senyal de vídeo, tant a nivell
d’amplitud com temporal. També hem estudiat l’ample de banda del senyal i el
concepte de resolució.
43
44
SESSIÓ 8: Transformada del senyal B/N
FITXA DE LA SESSIÓ
v Nom: Transformada del senyal B/N
v Tipus: teòrica
v Format: no presencial
v Durada: 2 hores
v Dedicació: 3 hores
v Treball a lliurar: no
v Material:
o Bibliografia bàsica:
§ [Fernàndez2001]
§ [Torres1993]
o Bibliografia complementària:
§ [Kuhn1995]
PRECEDENTS
Fins ara hem vist els paràmetres bàsics de la televisió i l’estructura del senyal de TV
B/N.
En la sessió anterior hem vist en què consisteix el senyal de TV en blanc i negre (B/N).
S’ha estudiat el senyal, tant a nivell de luminància (amplitud) com a nivell temporal,
fent especial èmfasi als sincronismes. Finalment, s’han vist els conceptes d’ample de
banda teòric del senyal de TV B/N i els conceptes relacionats amb el detall observable
de la imatge (resolució).
OBJECTIUS
En aquesta sessió veurem en què consisteix la transformada del senyal de TV en B/N
CONTINGUTS
45
TV el que fa és explorar unidimensionalment aquestes imatges obtenint finalment un
senyal d’una dimensió.
Figura 18. Exploració d’una imatge mitjançant l’extensió periòdica del senyal
bidimensional.
∞ ∞
f (t ) = ∑ ∑C mn e j 2π (mf h + nf v )t
m = −∞ n = −∞
46
§ [Fernàndez2001] p. 86-88
§ [Torres1993] p. 83-85
Observem, doncs, que l’espectre presenta uns espais buits, on la freqüència central
compleix la característica de ser un múltiple senar de la meitat de la freqüència de
línia. Aquests espais buits s’anomenen espais de Gray i ens serviran més endavant
per inserir la informació del color.
§ [Fernàndez2001] p. 89
§ [Torres1993] p. 85
47
RESUM
En aquesta sessió hem repassat el concepte de l’espectre del senyal de vídeo en
blanc i negre i la seva transmissió en banda lateral vestigial. També hem vist la
correcció en gamma, un concepte que més endavant ens produirà algun efecte no
desitjat.
48
SESSIÓ 9: Característiques d’un sistema
de TV color
FITXA DE LA SESSIÓ
v Nom: Característiques d’un sistema de TV color
v Tipus: teòrica
v Format: no presencial
v Durada: 2 hores
v Dedicació: 2 hores
v Treball a lliurar: no
v Material:
o Bibliografia bàsica:
§ [Fernàndez2001]
§ [Torres1993]
o Bibliografia complementària:
§ [Bethencourt1990]
PRECEDENTS
En les sessions anteriors hem estat estudiant les característiques del sistema visual
humà i el senyal de televisió en blanc i negre.
OBJECTIUS
En aquesta sessió estudiarem les característiques generals del senyal en color, quins
requisits ha de complir i com s’envia la informació de color.
CONTINGUTS
Això implica que els sistemes en color han de transmetre la mateixa informació i en el
mateix format que ho feien en el senyal en blanc i negre. La informació de color ha de
ser transparent en els receptors en blanc i negre, respectant l’assignació i distribució
dels canals, mantenint l’ample de banda del senyal de vídeo a 5 MHz. La Figura 20.
Relació de compatibilitats entre TV B/N i color
49
Figura 20. Relació de compatibilitats entre TV B/N i color
§ [Fernàndez2001] p. 107-109
Es podrien enviar els tres primaris (R, G i B). Aquesta opció, però, no compleix amb el
primer criteri de compatibilitat, ja que no s’envia la informació de luminància que
permet visualitzar el senyal de vídeo en els monitors en blanc i negre.
Dels tres senyals diferència, es va descartar el senyal G-Y ja que presenta amplituds
menors que els altres senyals i per tant, és més vulnerable al soroll.
S’utilitza una matriu resistiva per aconseguir el senyals i recuperar els senyals R, G i B,
tal i com es mostra en la Figura 21. Matriu per a l'obtenció de les components Y, R-Y i
B-Y
Per a descodificar les components R, G i B en recepció s’utilitzen dues matrius com les
que s’indiquen a la Figura 22. Descodificació de Y, R-Y i B-Y
50
Figura 22. Descodificació de Y, R-Y i B-Y
− 0.3 0.11
(G − Y ) = (R − Y ) − (B − Y )
0.59 0.59
§ [Fernàndez2001] p. 110-112
En cas que aquest principi no es complís, els receptors B/N no serien capaços de
recuperar el senyal de luminància correcta en no poder desmodular el senyal de
crominància.
A més, la major sensibilitat de l’ull a les variacions de luminància causaria que el soroll
al canal de crominància es traduís en variacions de luminància molt més perceptibles
per a l’ull humà.
Per comprovar que les components Y, R-Y i B-Y compleixen el principi de luminància
constant, suposarem que en el senyal de crominància s’hi afegeix un soroll additiu N,
com es mostra a la Figura 23. Descodificació de Y, R-Y i B-Y davant la presència de
soroll N en el canal de crominància
51
Figura 23. Descodificació de Y, R-Y i B-Y davant la presència de soroll N en el canal de
crominància
La sortida del senyal G-Y es veu afectada pel soroll N de la següent forma:
0.41
Yrep = 0.3( R + N ) + O.59(G − N ) + 0.11( B + N ) = Y
0.59
§ [Fernàndez2001] p. 113-114
Sistema compatible
Podeu observar el diagrama de blocs d’un esquema compatible en la Figura 24.
Esquema de transmissor i receptors en un sistema compatibleCom indica el seu nom
aquesta seria la millor forma de mantenir una correcció en gamma compatible en
sistema B/N i color.
52
Figura 24. Esquema de transmissor i receptors en un sistema compatible
En els monitors en color es recuperen els primaris transmesos i per tant, és el receptor
ideal, però no és implementable per tenir 4 blocs no lineals, esdevenint un receptor
complicat i car.
§ [Fernàndez2001] p. 115
53
En aquest cas, en els monitors en blanc i negre, la luminància representada no és
exactament la luminància correcta, perdent la total compatibilitat i violant el principi de
luminància constant. Com es pot observar a continuació:
0.41 γ
Yrep = 0.3( R'+ N )γ + O.59(G'− N ) + 0.11( B'+ N )γ ≠ Y
0.59
En emissions en B/N se segueix mantenint la compatibilitat que es perd en les
emissions en color. El pitjor cas es dóna pel blau 100 % saturat. En aquest cas, es
perd un 12 % de la luminància original. A la pràctica això resulta menyspreable, ja que
els colors altament saturats només s’emeten en un 1 % del temps.
§ [Fernàndez2001] p. 116-124
El senyal de crominància
Per mantenir la compatibilitat, la informació de crominància ha d’anar inserida dins del
canal de televisió. El senyal de croma es modula amb una subportadora per traslladar
el seu espectre a la zona de mínima interferència amb l’espectre de luminància.
S’utilitzen els espais de Gray de la zona d’alta freqüència de l’espectre de luminància.
54
Figura 26. Modulació en quadratura de les components B-Y i R-Y
§ [Fernàndez2001] p. 125-131
55
RESUM
En aquesta sessió hem repassat la problemàtica d’inserir el senyal de crominància
dins del senyal de televisió B/N, tot mantenint la compatibilitat dels sistemes B/N.
56
SESSIÓ 10: El senyal de vídeo color
FITXA DE LA SESSIÓ
v Nom: El sistema de TV color NTSC
v Tipus: teòrica
v Format: no presencial
v Durada: 2 hores
v Dedicació: 2 hores
v Treball a lliurar: no
v Material:
o Bibliografia bàsica:
§ [Fernàndez2001]
§ [Torres1993]
o Bibliografia complementària:
§ [Bethencourt1990]
PRECEDENTS
En la sessió anterior varem estudiar les característiques generals dels sistemes de
televisió en color, quins requisits havien de seguir i com es podia enviar la informació
de crominància.
OBJECTIUS
En aquesta sessió estudiarem el sistema NTSC, les seves característiques generals i
com es codifica el senyal de color.
CONTINGUTS
L’ample de banda del canal està limitat a 6 MHz, i la luminància, a 4,2 MHz. S’envia
luminància i els senyals diferència de color, modulades en quadratura.
Podeu veure una explicació detallada del sistema NTSC a [Torres1993], pàgines 120-
129 i algunes explicacions a [Fernàndez2001], pàgines 132-153.
57
Senyals I i Q
L’ull no és igualment sensible a les diferències de color en totes les zones del
diagrama de cromaticitat. Per aquesta raó en el sistema NTSC no s’envien els senyals
diferència (R-Y) i (B-Y) directament, sinó que s’envien uns senyals que representen la
croma en funció dels eixos de màxima i mínima sensibilitat a les variacions de color.
El sistema NTSC defineix dos eixos segons la màxima i mínima resolució de l’ull
respecte del color. L’eix de màxima resolució és I (in phase) i el de mínima, l’eix Q
(quadrature), que es modulen amb amples de banda diferents en funció de la resolució
del color. Pel senyal I, on tenim major sensibilitat, tenim un ample de banda de 1,5
MHz, i pel senyal Q, de 0,5 MHz.
Per convertir els senyals R-Y i B-Y en I i Q, cal realitzar una rotació dels eixos de 33 º.
En la Figura 28. Espectre del senyal de vídeo NTSC podeu observar l’espectre del
senyal de vídeo NTSC. Per tal de no superar l’ample de banda del senyal de
luminància, la banda lateral superior de I s’atenua, utilitzant una modulació en banda
lateral vestigial, amb una banda lateral inferior completa. El senyal Q s’envia en doble
banda lateral.
Ja que els senyals Y, I i Q disposen de diferent ample de banda, davant d’una variació
brusca (contorn), el senyal amb major ample de banda tindrà un temps de pujada
menor, provocant un retard dels senyals I i Q. Per tal de minimitzar aquest problema,
cal retardar la luminància.
§ [Fernàndez2001] p. 149-145
Patró d’interferència
58
Definim el patró d’interferència com la imatge que il·lustra la interferència que ens
provocarà la crominància sobre de la luminància. En els semiperiodes positius de la
crominància aquesta interferència afectarà en un augment de la llluentor, mentre que
en els semiperiodes negatius serà a l’inrevés.
Podeu veure els criteris per a seleccionar la subportadora de color en la pàgina 134 de
[Fernàndez2001]. Seguint aquests criteris, en NTSC es va prendre una freqüència de
portadora de 3,583125 MHz, que més endavant es va modificar molt lleugerament.
Es força que els batuts siguin a una freqüència múltiple senar de la freqüència de línia,
concretament 117 * fH, fent que la freqüència de so sigui 572 * fH. D’aquí obtenim que
les línies són una mica més llargues que en el sistema monocrom ja que la fH ara és
de 15734,26 Hz.
§ [Fernàndez2001] p. 134-139
Sincronisme de color
Consisteix en una ràfega de subportadora de color que es transmet en el pòrtic
posterior i permet sincronitzar l’oscil·lador local de subportadora de color.
§ [Fernàndez2001] p. 147
Codificador NTSC
Podeu trobar una explicació i diagrama del sistema NTSC a [Torres1993], pàgina 125.
Bàsicament consisteix en un modulador en quadratura dels senyals I i Q que es suma
al senyal de luminància. Per tal de poder recuperar la portadora de color amb la fase
correcta, s’envia el senyal de burst al pòrtic posterior del sincronisme horitzontal.
59
§ [Torres1993] p. 125
RESUM
En aquesta sessió hem estudiat els fonaments del sistema NTSC, els senyals
utilitzats, la freqüència de subportadora i el diagrama de blocs del codificador.
60
SESSIÓ 11: El senyal color PAL
FITXA DE LA SESSIÓ
v Nom: El senyal color PAL
v Tipus: teòrica
v Format: no presencial
v Durada: 2 hores
v Dedicació: 2 hores
v Treball a lliurar: no
v Material:
o Bibliografia bàsica:
§ [Fernàndez2001]
§ [Torres1993]
o Bibliografia complementària:
§ [Bethencourt1990]
PRECEDENTS
En la sessió anterior vam estudiar les característiques generals del sistema NTSC.
OBJECTIUS
En aquesta sessió estudiarem el principal problema que presenta el sistema NTSC: el
crosstalk. També estudiarem el sistema PAL, el codificador i els receptors PAL-S.
CONTINGUTS
61
En la representació vectorial dels vectors de crominància, la informació Q és la suma
de dos vectors simètrics en l’ample de banda que sumats només tenen component en
Q.
Això provoca un canvi de fase del vector de croma, que provoca un canvi en el matís
de color.
A més a més del crosstalk, el sistema NTSC és molt sensible als errors de fase, ja que
una variació de fase fa variar els color. Per això, els televisors NTSC tenen l’ajust hue
que permet sincronitzar la fase de l’oscil·lador local amb el de l’emissora.
§ [Fernàndez2001] p. 150-152
El PAL resol el problema principal del sistema NTSC provocat per errors de fase entre
l’oscil·lador local i el generador de subportadora.
Els errors de fase entre l’oscil·lador local del receptor i el generador de subportadora
provoca variacions de matís, detectables per l’ull humà a partir de 5 º i molèsties a
partir de 10 º. El sistema PAL corregeix automàticament els defectes deguts als errors
de fase. (Vegeu a [Fernàndez2001], pàgines 155-156).
62
Codificador PAL
La croma s’envia en doble banda lateral, modulant els senyals diferència en
quadratura, i variant el signe de la component V, en cada línia, canviant el signe de la
fase del senyal de crominància com es mostra a la Figura 31. Modulació de la Cr en un
sistema PAL
La correcció dels errors de fase es basa en la hipòtesi que la croma de dues línies
consecutives no varia significativament. En desmodular la croma, es canviarà el signe
de la component V i es promitjarà la Cr de dues línies consecutives. La resultant té la
mateixa fase que el vector original. Es pot veure una il·lustració del fenomen a la
Figura 32. Il·lustració de la correcció de l’error de fase en el sistema PAL
Hem cancel·lat l’error de fase (matís) però hem introduït un error en el mòdul
(saturació) que ha quedat lleugerament atenuat.
L’ull, però, no és tan sensible a variacions de saturació com a les variacions de fase.
Un desfasament de 10 º del matís (molest) es converteix en una variació d’entre un 1 i
1,5 % del valor de la saturació.
Podeu trobar una explicació més detallada a [Torres1993], en les pàgines 129-133, i a
[Fernàndez2001], pàgines 157-158.
63
Elecció de la subportadora de color
Cal seguir els criteris que s’havien exposat en el sistema NTSC. La freqüència de
subportadora de color ha de ser el més alta possible, ha de respectar l’ample de banda
de la luminància, i respectar el principi d’imbricació de l’espectre.
on S(t) és:
2 ω 1 3ω 1 5ω 2 ω
S (t ) = (cos H t − cos H t + cos H t + ) ≅ cos H t
Π 2 3 2 5 2 Π 2
Si substituïm a Cr(t):
ωH
Cr (t ) = U (t ) sin ω sp t + V (t )[cos(ω sp ± )t ]
2
El canvi de signe, provoca un desplaçament de freqüència de la component V respecte
a la V de fh/2. Si escollíssim fsc = (2n + 1)fH/2. Aleshores, la component V aniria a
parar a sobre de la Y.
64
Figura 35. Espectre PAL amb Fsp =(2n + 1)Fh/4
Amb (2n + 1)Fh/4, el patró d’interferència PAL té una periodicitat de quatre imatges,
massa lent per tal que pugui ser integrat per l’ull.
Amb totes les modificacions el valor final de la Fsc del sistema PAL és 4,43361875
MHz. Podeu veure més informació a [Fernàndez2001], pàgines 182-183.
65
L’altra gran diferència és en la transmissió del senyal de color. Els senyals diferència
es modulen en FM, utilitzant dues subportadores a freqüències diferents. A mes a
més, a cada línia s’envia només un dels dos senyals diferència.
En alternar les components a cada línia, la resolució del color en vertical és pitjor que
en el sistema PAL.
S’usen dues portadores, una per a cada component, per limitar l’ample de banda
limitant l’amplitud del senyal d’entrada (es tracta de modulació FM). Es tria una
freqüència de subportadora específica per a cada freqüència per a disminuir la
distorsió que es produeix en limitar el senyal en amplitud.
Per tal de poder identificar les línies parells de les línies senars, en el modulador
SECAM s’insereix l’identificador, format per una seqüència d’impulsos inserits al
sincronisme vertical.
En el desmodulador SECAM, un retard de 64 µs permet memoritzar la línia anterior.
Segons arribi R-Y o B-Y, commutarem els senyals directe o memoritzat.
Pel fet de modular el senyal de croma en FM, tenim més interferència del color
respecte el senyal de luminància quan menys color hi ha a l’escena, ja que la potència
es concentra a la freqüència de subportadora.
§ [Fernàndez2001], p. 189-193
RESUM
En aquesta sessió hem repassat el sistema PAL i quines són els seus principals
avantatges. Hem discutit també l’elecció de la freqüència de subportadora de color.
Finalment, hem vist el funcionament bàsic del sistema SECAM.
66
SESSIÓ 12: Senyal de vídeo digital
FITXA DE LA SESSIÓ
v Nom: Senyal de vídeo digital
v Tipus: teòrica
v Format: no presencial
v Durada: 2 hores
v Dedicació: 2 hores
v Treball a lliurar: no
v Material:
o Bibliografia bàsica:
§ [Fernàndez2001]
§ [Benoit1998]
o Bibliografia complementària:
§ [Bethencourt1990]
PRECEDENTS
En les sessions anteriors hem estudiat el senyal de televisió analògic. A partir
d’aquesta sessió comencem a veure les característiques i funcionament dels sistemes
de televisió digital.
OBJECTIUS
En aquesta sessió farem una introducció al senyal digital, basant-nos en la norma ITU-
R601 que fixa els paràmetres per la codificació del senyal.
CONTINGUTS
El senyal digital és aquell que està codificat en dos nivells (0 i 1). Com que el món real
és analògic, sempre caldrà una conversió d’analògic a digital.
En el senyal digital ens importa la seqüència binària i polaritat, però no la forma, per la
qual cosa les distorsions no alteren el missatge i són possible múltiples còpies sense
degradació. En cas que el senyal digital presenti errors, en alguns casos és possible
corregir-ne algun, sense perdre qualitat.
67
També hi ha efectes especials possibles de realitzar amb el senyal analògic que sí que
es poden fer, un cop el senyal de vídeo és digitalitzat, i facilita la compatibilitat entre
equips, malgrat disposar de sistemes diferents.
Els passos per a digitalitzar un senyal són el filtratge passa baixes, el mostratge, la
quantificació i la codificació, com es mostra a la Figura 36. Esquema de
digitalitzacióEn els següents apartats discutirem els diferents paràmetres que
intervenen en la digitalització del senyal.
4.1.2. Mostratge
Fm ≥ 2 F max
De no complir aquest criteri es pot caure en el fenomen conegut com aliasing, on el
senyal recuperat després de la digitalització és de freqüència menor a la real a causa
de la manca de mostres suficients per a fer una bona reconstrucció.
N = 2b
68
4.2. Senyal de vídeo digital compost
4.2.1. Introducció
El senyal digital compost s’obté de digitalitzar directament el senyal de vídeo compost
analògic (NTSC, PAL o SECAM).
El nivell de blanc 100 % (700 mV) es codifica en el valor 211 (8 bits) i 844 (10 bits).
El nivell de negre (0 V) es codifica amb els valors 64 i 256, respectivament.
El nivell de sincronismes (-300 mV) es codifica amb els valors 1 i 4, respectivament.
El valor 0 (en 8 bits) i els valors 0-3 (en 10 bits) estan reservats per a altres usos.
Aquest sistema de vídeo digital compost no soluciona les limitacions que ja existien en
l’analògic, pel que fa a les interferències del cross-color i cross-luminance i, per tant,
és un sistema d’implantació reduïda.
§ [Fernàndez2001] p. 333
§ [Benoit1998] p. 18
4.3.1. Introducció
Per tal de resoldre la problemàtica del senyal digital compost, es proposa digitalitzar
cadascuna de les components per separat. El senyals mostrejats són els senyals
corregits en gamma Y’, R’-Y’, B’-Y’.
69
El principal avantatge d’aquest sistema és la compatibilitat entre els sistemes PAL,
SECAM i NTSC. La ITU (Unió Internacional de Telecomunicacions) va establir el 1982
la norma 4:2:2 ITU-R 601 de televisió digital en components. La Figura 37. Esquema
de la digitalització del senyal en mostra l’esquema de la digitalització segons aquesta
norma.
Per tal que el mostratge sigui ortogonal (mateix nombre de mostres per a totes les
línies i que estiguin alineades, com es mostra a la Figura 38. Patró de mostratge
ortogonal), cal que el temps de línia, Th, sigui un múltiple del període de mostratge, el
que comporta que la freqüència de mostratge hagi de ser múltiple enter de la
freqüència de línia.
70
Figura 38. Patró de mostratge ortogonal
Com que 2,25 MHz no compleix el criteri de Nyquist, cal cercar el múltiple més petit de
2,25 MHz que si que ho compleixi. En aquest cas 6 x 2,25 MHz = 13,5. La freqüència
de mostratge triada per a la luminància és, doncs 13,5 MHz, que compleix les
condicions requerides.
71
Taula 1. Valors a l’entrada i a la sortida de la matriu en components
Els valors de luminància estan compresos entre 0 i 1. Es codifiquen amb 8 bits, amb
220 nivells per quantificar la luminància i la resta reservats com a guarda.
Els nivells 0 i 255 estan reservats per sincronització. El nivell de blanc es codifica amb
el valor 235 i el nivell de negre, amb el valor 19.
Els valors de R’-Y’ estan compresos entre +0,701 i –0,701, i els valors de B’-Y’, entre
+0,886 i –0,886. Per tal de restablir l’excursió dels senyals diferència a la unitat (de
+0,5 a –0,5) cal emprar els següents coeficients de ponderació:
Kr = 0,5/0,701 = 0,713.
Kb = 0,5/0,886 = 0,564.
Les mostres de crominància també es codifiquen amb 8 bits, amb 225 nivells assignats
als colors i la resta reservats com a guarda.
El nivell màxim de croma es codifica amb el valor 240, el nivell zero, amb el valor 128 i
el nivell mínim de croma, amb el valor 16.
§ [Fernàndez2001] p. 345-350
En definir el nombre de mostres actives per línia, i tot cercant certa compatibilitat entre
sistemes de 525 línies (amb un temps de línia activa de 53,33 µs) i els de 625 línies
(amb un temps de línia activa de 52 µs), es va triar la major de les dues. De forma que
les mostres actives de luminància per línia seran 53,33 µs x 13,5 M most/s = 720
mostres actives de Y/ línia en tots els sistemes.
72
Aquesta decisió implica que en la digitalització del senyal analògic d’un sistema a 625
línies hi apareguin unes poques mostres negres a principi i final de línia, corresponent
al mostratge de l’esborrat horitzontal que apareixen pel fet d’agafar un temps de línia
activa una mica superior que l’estàndard.
Pel que fa a les mostres en vertical, aquestes haurien de correspondre a les línies
actives (575 en un sistema de 625 línies). El problema està en el fet que les 575 estan
organitzades en dos camps, i que, per tant, cada camp té un nombre no enter de línies
(287,5 línies exactament). Aquest fet ocasiona problemes per a emmagatzemar
digitalment les mitges línies de cada camp i es prefereix que aquestes línies es
completin, donant lloc al nombre de línies actives en un sistema digital de 576 línies.
En un sistema a 525 passa el mateix, donant lloc a 480 línies.
En la Figura 39. Mostres actives per imatge en sistemes de 525 i 625 línieses mostren
les mostres actives de Y per a cada sistema.
Figura 39. Mostres actives per imatge en sistemes de 525 i 625 línies
§ [Fernàndez2001] p. 351-354
El patró definit per la ITU-R 601 s’anomena 4:2:2. Tot i així, existeixen 4 patrons de
mostratge on es relacionen les mostres de color amb les de luminància.
73
- 4:4:4: la Y i la Cr tenen la mateixa resolució horitzontal i vertical. Permet alta
qualitat i no és utilitzat en difusió, només en entorns de producció de molt alta
qualitat.
En la Figura 40. Patrons de mostratgees mostres els patrons de mostratge 4:2:2, 4:1:1
i 4:2:0, on les “X” indiquen les mostres de luminància i les “O” les mostres de
crominància (R-Y i B-Y).
RESUM
En aquesta sessió hem pogut veure la digitalització del senyal de vídeo analògic, tant
del senyal compost com el de components.
74
SESSIÓ 13: Interconnexió de vídeo
digital
FITXA DE LA SESSIÓ
v Nom: Interconnexió de vídeo digital
v Tipus: teòrica
v Format: no presencial
v Durada: 2 hores
v Dedicació: 2 hores
v Treball a lliurar: no
v Material:
o Bibliografia bàsica:
§ [Fernàndez2001]
§ [Benoit1998]
o Bibliografia complementària:
§ [Bethencourt1990]
PRECEDENTS
En la sessió anterior vam estudiar el mostratge, la quantificació i la codificació del
senyal analògic, obtenint el senyal de vídeo digital compost i en components.
OBJECTIUS
En aquesta sessió veurem les dues interfícies que permeten connectar equips digitals
de producció, permetent als fabricants dissenyar les característiques d’entrada i sortida
dels seus equips.
CONTINGUTS
És utilitzat en edició, en interconnexió entre equips que es troben a poca distància (fins
a un màxim de 100 metres) i ha caigut darrerament en desús. La circuiteria és simple, i
per tant, els equips són barats. En canvi els cables i connectors són cars, i la
commutació per connectar múltiples aparells, cara i complicada.
75
Altres desavantatges és el fet que es pot produir diafonia (interferència entre senyals) i
si les velocitats de propagació són diferents, a gran distància, hi poden haver
problemes.
Pels motius anteriorment descrits, es prefereix utilitzar el senyal digital en sèrie que
veurem en el següent apartat.
Com a punt positiu del SDI és que els cables i connectors són senzills i barats, podent-
se utilitzar cable coaxial de qualitat. La commutació és senzilla.
A més a més, el senyal es autosincronitzable i sense polaritat, la qual cosa fa que sigui
fàcil d’instal·lar i d’utilitzar.
Cb Y Cr Y Cb Y ...
En cadascuna de les línies tenim 720 mostres de luminància, 360 mostres U i 360
mostres V. En total, doncs, tenim 1440 mostres/línia.
Una vegada multiplexats els senyals, aquests es serialitzen considerant que s’utilitzen
10 bits/mostra encara que la senyal d’origen sigui en 8 bits. D’aquesta forma la
interfície SDI té un bitrate total de 270 Mbps, independentment de si transporta vídeo
digital a 8 bit/mostra o 10 bit/mostra (si es treballa en 8 bits/mostra es posen dos bits a
zero).
76
FF 00 00 XX.
Dades auxiliars
D’aquestes 1728 mostres/línia, 1440 són de mostres actives (720 Y + 360 B-Y + 360
R-Y), 8 són per als sincronismes (4 pel SAV i 4 pel EAV). La resta, 280, s’utilitzen per
transmetre altres dades, com per exemple àudio digital. Hi ha capacitat per a
transmetre fins 8 canals estèreo d’àudio dins del senyal SDI.
Aleatorització i autosincronització
El senyal resultant ha de ser robust als errors i autosincronitzable, i per això
s’aleatoritza i es codifica mitjançant una codificació NRZI.
§ [Fernàndez2001] p. 359
Senyals HDTV
A més a més del senyal SDI de definició estàndard, existeixen altres senyals d’alta
definició amb les corresponents interfícies d’interconnexió. Com a quadre resum
podem obtenir els següents formats:
77
Bitrate-‐
total
Bitrate-‐net
Standard
Nom
Mostres/
Línies/
Frame
(4:2:2,
10
(4:2:2,
10
ITU
comercial
línia
imatge
rate
Fmy
bit)
bit)
Interfície
ITU-‐R
601
576i
720
576
25
13,5
MHz
270
Mbps
207,3
Mbps
SDI
1,485
ITU-‐R
1543
720p
1280
720
50
74,25
MHz
Gbps
921,6
Mbps
HD-‐SDI
1,485
1,0368
ITU-‐R
709
1080i
1920
1080
25
74,25
MHz
Gbps
Gbps
HD-‐SDI
2
x
HD-‐
2,0736
SDI/
3G-‐
ITU-‐R
709
1080p
1920
1080
50
148,5
MHz
2,97
Gbps
Gbps
SDI
RESUM
En aquesta sessió hem vist les dues interfíces principals d’interconnexió de vídeo
digital, la interfície paral·lela i la interfície sèrie.
78
SESSIÓ 14: Fonaments de compressió
FITXA DE LA SESSIÓ
v Nom: Fonaments de compressió
v Tipus: teòrica
v Format: no presencial
v Durada: 2 hores
v Dedicació: 2 hores
v Treball a lliurar: no
v Material:
o Bibliografia bàsica:
§ [Fernàndez2001]
§ [Benoit1998]
§ [Torres1993]
o Bibliografia complementària:
§ [Bethencourt1990]
PRECEDENTS
En les sessions anteriors, vàrem fer una introducció del senyal digital de televisió i
estudiar la norma ITU-R601.
OBJECTIUS
En aquesta sessió veurem la necessitat de comprimir per tal de poder transmetre el
senyal de televisió digital, i estudiarem els mètodes estadístics i predictius que ens
permeten fer aquesta compressió.
CONTINGUTS
5. Compressió de vídeo
79
En una seqüència de vídeo existeixen tres tipus de redundància: l’estadística, la
temporal i l’espacial. En les properes seccions en parlarem amb més detall.
Factor de compressió
Un sistema de compressió es caracteritza pel seu factor de compressió. El factor de
compressió és el paràmetre bàsic que ens indica el nombre de vegades que reduïm el
volum d’informació després de la compressió, es defineix, doncs, com:
Evidentment per tenir compressió cal que el factor de compressió sigui major que la
unitat.
Tipus de compressors
Existeixen diverses formes de classificar les tècniques de compressió. Una d’elles és
en funció de la distorsió introduïda en el procés de compressió.
En contraposició, els mètodes irreversibles, amb pèrdua o lossy són aquells que
introdueixen una certa distorsió en el procés. Permeten grans factors de compressió,
que són variables en funció de la distorsió que la nostra aplicació accepti.
Generalment, s’apliquen a contingut digitalitzat com l’àudio, les imatges o el vídeo, on
l’usuari final és l’esser humà que està disposat a acceptar certa distorsió en el resultat
final.
Redundància estadística
En qualsevol volum de dades hi ha símbols que apareixen més que altres. Els
mètodes de compressió reversibles (tipus ZIP, ARJ, etc.) permeten eliminar aquesta
redundància, utilitzant mètodes de codificació de longitud variable. Aquesta
compressió és totalment reversible.
80
Redundància temporal
En una seqüència d’imatges, el contingut entre imatges no varia excessivament, a
excepció de quan hi ha canvis de pla o moviments bruscos. Aquesta repetició
d’informació al llarg del temps és la redundància temporal. Per eliminar la redundància
temporal generalment s’utilitzen mètodes anomenats predictius. Utilitzant mostres de
la imatge anterior, i mitjançant tècniques predictives, podrem deduir de manera
aproximada quina és la situació dels píxels en la imatge actual. L’eliminació de la
redundància temporal és el procés que comprimirà més en una seqüència de vídeo.
Redundància espacial
En una imatge, els píxels propers en l’espai presenten valors de luminància i
crominància molt semblants. Aquesta semblança és la redundància espacial. Els
contorns trenquen aquesta redundància. L’eliminació de la redundància espacial
generalment es realitza mitjançant tècniques transformades que concentren l’energia
del senyal en pocs coeficients decorrelats entre ells.
§ [Fernàndez2001], p. 368-370
81
Codis de longitud variable. Huffman
En els codis de longitud variable (VLC, Variable Length Code) es defineix una taula de
símbols obtinguda estadísticament a partir de la freqüència d’aparició de cada símbol
en una seqüència. La base del codi consisteix en assignar codis curts als símbols més
probables, i codis més llargs als símbols que apareixen amb menys freqüència.
Aconseguint reduir la longitud mitja del senyal codificat final.
Per que un codi d’aquest tipus funcioni cal que ens assegurem que la descodificació
no té cap ambigüitat. Per aconseguir-ho cal que cap codi sigui prefix de cap altre. Per
entendre el concepte suposem que volem comprimir la següent seqüència de lletres:
a e c e d f a a c d.
símbol codeword
a 000
e 001
c 010
d 011
f 100
Tot i així podem cercar un codi més eficient que codifiqui amb un codi binari més curt
aquells símbols que són més probables:
Aquest codi presenta una longitud mitja per símbol de 1,5 bits/símbol i per tant
comprimiria amb 15 bits la seqüència de 10 símbols. Obtenint un factor de compressió
respecte el codi de longitud fix de FC = 30/15 = 2. Malgrat tot, aquest codi no és vàlid.
La seva descodificació no és única, ja que davant d’un 0, el descodificador no té forma
de saber si ha de descodificar un a o es tracta del principi d’una c o d.
Per construir un codi vàlid cal que cap codi sigui prefix de cap altre. Podríem construir
molts codis que tinguessin aquesta propietat, però de tots ells el que té millors
prestacions de compressió és el codi de Huffman. Consisteix en ordenar els símbols
de major a menor probabilitat i després, iterativament, anar agrupant els dos símbols
de menor probabilitat. A cada agrupació, sumem les probabilitats de cada símbol o
grups de símbols que agrupem. Finalment, resta només una sola branca que haurà de
tenir la suma de totes les probabilitats, és a dir, la unitat.
82
Un cop aquest arbre està fet, cal assignar, començant per la branca arrel, un 0 o un 1
a cada branca. Construint el codi final a partir de la lectura de cada camí, des de l’arrel
a les fulles:
Així doncs, el codi obtingut assegura descodificació unívoca, tot oferint la màxima
compressió possible que podem obtenir amb un codi de longitud variable. En aquest
cas, la longitud promig del codi és de 2,3 bits/símbol, que correspon a un factor de
compressió de FC = 30/23 = 1,3.
83
Els mètodes predictius eviten enviar informació redundant que es pot predir amb les
imatges anteriors, enviant només l’error de predicció. Vegeu l’explicació a
[Torres1993], pàgines 168-181.
Estimació de moviment
El primer pas per tal de reduir la redundància temporal entre imatges és l’estimació de
moviment, comparant dues imatges consecutives. La informació de moviment
s’expressa mitjançant vectors de moviment, associats a cada bloc, generalment
particions de 16 x 16 píxels de la imatge.
Per tal de poder trobar el vector de moviment òptim per a cadascun dels blocs
existeixen diferents mètodes, entre els quals podem destacar l’estimació de moviment
per la tècnica del block matching. Aquesta tècnica consisteix a trobar, per a cada bloc
de la imatge, un bloc que sigui el més semblant possible a l’inicial, dins d’una àrea de
cerca en la imatge que ens serveix de referència per a fer la predicció.
Per tal de poder aplicar aquest mètode, cal que es compleixin unes condicions: el
moviment ha de tenir lloc en el pla perpendicular a l’eix de la càmera i només en forma
de translacions, la il·luminació ha de ser espacialment i temporalment uniforme i les
oclusions d’objectes han de ser infreqüents.
§ [Fernàndez2001] p. 373-376
§ [Benoit1998] p. 42-43
84
Compensació de moviment
Abans de codificar la imatge, tenim en compte la informació proporcionada per la
imatge anterior i el vector de moviment. Només cal enviar l’error entre aquesta
predicció i la imatge real, podent codificar més eficientment la imatge actual.
Quan més exacte sigui el vector de moviment, menys error de predicció hi haurà i més
eficient serà el compressor.
§ [Fernàndez2001] p. 377
RESUM
En aquesta sessió hem vist la necessitat de comprimir el senyal de vídeo digital,
eliminant la redundància. Hem estudiat els mètodes estadístics i predictius que
permeten eliminar la redundància estadística i temporal, respectivament.
85
86
SESSIÓ 15: Mètodes de compressió
transformats
FITXA DE LA SESSIÓ
v Nom: Mètodes de compressió transformats
v Tipus: teòrica
v Format: no presencial
v Durada: 2 hores
v Dedicació: 2 hores
v Treball a lliurar: no
v Material:
o Bibliografia bàsica:
§ [Fernàndez2001]
§ [Benoit1998]
§ [Torres1993]
o Bibliografia complementària:
§ [Bethencourt1990]
PRECEDENTS
En la sessió anterior vam estudiar els mètodes estadístics (codis de longitud variable) i
predictius (estimació i compensació del moviment) que ens permetien comprimir el
senyal de vídeo.
OBJECTIUS
En aquesta sessió estudiarem els mètodes transformats que permeten eliminar la
redundància espacial. També estudiarem els estàndards de compressió de vídeo per a
videoconferència.
CONTINGUTS
Els sistemes irreversibles només són aplicables a dades digitalitzades, com és el cas
del senyal de televisió.
87
Els objectius d’aquestes tècniques són concentrar l’energia del senyal en el menor
nombre possibles de coeficients, i descorrelar aquests. En tenir uns coeficients
descorrelats, aquests es poden quantificar de forma independent, podent aplicar més o
menys quantificació, d’acord amb la corba de sensibilitat de l’ull. Vegeu [Torres1993],
pàgines 182-188
Cada coeficient de la DCT original és dividit pel seu valor corresponent en la matriu de
quantificació, que no és única. Com que la divisió no és exacta, produeix pèrdues que
fan que el procés no sigui reversible.
§ [Fernàndez2001], p. 383-390
§ [Torres1993], p. 188-194
§ [Benoit1998], p. 28-35
88
5.3. Estàndards de compressió de vídeo
Són estàndards que operen en temps real, amb un retard inferior a 150 ms, oferint un
factor de compressió unes tres vegades superior al JPEG. Vegeu [Fernàndez2001],
pàgines 379-381 i [Torres1993], pàgines 210-216.
Formats d’imatge
Els formats utilitzats són el CIF (Common Intermediate Format) i el QCIF (Quarter of
CIF).
§ [Benoit1998], p. 21-22
Mètodes utilitzats
Per tal de comprimir la informació s’utilitza la codificació de longitud variable que
permet eliminar la redundància estadística. S’aplica sobre macroblocs d’imatge de 16 x
16 píxels.
Modes de codificació
En el mode intraframe, els valors de luminància i crominància es codifiquen sense cap
tipus de predicció. S’aplica directament la DCT als valors Y, U i V de la imatge.
D’aquesta manera disposem de punts de partida i evitem arrossegar errors que s’hagin
pogut produir durant la transmissió.
89
En el mode interframe, només es codifica l’error de predicció, després d’haver
comparat la imatge amb la predicció. Si la predicció no és prou bona, s’utilitza el mode
intraframe.
RESUM
En aquesta sessió hem estudiat els mètodes transformats que permeten eliminar la
redundància espacial. També hem estudiat l’estàndard H.261 de compressió de vídeo
per a videoconferència.
90
SESSIÓ 16: Introducció al MPEG
FITXA DE LA SESSIÓ
v Nom: Introducció al MPEG
v Tipus: teòrica
v Format: no presencial
v Durada: 2 hores
v Dedicació: 2 hores
v Treball a lliurar: no
v Material:
o Bibliografia bàsica:
§ [Fernàndez2001]
§ [Benoit1998]
o Bibliografia complementària:
§ [Bethencourt1990]
PRECEDENTS
En les sessions anteriors vam estudiar els diferents mètodes: estadístics, predictius i
transformats que ens permetien comprimir el senyal de vídeo. També vàrem estudiar
els estàndards utilitzats per a videoconferències.
OBJECTIUS
En aquesta sessió estudiarem els estàndards MPEG. Estudiarem el MPEG2 vídeo, els
perfils i nivells que utilitza, i la sintaxi emprada.
CONTINGUTS
Els formats de dades reben el nom de sintaxi i s’utilitzen per crear diferents tipus de
bitstreams. Les regles per a interpretar les dades s’anomenen semàntica. L’únic
requeriment que MPEG disposa al codificador és que generi un bitstream
sintàcticament correcte i que pugui ser interpretat seguint la semàntica de
descodificació de qualsevol descodificador compatible.
91
El fet que el descodificador no sigui estàndard implica que poden coexistir codificadors
compatibles amb nivells de prestació diferents.
Els estàndards MPEG són jeràrquics: els nivells superiors sempre són compatibles
amb els anteriors. L’estàndard MPEG1 és utilitzat en sistemes d’emmagatzematge
(CD-ROM, etc.) i ofereix una qualitat VHS. El seu bitrate és petit, entre 1,5 i 3 Mbps, i
el format d’imatge utilitzat és el SIF. MPEG2 està orientat a la transmissió de TV digital
i HDTV. El bitrate és entre 4 i 25 Mbps i el format d’imatge, el ITU601. MPEG3 està
orientat a la compressió HDTV, però no s’utilitza ja que el nivell anterior (MPEG2) és
prou flexible. MPEG4 està dissenyat per sistemes de compressió multimèdia.
§ [Fernàndez2001], p. 392-394
MPEG1
L’estàndard MPEG1 (ISO11172) va sorgir d’un comitè constituït al 1988 per 15
participants. La primera redacció es va presentar el 1990. En aquell moment, el comitè
ja estava constituït per 150 participants.
§ [Fernàndez2001] p. 395-397
§ [Torres1993], p. 217-221.
MPEG1 Systems
El MPEG1 Systems defineix una estructura de paquets per multiplexar dades de vídeo
i àudio en un únic stream, mantenint la seva sincronització.
§ [Fernàndez2001], p. 398
§ [Benoit1998], p. 65-69
92
MPEG1 vídeo
MPEG1 vídeo especifica la sintaxi de l’stream de vídeo i el procés de codificació
corresponent. Inicialment va ser concebut per a codificar vídeo a resolució CIF, encara
que accepta resolucions majors. El format SIF emprat és el següent:
En PAL, tenim 25 imatges per segon, de 352 x 288 píxels. En NTSC, disposem de 30
imatges per segon, de 352 x 240 píxels. En ambdós casos, el patró de mostratge és
4:2:0, les imatges, progressives i el bitrate sense compressió, de 30 Mbps.
Els mètodes de codificació per eliminar les redundàncies espacial i temporal són molt
similars als emprats en H.261.
§ [Fernàndez2001], p. 399
§ [Benoit1998], p. 36-44
MPEG1 àudio
El MPEG1 àudio especifica la sintaxi de l’stream d’àudio i el procés de codificació
corresponent. El sistema de compressió es basa en una descomposició en subbandes
del senyal, aconseguint bitrates de 64, 128 o 192 kbps.
§ [Fernàndez2001], p. 400
§ [Benoit1998], p. 58-61
Les principals aplicacions del MPEG2 són la distribució de senyal de televisió digital
terrestre, per cable o satèl·lit, HDTV, DVD, vídeo sota demanda, vídeo professional
(edició no lineal, postproducció, etc.).
En les pàgines 404 i 405 de [Fernàndez2001] podeu observar les diferències principals
entre els estàndards MPEG1 i MPEG2.
93
MPEG2 vídeo
El desenvolupament de l’estàndard MPEG2 vídeo es va realitzar en dues fases. En
una primera, les empreses competien per tal de treure el seu estàndard.
Posteriorment, van decidir col·laborar entre elles per tal de crear un estàndard únic.
A més dels perfils es defineixen el nivells. Els nivells són les diferents resolucions amb
les quals poden treballar cadascun dels perfils. Es defineixen 4 nivells (baix, principal,
alt 1440 i alt) i van des de resolucions tipus CIF fins a alta definició.
No totes les combinacions perfil-nivell són possibles, les que l’estàndard permet són
els punts de conformitat, que podeu trobar a la pàgina 419 de [Fernàndez2001]. Els
dissenyadors de descodificadors s’han d’adherir a aquests parells, ja que no totes les
combinacions són permeses. Només ho són aquelles que tenen sentit des del punt de
vista aplicatiu. Els nivells inferiors també es poden descodificar, encara que no es
poden considerar pròpiament punts de conformitat.
Malgrat que MPEG2 està finalitzat, el procés de definició de perfils segueix obert per
tal d’acomodar noves eines que poden ser necessàries en un futur. Actualment hi ha
dues àrees per les quals s’estan definint nous perfils: el vídeo professional d’alta
qualitat i el vídeo amb múltiples punts de vista. A les pàgines 431-434 de
[Fernàndez2001] podeu trobar informació sobre aquests nous perfils.
§ [Fernàndez2001], p. 415-434
§ [Benoit1998], p. 46-48
94
Sintaxi del MPEG2 vídeo
La sintaxi especifica com han de ser les dades. Està organitzada entorn d’una
estructura jeràrquica de 6 nivells: seqüència, grup d’imatges, imatge, slice, macrobloc i
bloc. Observeu aquesta jerarquia a la pàgina 436 de [Fernàndez2001].
§ [Fernàndez2001], p. 435-456
Grup d’imatges
Els grups d’imatges (group of pictures, GOP) és la base per a realitzar la codificació
temporal de les imatges. Un GOP està format habitualment per 12 imatges. Si agafem
un nombre més gran, aconseguirem taxes de compressió major però els errors es
propagaran durant més temps.
Les imatges estan constituïdes per slices i és la unitat de codificació bàsica. Podem
distingir tres tipus d’imatges: imatges I (intraframe), imatges P (predicted) i imatges B
(bidirectional).
Les imatges I són les imatges que s’utilitzen en un principi de seqüència d’imatges o
de GOP. En aquestes imatges només s’apliquen tècniques de compressió de
redundància espacial i estadística, per la qual cosa són les que menys compressió
presenten. Permeten definir punts d’accés aleatori a la seqüència, la recerca ràpida i
edició, i eviten la propagació d’errors.
Per escenes amb moviment ràpid, en què els errors de codificació són difícils de
detectar, les imatges P proporcionen un millor compromís entre qualitat i velocitat
d’actualització de la imatge.
95
Els GOP són oberts o tancats en funció de si la primera imatge B necessita o no de
l’anterior imatge P (del GOP anterior) per poder ser predita. Observeu l’exemple de la
pàgina 443 de [Fernàndez2001].
Slice
Un slice (llesca) és una cadena de macroblocs consecutius de longitud arbitrària.
En les imatges I, transmetem tots els macroblocs dins d’un slice, i en les imatges P i B,
els macroblocs nuls (o amb poca informació) poden no ser enviats, però sempre cal
transmetre el primer i darrer macrobloc de l’slice.
Un slice pot ser tan llarg com l’amplada de la imatge, però normalment es divideix per
evitar la propagació d’errors i ja que hi ha informació que es transmet de forma
diferencial de MB a MB (vectors de moviment, component DC). Aleshores, en cas
d’error, aquest es propaga per tot l’slice. Dissenyarem, doncs, la longitud del slice en
funció dels errors de transmissió.
Macrobloc
És la unitat emprada per a la predicció i compensació de moviment. A cada MB s’hi
associa un vector de moviment.
Per tal d’augmentar la compressió, el codificador pot decidir no enviar alguns MB.
Tipus de macrobloc
En imatges I només hi ha dos tipus de MB possibles: intra o intra+macroblock_quant.
96
diferència entre MB situats en la mateixa posició. També es poden utilitzar MB intra
quan l’error de predicció és gran i convé més enviar els valors originals.
§ [Fernàndez2001] p. 452-453
Bloc
Els blocs consten de les dades dels coeficients de la DCT quantificats d’un bloc de 8 x
8 píxels. En el MP@ML consta de 6 blocs per MB (4 de luminància i un per cada
component de color).
Existeix una taula de quantificació dels coeficients de la DCT diferent per a MB inter i
per MB intra, ja que tenen estadistiques diferents.
97
RESUM
En aquesta sessió hem estudiat l’estàndard MPEG1. Hem introduït el MPEG2 i
estudiat els nivells i perfils, i sintaxi del MPEG2 vídeo. Finalment, hem comentat els
principals aspectes del H.264/MPEG4-Part 10.
98
Bibliografia
LLIBRES
PAL Plus
Pareja Carrascal, Emilio
Instituto Oficial de Radiotelevisión Española
Madrid, 1995
[Pareja1995]
99
APUNTS
Sistemes de Televisió
Fernàndez, Gabriel
Enginyeria i Arquitectura La Salle
Barcelona, 2001
[Fernàndez2001]
Televisió. Pràctiques
Güell, Jaume; Ribas, Josep
Enginyeria i Arquitectura La Salle
Barcelona, 2001
[Güell2001]
100
Glossari
3-STEP-SEARCH
Mètode d’implementació del block matching en el qual es busca dins un subconjunt de
punts. Menys costós que el full-search però la solució és subòptima.
Aliasing PAL-Plus.
La recepció d’una imatge en 16:9 en una pantalla en 4:3 posa la informació d’alta
freqüència del senyal (detalls de la imatge) en una modulació ultranegra en la part
superior i inferior de la pantalla. Aquestes bandes són les que ajuden als receptors
PAL Plus a fer la reconstrucció de la imatge (ja que sinó hi hauria molt poca resolució).
Mentre enviem el vertical helper no podem enviar color.
BANDES DE MACH
Són les barres de color que a vegades veiem en les cartes d’ajust. La luminància en
aquestes barres és constant, però nosaltres la percebem diferent perquè tendim a
comparar-les amb les del voltant.
BLOCK
Cada macroblock està format per un conjunt de 4 blocks de 8 x 8 píxels sobre els
quals es fa la DCT.
BLOCK MATCHING
Tècnica d’estimació de moviment. És el més usat per la seva senzillesa. Consisteix a
dividir la imatge en blocs. Té dues modalitats: full-search i 3-step-search (cerca en tres
passes).
BURST
Sincronització de color. Té la funció de sincronitzar la Fsp del OL i informar del tipus de
línia senar o parell. És un sincronisme perfecte de 0,3 V d’amplitud en fase entre el
senyal de l’emissor i el receptor (l’ha de conèixer el receptor per agafar-lo com a
referència). Consta de 10 a 12 cicles de subportadora inserits al pòrtic posterior del
senyal en color per transmetre la sincronització local del receptor (senyal de vídeo
compost).
CAMP
Per tal d’aconseguir unes imatges contínues hem d’arribar a veure més de 40 imatges
per segon. Degut al fet que la freqüència de xarxa seria massa crítica, desdoblem les
imatges formades per 625 línies en dos camps, un d’ells formats per 312,5 línies
parelles i l’altre per les 312,5 línies senars. En la pantalla, primer apareixerà un camp i
llavors l’altre, donant l’efecte que tenim el doble d’imatges per segon i podem veure les
imatges més contínues (sense la sensació de pampallugueig).
CODI DE HUFFMAN
101
Codi de longitud variable de descodificació unívoca. És òptim basat a partir de
probabilitats.
CODIFICACIÓ DUOBINÀRIA
Reduir l’ample de banda a la meitat passant de dos a tres nivells. Amb aquest sistema
l’ample de banda varia segons la component que estem transmetent.
COEFICIENTS TRIESTÍMULS
A causa del tipus de cèl·lules con, tots els colors els podem definir com una
combinació del vermell (R), verd (G) i blau (B). La llum blanca és quan R = G = B.
COFMD
Coded Orthogonal Frequency Division Multiplexing. S’utilitza en el DVB-T i permet
aprofitar molt bé l’espectre. Es basa amb una modulació multiportadora on els ecos es
poden cancel·lar fàcilment.
COMPRESSIÓ
La compressió intenta eliminar la redundància que podem trobar en determinades
fonts d’informació. La compressió pot ser reversible (quan no hi ha pèrdua amb el que
comprimeixes) o irreversible (amb pèrdua, lossy, són els que l’original i el reconstruït
no són idèntics).
CORRECCIÓ EN GAMMA
La correcció en gamma consisteix a aplicar en el transmissor una no linealitat al senyal
del tipus elevat a 1/gamma. Això es fa per compensar la no linealitat que existeix al
tubs de raigs catòdics dels receptors que generalment són del tipus elevat a gamma.
Gamma és un factor que dependrà de la no linealitat del receptor i acostuma a prendre
valors al voltant de 2. D’aquesta forma la resposta global del sistema emissor-receptor
serà lineal.
CROMINÀNCIA
És la especificació del color (matís i saturació).
CROSS-COLOR
Interferència del color sobre la luminància. Per molt que s’utilitzin els espais de Gray,
com que compartim el mateix ample de banda entre la luminància i el color sempre
tenim alguna interferència.
CROSS-LUMINÀNCIA
Interferència de la luminància sobre el color. Per molt que s’utilitzin els espais de Gray,
com que compartim el mateix ample de banda entre la luminància i el color sempre
tenim alguna interferència.
CROSSTALK
Interferència entre els senyals I i Q, els quals haurien de ser independents. Això
produeix un canvi en el matís del color (igualment que els errors de fase).
DATACAST
102
Servei de lloguer per transmetre dades utilitzant els les línies 20 – 21 del camp I i les
línies 333 – 334 del camp II.
DCT
Discrete Cosine Transform. És una transformada real i fixa. Proporciona resultats molt
similars als que obtindrem amb KLT. Els seus coeficients ens permeten codificar les
imatges en blocs sobre els quals es farà la DCT.
DEFLEXIÓ
És el fet de desviar el feix d’electrons d’esquerra a dreta en un TRC. Això
s’aconsegueix creant un camp magnètic, donant una rampa de corrent a les bobines
de deflexió horitzontals. Existeix també la deflexió vertical que serveix perquè el feix
faci el moviment de dalt a baix.
DFT
Discrete Fourier Transform. Transformada complexa que s’utilitza en l’anàlisi espectral.
DIGITALITZACIÓ
Un senyal digital és més robust al soroll que un d’analògic i necessita menys potència
per ser transmès. L’ús de circuits electrònics digitals ens permeten manipular més
fàcilment el senyal, aplicar codis correctors d’errors, comprimir, utilitzar canals
adjacents (amb més ample de banda).
DISTORSIÓ
La distorsió és una malformació del senyal a causa d’una resposta imperfecta del
sistema.
DISTORSIÓ DE COIXÍ
Per solucionar el fet que la pantalla d’un televisor és aproximadament plana (els punts
dels extrems estan en un punt més llunyà del centre de la pantalla i les imatges
queden bombades en forma de coixí), es col·loquen imants a cada banda, en la
televisió en blanc i negre, o bé ajustem el corrent de deflexió electrònicament, en el
cas de la televisió en color.
DISTORSIÓ DE LINEALITAT
Causada per la no curvatura de la pantalla de televisió (la separació entre línies de
l’extrem superior i inferior és major que la separació que hi ha entre les del centre de la
pantalla). Es pot solucionar fent una correcció en “S” que suavitzarà la corba de la
deflexió horitzontal.
EDTV
Extended Definition Television. Sistemes analògics que milloren el senyal transmès.
Els més importants són PAL PLUS i MAC.
EFECTE PERSIANA
Barres de Hannover. En la imatge hi ha línies que es veuen més lluents que d’altres.
Quan la correcció en gamma és major que 5 º part de la informació de luminància
viatja en el senyal de croma. L’entrellaçat agreuja aquest fenomen.
103
EL·LIPSES DE MC.ADAM
Fa una reorientació dels eixos U i V i els anomena I i Q. Aquesta reorientació es basa
en què cada llum dins el gràfic d’eixos u i v té forma d’el·lipse. Si travessem les
el·lipses pel cantó curt, la variació d’el·lipses és molt més ràpida i tindrem més
sensibilitat al color. Per tenir una sensibilitat màxima cal que els nous eixos tinguin un
angle superior de 33 º respecte els antics.
EMMASCARAMENT VISUAL
Reducció visual d’un cert estímul per la producció d’un canvi espacial (poc sensibles al
contorn) i temporal (poc sensibles al detall en imatges que es mouen).
ENTRELLAÇAT
Desdoblament de les imatges en dos camps amb la meitat de línies cadascun.
L’objectiu de l’entrellaçat és el de proveir d’un sistema de visualització lliure de flícker
però amb un nombre d’imatges per segon relativament petit.
ESBORRAT (BLANKING)
L’esborrat és l’interval de temps durant el qual el TRC no ha de pintar res per pantalla,
ja que el feix d’electrons està retornant horitzontalment o verticalment. L’esborrat
horitzontal està format per dos pòrtics i un sincronisme que en total ocupen 12
microsegons de cada línia. L’esborrat vertical té una durada de 25 línies, formades per
un conjunt de polsos de preigualació, sincronisme vertical i postigualació. Durant
l’esborrat vertical es contínua enviant el sincronisme horitzontal.
ESTIMACIÓ DE MOVIMENT
Els objectes en moviment tenen un error de predicció molt gran. Per solucionar-ho
tindrem en compte el moviment en la predicció amb vectors de moviments. Existeixen
diferents mètodes per tal de realitzar aquesta estimació, com són els mètodes de
gradient, correlació de fase i block matching. L’estimació es realitza sobre la Y. Els de
la Cr es basen en els de la Y dividits entre 2.
FACTOR DE COMPRESSIÓ
Relació que ens indica el nombre de vegades que reduïm la informació en un sistema
de compressió de dades.
FACTOR DE KELL
Factor que defineix la pèrdua de definició vertical. És degut al sistema d’entrellaçat i a
deficiències mecàniques del sistema d’entrellaçat dels televisors.
FLÍCKER
La freqüència crítica de flícker és el nombre d’imatges discontínues que calen rebre en
un segon perquè ens sembli veure una imatge constant. Aquesta freqüència és de 40
Hz. (40 imatges/segon) i pot augmentar si augmenta la luminància o augmenta el
tamany de la superfície il·luminada. Flícker de grans àrees i flícker de línia.
FULL-SEARCH
104
Mètode d’implementació del block matching. Consisteix en buscar totes les possibles
posicions del bloc de referència. Molt costós però trobem el resultat òptim.
GOP
Group of pictures. Forma part de la sintaxi del stream del MPEG. Un GOP conté la
informació d’una sèrie d’imatges codificades. Un GOP és obert quan es pot relacionar
amb un altre; en canvi, és tancat quan no podem fer-ho.
HD-MAC
Sistema d’alta definició HDTV que es compon de 1250 línies/imatge, 25
imatges/segon, 2 camps imatge i relació 16:9. Treballa amb vectors de moviment per
interpolar una fusió de les 2 trames sols al lloc on hi ha hagut moviment.
HDTV
Sistemes analògics d’alta definició. Permet obtenir més resolució espacial, relació
d’aspecte panoràmica 16:9, millora del color i so digital. N’hi ha dos tipus: HD-MAC
(1250 línies/imatge, 25 imatges/segon, 2 camps imatge i relació 16:9). MUSE (1050
línies/imatge, 30 imatges/segon, 2 camps/imatge i relació 16:9). S’aconsegueix
augmentar la resolució espacial, millora del color, so digital i relació d’aspecte
panoràmica 16:9. Mostratge subNyquist.
IDTV
Improved Definition Television. Millora feta en els receptors a partir de filtres COMB,
cancel·ladors d’eco i sistemes de 100 Hz. Amb això s’aconsegueix eliminar totalment
el flícker (però apareix un problema temporal que es manifesta com una tremolor).
ILC
Índex de luminància constant. Serveix per quantificar la dependència entre els canals
de croma i de luminància i veure en quin grau es pot violar el principi de luminància
constant.
IMATGE PROGRESSIVA
S’utilitza en el cinema. El cinema capta les imatges fotograma a fotograma, la imatge
des de l’inici ja és una foto de 576 línies.
IMATGES I, B, P
Són les imatges que poden portar un GOP dins la seqüència del MPEG. Les imatges I
(intra) estan codificades sense predicció temporal, les imatges P (predicted) la
codificació és amb predicció temporal a partir d’una altre imatge I o P anterior, i les
imatges B (bidirectional) estan codificades amb predicció temporal a partir d’una I o P
posterior.
INTEGRADOR ELECTRÒNIC
Es troba en el sistema PAL-D per solucionar els problemes del PAL-S. Realitza la
integració de les línies electrònicament. Com a conseqüència s’elimina totalment
105
l’efecte persiana i la línia de retard és ultrasònica, però tenim una pèrdua de resolució
vertical del color.
INTERFERÈNCIA
La interferència és un senyal molt similar al nostre (generalment freqüencialment) que
afecta al nostre senyal.
INTERFRAME
Per poder comprimir utilitza vàries imatges de vídeo (extreu la redundància de vàries
imatges de vídeo).
INTRAFRAME
Quan la compressió de vídeo es realitza en una sola imatge (extreu la redundància de
cada imatge).
ITU-R 601
Norma estandarditzada per tal d’obtenir la Y, U i V digitalitzades en paral·lel. Els tres
senyals R, G i B després de passar per un filtre FPB de 5,5 MHz es transformen a
causa d’una matriu en Y’, B’-Y’ i R’-Y’. Cada una d’elles actua per separat. A la Y’ se li
aplica un retard, en canvi als altres senyals se’ls multiplica per un factor de 0,5643 i
0,713 respectivament. Llavors en la Y’ li apliquem un altre filtre FPB de 5,5 MHz, se la
mostreja a 13,5 MHz i ja se la pot quantificar per obtenir un senyal digital·litzat de 8 o
10 bits. Les altres dos el FPB que se’ls aplica és de 2,75 MHz i la freqüència de
mostratge de 6,75 MHz.
KLT
Karhunen Lloeve Transform. És la transformada òptima, ja que calcula els coeficients
de la transformada adaptats a unes dades concretes. És òptim per imatges estàtiques,
ja que per cada nova imatge ha de calcular nous coeficients.
LÍNIA
Les imatges es composen de línies. Cada línia dura 64 microsegons, 52 dels quals són
d’informació, i recorre d’esquerra a dreta de la pantalla donant-li la informació de
luminància i de color. Cada imatge ocupa 625 línies.
LLUM MONOCROMÀTICA
És la llum que té tota l’energia (informació) en una longitud d’ona concreta. La seva
oposada és la llum blanca que té la informació per igual a totes les longituds d’ona.
LUMINÀNCIA
És la informació blanc i negre d’una imatge (aproximació a la lluentor).
MAC
Multiplexed Analog Components. Objectius: millorar el sistema PAL, millorar la qualitat
sobretot via satèl·lit amb un millor aprofitament de l’espectre, mantenir certa
compatibilitat amb el sistema PAL, eliminar interferències Y/Cr, millorar resolució
horitzontal i augmentar el nombre i qualitat de canals de so.
106
METÀMERS
Distribucions físicament diferents, però que tenen la percepció visual (sensació de
color) igual cadascuna d’elles.
MÈTODES PREDICTIUS
Basat en predicció. Consisteixen a predir la informació a partir de mostres prèvies.
Generalment, les mostres directament no tenen redundància però es mouen dins un
marge (són similars). Aquests mètodes no transmeten el valor sinó l’error del que
havia de transmetre i el que ha predit, esperant que aquests siguin aprox. 0.
MÈTODES TRANSFORMATS
Serveixen per eliminar la redundància espacial. Basen el seu funcionament en treballar
en un domini transformat on la informació es descriu de forma més compacta. Aquests
mètodes són més complexos que els predictius, però també més òptims.
MFO
Monitor de Forma d’Ona. És un instrument dissenyat per l’anàlisi i mesura directa dels
diferents paràmetres del senyal de televisió.
MOSTRATGE ORTOGONAL
Aquest mostratge consisteix a agafar les mostres d’una imatge línia a línia de manera
que unes mostres estiguin a sobre de les altres. Perquè sigui ortogonal cal que Fm =
K•Fh.
MOSTRATGE SUBNYQUIST
Aquests sistemes agafen no totes les mostres sinó alternatives. Aquestes mostres es
recuperaran en el receptor mitjançant mètodes d’interpolació.
MPEG-2
Digital. Algorisme de compressió de la informació de vídeo per poder transmetre la
informació, comú a tots els països.
MUSE
Sistema HDTV. 1050 línies/imatge, 30 imatges/segon, 2 camps/imatge i relació 16:9.
S’aconsegueix augmentar la resolució espacial, millora del color, so digital i relació
d’aspecte panoràmica 16:9. Mostratge subNyquist.
NTSC
Sistema de TV americà. Compost de 525 línies/imatge, 30 imatges/segon i 2
camps/imatge. Relació d’aspecte 4:3. – resolució espacial + temporal. Com a principal
problema les distorsions de color causades pels errors de fase entre l’oscil·lador del
receptor i la portadora que provoquen canvis de matís en el color (botó hue: ajust
manual de la fase).
PAL
107
Phase alternating line. Europeu. Sistema analògic compost de 625 línies/imatge, 25
imatges/segon i 2 camps/imatge. Relació d’aspecte 4:3. La combinació de fase entre
línies més l’integrador electrònic cancel·la els canvis de matís en el color a causa dels
errors de fase (receptors PAL inclouen el control de croma). Elimina el crosstalk.
Sistema més car i patró interferent més molest que en el NTSC.
PAL PLUS
Sistema analògic que millora el senyal PAL convencional. Permet la compatibilitat
entre 4:3 i 16:9 (en format panoràmic).
PATRONS D’INTERFERÈNCIA
En funció de la freqüència subportadora que escollim, per tal de transmetre el nostre
senyal, podem tenir interferències diferents que ens afecten al color. El tipus
d’interferència que menys ens afecti serà el que ens condicionarà la nostra Fsp.
PATRONS DE MOSTRATGE
Plantilles que seguim per tal d’eliminar mostres d’un senyal i així poder-los comprimir.
Aquests patrons s’escullen en funció del tipus de resolució que vulguem tenir. Un cop
haguem mostrejat el senyal, seguint un d’aquests patrons, podrem enviar-lo pel canal
o bé guardar-lo (ocupant el mínim d’espai). La simbologia d’aquests patrons
s’expressa amb tres nombres X : Y : Z. El primer d’ells (X) indica el nombre de
mostres, el segon (Y) indica les mostres de Y que agafem de cada Y mostres i el
tercer (Z) les de crominància. Els patrons de mostratge més comuns són el 4:2:2 (el
color agafa la meitat de mostres per línia que la luminància), 4:1:1 (elimina 1 de cada
dues columnes de crominància), 4:2:0 i 4:4:4 (agafem mostres de Y i de Cr de tot
arreu).
PERCEPCIÓ VISUAL
La llum es caracteritza perquè té una freqüència a la qual nosaltres som sensibles. La
llum la podem especificar amb unes quantitats radiomètriques i fotomètriques. Les
quantitats radiomètriques són els factors físics de la energia, la longitud d’ona
dominant i l’ample de banda que podem arribar a mesurar físicament amb un
instrument. Les fotomètriques són els factors amb els quals la percebem, lluentor
(sensació de luminància), matís (sensació de saber distingir diferents colors) i
saturació (més o menys vida d’un color), els quals a diferència dels anteriors, són
diferents per cada persona.
PMT
Program Map Table. Forma part del PSI. Ens indica el nombre d’streams que forma un
programa i el PID de cadascun d’ells.
REDUNDÀNCIA
108
Fonaments de la compressió. Gràcies al fet que existeix una redundància en les fonts
d’informació existeixen mètodes de compressió per tal d’eliminar els diferents tipus de
redundància: temporal, espacial, estadística, psicofísica.
SDI
Serial Digital Interface. És agafar el senyal paral·lel i serialitzar-lo (en comptes d’anar
amb 8 fils va en 1). Es treballa a 270 Mbps i és necessari autosincronitzar-lo.
SECAM
Sequentiel a couleur avec memoire. Sistema analògic compost per 625 línies/imatge.
La modulació en FM de la crominància elimina errors de crosstalk i de fase, però fa
impossible l’entrellaçat de l’espectre. La resolució de color en sentit vertical disminueix.
SENSACIÓ DE MOVIMENT
És el nombre mínim de imatges/segon necessàries perquè un seguit de fotogrames
sembli un moviment real. El seu valor està al voltant de 15.
SINCRONISME
Són els impulsos existents en el senyal de televisió que ens diuen quan acaba una
línia i quan acaba el camp. Indiquen al feix d’electrons que impacte sobre el TRC (tub
de raigs catòdics), l’inici d’una nova línia (sincronisme de línia o horitzontal) o bé l’inici
d’un nou camp (sincronisme de camp o vertical).
SISTEMA COMPATIBLE
Es basa en transmetre la informació que ens dóna la càmera en 3 senyals que seran Y
(corregida en gamma Y^1/γ), R-Y i B-Y. Tant el receptor en B/N com en color
aconseguiran Y.
SOROLL
El soroll és un senyal elèctric, aleatori amb naturalesa natural que ens contamina el
nostre senyal quan aquest viatja a través d’un canal.
SVH
(Sistema Visual Humà). Es compon del nivell perifèric (converteix la llum en senyals
neuronals) i nivell central (passa dels senyals neuronals a la informació visual). Les
cèl·lules encarregades de percebre la llum són les cèl·lules bastó (responsables de la
visió monocromàtica, poca llum; es troben uniformement distribuïdes en la retina
109
exceptuant la fòrea que gairebé no n’hi ha), i les cèl·lules con (responsables de la visió
en color i la definició espacial; n’existeixen tres tipus segons la sensibilitat al vermell,
verd i blau ; es troben concentrades a la fòvea).
TELETEXT
Servei d’informació unidireccional en format de text. Aquest format disposa en la
pantalla de 25 línies i 40 columnes, un total de 1000 caràcters/pàgina de teletext.
Aquesta informació viatja en les línies VBI corresponents al camp I de la 7 a la 22 i al
camp II de la 320 a la 337.
TELEVISIÓ
Sistema de comunicació electrònic per transmetre imatges amb moviment amb el seu
corresponent so a distància.
TRC
Tub de raigs catòdics. És un aparell format per un coll, con i una pantalla. Els electrons
que es generen al coll fins arribar a la pantalla impactaran sobre una capa de fòsfor
que resideix en ella, la qual convertirà l’energia dels electrons en energia lluminosa.
VBI
Vertical Blanking Interval. Està format per les senyals de test (ajudaran a verificar la
qualitat de la imatge), senyals de teletext (transmetre informació digital dins un senyal
analògic), senyalització PAL Plus (formats panoràmics), senyals de Datacast (servei
de transmissió de dades per a empreses) i VPS (Video Programming System,
enregistrament de vídeo).
VECTORSCOPI
El vectorscopi permet la visualització de la informació de color del senyal de TV,
representades en coordenades polars.
VÍDEO DIGITAL
Digitalització d’un senyal analògic que proporciona: alta qualitat, robustesa al soroll,
emmagatzematge sense pèrdua i transmissió en xarxes telemàtiques d’alta velocitat.
110