Professional Documents
Culture Documents
Cinema TV
1884 – Varredura de Imagens por discos
1890 – “Kinetoscópio” permite rotativos (Paul Nipkov)
visualização de imagens em movimento
(Thomas Edison)
1895 – Cinematógrafo proporciona
projeção de imagens em telas de grandes 1900 – Conceito de “Televisão” (Constantin
dimensões (Irmãos Lumiére) Persky)
1925 – Primeiras transmissões de TV (J.
1926 – Cinema Falado (Lee de Forest) Baird, C. Jenkins)
1928 – Transmissões comerciais de TV
(Hugo Gernsback)
1939 – Cinema a Cores (Siegrist , Fisher)
1940 – Testes de transmissão de TV a cores
1941 – Transmissões no padrão “M” (CBS)
1951 – Cinema “Wide Screen” – 1948 – Padrão de 50 Hz / 625 linhas é
Cinerama (Fred Walker) adotado na Europa
1952 – Cinema em 3 dimensões com 1952 – Transmissão de TV em UHF
polarizadores; “Wide Screen” anamórfico 1953 – TV a Cores padrão NTSC (RCA)
(Cinemascope)
1965 – Sitema PAL de transmissão de TV a
1970 – Cinema formato IMAX Cores
1986 – Transmissão de som estéreo na TV
(BTSC)
1989 – Sistema Hi-Vision (NHK)
Após a introdução da TV a cores, em 1953, o formato da TV manteve-se praticamente inalterado até os nossos dias.
Um televisor fabricado naquela época é compatível com o sinal transmitido hoje, e vice-versa. Essa relativa
estagnação da tecnologia culminou, na década de 80, em uma situação de baixa lucratividade, patentes expiradas,
concorrência acirrada entre fabricantes de equipamentos e saturação do espectro de radiodifusão disponível. Some-
se a isso um certo desinteresse do espectador, devido à incompatibilidade com o formato “Wide Screen”, adotado
pela indústria cinematográfica desde os anos 50. Como resposta a esse quadro, estamos presenciando a implantação
de uma nova geração de sistemas de TV: a Televisão Digital e a TV de Alta Definição.
A Aplicação da Televisão
Esse critério leva ao dimensionamento da dimensão aparente necessária para a imagem de TV. Além disso,
considerando que grande parte do material a ser veiculado pela TV consistiria de filmes cinematográficos, foi
adotada a mesma proporção (na época) de 4 : 3 (largura : altura) para a imagem de TV. Por estes critérios, a
imagem da televisão deve subentender um ângulo de cerca de 11 graus no sentido horizontal e 8 graus no sentido
vertical.
Considerando agora que a acuidade da visão humana é da ordem de 1 minuto de grau (capacidade limite de
separação entre elementos distintos), chega-se à conclusão que a imagem pode ser representada adequadamente por
um conjunto de aproximadamente 480 x 640 elementos de imagem (ou pixels, de picture elements).
1 minuto
A = 480 de grau
linhas
L/A = 4/3
D=7xA
Outro critério relacionado à percepção visual é a necessidade da apresentação seqüencial de pelo menos 20 imagens
por segundo para proporcionar ilusão de movimento. Já para evitar sensação de cintilação, ou flutuação de
luminosidade da imagem, são necessárias pelo menos 50 a 60 imagens por segundo.
Considerando critérios técnicos de interferência com a rede elétrica, adotou-se 60 imagens por segundo nos países
onde a energia elétrica é distribuída em 60 Hz (EUA, Japão, Canadá, Brasil, etc.) e 50 imagens por segundo nos
países de 50 Hz (Europa, África, Ásia, América Latina, etc.).
1
f max = × 640 × 480 × 60 = 9,2 MHz
2
Este valor é muito elevado, sendo considerado impraticável para a tecnologia da época.
Os critérios de viabilidade tecnológica foram satisfeitos pela introdução de duas inovações: Entrelaçamento e
Modulação AM Vestigial.
2.3.1 Entrelaçamento
Este processo consiste em descartar as linhas pares ou ímpares,
alternadamente, em imagens sucessivas. Assim sendo, cada imagem
transmitida consistirá de um campo (par ou ímpar) com 240 linhas,
sendo que dois campos consecutivos constituem um “quadro”
completo.
Assim sendo, a freqüência máxima cairia para 4,6 MHz. Na prática,
outros fatores devem ser considerados, tais como o intervalo de
retraço (regiões invisíveis nas partes superior e lateral da imagem). O
valor padronizado hoje é de 4,2 MHz.
Vídeo Composto
(Banda Base)
0 4,2 MHz
Modulação AM
Modulação VSB
+ Áudio
+4,5 MHz
-0,75 MHz
1080
480 1’
640
1920
Deve ser ressaltado que, a rigor, o nome “Alta Definição” é inadequado, uma vez que o critério de resolução visual
é o mesmo da TV convencional (cada elemento de imagem ocupa um ângulo de 1 minuto de grau). O que diferencia
os dois formatos é essencialmente o maior ângulo de visualização da imagem, 30 graus na horizontal.
A proporção de 16:9 foi adotada para manter
16
compatibilidade com múltiplas imagens no formato
4:3, conforme figura ao lado, além de se aproximar
4×3
bastante da proporção utilizada na maioria dos filmes
produzidos na época.
A figura abaixo mostra as proporções relativas dos
formatos de TV convencional e HDTV, bem como 4×3 4×3
9
formatos correntes de filmes cinematográficos de tela (12 × 9)
larga.
4×3
Cinemascope (2.35:1)
TV (4:3)
Imagens
Cabo
Canal de
Satélite Transmissão
Áudio
Radiodifusão
Legendas
Rede Digital
Programa
Usuário Lista de Usuário
CD-ROM Programas Criptografia
e Acesso
Dados Condicional
Transmissor Receptor
Um exemplo de preditor para aplicações em vídeo é o "frame store", que explora o fato de que um quadro
transmitido é geralmente muito semelhante ao quadro anterior. Um preditor deste tipo consiste de uma memória que
armazena o quadro anterior, sendo então transmitidas apenas as diferenças pixel a pixel entre dois quadros
consecutivos. É claro que este preditor falha quando há um corte de cenas, ou movimentos rápidos de objetos ou da
câmera.
O detetor de movimento é a unidade funcional responsável pela determinação dos vetores. Para cada bloco da
imagem atual a ser transmitida, esta unidade faz uma varredura sobre a imagem de referência, buscando o ponto de
maior semelhança com o bloco a ser analisado. A busca pode medir o erro quadrático médio ou, mais comumente, a
distorção média absoluta (DMA), expressa por
1
DMA( x , y ) =
N
∑ f ( x + i, y + j ) − ref ( x + i + dx, y + j + dy )
i, j
onde (dx,dy) é o deslocamento entre a imagem de referência ref(x,y) e o bloco da imagem de entrada f(x,y). O valor
de (dx,dy) para o qual a DMA é mínima é adotado como vetor de movimento do bloco de coordenadas (x,y).
Normalmente a busca é feita dentro de uma área restrita, e/ou utilizando processos hierárquicos, uma vez que uma
busca exaustiva sobre toda a imagem representa um esforço computacional elevado.
x Área de Busca
x
y y
Bloco a ser
Estimado
Bloco de Maior Vetor de
Semelhança Movimento
O padrão MPEG-1 (ISO-IEC 11172a) destina-se à compressão de vídeo não entrelaçado, com taxa de informação
até 1,5 Mb/s, aplicável a vídeo-conferência e multimídia em CD-ROM; já o padrão MPEG-2 (ISO13818) destina-se
à compressão de imagens entrelaçadas, com taxas de 1,5 a 100 Mb/s em aplicações de TV convencional e HDTV.
24 / 30 / 60
Conversão de Formatos
Quadros / s
BLOCOS
Deteção QUADRO
de RECONSTRUIDO
Movimento
ERRO DE PREDIÇÃO
Preditor
DCT Transformação Espacial
Reconstrução COEFICIENTES
-1 Fator de Escala
DCT Q
Truncamento
COEFICIENTES QUANTIZADOS
Compactação RLE
Huffman
VETORES DE
MOVIMENTO DADOS SAÍDA
MUX Buffer
Após a conversão de formatos, a imagem é subdividida em blocos de 8 x 8 pixels. Após detecção e compensação de
movimento, o erro de predição resultante é submetido a uma Transformada Discreta de Cossenos (DCT), descrita
por
C ( u ) C( v ) 7 7
( 2 x + 1)uπ ( 2 y + 1)vπ
F ( u, v ) =
2
∑
2 y =0
∑ f ( x, y )cos 16 cos 16
x =0
1
C ( k ) = se k = 0
onde 2
C ( k ) = 1 se k > 0
O que esta expressão faz é decompor o bloco original da imagem em uma soma ponderada de funções primitivas,
que correspondem a componentes cossenoidais, bi-dimensionais, com freqüências espaciais sucessivamente
maiores. As funções primitivas da DCT estão representadas na figura abaixo. Cada coeficiente F(u,v) representa
então a semelhança relativa entre o bloco original e cada função primitiva correspondente.
Os coeficientes F(u,v) da DCT são quantizados (arredondados), sendo esta etapa a responsável pelas perdas do
processo. A idéia é que a maior parte dos coeficientes F(u,v) terão valores próximos de zero, sendo eliminados pela
quantização.
Os coeficientes “sobreviventes” representam as componentes mais importantes do bloco da imagem original. Eles
são em seguida reordenados e compactados através de um processo RLE (Run-Length Encoding), onde os
coeficientes nulos são eliminados. A seguir, é feita uma codificação estatística, pela qual os coeficientes de maior
Sinc. Extensão
(opcional)
(Total: 188 Bytes)
0 1 0 0 0 1 1 1 Sincronismo (047h)
0 0 0 X P P P P
0 0 0 1
Contador Sequencial (0-15)
Controle de Extensão de Header
Controle de Criptografia
O fluxo de transporte pode assim carregar vários programas independentes, que compartilham apenas o mesmo
canal de comunicação. A figura a seguir mostra um esquema de multiplexação de pacotes, no qual informações de
áudio, vídeo e dados (legendas, informações auxiliares, etc) são reunidas em um fluxo de programa; vários fluxos
de programa são a seguir reunidos em um fluxo de transporte, que inclui ainda pacotes de Mapa de Programação e
de Informações de Sistema (SI - System Information). Estes últimos trazem tabelas referentes aos sistemas de
transmissão e modulação usados, bem como mapas de canais virtuais e outras informações relevantes à rede de
distribuição.
Para o caso de transmissão por um canal de taxa fixa, o buffer (reservatório) de saída amortece as flutuações
estatísticas de taxa de bits de cada programa, e o ajuste dos quantizadores nos codificadores de vídeo pode ser feito
em função do grau de ocupação deste buffer, de forma a garantir uma taxa média constante.
Vídeo
Áudio 1 Programa 1
Áudio 2 MUX
Programa 2 Fluxo de
Dados Buffer
Programa 3 MUX
Transporte
Mapa de Programas
Codificador de Formatadores
Áudio de Pacotes
Dolby AC-3 19.6 Mb/s
Audio 1
Pacotes de
Dados 188 bytes
CODIFICAÇÃO TRANSPORTE
A etapa de Modulação inclui um randomizador, cuja função é tornar os bits equiprováveis, mesmo na ausência de
informação a ser transmitida; em seguida, dois códigos de correção de erros (Reed-Solomon e Convolucional) são
aplicados, introduzindo redundâncias de forma a permitir correção de erros no receptor. Isto eleva a taxa de bits para
32,3 Mb/s.
A seguir, os bits são agrupados formando símbolos; cada símbolo corresponde a um pulso de amplitude diferente (8
níveis), carregando 3 bits de informação. A taxa de símbolos é portanto 10,76 Ms/s.
Em seguida, são inseridos símbolos de sincronismo, e uma portadora piloto para auxiliar a sintonia do receptor. Os
símbolos modulam uma portadora e são filtrados para limitar a banda em 6 MHz, e encaminhados ao transmissor.
TRANSMISSÃO
32.3 Codificadores para Correção de Erros
Randomizador
Mb/s
19.6
Mb/s
Mapeador Convolucional Entrelaçamento Reed-Solomon
(8 níveis) Entrelaçado (4 ms) (207,187),t=10 PRS
12 x (2/3)
Sequencia
10.76 de 65535
Msymb/s Filtro de Nyquist Bytes
Inserção de Filtro
Sincronismo Piloto Equalizador Modulador Vestigial SAIDA 8-VSB
(F.I.)
Banda de 6 MHz
4 sy. 1.25 p/ Transmissor
44 MHz
Portadora 46.69
MHz
Sincronismo 92.9 ns
O espectro resultante do sinal transmitido é plano, e a envoltória é similar a um ruído aleatório. O desempenho do
sistema é caracterizado pela curva abaixo, que indica a taxa de erros de bloco em função da relação sinal/ruído do
canal.
O limiar de visibilidade dos erros, determinado experimentalmente, ocorre para uma relação sinal/ruído de 14,9 dB.
Adicionalmente, o sistema ATSC tolera surtos de ruído impulsivo de 190 µs dentro de um período de 4 ms, graças
ao entrelaçamento temporal. O sistema VSB é bastante insensível a ruído de fase (erros aleatórios na fase da
portadora). O limiar de percepção de interferência co-canal de um sinal digital sobre o analógico ocorre para
potência média digital 45 dB abaixo da potência de pico do sinal analógico.
Testes em campo demonstraram que o sistema ATSC é muito sensível a efeitos de multi-percurso, que ocorrem
quando o sinal transmitido chega ao receptor através de vários caminhos, com tempos de propagação diferentes (os
conhecidos “fantasmas” na transmissão analógica). A técnica usual para compensar o multi-percurso consiste na
equalização adaptativa, que procura compensar os vários “ecos” do sinal principal através da criação de “contra-
ecos” simulados no receptor. Esta abordagem infelizmente não funciona quando os ecos possuem amplitude
comparável ao sinal principal, o que costuma ocorrer quando há reflexão no solo.
K Portadoras
Independentes Banda de cada Portadora
f f
Espaçamento
Banda Total Ocupada
1 / TU
Espectro do Sinal OFDM
TG
TU Modulação
de cada
Portadora
TS
Cada símbolo consiste de uma determinada amplitude e fase de uma portadora; essas combinações podem
transportar de 1 a 6 bits por símbolo (modulações BPSK a 64-QAM).
A idéia é que ao ser transmitido um símbolo, o sinal propaga-se pelos vários percursos até chegar ao receptor.
Passado um intervalo de alguns micro-segundos, todos os percursos se estabilizam, e a partir daí o receptor passa a
demodular a informação daquele símbolo levando em conta a energia total resultante de todos os percursos. Assim
sendo, a duração total TS do símbolo consiste de uma duração útil TU mais um intervalo de guarda TG que será
descartado pelo receptor.
Os sistemas baseados na modulação OFDM podem operar mesmo com ecos com a mesma amplitude do sinal
principal. Isso permite o uso de repetidoras, operando na mesma freqüência, para cobrir regiões com problemas de
propagação.
Como desvantagem, o OFDM costuma exigir maior potência do transmissor (cerca de 2 a 4 dB acima do 8-VSB)
para mesma taxa de erros; além disso, é mais sensível a ruído de fase na portadora.
38
36
8-VSB
34
32
30
28
COFDM 64-QAM 2/3 FEC
Banda de Guarda 1/8
26
24
22
20
18
16
14
0 2 4 6 8 10 12 14 16 18 20
Relação Sinal/Eco (dB)
8. Referências: