You are on page 1of 7

Capitolo 10

Codifica Audio e Video
10.1 Segnali Video
A seconda della strategia di trasmissione utilizzata possiamo avere vari tipi di trasmissioni:    Component Video; Composite Video; S – Video.

Component Video La trasmissione in Component Video permette una trasmissione separata dei colori R, G e B mediante opportuni segnali di colori. E’ utilizzata dalla maggior parte dei sistemi, come PC e molti altri e permette una risoluzione migliore dei colori, pagando però seotto due aspetti: 1. La trasmissione richiede un elevata ampiezza di banda; 2. I segnali devono essere opportunamente sincronizzati. Composite Video La trasmissione in Composite invece risolve il problema della banda, introducendo un meccanismo che permette la trasmissione video mediante la combinazione del segnale di crominanza e quello di luminanza. La crominanza è l’unione di due segnali, il segnale I e il segnale V. Nelle NTSC TV il segnale di crominanza è definito come un unico segnale cromatico, e un sottosegnale di colore porta il segnale cromatico alle alte frequenze per dare la possibilità di combinarsi con quello di luminanza. Il segnale ricevuto viene poi scisso in crominanza e luminanza dal ricevitore. E’ dunque una tecnica molto efficiente in banda, ma l’unione dei due segnali comporta che il rumore sul canale li affligge entrambi. S - Video E’ il compromesso tra le due tecniche di trasmissione. Vengono utilizzati due canali, uno per la crominanza e uno per la luminanza, in particolare per trasportare distintamente le informazioni di colore da quelle in scala di grigi. Tale soluzione è stata adottata perché l’informazione in scala di grigi è molto cruciale nella percezione visuale. Infatti è più facile distinguere una differenza di risoluzione in scala di grigi che in colore, per cui la trasmissione del colore avviene in maniera meno accurata di quella in scala di grigi, ossia trasmettendo solo larghi blob di colori, rispetto ad un informazione completa.

Trasmissione in Analogico e Digitale
Trasmissione Analogica La trasmissione in analogico utilizza una funzione f(t) per effettuare un campionamento completo di un immagine. La scansione avviene per intervalli di tempo , dove ad ogni intervallo viene scandita una riga. Detta anche scansione per interlacciamento, tale meccanismo procede in due passaggi: 1. Vengono tracciate prima linee dispari e poi quelle pari e ogni campo consecutivo (pari e dispari) costituisce un frame; 2. La scansione inizia dalla linea dispari (linea 1) e finisce alla metà della linea alla fine del campo dispari, in modo che la scansione delle linee pari inizi da quel punto preciso. Trasmissione Digitale Presenta numerosi vantaggi, come la capacità di memorizzare il contenuto multimediale su memoria, in modo da effettuare operazioni di processing per accesso diretto al contenuto. Inoltre la ripetizione di numerose registrazioni non degrada la qualità dell’immagine e il contenuto digitale è molto piu facile da criptare.

Lo Standard CCIR – 601
Lo standard CCIR – 601 evolve dallo standard ITUR – 601 standard per le informazioni video, e gestisce formati molto famosi quale il formato DV. E’ stato definito dal CCIR ( Comitato Consultivo per la Radio internazionale)

Trasmissioni ad alta qualità (HDTV)
La trasmissione in alta qualità non era progettata per la maggiore definizione per unità di area, bensì per allargare la larghezza del campo visivo dell’utente. Storia Inizialmente la trasmissione era in formato analogico, ma in seguito furono messe a punto tenciche per la trasmissione ibrida analogico – digitale. Tali meccanismi non richiedevano una grande ampiezza di banda (non più di 20 Mhz), tuttavia la trasmissione era su più di un canale. Progettata all’inizio per la compatibilità col formato NTSC, ma col passaggio a una tecnica completamente digitale l’ha pian piano sostituita. Differenze e aspetti tecnici   Quando si utilizzano gli attributi 720p o 1080i, la i e la p identificano la tecnica di scansione (interlacciata o progressiva). L’HDTV ha uno risoluzione piu wide rispetto la TV tradizionale (16:9 rispetto i 4:3)

10.2 Audio e Compressione
Introduzione L’audio, cosi come la luce è un fenomeno d’onda che però, a differenza della luce, coinvolge le particelle dell’aria, che subiscono compressioni o espansioni da parte di un dispositivo fisico. Quello che ci interessa è la digitalizzazione di un segnale audio, ossia la sua trasformazione in una sequenza di numeri, solitamente espressi in forma intera. Rappresentiamo sul grafico ampiezza-tempo un segnale audio

Sotto tali condizioni possiamo dire che la prima operazione per la digitalizzazione è il processo di campionamento dell’onda analogica, che procede:   Sezionando l’onda con un certo quanto di tempo (estrazione dei campioni) Il numero dei campioni varia a seconda della frequenza di campionamento, che definisce un determinato quanto di tempo

Solitamente per i file audio si parla di frequenze di campionamento che vanno dagli 8 khz, a 48 khz. Il campionamento in ampiezza è anche chiamato quantizzazione. In termini di rumore, la valutazione del rumore è definita mediante il parametro SNR (o rapporto segnale rumore):

Ossia come la forma in decibel del rapporto tra la potenza del segnale (o tensione) e quella del rumore, ricordando che la potenza del segnale è proporzionale all’SNR. Filtraggio Prima di essere campionato il segnale viene però prima filtrato delle frequenze non – desiderate. Solitamente si preservano le frequenze al di sotto dei 50 khz, filtrando il resto con opportuni filtri passa – banda. Nel passaggio da digitale ad analogico le alte frequenze vengono reinserite, poiché in fase di quantizzazione vengono utilizzate delle funzioni che comprendono tutte le frequenze del segnale. Dunque un filtro DA è un filtro di natura passa – basso.

MIDI
Il MIDI è un linguaggio di scripting volto alla programmazione di eventi per la produzione musicale, come il picco di una nota o la durata del suono della nota stesso. Utilizzato molto nel campo della musica elettronica, è compatibile con molti sintetizzatori, per cui se un MIDI viene prodotto con un sintetizzatore è molto probabile che tale midi possa essere modificato e riprodotto con un altro sintetizzatore.Anche i PC hanno un interfaccia MIDI integrata sulla scheda audio. Un MIDI Device ha 16 canali numerati da 0 a 15 su cui separa i messaggi verso le periferiche strumentali. Ad ogni canale è associato uno strumento, ma nulla toglie che uno strumento possa essere collegato su un altro canale. Di particolare interesse è la differenza tra timbro e voce. Sono sostanzialmente lo stesso concetto ma in due ambiti diversi:   Uno strumento è multi timbrico se può riprodurre piu suoni contemporaneamente; Il concetto di voce in midi identifica la tonalità e il picco di diversi timbri.

Timbri diversi vengono prodotti con opportune patch, controlli per la generazione di timbri, contenuti in appositi database. Un messaggio MIDI è formato da byte da 10 bit, che contengono due zeri che delimitano i byte, uno iniziale e uno finale. La struttura del messaggio è la seguente:    Status byte = NOTE ON Data byte = NOTE NUMBER Data byte = NOTE VELOCITY

Solitamente dispositivi MIDI sono dispositivi a porta seriale a circa 32 kbps, o solo dispositivi di ingresso o uscita. La porta seriale è una porta a 5 pin ed è divisa in:    MIDI IN: dove viene accettato il flusso dati in uscita da un'altra periferica; MIDI OUT: dove la periferica mette in uscita il flusso dati da essa prodotta; MIDI THRU: che permette il transito dei dati dalla porta MIDI IN unicamente. Non è possibile prendere quello OUT perché utilizzato per la trasmissione dei dati prodotti dalla periferica

Uno schema di collegamento è il seguente:

I messaggi MIDI possono essere di due tipi:

 

Messaggi di sistema Messaggi di canale

I messaggi di sistema hanno 4 bit più significativi tutti settati a 1, quelli di canale invece hanno una dimensione massima di 3 byte e hanno:    1 byte per lo status code con bit più significativo settato a 1; 4 bit per la codifica del canale dove inviare il messaggio; 3 bit per il messaggio con bit più significativo settato a 1.

10.3 Meccanismi di compressione
Il processo di compressione è un processo di codifica mirato alla riduzione del numero di bit che servono per rappresentare un informazione. Il processo di compressione si avvale dunque della seguente catena di strumenti

La compressione può essere di due tipi:   Loseless: comporta nessuna perdita di informazione; Con perdita:comporta la perdita di informazione

E il tasso di perdita può essere misurato con il seguente indice di compressione:

Compr.Ratio = dove B sono il numero di bit prima della compressione e B’ dopo l’operazione di compressione.

Entropia
Supponiamo di voler considerare una sorgente di dati , si definisce entropia

Dove :   è la probabilità che si verifichi il simbolo ;

è la quantità di informazioni contenuta all’interno del simbolo, anche definita come il numero di bit per codificare tale informazione

Dalla relazione dell’entropia ci rendiamo conto che essa esprime una media pesata; essa infatti è la media pesata del numero di bit necessari per codificare l’informazione del simbolo in questione. RLC (Run – Lenght Code) Definiamo come sorgente senza memoria una sorgente dati dove i simboli di tale sorgente appaiono in modo casuale, ossia il simbolo all’istante corrente non ha alcuna dipendenza da quello a ll’istante precedente. Contrariamente a tale base si definisce la tecnica RLC: il meccanismo di comparsa all’istante corrente dipende dal precedente. Si definisce inoltre “Rationale per RLC” la possibilità, nel caso in cui i simboli compaiano per gruppi continui, di codificare oltre ai simboli, anche la lunghezza dei gruppi.

Meccanismo di codifica VLC e codifica di Huffman
Consideriamo un nuovo meccanismo dove i simboli vengono ordinati a seconda del numero di occorrenze all’interno della forma presentata. Ricorsivamente si dividono i simboli in due parti fino a che tutte le parti non posseggono un solo simbolo.

Algoritmo di codifica di Huffman L’algoritmo di Huffman permette l’inserimento dei caratteri all’interno di una lista ordinata. Dopodichè si procede per passi iterativi:    Si genera, a partire da simboli con il minor numero di occorrenze un albero di Huffman che ha due rami, uno con 0 (ramo di sinistra) e uno con 1 (ramo di destra); Si sommano le occorrenze con un nuovo simbolo e si assegna un simbolo fittizzio con la somma delle occorrenze come radice e vi si aggiunge il nuovo simbolo a sinistra Si procede finche non finiscono i simboli e in ordine crescente in termini di occorrenza

Si osserva che la codifica della parola Hello genera la lista L H E O in termini di occorrenza. Viene prima generato l’albero E O, poi diventa P1 e accetta H con occorrenza 3, e poi diventa P3 con occorrenza 5 perché accetta L.

Approccio differenziale per compressione loseless
Supponiamo di voler considerare un immagine I(x,y), possiamo definire la sua immagine differenza in una dimensione con la definizione di derivata d(x,y) = f(x,y) – f(x-1,y) oppure in termini di laplaciano , nel caso di immagini a 2D con la definizione di laplaciano. La compressione genera un immagine d che ha un istogramma in scala di grigi piu compatto e di piu bassa entropia. IMPORTANTE I meccanismi di compressione loseless hanno ratei di compression molto alti. Per questo motivo vengono favoriti meccanismi di compressione con perdita, che nonostante comportino un apporssimazione del contenuto informativo, forniscono ratei di compressione piu alti.