You are on page 1of 29

Cmo funciona el MP3?

Ursula Molter
Departamento de Matemtica
Facultad de Ciencias Exactas y Naturales
Universidad de Buenos Aires

Semana de la Matemtica 2010

Digitalizacin por qu y para qu?

La palabra digital hoy ya se incorpor al lenguaje diario.


cmaras digitales,
telfonos digitales,
megapixeles,
ancho de banda.
La digitalizacin permite una transformacin y procesamiento de
la informacin, con grandes beneficios.
Es aqu donde se necesita la matemtica para desarrollar y
fundamentar las tcnicas usadas.

Qu queremos digitalizar?

Las seales que pretendemos digitalizar - con distintos objetivos,


incluyen:
Seales de Audio: Msica y Voz
Video: Imgenes y Televisin
Datos: Resonancia Magntica, Electrocardiogramas, Nmeros,
Letras, Patentes

Seales de Audio

Consideremos por ejemplo una


suite de Bach. Cuando l la
escribi, probablemente us lo
que se denomina notacin
musical.
Es evidente que de esta escritura,
no se obtiene toda la informacin
de una pieza: depende de quin la
ejecuta, cmo la interpreta, etc.
Matemticamente, esto no es
muy preciso.

Cmo digitalizamos a Bach?


1

En primer lugar registramos el sonido con intervalos de tiempo


muy pequeos. (muestreo - sampling de la seal analgica.)

Cada medicin se cuantifica asignndole en forma proporcional


un nmero entero positivo en un cierto rango, por ejemplo (de
0 a 512).

Cada uno de estos nmeros es ahora convertido a notacin


binaria (ceros y unos).

Estos nmeros binarios agrupados consecutivamente forman


una sucesin de ceros y unos, que es lo que llamamos, la seal
sonora digital en contraposicin a la seal analgica.

En este proceso de digitalizacin slo se registr informacin en


determinados instantes de tiempo equiespaciados. El resto de la
seal aparentemente se ha perdido.

Teorema del Muestreo


Cmo hacemos para entonces escuchar toda la msica?
Usamos la matemtica!
El Teorema de muestreo de Shannon, dice que para conocer el
valor de una funcin o seal f (cuyo rango de frecuencias est
limitado) basta con conocerla en algunos instantes
equi-distribuidos. O sea, si conozco
. . . , f (1/B), f (0/B), f (1/B), f (2/B), . . .
entonces puedo averiguar cunto vale f en cualquier valor. Cmo?
Lo que prob C.E. Shannon es que usando la funcin seno, puede
calcular f en cualquier valor:
f (x) = + f (1/B)

sen((Bx (0)))
sen((Bx (1)))
sen((Bx (1)))
+ f (0/B)
+ f (1/B)
+...
(Bx (1))
(Bx (0))
(Bx (1))

C.E. Shannon en realidad redescubri este teorema en 1949 que haba


sido descubierto por Whittaker en 1935. Pero Shannon se dio cuenta de la
utilidad de este resultado en la teora de la transmisin de la informacin.
Este teorema slamente se aplica a seales cuyo rango de frecuencias est
limitado a un intervalo finito. Pero esto es siempre el caso en las seales
que aparecen en la prctica (por ejemplo, la frecuencia mxima trasmitida
por una lnea telefnica est alrededor de 4.000 ciclos por segundo).
Este teorema se prueba (demuestra) utilizando la Transformada de
Fourier.

Transformada de Fourier
El matemtico Jean
Baptiste-Joseph Fourier alrededor
de 1800 escribi su famoso
tratado del calor en el cual
explic que las funciones pueden
ser descompuestas en
componentes muy simples,
utilizando slamente funciones
como cos(x) y sen(x).

Transformada de Fourier (cont.)

La transformada de Fourier es un procedimiento matemtico que


descompone una seal en cada una de las frecuencias que la
componen.
Se puede pensar en una analoga con un prisma que descompone la
luz en colores.
La idea es que cada funcin se puede escribir como una suma de
mltiplos de senos y cosenos.
Si consideramos para cada nmero entero k (positivo y negativo)
las funciones cos(kx) y sen(kx) obtenemos un sistema (o familia)
infinito de funciones, conocido como el sistema trigonomtrico.

Transformada de Fourier (cont.)

Toda funcin f , de duracin finita (por ejemplo dura 2 horas),


puede ser escrita, de manera nica, como sumas de mltiplos de
estas funciones:

f (x) = +a2 cos(2x)+a1 cos(x)+a0 +a1 cos(x)+a2 cos(2x)+. . .


Est claro, que conociendo los nmeros {. . . , a2 , a1 , a0 , a1 , a2 , . . . }
se vuelve a obtener la funcin original. El procedimiento que a una
funcin le asigna la sucesin de nmeros
{. . . , a2 , a1 , a0 , a1 , a2 , . . . }, es lo que se llama transformada de
Fourier. (Ojo! hay infinitos nmeros)

Varios Cosenos

Otras seales
Una combinacin de tres cosenos:

Una funcin y su transformada:

Virtudes ...
Para remover ruido:

Ejemplo con sonido: Digitalizando a Caruso

La seal corresponde a un pasaje muy corto (6s) del tenor Caruso,


obtenido a partir de una grabacin de un disco de pasta.
Caruso Original
Qu podemos hacer con esta representacin numrica?
Le aplicamos la transformada de Fourier, y le eliminamos las
frecuencias altas.
Caruso Limpio
Hemos eliminado el ruido!

Manipulando a Caruso

Caruso Original

Caruso Limpio

Caruso Ruido

Caruso Ms Limpio

Problemas
El problema de la transformada de Fourier, para analizar seales, se
presenta cuando hay cambios abruptos en la seal. Veamos:

Podemos pensar en una funcin suave + dos saltos:

Fenmeno de Gibbs
La transformada de Fourier de la funcin de salto es:

Esto produce, que al reproducir la funcin usando solamente un


nmero finito de coeficientes, obtengamos:

Esto se debe a que las funciones seno y coseno no estn localizadas.

Mala Sinfona
Pensando en la orquesta, Gilbert
Strang en 1994 dijo: La
transformada de Fourier para
representar una sinfona, consta
de una orquesta de infinitos
msicos, cada uno tocando
slamente una nota: No se
necesita director - los msicos
estn totalmente aburridos.
En contrapartida est la notacin
musical, donde las indicaciones si bien no totalmente precisas - se
adecuan a lo que uno se imagina:
las diferentes notas indican la
duracin y la posicin en el
pentagrama, la frecuencia.

Mejorando Fourier
Entonces est el desafo matemtico: Podemos inventar algo
mejor? Sera bueno, que las funciones base estn localizadas en el
tiempo, ya que entonces podemos analizar la seal localmente sin
condicionar el resto.
Efectivamente esto es posible, y se obtiene utilizando un resultado
muy profundo que se debe a uno de los matemticos ms brillantes
del siglo pasado, el argentino Alberto Caldern

Wavelets

Definicin: Una wavelet es una funcin del tiempo, = (t), de


energa finita, oscilante y bien concentrada.

3 wavelets famosas: Haar(1909) Meyer (1985) Daubechies (1988) .

Wavelets
Esta funcin luego es dilatada y trasladada para obtener una
coleccin de funciones que nuevamente permiten representar todas
las seales.

Por ejemplo, (2t) dura la mitad del tiempo, mientras que (t/2)
dura el doble. Por otro lado, la seal (t k) comienza k unidades
de tiempoi ms temprano, y a(t) tiene una amplitud a veces la
wavelet original.

Anlisis por transformadas

Lo que se denomina la transformada wavelet es la representacin


que asocia a cada seal una sucesin de coeficientes que
corresponden a las traslaciones y dilataciones de una wavelet
original.
Teorema: Si es una funcin adecuadamente elegida, a partir de
la transformada wavelet se puede reconstruir la funcin.

Ventajas de las escalas


Observemos qu es lo que significa analizar una imgen con
diferentes escalas de la funcin de Haar:

Qu se perdi?

Esta imgen muestra lo que se ha


perdido al pasar de la primer
imgen a la segunda. Est claro
que con las dos imgenes juntas
(la segunda y esta diferencia)
obtenemos la primera.

Siguiendo

La ltima imgen slamente requiere 1024 pixeles, mientras que la


original usa 262.144

Lena

Otro xito

Las wavelets han sido exitosas en compresin: el FBI ha optado


utilizar las mismas para comprimir su archivo de huellas digitales.

MUCHAS GRACIAS POR ESCUCHARME!


Ursula Molter
umolter@dm.uba.ar

You might also like