Resumen Sonido

Primer Cuatrimestre
Cuando hablamos de sonido, nos referimos a los fenómenos necesarios para la producción sonora y su percepción.
Estos son: una fuente sonora que produzca una vibración u oscilación, un medio elástico en el que esta perturbación se
propague y un receptor que transforme el estímulo sonoro en percepción sonora.
Onda sonora: propagación de una perturbación de presión o densidad que viaja en un medio elástico.
Fuente sonora: cualquier objeto vibrante que pueda generar una onda sonora (instrumento musical, parlante, etc.).
Toda fuente sonora debe tener un elemento vibrante que, al recibir energía, pueda generar una oscilación que produzca
una onda sonora.
Medio: puede ser gaseoso, líquido o sólido. El aire es el medio de propagación por excelencia.
Ejemplo del parlante: el cono se mueve hacia adelante, empujando las partículas de aire adyacentes. Se genera una
reacción en cadena, empujando a la zona siguiente de partículas, y propagando la perturbación por el aire en todas las
direcciones posibles. Este proceso se conoce como propagación de una onda sonora.
Receptor: el oyente recibe las ondas sonoras y -por medio del sistema perceptivo sonoro- las transforma en impulsos
eléctricos, los cuales serán decodificados por el sistema nervioso auditivo como percepción sonora.
Movimiento oscilatorio
Es una oscilación en torno a una posición de equilibrio. Si se repite regularmente a intervalos de tiempo iguales se lo
llama periódico.
Ciclo o período: cada una de las repeticiones del movimiento.
Frecuencia: cantidad de ciclos o períodos por segundo.
Elongación: desplazamiento del movimiento medido desde la posición de reposo.
Amplitud: máxima elongación del movimiento.
Movimiento armónico simple: se puede obtener como la proyección sobre un eje de un punto que describe un
movimiento circular uniforme.
Onda senoidal
Es una de las ondas más importantes, ya que describe la oscilación más sencilla posible. Se representa con la función
trigonométrica seno.
Todas las ondas periódicas pueden ser descompuestas como sumas de ondas senoidales (Teorema de Fourier).
En acústica, la sinusoide es equivalente al movimiento armónico simple. Para que sea audible por nuestro sistema
perceptivo, su frecuencia tiene que estar en el rango de los 20Hz a 20.000 Hz.
Características de la forma de onda
La representación gráfica del sonido se denomina oscilograma. Representa los cambios de amplitud (eje vertical) en
función del tiempo (eje horizontal).
Frecuencia: cantidad de ciclos por segundo de una oscilación periódica. Se mide en cps (ciclos por segundo) o Hertz.
f = 1/T y T= 1/f (siendo f frecuencia y T período).

Los sonidos periódicos son los que definen la altura. La frecuencia de un sonido se relaciona con su altura: frecuencias
bajas corresponden a sonidos graves y las altas a sonidos agudos.
Amplitud: valor máximo que alcanza una oscilación en un ciclo, también se la llama valor pico. Está vinculada con la
energía o intensidad del sonido. La energía en un instante determinado se llama valor instantáneo.
Envolvente: la amplitud de un sonido no es necesariamente constante, puede variar de forma dinámica en el tiempo. Se
puede simplificar esta evolución en las siguientes etapas (envolvente ADSR):
-Ataque: tiempo en el que el sonido crece hasta el pico máximo de energía.
-Decaimiento: la energía cae desde el pico del ataque hasta que se establece.
-Sostenimiento o régimen: la energía se mantiene estable.
-Extinción: la energía cae desde el régimen hasta que se extingue el sonido.
Período: tiempo transcurrido en realizar un ciclo. Se mide en segundos o milisegundos.
Fase: se denomina fase de una onda periódica a las diferentes posiciones instantáneas dentro de un respectivo ciclo.
Generalmente se mide en grados y hace referencia al tiempo transcurrido desde el inicio de la oscilación. Dos ondas
periódicas de igual frecuencia están en fase cuando están sincronizadas, cuando en determinado momento ocupan
posiciones idénticas de un ciclo.
Suma de ondas senoidales
Cuando se suman dos ondas se suma la energía de ambas y se obtiene una combinación.
Para que la suma de dos ondas senoidales de como resultado otra senoidal, es necesario que ambos componentes
tengan la misma frecuencia.
-Suma de sinusoides de igual frecuencia, amplitud y fase: la resultante es otra sinusoide de igual frecuencia, fase y el
doble de amplitud.
-Suma de sinusoides de igual frecuencia, fase y distinta amplitud: la resultante es otra sinusoide de igual frecuencia,
fase y amplitud equivalente a la suma de sus amplitudes.
-Suma de sinusoides de igual frecuencia, amplitud y distinta fase: si la diferencia de fase es cercana a 0°, la amplitud
resultante será próxima al doble. En cambio, si la diferencia de fase es cercana a 180°, la amplitud resultante será
cercana a cero. La frecuencia será la misma, la amplitud será la suma de las amplitudes y la fase será el promedio de las
fases. Si se encuentran en oposición completa de fase, la resultante será silencio.
Suma de ondas senoidales cuya resultante es una onda compleja
Todos los tipos de onda que nos sean senoidales se denominan ondas complejas. El teorema de Fourier plantea que
podemos descomponer las ondas complejas como suma de ondas simples o senoidales de frecuencia, amplitud y fase
determinadas. Si las frecuencias de los componentes de una onda compleja son múltiplos enteros de la sinusoide de f
más baja, la onda resultante será periódica o armónica. Si, en cambio, no son múltiplos, la onda resultante será
aperiódica o inarmónica.
Espectro de frecuencias
Podemos definir al espectro de una onda como la distribución de su energía en función de la frecuencia. Se puede
representar gráficamente en un espectrograma: frecuencia en el eje horizontal y amplitud en el eje vertical.
Ondas complejas periódicas
Una onda periódica de frecuencia f se puede descomponer como una suma de sinusoides cuyas frecuencias serán f, 2f,
3f, 4f, etc. A la frecuencia f se la denomina fundamental y es la que determina la altura percibida. A los otros
componentes se los denomina armónicos superiores.
Algunos tipos de onda:
-Onda diente de sierra: la amplitud de sus armónicos decrece proporcionalmente con el número de armónico.
-Onda cuadrada: se obtiene sumando solo los armónicos impares, y su amplitud decrece proporcionalmente con el
número de armónico.
-Onda triangular: se obtiene sumando sólo los armónicos impares y su amplitud decrece proporcionalmente con el
cuadrado del número de armónico.
Ondas complejas aperiódicas
Sus componentes no forman parte de una serie armónica. Producen sonidos que no definen altura.
Batidos o pulsaciones
Se producen al sumar ondas periódicas simples o complejas que no están en relación armónica y cuyas frecuencias son
levemente distintas, sin superar los 20Hz de diferencia. El resultado es otra onda del mismo tipo, cuya frecuencia será el
promedio de las frecuencias originales. Su amplitud no será constante, sino que variará periódicamente en el tiempo con
una frecuencia igual a la diferencia de las frecuencias originales.
Timbre
La evolución del espectro en el tiempo se relaciona con un atributo perceptivo del sonido denominado timbre. Es una de
las características más significativas de un sonido en cuanto a su identidad, ya que nos permite discriminar entre una
fuente sonora y otra.
Sonograma
Para visualizar el timbre necesitaríamos una sucesión de espectrogramas. El sonograma es una forma de representación
gráfica de esta información y las tres dimensiones a visualizar: frecuencia (eje vertical), tiempo (eje horizontal) y
amplitud (graduación de color o escala de grises).
Propagación de las ondas sonoras
La velocidad de propagación del sonido depende de las características del medio transmisor. En el aire a 0°, por
ejemplo, esta velocidad es de 331,4 m/s y aumenta 0,6 m/s por cada grado que aumenta la temperatura.
El frente de onda es la superficie o línea formada por los puntos del medio de propagación que son alcanzados en un
mismo instante por una onda mecánica. Su forma puede considerarse plana o esférica, en la medida en que se aleja de
la fuente emisora.
La longitud de onda () es la distancia que recorre una perturbación u onda en el intervalo de tiempo de un período (T) o
la duración de un ciclo. Para poder calcularla, se debe multiplicar la velocidad de propagación del sonido por el período
de la onda a evaluar. Long = v.T / Long =v/f. La longitud de onda, entonces, es inversamente proporcional a la
frecuencia del sonido.
Comportamientos de la propagación de las ondas sonoras en espacios cerrados
-Reflexión: cambio de dirección que experimenta la onda sonora cuando se encuentra con un límite físico como, por
ejemplo, una pared. Depende del ángulo de incidencia del frente de onda.
-Absorción: la reflexión nunca es completa, parte de la energía de la onda cambia de medio y es absorbida por el
segundo medio de transmisión. El coeficiente de absorción es la relación entre la energía reflejada y la absorbida por el
material, y tiene valores que van de 0 a 1. La absorción depende de las características del material.
-Refracción: es el cambio de dirección que experimenta una onda sonora cuando pasa de un medio a otro. Se debe a la
diferencia de velocidad de propagación entre los dos medios. Ocurre cuando la onda incide oblicuamente sobre la
superficie de separación de los medios.
-Difracción: Es el cambio de dirección que experimenta una onda sonora cuando se encuentra con un obstáculo o
atraviesa una abertura.
Para que se dé este fenómeno la longitud de la onda debe ser mayor al tamaño del obstáculo, por lo que es más común
que se produzca para las frecuencias graves. Si es menor, no se produce difracción y la onda es reflejada por el
obstáculo, produciendo del otro lado del mismo lo que se llama sombra acústica.
Cuando un frente de onda se encuentra con una abertura, la onda se dispersa como si se hubiera generado allí.
Efecto Doppler: es el aparente cambio de frecuencia de una onda debido al movimiento relativo de la fuente respecto a
su receptor.
Segundo Cuatrimestre
Señal digital: Representación en código binario de una señal acústica. El conjunto de procedimientos para el
procesamiento de la señal se llama DSP (Digital Signal Processing).
Parámetros principales del audio digital:
1) Cantidad de canales: 1 para mono, 2 para estéreo, etc.

2) Frecuencia de muestreo: La cantidad de valores (muestras) tomadas por segundo en cada canal. Se calcula
mediante el teorema de Nyquist, donde esta frecuencia debe ser el doble o más que la frecuencia original de la
señal analógica. El Intervalo de muestreo (lapso que separa una muestra de otra) es 1/SR.
3) Número de bits por muestra: Indica el rango de las muestras, en el que se mueven los valores de amplitud.
Habitualmente va de 8 a 32 bits.
Sampling o muestreo
Es el acto de tomar una porción o sample (muestra) de un sonido/señal. Se realiza por medio de un dispositivo especial
denominado ADC (conversor analógico a digital) y el proceso inverso se realiza con un DAC (conversor digital a
analógico).
El proceso de muestreo tiene tres etapas:
1) La señal analógica es procesada por un filtro pasa bajos, que elimina cualquier f mayor a la frecuencia de Nyquist
(Frecuencia de muestreo/2). Su teorema plantea que para representar digitalmente una señal que tiene
componentes hasta X f, es necesario usar una f de muestreo de al menos 2X muestras por segundo.
2) Se mide la amplitud instantánea a intervalos de tiempo iguales (T =1/SampleRate)
3) El cuantizador convierte cada medición en un valor numérico.
Si se utiliza una frecuencia de muestreo menor a la establecida por el teorema de Nyquist (SR/2) se produce Aliasing. Al
submuestrear una onda, se produce una nueva componente (frecuencia alias), que no se corresponde con la original.
Los efectos negativos que este provoca son: Distorsión de la amplitud real de los componentes (también se modifica la
forma de onda), batidos y distorsión no-lineal (los componentes falsos se ubican en frecuencias cercanas a las reales) y
frecuencias inferiores divergentes.
Si bien existe un filtro anti-aliasing el cual actúa como un filtro pasa bajo, eliminando todas las frecuencias que
sobrepasan la frecuencia crítica (Nyquist), es preferible tener en cuenta el teorema antes de muestrear ya que luego es
difícil eliminar los componentes falsos.
Cuantización
Es el proceso que discretiza los valores de amplitud de una señal. Determina dentro de cuáles rangos de amplitud
disponibles (regiones) cae el valor de cada muestra. Se asigna cualquier valor de amplitud que cae dentro de una de esas
regiones al número binario asociado con esa región.
La resolución en bits de una señal determina la precisión con que se representan estos valores de amplitud tomados por
muestra, define el rango dinámico.
Si los distintos valores de amplitud posibles determinados por la resolución en bits se distribuyen de manera
equidistante, se dice que es una cuantización lineal.
Alguna información se pierde en este proceso de cuantización, porque cualquier valor entre algún mínimo y máximo
será asignado a un único código binario, por lo que se redondea y ocurre el error de cuantización. Cuanta menos
distancia entre las muestras, menos ruido.
El error de cuantización provoca bandas de ruido que “acompañan” a la señal de ruido y provocan un efecto muy
notorio llamado distorsión armónica o noise shaping. Para evitar este fenómeno se usa dithering, el cual consiste en
aplicar ruido blanco de baja amplitud después del proceso de la cuantización (y antes de la conversión analógico-digital).
Así, el error de cuantización no varía espectralmente junto con las variaciones de la señal de entrada. También, al
generar un ruido estacionario constante, el piso de ruido se vuelve mucho menos perceptible.
Cuantización no-lineal: Otro método de cuantización donde se usan regiones no-uniformes (las regiones son más
pequeñas a medida que el voltaje disminuye). Tiene la ventaja de disminuir el error de cuantización en los niveles bajos
de amplitud, enmascarando el ruido, a costa de un pequeño aumento de error en los niveles altos.
El ruido generado por el error de cuantización hace que la señal se distorsione más o menos según su amplitud. En
señales de muy baja amplitud, el ruido de cuantización enmascara la señal representada. A ese límite de
enmascaramiento se lo llama piso de ruido.
Hay una proporción entre la amplitud de la señal y la amplitud del error de cuantización, denominada SQNR (signal to
quantization error noise ratio). Se calcula con la siguiente fórmula:
SQNR = 6Db * n + S, siendo n la resolución en bits y S la amplitud efectiva de la señal en dB (fs).
También 6* N(bits) da el rango dinámico en dB (la máxima amplitud).
Recordar que dobles y mitades en dB se calculan sumando o restando 6dB. Por ejemplo, el doble de 10dB es 16dB.
Si el nivel de grabación fue muy bajo, el ruido puede enmascarar la señal y no es posible amplificarla sin aumentar este
ruido.
Codificación y almacenamiento de la señal digital
Codificación: Codifica los niveles de cuantificación mediante el método binario. Se hace generalmente con un
modulador llamado PCM (Pulse Code Modulation) que codifica a partir de la fórmula N=2^n.
Archivos con formato y sin formato (crudo)
Un formato de archivo es un estándar que define la forma en que la información se codifica digitalmente. Se componen
generalmente de un encabezado (o header, el cual especifica el formato binario usado, la f de muestreo, resolución en
bits y cantidad de canales) y luego los valores de amplitud de la señal almacenada.
Un archivo sin formato o RAW contiene los valores “crudos” de amplitud, sin especificar sample rate ni resolución en
bits. Para poder leer un archivo RAW, es necesario saber de antemano cómo fue generado.
Los archivos con formato se clasifican de acuerdo a si tienen o no compresión, y si ésta es o no destructiva. Por ejemplo:
● Con compresión destructiva: MP3, WMA, AAC, etc.

● Con compresión no destructiva: FLAC y APE.
● Sin compresión: WAV, AIFF.
Si el archivo está comprimido es para reducir su tamaño. Puede esta compresión ser destructiva (no recupero
información) o no destructiva.
Peso archivo en Bytes = [cantidad bits x tiempo x núm. canales x frecuencia de muestreo]/8
Para pasar a Kilobytes divido por 1024. Repito el proceso para pasar a MegaBytes.
DC (o Direct Current) refiere al estado de reposo del sistema, equivaldría al silencio. Debido al mal funcionamiento de un
micrófono, una placa de audio o como resultado del procesamiento de una señal, pueden producirse desviaciones del
DC, llamadas DC Offset. Éstas provocan que toda la señal quede desplazada respecto al cero. Son indeseables porque:
-acotan el rango dinámico posible de la señal.
-genera clicks al ser mezclada con otra señal o al comienzo de su reproducción.
-hace que el sistema funcione fuera de sus valores de operación, lo cual puede deteriorar el equipamiento.
Cómo detectar el DC Offset: se toma el valor promedio de todas las muestras. Si es igual o muy cercano a cero, la
muestra esta balanceada. Si no, hay DC Offset.
Cómo eliminar el DC Offset: Hay dos métodos.
-Si se dispone de la totalidad de la señal, se calcula cuánto difiere de cero el promedio de las muestras. Este valor indica
el desplazamiento respecto al DC, por lo que se lo resta a todos los valores de la señal.
-Si se produce sólo en partes de la señal, se utiliza un filtro pasa altos que atenúe la energía presente cercana a los 0 Hz.
Potencia RMS: Es la amplitud promedio de una señal. Refleja de manera homogénea la relación de energía entre
distintas señales sin verse afectada por sus formas de onda.
Transformadas de Fourier
Es el proceso inverso a “armar” una onda compleja dados los armónicos y la fundamental. Dado un movimiento
armónico complejo, nos dice cuáles son los movimientos armónicos presentes y cuáles son sus amplitudes y fases. Estas
propiedades de las distintas componentes pueden apreciarse en los gráficos espectrales (amplitud en función de la
frecuencia).
Es un proceso continuo, para todos los valores, pero las señales digitales son discretas por definición, por lo que debe
aplicarse una fórmula matemática discreta.
Transformada Discreta de Fourier (DFT): Calcula el espectro de una forma de onda. Hace las señales complejas más
fáciles de analizar a través de un muestreo de las señales sin afectar la señal en sí. La transformada es un proceso
reversible, su forma inversa es la Transformada de Fourier Discreta e Inversa (IDFT). Ésta la vuelve a convertir en una
función temporal/señal original, sin perder información. Es posible modificar el sonido empleando la representación
espectral para luego reconstruirlo con esas modificaciones.
Como la DTF requiere una gran capacidad de cómputo, se desarrolló un algoritmo que reduce esta capacidad y posibilita
su cálculo en menor tiempo. Este algoritmo se denomina Transformada rápida de Fourier (FFT), y también tiene su
inversa (IFFT). Sin embargo, lo que se gana en eficiencia se pierde en precisión.
Los parámetros fundamentales de la FFT son:
-Sample Rate. Más SR implica mayor precisión temporal en general.
-Tamaño de ventana de análisis. Es un período temporal que se toma, en cantidad de muestras, de una porción de la
señal a analizar.
-Frecuencia de análisis (FA). Determinada por la relación entre SR y tamaño de ventana (W)
FA=SR/W. La cantidad de componentes parciales (bins) que se pueden analizar es la mitad del tamaño de la ventana de
análisis. Por ejemplo, para una ventana que toma 512 muestras, se podrán analizar 256 muestras de la señal, que vayan
desde 0 Hz hasta la f de Nyquist.
Resolución en frecuencia y resolución temporal
Al incrementarse el tamaño de la ventana de análisis disminuye la f de análisis. Esto produce mayor resolución en
frecuencia, pero menos resolución temporal, ya que el tiempo que pasa entre análisis consecutivos es mayor.
Si queremos mayor resolución temporal, para ver cómo varía el espectro en instantes pequeños, tendremos que achicar
la ventana de análisis y perder resolución en frecuencia.
+ tamaño de ventana y + resolución en frecuencia → - f de análisis y -resolución temporal
- tamaño de ventana y - resolución en frecuencia → + resolución temporal
Los límites del tamaño de ventana están definidos entre 8 y 32768 muestras, siendo las ventanas más usadas las de 256,
512, 1024 y 2048 muestras.
El análisis de Fourier presupone que la ventana de análisis es un período completo de un solo movimiento armónico, por
lo que si se analizan espectralmente fragmentos de señales complejas que no coincidan con el período de análisis los
resultados no van a ser ideales. La energía de los componentes en frecuencia que no coincidan con la serie de Fourier,
será distribuida en las bandas laterales.
Además, se producen discontinuidades, ya que al recortar la señal el ciclo generado suele tener un salto abrupto entre el
final y el inicio que genera componentes espectrales agudos y ruido.
Para solucionar el problema de la discontinuidad se usan ventanas de suavizamiento. Éstas son envolventes dinámicas
que multiplican la señal capturada por la ventana de análisis antes de ser analizada. Hacen que los valores de amplitud
próximos al inicio y fin de la forma de onda analizada sean coincidentes o que no se produzcan saltos abruptos.
Tipos de ventanas: kaisser, beakman, parcen, hanning, haming.
Si se quisiera analizar la evolución espectral de una señal de mayor duración sería necesario emplear sucesivas ventanas
a medida que avanza la forma de onda. Este recurso se conoce como ventana deslizante. Se implementa de dos formas:
-yuxtaponiendo sucesivas ventanas y analizando los cambios de ventana a ventana. La resolución temporal de análisis de
cambios espectrales está determinada por la duración de la ventana.
-utilizando ventanas solapadas, haciendo que se superpongan una determinada cantidad de tiempo. La duración del
espectro promedio visualizado es más pequeña, y las muestras espectrales sucesivas están más juntas.
Normalización: proceso que implica determinar la amplitud máxima de la señal y a partir de ella modificar
proporcionalmente todos los valores de amplitud, ya sea para atenuar la señal o para amplificarla a un nivel
determinado. Debido a que se aplica la misma cantidad de ganancia a todo el rango, la relación señal-ruido
generalmente no cambia.
Tipos de filtros: Pasa alto, pasa bajo, pasa banda, elimina banda.

Resumen Sonido

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Resumen Sonido

Uploaded by

Copyright:

Available Formats

Primer Cuatrimestre

Ciclo o período: cada una de las repeticiones del movimiento.

Frecuencia: cantidad de ciclos o períodos por segundo.

Elongación: desplazamiento del movimiento medido desde la posición de reposo.

Amplitud: máxima elongación del movimiento.

Características de la forma de onda

f = 1/T y T= 1/f (siendo f frecuencia y T período).

-Ataque: tiempo en el que el sonido crece hasta el pico máximo de energía.

-Sostenimiento o régimen: la energía se mantiene estable.

-Extinción: la energía cae desde el régimen hasta que se extingue el sonido.

Período: tiempo transcurrido en realizar un ciclo. Se mide en segundos o milisegundos.

Suma de ondas senoidales

Suma de ondas senoidales cuya resultante es una onda compleja

Ondas complejas periódicas

Algunos tipos de onda:

Ondas complejas aperiódicas

Propagación de las ondas sonoras

Comportamientos de la propagación de las ondas sonoras en espacios cerrados

Parámetros principales del audio digital:

1) Cantidad de canales: 1 para mono, 2 para estéreo, etc.

El proceso de muestreo tiene tres etapas:

SQNR = 6Db * n + S, siendo n la resolución en bits y S la amplitud efectiva de la señal en dB (fs).

También 6* N(bits) da el rango dinámico en dB (la máxima amplitud).

Codificación y almacenamiento de la señal digital

Archivos con formato y sin formato (crudo)

● Con compresión destructiva: MP3, WMA, AAC, etc.

-acotan el rango dinámico posible de la señal.

-genera clicks al ser mezclada con otra señal o al comienzo de su reproducción.

Cómo eliminar el DC Offset: Hay dos métodos.

Los parámetros fundamentales de la FFT son:

-Sample Rate. Más SR implica mayor precisión temporal en general.

+ tamaño de ventana y + resolución en frecuencia → - f de análisis y -resolución temporal

- tamaño de ventana y - resolución en frecuencia → + resolución temporal

You might also like