Professional Documents
Culture Documents
dardogil19@hotmail.com
2. Antecedentes…………………………………………………………………… Pág. 2
2.1 Que es la voz……………………………………………….………….. Pág. 2
2.2 Rangos audibles……………………………………...……………...... Pág. 3
2.3 Técnica de muestreo………………………………….………………. Pág. 3
2.4 PCM………………………………………………………………...….. Pág. 4
2.5 Cuantización…………………………………………………….…….. Pág. 5
2.6 Unificando herramientas…………...…………………………..……. Pág. 7
5. Referencias bibliográficas………………………………………………………Pág. 15
2).- ANTECEDENTES:
2.1).- ¿Qué es la Voz?
La voz es una forma de energía de naturaleza analógica. Puesto que se en la Laringe
donde se forma el sonido de la voz, estamos hablando de ondas sonoras producidas por
diferentes presiones del aire, mismas que están dadas por todo el conjunto de órganos que
intervienen en ello desde la nariz hasta los pulmones son los que determinan el tipo de
sonoridad de la voz..
Por lo tanto, la voz puede ser medida y cuantificable electrónicamente debido a que se
trata de un fenómeno relacionado con la presión y eso es algo que se puede medir. Las
frecuencias de la voz quedan dentro del rango entre cero y 10 khz para efectos de acaparar
todas las frecuencias que ésta genera.
2.3).-Técnica de muestreo
Si una señal contínua, S(t), tiene una banda de frecuencia tal que fm sea la mayor
frecuencia comprendida dentro de dicha banda, dicha señal podrá reconstruirse sin distorsión a
partir de muestras de la señal tomadas a una frecuencia fs siendo
fs > 2 fm. (1)
El interruptor no es del tipo mecánico, puesto que por lo general fs es de bastante valor.
Suelen emplearse transistores de efecto campo como interruptores, para cumplir los
requerimientos que se le exigen entre los que se encuentran:
• Una elevada resistencia de aislamiento cuando los interruptores (transistores) están
desconectados.
• Una baja resistencia si los interruptores están conectados o cerrados.
• Una elevada velocidad de conmutación entre los dos estados de los interruptores.
PCM modifica los pulsos creados por PAM 1 para crear una señal completamente
digital. Para hacerlo, PCM, en primer lugar, cuantifica los pulsos de PAM. La cuantificación
es un método de asignación de los valores íntegros a un rango específico.
1
PAM: (Pulse Amplitude Modulation). Modulación por amplitud de pulso. Se varía la amplitud de un pulso de
ancho constante y posición constante, de acuerdo con la amplitud de la señal analógica. La PAM se usa como
forma intermedia de modulación en PSK, QAM y PCM, aunque casi nunca se usa por sí misma.
Ing. Gildardo Contreras Morales, Código;398691723, dardogil19@hotmail.com
Proyecto de Diseño con Electrónica Integrada.
Página 4
La figura 3 muestra un método simple de asignación de signo y magnitud de los valores
para muestras cuantificadas. Cada valor es traducido en su equivalente binario 7-bits. El
octavo bit indica el signo.
2.5).- Cuantización.
Para procesar señales digitalmente no sólo es necesario muestrear la señal analógica
sino también cuantizar la amplitud de esas señales a un número finito de niveles.
El tipo más usual de cuantización es la cuantización uniforme, en el que los niveles son todos
iguales. La mayoría usan un número de niveles que es una potencia de 2. Si L = 2 B , cada
uno de los niveles es codificado a un número binario de B bits. .
Supongamos que tenemos una señal x(t) cuyo fondo de escala D está dado por xmax -
xmin . Si cuantizamos x(t) con L niveles, la distancia entre dos niveles consecutivos o resolución
∆ se define como ∆=D/L. Se denomina rango dinámico DR, a la relación entre el fondo de
escala
D y la resolución, de forma que DR= 2 B . En decibelios,
Para una señal xS[n] cuantizada a xQ[n], el error estará entre - ∆/2 y ∆/2. Si L es grande
la distribución de errores será uniforme en ese intervalo. Para este caso
∑ ε 2 [n] = σ 2 = ∆2 /12 (3)
Sustituyendo:
Mientras más grande sea la cantidad de bits, más bajo es el nivel de ruido y más grande
será el rango dinámico. La mayoría de los analizadores TRF usan palabras de 12 bits y eso
produce un rango dinámico de alrededor de 70 dB. Palabras de 14 bits pueden realizar un
rango dinámico de 80 dB.
Figura 4. Diagrama a Bloques del sistema utilizando todas las técnicas y herramientas descritas.
Como se puede ver a partir de las figuras anteriores (figura 4), la exactitud de la
reproducción digital de una señal analógica depende del número de pruebas tomadas. Usando
PAM y PCM se puede reproducir una onda con exactitud si se toma una infinidad de pruebas,
o se puede reproducir de fo rma más generalizada si se toman 3 pruebas. La cuestión es:
¿cuántas muestras son suficientes?.
Actualmente, se requiere poca información para la reconstrucción de señal analógica.
En lo referente al Teorema de Nyquist, para asegurarse que la reproducción exacta de una
señal analógica original usando PAM, la tasa de prueba debe ser al menos el doble de la
frecuencia máxima de la señal original. De este modo, si deseamos hacer muestra con la
información de voz de un teléfono que tiene como frecuencia máxima 3300 HZ, la tasa de
muestra debe ser de 6600 pruebas/s. En la práctica, actualmente se toman 8000 muestras para
compensar las imperfecciones del proceso.
3.1).-Consideraciones.
Para comenzar con el tema en cuestión, se puede decir que éste proceso consta de 2
etapas y se conoce como Modulación por Código de Pulso (PCM) La señal vocal tiene
componentes de frecuencia que pueden llegar a los 10 kHz, sin embargo la mayor parte de los
sonidos vocales tienen energía espectral significativa hasta los 5 kHz.
La frecuencia de muestreo dependerá del tipo de aplicación, para señales de voz se
adopta un rango de 6Khz. a 20 kHz. Dependiendo de la resolución que se desee. Otra
consideración que se debe tener en cuenta es la cuantificación de la señal, la cual involucra la
conversión de la amplitud de los valores muestreados a forma digital usando un numero de
determinado de bits.
El número de bits usado afectará la calidad de la voz muestreada y determinará la
cantidad de información a almacenar.
Para cada instante de muestreo, el convertidor analógico-digital compara la señal
muestreada con una serie de niveles de cuantificación predefinidos. El número de niveles N a
usar, determina la precisión del análisis y por tanto el número de bits necesarios. Cada bit
adicional que se agrega contribuye en mejorar la relación de señal a ruido en aproximadamente
6dB.
La señal de voz exhibe un rango dinámico de unos 50dB. a 60 dB. Por lo que resultaría
suficiente una cuantificación de 8 a 9 bits para una buena calidad de voz. Sin embargo
generalmente se usa de 11 a 20 bits en aplicaciones de procesamiento de voz de alta calidad.
Como se había mencionado al principio, la voz humana es obviamente analógica, es
decir, no presenta cambios bruscos. La voz adaptada por un micrófono para ser analizada, no
representa una señal con pendiente muy elevadas, mas si una serie curvas complejas. En forma
simplificada podría representarse por una señal senoidal cambiante en frecuencia y en
amplitud.
La señal eléctrica recogida por el micrófono es la imagen de la voz de la que proviene, también
una señal analógica, resultando muy fácil de utilizar en los equipos electrónicos que
usualmente conocemos, como son radios, amplificadores, tocadiscos, cassettes, teléfono, etc, y
cuyo común denominador es su funcionamiento analógico.
3.2).-Primera etapa:
Obtención de la voz.
Debe emplearse un micrófono que de preferencia sea “electrec2 ”, y alimentarlo de
acuerdo al circuito de polarización mostrado.
El micrófono convierte el sonido en una señal eléctrica equivalente, el tipo de
micrófono recomendado para ésta etapa es el de condensador ya que es el mejor para medir el
nivel de presión sonora, Puesto que combina precisión estabilidad y una excelente respuesta en
frecuencia de 20 kHz. A 20,000 kHz. Deberá tener una respuesta o más lineal posible en el
rango audible. El circuito de polarización del micrófono consta de las resistencias R1 y R2 que
constituyen el divisor de voltaje y de un capacitor C1 para la polarización del micrófono.
2
Llamado también micrófono de condensador electret o, simplemente, electret.
Es una variante del micrófono de condensador que utiliza un electrodo (fluorocarbonato o policabonato de
flouroro) laminal de plástico que al estar polarizado no necesita alimentación. Que las placas estén polarizadas
significa que están cargadas a perpetuidad desde el mismo momento de su fabricación (son polarizados una sola
vez y pueden durar muchos años).
3.4).-Tercera etapa:
Filtrado de la señal de voz.
Para filtrar la señal se deberá emplear un filtro Paso-Banda como filtro selectivo en
frecuencia; sólo permite pasar frecuencias entre los 300 Hz y los 3 kHZ de entre otras que
pudiesen estar en el circuito. Con éste arreglo de frecuencia se obtiene un a ancho de banda de
2.7 kHz.
Mediante la ecuación clásica para el ancho de banda, que se enuncia a continuación por la
ecuación 5.
B = fH − fL (5)
B = 3kHz − 300Hz
B = 2.7 kHz
Ahora es necesario elegir una frecuencia de resonancia 948.7Hz con la siguiente ecuación (6):
3
El circuito se conecta a la entrada de un osciloscopio para verificar la correcta de salida del mismo.
Ing. Gildardo Contreras Morales, Código;398691723, dardogil19@hotmail.com
Proyecto de Diseño con Electrónica Integrada.
Página 10
fR = (300 Hz )( 3kHz) (6)
Sustituyendo…
fR = 948.7Hz
Ahora bien, a partir de la medida de la selectividad del filtro, se puede decir que y
calificar como un circuito de banda de banda ancha por la relación de Q 〈0.5
La ecuación que nos ilustra esto es la ecuación 7 que a continuación se describe:
fR
Q= (7)
B
Sustituyendo…
948.7 Hz
Q=
2.7 kHz
Q = 0.352
El filtro está conectado en cascada 4 , así que de ésta manera se logra una etapa de
ganancia. La primera etapa es un circuito, un Paso-Bajo de 3kHz, cuya salida está conectada a
la entrada de la segunda etapa de un circuito Paso-Alto de 300Hz. Éste par de circuitos en
cascada forman el filtro activo de Paso-Banda como se muestra a continuación.
4
Una conexión en cascada significa que la salida de un circuito se encuentra conectada a la entrada de otro.
Ing. Gildardo Contreras Morales, Código;398691723, dardogil19@hotmail.com
Proyecto de Diseño con Electrónica Integrada.
Página 11
3.5).-Cuarta etapa:
Digitalización de la voz.
En ésta etapa es donde a partir del teorema de muestreo, se comienza el diseño, puesto
que éste se debe cumplir.
Recordando la ecuación (1) tenemos que.
f S = 2 f MAX
En donde la frecuencia de muestreo f S estará dada por la resistencia y el capacitor que se
conectan al convertidor ADC0804 en la terminal CLK IN, y cuyos valores estarán en función
de la f MAX que se deseé digitalizar.
Es justo mencionar que en este convertidor se trabaja con un voltaje de referencia dado
por Vcc/2, el cual se obtendrá utilizando un simple divisor de voltaje.
4.2).- Conclusiones
Éste circuito sólo digitaliza la voz ya que se diseño para ello, si se quieren hacer
pruebas con algún otro tipo de audio, serán necesario nuevos cálculos y consideraciones. Ya
que los cálculos fueron tomados para las características esenciales que produce la voz.
Se debe recordar que primero se realiza un estudio acerca de lo que se quiere y partir
del fenómeno inicial es como se procede a trabajar
4.3).- Recomendaciones
Esencialmente se recomienda el estudio acerca de amplificadores operacionales para
una mejor comprensión y desarrollo e incluso la oportunidad de experimentar con diferentes
frecuencias.
Los amplificadores a estudiar, filtros para ser exactos, son:
§ Filtro Paso-Bajo.
§ Filtro Alto.
§ Filtro Pasa-Banda.
Estos son los más esenciales dentro del proyecto.
Así mismo es necesaria la comprensión de lo que el teorema del muestreo realiza para poder
realizar el trabajo, ya que todo se basa en ello.