You are on page 1of 13

DIGITALIZADOR DE VOZ Gildardo Contreras Morales

dardogil19@hotmail.com

ÍNDICE Y CONTENIDO DEL TRABAJO


1. Resumen……………………………………………………………………….. Pág. 2
1.1 El proyecto a grandes rasgos (síntesis)…………………...………… Pág. 2

2. Antecedentes…………………………………………………………………… Pág. 2
2.1 Que es la voz……………………………………………….………….. Pág. 2
2.2 Rangos audibles……………………………………...……………...... Pág. 3
2.3 Técnica de muestreo………………………………….………………. Pág. 3
2.4 PCM………………………………………………………………...….. Pág. 4
2.5 Cuantización…………………………………………………….…….. Pág. 5
2.6 Unificando herramientas…………...…………………………..……. Pág. 7

3. Digitalizador de Voz……………………………………………….………….. Pág. 8


3.1 Consideraciones……………………………………………………… Pág. 8
3.2 Primera etapa: obtención de la voz…………………………………. Pág. 9
3.3 Segunda etapa: Amplificación de la señal de la voz.…………….. Pág. 10
3.4 Tercera etapa: Filtrado de la señal de la voz………………….……. Pág. 11
3.5 Cuarta etapa: digitalización de la voz……………………..…...…… Pág. 12

4. Resultados, Conclusiones Y Recomendaciones…………………………..….. Pág. 14


4.1 Resultados…………… ..…………………………………………....... Pág. 14
4.2 Conclusiones……………………………………………………...…… Pág. 14
4.3 Recomendaciones………………………………………….………….. Pág. 14

5. Referencias bibliográficas………………………………………………………Pág. 15

Ing. Gildardo Contreras Morales, Código;398691723, dardogil19@hotmail.com


Proyecto de Diseño con Electrónica Integrada.
Página 1
1).- RESUMEN:
La civilización está entrando en una era de modernización constante, donde la
actualización es un tema que confiere especial atención. Todo cuanto se conoce se está
digitalizando ya sea para mejorar funcionamiento, facilitar, economizar, comunicar entre
otros… En la implementación del presente proyecto se realiza una digitalización de la voz,
esto es, convertir los efectos sonoros de la voz en una codificación digital, para posteriormente
utilizar ésta información en otros diseños. Ésta transformación a digital puede ser interpretada
en algún ordenador ó con la ayuda de algún otro circuito realizar una función de aplicación
particular; citando un ejemplo: podría ser activación de voz cuando se requiera cierta
seguridad, puesto que el circuito a tratar obedecerá a variaciones como el tono de la voz.
Utiliza la técnica de muestreo además de una cuantificación la cual no estará entregando los
uno`s y cero´s correspondientes de la voz. Cabe destacar que la digitalización es algo que bien
puede realizarse por medio de software como por medios circuitales como es el caso
presentado.

1.1).- EL PROYECTO GRANDES RAZGOS (SÍNTESIS)


El proceso de Digitalizar la voz se lleva a cabo por medio de etapas. Puesto que
estamos hablando de digitalizar algo que de antemano se sabe es de naturaleza análoga, se
procede a la obtención de la voz mediante un micrófono que será conectado a un circuito que
nos realizará una primera conversión de la señal (voz), a partir de ésta etapa ya contamos con
unos valores de voltajes mediante las conversiones realizadas por el micrófono o piezo-
eléctrico. La siguiente etapa tiene la tarea de amplificar lo que capta el micrófono, para poder
trabajar. Inmediatamente tendremos un filtro que como es de imaginar se trata de un filtro pasa
banda, seleccionado previamente y bajo las características propias de la voz humana. Después
de realizar el filtrado y delimitación, se llega a la etapa donde se realiza la digitalización con la
ayuda del Circuito Integrado ADC0804. La última etapa consta de utilizar un Bus que será la
conexión directa con el ordenador o algún otro medio.

2).- ANTECEDENTES:
2.1).- ¿Qué es la Voz?
La voz es una forma de energía de naturaleza analógica. Puesto que se en la Laringe
donde se forma el sonido de la voz, estamos hablando de ondas sonoras producidas por
diferentes presiones del aire, mismas que están dadas por todo el conjunto de órganos que
intervienen en ello desde la nariz hasta los pulmones son los que determinan el tipo de
sonoridad de la voz..
Por lo tanto, la voz puede ser medida y cuantificable electrónicamente debido a que se
trata de un fenómeno relacionado con la presión y eso es algo que se puede medir. Las
frecuencias de la voz quedan dentro del rango entre cero y 10 khz para efectos de acaparar
todas las frecuencias que ésta genera.

Ing. Gildardo Contreras Morales, Código;398691723, dardogil19@hotmail.com


Proyecto de Diseño con Electrónica Integrada.
Página 2
2.2).-Rangos audibles.
Éste termino hace referencia a aquellas frecuencias que pueden ser escuchadas por un
ser humano. Tales frecuencias están dentro del rango que va desde los 20hz hasta los 20khz.
Es importante decir que después de ello, no percibimos nada y entra en otro campo de
aplicación, de igual manera las que están por debajo del rango audible.
Éstos datos dan idea de los rangos que más adelante se deben utilizar para el diseño, puesto
que gracias a ello se podrán delimitar los rangos de trabajo de los circuitos y así hacer más
preciso y fácil el mismo.

2.3).-Técnica de muestreo
Si una señal contínua, S(t), tiene una banda de frecuencia tal que fm sea la mayor
frecuencia comprendida dentro de dicha banda, dicha señal podrá reconstruirse sin distorsión a
partir de muestras de la señal tomadas a una frecuencia fs siendo
fs > 2 fm. (1)

Figura 1. Esquema simplificado del proceso de muestreo.

El interruptor no es del tipo mecánico, puesto que por lo general fs es de bastante valor.
Suelen emplearse transistores de efecto campo como interruptores, para cumplir los
requerimientos que se le exigen entre los que se encuentran:
• Una elevada resistencia de aislamiento cuando los interruptores (transistores) están
desconectados.
• Una baja resistencia si los interruptores están conectados o cerrados.
• Una elevada velocidad de conmutación entre los dos estados de los interruptores.

En la siguiente figura se ofrece las formas de las tres señales principales:

Ing. Gildardo Contreras Morales, Código;398691723, dardogil19@hotmail.com


Proyecto de Diseño con Electrónica Integrada.
Página 3
Figura 2. Proceso de muestreo.

S(t) Señal a muestrear.


d Señal muestreadora.
Sd (t) Señal muestreada.

2.4).- PCM, Modulación por Codificación de Pulsos.


Se basa en el anterior teorema de muestreo: " Si una señal f(t) se muestrea a intervalos
regulares de tiempo con una frecuencia mayor que el doble de la frecuencia significativa más
alta de la señal, entonces las muestras así obtenidas contienen toda la información de la señal
original. La función f(t) se puede reconstruir a partir de estas muestras mediante la utilización
de un filtro paso - bajo". Es decir, se debe muestrear la señal original con el doble de
frecuencia que ella, y con los valores obtenidos, normalizándolos a un número de bits dado
(por ejemplo, con 8 bits habría que distinguir entre 256 posibles valores de amplitud de la
señal original a cuantificar) se ha podido codificar dicha señal.

En el receptor, este proceso se invierte, pero por supuesto se ha perdido algo de


información al codificar, por lo que la señal obtenida no es exactamente igual que la original
(se le ha introducido ruido de cuantización). Hay técnicas no lineales en las que es posible
reducir el ruido de cuantización muestreando a intervalos no siempre iguales.

PCM modifica los pulsos creados por PAM 1 para crear una señal completamente
digital. Para hacerlo, PCM, en primer lugar, cuantifica los pulsos de PAM. La cuantificación
es un método de asignación de los valores íntegros a un rango específico.

1
PAM: (Pulse Amplitude Modulation). Modulación por amplitud de pulso. Se varía la amplitud de un pulso de
ancho constante y posición constante, de acuerdo con la amplitud de la señal analógica. La PAM se usa como
forma intermedia de modulación en PSK, QAM y PCM, aunque casi nunca se usa por sí misma.
Ing. Gildardo Contreras Morales, Código;398691723, dardogil19@hotmail.com
Proyecto de Diseño con Electrónica Integrada.
Página 4
La figura 3 muestra un método simple de asignación de signo y magnitud de los valores
para muestras cuantificadas. Cada valor es traducido en su equivalente binario 7-bits. El
octavo bit indica el signo.

Figura 3. Cuantificación usando signo y magnitud.

2.5).- Cuantización.
Para procesar señales digitalmente no sólo es necesario muestrear la señal analógica
sino también cuantizar la amplitud de esas señales a un número finito de niveles.
El tipo más usual de cuantización es la cuantización uniforme, en el que los niveles son todos
iguales. La mayoría usan un número de niveles que es una potencia de 2. Si L = 2 B , cada
uno de los niveles es codificado a un número binario de B bits. .

Supongamos que tenemos una señal x(t) cuyo fondo de escala D está dado por xmax -
xmin . Si cuantizamos x(t) con L niveles, la distancia entre dos niveles consecutivos o resolución
∆ se define como ∆=D/L. Se denomina rango dinámico DR, a la relación entre el fondo de
escala
D y la resolución, de forma que DR= 2 B . En decibelios,

DR (dB) = 20 log 10 (2 B ) = 6.02 B (2)

Para una señal xS[n] cuantizada a xQ[n], el error estará entre - ∆/2 y ∆/2. Si L es grande
la distribución de errores será uniforme en ese intervalo. Para este caso
∑ ε 2 [n] = σ 2 = ∆2 /12 (3)
Sustituyendo:

SNRQ ( dB) = 10 log Ps − 10 log ∆2 + 10 log 12 (4)


SNRQ ( dB) = 10 log Ps + 10.8 − 20 log D + 20 log L
SNRQ ( dB) = 10 log Ps + 10.8 − 20 log D + 6 B

Ing. Gildardo Contreras Morales, Código;398691723, dardogil19@hotmail.com


Proyecto de Diseño con Electrónica Integrada.
Página 5
Donde hemos utilizado el hecho que L = 2 B .
La ecuación sugiere que por cada bit que se añade al cuantizador, la relación señal a
ruido de cuantización mejora en 6 dB.

Figura 3. Proceso de muestreo y reconstrucción de una señal irregular.

El muestreo es un procedimiento análogo No es digital y se realiza con un circuito


"Tomar muestras y detener". La salida de este circuito es una secuencia de niveles de voltaje,
que se mandan a un convertidor de análogo a digital. (CAD), mejor conocido como ADC.
Aquí los niveles de voltaje se convierten en palabras digitales que representan cada nivel de
toma de muestras. La precisión de toma de muestras depende en parte de la cantidad de bits en
las palabras digitales.

Mientras más grande sea la cantidad de bits, más bajo es el nivel de ruido y más grande
será el rango dinámico. La mayoría de los analizadores TRF usan palabras de 12 bits y eso
produce un rango dinámico de alrededor de 70 dB. Palabras de 14 bits pueden realizar un
rango dinámico de 80 dB.

Se puede ver que la proporción de muestreo determina la frecuencia más alta en la


señal que se podrá codificar. La forma de onda de que se tomaron muestras no puede conocer
nada acerca de lo que se pasa en la señal entre los tiempos de muestreo. Claude Shannon que
desarrolló la rama de las matemáticas que se llama teoría de la información, determinó que
para codificar toda la información contenida en las muestras de una señal, la frecuencia de
muestreo debe ser por lo menos el doble de la frecuencia más alta presente en la señal. Este
hecho a veces es llamado el criterio Nyquist.

Ing. Gildardo Contreras Morales, Código;398691723, dardogil19@hotmail.com


Proyecto de Diseño con Electrónica Integrada.
Página 6
2.6).-Unificando Herramientas.

Figura 4. Diagrama a Bloques del sistema utilizando todas las técnicas y herramientas descritas.

Como se puede ver a partir de las figuras anteriores (figura 4), la exactitud de la
reproducción digital de una señal analógica depende del número de pruebas tomadas. Usando
PAM y PCM se puede reproducir una onda con exactitud si se toma una infinidad de pruebas,
o se puede reproducir de fo rma más generalizada si se toman 3 pruebas. La cuestión es:
¿cuántas muestras son suficientes?.
Actualmente, se requiere poca información para la reconstrucción de señal analógica.
En lo referente al Teorema de Nyquist, para asegurarse que la reproducción exacta de una
señal analógica original usando PAM, la tasa de prueba debe ser al menos el doble de la
frecuencia máxima de la señal original. De este modo, si deseamos hacer muestra con la
información de voz de un teléfono que tiene como frecuencia máxima 3300 HZ, la tasa de
muestra debe ser de 6600 pruebas/s. En la práctica, actualmente se toman 8000 muestras para
compensar las imperfecciones del proceso.

3).- DIGITALIZADOR DE VOZ.


Existen dos tendencias para realizar la digitalización de la voz con velocidades más
lentas. La Modulación Diferencial de Impulsos Codificados (DPCM), que consiste en trocear
la banda vocal en cinco intervalos llegando a obtener 16 kbit/s, que aún mantiene los
parámetros de la persona que habla, es decir del timbre. Esto permitiría utilizar canales de
FM en VHF (144MHz) de 25 kHz, si bien la tendencia es pasar a 12.5 kHz de ancho de banda

Ing. Gildardo Contreras Morales, Código;398691723, dardogil19@hotmail.com


Proyecto de Diseño con Electrónica Integrada.
Página 7
por canal, con lo que debería reducirse la velocidad de emisión de la voz digitalizada bajando
por debajo de los 16 kbit/s.
Otra técnica es la del Sintetizador o LPC. Se basa en el estudio de la voz, del que se
deduce que sólo se utilizan unos 40 fonemas y de estos sólo 10 por segundo. Teóricamente
con un ancho de banda de 400 a 600 Hz debería poderse enviar a voz. Actualmente con esta
técnica se hacen síntesis de mensajes pregrabados. Se extraen los formatos de la voz y e ahí
todos los fonemas ó parámetros LPC se pueden introducir en una ROM. Con un generador de
ruido y los parámetros de la ROM se reproduce la voz aceptablemente. Después de considerar
ciertas cuestiones teóricas importantes para la comprensión de la digitalización de la voz, se
procede a describir por etapas el circuito del que lleva por nombre éste proyecto.

3.1).-Consideraciones.
Para comenzar con el tema en cuestión, se puede decir que éste proceso consta de 2
etapas y se conoce como Modulación por Código de Pulso (PCM) La señal vocal tiene
componentes de frecuencia que pueden llegar a los 10 kHz, sin embargo la mayor parte de los
sonidos vocales tienen energía espectral significativa hasta los 5 kHz.
La frecuencia de muestreo dependerá del tipo de aplicación, para señales de voz se
adopta un rango de 6Khz. a 20 kHz. Dependiendo de la resolución que se desee. Otra
consideración que se debe tener en cuenta es la cuantificación de la señal, la cual involucra la
conversión de la amplitud de los valores muestreados a forma digital usando un numero de
determinado de bits.
El número de bits usado afectará la calidad de la voz muestreada y determinará la
cantidad de información a almacenar.
Para cada instante de muestreo, el convertidor analógico-digital compara la señal
muestreada con una serie de niveles de cuantificación predefinidos. El número de niveles N a
usar, determina la precisión del análisis y por tanto el número de bits necesarios. Cada bit
adicional que se agrega contribuye en mejorar la relación de señal a ruido en aproximadamente
6dB.
La señal de voz exhibe un rango dinámico de unos 50dB. a 60 dB. Por lo que resultaría
suficiente una cuantificación de 8 a 9 bits para una buena calidad de voz. Sin embargo
generalmente se usa de 11 a 20 bits en aplicaciones de procesamiento de voz de alta calidad.
Como se había mencionado al principio, la voz humana es obviamente analógica, es
decir, no presenta cambios bruscos. La voz adaptada por un micrófono para ser analizada, no
representa una señal con pendiente muy elevadas, mas si una serie curvas complejas. En forma
simplificada podría representarse por una señal senoidal cambiante en frecuencia y en
amplitud.
La señal eléctrica recogida por el micrófono es la imagen de la voz de la que proviene, también
una señal analógica, resultando muy fácil de utilizar en los equipos electrónicos que
usualmente conocemos, como son radios, amplificadores, tocadiscos, cassettes, teléfono, etc, y
cuyo común denominador es su funcionamiento analógico.

Ing. Gildardo Contreras Morales, Código;398691723, dardogil19@hotmail.com


Proyecto de Diseño con Electrónica Integrada.
Página 8
Figura 5. Representación analógica de la voz.

3.2).-Primera etapa:
Obtención de la voz.
Debe emplearse un micrófono que de preferencia sea “electrec2 ”, y alimentarlo de
acuerdo al circuito de polarización mostrado.
El micrófono convierte el sonido en una señal eléctrica equivalente, el tipo de
micrófono recomendado para ésta etapa es el de condensador ya que es el mejor para medir el
nivel de presión sonora, Puesto que combina precisión estabilidad y una excelente respuesta en
frecuencia de 20 kHz. A 20,000 kHz. Deberá tener una respuesta o más lineal posible en el
rango audible. El circuito de polarización del micrófono consta de las resistencias R1 y R2 que
constituyen el divisor de voltaje y de un capacitor C1 para la polarización del micrófono.

Figura 6. Circuito de Polarización para el micrófono3 .

2
Llamado también micrófono de condensador electret o, simplemente, electret.
Es una variante del micrófono de condensador que utiliza un electrodo (fluorocarbonato o policabonato de
flouroro) laminal de plástico que al estar polarizado no necesita alimentación. Que las placas estén polarizadas
significa que están cargadas a perpetuidad desde el mismo momento de su fabricación (son polarizados una sola
vez y pueden durar muchos años).

Ing. Gildardo Contreras Morales, Código;398691723, dardogil19@hotmail.com


Proyecto de Diseño con Electrónica Integrada.
Página 9
3.3).-Segunda etapa:
Amplificación de la señal de la voz.
Dado que a la salida del micrófono la amplitud de voltaje es muy pequeña, se procede
a utilizar un circuito que amplifique lo suficiente para que ésta señal sea captada por el filtro
Paso-Banda, del tal manera haciendo uso del amplificador LM386 se logra una amplificación
deseada. Es posible utilizar algún otro circuito amplificador como el caso del TDA2002, ó
incluso el conocido amplificador LM741, puesto que el objetivo de esta etapa es sólo
amplificar la señal.
El diagrama de conexión es muestra enseguida para un circuito utilizando un L386,
puesto que por sus características es el más idóneo ya que es para audio.

Figura 7. Diagrama de polarización y conexión del amplificadorutilizando un LM386.

3.4).-Tercera etapa:
Filtrado de la señal de voz.
Para filtrar la señal se deberá emplear un filtro Paso-Banda como filtro selectivo en
frecuencia; sólo permite pasar frecuencias entre los 300 Hz y los 3 kHZ de entre otras que
pudiesen estar en el circuito. Con éste arreglo de frecuencia se obtiene un a ancho de banda de
2.7 kHz.
Mediante la ecuación clásica para el ancho de banda, que se enuncia a continuación por la
ecuación 5.
B = fH − fL (5)
B = 3kHz − 300Hz
B = 2.7 kHz

Ahora es necesario elegir una frecuencia de resonancia 948.7Hz con la siguiente ecuación (6):

3
El circuito se conecta a la entrada de un osciloscopio para verificar la correcta de salida del mismo.
Ing. Gildardo Contreras Morales, Código;398691723, dardogil19@hotmail.com
Proyecto de Diseño con Electrónica Integrada.
Página 10
fR = (300 Hz )( 3kHz) (6)

Sustituyendo…
fR = 948.7Hz

Ahora bien, a partir de la medida de la selectividad del filtro, se puede decir que y
calificar como un circuito de banda de banda ancha por la relación de Q 〈0.5
La ecuación que nos ilustra esto es la ecuación 7 que a continuación se describe:

fR
Q= (7)
B

Sustituyendo…

948.7 Hz
Q=
2.7 kHz
Q = 0.352

El filtro está conectado en cascada 4 , así que de ésta manera se logra una etapa de
ganancia. La primera etapa es un circuito, un Paso-Bajo de 3kHz, cuya salida está conectada a
la entrada de la segunda etapa de un circuito Paso-Alto de 300Hz. Éste par de circuitos en
cascada forman el filtro activo de Paso-Banda como se muestra a continuación.

Figura 8. Amplificador Paso-Banda.

4
Una conexión en cascada significa que la salida de un circuito se encuentra conectada a la entrada de otro.
Ing. Gildardo Contreras Morales, Código;398691723, dardogil19@hotmail.com
Proyecto de Diseño con Electrónica Integrada.
Página 11
3.5).-Cuarta etapa:
Digitalización de la voz.
En ésta etapa es donde a partir del teorema de muestreo, se comienza el diseño, puesto
que éste se debe cumplir.
Recordando la ecuación (1) tenemos que.
f S = 2 f MAX
En donde la frecuencia de muestreo f S estará dada por la resistencia y el capacitor que se
conectan al convertidor ADC0804 en la terminal CLK IN, y cuyos valores estarán en función
de la f MAX que se deseé digitalizar.
Es justo mencionar que en este convertidor se trabaja con un voltaje de referencia dado
por Vcc/2, el cual se obtendrá utilizando un simple divisor de voltaje.

A continuación se muestra el circuito completo y con un bus para permitir la


transmisión de datos como tal hacia un ordenador por citar un ejemplo.

Figura 9. Circuito Digitalizador de Voz completo.

Ing. Gildardo Contreras Morales, Código;398691723, dardogil19@hotmail.com


Proyecto de Diseño con Electrónica Integrada.
Página 12
4).- RESULTADOS, CONCLUSIONES Y RECOMENDACIONES.
4.1).- Resultados
El circuito en cuestión trabaja aceptablemente. Para sacar más provecho de dicho
diseño, es necesario trabajar los datos que arroja el circuito mediante la pc, donde se pueden
obtener mucho más aplicaciones e innovaciones incluso, he aquí donde comienza algún nuevo
proyecto. Como podría es el caso de un reconocedor de voz inteligente que reconozca incluso
el timbre de voz de alguna persona en cuestión.

4.2).- Conclusiones
Éste circuito sólo digitaliza la voz ya que se diseño para ello, si se quieren hacer
pruebas con algún otro tipo de audio, serán necesario nuevos cálculos y consideraciones. Ya
que los cálculos fueron tomados para las características esenciales que produce la voz.

Se debe recordar que primero se realiza un estudio acerca de lo que se quiere y partir
del fenómeno inicial es como se procede a trabajar

4.3).- Recomendaciones
Esencialmente se recomienda el estudio acerca de amplificadores operacionales para
una mejor comprensión y desarrollo e incluso la oportunidad de experimentar con diferentes
frecuencias.
Los amplificadores a estudiar, filtros para ser exactos, son:
§ Filtro Paso-Bajo.
§ Filtro Alto.
§ Filtro Pasa-Banda.
Estos son los más esenciales dentro del proyecto.
Así mismo es necesaria la comprensión de lo que el teorema del muestreo realiza para poder
realizar el trabajo, ya que todo se basa en ello.

5).- REFERENCIAS BIBLIOGRÁFICAS.


[1] Weyn Tomasi, Sistemas de Comunicaciones Electrónicas (Ed. Prentice Hall, México), (2003).
[2] Apuntes electrónica integrada, http://proton.ucting.udg.mx/materias/ET201/index.html
[3] espectro de la voz, http://www.ehu.es/acustica/espanol/musica/vohues/vohues.html
[4] Wikipedia: Que es la voz, http://es.wikipedia.org/wiki/Espectro_de_frecuencias
[5] Referencias de circuitería , http://webelectronica.com.ar
[6] Técnica del muestreo: http://es.wikipedia.org/wiki/Muestreo_en_estad%C3%ADstica
[7] Circuitos de electrónica, http://www.unicrom.com/Tut_ADC.asp
[8] Weyn Tomasi, Sistemas de Comunicaciones Electrónicas PCM (Ed. Prentice Hall, México), (2003).
[9] Weyn Tomasi, Sistemas de Comunicaciones Electrónicas PAM (Ed. Prentice Hall, México), (2003).
[10] Cooglin F. Roberto & Driscoll F. Frederick, Amplificadores Operacionales y Circuitos Intetgrados Lineales
(Ed. Pearson Educaction, quinta edicion).

Ing. Gildardo Contreras Morales, Código;398691723, dardogil19@hotmail.com


Proyecto de Diseño con Electrónica Integrada.
Página 13

You might also like