Professional Documents
Culture Documents
net/publication/313264121
CITATIONS READS
0 596
3 authors:
24 PUBLICATIONS 11 CITATIONS
SEE PROFILE
Some of the authors of this publication are also working on these related projects:
All content following this page was uploaded by Daniel Isac Escobedo Beceiro on 03 February 2017.
Abstract: Parkinson disease (PD) is a progressive and chronic process from non-precise etiology. PD is provoked by neuronal
degeneration from nigra substance on the brain. It carries out that the Dopamine level decrease. Dopamine is an important
neurotransmitter from Central Nervous System. When dopamine level on the brain is decreased many important functions are
affected in these patients. PD patients have alteration in voice and language areas whom suffering from mild hypokinetic
dysarthria. The main objective from this paper is showing the frequency alteration of first and second formants, Vowel Space
Area (VSA) and Vowel Articulation in Spaniard vowel productions in few numbers of Parkinson´s patient affected during 5 years
or more. In this paper the vowels in tonic sounds in normal phonetic position within different isolated words are analyzed in 10
cases (5 of control). The first and second formants as acoustic parameters object of analysis in this test are obtained using
Anavoz 1.0 (software tool). The main results in these patients analyzed are: reduction between the difference in frequency
between first and second formants and the decreased of VSA in Parkinson´s disease patients, among others. This paper at the
same time that uses the acoustic method for the evaluation in the production of vowel sounds; would be oriented towards
combined use from Acoustic method, Signal processing and Computerized solution applied to the dysarthria evaluation in PD
patients. Keywords: Parkinson´s speech, Hypokinetic dysarthria, Formants, VSA.
INTRODUCCION
La Enfermedad de Parkinson (EP) es de etiología imprecisa, es un proceso crónico y progresivo debido a la
degeneración neuronal en la sustancia nigra del cerebro lo que trae disminución de los niveles de dopamina,
neurotransmisor importante del Sistema Nervioso Central (SNC), que participa en gran variedad de funciones de
control, coordinación y regulación de movimientos, regulación neuroendocrina e ingestión de alimentos. Esta
enfermedad sin preferencias por sexo o raza, comienza entre 40 y 70 años aunque formas tempranas tienen
peor pronóstico [1-3]. Su cuadro clínico presenta temblor de reposo, rigidez, por aumento del tono muscular lo
que produce resistencia para realizar movimientos pasivos de las extremidades y bradicinesia que es el
enlentecimiento y reducción de movimientos, apreciado en la disminución del braceo al caminar, dificultad para
vestirse, trastornos de la escritura, alteraciones de voz y habla, etc. Según avanza esta enfermedad, los
pacientes sufren alteraciones de postura, reflejos, marcha, equilibrio, funciones ejecutivas, atención, memoria,
tienen además depresión, ansiedad, trastornos del sueño y alteraciones neurovegetativas, entre otras [2-5].
En estos pacientes las alteraciones observadas transitan junto a los cambios naturales en el anciano como,
modificaciones en laringe, sistema respiratorio, cavidades de resonancia y órganos articulatorios, consecuentes
al deterioro en músculos, cartílagos, articulaciones, ligamentos y mucosa laríngea. Esta enfermedad afecta la
mayor parte de los sistemas que regulan el control motor del habla, incluyendo respiración, fonación y
articulación [6]. Las alteraciones de los parámetros acústicos de la voz y el habla en estos casos involucran a
parámetros de frecuencia, intensidad, duración y también parámetros vinculados con la articulación [6-19].
Es frecuente en la EP la progresiva disartria hipocinética [6]. Esta disartria afecta la voz y el habla generando
imprecisiones no solo en la articulación sino en la inteligibilidad [11]. La EP en su desarrollo incide en el aparato
fonador y sus componentes, produciendo rigidez del tracto vocal, varios parámetros dan cuenta de ello, siendo
los de frecuencia algunos de los más importantes. Así al percibir y evaluar alteraciones en la articulación, sobre
todo de fonemas sonoros, particularmente en la producción de vocales, tienen un papel primordial la frecuencia
de los formantes [11], [20], [21]. En la producción de la voz las cavidades supralaríngeas actúan como un filtro
variable de frecuencias capaz de transformar la energía acústica, dicha variabilidad del filtro se debe a cambios
en la forma del tracto vocal, así esta transmisión de energía acústica logra su mayor valor en las frecuencias de
formantes, o sea, es el conjunto de armónicos cuyas frecuencias al coincidir con los resonadores bucales han
sido reforzadas [22]. Los formantes están muy vinculados al espacio vocal y a la articulación vocálica.
Este trabajo tiene como objetivo mostrar la alteración de los dos primeros formantes, el área de espacio vocal y
el índice de articulación de las vocales españolas en pacientes que tienen 5 años o más con Parkinson.
MATERIAL Y METODOS
Por su naturaleza, el estudio de la producción de vocales conlleva un análisis con aspectos fisiológicos,
psicológicos, articulatorios, acústicos, etc., a considerar en esta producción, en la que participa el SNC en
interrelación con los sistemas subglotal, glotal y supraglotal, respectivamente. Este trabajo emplea el método
acústico, método que permite, a través de la posición de los formantes, dado el papel de éstos en la
diferenciación vocálica [22], mostrar la realización de las vocales españolas por estos pacientes, empleando
Oscilogramas y Espectrogramas en la prueba acústica efectuada.
D. I. Escobedo B.; O. R. Aguilera P.; F. Sanabria M. (2017) “PRIMEROS FORMANTES Y ÁREA DE ESPACIO
VOCAL EN UNA PEQUEÑA MUESTRA DE PACIENTES CON PARKINSON”. XV Simposio Internacional de
Comunicación Social. Nuevos estudios sobre Comunicación Social Vol. II. Ediciones Centro de Lingüística
Aplicada, Santiago de Cuba. pp. 645-650. ISBN: 978-959-7174-33-2.
Cada vocal tiene un conjunto de formantes, los dos primeros, F1: formante bajo y F2: formante alto, son
imprescindibles para la percepción de cada vocal, de hecho intervienen en su diferenciación [23]. Los llamados
formantes individuales son los formantes superiores, dependientes de la configuración faringo-bucal de cada
sujeto, del sexo, de diferencias anatómicas, etc. [22]. Los formantes se observan en un Espectrograma de Banda
ancha (Ancho de banda: 300 Hz). Cada vocal tiene un rango de valores de frecuencia de formantes. Existe una
relación directa entre la elevación del valor de F1 y la abertura de la cavidad oral. También hay relación directa
entre el retroceso y la elevación de la lengua y la reducción de F2. Para representar los valores de frecuencia de
los formantes F1 y F2 se usan pares ordenados (F2, F1), esta representación en el plano coordenado es la carta
de formantes, la que emplea en los ejes coordenados la escala logarítmica, esta escala asigna a intervalos
sonoros iguales una representación de distancias iguales, como en la escala musical. Así por sus valores, la
escala del eje X (F2) va desde 500 Hz hasta 4000 Hz y la del eje Y (F1) de 200 Hz a 1000 Hz.
Las vocales son fonemas sonoros abiertos con su timbre característico, al producir estos fonemas los órganos de
la articulación pueden acercarse y generar mayor o menor estrechez en la especie de caja de resonancia que
forman los componentes del sistema supraglotal (faringe, boca, fosas nasales, etc.), permaneciendo la cavidad
bucal siempre abierta para que la corriente de aire del sistema glotal pase por ella sin obstáculo, debido a esto
en la producción de vocales participan zonas o regiones de articulación. Si bien los movimientos de la laringe,
labios, velo del paladar, maxilar inferior, afectan volumen y forma de la caja de resonancia, un papel muy
importante lo tiene la lengua y su movimiento. La vocal /a/ es la más abierta, al pronunciarla en su posición
media o central, la lengua conserva una posición relativamente plana, no va hacia adelante ni hacia atrás, muy
cercana a la posición normal de la respiración sin voz. Si a partir de la /a/ son pronunciadas la /e/ e /i/ se observa
que la parte anterior de la lengua se eleva hacia la región prepalatal. Si se pronuncia la /o/, /u/ la lengua se retrae
hacia el interior de la boca, su postdorso se acerca al velo del paladar. Es por esto que aparecen los variados
matices de /e/ e /i/ que forman la serie anterior o palatal, al tiempo que /o/, /u/, más o menos abierta o cerrada,
forman la serie posterior o velar, este es el basamento del Triángulo de Hellwag, que aparece en la figura 1 con
la clasificación de las vocales por su lugar y modo de articulación. Desde la /a/ media hasta la /i/ cerrada en la
serie anterior y desde la /a/ media hasta la /u/ cerrada en la serie posterior existen innumerables matices.
VAI F i F a F i F u F u F a (2)
donde, VAI: Índice de Articulación Vocal
En el trabajo se efectúa una sola prueba cuyo contenido lo forman las vocales españolas en palabras aisladas en
una posición fonética normal, en la prueba cada vocal de interés está situada entre /p/, que es una consonante
labial, la cual no afecta la articulación de la vocal que es eminentemente lingual. La serie de palabras: /papa/,
/pepe/, /pipi/, /popo/, /pupu/, permite analizar cada vocal tónica sin influencia de contexto. En la prueba a cada
vocal se le extrae el valor de frecuencia de los formantes F1 y F2, usando un Espectrograma de Banda Ancha.
Para la obtención de los formantes de las 5 vocales españolas por cada caso se realizaron 10 grabaciones, los
archivos de audio (.wav) fueron digitalizados y procesados por la herramienta de software para análisis de voz
Anavoz 1.0 [27], [28], programa desarrollado en ambiente MATLAB® (The Mathworks, Inc), con sus facilidades
gráficas [29], [30]. Anavoz 1.0 es un programa registrado con resultados validados y comparados [27], [28], [31],
[32]. Los archivos de audio fueron obtenidos con frecuencia de muestreo de 8 kHz durante 12 segundos de
grabación la cual se efectuó con un micrófono HS-02B Genius y una laptop IBM ®ThinkPad X4. La figura 3
presenta el Espectrograma de Banda Ancha de una trama de más de 2 segundos de la prueba tomada al caso
D. I. Escobedo B.; O. R. Aguilera P.; F. Sanabria M. (2017) “PRIMEROS FORMANTES Y ÁREA DE ESPACIO
VOCAL EN UNA PEQUEÑA MUESTRA DE PACIENTES CON PARKINSON”. XV Simposio Internacional de
Comunicación Social. Nuevos estudios sobre Comunicación Social Vol. II. Ediciones Centro de Lingüística
Aplicada, Santiago de Cuba. pp. 645-650. ISBN: 978-959-7174-33-2.
de control C12, donde se observan las palabras /papa/, /pepe/, /pipi/, el cursor horizontal indica el valor de F2 de
la vocal tónica /a/ en la palabra /papa/ con frecuencia en el orden de 1500 Hz.
RESULTADOS Y DISCUSIÓN
La tabla 2 presenta los valores obtenidos de los formantes F1 y F2 en cada vocal tónica en posición fonética
normal de las palabras: /papa/, /pepe/, /pipi/, /popo/, /pupu/. Las vocales se disponen según: /i/, /e/, /a/, /o/, /u/.
En la tabla 2, al observar los valores de F1 y F2 en los casos de control se cumple el comportamiento referente a
los valores de los formantes alto y bajo explicado para la serie de vocales de la figura 2. En los casos patológicos
F1 es de valor creciente hasta la /a/ y luego decreciente hasta la /u/, no es así con los valores de F2 dado que en
los casos C06 (F2 /e/) y C23 (F2 /e/), se interrumpen los valores decrecientes. La figura 4 muestra en la serie /i/,
/e/, /a/, /o/, /u/ el típico incremento de F1 hasta la /a/ y su decrecimiento hasta la /u/, en F2 todo el decrecimiento
de valores desde /i/ hasta /u/. También en la tabla 2 se observa la tendencia de que los valores de F1 en los
casos de control son generalmente inferiores a los de los casos con EP, y los de F2 de estos casos por lo
general superiores a los de los patológicos. En la figura 5 en el comportamiento de F1 y F2 de C12 y C02, se ve
lo explicado y lo que algunos identifican como concentración de formantes o reducción de la diferencia F2-F1. En
el trabajo por lo extenso del tema no se trata suficientemente la diferencia F2-F1, igualmente no se hace
referencia a la semisuma de F1 y F2, importantes en la descripción de posiciones articulatorias de la lengua, etc.
Figura. 4: Valores de F1 y F2 del Caso de control C12 Figura. 5: Valores de F1 y F2 de C12 y C02
D. I. Escobedo B.; O. R. Aguilera P.; F. Sanabria M. (2017) “PRIMEROS FORMANTES Y ÁREA DE ESPACIO
VOCAL EN UNA PEQUEÑA MUESTRA DE PACIENTES CON PARKINSON”. XV Simposio Internacional de
Comunicación Social. Nuevos estudios sobre Comunicación Social Vol. II. Ediciones Centro de Lingüística
Aplicada, Santiago de Cuba. pp. 645-650. ISBN: 978-959-7174-33-2.
Si a partir de los valores formánticos de la tabla 2 se calcula el promedio de F1 y F2 para cada vocal de los casos
patológicos y de control, es posible obtener el comportamiento promedio de estos valores en todos los casos.
Dicha secuencia de valores se observa en las figuras 6 y 7.
Figura. 6: Promedio de F1 y F2 de los Casos con EP Figura. 7: Promedio de F1 y F2 de los Casos de control
Como se aprecia, la secuencia de valores decrecientes de F2 de la figura 6, está afectada en la realización
vocálica. La distribución de valores de F1 y F2 en la figura 7 es típica para estos casos sin presentar
modificación, además la diferencia F2-F1 de la serie /i/, /e/, /a/, /o/, /u/, dada por los valores en Hz: 2098, 1526,
692, 446 y 444, es de mayores valores respectivamente que la misma serie de la figura 6, de los casos con EP,
dada por los valores en Hz: 1628, 722, 490, 228, 224. La comparación vocal a vocal de cada figura muestra la
concentración de formantes en los casos con EP como resultado de la reducción de movimientos articulatorios.
En relación con el Área de espacio vocal, al tomar los valores promedio representativos de los vértices /i/, /u/, /a/
de los triángulos vocálicos acústicos de los casos con EP y de control, que se exhiben en la carta de formantes
de la figura 8, es posible comparar dichos triángulos y calcular el área de espacio vocal contenida en los mismos.
CONCLUSIONES
A través de la prueba realizada a los casos con 5 años o más con la enfermedad de Parkinson en la obtención
de los dos primeros formantes de las vocales españolas tónicas en posición fonética normal, sin influencia de
contexto, se muestra el incremento de F1 y la disminución de F2, haciéndose evidente la concentración de
formantes en estos casos. Además como en el triángulo vocálico acústico los formantes F1 y F2 tienen un papel
primordial, la repercusión en el Área de Espacio Vocal y en el Índice de Articulación Vocálica de estos casos se
hace manifiesta y de valores menores que las respectivas área e índice en los casos de control. Los resultados
de la aplicación del método acústico indican que al comparar los casos de control con los casos afectados por el
Parkinson, estos últimos tienen mayor limitación de los movimientos articulatorios para la producción de vocales,
lo que es consecuente con la disartria observada. Los resultados obtenidos coinciden con otros reportados en la
literatura. Finalmente, aumentar los casos para el análisis, mejorar el diseño de experimentos usando el método
acústico, técnicas de procesamiento de señal y alguna solución computadorizada, permitirán un mayor avance
en el estudio acústico articulatorio de las alteraciones de voz y en la evaluación de la disartria en estos pacientes.
AGRADECIMIENTOS
Al Servicio de Neurología del Hospital Saturnino Lora. A los pacientes y familiares de los casos patológicos y de
control. Al CENPIS de la Facultad de Ingeniería Eléctrica de la Universidad de Oriente, proyecto institucional:
Estudio de parámetros acústicos de la voz en la enfermedad de Parkinson, código: 10197.
REFERENCIAS BIBLIOGRÁFICAS
[1]. Bahena TR, Flores G, Arias MJA. Dopamina: síntesis, liberación y receptores en el Sistema Nervioso
Central. Rev Biomed. 2000; 11:39-60.
[2]. Roca GR y otros. Temas de Medicina Interna. 5ª. Ed. T-2 Editorial Ciencias Médicas. La Habana, 2014.
[3]. Ropper AH, Brown RH, editors. Adams and Victor’s Principles of Neurology. 9th ed. NY: McGraw-Hill; 2009.
[4]. Rodríguez VM, Cervantes AA. Detección y manejo de síntomas no motores en la enfermedad de Parkinson:
impacto en su prevalencia. Rev Med Chile. 2011; 139:1032-38.
[5]. Bocanegra Y, Trujillo ON, Pineda D. Demencia y deterioro cognitivo leve en la enfermedad de Parkinson:
una revisión. Rev Neurol. 2014; 59(12):555-69.
[6]. Martínez SF. Trastornos del habla y la voz en la enfermedad de Parkinson. Rev Neurol. 2010; 51(9):542-50.
[7]. Landázuri E, Villamil L, Delgado L. Parámetros acústicos de la voz en personas con enfermedad de
Parkinson. Umbral Científico 2007 (11):90-103, Universidad Manuela Beltrán, Colombia.
[8]. Hirano, M. Clinical examination of voice, Springer-Verlag/Wien, N. York, 1981.
[9]. Aguilera OR, Escobedo DI, Sanabria F, Nuñez I. Alteración de parámetros acústicos de la voz y el habla en
la enfermedad de Parkinson. XIV Simposio Internacional de Comunicación Social. Comunicación Social:
Retos y Perspectivas (2):679-84. Ediciones Centro de Lingüística Aplicada, Santiago de Cuba, 2015.
[10]. Gamboa J, Jiménez FJ, Nieto A, Montojo J, Ortí PM, Molina JA, García AE, Cobeta I. Acoustic voice analysis
in patients with Parkinson´s disease treated with dopaminergic drugs. J. of Voice 11, (3):314-20, 1997.
[11]. Skodda S, Visser W, Schlegel U. Vowel articulation in Parkinson´s disease. J. of Voice 25, (4):467-72, 2011.
[12]. Stouten V, Van H H. Automatic voice onset time estimation from reassignment spectra. Speech
Communication 51, (12):1-23, 2009.
[13]. Hansen J, Gray S, Kim W. Automatic voice onset time detection for unvoiced stops (/p/, /t/, /k/) with
application to accent classification. Speech Communication, 52:777-789, 2010.
[14]. Prathosh AP, Ramakrishnan AG, Ananthapadmanabha TV. Estimation of voice-onset time in continuous
speech using temporal measures, Typeset by REVTEX, 1-17, 2014.
[15]. Fischer E, Goberman AM. Voice onset time in Parkinson disease. J. of Comm. Disorders 43, 21-34, 2010.
[16]. Martínez SF, Meilán JJG, Carro J, Gómez ÍC, Millian ML, Pujante VIM, López AT, López DE. Estudio
controlado del ritmo del habla en la enfermedad de Parkinson. Neurología. 2015.
[17]. Gómez VP, Rodellar BV, Nieto LlV, Muñoz MC, Mazaira FLM, Martínez OR, Alvarez MA, Ramírez CC,
Fernández FM. Characterizing neurological disease from voice quality biomechanical analysis. Cogn Comput
2013, 5:399-425.
[18]. Escobedo DI, Cano SD, Ruiz F. Some acoustical features of the cry and speech signals in infants with
epilepsy. Proc. of the 2nd Int. Workshop on MAVEBA 2001, University of Firenze, Italy, 2001.
[19]. Delgado HJ. Medida de la severidad de la disartria atáxica a través del análisis acústico. Estudios de
Fonética Experimental [in press], 2016.
[20]. Blomgren M, Robb M, Chen Y. A note on vowel centralization in stuttering and nonstuttering individuals.
JSLHR 41, 1042-51, 1998.
[21]. Roy N, Nissen SL, Dromey C, Sapir S. Articulatory changes in muscle tension dysphonia: evidence of vocal
space expansion following manual circumlaryngeal therapy. J. of Comm. Disorders 42, 124-135, 2009.
[22]. Quilis A. Fonética Acústica de la Lengua Española, Editorial Gredos, S. A, Madrid, 1981.
[23]. Gili GS. Elementos de Fonética General, Editorial Gredos, S. A, Madrid, 1978.
[24]. Ruiz V, Miyares E. Estudio acústico comparativo del vocalismo de la joven generación cubana y los
locutores de Cuba. Aplicaciones prácticas. Comunicación Social, 2, 104-17, 1989.
[25]. Miyares E. El método acústico aplicado al estudio del vocalismo de algunos locutores cubanos.
Comunicación Social, 3, 8-39, 1989.
D. I. Escobedo B.; O. R. Aguilera P.; F. Sanabria M. (2017) “PRIMEROS FORMANTES Y ÁREA DE ESPACIO
VOCAL EN UNA PEQUEÑA MUESTRA DE PACIENTES CON PARKINSON”. XV Simposio Internacional de
Comunicación Social. Nuevos estudios sobre Comunicación Social Vol. II. Ediciones Centro de Lingüística
Aplicada, Santiago de Cuba. pp. 645-650. ISBN: 978-959-7174-33-2.
[26]. Jacewicz E, Allen FR, Salmons J. Vowel space areas across dialects and gender. ICPhSXVI, 1465-68, 2007.
[27]. Escobedo DI, Sanabria F, Cano SD, Marañón EJ. Analizador de voz, llanto infantil y habla usando Matlab.
FIE’ 8, Conferencia Internacional, 5ta Edición, Universidad de Oriente, Santiago de Cuba, 2008.
[28]. Escobedo DI, Sanabria F, Cano SD, Marañón EJ. Manual de Usuario Anavoz 1.0 (Registro: 1846-2008),
Universidad de Oriente, Santiago de Cuba, 2008.
[29]. The Mathworks, Inc. Help Matlab, version 6.5.0.180913 (R13), 2002.
[30]. The Mathworks, Inc. Help Matlab, version 7.13.0.564 (R2011b), 2011.
[31]. Kay Elemetrics Corp. Kay’s Acoustic and Speech Products: CSL, Multi-Speech, Visi-Pitch III, Sona-Speech.
Kay Elemetrics Corp., N.J, USA, 2001.
[32]. Escobedo DI, Sanabria F, Cano SD, Marañón EJ. Adaptación del diagrama de bloques de un algoritmo para
la extracción de la frecuencia fundamental en el llanto infantil. Ciencia en su PC. CITMA, (2):50-60, Santiago
de Cuba, 2009. http://169.158.189.18/cienciapc/index.php/cienciapc