You are on page 1of 2

1/2

Modélisation physique de la parole articulée.

Ce sujet de thèse se situe dans le cadre du projet ANR « Artspeech » qui vise à synthétiser de la
parole à partir du texte en simulant numériquement le processus physique de production de la
parole chez un humain, c’est-à-dire les aspects articulatoires, aérodynamiques et acoustiques.

Du point de vue de la physique, la production des sons de parole résulte de la conversion d'un
écoulement aérien provenant des poumons en une perturbation acoustique. Ceci est réalisé
notamment par l'auto-oscillation des plis vocaux, dans le cas des sons voisés, par le relâchement
rapide d'une occlusion du conduit vocal, dans le cas des plosives ou bien encore par les fluctuations
internes d'un écoulement turbulent en interaction avec les parois du conduit vocal, dans le cas des
fricatives. La modélisation de ces évènements est complexe parce qu’elle implique la
description conjointe de phénomènes relevant du domaine de la mécanique, de la mécanique
des fluides, de l’acoustique ainsi que des leurs interactions c’est-à-dire de l’aérodynamique ou
de l’aérodistorsion et de l’aéro-acoustique. Pour des raisons pratiques (puissance des calculateurs)
et théoriques (validation des algorithmes, stabilité, définition des conditions aux limites), la
simulation numérique directe de ces phénomènes reste à l'heure actuelle limitée à l'étude de
configurations ponctuelles, souvent très simplifiées. Même ainsi restreinte, la simulation numérique
de l'acoustique du conduit vocal nécessite typiquement une dizaine d'heures [1]. Celle de
l'écoulement au travers des cordes vocales se compte en jours sur un supercalculateur [2]. La
simulation numérique directe reste un outil coûteux et inadapté aux fins de la synthèse.

L’approche proposée dans cette thèse consiste à développer des modèles théoriques simplifiés et
validés, visant à rendre compte des phénomènes physiques essentiels.
Ainsi, plutôt que de considérer une infinité de degrés de liberté, les modèles distribués de type
masse-ressort [3] ne prennent en compte que les modes de vibration principaux des cordes vocales.
De la même manière, la méthode modale en acoustique permet de modéliser de manière très
efficace et avec une précision comparable à la simulation numérique par Eléments Finis [1],
des phénomènes tridimensionnels qui ne peuvent pas être prédits par les théories classiquement
utilisées en parole (modèles d'ondes planes).
En ce qui concerne la modélisation de l'écoulement aérien, l'analyse théorique [4, 5], soutenue par
des travaux expérimentaux [6, 7], permet d'identifier la nature des phénomènes physiques les plus
importants et de rationaliser un certain nombre d'hypothèses simplificatrices. L'analyse
dimensionnelle des équations de Navier Stokes appliquée au larynx, permet ainsi de justifier
l'utilisation de modèles d'écoulement localement incompressible (faible nombre de Helmoltz),
quasi-stationnaire (faible nombre de Strouhal) et à faible viscosité (nombre de Reynold
modéré). De même, l'utilisation d'analogies aéroacoustiques permet de modéliser la production
de son par turbulence sans nécessiter une description détaillée de l'écoulement [8, 9].
Le champ d'applications de ces travaux est vaste puisqu'il va de la recherche fondamentale à l'étude
des pathologies, du contrôle moteur et de la synthèse de la parole, bien sûr.

L’objectif est de modéliser théoriquement le processus physique de production de la parole chez un
humain, c’est-à-dire rendant compte :
 des gestes des articulateurs de la parole (mandibule, langue, lèvres, voile du palais, larynx),

GIPSA-lab
Grenoble Campus
11 rue des Mathématiques - BP46 UMR5216
F-38402 SAINT MARTIN D’HERES Cedex CNRS
Tél. +33 (0)4 76 57 45 36 www.gipsa-lab.fr Grenoble INP
Fax +33 (0)4 76 82 64 26 xavier.pelorson@gipsa-lab.fr UGA

 et enfin des interactions entre ces différents éléments. Journal of the Acoustical Society of America.R.K. Erath. Annemie Van Hirtum (annemie. J.fr Grenoble INP Fax +33 (0)4 76 82 64 26 xavier. M. [8] M. R. L. 461:1005–1028.fr UGA . arlsson.P. Aeroacoustics of [s]. 2013. GIPSA-lab Grenoble Campus 11 rue des Mathématiques . Ruty. Pelorson. Laboissière. Technol. A. Bailliet. A. [6] N. Flanagan. [5] B. Montreal. O. Journal of the Acoustical Society of America. 2015. Peterson.gipsa-lab. Kucinschi. 2005. An in vitro setup to test the relevance and the accuracy of low-order vocal folds models. Howe and R. Theoretical and experimental study of quasisteady-flow separation within the glottis during phonation. C. 118(1):410–427. ICA 2013 .V. Effects of higher order propagation modes in vocal tract like geometries.BP46 UMR5216 F-38402 SAINT MARTIN D’HERES Cedex CNRS Tél. Degirmenci. Van Hirtum. 2007. I.J.vanhirtum@gipsa-lab.. application to a modified two-mass model. G. Pelorson. A theoretical model of the pressure field arising from asymmetric intraglottal flows applied to a two-mass model of the vocal folds. In Proceedings of 21st International Congress on Acoustics. X. Krane. J. C. K.S. Aeroacoustic production of low-frequency unvoiced speech sounds.M. A. [4] X. 2011.S. Wijnands. S.grenoble-inp. Blandin. 1994. Laval. Pelorson.R. Hirschberg. 121(1):479–490. Scherer. 2005. Journal of the Acoustical Society of America. and A. X. and A. Références : [1] R. Abom. [7] R. Adaptive stabilized finite element framework for simulation of vocal fold turbulent fluid-structure interaction. Arnela. de Abreu. 96(6):3416–3431. Wodicka. Journal of the Acoustical Society of America. Za nartu. Afjeh. [9] M. McGowan. C. A.J. Des modèles théoriques de complexité croissante seront donc développés et validés sur la base d’un banc expérimental reproduisant sur maquette le fonctionnement du conduit vocal humain.D. Proc. Van Hirtum. Ces modèles seront enfin implémentés et testés acoustiquement sur un synthétiseur articulatoire développé par nos partenaires du projet ANR. Guasch. Shinwari.. 137(2):832–843. and M.grenoble-inp. R. [2] J. 1972. 2001. 130(1):389–403. 112(4):1253–1256.W. Lopez-Arteaga.  des phénomènes aérodynamiques qui modifient le flux d’air depuis les plis vocaux jusqu’aux lèvres. +33 (0)4 76 57 45 36 www. D. Synthesis of voiced sounds from a two-mass model of the vocal cords. Jansson. M. and X. Encadrement : Xavier Pelorson (xavier. Holmberg. 51:1233–1268. A. B. H.165th Meeting of the Acoustical Society of America. and A.pelorson@gipsa-lab. Journal of the Acoustical Society of America. Hoffman. Hirschberg.D.A. Journal of the Acoustical Society of America. Intraglottal pressure profiles for a symmetric and oblique glottis with a uniform duct. Ishizaka and J. Plesniak.pelorson@gipsa-lab. Bell Syst. 2/2  du contrôle des cordes vocales dont la vibration est l’une des sources sonores qui excitent le conduit vocal. M. [3] K.fr). Zhang.  de la propagation de l’onde acoustique dans le conduit vocal et du rayonnement aux lèvres pour donner le signal acoustique tel qu’il est perçu par des auditeurs.fr). and M. of the Royal Society A. DeWitt.