You are on page 1of 93

Cycle de formation des ingénieurs en Télécommunications

Option :

Réseaux et Services Mobiles

Rapport de Projet de fin d’études

Thème :

Intégration des services vocaux aux services d’accès aux données
Réalisé par :

Ben Slama Sofiene
Encadrants :

M. Choukaier Zied (SUP’COM) M. Bel Habib Najib (NewTech) M. Zouari Mourad (IT.Com)
Travail proposé et réalisé en collaboration avec

&

Année universitaire : 2006/2007

Dédicaces

La vie n’est qu’un éclair, Et un jour de réussite est un jour très cher.
A mon cher père SlahEddine et ma chère mère Dahbia,

Pour l’éducation et le grand amour dont ils m’ont entouré depuis ma naissance. Et pour leurs patiences et leurs sacrifices. A mes chers frères : Walid, Bacem, Naceur ; A ma chère soeur : Naziha ; A tous mes proches ; Au petit Achref ; A tous ceux qui m'aiment ; A tous mes ami (e) s; A tous ceux que j’aime. Je dédie ce mémoire.
Sofiene BEN SLAMA…

Sup’Com 2006/2007

i

Remerciements

Remerciements
C’est avec un grand plaisir que je réserve cette page en signe de gratitude et Je tiens à exprimer mes sincères gratitudes et respects à mes encadreurs Mr.

de profonde reconnaissance à tous ceux qui m’ont aidé de près ou de loin à la réalisation de ce travail.

Zied Choukaier, Maître de conférence à l’école supérieure des communications de Tunis, et Mr Bel Habib Najib et Zouari Mourad, directeurs des sociétés
NewTech et IT.COM, Pour leurs encouragements et les précieux conseils qu’ils n’ont cessés de me prodiguer tout au long de ce projet.

Supérieure de Communication de Tunis (Sup’com) qui de prés ou de loin n’a épargné aucun effort pour que nos travaux se termine dans les bonnes conditions.

Je n’omettrai jamais d’exprimer toute ma gratitude à tout le staff de l’Ecole

mes meilleurs et vifs remerciements s’adressent aux membres du jury pour avoir accepté d’évaluer ce projet.

Enfin

Sofiene BEN SLAMA…

Sup’Com 2006/2007

ii

................................3.......4............................................................... 15 I................ 18 I........... 16 I..............................................................1................................4.... Le serveur d’appel ou Media Gateway Controller ..................................................................................4........................................... Les entités fonctionnelles du cœur de réseau NGN...........4...... Les paramètres de la voix sur IP..................5........ 10 I......... 15 I.............................................5 I........... 7 I.........2. La Voix sur IP........... 6 I.2.......................................1..............................TABLE DES MATIERES TABLE DES MATIERES Liste des Figures et des Tableaux ...............................................2...........................................5................ La gigue de phase ........2.............................................3 I.......2..... 17 I................................. viii Introduction Générale ..........................................5...........4.............4.......3........... Le délai de transit .............................. Les différents échantillonnages .....................3...................4................4...........................................4............................. Principaux composants d’architecture VoIP .. Les défauts de la communication IP........................................ 8 I....................4.................4....2. Les protocoles de contrôle d’appel...................1.......2................ 15 I................. Exemples des services offerts par les NGNs ...................................................... 12 I.....1...2.....................2...5........ La perte de données ...............6................4...........................12 I...............4.................................................. 9 I............ vi Glossaires ...................................................................2......................1.................................3.................................3......... 14 I..................... Caractéristiques de la Voix.... 18 I.................. 18 I.................3...................................2...........................2............ 7 I............................. Un sens délicat..........2....... Définition et vue d’ensemble................ Introduction .1..........................4..................................1.......3.........................4......................................................................... Le Media Gateway....................................................... 15 I......................................................................................4 I...............1 Chapitre I : Réseau de nouvelle génération (NGN) et Voix sur IP (VoIP) ......4.................11 I.... Le Signalling Gateway ............................................... Les protocoles de commande de Media Gateway ....................................................4.................5........................................................ Les réseaux de nouvelles générations......................... 13 I....................5............................. Architecture VoIP...................... Les protocoles de signalisation entre les serveurs de contrôle ..........3............... Définition................4...............................2......... 5 I......................................... 7 I.......................................................................4................................................2..................................4..............................4............... 7 I....2.... Principe générale et vue d’ensemble ..... La conversation orale : une exigence d’interactivité ............... Conclusion ................2........ 7 I.............................. Les protocoles de NGN .............19 Sup’Com 2006/2007 iii ......3...............................................

.................... 36 II............................6...............................................................1............................................................ 23 II.......................... 35 II.2.........................................2......................................1........6.....1... 23 II.....................................................1..5.4.................... 33 II..............................1. SCCP ........................... Exemple de fonctionnement d’une application VoiceXML ......................... Avantages ............................................ Introduction . 45 Sup’Com 2006 /2007 iv ...............................................................4...248.... Le protocole SIP. Défis d’un système de dialogue ....4....5.......2.............................................................................................................................................................................7 Synthétiseur de la parole .........3..................................1..........6....................................2.2................................................4...........20 II........................3............................2.......2.....4............ Les protocoles de contrôle d’appel...............2....................2.. 28 II.........................4...........3..............21 II... 25 II......2........................31 II......... 32 II..............................1.................................................................2................. Les messages SIP . Description......................... 23 II...32 II..................6...1........TABLE DES MATIERES Chapitre II : Les protocoles de signalisation de VoIP et le langage VoiceXML ...............3.........2.....................4.. Concept de base............. MGCP.............6.. Architecture distribuée ...........................2.................................................. Etude théorique ................6 Générateur textuel ............ Conclusion................................................................... Net2Phone .........4..... 38 II...................41 III..4............2......................... Avantages et Inconvénients H323.........................6..............................2........................... 34 II.........1.....................4..................2..........................................44 III.....................................323 .............42 III. 22 II..............................5 Contrôleur de la tâche ................................1............4................1....1...2......................2................6............................ 22 II........... VoiceXML et application vocale .....4.................. MEGACO/H.................... Formalismeiagramme de séquence : DES......1..........4........................ 38 II..........3........................................ 44 III....2.......................................................... Architecture centralisée......................................................2.3...............2 Compréhension sémantique ........... 39 II........40 Chapitre III : Conception Objet de l’application.....................2..6.............. 34 II.............. Cadre générale de l’application .2.......6.................................. 30 II........3 Interpréteur pragmatique ................1.......................... Introduction .................2........... 24 II.................. 30 II.2.....4...........1.................2.......6............................................................ Caractéristiques ......................5....................... Reconnaissance automatique de la parole. 38 II. 23 II........... Les autres requêtes SIP ...................4............. 35 II... Introduction...2.......................3............................. 35 II.......3....................................................2........................5............... Présentation de VoiceXML....... 35 II........................................... 38 II....................4 Contrôleur du dialogue...............................4....1........................ Inconvénients .......... Modèle d’architecture .21 II...................................2.... 28 II............................................................................ 39 II......... Principes généraux .....1.......2........2.........................................................3....4... 39 II............................ 30 II....2.............2.....................................................1.... Le protocole H................6............................................. Topologie de protocole SIP............................................1....2......5........... 37 II...............................323........................................................... Systèmes de dialogue oral homme-machine .........2.........4..................... Architecture générale .........3........ 34 II...................................................2...............................2.. SIP et MGCP...............1................. Définition ..........................2.........2.....................................................2....2........................... Diagramme d’activité : DAC ........................ Les différents composants de H......................................................3....1.................................... Diagramme des cas d’utilisation : DCU .........................Media Gateway Control Protocol .............................................. Les requêtes de base SIP ....................................................

nnexe ................................ 50 III... Introduction....................................... 69 IV...............................2....................................................................................................... De l’appellent jusqu'à l’appelé................3......... Choix d’équipe.............................................................5............... Interprétation d’un fichier VXML par l’Asterisk .......................... Cycle d’authentification.................5......................................................63 IV............................. 50 III............................................................1... Conclusion .....................5.... 65 IV............2....................... 58 IV...... Paramétrage de Soft phone VoIP.........................................3........................................3.....3.........1.............................. 64 IV...2.....2.........3....... IVR .................................... 53 Chapitre IV : Réalisation .......................3........ Déroulement de l’application..............3............................. 53 III.....5....................3...............3................3..................... Diagramme de séquence .......3.......................................................... Demande d’inscription................3. Diagramme de collaboration :.1..............................................1............5.........57 IV......2................................................ Vue global sur Voxeo .............. 57 IV............76 Conclusion générale et perspectives.....2.......3.2.......................4................... 45 III..............3................................2..................................TABLE DES MATIERES III.................................4..............4.........3....... 65 IV.....................5...........................................1............................................. 46 III........................................................... 67 IV............. 52 III....................... 64 IV....................................... Cas d’utilisation d’identification........................3......................56 IV..................................... Asterisk PBX ............... 46 III......... Fichiers de configuration d’Asterisk .....3.........................................3.......................................3............ Déroulement d’appel au niveau d’Asterisk .2..................3.... Identification et Représentation des cas d’utilisation ..................... 48 III.. 46 III.................................................................... Diagramme de collaboration : DCO ...............................57 IV........................................3.....................80 Sup’Com 2006 /2007 v ..... Diagramme d’activité.. 49 III................2..................3..........3.................................................................... Plate forme Voxeo pour VoiceXML ...........3..............1....... Réalisation d’une application VoiceXML .......3...... Cas d’utilisation d’inscription.. Conception de site.............................. Fichiers de configuration de VoiceXML Browser ...................77 Bibliographie ..................................................................................................................4..................... Site Sportif ..3............................ 47 III.................... Configuration de service Voice XML sur l’Asterisk...........4..1.................. Réponse d’Asterisk à un appel entrant ........2......................3...

...........................................................................................................4 : Cas d’utilisation d’inscription ....................................10 : Architecture générale d’un système de DHM .......................................................................43 Figure III.................................................................................................29 Figure II......8 : Proxy SIP ...........47 FigureIII....................6: Cas d’utilisation de sélection d’équipe préféré Handballeuse...............................................................................................................................................2 : Intelligence partagée entre les serveurs et les clients...........................................................3 : Principaux composants d’une solution de communication IP .....................................................................................................................................61 Figure IV.......5 : Diagramme fonctionnel d’un Gatekeeper.................................................13 : Diagramme de séquence (identification)...................58 Figure IV....................................................11 : Description d’un module de reconnaissance de la parole................48 Figure III..................................3 : Directeur d'application de Voxeo............36 Figure II.................................10 : Diagramme d’activité ...........................5 Figure I.......................4 : Architecture VoIP ......................14 Figure II....................34 Figure II..................2 : Fonctionnement d’une application VoiceXML....59 Figure IV.......................................................................1 : Intelligence uniquement auprès des "maîtres"..................................62 Figure IV....14 : Diagramme de séquence (conception de site) ..............7 : Topologie d'un réseau VoIP – SIP..................................................7 : Cas d’utilisation de sélection d’équipe préféré Footballeuse............................................................................................11 : Diagramme de séquence (appellent à appelé) ......61 Figure IV..........10 : Détection des erreurs pour un fichier VXML.....................49 Figure III...............9 : Modèle d’architecture de VoiceXML..........................8 : Cas d’utilisation de conception de site ............52 Figure III.............................................1 : Plate forme Voxeo.........................................................................................................9 : Diagramme de collaboration ........2 : Architecture physique d’un réseau NGN...........................................................................5 : Cas d’utilisation d’identification .................. ...............12 : Les fichiers de configurations pour Asterisk ........................59 Figure IV.............7 : Apple d’une application VoiceXML par FWD.64 Figure IV......................46 Figure III...........49 Figure III...........1 : Principe général d’architecture d’un réseau NGN ....22 Figure II............................................2 : Composants des IVRs ............................................60 Figure IV..........................................42 Figure III..47 Figure III.......................4 : Diagramme fonctionnel d’une passerelle .1 : Serveurs vocaux de nouvelle génération :...6 Figure I......37 Figure III.52 Figure III.................................................................................................................................65 Sup’Com 2006 /2007 vi ...6 : Diagramme fonctionnel d’une MCU ....................................................54 Figure IV................................................3 : Positionnement des neuf diagrammes d’UML.........9 : Exemple d’un fichier VXML....................................26 Figure II........................6 : Les différents points d'accès au fichier VXML..........4 : Attribution d’un numéro de téléphone à un fichier VXML ..........26 Figure II...........................5 : Attribution de fichier VXML est réussi ........................................62 Figure IV........................................13 Figure I...................... .......................3 : Topologie d'un réseau VoIP – H...................................53 Figure III..............................11 : Interconnexion d’Asterisk PBX ...........................................................46 Figure III...........28 Figure II.......... ..................58 Figure IV................................12 : Diagramme de séquence (inscription).................24 Figure II................63 Figure IV......................25 Figure II.............................27 Figure II...... ......................................................................44 Figure III..... ..........Liste des Figures et des Tableaux Liste des Figures Figure I..323....................8 : Interface de programmation VXML ........................

Liste des Figures et des Tableaux
Figure IV.13 : Extensions.conf ......................................................................................................66 Figure IV.14 : VoiceXML Configuration......................................................................................66 Figure IV.15 : SIP Configuration...................................................................................................67 Figure IV.16 : Paramétrage de Softphone......................................................................................68 Figure IV.17 : X-Lite (Softphone VoIP)........................................................................................68 Figure IV.18 : Réponse d’Asterisk pour l’appel 1225...................................................................69 Figure IV.19 : Ouverture de site ....................................................................................................70 Figure IV.20 : Identification ou inscription ...................................................................................70 Figure IV.21 : Page d’inscription...................................................................................................71 Figure IV.22 : Les messages d’alertes. ..........................................................................................71 Figure IV.23 : Choix de type de service sportif.............................................................................72 Figure IV.24 : Page service football : choix d’une League disponible..........................................72 Figue IV.25 : Choix d’équipe : Page de la League anglaise..........................................................73 Figure IV.26 : Page d’équipe Arsenal............................................................................................73 Figure IV.27 : Exécution de Skype VoIP ......................................................................................74 Figure IV.28 : Démarrage de Skype ..............................................................................................74 Figure IV.29 : Numérotation de Skype..........................................................................................75 Figure IV.30 : Liens de téléchargement des Softphone VoIP .......................................................75

Liste des Tableaux
Tableau I.1 : Codecs en fonction de leurs vitesses d’échantillonnage...........................................16 Tableau I.2 : Bilan de bande passante en fonction du codec .........................................................16 Tableau II.1 : Avantages et Inconvénients des protocoles de signalisation de VoIP ....................31 Tableau III.1 : Diagramme UML...................................................................................................45

Sup’Com 2006 /2007 vii

Glossaires

Glossaires
A
ATM: Asynchronous Transfer Mode. ASR: Automatic Speech Recognizer. ADSI: Active Directory Service Interfaces.

B
BICC: Bearer Independant Call Control.

C
CPL: Call Processing Language. CGI: Common Gateway Interface.

D
DTMF: Dual-tone multi-frequency.

F
FWD: Free World Dialup.

G
GK: Gatekeeper.

H
HTTP: Hypertext Transfer Protocol. HTML: Hypertext Markup Language.

I
IVR: Interactive Voice Response. IP: Internet Protocol. IETF: Internet Engineering Task Force.

Sup’Com 2006 /2007 viii

Glossaires
L
LAN: Local Area Network. LS: Location Server.

M
MG: Media Gateway. MGC: Media Gateway Controller. MGCP: Media Gateway Control Protocol. MRCP: Media Resource Control Protocol. MCU: Multipoint Controller Unit. MMUSIC: Multiparty Multimedia Session Control.

N
NGN: Next Generation Networks.

O
OSI: Open Systems Interconnection.

P
PSTN: Public Switched Telephone Network. PPP: Point to Point Protocol. PABX: Private Automatic Branch eXchange. PBX: Private branch exchange. PDA: Personal Digital Assistant.

R
RTC: Réseau téléphonique commuté. RTP: Real-time Transfert Protocole. RTCP: Real-time Transfert Control Protocole. RAS: Réseau Associatif et Syndical. RNIS: Réseau numérique à intégration de services. RTSP: Real Time Streaming Protocol.

S
SS7: Signalling System 7. SIP: Session Initiation Protocol. SMTP: Simple Mail Transfer Protocol. SG: Signalling Gateway. SIGTRAN: Signalling Transport, Informational: RFC 2719. SCTP: Stream Control Transmission Protocol. SCCP: Skinny Client Control Protocol. SDP: Session Description Protocol.

Sup’Com 2006 /2007

ix

T TDM: Time Division Multiplexing. W WAN: Wide Area Network. URL: Uniform Resource Locator.Glossaires SSML: Speech Synthesis Markup Language. UMTS: Universal Mobile Telecommunications System. UAC: User Agent Client. VPN: Virtual Private Network. Sup’Com 2006 /2007 x . V VoIP: Voice Over Internet Protocol. SRGS: Speech Recognition Grammar Specification. TTS: Text To Speech. UML: Unified Modeling Language. W3C: The World Wide Web Consortium. UAS: User Agent Serveur. SISR: Semantic Interpretation for Speech Recognition. UDP: User Datagram Protocol. VXML: Voice Extensible Markup Language. TCP: Transmission Control Protocol. U UIT: Union Internationale des Télécommunications.

mais également dans l’aspect communicatif entre l’homme et le système d’information. concernant la gestion des flux multimédia.323 et SIP. Dans ce type d'applications. L’utilisation d’un réseau en mode paquet pour transporter de la voix. Ce mémoire s’organise en quatre chapitres et se termine par une conclusion. Il s’agit de présenter un état de l’art concernant d’une part la notion des réseaux NGNs ainsi que les différents protocoles de signalisation. au sein de la couche contrôle. cet adage est certainement vrai. Ce nouveau concept propose le transport de plusieurs informations différentes sur un support mode paquet. ces réseaux en mode paquet étaient généralement utilisés comme réseau de transport mais n’offraient pas de services permettant la gestion des appels et des communications. En effet. « Dialoguer est un art de vivre ». les sociétés IT. C’est dans ce contexte que décline l’objectif de notre projet de fin d’étude. Cette évolution a conduit donc à l’apparition de nouveaux protocoles tels que H. a nécessité l’adaptation de la couche contrôle.Introduction générale Introduction Générale Les évolutions profondes vécues et le développement de nouvelles gammes de services semblent êtres des facteurs favorables à l’évolution progressive du monde des télécommunications vers un nouveau modèle de réseaux et de services appelé NGN (Next Generation Networks). Le deuxième volet porte sur la notion de la voix sur IP et de ses exigences comme étant un service directement lié aux NGNs. on parle donc de la convergence Voix/données et fixe/Mobile. de contrôle et de commande d’appels. La notion d' « application vocale » couvre une zone plus vaste dans l'ensemble des applications informatiques. non seulement dans la vie quotidienne. une phrase courte et simple. ouvrant sur des perspectives : Le premier chapitre introduit le concept NGN. Sup’Com 2006/2007 1 . d’autre part le langage VoiceXML afin de nous permettre moyennant des Soft phones VoIP d’appeler une application vocale prédéfinie. … ou toute la complexité de la langue. Nous définissons une application vocale comme une application informatique utilisant la parole pour réaliser/accomplir certaines tâches. avec des contraintes de «temps réel». l'utilisateur peut dialoguer avec l'application en utilisant seulement les mots clés. il présente dans un premier volet les protocoles de signalisation de contrôle et de commande d’appel. proposé dans le cadre d’une collaboration entre l’école supérieure des communications de Tunis. pour la réalisation des IVRs : les réponses vocales interactives soit sur une plateforme Web Voxeo ou sur l’Asterisk PBX.COM et NEWTECH .

Nous détaillerons alors leurs architectures ainsi que leurs caractéristiques. Et à la fin de ce chapitre nous expliquons la notion d’application vocale ainsi que le langage VoiceXML.Introduction générale Le second chapitre se focalise d’avantage sur les protocoles de contrôle d’appel à savoir les protocoles H. La représentation et la conception de travail à faire seront proposées dans le troisième chapitre qui se divise en deux parties : la première pour la description de l’application aussi bien que l’introduction d’utilisation de VoiceXML comme un langage de programmation pour le développement des IVRs dans un réseau tout IP. la seconde consacré à une étude théorique de travail à réaliser expérimentalement en détaillant quelques diagrammes UML qui vont être réaliser à travers Rational Rose comme logiciel. Le bilan général de ce mémoire est présenté dans la conclusion et diverses perspectives sont également proposées. Nous exposons tout d’abord la plate forme Voxeo comme un outil de développement des IVRs.323 et SIP. la notion de VoiceXML Browser ainsi que son utilisation avec l’Asterisk pour l’interprétation des fichiers VoiceXML. nous présentons par la suite l’Asterisk PBX. Enfin la réalisation d’un petit site web dans le but est de fournir des infos vocales sportives par l’utilisation des numéros spécifiques à travers des Soft phones VoIP bien définies. Le quatrième chapitre s’adresse à l’aspect pratique en présentant l’expérimentation de toutes nos approches théoriques. Sup’Com 2006/2007 2 .

Chapitre I : Réseau de nouvelle génération (NGN) et voix sur IP (VoIP) Chapitre I Réseau de nouvelle génération (NGN) et Voix sur IP (VoIP) Sup’Com 2006/2007 3 .

d’ ailleurs. Sup’Com 2006/2007 4 . Aujourd’hui. Introduction Depuis l’invention du téléphone par Alexander Graham Bell en 1876. de nombreux progrès et révolutions se sont opérés dans le domaine des télécommunications. Les évolutions profonds vécus et le développement de nouvelles gammes de services semblent êtres des facteurs favorable à l’évolution progressive du monde des télécommunications vers un nouveau modèle de réseaux et de services appelé NGN (Next Generation Networks). Dans une première section nous nous sommes intéressés à l’architecture des réseaux NGNs.1.Chapitre I : Réseau de nouvelle génération (NGN) et voix sur IP (VoIP) Chapitre I Réseau de nouvelle génération (NGN) et Voix sur IP (VoIP) I. aux différents éléments qui le composent ainsi qu’aux différents protocoles en concurrence. C’est dans ce contexte que ce premier chapitre est consacré à la présentation des réseaux de nouvelles générations (NGN Next Generation Network). à savoir le service de la voix sur IP (VoIP). nous vivons dans l’ère des télécommunications et il est devenu impensable de se séparer des services offerts par ce secteur. La seconde section met l’accent sur un service directement lié à l’évolution vers les réseaux NGNs .

indépendantes de la nature du réseau d’accès Sup’Com 2006/2007 5 . Afin de s’adapter à l’ouverture des nouveaux services. réseaux mobiles. et d’autre part l’accès aux services (profils d’abonnés. fibre optique.2. Elle communique avec la couche contrôle du coeur de réseau via des interfaces ouvertes et normalisées.2. qui regroupe les plates-formes d’exécution de services et de diffusion de contenus. les NGN sont basés sur une évolution progressive vers le « tout IP ». qui se compose de serveurs dits « Softswitch » gérant d’une part les mécanismes de contrôle d’appel (pilotage de la couche transport. services et accès) dialoguant via des interfaces ouvertes et normalisées [1]. accès aux plates formes de services à valeur ajoutée). La couche « Services ». gestion des adresses). Couche Service (opérateur et tiers) Interfaces ouvertes et normalisées Périmètre NGN Couche Contrôle Interfaces ouvertes et normalisées Couche Transport (mode paquet) Cœur de réseau Réseau d’accès multiple Connexe aux NGN Terminaux Figure I.1 : Principe général d’architecture d’un réseau NGN La couche « Accès ».Chapitre I : Réseau de nouvelle génération (NGN) et voix sur IP (VoIP) I. Définition Les NGNs sont définis comme un réseau de transport en mode paquet permettant la convergence des réseaux Voix/données et Fixe/Mobile . La couche « Contrôle ». xDSL. En bordure du réseau de transport. boucle locale radio. qui permet l’accès de l’utilisateur aux services via des supports de transmission et de collecte divers : câble. ces réseaux permettront de fournir des services multimédia accessibles depuis différents réseaux d’accès.1. contrôle. qui gère l’acheminement du trafic vers sa destination. cuivre. Les réseaux de nouvelles générations I. Ils sont modélisés par une architecture en couches indépendantes (transport. La couche « Transport ». des « Media Gateways » et des «Signalling Gateways» gère respectivement la conversion des flux de données et de signalisation aux interfaces avec les autres ensembles du réseau ou les réseaux tiers interconnectés.

. B/ Apparition des nouveaux protocoles de contrôle d’appel et de signalisation entre ces équipements (de serveur à serveur et de serveur à Media Gateway). Sup’Com 2006/2007 6 .…) ainsi que la séparation des couches de transport des flux et de contrôle des communications.Chapitre I : Réseau de nouvelle génération (NGN) et voix sur IP (VoIP) utilisé. I. Des équipements de médiation et de routage dits Media Gateway (correspondant schématiquement aux cartes d’interfaces et de signalisation et aux matrices de commutation des commutateurs voix traditionnels). qui s’appuient sur le réseau de transport mutualisé NGN. Les services et contenus eux-mêmes sont par ailleurs développés avec des langages convergents et unifiés. Ces grands principes se déclinent techniquement comme suit concernant les équipements actifs du coeur de réseau NGN : A/ Remplacement des commutateurs traditionnels par deux types d’équipements distincts : Des serveurs de contrôle d’appel dits Softswitch ou Media Gateway Controller (correspondant schématiquement aux ressources processeur et mémoire des commutateurs voix traditionnels). Figure I. qui sont implémentées dans un même équipement pour un commutateur traditionnel.2 : Architecture physique d’un réseau NGN. ATM.2. Principe générale et vue d’ensemble Les principales caractéristiques des réseaux NGN sont l’utilisation d’un unique réseau de transport en mode paquet (IP.2.

3.2. Le choix du MG de sortie selon l'adresse du destinataire. mais sans l’interpréter (ce rôle étant dévolu au Media Gateway Controller). La transmission.1. La réservation des ressources dans le MG et le contrôle des connexions internes au MG (commande des Media Gateways). des flux média reçus de part et d'autre. Le traitement des appels : dialogue avec les terminaux H. le type d'appel.4.2. ou entre le coeur de réseau NGN et les réseaux d’accès. I. En effet ces réseaux en mode paquet étaient généralement utilisés comme réseau de transport mais n’offraient pas de services permettant la gestion des appels et des communications multimédia. etc.3. Cette évolution a conduit à l’apparition de nouveaux Sup’Com 2006/2007 7 .3. communication avec les serveurs d’application pour la fourniture des services. I. Le Media Gateway (MG) Le Media Gateway est située au niveau du transport des flux média entre le réseau RTC et le réseau en mode paquet. I. Les entités fonctionnelles du cœur de réseau NGN I. d’où le fait que ce dernier terme est parfois employé abusivement pour recouvrir les deux fonctions MG + SG.3. Le Signalling Gateway (SG) La fonction Signalling Gateway a pour rôle de convertir la signalisation échangée entre le réseau NGN et le réseau externe interconnecté selon un format compréhensible par les équipements chargés de la traiter. et l’interprétation de cette signalisation.323. SIP. : adaptation TDM /IP). Le serveur d’appel ou Media Gateway Controller (MGC) Dans un réseau NGN. le MGC possède de « l'intelligence » et c’est lui qui gère : L’échange des messages de signalisation transmise de part et d'autre avec les passerelles de signalisation.2.2. ayant des contraintes de « temps réel ». a nécessité l’adaptation de la couche Contrôle. Il a pour rôle : Le codage et la mise en paquets du flux média reçu du RTC et vice-versa (conversion du trafic TDM (Time Division Multiplexing) en trafic IP (Internet Protocol)). elle assure l’adaptation de la signalisation par rapport au protocole de transport utilisé (ex. Les protocoles de NGN La convergence des réseaux voix/données ainsi que le fait d’utiliser un réseau en mode paquet pour transporter des flux multimédia. Cette fonction est souvent implémentée physiquement dans le même équipement que la Media Gateway. la charge du réseau.2. selon les instructions du Media Gateway Controller.Chapitre I : Réseau de nouvelle génération (NGN) et voix sur IP (VoIP) I. Notamment.2.3.

On peut classer les protocoles de contrôle en différents groupes : Les protocoles de contrôle d’appel permettant l’établissement.323 assure la communication entre plusieurs composants du réseau : Les terminaux H. notamment les réseaux à technologie IP [2].248/MEGACO. L’unité de contrôle MCU (Multipoint Controller Unit) gère les connexions multipoint (ex.323 de l’UIT-T spécifie les composants.4. MGCP (Media Gateway Control Protocol) de l’IETF et H. Il se décompose en un Multipoint Controller (MC). d’une communication entre deux terminaux ou entre un terminal et un serveur . sont actuellement les protocoles prédominants. standard développé à l’IETF. PC) permettant de communiquer en « temps réel ».323 sont des systèmes multimédia (téléphone. principalement concernant la gestion des flux multimédia. A l’interconnexion avec les réseaux de signalisation SS7. généralement à l’initiative d’un utilisateur.323 (Gateway) permet d’interfacer le réseau IP avec le réseau téléphonique classique.2. I.1. les deux principaux protocoles sont H. norme de l’UIT et SIP. permettent au Softswitch ou Media Gateway Controller de gérer les passerelles de transport ou Media Gateway. généralement via des passerelles de signalisation ou Signalling Gateways par l’utilisation de protocole tel que SIGTRAN.Chapitre I : Réseau de nouvelle génération (NGN) et voix sur IP (VoIP) protocoles. De plus.323 Le standard H. au sein de la couche Contrôle. Les protocoles de signalisation entre les serveurs de contrôle (ou Media Gateway Controller) permettant la gestion du plan contrôle : • • Au niveau du coeur de réseau avec des protocoles tels que BICC (Bearer Independant Call Control). : appels de conférence).323. Les protocoles de commande de Media Gateway qui sont issus de la séparation entre les couches Transport et Contrôle. Les protocoles de contrôle d’appel Deux protocoles candidats : Protocole H. les méthodes et les protocoles pour permettre la communication en temps réel de données multimédia à travers les réseaux à commutation de paquets. développé conjointement par l’UIT et l’IETF.323 (identification et traduction d’adresses) et les établissements d’appels La passerelle H. H.323. le Gatekeeper gère les terminaux H. l’interconnexion de ces réseaux de données avec les réseaux existants de téléphonie (TDM avec signalisation SS7) a nécessité le développement de protocoles dédiés à l’interconnexion des réseaux et au transport de la signalisation SS7 sur des réseaux en mode paquet. SIP-T (SIP pour la téléphonie) et H. affecté à Sup’Com 2006/2007 8 .

la gestion et les contrôles des ressources des Media Gateway. dédié à la transmission proprement dite. RTCP.261. Le Registrar : est essentiel dans tout réseau SIP ou l’on veut utiliser les services de localisation. H. Ces sessions peuvent inclure aussi bien de la voix.4.. tout comme http ou SMTP. Il est sous forme de texte. Les différents éléments qui utilisent MGCP sont : Signalling Gateway : Elle réalise l’interface entre le réseau de téléphonie (signalisation SS7) et le réseau IP. Elle effectue la conversion des médias entre le mode circuit (téléphonique) au mode paquet (IP).1.. Le Proxy Server : remplit la même fonction qu’un Redirect Server.728. et des codecs vidéo : H. G723. Elle coordonne l’établissement. et un Multipoint Processor (MP). Q.263. H.….… Des protocoles de signalisation : RAS. aussi bien des conférences que des appels téléphoniques sur des réseaux en mode paquets.931.711.323 s’appuie sur 3 points de normalisation : Des protocoles de communications : RTP.2. Media Gateway (MG) : Il est le point d’entrées ou de sortie des flux média à l’interface avec les réseaux IP et téléphoniques. Media Gateway Controller (MGC) ou Call Agent : Il opère l’enregistrement. Il gère la communication entre les « Media Gateway » et les «Media Gateway Controller ». modifier et terminer des sessions multimédia. Le protocole SIP SIP : « Session Initiation Protocol » est un protocole de contrôle qui peut établir.Chapitre I : Réseau de nouvelle génération (NGN) et voix sur IP (VoIP) la signalisation. a été conçu pour des réseaux de téléphonie IP utilisant des passerelles VoIP. Ce protocole traite la signalisation et le contrôle des appels. Le Redirect Server : établit la correspondance entre l’adresse SIP du terminal appelé et la ou les adresses où il pourra effectivement être joignable. des jeux interactifs. de la vidéo. Les principales composantes sont : Les terminaux : sont des appareils pouvant émettre et recevoir de la signalisation SIP. Les protocoles de commande de Media Gateway Deux protocoles candidats : Le Media Gateway Control Protocol: MGCP Ce protocole défini par l’IETF (RFC 2705).2.245. G. Des codecs audio : G. Elle termine les connexions des couches basses de SS7 et transmet les messages ISUP au MGC. et les flux média d’autre part. Sup’Com 2006/2007 9 . le contrôle et la fin des flux média qui transitent par le Media Gateway. I. d’une part. L'architecture de SIP est basée sur des relations client/serveur. et a pour rôle d’initier des sessions de communications interactives. H.

Il permet : L’utilisation d’un réseau IP comme réseau de transit. permettant aux opérateurs de réaliser une migration de leurs réseaux RTC/RNIS vers des réseaux en mode paquet. tel ou tel « package » qui ne sera pas obligatoirement choisi par un autre constructeur. d’une migration des réseaux téléphoniques (SS7) vers une architecture NGN.Chapitre I : Réseau de nouvelle génération (NGN) et voix sur IP (VoIP) Le protocole alternatif : MEGACO/H. élargit énormément son rayon d’action et les capacités. suivant ses besoins. Protocole SIP entre Media Gateway Controller: SIP-T L’Internet Draft SIP-T (SIP pour la téléphonie) de l’IETF définit la gestion de la téléphonie par le protocole SIP ainsi que l’interconnexion avec le RTC : cependant uniquement avec le protocole SS7 ISUP. le protocole BICC. SIP-T préconise : Sup’Com 2006/2007 10 . l’ISUP. indépendamment du type de support. Il s’agit de « tunnelling » de messages de signalisation par le protocole BICC sur un réseau de transport IP.323.4. La première version de ce protocole. BICC CS1 (BICC Capability Set 1) définit le transport de signalisation sur un réseau ATM en tant que réseau de transit. En effet BICC est en grande partie issu de l’ISUP . donc transparent pour les MGC du réseau IP. ce protocole est étendu par des « packages » répondant à des besoins spécifiques. l’UIT et l’IETF travaillent conjointement sur le développement du protocole MEGACO/H. une recommandation de l’UIT. Les protocoles de signalisation entre les serveurs de contrôle A/ Au cœur de réseau (NGN) BICC (Bearer Independant call control) Ce protocole a pour objectif la gestion de la communication entre les serveurs de contrôle. donc. I. quant à sa définition mais aussi pour l’interopérabilité avec H. Il est dérivé de MGCP et possède des améliorations par rapport à celui-ci : Support de services multimédia et de vidéoconférence. Ce système permet de couvrir un nombre très important d’applications. Depuis 1999. Possibilité d’utiliser UDP ou TCP. en effet.248 a été adoptée en juin 2000 (RFC 3015 de l’IETF).2. La seconde version de ce protocole. les recommandations font d’ailleurs directement référence à l’ISUP. doit étendre le protocole de signalisation actuellement implémenté sur les réseaux téléphoniques. Une première version de H. L’implémentation de H. BICC CS2.248 permet une grande modularité . mais complique aussi grandement l’inter fonctionnements d’équipements d’origine différente.3.248 . En vue.248 Le groupe de travail MEGACO (Media Protocol Control) a été constitué en 1998 pour compléter les travaux sur le protocole MGCP au sein de l’IETF. Ainsi un constructeur peut implémenter. c’est un standard permettant la communication entre les Media Gateway Controller (MGC) et les Media Gateway (MG). de passerelle à passerelle (Signalling Gateway). Utilise le codage en mode texte ou binaire.

Chapitre I : Réseau de nouvelle génération (NGN) et voix sur IP (VoIP) L’encapsulation des messages ISUP à l’intérieur de messages SIP. Mobilité (services disponibles partout et tout le temps). Ce protocole utilise une nouvelle couche de transport appelée Stream Control Transmission Protocol (SCTP) permettant de pallier les défauts du protocole TCP pour la gestion des messages de signalisation. Multicast (communication point-multipoint). Broadcast (diffusion). Les Media Gateway Controllers.3. On se concentrera dans cette section à la présentation du service de la voix sur IP qui fait une importance partie pour l’élaboration de l’objet de notre projet de fin d’étude. La grande diversité des services est due aux multiples possibilités offertes par les réseaux NGN en termes de : Support multimédia (données. I. Portabilité sur les différents terminaux. Parmi ces services offerts on cite : La messagerie instantanée La messagerie unifiée La diffusion de contenus multimédia La voix sur IP (VoIP) …. texte. Sup’Com 2006/2007 11 . permettant d’acheminer le message correctement à travers le réseau IP et de terminer les appels sur un terminal SIP. Mode de communication. Ce groupe définit le protocole de contrôle entre : Les Signalling Gateways. visuel). qui reçoivent la signalisation SS7 sur TDM. Le renseignement de l’en-tête du message SIP par les informations contenues dans le message ISUP. de créer et de déployer des nouveaux services multimédia sur des réseaux en mode paquet. Les « Signalling Points » du réseau IP (serveurs de contrôle d’appel). qui interprètent la signalisation SS7 sur IP. de protocole et de gestion. audio. permettant la transmission de façon transparente de la signalisation ISUP dans le cas de transit par un réseau IP. et la convertissent en SS7 sur IP. en termes d’infrastructure. Exemples des services offerts par les NGNs Les NGN offrent les capacités. B/ A l’interconnexion avec les réseaux de signalisation SS7 SIGTRAN (Signalling Transport. Informational : RFC 2719) développé par un groupe de travail de l’IETF. Unicast (communication point à point).

Définition et vue d’ensemble VoIP signifie textuellement Voice Over IP. Le coût des terminaux IP reste encore supérieur à celui des équipements classiques (pas encore d’économies d’échelle suffisantes). Vu l’évolution profonde du secteur de télécommunication et l’introduction du concept NGN.1.VoIP » consiste essentiellement à considérer les échantillons de voix comme des données particulières également susceptibles d’être transportées de façon banalisée sur un réseau IP.Chapitre I : Réseau de nouvelle génération (NGN) et voix sur IP (VoIP) I. l’évolution des terminaux communicants multimédia est un argument supplémentaire à l’évolution des réseaux téléphoniques vers la voix sur IP . en français : Voix sur IP. PPP. qui en rendaient l’intérêt essentiellement expérimental et ludique. L’approche VoIP s’applique donc au transport de la voix sur Internet. Ces premières applications étaient caractérisées par une qualité de voix très mauvaise: retards importants souvent supérieurs à une seconde. la voix sur IP est considéré un service directement lié ce nouveau paradigme. sur un Intranet d’entreprise ou dans le cadre d’un Extranet. paroles saccadées. De plus. La principale application de ce principe est la téléphonie Internet (téléphonie IP). Cependant l’évolution de la technologie et des protocoles et l’apparition de services associés au monde IP devraient permettre l’émergence de la voix sur IP. généralise le transport en IP au réseau voix.4. dans le release 5. ainsi l’UMTS. La nécessité d’interconnecter les réseaux IP aux réseaux TDM/SS7 implique des coûts liés aux équipements d’interconnexion (passerelles) et le prix des terminaux (IP phones) annihile l’avantage financier apporté par le transport en IP. la VoIP permet d'étendre la téléphonie sur tout réseau numérique ou analogique acceptant le protocole TCP/IP (Ethernet. etc. La transmission de la voix par l’intermédiaire du protocole IP a débuté avec IBM en 1996 sous la forme d’applications dites de téléphonie sur Internet (Internet Telephony) permettant à deux internautes de communiquer oralement via leur PC. par rapport au service de voix classique. Le seul fait de transporter la voix sur IP n’apporte pas de valeur ajoutée pour l’utilisateur final. et cela pour différentes raisons : La jeunesse des protocoles de signalisation (SIP. Le principe consiste à encapsuler un signal audio numérisé (en général la voix) dans le protocole IP (Internet Protocol). RNIS. Les services associés à la voix sur IP n’ont pas encore la maturité nécessaire pour pousser l’évolution vers ces nouveaux réseaux.). H.4. Megaco) de voix sur IP et la gestion de la qualité de service qui commence seulement maintenant à être mature ne permettaient pas de déployer de services téléphoniques sur IP.323. La transmission de la voix sur IP « Voice Over IP . La Voix sur IP (VoIP) I. échos. Sup’Com 2006/2007 12 . C’est un service qui est apparue depuis longtemps mais qui n’a pas encore eu le succès escompté.A la différence des téléphones analogiques filaires (RTC) distribués par les centraux téléphoniques.

pour communiquer. des PDA. des commutateurs LAN. Livre blanc : Communications IP La fonction de signalisation. Les clients peuvent être des téléphones respectant le standard Ethernet (filaire ou wireless) ou par des logiciels installés sur des postes de bureautiques (Softphones). des logiciels de messagerie instantanée.3 : Principaux composants d’une solution de communication IP Sup’Com 2006/2007 13 . etc. Figure I. de gestion des abonnés et des fonctionnalités téléphoniques est dévolue à un ou plusieurs serveurs hébergeant l'application LAN PBX. Il s’agit généralement d’un serveur entièrement standardisé et exploité sous Linux ou Windows 2000.) entièrement logicielles et dialoguant sur IP avec le reste de l'infrastructure de téléphonie. Elle n'est pas dédiée à la fonction PABX et peut être issue d'un autre constructeur. Cette solution est généralement complétée par des équipements contrôleurs de média en charge de la compression. Les clients peuvent néanmoins vouloir utiliser leurs combinés mobiles. la paquetisation ou le mixage (conférence) des flux voix. Cette infrastructure peut être complétée par des applications (messagerie. L'accès au réseau.Chapitre I : Réseau de nouvelle génération (NGN) et voix sur IP (VoIP) I. serveur vocal interactif. La voix ne transite pas par ce serveur. des routeurs. elle évolue naturellement en fonction de l’évolution du réseau. des équipements de visioconférences. etc. l'intégration d'équipements de téléphonie classique est réalisé par des passerelles intégrées dans des équipements dédiés. etc. vidéos et données.2.. Principaux composants d’architecture VoIP Les principaux composants fonctionnels d’une solution de communication IP sont [4] : La capacité de commutation n'est plus dévolue à la matrice de commutation d'un PABX et s'appuie sur les équipements de réseau local et étendu.4.

3.Chapitre I : Réseau de nouvelle génération (NGN) et voix sur IP (VoIP) I.4.4 : Architecture VoIP Sup’Com 2006/2007 14 . Architecture VoIP Le schéma suivant représente les différents blocs utilisés lors de l’établissement d’une communication IP Figure I.

cela se traduit par le terme duplex.Chapitre I : Réseau de nouvelle génération (NGN) et voix sur IP (VoIP) I. Les paramètres de la voix sur IP Les aspects déterminants pour la qualité de la voix sur un réseau sont le traitement de la voix. bien que différente pour les puristes. ne troublerait pas une personne habituée à 30 images/sec. on remarque. Cette fourchette est. transactions …) ne supporte aucune perte en ligne sous peine de graves conséquences pour l’interprétation et l’utilisation de ces données par l’équipement récepteur. mais c’est un gage d’interactivité et de dialogue.5. la clarté. la qualité d’une image photographique argentique comparée à celle d’un appareil numérique. Qui est d’ailleurs utilisée par le téléphone standard [3].2. Peu importe qu’un paquet arrive avec 100 ms de retard. la quasi-totalité d’un message sonore est compréhensible dans la fourchette 330-3400 Hz. mais en revanche une variation fréquente de 100 ms sur le délai de transit est catastrophique et rend le service inutilisable. l’ouie est plus exigeante. cependant. Le spectre des fréquences perçues par l’oreille humaine s’étale de 100 Hz à 20 KHz. L’écho est le son émis par l’émetteur qui lui revient. de leur paramétrage. ce qui arrive quand deux personnes parlent de leur propre expérience sans s’écouter… I. d’après différentes études. un film dont le rafraîchissement serait 25 images/sec. Une conversation full duplex assure cette interactivité car chaque locuteur peut parler en même temps.4.4.4. De même. Un sens délicat Contrairement à la vue. Le délai de bout en bout est le temps de propagation de la voix à travers le réseau de l’émetteur vers le récepteur.1. En effet.4. mais elle supporte en revanche une dérive importante en termes de durée d’acheminement.4. Ces aspects sont les suivants : Traitement de la voix : lors de l'émission du signal. La clarté et la mesure de fidélité de la voix reçue par rapport à la voix émise. que la marge de manoeuvre est beaucoup plus réduite et une dégradation au-delà de 10% pourrait être néfaste.4. peut être acceptée. Ils dépendent des différents composants de la chaîne de transmission. Couper la parole à quelqu’un ne se fait pas. de l’architecture générale de la chaîne. Caractéristiques de la Voix Le système vocal est complexe et basé sur des ondes sonores de fréquences différentes. messages. la voix est traitée. le délai de bout en bout et l’écho. En termes de transmission numérique. I. La problématique de qualité de la voix sur IP est particulière car la voix attend de son transporteur autre chose que les données. Si l’on se concentre sur l’aspect conversation orale. Sup’Com 2006/2007 15 . avant d'être transmise. à réduire si l’on veut distinguer les fréquences utiles des fréquences audibles. et dans le cas de la VoIP des flux concurrents. c'est-à-dire codée et éventuellement compressée. I. En effet.4. Le comportement attendu pour la voix est exactement inverse : 1% ou 2% de perte de données de voix en ligne ne sont pas trop gênants pour la qualité du service de VoIP. La transmission de données classique (fichiers. La conversation orale : une exigence d’interactivité Une conversation entre deux personnes respecte deux principes : intelligibilité et interactivité.

Les différents échantillonnages Le paramètre d’échantillonnage ou codecs (pour compression / décompression) est structurant en VoIP.726 G. le délai de transit.726 24 20 1 60 G. Les codecs sont répertoriés par leur nom à l’ITU.3 Kbps 5.728 G.728 16 20 25 40 G. I. Les codecs les plus utilisés et leurs vitesses d’échantillonnage sont les suivants [5] : Codecs G.1 : Codecs en fonction de leurs vitesses d’échantillonnage Le choix du codec est un compromis entre la qualité de services souhaités et la capacité de l’infrastructure IP à délivrer une bande passante et des paramètres de QoS qui vont impacter cette qualité.3 Kbps Tableau I.5 20 Sup’Com 2006/2007 16 .Chapitre I : Réseau de nouvelle génération (NGN) et voix sur IP (VoIP) La voix attend donc du transport IP l’inverse de ce qu’exigent les données.1 5.729 G.723. Le paramètre le plus déterminant auquel on s’intéresse pour commencer est la bande passante que l’on met en regard du nombre de communications simultanées à écouler. notamment en ce qui concerne la stabilité du réseau dans le temps.3 30 67.723.3 30 67.711 G. Et cette formulation n’est qu’un raccourci car en fait le transport de la voix exige beaucoup plus : il bénéficiera évidemment de l’intégrité exigée pour le transport des données laquelle est garantie par les réseaux modernes bien qu’il puisse s’en affranchir dans une certaine limite mais exigera beaucoup plus au niveau des autres paramètres.1 6.723. Nous présenterons à la suite les principaux paramètres influents en VoIP.723.5.726 G. la gigue de phase et les pertes de données.1 MPMLQ G. Le codec détermine à quelle vitesse la voix est échantillonnée et dimensionne par la même le flux de données numériques que va générer la transformation d’un échantillon temporel de voix analogique.711 64 20 1 180 G. dans l’ordre les échantillonnages (codecs).4.1.1 ACELP Vitesse d’échantillonnage 64 Kbps 32 Kbps 24 Kbps 16 Kbps 8 Kbps 6.729 8 20 25 20 G.726 32 20 1 80 G. Le tableau suivant permet d’effectuer rapidement le bilan de bande passante en fonction du codec choisi : Echantillonnage (codec) Délai Codec Débit Intervalle volume de données de voix (kbps) échantillonnage échantillonnage par échantillonnage de (ms) (ms) codec (octets) G.5 24 G.

6 32. les commutateurs et les autres composants du réseau et de l’infrastructure de téléphonie IP.7 31.0 87.8 60 30 33 26.9 20 20 50 24.4. Sup’Com 2006/2007 17 .Chapitre I : Réseau de nouvelle génération (NGN) et voix sur IP (VoIP) Calcul de bande passante nécessaire volume de Duré de donnée donnée Nombre Bande Bande s de s de de passante passante voix voix paquet Bande Ethernet Bande Ethernet dans dans passante passante par avec avec RTP RTP second IP/UDP/RT IP/UDP/RT IP/UDP/cRT IP/UDP/cRT (octets) (ms) e P (kbps) P (kbps) P (kbps) P (kbps) 160 20 50 80.2 25.723 (échantillonnage 6. tandis que les compressions G.0 55. Le délai d’échantillonnage est la durée de numérisation de la voix à l’émission puis de conversion en signal voix à la réception. L’ordre de grandeur est de plusieurs dizaines de millisecondes.0 20.2 : Bilan de bande passante en fonction du codec Le choix du codec G. Le délai de transport est la durée passée à traverser les routeurs.8 80 20 50 48.3 ou 5. G.4 11. de l’ordre de quelques millisecondes. I.3 20 30 33 16.723 apportent avec elles des diminutions initiales de la QoS.726.711 (échantillonnage 64 kbps) à plus de 50 ms en G.9 7. Ce temps dépend du type de codec choisi et varie de quelques millisecondes avec le codec G.711 permet de bénéficier à réseau constant de la meilleure qualité de service.6 40.729 et G.3 kbps).6 16.5 12. Ce temps de transit comporte quatre composantes : Le délai d’échantillonnage.2 65. Le délai de transit Le délai de transit (ou end-to-end delay dans la dénomination anglo-saxonne) est un des paramètres critiques influençant fortement la QoS d’un service de voix sur IP.728. Le délai de propagation. Le délai de transport.2 33.5 17.0 31. Le délai de propagation est la durée de transmission en ligne des données numérisées.1 21. C’est le temps que va mettre en moyenne un paquet IP contenant un échantillon de voix pour traverser l’infrastructure entre deux interlocuteurs.0 47.8 60 20 50 40.8 6.8 24 30 33 17. Le délai des buffers de gigue.1 21.2 Bande passant e RTP/IP pour 10 canaux (kbps) 800 480 400 267 240 171 160 Bande passant e RTP/IP pour 32 canaux (kbps) 2560 1536 1280 853 768 546 512 Tableau I.2.2 9. Cette durée est normalement très faible par rapport aux autres composantes du délai de transit. G.5.6 72.

La gigue de phase est indépendante du délai de transit. Il utilise pour cela des numéros de séquence et s’appuie sur UDP. En effet l’écoute humaine s’habituera à une qualité moyenne mais constante et en revanche supportera peu de soudaines dégradations de la QoS. L’ordre de grandeur est de 50 ms.5. Ce dernier permet de transmettre sur IP les paquets de voix en reconstituant les informations même si la couche de transport change l'ordre des paquets.3. à débit constant. La gigue est une conséquence de congestions passagères sur le réseau. La qualité de service reste donc la question centrale de la voix sur IP. Une perte de données régulière mais faible est moins gênante en voix sur IP que des pics de perte de paquets espacés mais élevés.5. Les principaux défauts de la transmission IP sont : Le délai : le délai doit rester inférieur à 400 ms aller-retour pour satisfaire les critères d’interactivité d’une communication téléphonique. En voix sur IP on ne retransmet donc pas les données perdues. ce dernier ne pouvant plus transporter les données de manière constante dans le temps. Cela crée une déformation de la voix ou un hachage.4. Le taux de perte en VoIP est typiquement de quelques pourcents ou dixièmes de pourcent. ceux-ci ne pouvant pas accueillir tous les paquets arrivés en retard. Les contraintes temps réel de délai de transit évoquées plus haut rendent inutile la retransmission des paquets perdus : même retransmis un datagramme RTP arriverait bien trop tard pour être d’une quelconque utilité dans le processus de reconstitution de la voix. peuvent également mettre en œuvre des buffers de gigue. notamment les routeurs. et donc de réduire la gigue de phase. I. est la conséquence du fait que tous les paquets contenant des échantillons de voix ne vont pas traverser le réseau à la même vitesse. ou à une gigue excessive qui va provoquer des rejets de paquet dans les buffers de gigue du récepteur. Ces pertes de données VoIP sont dues aux congestions sur le réseau. La gigue de phase La variation de temps de transit. pour les applications critiques telle que la téléphonie. ce dernier pourrait être constant ce qui préserve la synchronisation du signal entre l’émetteur et le récepteur ou variable ce qui détruit la base de temps du signal et oblige le destinateur de maintenir une mémoire tampon de resynchronisation. Les défauts de la communication IP Il n’est pas facile de transformer un réseau d’échange de données en une architecture de transmission synchrone. I. La valeur de la gigue va de quelques ms à quelques dizaines de ms.4. qui entraînent des rejets de paquets tout au long du réseau. Les éléments d’infrastructure. Sup’Com 2006/2007 18 . La perte de données La transmission de la voix par paquets s’appuie sur le protocole RTP (Real-Time Transport Protocol).4. I. La gigue : c’est la variation de délai.4. ou gigue de phase. Le délai peut être court et la gigue importante ou inversement.Chapitre I : Réseau de nouvelle génération (NGN) et voix sur IP (VoIP) Le délai des buffers de gigue est le retard introduit à la réception en vue de lisser la variation de temps de transit.6.

nous avons présenté les protocoles de signalisation ainsi que la notion de la VoIP d’une façon général. et l’autre plus récent et plutôt hérité du monde Internet. Sup’Com 2006/2007 19 . les principales incertitudes concernent le choix des protocoles. ainsi que la représentation de notion d’application vocale et de principe de langage VoiceXML. I. de leurs architectures et de leurs spécificités. La qualité sonore : le phénomène d’écho devient gênant lorsque le temps d’aller retour du signal dépasse 40 ou 50 ms. présentant une dégradation sensible de cette qualité de service.999% tandis que celle du réseau des données est 80%. Quant à la VoIP le principal challenge pour un tel service est de satisfaire les besoins des utilisateurs. Elles sont nombreuses au moment de la congestion. Cette situation soulève immanquablement la question de l’interopérabilité à court/moyen terme entre solutions implémentant des protocoles différents. l’un plus ancien et plus proche de l’héritage «téléphonie». Dans ce premier chapitre. pour chaque domaine concerné. deux ou plusieurs protocoles sont en général en lice. Conclusion Il ressort de notre première étude qu’au niveau de la couche Contrôle. La fiabilité des équipements : l’industrie des télécommunications est habituée à une fiabilité de cinq chiffres 99. même économique.5. Ces derniers sont en effet habitués à la qualité de service délivrée par les systèmes téléphoniques traditionnels et accepteraient difficilement une solution. En effet.Chapitre I : Réseau de nouvelle génération (NGN) et voix sur IP (VoIP) Les pertes de paquets : elles sont chroniques et font partie de la transmission IP. le chapitre suivant fera l’objet d’une description détaillé des différents protocoles de contrôle d’appel.

Chapitre II : Les protocoles de signalisation de VoIP et le langage VoiceXML Chapitre II Les protocoles de signalisation de VoIP et le langage VoiceXML Sup’Com 2006/2007 20 .

ainsi qu’une étude comparative entre ces différents protocoles. Nous nous intéressons dans une première section de ce chapitre à l’étude de différents protocoles spécifiant par une architecture centralisée et distribuées. Il existe : l’architecture centralisée et l’architecture distribuée Sup’Com 2006/2007 21 . Introduction La signalisation est une des plus importantes fonctions dans l’infrastructure des télécommunications puisqu’elle permet aux composants du réseau de communiquer entre eux pour établir et terminer des appels. La deuxième section fera l’objet de l’étude de langage Voice XML et de la notion d’application vocale. Les protocoles de contrôle d’appel Le VoIP utilise plusieurs protocoles de contrôle d’appel pour l’établissement des communications IP ainsi pour la transmission de flux de données.1. La voix sur IP. par exemple. requiert alors l’utilisation des protocoles de signalisation pour initier et terminer les appels.Chapitre II : Les protocoles de signalisation de VoIP et le langage VoiceXML Chapitre II Les protocoles de signalisation de VoIP et le langage VoiceXML II. II. dont le but est d’établir des canaux de communication vocaux entre utilisateurs.2.

2.1.Media Gateway Control Protocol Définit des protocoles de commande de passerelles de conversion de flux multimédia.1. le protocole MGCP sert à l’échange de messages de signalisation entre un contrôleur de passerelles de médias et des passerelles réparties dans un réseau IP. La gestion est centralisée. La réservation des ressources et la signalisation des communications sont similaires à celle du PSTN. Par exemple. Les terminaux des utilisateurs sont relativement "ignorants". Figure II.) sont "ignorants" et offrent peu ou pas de fonctionnalités propres. Architecture centralisée Ce modèle est fort proche de la philosophie des opérateurs de télécoms traditionnels. etc. Pour l'établissement et la terminaison Sup’Com 2006/2007 22 .1 : Intelligence uniquement auprès des "maîtres" Parmi les protocoles existants pour ce type d'architecture.Chapitre II : Les protocoles de signalisation de VoIP et le langage VoiceXML II. c'est au central téléphonique de l'opérateur (ou le PABX privé) qu'incombe cette tâche. GSM.2. si un abonné désire faire un transfert inconditionnel d'appels vers un autre poste. on retiendra : II. les terminaux utilisateurs (téléphones analogiques. Dans ce mode de fonctionnement.1. MGCP. Les relations au sein d'une architecture centralisée sont souvent qualifiées de "maître/esclave". il sera par exemple impossible pour l'abonné de savoir qui a tenté de le joindre sans faire appel à son opérateur Les caractéristiques d'une telle architecture sont les suivantes: L'intelligence est au sein du réseau. Il considère que l'intelligence et les fonctionnalités sont uniquement localisées au sein du réseau! Ainsi. Peu de possibilités de fonctionnalités sur les terminaux utilisateurs.

Ce protocole est considéré comme la nouvelle génération de MGCP.Chapitre II : Les protocoles de signalisation de VoIP et le langage VoiceXML des sessions. les terminaux utilisateurs offrent en outre de nombreuses fonctionnalités et services. MGCP se sert de signaux et événements. les architectures informatiques sont scindées en de multiples entités afin de déléguer les tâches à accomplir aux systèmes les plus adaptés à leur réalisation: par exemple le DNS pour la localisation de services.2.1. II. Ainsi.2.1. Il utilise une technologie propriétaire qui permet de réaliser des appels locaux ou internationaux seulement à partir d'un ordinateur connecté à Internet. Dans ce modèle.248): c'est le fruit d'une collaboration conjointe entre l'ITUT Study Group16 et l'organisme IETF. Sup’Com 2006/2007 23 . II. C’est une approche reposant sur la séparation de la logique de contrôle des supports multimédia. Cette technologie de signalisation est destinée à initier les communications entre un Media Gateway (MG: le terminal sans intelligence) et un Media Gateway Controller (MGC: le centre névralgique de l'intelligence) au travers d'un réseau de données IP. L'IETF identifie ce protocole comme "MEGACO" alors que l'ITU le référence comme l'H.248 Media Gateway Control (Megaco H. Dans un mode distribué. il peut le faire directement via un terminal qui lui est associé. MEGACO/H. Il n'est donc possible de joindre un utilisateur Net2phone qu'à partir d'un poste Net2phone. sans intervention d'une tierce partie. Net2Phone Net2Phone: c'est un vétéran (1995) et un leader des outils de téléphonie pour PC. Architecture distribuée Le modèle est proche de la philosophie utilisée au sein de l'Internet.248 ((Media Gateway Control Protocol). La standardisation de MGCP a été stoppée pour faire place à MEGACO/H. si un abonné désire utiliser un service de rejet d'appels sélectif. II.2. MGCP met en ouvre un organe central de gestion des appels et s'appuie sur des terminaux simplifiés à l'extrême.3.2.248. Exemple : Media Gateway Controller RTC Media Gateway Flux PCM 64 Kb/s IP Flux RTP Transformation d’une voie téléphonique (RTC) en une voie téléphonique IP. Ce protocole est utilisé pour le CISCO Call Manager et les téléphones IP. II.2. SCCP (Skinny Client Control Protocol) Skinny Client Control Protocol (SCCP): protocole propriétaire développé par CISCO. seuls sont possibles les appels de PC à PC ou d'un PC vers un poste téléphonique traditionnel.2.4. De plus la connexion à l'Internet est indispensable. En effet.1.

Les systèmes sont plus complexes.2. Ce standard est valable pour Sup’Com 2006/2007 24 .Chapitre II : Les protocoles de signalisation de VoIP et le langage VoiceXML Les caractéristiques d'une telle architecture sont: Intelligence distribuée entre les terminaux utilisateurs et les équipements de signalisation disponibles au sein du réseau.2. il est devenu nécessaire de créer des protocoles qui supportent ces nouvelles fonctionnalités. Parmi les protocoles existants pour ce type d'architecture. les PC ou les passerelles VoIP.323 a été conçu par l’ITU-T.323 est l’un d’eux. Les relations au sein d'une architecture distribuée sont souvent qualifiées de "client/serveur".323 Avec le développement du multimédia sur les réseaux. Le protocole H. protocoles et procédures permettant la mise en place d’un service multimédia sur des réseaux à paquets commutés sans garantie de bande passante. Le standard H. telles que la visioconférence : l’envoi de son et de vidéo avec un souci de données temps réel. on retiendra : II. Il permet de faire de la visioconférence sur des réseaux IP. Il fait partie d’une série de recommandations qui décrivent des transmissions multimédia mais sur des réseaux différents. Il spécifie les composants. Les terminaux sont les téléphones IP.2 : Intelligence partagée entre les serveurs et les clients. Les systèmes sont flexibles et il est aisé d'ajouter un nouveau service. Figure II.1. Le protocole H.

323 H. Figure II. tels que H.4) et de codeurs qui ont été définis par l’ITU. les terminaux et les unités de contrôle multipoint MCU. Q.225.245.120 pour la data-conférence et des fonctionnalités de qualité de service. PC) ou de vidéo conférence utilisés pour communiquer en temps réel.2.323. la multiplicité des options rend difficile l’interopérabilité des différents terminaux H. Les terminaux H.323 II. RAS (Registration/Admission/Status) et RTP/RTCP (Real Time Protocol/Control Protocol). Les différents composants de H. elle fournit une traduction entre des formats de transmission aussi bien de signalisation que de flux multimédia.931. Ce sont des systèmes d’audio (Téléphone IP.323. Les passerelles (GW : Gateway) La passerelle ou « Gateway » gère l’interconnexion entre le réseau IP et le réseau téléphonique classique .323 requiert que chaque terminal supporte un certain nombre de fonctions (voir Figure II. Il est constitué par un ensemble de protocoles permettant des communications entre plusieurs entités du réseau. Nous allons décrire par la suite le rôle de chacun de ces équipements [6].323.2. Le Gateway établit et termine les appels aussi bien du côté du réseau IP que du côté du réseau téléphonique.323 Les terminaux sont des clients dans un réseau H. Ces entités sont les Gateways. [7].Chapitre II : Les protocoles de signalisation de VoIP et le langage VoiceXML VoIP car il permet de transmettre uniquement la voix ou un mélange de voix et de données. Le standard H. H.1. Elle peut aussi effectuer le transcodage entre Sup’Com 2006/2007 25 .323 peuvent aussi avoir des fonctionnalités supplémentaires. La figure suivante montre un réseau doté d’équipements basés sur le modèle H. tels que des codeurs audio/vidéo. le protocole T.323 est un protocole de communication englobant un ensemble de normes et composants utilisés pour l’envoi de données audio et vidéo sur Internet et parmi ces composants on retiendra : Les terminaux H. Gatekeeper.1.3 : Topologie d'un réseau VoIP – H. Cependant.

323. fournit un service de contrôle d’appel pour les terminaux H.5 : Diagramme fonctionnel d’un Gatekeeper Sup’Com 2006/2007 26 .323. qui est un équipement optionnel dans un système H. un Gateway ou un autre élément du réseau non-H323.323 sur le réseau IP. Plusieurs Gatekeepers peuvent être présents sur un réseau et communiquer les uns avec les autres. Le Gatekeeper est séparé des autres terminaux. vidéo ou data. Figure II. Une passerelle possède les mêmes fonctionnalités qu’un terminal H. Figure II. et aussi celles d’un terminal téléphonique sur le réseau de téléphonie.Chapitre II : Les protocoles de signalisation de VoIP et le langage VoiceXML les formats audio.4 : Diagramme fonctionnel d’une passerelle Les portiers (GK : Gatekeeper) Le Gatekeeper. cependant il peut être physiquement implémenté avec un terminal.

6 : Diagramme fonctionnel d’une MCU Sup’Com 2006/2007 27 . Contrôle d’admission : Le Gatekeeper autorise l’accès au réseau par les messages H.225. Contrôle de bande passante: Le Gatekeeper peut refuser l’établissement d’un appel pour cause de limitation de bande passante. dédié à la transmission proprement dite. Figure II. affecté à la signalisation. Il se décompose en un Multipoint Controller (MC).225. et un Multipoint Processor (MP). Les unités de contrôle multipoints (MCU) Le « Multipoint Controller Unit » gère les connexions multipoint (ex : appels de conférence).225 (ARQ/ACF/ARJ). Autorisation d’appel: Par l’intermédiaire de la signalisation H. De cette façon. cela permet d’éviter au Gatekeeper de gérer les appels H. Gestion de zone : Le Gatekeeper doit garantir tous les services décrits précédemment pour les terminaux enregistrés. Signalisation de contrôle d’appel: Le Gatekeeper peut choisir de faire la signalisation d’appel avec le terminal par lui-même ou de rediriger le terminal pour qu’il établisse un «canal» de signalisation directement avec l’autre terminal.Chapitre II : Les protocoles de signalisation de VoIP et le langage VoiceXML Le Gatekeeper fournit les services suivants : Traduction d’adresse : Le Gatekeeper fait la traduction de l’alias H. Gestion des appels: Le Gatekeeper peut recenser les appels en cours dans la zone qu’il gère et connaître l’état dans lequel les différents appels se trouvent. Ce contrôle peut être basé sur l’autorisation d’appel.323 en une adresse de transport (adresse IP + port) Cela est effectué grâce à une table qui est rafraîchie par les messages d’enregistrement (Registration message). le Gatekeeper peut accepter ou refuser une demande d’appel émise par un terminal. la bande passante disponible ou d’autres critères fixés par l’administrateur.

II. R. Il utilise le protocole SDP (Session Description Protocol) pour la description des communications média. de l’enseignement à distance. les serveurs Proxy SIP. Le protocole SIP (Session Initial Protocol) Le protocole SIP (session initial Protocol) est développé par le groupe MMUSIC (Multiparty Multimedia Session Control) : Ensemble de standards développés pour le support de conférences Internet multimédia « faiblement contrôlées » pour l’établissement et la supervision de conférences multimédia. peut être comparé à un protocole d’établissement d’appel.2. Ces principales entités sont : les terminaux (User Agent). vidéo et de données à une session multimédia. SIP est indépendant du protocole de transport utilisé.2. de la voix (téléphonie) et de la diffusion multimédia sur IP essentiellement. Serveur de re-direction Proxy SIP SIP Serveur d’enregistrement Serveur de localisation PSTN/ou Mobile Clients SIP Passerelle SIP Figure II. il permet d’associer des supports audio.7 : Topologie d'un réseau VoIP – SIP Sup’Com 2006/2007 28 . Les serveurs SIP intermédiaires peuvent se comporter comme Proxy serveur ou serveur de redirection.2. Le protocole SIP (normalisé par l’IETF.1. L’ouverture de ces sessions permet de réaliser de l’audio ou vidéoconférence.323. Il spécifie plusieurs entités du réseau sur lequel il opère. Topologie de protocole SIP L'architecture de SIP est basée sur des relations client/serveur.F.2. Son rôle est d’ouvrir. les serveurs de redirection. les serveurs d’enregistrement.C 2543) est un protocole de signalisation appartenant à la couche application du modèle OSI et il est apparenté au protocole HTTP.2.2. modifier et libérer les sessions. SIP est rapidement apparu comme une alternative à H.Chapitre II : Les protocoles de signalisation de VoIP et le langage VoiceXML II. les passerelles.

d’un microphone. modifie son entête. Il établit la correspondance entre l’adresse SIP du terminal appelé et la ou les adresses où il pourra effectivement être joignable. Un serveur Proxy peut transmettre une requête.8 : Proxy SIP Alors le Proxy SIP reçoit une requête SIP. la transmet au Proxy suivant ou à l’agent final. ce qui ne serait pas possible avec le protocole UDP. Sup’Com 2006/2007 29 . Il renseigne le champ «via» à chaque fois qu’une requête passe par lui afin que la réponse puisse prendre le même chemin au retour . etc. Les serveurs de redirection Un serveur de redirection répond à une requête SIP « Invite ». Les terminaux peuvent communiquer directement entre eux ou par l'intermédiaire d'autres serveurs. Le serveur redirection n’est pas chargé d’accepter les appels ni d’émettre des requêtes. Un terminal SIP doit disposer d’un agent qui devient client lorsqu’il émet des requêtes et reçoit des réponses (UAC User Agent Client) et par conséquent son partenaire devient serveur (UAS User Agent Serveur) puisqu’il répond à ces requêtes. etc. sans changement. à la destination finale ou éventuellement modifier certains paramètres. Existe en version stateful et stateless suivant qu’il garde ou non des informations au cours des sessions.Chapitre II : Les protocoles de signalisation de VoIP et le langage VoiceXML Les terminaux Les terminaux sont donc des appareils pouvant émettre et recevoir de la signalisation SIP. Il ne fait que répondre aux requêtes émises par des terminaux SIP appelants. d’une carte son. On distingue essentiellement deux types de terminaux : les téléphones ou les PC équipés d’un logiciel adéquat. Les serveurs Proxy SIP Le serveur Proxy joue le rôle de serveur d’un côté (réception de requête) et de client de l’autre (envoi de requête). Figure II. Le Proxy peut aussi dans certains cas être chargé d’effectuer d’autres tâches telles que l’authentification. Il permet l’acheminement des messages SIP. l’autorisation. la gestion des taxes.

Chapitre II : Les protocoles de signalisation de VoIP et le langage VoiceXML
C’est un serveur réalisant une association d’adresses vers une ou plusieurs nouvelles adresses. Un Redirect Server est consulté par l’UAC comme un simple serveur et ne peut émettre de requêtes contrairement au Proxy Server.

Les serveurs d’enregistrement
Un serveur d’enregistrement ou registrar est un serveur qui traite les requêtes « Register » et peut aussi avoir la fonction de Proxy. Sa fonction est de connaître l’endroit où se trouve un usager et de fournir cette information au Proxy et au serveur de redirection. En effet pour pouvoir joindre un usager à partir d’une adresse SIP, il faut faire une correspondance avec une adresse IP qui peut être variable (mobilité IP) : c’est le rôle du registrar.

Les serveurs de localisation (LS)
Il fournit la position courante des utilisateurs dont la communication traverse les RS et PS auxquels il est rattaché : cette fonction est assurée par le service de localisation. II.2.2.2.2. Les messages SIP II.2.2.2.2.1. Les requêtes de base SIP Les requêtes de base SIP appelés encore « méthodes », sont au nombre de six. Ces requêtes de base permettent de localiser, d’adresser un élément du réseau et lui transmettre les informations de signalisation : Invite : Ce message est une demande d’établissement de liaison. Le type de session, l’adresse IP, le port, et le type du codec sont inscrits dans le corps du message. L’envoi d’un message « invite » durant une session existante donne lieu à une réinvitation et est utilisé pour la modification des paramètres de la session actuelle. ACK : Termine la demande de liaison (invite) il est uniquement utilisé pour ceci. Si lors de la demande de liaison le corps du message invite ne contient pas les informations sur le type médias, alors le ACK devra les contenir. Options : Demande à un autre agent ces comptabilités, la réponse contiendra la liste des méthodes qu’il supporte, ces codecs etc. L’agent questionné répondra à ce message comme s’il s’agissait d’une invite. Bye : Termine une communication, l’agent stop l’envoi de paquets de type media (RTP). Cancel : Termine une communication en cour d’établissement. Register : Permet à un agent de s’enregistrer ou de mettre à jour sa localisation et sont URL auprès d’un serveur d’enregistrement, celui-ci pourra à son tour mettre à jour le serveur de localisation, ces données seront utilisées pour la redirection des communications. II.2.2.2.2.2. Les autres requêtes SIP Afin d’étendre les possibilités de SIP des nouvelles méthodes ont été ajoutée, actuellement on peut en compter 8 mais il est vraisemblable que cette liste va s’agrandir au fil du temps : Info : Est utilisé pour transmettre de la signalisation, exemple signaux en provenance du Gateway PSTN.

Sup’Com 2006/2007

30

Chapitre II : Les protocoles de signalisation de VoIP et le langage VoiceXML
Refer : Permet à un agent de demander à un autre agent d’exécuter une requête particulière. Prack : Ce message et une confirmation à un message de réponse temporaire. Comet : Est utilisé pour annoncer à un agent qu’il doit avertir l’utilisateur que certaines conditions (ex. QoS etc.) ont été réunies. Subscribe : Permet de s’inscrire de façons à être informé lors de l’exécution d’un événement donné. Unsubscribe : Annule une inscription préalable. Notify : Est utilisé pour informer les utilisateurs inscrits que un événement a eu lieu. Message : Permet l’envoi d’un message vers un utilisateur, le message qui peut être de type HTML, texte ou autre est transporté dans le corps du message.

II.3. Avantages et Inconvénients H323, SIP et MGCP
Avantages Simple à mettre en œuvre, messages écrits en clair Interopérabilité très bonne Grâce à CPL (Call Processing Language) qui utilise XML, il est très facile d’ajouter des services intelligents de redirection Très bonne possibilité de gestion de la mobilité Utilisé pour la téléphonie 3G (UMTS) Maturité du protocole: Actuellement version 4 pour la définition. Les premières mises en œuvre de V3 commencent juste à apparaître Beaucoup de constructeurs utilisent H.323 Peut supporter autre chose que IP, existe aussi sur ATM Inconvénients Pas encore de grande référence Service supplémentaire de téléphonie inexistant En pleine maturation

SIP

H323

Protocole très complexe, manque d’inter-opérabilité Difficultés avec les Firewall Support des fonctions avancées de la téléphonie. Pas dans l’esprit « Internet »

MGCP

Permet d’utiliser des téléphones « idiots » Indépendant des protocoles de signalisation supérieurs (H.323, SIP) Bien pour les opérateurs voulant faire du RTC-IP-RTC

Pas encore de grande référence Service supplémentaire de téléphonie inexistant En pleine maturation

Tableau II.1 : Avantages et inconvénients des protocoles de signalisations de VoIP [8].

Sup’Com 2006/2007

31

Chapitre II : Les protocoles de signalisation de VoIP et le langage VoiceXML II.4. VoiceXML et application vocale
La notion d' « application vocale » couvre une zone plus vaste dans l'ensemble des applications informatiques. Nous définissons une application vocale comme une application informatique utilisant la parole pour réaliser/accomplir certaines tâches. Dans ce type d'applications, l'utilisateur peut dialoguer avec l'application en utilisant seulement les mots clés, une phrase courte et simple, … ou toute la complexité de la langue Nous présentons dans cette section, tout d’abord, la notion de VoiceXML, ses avantages, ainsi que ses inconvénients. Nous donnons, en conclusion, des remarques importantes qui nous motivent pour faire plus de recherches portant sur le système de dialogue.

II.4.1. Introduction
VoiceXML est le nom d'une norme de technologie proposée initialement par le forum de VoiceXML [9]. Elle est basée sur des veilles technologies telles que VoXML de Motorola et de SpeechML d'IBM, pour créer une nouvelle façon d’interagir avec des applications via une interface vocale, en apportant les avantages de développement du WEB aux applications interactives par la parole. La première version de VoiceXML a été élaborée par AT&T, Lucent Technologies, Motorola, et IBM et approuvée par le W3C en mars 2000. La deuxième version est également apparue avec l’aide des membres du groupe « Voice Browser » du W3C [10]. Au point de vue technique, VoiceXML est considéré comme un langage qui permet d’intégrer aisément la téléphonie et l’Internet. Il s'agit d'un interpréteur (browser) vocal de pages dans une forme dérivée du XML. Un interpréteur de ce type possède une connexion au réseau téléphonique d'un côté, une connexion au réseau Internet de l’autre, des ressources technologiques et un algorithme pour traiter les pages et interagir avec l'utilisateur. Les ressources technologiques couvrent la majorité de technologies vocales, à savoir la synthèse de la parole, la reconnaissance de la parole et l'annulation d'écho. L’objectif principal de VoiceXML est premièrement d’apporter tous les avantages de développement de services Web à des systèmes d’application utilisant la parole pour interagir, et deuxièmement de permettre au développeur de programmer et de gérer des ressources au haut niveau. De plus, VoiceXML vise à satisfaire les besoins suivants : Minimiser les interactions client/serveur en précisant plusieurs interactions par document. Séparer le code d’interaction d’utilisateur (VoiceXML) de la logique (scripts CGI Common Gateway Interface). Favoriser la portabilité de service à travers des plates-formes d’implémentation. VoiceXML est un langage commun pour les fournisseurs de contenu, les fournisseurs d'outil, et les fournisseurs de plates-formes. Etre facile à utiliser pour des interactions simples, mais fournir des possibilités pour supporter des dialogues complexes. Les documents VoiceXML couvrent donc les éléments suivants : sortie pour la synthèse de la parole TTS (Text To Speech), sortie des fichiers sonores, reconnaissance d'entrée parlée, reconnaissance d'entrée DTMF, enregistrement d'entrée parlée, contrôle de dialogue et caractéristiques de téléphonie tels que le transfert et la déconnexion d'appel.

Sup’Com 2006/2007

32

Il permet d'élaborer un scénario d'accueil de l'appelant en intégrant de multiples possibilités : jeu d'un message préenregistré. VoiceXML est un langage de programmation des interactions vocales homme-machine s'appuyant sur l'architecture et les applications du Web. VoiceXML est lui interprété par un "Voice Brower" pour formater le contenu présenté sur votre téléphone. enregistrement d'un message et transmission par e-mail. gestion de plusieurs canaux (e-mail. etc. Il sert à développer des services de communication interactifs. Sup’Com 2006/2007 33 . …) pour formater le contenu présenté sur votre ordinateur. Firefox. II. emploi de la reconnaissance et de la synthèse vocales. Mais quand un document Html est interprété par un "Web Browser" (Internet Explorer. L’objectif initial du langage VoiceXML est de permettre aux personnes disposant d’un simple téléphone d’accéder sous forme vocale aux contenus et services du Web ainsi qu’aux systèmes d’informations des entreprises. reconnaissance des touches tapées sur le clavier téléphonique (DTMF. Définition VoiceXML est un langage de programmation pérenne et portable.4. La détection de mots ou expressions prononcés par l'utilisateur (reconnaissance vocale). fax et Web). ou Dual tone multiple frequency) pour conditionner une interaction. convergents avec Internet. Les principales fonctionnalités de ce langage sont : La diffusion de fichiers audio. Présentation de VoiceXML VoiceXML et HTML sont des langages à balise (‘Markup Language’). Le contrôle de l’appel téléphonique (transfert de l’appel.4.2. SMS. déconnexion de l’appel). La diffusion de parole synthétisée (synthèse vocale). La détection de codes DTMF générés par les touches du clavier du téléphone.Chapitre II : Les protocoles de signalisation de VoIP et le langage VoiceXML II. transfert d'appel. L’enregistrement de la parole de l’utilisateur.3. normalisé par le World Wide Web Consortium (W3C). traitement des appels entrants ou sortants.

Cette plateforme VoiceXML est composée de plusieurs éléments qui sont : VoiceXML pour les interactions entre une application et un utilisateur. Le langage de synthèse vocale (SSML) utilisé pour générer des annonces vocales synthétiques.9 : Modèle d’architecture de VoiceXML Sup’Com 2006/2007 34 .5. L'interprétation sémantique pour la reconnaissance de la parole (SISR) qui définit la syntaxe et la sémantique des balises.9 : Utilisateur Réseaux téléphoniques Infrastructure de téléphone Reconnaissance de la parole Plate-forme d’implémentation Synthèse de la parole Interprète de VoiceXML Application Figure II. Concept de base La technologie VoiceXML apporte les fonctionnalités suivantes : création et gestion de dialogues vocaux utilisant des voix synthétisées. développée en se fondant sur la norme VoiceXML.1. est illustré par la figure II. de la reconnaissance de la parole et des sons DTMF. des sons numérisés. Le contrôle d'appel du navigateur vocal (Voice Browser CCXML) qui gère les appels téléphoniques.4.4. La grammaire de reconnaissance de la parole (SRGS) qui guide la reconnaissance en utilisant la description des réponses possibles de l'utilisateur.4. II.Chapitre II : Les protocoles de signalisation de VoIP et le langage VoiceXML II.4. La réalisation de cet exploit passe par une plate-forme «interface vocale» du W3C. Modèle d’architecture Le modèle d’architecture d’une application vocale.5. Caractéristiques II.

qui peut être prédéfini et fixé dans l’environnement d’exploitation de cette norme. De plus. pourront être réutilisées afin de développer des applications vocales. Facilité de construction : pour une application vocale simple.Chapitre II : Les protocoles de signalisation de VoIP et le langage VoiceXML Dans ce modèle. dans lesquelles l’application garde toujours sa propre initiative. c'est-àdire qu'elle est seulement constituée de mots clés ou de phrases simples. un module de reconnaissance automatique de la parole (ASR – Automatic Speech Recognizer). L’interprète de VoiceXML doit également assurer la coordination de ces actions.4. Inconvénients Les applications à base de la norme VoiceXML ne sont appropriées que dans les cas où les utilisateurs savent ce qu'ils veulent. Sup’Com 2006/2007 35 . Systèmes de dialogue oral homme-machine II. c'est-à-dire que l'utilisateur peut vraiment dialoguer avec elle. la plate-forme d’implémentation a pour but de fournir les primitives dédiées aux événements concernant les actions à la fois d’utilisateur et de système.4. Néanmoins. Avantages La norme VoiceXML présente les avantages suivants : Réutilisation de qualifications : les développeurs à base des technologies de Web s’accordent pour dire que VoiceXML est facile à apprendre. Leurs compétences. un taux de bruit élevé.5. entre l’utilisateur et l’application. mais également des phrases complètes.5. en raison de sa similitude avec d'autres langages de Markup tels que HTML.1. L'interprète de VoiceXML doit traduire les événements spécifiant dans les documents VoiceXML produits par une application en des actions concrètes sur le monde. principalement en langue naturelle) avec l’utilisateur principal via des modalités d’interaction vocale pour accomplir une tâche concrète.6. le dialogue. II. La raison de cette facilité réside aux objectifs posés de cette norme. n’est constitué que par des questions/réponses. ou par simplicité.4. système de dialogue) est un système informatique qui est capable d’interagir naturellement (c’est-à-dire d’une façon qui semble naturelle à l’homme. Principes généraux Un système de dialogue oral homme-machine (désormais SDHM. Elle se compose une infrastructure de téléphonie pour capturer et diffuser les appels téléphoniques. Cela est donc un grand inconvénient pour l’utilisateur quand il veut exprimer ses demandes par des longues phrases à telle application. Portabilité : les applications développées en VoiceXML peuvent fonctionner sur une grande variété de plates-formes et peuvent migrer facilement. qui est le dispositif de transmission le plus omniprésent.3. les limitations. etc. II.4. et un module de synthèse de la parole (TTS – Text To Speech).. sa conception ainsi que son développement peuvent être facilement effectués en se fondant sur des environnements développés de VoiceXML. un système de dialogue est une application vocale mais elle doit être capable de comprendre non seulement les mots clés.6. L'information qu'ils écoutent est courte et au point. II.2. imposées par le téléphone comme un niveau sonore faible. amènent de la faiblesse au module de reconnaissance automatique de la parole. VoiceXML est conçu principalement pour fonctionner avec le téléphone. Evidemment. par exemple pour la génération dynamique du contenu.

l’action du système peut satisfaire ou non les souhaits de l’utilisateur et donc le processus de cognition est exigé afin d’assurer une satisfaction maximale si possible.10 : Architecture générale d’un système de DHM L'objectif principal de notre architecture est de séparer le plus nettement possible les composants d’un SDHM. II. afin que nous puissions les manipuler aisément.Chapitre II : Les protocoles de signalisation de VoIP et le langage VoiceXML Un SDHM doit se comporter en respectant bien les trois processus principaux : perception. Architecture générale En utilisant les principes abordés à la section précédente. Les composants minimaux d’un SDHM doivent se charger des tâches comme la reconnaissance. Evidemment.6. nous visons Sup’Com 2006/2007 36 . la coordination des tours de parole ou bien le contrôle de dialogue et la manipulation de tâches élémentaires ou bien le contrôle de tâche.4.10 : Énoncé oral Énoncé oral Reconnaissance de la parole Synthétiseur de la parole Chaîne orthographique Compréhension sémantique Schéma sémantique Interpréteur pragmatique Actes Contrôleur de la tache Action sur Générateur le monde Contrôleur de dialogue Figure II. Nous détaillons maintenant ces composants dans la section suivante décrite l’architecture générale d’un SDHM. la compréhension. action et cognition. nous proposons une architecture générique dédiée au système de dialogue. En général. Tout ce que le système peut comprendre par sa propre manière formelle conduit directement l’action du système dans son propre monde.2. la synthèse de la parole. La perception est bien évidemment traduite au cours de reconnaissance automatique de la parole et de compréhension des énoncés de l’utilisateur. illustrée par la figure II.

Les défis du système de dialogue oral homme-machine présenté dans la section suivante sont considérés en donnant à cette architecture des facilités de mise en oeuvre. Ces signaux sont transmis au module de reconnaissance automatique de la parole afin de les convertir en une chaîne de caractères de confiance.2.11 : Description d’un module de reconnaissance de la parole Un module de reconnaissance se compose normalement de trois composants principaux illustrés ci-dessus Le premier est pour acquérir le signal sonore de l’énoncé de l’utilisateur et le modéliser sous une forme généralement fréquentielle en gardant des paramètres pertinents.Chapitre II : Les protocoles de signalisation de VoIP et le langage VoiceXML effectivement deux caractéristiques principales : distribué et modulaire. etc. Il permet donc de spécifier le positionnement d'un mot dans l’énoncé de l’utilisateur par différentes techniques de modélisation à base soit de grammaire. le résultat obtenu peut être soit une chaîne textuelle. Il est ensuite nécessaire de mettre en correspondance une suite d’éléments acoustiques avec une forme lexicale en utilisant le composant de modélisation de langage. Pour la même raison. Nous abordons maintenant ces modules en détail : II. soit la combinaison des deux [12].4. Cette chaîne orthographique est transmise immédiatement au module de compréhension sémantique. Selon la demande de chaque application. Notre architecture se compose de sept modules différents. Chaque composant doit être modulaire pour que des changements d’un des autres ne l’affectent pas.1. Le score de confiance est calculé directement à partir des scores acoustiques de chaque mot dans la chaîne de résultat et caractérise donc cette chaîne. Modélisation de langage Parole Acquisition et modélisation du signal n-candidats Reconnaissance acoustique Figure II. soit de statistique. Normalement. La reconnaissance acoustique est effectuée en utilisant normalement la modélisation par modèles de Markov cachés [11] concernant des phonèmes. le module de reconnaissance de la parole peut retourner une liste de n meilleures chaînes orthographiques qui représentent les meilleures candidates reconnues par ordre de ses scores de confiance. Au niveau le plus bas. diphones. Ces paramètres sont utilisés dans le composant de reconnaissance acoustique qui identifie les sons présents dans le signal. le score acoustique d’un mot est effectivement mesuré à partir du score de phonème. Reconnaissance automatique de la parole Les signaux sonores que l’utilisateur prononce arrivent au système et sont capturés par des interfaces spéciales (une carte téléphonique. soit une liste des n meilleures chaînes textuelles. syllabes. Sup’Com 2006/2007 37 .6. ils sont distribués en tirant profit de la puissance de plusieurs machines différentes. une carte de son…).

6.2. au canal de communication. Il doit représenter des tâches. En effet.6. on trouvera l’acte de dialogue du système et des données supplémentaires qui sont tous transférés au module de génération. II.5 Contrôleur de la tâche Le contrôleur de la tâche est un module concernant purement l’application réelle. les présuppositions et les implicatives conventionnelles…en se fondant sur des connaissances de l’historique (acquises par les tours précédents de parole).4. II. à l’environnement. Bien évidemment. Le central transfère tout d’abord le schéma sémantique au module d’Interpréteur pragmatique et attend des actes de dialogue en réponse. contrôleur du dialogue et contrôleur de la tâche.3 Interpréteur pragmatique Le schéma sémantique sorti du module de compréhension arrive ensuite dans un central qui coordonne les modules principaux du système : interprétation.4. L’analyse syntaxique est à base de grammaire formelle. En s’appuyant sur les tours précédents de la parole.2. Cela apporte donc l’indépendance du locuteur à l’application vocale. expressions de désignation.2. de grammaire transformationnelle. il doit également calculer la stratégie appliquée pour générer l’acte (l’action et de même. nous considérons ce module comme une application réelle enrichie par les interfaces Sup’Com 2006/2007 38 . Au point de vue de la conception logicielle. l’acte de dialogue sorti du module d’interpréteur pragmatique est analysé et traité par le contrôleur du dialogue.4. Il doit l’analyser pour produire un schéma sémantique qui symbolise ce que l’utilisateur vient de prononcer au système.). ou de grammaire en chaîne… Plusieurs approches différentes sont également utilisées au cours des analyses sémantiques comme grammaire sémantique [13]. anaphores. actuellement. Etre le pont qui relie la parole et l’action réelle dans le monde. II. des référents de contexte obtenus en interagissant avec le contrôleur de la tâche. Comme pour un humain. etc.2. il doit déterminer le but souhaité par l’utilisateur.6. déictiques.Chapitre II : Les protocoles de signalisation de VoIP et le langage VoiceXML En ce qui concerne la dépendance à l’utilisateur.2 Compréhension sémantique Le module de compréhension sémantique a la charge de caractériser la chaîne de caractères envoyés par le module de reconnaissance de la parole. grammaire de cas [14].4.4 Contrôleur du dialogue Le contrôleur du dialogue assure effectivement un rôle important dans un système de DHM : Coordonner toutes les interactions entre l’utilisateur et le système. Le central retrouve à la sortie de ce module des actes de dialogue qui sont ensuite pris et traités par le module de contrôleur du dialogue. Assurer l’avancement. Ces trois modules peuvent mutuellement interagir afin d’obtenir des données nécessaires pour l’action. la cohérence de dialogue. Afin de bien conduire le dialogue au but posé. la réponse) du système. grammaire fonctionnelle [15]… II. des interactions nécessaires au contrôleur de la tâche peuvent être invoquées au cours de ces calculs pour qu’il puisse avoir suffisamment de connaissances ciblées sur l’action du système. il est certain qu’il y aura des erreurs à ce niveau là : le système (ce module) ne peut tout comprendre ou peut les comprendre de manière différente… La compréhension doit être effectivement effectuée par l’analyse syntaxique et sémantique.6. A la sortie de ce module. Ce module doit résoudre des problèmes concernant la référence (noms propres. il existe plusieurs moteurs de reconnaissance ayant un modèle acoustique déjà adapté aux utilisateurs. des services visés par le système.

fiabilité. II. l’interprétation doit résoudre tous les problèmes pragmatiques… Nous espérons donc que. Les signaux sonores de sortie seront conduits vers les dispositifs visés par le système de dialogue. etc. la stratégie de dialogue. Une autre exigence qu’on ne peut ignorer est l’extensibilité. L’exactitude est une exigence très importante envers le système de dialogue oral homme machine. la compréhension est obligatoirement assurée avec d’excellents résultats.3. avec des progrès dans tous les domaines concernés. La fiabilité réside dans le contrôleur de la tâche si l’on ne compte que les données au niveau de l’application. soit à la concaténation des morceaux préenregistrés. La flexibilité doit être exigée principalement des modules de compréhension et de synthétiseur. mais également au contexte différent (environnement. langue.6 Générateur textuel L’acte de dialogue.) et l’adaptabilité est donc une exigence à envisager dans tous les modules du système. doivent être traitées dans ce module. visées par le système. généré par le contrôleur du dialogue.6. il traduit cet acte en une chaîne de caractères et/ou des actions concrètes qui y sont codés. extensibilité et généricité.2.4. adaptabilité. le système doit s’adapter non seulement aux utilisateurs. II. Ce défi n’est pas encore respecté dans la plupart des systèmes actuels de dialogue qui sont dédiés seulement à des tâches prédéfinies.2. grâce soit à une transcription graphème-phonème des phrases à lire. Sup’Com 2006/2007 39 . Les deux modules qui peuvent réaliser un tel défi sont évidemment l’interprétation et le contrôleur du dialogue s’ils sont génériques. les défis sont: exactitude.7 Synthétiseur de la parole Ce module n’effectue que la conversion d’une chaîne de caractères en des signaux sonores représentant sa prononciation. Elle est manifestée par la cohérence entre un tour de parole (la réponse de la machine.6. II. La synthèse de la parole est alors définie comme la production automatique de la parole. Il contient donc des objets.4. Cela demande donc l’exactitude de tous les modules dans le système : le module de reconnaissance doit bien produire le texte de l’énoncé de l’utilisateur. etc. des connaissances… indispensables au système visé. le téléphone. Elle est manifestée par la cohérence entre un tour de parole (la réponse de la machine doit être adéquate par rapport à la question posée par l’utilisateur) ainsi que la cohérence dans tout le dialogue. des données. Bien évidemment. des données détaillées stockées dans le contrôleur de la tâche… La chaîne de caractères est ensuite transférée au module de la synthèse de la parole. De plus. par exemple les haut-parleurs. toutes ces exigences pourront être satisfaites. flexibilité. Toutes ces informations sont servies à d’autres modules en cas de nécessité via des commandes du central. Défis d’un système de dialogue Avec une telle architecture du système de dialogue oral homme-machine.4. Ici. la génération peut avoir besoin des données supplémentaires comme le but souhaité par l’utilisateur. dans un temps proche. à leurs exigences. Toutes les actions.Chapitre II : Les protocoles de signalisation de VoIP et le langage VoiceXML ente cette application et les composants du système de dialogue. est pris par le module de génération textuelle.6.

323 et SIP. En effet. tous les modules dans un système de dialogue doivent être envisagés sous l’angle de généricité afin d’assurer les exigences mentionnées au dessus. ils tendent tous les deux vers un modèle leur permettant d’intégrer au mieux les nouveaux outils du monde «Internet ». ainsi que la représentation générale de langage VoiceXML et de la notion d’application vocale. II.Chapitre II : Les protocoles de signalisation de VoIP et le langage VoiceXML Le dernier défi qui peut être considéré comme la synthèse de tous les défis précédents : la généricité. Conclusion Bien que les protocoles H. Nous avons essayé dans ce chapitre de donner les différentes caractéristiques des protocoles centralisées et distribuées tels que H. nous essayerons de représenter les différents étapes de l’élaboration de ce projet par une conception objet bien détaillé et aussi l’exploitation de ses différentes caractéristiques des protocoles distribuées déjà étudiés pour développer une application à une réponse vocale interactive qui utilise VoiceXML comme langage de développement.5. Ainsi ces protocoles permettront d’offrir une meilleure adaptation de transmission de la voix sur un réseau « Best effort ».323 et SIP soient issus de contextes très différents. Sup’Com 2006/2007 40 . Dans la suite de ce rapport.

Chapitre III : Conception Objet de l’application Chapitre III Conception Objet de l’application Sup’Com 2006/2007 41 .

Pour ce faire. Cette conception est faite d’une façon globale tout en détaillant quelques exemples de chaque module d’application. Introduction Dans ce chapitre.2.1.1 : Serveurs vocaux de nouvelle génération Sup’Com 2006/2007 42 . Cadre générale de l’application Figure III. c’est l’étude théorique par l’élaboration de quelque diagramme UML qui vont être implantés à l’aide de l’AGL : Rational Rose. en premier lieu c’est le formalisme et la représentation de l’application qui sera évoqué et en second lieu. une conception de l’application va être bien détaillée.Chapitre III : Conception Objet de l’application Chapitre III Conception objet de l’application III. III.

1. Description Cette application consiste à développer des IVRs (Interactive Voice Response) sur une Plate forme d’interprétation Voice XML (TTS & ASR).2 : Fonctionnement d’une application VoiceXML Sup’Com 2006/2007 43 .2. l’appelant compose un numéro court. Et ainsi le message «bonjour» est diffusé à l’appelant.2. Une réponse en page VXML est envoyée au serveur vocal qui va permettre un rendu sonore. Cette Plate forme d’interprétation Voice XML peut être assemblée à un serveur Astérisk PBX. Exemple de fonctionnement d’une application VoiceXML Dans cet exemple.1). ainsi que la compréhension de principe d’interprétation vocale. qui sont eux même connectés à la Plate forme (voir Figure III. peuvent se connecter à la Plate forme VoiceXML soit par l’intermédiaire d’un serveur Astérisk. Une requête est envoyée au serveur d’applications. L’appel est envoyé à l’interpréteur VoiceXML. les différents types des clients: PSTN. Figure III. ici le 642. ensuite l’ajout d’autres modules est nécessaire pour que l’interprétation soit possible. les tester à distance par l’utilisation des Softphones VoIP. Alors. Le but des ces IVRs est de former un site web sportif à informations vocales. III. soit par l’utilisation des autres serveurs web.2.Chapitre III : Conception Objet de l’application III. Le fonctionnement est le suivant (voir figure ci-dessous): Un client appelle un numéro spécifique. cellulaires et Internet.

3. diagramme de déploiement. Avec : Type de diagramme DCU DCL DOB DET DAC DES DCO DCP DDP Spécification diagramme des cas d’utilisation diagramme de classes.3. Formalisme UML UML propose de décrire un système à l’aide de neuf diagrammes. Cette présentation des liens peut aussi constituer une aide dans la démarche d’élaboration de ces diagrammes.Chapitre III : Conception Objet de l’application III. La figure suivante propose une représentation d’ensemble du positionnement relatif des neuf diagrammes d’UML. diagramme d’objets. Etude théorique III. diagramme état-transition diagramme d’activités. diagramme de séquence. Sup’Com 2006/2007 44 . diagramme de collaboration.3 : Positionnement des neuf diagrammes d’UML. Chacun de ces diagrammes correspond soit à la description d’une partie du système soit à la description du système selon un point de vue particulier. diagramme de composants. Figure III.1.

une classe. Diagramme de collaboration : DCO Les diagrammes de collaborations se sont des diagrammes qui montrant les interactions entre objets (instances de classes et acteurs).3. Un cas d'utilisation indique une fonctionnalité du système déclenchée par un acteur externe au système. III.3.3. III.Chapitre III : Conception Objet de l’application Tableau III. Diagramme de séquence : DES Le diagramme de séquence permet d’appréhender plus facilement la succession des actions dans le temps et les contraintes temporelles des interactions entre les objets.3. Ce genre de diagramme permet de mettre en place et de comprendre les besoins du client.1. (Concernant le site sportif) Vu la diversité des acteurs et des fonctions. Un diagramme de séquence peut décrire un paquetage.2. Diagramme des cas d’utilisation : DCU Les cas d’utilisation décrivent le comportement du système du point de vue utilisateur sous la forme d'actions et de réactions. une opération ou une instance. interviennent trois éléments : les acteurs. L'acteur représente un rôle joué par une personne ou un autre système qui interagit avec le système en cours de modélisation.1.3. III.2.3. car on peut y préciser les états des objets qui interagissent.4. un cas d’utilisation. Identification et Représentation des cas d’utilisation Les fonctions du système sont identifiées en recherchant ces cas d’utilisation qui seront mis en oeuvre par les différents acteurs. III.1. Il s'agit de la représentation des interactions entre les objets selon un point de vue temporel. ils seront classifiés de façon que ceux fonctionnent pour l’un des quatre modules suivant : Identification Inscription Choix d’équipe Conception de site Sup’Com 2006/2007 45 . DAC. Dans ce diagramme. le système et les cas d'utilisation.1.1. UML représente le cas d'utilisation par un ovale. Ils permettent de représenter le contexte d'une interaction.1 : Diagramme UML La conception de l’application qui nous incombe est limitée à quatre diagrammes : DCU. Diagramme d’activité : DAC Un diagramme d'activité ne modélise pas en général l’exact comportement interne d'un programme (comme le fait le diagramme de séquences) mais montre plutôt les traitements et les étapes généraux à un haut niveau d'abstraction. Les activités sont généralement réalisées par un ou plusieurs cas d'utilisation : l'activité décrit le traitement qui doit être entrepris et le cas d'utilisation la façon dont un acteur utilisera le système pour accomplir tout ou partie de l'activité. DCO et DES puisqu’ils permettent de mettre en évidence les fonctionnalités à implanter. III.

Sup’Com 2006/2007 46 . le client devra connu par certains champs exacts tels que « Login ».3.2. mais avant tout il faut faire une sélection de leurs propre type de sport adorable parmi les types disponibles sur le site.Chapitre III : Conception Objet de l’application III. « Password »… III. Cas d’utilisation d’identification Figure III.3.2. III. Choix d’équipe Après le test de vérification d’un certains champs et que l’accès au service a été autorisé.2.2.3. Cas d’utilisation d’inscription Figure III.4 : Cas d’utilisation d’inscription Dans ce cas le client « utilisateur » doit être connecté à une base de donnés ensuite le remplissage d’un formulaire bien défini.1. le client passe à l’étape de sélection de leur League préféré ainsi que la sélection de leurs équipe favorable.5 : Cas d’utilisation d’identification Comme le cas d’inscription le client « utilisateur » doit être connecté à une base de données pour passer un test d’accès à un service bien déterminé suite à une vérification des certains champs qui a été remplié dans le formulaire d’inscription.3.

Conception de site Ce cas d’utilisation est la généralisation des autres cas.2. l’identification et les sélections.4.Chapitre III : Conception Objet de l’application Figure III.3.7 : Cas d’utilisation de sélection d’équipe préféré Footballeuse III.6: Cas d’utilisation de sélection d’équipe préféré Handballeuse FigureIII. Sup’Com 2006/2007 47 . il englobe toutes les fonctionnalités déjà prédéfinies comme l’inscription.

3. Diagramme de collaboration : (Typical Configuration with VoiceXML & SIP) Ce diagramme défini les relations entre les trois modules suivants : Signalisation et contrôle d’appel (ce module qu’est le responsable de la signalisation et de la réalisation des connexions aux préalables) Interactions voix (dans ce module on trouve l’analyseur de Voice XML ainsi que la pile SIP de signalisation). Sup’Com 2006/2007 48 .3.Chapitre III : Conception Objet de l’application Figure III. Affaires et commerce logiques (ce module est un serveur web ou il y a les pages JSP (Java server page) ainsi que les appels des services « callback »).8 : Cas d’utilisation de conception de site III.

Diagramme d’activité Start Inbound call Dial Callee Callee Answers Please enter phone number you want to reach.3. Inc.10 : Diagramme d’activité Sup’Com 2006/2007 49 . III.4.Chapitre III : Conception Objet de l’application Signalisation et contrôle d’appel Interactions Voix Affaires et Commerces Logiques Figure III. Put caller on hold Do you want to accept the call? No Phone is X. correct? Yes Play hold music Yes Join Caller and Callee Accepted ? No Put Caller to Voice Mail Fin Figure III.9 : Diagramme de collaboration Avec RMI : Redman MicroConnections.

3.3. ainsi que les différents cas possible au cours de cet appel. Sup’Com 2006/2007 50 . III. Diagramme de séquence III. De l’appellent jusqu'à l’appelé Ce diagramme est la schématisation de scénario total d’enchaînement d’appel VoIP qui utilise SIP comme protocole de communication.Chapitre III : Conception Objet de l’application Ce diagramme d’activité présente le scénario d’établissement d’un appel par un client VoIP.1.5.5.

Chapitre III : Conception Objet de l’application Sup’Com 2006/2007 51 .

Chapitre III : Conception Objet de l’application Figure III.11 : Diagramme de séquence (appellent à appelé) III. Sup’Com 2006/2007 52 .3. Demande d’inscription Figure III.12 : Diagramme de séquence (inscription) Les conditions de la saisie de « Login » et de mot de passe sont définies dans le formulaire d’inscription au départ.2.5.

Déroulement de l’application : (conception d’un site sportif) Ce diagramme de séquence décrive l’enchaînement global de fonctionnement de site sportif. l’accès au client VoIP tel que (X-Lite. Sup’Com 2006/2007 53 .5.5.. l’accès au service.4.13 : Diagramme de séquence (identification) L’authentification est la vérification des quelques champs déjà saisis lors de l’étape d’inscription. Skype ou FWD). Cycle d’authentification Figure III.3.3. III.Chapitre III : Conception Objet de l’application III. le choix des types d’infos à écouter. la numérotation….3. l’authentification.

14 : Diagramme de séquence (conception de site) Sup’Com 2006/2007 54 .Chapitre III : Conception Objet de l’application Figure III.

4. Sup’Com 2006/2007 55 . l’explication et la mise en œuvre de point de vue expérimentale. la formulation théorique a été lieu par la présentation et la détermination de quelques diagramme UML qui sont réaliser par Rationel Rose. Conclusion Nous avons présenté dans ce chapitre une vue globale. Nous abordons par la suite le dernier chapitre ou il y a la réalisation de notre application.Chapitre III : Conception Objet de l’application III. générale sur l’application à réalisé qui va être traité dans le chapitre suivant.

Chapitre IV : Réalisation Chapitre IV Réalisation Sup’Com 2006/2007 56 .

la configuration des différents modules et fichiers. comment le tester ?… En deuxième point. Vue global sur Voxeo Les principales caractéristiques fournies par Voxeo sont : Réponse interactive et identifications de voix. nous abordons en premier lieu. la présentation de la Plate forme Voxeo. FWD VoIP… IV.1. Sup’Com 2006/2007 57 .com IV.Chapitre IV : Réalisation Chapitre IV Réalisation IV.2. ainsi que son utilisation comme un outil de développement des applications vocales. Plate forme Voxeo pour VoiceXML C’est une Plate forme libre (Free) sur le web sous le site suivant : http://community. leur relation avec VoiceXML aussi que leurs réponses à un appel SIP entrant.voxeo. Introduction Dans ce chapitre. comment réaliser une application VoiceXML? . Skype VoIP.2. nous décrivons la réalisation d’un site sportif (réaliser moyennant Voxeo) dont le but est de fournir des informations vocales sportives aux clients par l’utilisation des numéros spécifiques qui ont des relations directes avec des soft phones tels que X-Lite (SIP VoIP). Skype ou SIP VoIP. Accès aux applications via le logiciel FreeWorldDialup (FWD).1. Voxeo fournit une plate-forme gratuite de développement avec ressources et appui technique. Et en dernier point. nous expliquons les différentes étapes ainsi que la méthode des réalisations des IVRs sur l’Asterisk PBX.

2.Chapitre IV : Réalisation Figure IV.1 : Plate forme Voxeo IV.2) : Les Terminales (1) Les Gateways (2) Les Softswitch et Directory (3) Les Serveurs VoiceXML (4) Les Serveurs Web (5) Figure IV. Les équipements qui constituent les IVRs comme matériels sont les suivants :(voir figure IV.2.2 : Composants des IVRs Sup’Com 2006/2007 58 . L'IVR est une technologie permettant une interaction entre un téléphone et une base de données afin d'obtenir des informations ou de générer des actions en pressant des touches sur le téléphone. IVR (Interactive Voice Response) Un IVR est un système de réponse automatique personnalisable proposant à l’appelant une liste de services.

3 : Directeur d'application de Voxeo. l’ouverture d’un fichier VoiceXML à partir d’un web browser ne s’accompagne pas par une réponse de voix. L’utilisation d’un VoiceXML Browser est nécessaire pour l’interprétation vocale. mais pour l'essai. ² Figure IV.3.Chapitre IV : Réalisation IV. Pour examiner une application VoiceXML à partir d'un téléphone.4 : Attribution d’un numéro de téléphone à un fichier VXML. Il y a d'abondance des approches de haut-dollar pour tracer des nombres aux applications VoiceXML. Figure IV. le développement de Voxeo offres un grand service d’attribution des numéros. nous avons besoin d’un nombre pour l’appeler. Sup’Com 2006/2007 59 . mettre en scène.2. Réalisation d’une application VoiceXML À la différence des applications traditionnelles d'enchaînement.

si non un message d’erreur est envoyé. Figure IV. aussi bien qu'un nom pour l’application (Voir figure IV. on commence par choisir « Create Application ».5). on fournit l’URL du fichier VXML.0 en tant que notre plateforme de développement.4 et figure IV. Puis. puis sélectionner VoiceXML 2. Sup’Com 2006/2007 60 . un message « Application Successufully Added » apparaît.5 : Attribution de fichier VXML est réussi Si l’application a été correctement ajoutée.Chapitre IV : Réalisation Pour créer une application VoiceXML à partir de la Plate forme Voxeo.

L’étape 1 consiste a composé le numéro « **86919990107208 » sur le terminal puis l’étape 2 permet la jointure de service.Chapitre IV : Réalisation Figure IV. la figure IV. soit par FWD ou un client SIP VoIP. 2 1 Figure IV.6 : Les différents points d'accès au fichier VXML.7 explique l’utilisation de l’FWD comme un Soft phone VoIP pour l’obtention de la voix. Sup’Com 2006/2007 61 .6 montre les différentes méthodes d’accès à une application VoiceXML par la fourniture des numéros spéciaux. suite à une opération de numérotation. le fichier VXML sera interprété et la conversation données voix va être réussie. La figure IV. L’accès à une application VoiceXML se fait soit par l’utilisation de Skype.7 : Apple d’une application VoiceXML par FWD Suite à l’instruction précédente. Ainsi.

Sup’Com 2006/2007 62 .8 : Interface de programmation VXML Figure IV.Chapitre IV : Réalisation Figure IV.9 : Exemple d’un fichier VXML.

de la génération d'enregistrement d'appels pour l'intégration avec des systèmes de facturation. IV. des mails vocaux. Figure IV. H323. nous présentons. etc. Sup’Com 2006/2007 63 . ADSI.Chapitre IV : Réalisation Au moment de clic sur « view ». si le fichier VXML est correct.3.9...10 : Détection des erreurs pour un fichier VXML. Asterisk PBX Asterisk est un PBX applicatif open source permettant d'interconnecter en temps réel des réseaux de voix sur IP via plusieurs protocoles (SIP. de la musique d'attente. il va être affiché sous la forme de la Figure IV. Après avoir parler de la Plate forme Voxeo et de la façon de réaliser une application VoiceXML. les erreurs vont être affichées comme l’indique la Figure IV. des répondeurs interactifs. de la mise en attente d'appels. par contre s’il est mal formé. l’Asterisk PBX puis nous décrivons la réalisation d’un site web à une information vocale concernant le sport. MGCP) et des réseaux de téléphonies classiques via des cartes d'interface téléphonique et tout ceci à moindre coût.(Comme la montre la figure ci-dessous). dans la suite de ce chapitre. Asterisk offre toutes les fonctions d'un PBX et ses services associés comme de la conférence téléphonique.10.

Wait (3) 1225. la configuration de protocole SIP ainsi que le principe d’interprétation VoiceXML. IAX Réseau ethernet PC avec un logiciel VoIP Asterisk PBX Réseau ethernet Adaptateur pour téléphone analogique (ATA) Téléphone IP Téléphone Analogique Figure IV.11 : Interconnexion d’Asterisk PBX Dans la suite nous présentons les méthodes de fonctionnement de l’Asterisk avec le langage VoiceXML. Configuration de service Voice XML sur l’Asterisk Pour configurer le service VoiceXML sur l'Astérisque. SIP. Ensuite. IV. il faut ajouter les nouvelles extensions au fichier de configurations (/etc/asterisk/extensions. les IVRs (Interactive Voice Response) sont basés dans notre application sur le langage de développement Voice XML. il suffit juste d’ouvrir le fichier de configuration « extensions. Interprétation d’un fichier VXML par l’Asterisk Parmi les services offerts par l’Asterisk PBX. Ce module contient les TTS « Text To Speech » et l’ASR « Automatic Speech Recognizer » qui sont nécessaires à cette opération.conf Après l’installation de fichier VXML.Hangup Sup’Com 2006/2007 64 .1. VoiceXML Browser » à l’Asterisk est nécessaire pour permettre l’interprétation vocale.2.3.3.2.4. par exemple sous le répertoire /tmp. Mais pour que ce service soit disponible. nous expliquons comment par l’utilisation d’un client SIP VoIP (X-Lite). H323. exten exten exten exten => => => => 1225.Chapitre IV : Réalisation Réseau ethernet Réseau téléphonique VoIP.3.Vxml(file:///tmp/sport.conf » et le modifier.conf) de l’Asterisk. IV. on peut écouter de la voix interpréter par le PBX.vxml) 1225.Answer 1225. l’ajout du module « OpenVXI.1. # cd /etc/asterisk # vi extensions.

Déroulement d’appel au niveau d’Asterisk IV.conf : permet la configuration du numérotation et l’attribution des fichiers VXMLs correspondants.conf : pour la configuration de protocole SIP.3.conf : pour la configuration de service VoiceXML.conf : pour la configuration des canaux des communications. Ensuite.1. Vxml.3. L’interprétation de fichier VXML va être réalisé automatiquement par la composition du cet numéro au client SIP VoIP. Zapata. Festival.12 : Les fichiers de configurations pour Asterisk Sup’Com 2006/2007 65 .Chapitre IV : Réalisation Le numéro 1225 est un numéro arbitraire de configuration attribué à l’application VoiceXML « sport.12) : Sip.3. Figure IV.conf : pour configurer le serveur TTS (Text-To-Speech).vxml ». il faut assurer le rechargement des prolongements dans l'Astérisque par l’utilisation de la commande : CLI*> extensions reload Et en fin l’appelle du service : SIP:1225@<your server IP address> IV.3. Extensions. Fichiers de configuration d’Asterisk Les fichiers de configuration d’Asterisk sont les suivant (voir figure IV.

Sup’Com 2006/2007 66 .13 : Extensions. la déclaration des paramètres d’interprétation.conf ».14 : VoiceXML Configuration Au niveau du fichier de configuration de VoiceXML « vxml. l’utilisation de vidéo et leurs paramètres ainsi que l’enregistrement de la licence pour VoiceXML Browser « OpenVXI ».conf Au niveau de fichier « extensions. est nécessaire.conf ». Figure IV. tels que la définition de type d’audio (wavecodec qu’il peut être «gsm» ou «pcm»).Chapitre IV : Réalisation Figure IV. il faut définir le scénario d’appel qui sera exécuté par l’Asterisk.

Sup’Com 2006/2007 67 . (tels que : Username.cfg » au niveau de « MIME type » : configuration de codec utilisé pour l’audio « audio/x-wav » à une fréquence d’échantillonnage de 8 kHz et une segmentation à 10 millisecondes par frames (80 échantillons par frame).cfg » option « Text To Speech » pour que la conversation données voix soit disponible. ainsi que l’installation de Festival « Flite » qui permet cette option. Paramétrage de Soft phone VoIP (X-Lite) Le paramétrage des Softphones VoIP est nécessaire pour qu’ils puissent être connectés au serveur Asterisk.3. Display Name.3.conf. IV. permet de définir et de déclarer les clients SIP qui auront à la suite la possibilité de connexion à l’Asterisk.cacheTotalSizeMB : configuration de l’accès à Internet par l’utilisation du protocole http ainsi que la détermination de la valeur de la « cache » suffisante.15 : SIP Configuration Le fichier « sip.3. IV.3. Dans client. Les paramètres saisis au niveau de compte SIP du Softphone sont effectivement définis lors de la configuration du fichier : sip.3. Fichiers de configuration de VoiceXML Browser Les configurations réalisées au niveau de VoiceXML Browser sont : Dans « client. Password…).inet. Configuration du serveur web s’il est nécessaire (souvent utilisé pour les communications vidéos).2.conf ».Chapitre IV : Réalisation Figure IV. Modification des paramètres dans « client.

conf).17 : X-Lite (Softphone VoIP) (b) Sup’Com 2006/2007 68 .16 : Paramétrage de Softphone.Chapitre IV : Réalisation Figure IV. (a) Figure IV. En utilisant un client SIP VoIP (X-Lite) paramétré et suite à une composition d’un numéro prédéfinie lors du fichier de configurations d’Asterisk (extensions. les applications VoiceXML vont être disponibles et toute personne connectée au serveur peut appeler un service déterminé.

3. Réponse d’Asterisk à un appel entrant Figure IV. signifie que l’opération d’appel est débutée.17-(a) est la composition du numéro « 1225 » au Softphone X-Lite.Chapitre IV : Réalisation La figure IV. tel que l’ouverture d’un fichier VXML ainsi que leur interprétation… Autrement dit l’Asterisk exécute les étapes déjà définie lors de la configuration de « extensions. Sup’Com 2006/2007 69 . la figure IV.18 : Réponse d’Asterisk pour l’appel 1225 La figure IV.conf » qui sont associé au numéro d’appel.17-(b) est l’établissement d’appel IP avec le serveur Asterisk.3.18 présente les différents étapes d’exécutions faite par l’Asterisk suivant à un appel SIP entrant « 1225 ». IV.4.

java (utilisation d’API Swing et Applet) et java script. comme « login incorrect » ou « mot de passe incorrect »… Sup’Com 2006/2007 70 . Et dans le cas où qu’il n’est pas inscrit.19 : Ouverture de site Après l’ouverture de site. Figure IV. Figure IV. Site Sportif : (réaliser moyennant Plate forme Voxeo) Ce site est réalisé moyennant le langage html.20 : Identification ou inscription Lors de l’étape de validation des champs d’identifications.4. le client doit remplir les champs d’identifications nécessaires pour passer à la page suivante. des messages d’alertes apparaissent dans le cas où un certain champ est erroné.Chapitre IV : Réalisation IV. il faut passer à la page d’inscription pour remplir un formulaire d’inscription.

22 : Les messages d’alertes. le client est demandé de remplir un formulaire qui contient des champs nécessaires à saisir et d’autres champs facultatifs. Figure IV.21 : Page d’inscription Dans la page d’inscription. Cette figure présente l’ensemble des messages d’alertes possibles correspondants à l’étape d’identification ou d’inscription. Sup’Com 2006/2007 71 . les messages d’alertes surgissent.Chapitre IV : Réalisation Figure IV. De même dans le cas de mal établissement d’un champ.

Figure IV. Sup’Com 2006/2007 72 .Chapitre IV : Réalisation Figure IV.24 : Page service football : choix d’une League disponible Après la sélection de type de service sportif. aussi une sélection de son équipe admirable (Arsenal). le client fait un choix de sa League préférée (FA Premier League Anglaise).23 : Choix du type de service sportif Le client doit choisir son propre service sportif disponible sur la page tel que Football pour qu’il puisse passer à la page suivante.

Chapitre IV : Réalisation Figue IV. la page correspondante est affichée. comme la montre la figure ci-dessous.26 : Page d’équipe Arsenal Sup’Com 2006/2007 73 . Figure IV.25 : Choix d’équipe : Page de la League anglaise Au moment du click sur le nom de l’équipe.

exécute l’un des Soft phones disponibles pour établir l’opération de numérotation. Sup’Com 2006/2007 74 . à cette étape. le client.27 : Exécution de Skype VoIP Suite à l’ouverture de la page d’équipe choisie.28 : Démarrage de Skype Le démarrage des Soft phones est réalisé automatiquement suite au click sur le bouton « exécuter ». Figure IV.Chapitre IV : Réalisation Figure IV.

Numérotation Figure IV. le client fait l’opération de numérotation qui consiste à taper le numéro de correspondance déjà définie dans la page (voir la figure cidessous).Chapitre IV : Réalisation Suite à la phase de démarrage de Soft phone VoIP. Figure IV. cette page lui permet d’en télécharger un directement en le sélectionnant à partir de la liste de la figure IV.29 : Numérotation de Skype.30 puis en cliquant sur le bouton suivant.30 : Liens de téléchargement des Softphone VoIP Sup’Com 2006/2007 75 . Dans le cas où le client n’a pas l’un des ces Softphones.

l’explication de leur configuration à faire ainsi que leur relation avec « Voice Browser VXI» l’interpréteur de langage VoiceXML.5. Sup’Com 2006/2007 76 . ainsi que la conversation données voix est établie.Chapitre IV : Réalisation IV. la façon de réaliser et de manipuler des applications vocales utilisant le langage VoiceXML ainsi que leurs méthodes de teste offerte (numérotation et différentes accès aux Soft phones VoIP). un outil de développement des applications vocales : la Plate forme Voxeo. Enfin nous avons présenté un site sportif qui permet à travers l’utilisation des Soft phones VoIP et on a montré suite à une opération de numérotation l’interprétation VoiceXML va être réussie. Conclusion Dans ce chapitre nous avons présenté au premier lieu. En deuxième point nous avons réalisé aussi des applications vocales sur l’Asterisk PBX.

Chaque solution envisagée répond à un besoin ou un service spécifique. nous nous sommes intéressés à l’étude des protocoles de la couche contrôle à savoir les protocoles H. La multiplication des protocoles de signalisation pour des applications de voix par exemple. les éléments qui les composent et les différents protocoles concurrents. Nous avons présenté dans un premier volet de cette mémoire les réseaux de nouvelle génération (NGN) : leurs architectures. Afin de réaliser une application vocale interactive nous avons eu recours à l’utilisation des outils qui utilisent VoiceXML comme langage de développement tels que la plate forme Voxeo ou encore l’assemblage de VoiceXML Browser « OpenVXI » à l’Asterisk PBX. c’est dans le cadre de ce thème que s’oriente l’objectif de notre projet de fin d’étude. nous avons décrit en détail une architecture générale dédiée au système de dialogue avec sept modules principaux. Ensuite. Par la suite. Nous avons abordé en deuxième volet le dialogue oral homme-machine ainsi que ses propriétés.Conclusion générale et perspective Conclusion générale et perspectives L’évolution des réseaux vers un réseau unique multiservices a nécessité l’élaboration de nombreux protocoles de signalisation par les communautés de recherche. En effet. leurs utilisations par des différents services tel que les réponses vocale interactives « IVRs ».conf ». Installation de l’OpenVXI : VoiceXML Browser. L’apparition de la norme VoiceXML apporte vraiment des avantages pour construire des applications vocales simples mais nos analyses montrent qu’il ne répond pas encore aux exigences de l’utilisateur en raison de ses caractéristiques intrinsèques.323 et SIP. En plus toutes les configurations déjà expliquer au niveau de chapitre IV tels que « extensions. Pour que l’interprétation des applications vocales réalisées par VoiceXML soit disponible à travers l’Asterisk PBX plusieurs étapes ont été établies : Installation de l’Asterisk PBX (sur RedHat Entrprise Server 4). « sip. de son objectif… A partir de cela.conf » … Sup’Com 2006/2007 77 . La séparation de fonctionnalités de chaque module permet effectivement de le mettre en oeuvre de manière distribuée un système de dialogue. Configuration de VoiceXML Browser. nous avons donné la définition d’un système de dialogue oral homme-machine afin d’avoir une vue sur une application vocale générale.

il convient de remarquer que : Actuellement. Mais il faut aussi considérer les problématiques suivantes au système de dialogue homme-machine : Sous l’angle du génie logiciel. Alors des philosophes et psychologues ont proposé beaucoup de théories importantes. afin de surmonter de tels problèmes. Il est certain que le contrôleur du dialogue doit posséder des mécanismes adéquats. la recherche portant sur le dialogue oral homme-machine s’efforce de plus en plus de modéliser la capacité de communication humaine dans la machine.Conclusion générale et perspective Néanmoins. de manière à l’adapter à un ensemble de systèmes différents. Il nécessite en pratique une infrastructure ayant des bonnes primitives. La capacité de négociation d’un système de dialogue est également une demande à considérer. ce travail est achevé. c’est-à-dire à diminuer de plus en plus la distance entre un dialogue humain et un dialogue homme-machine. Le but ultime de ces travaux vise à améliorer l’efficacité du système de dialogue au point de vue dialogique. jouant un rôle déterminant dans l’apparition des modèles de dialogue. des malentendus…). le système de dialogue est un système d’interaction. La défaillance d’efficacité d’un système de dialogue réside véritablement dans la sensibilité à de telles erreurs (les modules de compréhension et d’interprétation ne peuvent envisager tous les contextes et peuvent donc provoquer des incompréhensions. L’exigence d’un gestionnaire efficace dans un système de dialogue mobilise la recherche sur des modèles de dialogue. Sup’Com 2006/2007 78 .

art-telecom. M. http:// www. The case for case.com/voip/h323_vs_sip/ [9] http://www.w3.pp 1639-1642. http://www. in Universals in Linguitic Theory. économique et réglementaire de l’évolution vers les réseaux de nouvelle génération. no. 14. Juang B. 2. outils puissants pour interroger les base de données en langage naturel ».com/ [10] http://www. vol. ISBN 0-262-02158-7.art-telecom. vol.Bresnan. 01/03/2006 Telindus Arche. pp.. WHI/IPCOM. Etienne Turpin... [4] Communications IP.html [3] Téléphonie sur Internet : Quelle respective ? Patrice Collet.pdf [7] Réseaux IP . Sup’Com 2006/2007 79 . 1982. Michel Dudet. Par Laurent Auzély.Voix et multimédia sur IP Antoine Delley. MIT Press. 1980. http://www. Livre Blanc. R. ICTnet.org/ngnsep02.fr/fileadmin/reprise/publications/ngnsept02. [15] J. directeur ICTnet http:// www. www. [13] A. 137-148. “The mental representation of grammatical relations”.ch [8] SIP vs H.accellent-group. Mahajan. 257-285. 1989.com [6] Etude technique. pp. Accellent http://www. 1-90.packetizer. Proceedings of the IEEE.Bibliographie Bibliographie [1] Rapport de l’ETSI-NGN Starter Groupe.323 a Comparison of Call Functionality.J Fillmore. [12] Y. VoIP. Olivier Hersent.net/reseaux/voip/voip6. NewYork. 23 décembre 1999. X. Bonnet.org/TR/voicexml20/ [11] Rabiner L. Bach Emmon et Harms Robert T. Speech and Signal Processing – ICASSP 2000. Huang. [14] Ch. 1968. 77. A Unified Context-Free Grammar and N-Gram Model for Spoken Language Processing. In proceeding s of the International Conference on Acoustics. compte-rendu de l’assemblée GA38 des 2021/11/01.guill. Wang. pp. Cambridge.voicexml. MA. n°2.pdf [2] Guill Professeur ESCE Angres. RAIRO Informatique. « Les grammaires sémantiques. Tutorial on hidden Markov models and selected applications in speech recognition. [5] La qualité de service en voix sur IP.

Annexe Annexe Les éléments du langage VoiceXML Elément Assign Audio Block Catch Choice Clear Disconnect Else Elseif Enumerate Error Exit Field Filled Form Goto Grammar Help If Initial Link Log Menu Meta Metadata Noinput Nomatch Object Option Param Prompt Property Objectif Assigne une valeur à une variable Lit un fichier son au sein d'un élément prompt Un conteneur pour un code exécutable (non interactif) Capture un événement Définit un élément de menu Efface une ou plusieurs variables d'élément de formulaire Déconnecte une session Employé dans les éléments if Employé dans les éléments if Raccourci pour l'énumération des choix dans un menu Capture un événement erreur Sort d'une session Déclare un champ de saisie dans un formulaire Une action exécutée quand les champs sont remplis Un dialogue pour la présentation d'informations et la collecte de données Aller à un autre dialogue dans le même document ou un document différent Indique une grammaire de reconnaissance vocale ou une grammaire DTMF Capture un événement aide Logique conditionnelle simple Déclare une logique initiale sur une entrée dans un formulaire (à initiative mixte) Définit une transition commune à tous les dialogues dans la portée du lien Génère un message de débogage Un dialogue pour choisir entre plusieurs destinations Définit un élément de méta donné en tant que couple nom/valeur Définit un méta information en utilisant un schéma de méta donné Capture un événement non-entrée Capture un événement non-correspondance Interagit avec une extension personnalisée Indique une option dans un élément field Paramètre dans un élément object ou subdialog Place en file d'attente la synthèse vocale et la sortie audio vers l'utilisateur Contrôle les paramètres de la plateforme d'implémentation. Sup’Com 2006/2007 80 .

Annexe Record Reprompt Return Script Subdialog Submit Throw Transfer Value Var Record Enregistre un échantillon audio Joue la file d'attente sur un champ lorsque celui-ci est revisité après un événement Retour d'un sous-dialogue. Définit un bloc de logique de script ECMAScript côté client Invoque un dialogue en tant que sous-dialogue du dialogue courant Soumet des valeurs à un serveur de documents Suscite un événement. Transfère l'appelant vers une autre destination Insère la valeur d'une expression dans une invite Déclare une variable L'élément de niveau supérieur dans chaque document VoiceXML Sup’Com 2006/2007 81 .

puisqu'elles montrent une réactivité accrue face aux besoins des usagers de plus en plus variés. Asterisk PBX. une fois lancée sur Internet.Résumé Les applications vocales subissent ces dernières années une évolution importante. Plateforme Voxeo. et de manière continue. Sup’Com © Juin 2007 . En fait ce type d'application offre aux individus l'opportunité de garder. Application vocale. permette aux abonnées de découvrir notre service. le contact avec les informations qui les intéressent. Pour la réalisation de cette application. C'est dans cette perspective que s'inscrit notre projet. nous avons développé une application web moyennant une Plateforme VoiceXML qui. VoiceXML. qui a pour objectif de concevoir et de réaliser un service des IVRs (Interactive Voice Response). qui se charge de surveiller les demandes des clients et de les informer par de voix chaque fois qu'un appel client est reçu. Mots clés: VoIP. SIP.