Voix / image sur IP

VoIP est un terme que l'on entend de plus en plus de nos jours. VoIP signifie 'Voice over IP' en anglais ce qui se traduit par Voix sur IP. Ce terme désigne la technologie permettant de faire passer de la voix à travers les réseaux informatiques afin d'offrir les mêmes services que le réseau téléphonique. L'usage de cette technologie se répand de plus en plus, chez les particuliers d'abord avec l'explosion des logiciels de dialogue gratuit pour communiquer d'un ordinateur à un autre dans le monde entier, chez les fournisseurs d'accès ensuite qui proposent maintenant des forfaits comprenant les communications téléphoniques illimitées et enfin chez les professionnels où la VoIP et l’image sur IP remplacent peu à peu le réseau téléphonique de l'entreprise.

1. Les principaux protocoles pour la VOIP et l’image sur IP Les protocoles de VoIP et image sur IP sont les codages techniques qui permettent aux voix et images de passer sur l'internet. Il existe plusieurs normes concurrentes dans ce domaine. Les principaux protocoles utilisés pour l'établissement des connexions en voix sur IP sont :
• • • • • • • • • •

H.323 ; IAX (Asterisk) ; SIP ; UA/NOE (propriétaire Alcatel-Lucent) ; UNISTIM (propriétaire Nortel). Jingle, basé sur le protocole de messagerie instantanée standard ouvert Jabber ; MGCP ; SCCP (propriétaire Cisco Systems) ; …

Protocole H.323

Le protocole H.323 est un protocole englobant tout un ensemble de normes utilisées pour l’envoie de données audio et vidéos sur Internet. Il a été créé en 1996 par l’ITU, Internationale Télécommunication Union et est un des premiers

SIP remplace progressivement H. la négociation des codecs et le transport. SIP ne transporte pas les données échangées durant la session comme la voix ou la vidéo. pour l’enregistrement et l’authentification et Q. par exemple.323. Il se charge de l'authentification et de la localisation des multiples participants. en attente. Il est important que tous les systèmes utilisent la même manière d’encoder la voix. Administration and Status. SIP étant indépendant de la transmission des données. Le protocole H. la vidéo ou les données numérisées par les codecs. Cependant le protocole RTP (Realtime Transport Protocol) assure le plus souvent les sessions audio et vidéo. Ainsi il peut s’agir du codec le moins gourmant en bande passante ou celui qui offre la meilleure qualité. et est complété par le RFC 3265) qui a été conçu pour établir. La négociation est utilisée pour se mettre d’accord sur la façon de coder les informations que l’on va s’échanger. On peut regrouper les protocoles englobés dans H. etc…) et connaître la manière a utilisé pour le joindre. voir demander de renégocier les codecs si. Cependant H.323 en trois catégories : La signalisation. la bande passante diminue.protocoles dédié à la voix sur IP. Il se charge également de la négociation sur les types de média utilisables par les différents participants en encapsulant des messages SDP (Session Description Protocol). Le protocole de négociation utilisé est le H. Les messages de signalisation sont ceux que l’on envoie pour joindre un correspondant.323 issu du monde des télécommunications perd de plus en plus de terrain au profit de SIP.931 pour l’initialisation et le contrôle d’appel.245.323 utilise les protocoles de signalisation RAS. Real Time Protocol. connaître son état (occupé. . Registration. tout type de données et de protocoles peut être utilisé pour cet échange. modifier et terminer des sessions multimédia. qui transporte la voix. On peut aussi utiliser les messages RTCP. c’est à dire le même codec. Le H. Real Time Control Protocol pour faire du contrôle de qualité.323 est implémenté dans beaucoup de logiciel temps réel comme NetMeeting ou Ekiga. Le transport de l’information s’appuie sur le protocole RTP. SIP Session Initiation Protocol (dont l'abréviation est SIP) est un protocole normalisé et standardisé par l'IETF (décrit par le RFC 3261 qui rend obsolète le RFC 2543. plus souple et plus adapté aux technologies récentes.

) et des paramètres de communication. protocole fiable. Les éditeurs. • Etablissement et suivi de l'appel. le service et la passerelle vers les réseaux publics entrants et sortants. par unité de 64kb ou encore par paquet sur canal D). vidéo. • Gestion de fonctions évoluées : cryptage. mais toute cette technologie est fermée et donc non accessible aux développeurs du monde libre. . Les RTC et RNIS (ISDN) et par extension les téléphones de première et seconde générations (satellitaires et GSM) ont fait leur temps en tant que réseaux supportant la voix uniquement. on assiste à la convergence de la téléphonie et de l'informatique (couplage téléphonie-informatique). SIP. H. détermine si le poste appelé souhaite communiquer. fournisseurs de services et opérateurs mettant du temps à offrir logiciels et services autour de H323 et SIP... • Négociation du type de média (voix. avec des bandes passantes et débits très faibles (RNIS permettait les transmissions de données. avertit les parties appelant et appelé de la demande d'ouverture de session. en liaison commutée ou fixe sur abonnement. standard. retour d'erreurs. . Fonctionnement Sip intervient aux différentes phases de l'appel : • Localisation du terminal correspondant. des éditeurs et fournisseurs de service planchent sur l'intégration de SIP avec Jabber. gestion du transfert et de la fermeture des appels.323 a été un protocole pionnier de la téléphonie sur IP. émanant des instances du monde des télécommunications (UIT ou ITU). la firme Skype s'est imposée avec plusieurs millions d'utilisateurs en proposant le logiciel client. Actuellement.. conception un peu plus récente. ouvert et éprouvé de présence et de messagerie instantanée. vient du monde de l'Internet (IETF) et s'intègre sans doute un peu mieux sur les réseaux IP.Contexte de mise en place du protocole SIP À l'heure de la révolution de l'information par l'utilisation du réseau Internet.. données. et autorise l'appelant à le contacter. pour combler les faiblesses en termes de présence et de réseaux (NAT) du protocole SIP. • Disponibilité du correspondant. • Analyse du profil et des ressources du destinataire.

Sip permet donc l'ouverture de sessions en mode : Point-à-point . tels que : Call-ID. il peut lui adresser une ou plusieurs requêtes Sip et recevoir une ou plusieurs réponses de ce serveur. . En cas de réponse favorable.Cette requête permet de confirmer que le terminal appelant a bien reçu une réponse définitive à une requête Invite. Diffusif .U (Multipoint Control Unit) Combinatoire .Un proxy server en mesure de contacter l'UAS (terminal) appelé. Sap. • Requête Uri permettant de localiser le proxy server auquel est rattaché la machine de l'appelé. Le corps du message décrit cette session (par ex : média supportés par l'appelant ). choix des protocoles les mieux adaptés (Rsvp.Plusieurs utilisateurs en multicast. • Requête Sip. Voici les différents éléments intervenant dans l'ouverture de session : • Suivant nature des échanges. l'invité doit spécifier les médias qu'il supporte. via une unité de contrôle M. pour véhiculer de la vidéo. Sdp). 2 sessions doivent être ouvertes (l'une pour l'image et l'autre pour la vidéo). les utilisateurs qui ouvrent une session peuvent communiquer en mode point à point.C.Avec Sip. • Détermination du nombre de sessions. une fois le client (machine appelante) connecté à un serveur Sip distant. Rtp. doit répondre à une requête Options en précisant ses capacités à contacter le même terminal. en mode diffusif ou dans un mode combinant ceux-ci. • Chaque utilisateur ou sa machine est identifié par une adresse que l'on nomme Url Sip et qui se présente comme une Url Mailto.Communication entre 2 machines. Cseq. • Options . Les réponses contiennent certains champs identiques à ceux des requêtes.Plusieurs utilisateurs pleinement interconnectés en multicast via un réseau à maillage complet de connexions. • Ack . Les échanges entre un terminal appelant et un terminal appelé se font par l'intermédiaire de requêtes : • Invite . To et From. on parle d'unicast.Cette requête indique que l'application (ou utilisateur) correspondante à l'Url Sip spécifié est invité à participer à une session. comme par exemple. Rtcp.

User Agent Les User Agents désignent les agents que l'on retrouve dans les téléphones SIP. représentées par le premier bit : 1xx = Information . Ce résultat est précisé par une phrase. Une réponse à une requête est caractérisée. comprise et acceptée 3xx = Redirection . textbased (UTF-8).• Bye . les softphones (logiciels de téléphonie sur IP) des ordinateurs et PDA ou les passerelles SIP.Le serveur n'a pas réussi à traiter une requête apparemment correcte 6xx = Echec général . Le code d'état est donc destiné à l'automate gérant l'établissement des sessions Sip et les motifs aux programmeurs.La requête contient une syntaxe éronnée ou ne peut pas être traitée par ce serveur 5xx = Erreur du serveur . expliquant le motif du refus ou de l'acceptation de la requête.Une autre action doit être menée afin de valider la requête 4xx = Erreur du client . la mise en place de SIP repose sur trois éléments : User Agent. appelés code d'état et raison phrase respectivement. on peut établir des sessions directement entre deux User Agents. En théorie.Cette requête est envoyée par un terminal ou un proxy server à fin d'annuler une requête non validée par une réponse finale comme. alors elle émet une requête Cancel. par exemple. Cela n'est pas l'idéal car une adresse IP peut ne pas . et ayant accepté l'invitation ne reçoit pas de requête Ack.L'action a été reçue avec succès. si une machine ayant été invitée à participer à une session. par un code et un motif. Il existe 6 classes de réponses et donc de codes d'état. • Cancel . deux téléphones par exemple.cette méthode est utilisée par le client pour enregistrer l'adresse listée dans l'URL TO par le serveur auquel il est relié. • Register .Cette requête est utilisée par le terminal de l'appelé à fin de signaler qu'il souhaite mettre un terme à la session.La requête ne peut être traitée par aucun serveur En pratique.La requête a été reçue et continue à être traitée 2xx = Succès . Un code d'état est un entier codé sur 3 bits indiquant un résultat à l'issue de la réception d'une requête. Mais cela nécessite de connaître l'adresse IP du destinataire. registrar et proxy.

Une fois la session établie. Pour la diffusion de son ou de vidéos sur IP en multipoints. qui seront stockées dans une base de données. c’est-à-dire leur adresse IP. ne transitent pas par le serveur Proxy. Registrar Le Registrar est un serveur qui gère les requêtes REGISTER envoyées par les Users Agents pour signaler leur emplacement courant. En effet. Les User Agents peuvent donc s'enregistrer auprès de Registrars pour signaler leur emplacement courant. on .. les données. Proxy Un Proxy SIP sert d'intermédiaire entre deux User Agents qui ne connaissent pas leurs emplacements respectifs (adresse IP). 2.être publique (derrière un NAT) ou changer et elle est bien plus compliquée à retenir qu'une URI (Uniform Resource Identifier). Elles sont échangées directement entre les User Agents. l'association URIAdresse IP a été stockée préalablement dans une base de données par un Registrar. Les URI SIP sont très similaires dans leur forme à des adresses email : sip:utilisateur@domaine. associée à une URI. Le Proxy se contente de relayer uniquement les messages SIP pour établir.com Généralement. des mécanismes d'authentification permettent d'éviter que quiconque puisse s'enregistrer avec n'importe quelle URI. par exemple un flux RTP pour la VoIP. contrôler et terminer la session. Le Proxy peut donc interroger cette base de données pour diriger les messages vers le destinataire. Ces requêtes contiennent donc une adresse IP. Les différents modes de diffusion de la voix Le terme « VoIP » est en général utilisé pour décrire des communications « point à point ».

D’autres applications peuvent intégrer de la VoIP comme besoin secondaire. par exemple) et en mode « une émission pour plusieurs réceptions » (mais le signal n'est routé que s'il y a des récepteurs) comme les radios Web. Avec la banalisation des réseaux haut débit. Le terme multipoints sera réservé à des visioconférences dont le nombre de participants est plus grand que deux. Ici. Les API de VoIP peuvent être utilisées dans de nombreuses applications.parlera plutôt de streaming pour une simple diffusion. Les applications de VoIP (Voice over IP) sont une des nouvelles possibilités offertes. en mode « une émission et plusieurs réceptions » (comme un émetteur TV. . L’intégration de nouveaux besoins dans une plate-forme de développement permet d’attirer les concepteurs de logiciels qui doivent intégrer des fonctions de voix sur IP dans leurs applications. comme les radios Web par exemple. Le développement de la VoIP a entraîné les concepteurs de plates-formes de programmation à développer des API (Application Programming Interface) spécifiques à la voix sur IP. Il existe une différence majeure permettant de classer les codecs existants dans deux catégories : les codecs sans pertes ('lossless') et les codecs avec pertes ('lossy'). le codec transforme donc le signal de la voix en données numériques facilement transportables sur un réseau. 3. Elles implémentent le protocole SIP. Le protocole H. Après de transport. Par exemple les applications de messagerie instantanée qui intègrent de plus en plus souvent la possibilité de parler directement avec ses contacts ou bien toutes les applications nécessitant une interaction textuelle entre les différentes applications clientes comme les jeux vidéo. broadcast ou Multicast sur les réseaux. codage de la voix et d’images: les codecs L'objectif d'un codec est la transformation d'un signal analogue vers un signal numérique et vice-versa. la plus simple étant les téléphones logiciels (soft phones). L’augmentation des débits et les connexions permanentes offrent des possibilités de développement de la voix sur IP (Internet Protocol). c'est-à-dire en mode « point à point ».323 ne fonctionne qu'en mode Unicast. le même codec se charge de retransformer le signal numérique vers un signal analogique. le nombre d’applications possibles a considérablement augmenté. La voix ou le son sur IP peut se faire en mode Unicast.

Dans l'exemple de la voix. Les codecs les plus souvent mis en oeuvre dans les solutions VoIP sont G. L'exploitation des particularités de l'oreille humaine s'appelle la psychoacoustique. ces derniers doivent d'abord être convertis sous forme numérique suivant le format PCM (Pulse Code Modulation) à 64 Kbps. Dans un codec lossy. Compression : le signal numérique PCM à 64 Kbps est compressé selon l'un des formats de codec (compression / décompression) (Tableau 3-3) puis inséré dans des paquets IP. G. Décompression : côté réception. certaines parties du signal sont écartées et supprimées.1. PCM 64Kbps. tout le signal est transformé en binaire et le décodage restitue des données parfaitement identiques à celles données en entrée. le signal voix peut également être transporté dans son format originel à 64 Kbps. les informations reçues sont décompressées .).il est nécessaire pour cela d'utiliser le même codec que pour la compression.729 et G. La fonction de codec est le plus souvent réalisée par un DSP (Digital Signal Processor). Les codecs avec pertes (aussi appelés destructeurs) tirent parti de ce phénomène. Ces dernières écoutent tout un ensemble de . cette fonction est omise. Le Tableau ci-dessous présente les caractéristiques des principaux codecs standards de l'UIT. Les sons dans les fréquences hautes ou basses sont tronqués pour diminuer la quantité d'information à transmettre. l'oreille humaine rencontre ses limites lorsqu'il s'agit d'écouter des fréquences trop basses ou trop hautes.Dans un codec lossless. etc. Selon la bande passante à disposition. La qualité d'un codec est mesurée de façon subjective en laboratoire par une population test de personnes. Ce type de codecs est utilisé quand la qualité de la restitution est importante. Si l'interface téléphonique est numérique (accès RNIS. par exemple). L'objectif d'un codec est d'obtenir une bonne qualité de voix avec un débit et un délai de compression le plus faibles possibles.711.puis reconverties dans le format approprié pour le destinataire (analogique.723. Le coût du DSP est lié à la complexité du codec utilisé. Qualité de la voix : Le transport de la voix sur un réseau IP nécessite au préalable tout ou une partie des étapes suivantes : Numérisation : dans le cas où les signaux téléphoniques à transmettre sont sous forme analogique.

729 et G.711 (PCM) G. une opinion moyenne de la qualité d'écoute (Mean Opinion Score .92 3.729 x2 G.726 G.723.68 3. Ces deux codecs présentent une meilleure qualité que celle des réseaux téléphoniques cellulaires (GSM).5 3. MOS) est ensuite calculée pour chaque codec.4Kbps) est très proche de celle du service téléphonique actuel.65 3.4 5.17 Deux observations principales peuvent être tirées du Tableau 3-5 : La qualité de la voix obtenue par les codecs G. et ce pour des débits entre 8 et 10 fois inférieurs.729 x GSM Débit (Kbps) 64 32 8 6.3 13 Score MOS 4.723.conversations compressées selon les différents codecs à tester et les évaluent qualitativement selon la table suivante : Tableau 3: Echelle utilisé pour l'évaluation de la qualité de voix Qualité de la parole Excellente Bonne Correcte Pauvre Insuffisante Score 5 4 3 2 1 Sur la base des données numériques des appréciations.1 (à 6.27 2.9 3.729 G.729 x3 G.1 G.85 3.1 GSM G. Les résultats obtenus pour les principaux codecs sont résumés dans le tableau ci-dessous : Tableau 5: MOS des différents codecs Codec VoIP G.1 3.723. .

Même si il existe maintenant des codecs nettement plus intéressants. Offrant une qualité de voix très proche. les différents codecs retransmettent plus ou moins bien le signal original. d'opérations de compression/décompression conduit à une rapide dégradation de la qualité. Dans le domaine de la téléphonie sur IP. celui ci continue d'être implémenté dans les équipements a des fins de compatibilité entre marques d'équipements différentes. en fonction notamment de la bande passante à disposition et du retard cumulé maximum estimé pour chaque liaison (selon les standards de l'UIT. on parle de score MOS (Mean Opinion Score).1 se distinguent essentiellement par la bande passante qu'ils requièrent et par le retard que chacun introduit dans la transmission. Le facteur du jitter est primordiale pour une bonne écoute de la Voip.711 Ce codec est le premier à avoir été utilisé dans la VoIP. Les solutions mises en oeuvre doivent éviter des configurations en tandem dans lesquelles un PBX reçoit un appel d'un poste distant à travers une liaison VoIP et le redirige vers une autre liaison semblable.5 Qualité militaire 2.5 à 4 classiques Qualité acceptable 3 à 3. Score MOS Score MOS Définition Exemple Haute qualité Téléphones RNIS 4à5 Téléphones fixes Qualité commerciale 3. C'est une note comprise entre 1 et 5 et attribuée par des auditeurs jugeant de la qualité de ce qu'ils entendent. les codecs G.Le cumul.5 Plusieurs codecs peuvent servir dans la VOIP et l’image sur IP : G. dans une même communication.729 et G. le retard aller (« one-way delay ») devrait être inférieur à 150 ms). .5 à 3 inférieur à Qualité synthétique Voix robotisée 2. Pour mesurer la qualité de la voix restituer. Le choix d'un équipement implémentant l'un ou l'autre de ces codecs devra donc être fait selon la situation.723.

Une des particularités est de pouvoir immédiatement changer de débit. Les débits que ce codec fournit sont 48. Les scores MOS varient entre 3. le changement de mode peut se faire en pleine communication.2 ce qui en fait un codec de bonne qualité de restitution. G.1 Dérivé du codec précédent.711.723.722 A la différence du G. Deux modes sont disponibles.9. . La partie du spectre de fréquence au dessus de 4kHz est cependant éliminée. Ceci est fortement appréciable lorsque la qualité du support de transmission se dégrade.3kbit/s. G.4kbit/s et le deuxième un débit de 5. Les tonalités DTMF (utilisée par exemple lors d'un appel à un serveur vocal lorsque l'on appuie sur les touches) ne sont pas correctement retransmises et donc non reconnues. Ce codec produit un flux d'une taille de 64kbit/s et le score MOS qu'il a obtenue est de 4. G. Là aussi.7 et 3. Le premier propose un débit de 6. Pour cela deux lois différentes sont utilisées selon les pays.722.56 ou 64kbit/s.Le principe utilisé est le codage du signal selon une échelle logarithmique. Ce codec est un parfait exemple de codec à pertes. ce codec transforme le spectre jusqu'à 7kHz ce qui restitue encore mieux la voix.1 C'est le codec par défaut lors des communications à faible débit. celui ci propose des débits encore plus faibles (32 ou 24kbit/s). Il existe même des versions propriétaires de ce codec fournissant un débit de 16kbit/s.

Cette norme devenu obsolète. pour l'encodage vidéo pur. qui l'intégra entièrement dans son moteur de décompression de données. Elle fut notamment popularisée par la console de jeu Playstation de Sony.261 C’est une recommandation de compression vidéo de l'UIT-T. on préfèrera la norme H.0.263 de meilleure qualité pour la VoIP. . débit de 15 images/seconde (352 × 288 pixels) QCIF.261 ont ultérieurement servi de base à la norme MPEG.264. il ne convient pas pour des transmissions autres que la voix et ne retransmet pas correctement les tonalités DTMF. H. Formats d'images : • • CIF.263 C’est une recommandation concernant la norme de codage vidéo développée par l’UIT-T Q. sa succession fut assurée par la norme H.G. Les travaux sur la norme H. H. Bande passante sur le réseau : 64 kbit/s.723 un des plus utilisés en VoIP. débit de 30 images/seconde (176 × 144 pixels).6/SG16. C'est une évolution de la norme H.729 Ce codec est avec G. A l'instar de ce dernier.120. Le score MOS obtenu est 4.

La norme UIT-T H. Dans le cas de SIP.6/SG16 Video Coding Experts Group (VCEG) ainsi que l'ISO/CEI Moving Picture Experts Group (MPEG) et est le produit d'un effort de partenariat connu sous le nom Joint Video Team (JVT). est une norme de codage vidéo développée conjointement par l'UIT-T Q. Elle a ensuite été intégrée dans les protocoles de visioconférence sur IP du type H. Ce mécanisme s'appelle VAD (Voice Activity Detection .324m qui permet de réaliser des appels visio en mode circuit sur les réseaux mobiles de troisième génération. pour Advanced Video Coding. La première version de la norme a été approuvée en mai 2003 et la plus récente date de mars 2005 Compression du silence : C’est une des méthodes utilisées par les codecs pour réduire la quantité de données à transmettre et de détecter les silences.245 et choisissent les modes de H.264.263 qu’ils utiliseront lors de la communication. Le même codec a été repris par la norme H. Dans une conversation téléphonique. c'est la partie SDP qui est utilisée. ou MPEG-4 AVC (Advanced Video Coding).323 mais aussi SIP. Génération de bruits de confort : . ils échangent leurs caractéristiques grâce au protocole H. H.264 et la norme ISO/CEI MPEG-4 Part 10 (ISO/CEI 14496-10) sont techniquement identiques. Ce qui fait que 1/3 du temps d'une conversation est constitué de silence facilement reproductible et donc non codé par le codec. Au début d’une communication vidéo entre deux terminaux équipés de ce codec. et la technologie employée est aussi connue sous le nom AVC.324.DAV : Détection d'activité de la voix). chaque locuteur ne parle que 1/3 du temps en moyenne.263 a été développé pour la transmission de la vidéo sur des lignes à très bas débits. H. ou MPEG-4 Part 10. pour des applications de visiophonie via le réseau téléphonique commuté de type H.À l’origine.

Robustesse sur les pertes de paquets : Si les conditions de circulations sur le réseau se dégradent. qui est lui même fonction de la puissance et la charge de ce dernier. l'absence de bruit chez le récepteur peut vite se révéler inconfortable. les codecs disposent d'un générateur de bruits de confort visant à simuler des bruits de fond pour améliorer le confort des utilisateurs.Latence La maîtrise du délai de transmission est un élément essentiel pour bénéficier d'un véritable mode conversationnel et minimiser la perception d'écho (similaire aux désagréments causés par les conversations par satellites. 4. et du temps d'accès en sortie de l'élément. le codec dispose ainsi d'une copie du paquet à retransmettre. . Or la durée de traversée d'un réseau IP dépend de nombreux facteurs: Le débit de transmission sur chaque lien Le nombre d'éléments réseaux traversés Le temps de traversée de chaque élément. On peut aussi répartir l'information sur plusieurs paquets de façon à introduire une redondance des données. Dans cette optique. désormais largement remplacés par les câbles pour ce type d'usage). Il existe plusieurs méthodes pour palier à ce problème : Il est possible par exemple de simplement répéter le contenu du dernier paquet pour combler le vide. du temps de mise en file d'attente des paquets. Qualité de Service a) .Pendant une conversation où les silences sont effacés. Ce problème est en partie compensé par l'utilisation des buffers mais la gigue peut être telle que le codec soit obligé de retransmettre au récepteur un paquet alors qu'il n'est pas arrivé. En cas de pertes de paquets. certains paquets contenant de l'information peuvent se perdent ou arriver trop tard.

Noter que le temps de transport de l'information n'est pas le seul facteur responsable de la durée totale de traitement de la parole. se situe entre 150 et 200 ms par sens de transmission (en considérant à la fois le traitement de la voix et le délai d'acheminement). Ces chiffres concernent le délai total de traitement. à l'opposé de la terre.Commentaires Classe n° 1 2 3 4 Délai par sens 0 à 150 ms 150 à 300 ms 300 à 700 ms Au delà de 700 ms Commentaires Acceptable pour la plupart des conversations Acceptable pour des communications faiblement interactives Devient pratiquement une communication half duplex Inutilisable sans une bonne pratique de la conversation half duplex En conclusion. Les chiffres suivants (tirés de la recommandation UIT-T G114) sont donnés à titre indicatif pour préciser les classes de qualité et d'interactivité en fonction du retard de transmission dans une conversation téléphonique. dure environ 70 ms. chaque paquet IP « fait son chemin » indépendamment des paquets qui le précèdent ou le suivent: c'est ce qu'on appelle grossièrement le « Best effort » pour signifier que le réseau ne contrôle rien. et pas uniquement le temps de transmission de l'information sur le réseau. Une transmission par fibre optique. Le temps de codage et la mise en paquet de la voix contribuent aussi de manière importante à ce délai. qui est non négligeable si on communique à l'opposé de la terre.Délai par sens . b) Perte de paquets . Ce fonctionnement est fondamentalement différent de celui du réseau téléphonique où un circuit est établi pendant toute la durée de la communication. Classe n° . on considère généralement que la limite supérieure "acceptable" . pour une communication téléphonique.Le délai de propagation de l'information. Il est important de rappeler que sur les réseaux IP actuels (sans mécanismes de garantie de qualité de service).

aucun mécanisme de contrôle de flux ou de retransmission des paquets perdus n'est offert au niveau du transport. la charge du réseau à un instant donné. c'est à dire avec des pics de perte lors des phases de congestion.Lorsque les buffers des différents éléments réseaux IP sont congestionnés. Cela permet également d'envoyer un signal implicite aux terminaux TCP qui diminuent d'autant leur débit au vu des acquittements négatifs émis par le destinataire qui ne reçoit plus les paquets. Si aucun mécanisme performant de récupération des paquets perdus n'est mis en place (cas le plus fréquent dans les équipements actuels). En effet. Cette dégradation est bien sûr accentuée si chaque paquet contient un long temps de parole (plusieurs trames de voix de paquet). Enfin connaître le pourcentage de perte de paquets sur une liaison n'est pas suffisant pour déterminer la qualité de la voix que l'on peut espérer. Leur taille doit donc être soigneusement définie. mais cela donne une bonne approximation. et d'agir en conséquence au niveau applicatif. Par ailleurs. ils « libèrent » automatiquement de la bande passante en se débarrassant d'une certaine proportion des paquets entrant. qui sont véhiculés au dessus d'UDP. la variation des chemins empruntés dans le réseau. Malheureusement ces paquets présentent l'inconvénient de rallonger d'autant le temps de traversée global du système. et si possible adaptée de manière dynamique aux conditions du réseau. en fonction de seuils prédéfinis. un autre facteur essentiel intervient. pour les paquets de voix. soit répartie de manière corrélée. il s'agit du modèle de répartition de cette perte de paquets. alors la perte de paquet IP se traduit par des ruptures au niveau de la conversation et une impression de hachure de la parole. et mettent plus de temps à « reconstruire » un codage fidèle. les codeurs à très faible débit sont généralement plus sensibles à la perte d'information. suivies de phases moins dégradées en terme de QoS. Pour compenser la gigue. se traduit en . qui peut être soit « régulièrement » répartie.. elle mesure la variation temporelle entre le moment où deux paquets auraient dû arriver et le moment de leur arrivée effective. c) .. La dégradation de la qualité de service due à la présence de gigue. En d'autres termes.Gigue La gigue est la variance statistique du délai de transmission. D'où l'importance des protocoles RTP et RTCP qui permettent de déterminer le taux de perte de paquet. etc. Malheureusement. on utilise généralement des mémoires tampon (buffer de gigue) qui permettent de lisser l'irrégularité des paquets. Cette irrégularité d'arrivée des paquets est due à de multiples raisons dont: l'encapsulation des paquets IP dans les protocoles supportés.

fait. protocole. et que d'autre part on finit tout de même par perdre certains paquets lorsque ceux-ci ont un retard qui dépasse le délai maximum autorisé par le buffer.. etc. contraintes d'adressage.. par une combinaison des deux facteurs cités précédemment: le délai et la perte de paquets. . en français Réseau Local Virtuel) est un réseau local regroupant un ensemble de machines de façon logique et non physique. . d) Création des Vlans Un VLAN (Virtual Local Area Network ou Virtual LAN. En effet dans un réseau local la communication entre les différentes machines est régie par l'architecture physique. Grâce aux réseaux virtuels (VLANs) il est possible de s'affranchir des limitations de l'architecture physique (contraintes géographiques.). puisque d'une part on introduit un délai supplémentaire de traitement (buffer de gigue) lorsque l'on décide d'attendre les paquets qui arrivent en retard. numéros de port.) en définissant une segmentation logique (logicielle) basée sur un regroupement de machines grâce à des critères (adresses MAC.

• Identité : Attaques basées sur la manipulation d'identité (usurpation. Le détournement peut consister à rediriger un appel vers une personne illégitime ou à inclure une personne illégitime dans la conversation. Sécurité VOIP a) Les principaux risques Les principaux risques connus liés à l'utilisation de la VoIP en entreprise sont : • DoS : Attaques entraînant l'indisponibilité d'un service/système pour les utilisateurs légitimes. • Communications indésirées : Attaques permettant à une personne illégitime d'entrer en communication avec un utilisateur légitime. lancement d'exécutables) . • Détournement du trafic : Attaques permettant de détourner le trafic au profit de l'attaquant. Il peut s'agir : • • • • • • • d'empêcher des personnes non autorisées d'agir sur le système de façon malveillante d'empêcher les utilisateurs d'effectuer des opérations involontaires capables de nuire au système de sécuriser les données en prévoyant les pannes de garantir la non-interruption d'un service réduire l'accès au réseau (firewall) réduire le nombre de points d'entrée (ports) définir une politique de sécurité interne (mots de passe. • Surfacturation • Vols de services : Attaques permettant d'utiliser un service sans avoir à rémunérer son fournisseur. …). • Ecoute clandestine : Attaques permettant d'écouter l'ensemble du trafic de signalisation et/ou de données. b) Sécurité réseau La sécurité d'un réseau est un niveau de garantie que l'ensemble des machines du réseau fonctionnent de façon optimale et que les utilisateurs des dites machines possèdent uniquement les droits qui leur ont été octroyés. Le trafic écouté n'est pas modifié.5.

la requête aura de fortes chances d'atteindre le serveur intrus et non son vrai destinataire. des clés publiques et signatures sont utilisées par Sip et stockées dans les champs d'entête Autorisation. S’ il ne l'ignore pas et émet une requête vers le serveur "régulier" auquel il était relié avant la réponse du serveur "intrus". De plus. 6. lorsqu'un Proxy Server intrus renvoie une réponse de code 6xx au client (signifiant un échec général. la requête ne peut être traitée). Cryptage au saut par saut (hop by hop) à fin d'empêcher des pirates de savoir qui appelle qui. en effet le protocole Sip possède 3 mécanismes de cryptage : Cryptage de bout en bout du Corps du message Sip et de certains champs d'entête sensibles aux attaques. Le client peut ignorer cette réponse. VOIP: aspects logiciel et matériel a) Aspects Logiciels Avec la banalisation des réseaux haut débit le nombre d’applications possibles a considérablement augmenté. Les applications de VoIP (Voice over IP) sont une des nouvelles possibilités offertes. l’augmentation des débits et les connexions permanentes offrent des possibilités de développement de la voix sur IP (Internet Protocol). des mécanismes d'intégrité et d'authentification des messages sont mis en place. Une autre attaque connue avec Tcp ou Udp est le « deny of service ». En effet. Cryptage au saut par saut du champ d'en-tête Via pour dissimuler la route qu'a empruntée la requête. Et pour des messages Sip transmis de bout en bout. Le développement de la VoIP a entraîné les concepteurs de plates-formes de programmation à développer des API (Application Programming Interface) spécifiques à la voix sur IP. L’intégration de nouveaux besoins dans une plate- .c) Authentification et cryptage Les messages Sip peuvent contenir des données confidentielles. à fin d'empêcher à tout intrus de modifier et retransmettre des requêtes ou réponses Sip.

Citons par exemple les applications de messagerie instantanée qui intègrent de plus en plus souvent la possibilité de parler directement avec ses contacts ou bien toutes les applications nécessitant une interaction textuelle entre les différentes applications clientes comme les jeux vidéo. ainsi que les statistiques de la connexion Microsoft Office Communications Server . GNU SIP Witch. l'envoi de SMS. avec une interface rudimentaire c'est le plus simple des clients SIP. Gatekeeper H323 Proxy H323 Pont multipoint IP H323 : OpenMCU du projet OpenH323 Passerelle H323/Réseau téléphonique : PSTNGw du projet OpenH323 • • • • • • Logiciels propriétaires • • • • • Cisco SIP Proxy Server Eyeball SIP Proxy Server Sipleo (serveur PABX-IP & SIP Windows) PhonerLite.forme de développement permet d’attirer les concepteurs de logiciels qui doivent intégrer des fonctions de voix sur IP dans leurs applications. FreeSWITCH. OpenSER (disponibles dans la majorité des distributions Linux). licence GPL. serveur SIP assez peu connu en France. SIP Express Router (SER). la plus simple étant les téléphones logiciels (soft phones). OpenSIPS et Kamailio. serveur de voix sur IP en peer to peer utilisant une implémentation du protocole SIP comme solution de routage. IAX. Elles implémentent le protocole SIP. MGCP et H323. licence GPL OfficeSIPS. a-1) Serveurs Logiciels Libres • • • • • • Asterisk. serveur SIP pour un usage professionnel. traduit dans 5 langues. Les API de VoIP peuvent être utilisées dans de nombreuses applications. logiciel de PABX qui supporte entre autres SIP. D’autres applications peuvent intégrer de la VoIP comme besoin secondaire. contient une passerelle Jabber et gère l'authentification TLS.

Licence BSD. utilise les librairies Qt. fonctionne sous Windows. QuteComQuteCOM (précédemment WengoPhone) logiciel basé sur SIP et client de messagerie instantanée. KPhone. un client SIP (voix et vidéo) et de messagerie instantanée en Java. basé sur la librarie native pjsip. un client SIP pour Mac. client Android. GPLv3 SymPhonie. Licence GPL. wifi/3G/GPRS. CSipSimple client Android. Licence GPL. fonctionne en particulier avec Ubuntu. il permet de se connecter aux serveurs SIP. Linphone. préalablement nommé GnomeMeeting (Linux et Windows). multi-comptes.(DC-Share) Windows Live Messenger Skype Yahoo! Messenger Google Talk VLVC Qnext aMSN OnlineCall CUworld Logiciel Ivisit ICUII .OhPhone en version "command line" du projet OpenH323 Sun Solaris 2. un client SIP qui fonctionne sous Windows. Licence GPL. HP : VISUALIZE CONFERENCE . Ekiga. utilise les librairies GTK+. un client SIP pour Mac (beta).8 : SunForum . Twinkle. SIPdroid.• • Cisco Call Manager M2MSoft S5000. SIP Communicator. gère voix et vidéo.(DC-Share) Silicon Graphics : sgimeeting en version d'évaluation (DC-Share). Licence GPL. Mac et Linux (licence GPL). voix et vidéo. logiciel SIP sous Linux (licence GPL). Xlite Sjphone Telephone. SIP Proxy Server et IPBX Linux ou Window A -2 ) Clients Logiciels Libres • • • • • • • • • • • • • • • • • • • • • • • • • • • • • SIPInside. Environnement Microsoft : Netmeeting Linux : .

Compatible avec la Freebox Microsoft Office Communicator. Linux et Symbian OS Zoiper.NEOTION Processor 4. pour Windows. gratuit. EM8622L. SMP8635. Neotion NP4 . CRM intégrée 3CXPhone pour Windows. Android et Iphone b) Aspect matériel Applications matérielles Plusieurs entreprises produisent des puces capables de décoder des vidéos H. Compatible avec la Freebox SJphone. gratuit.. gratuit. Sigma Designs SMP8634. symbian et Windows Mobile Pangolin. . Windows 2000. et EM8624L. Mac OS X. Linux et MAC et l'iPhone. Les puces capables de décoder en temps réel de la vidéo haute définition sont entre autres les suivantes : • • • • • • • Broadcom BCM7411. STB7109. il fonctionne sous Windows. Conexant CX2418X. il fonctionne sous Windows.264/AVC. gratuit. Ce type de puces permet un large déploiement de matériel à bas coût capable de jouer des vidéos H. WISchip (Micronas USA.) DeCypher 8100.264/AVC aux définitions de télévision standard et hautes. Inc. Mac OS X et Linux X-Lite.• • • Eye Speak Neos mt IM4chat Logiciels propriétaires • • • • • • • • • Gizmo5 pour Windows XP. pour Windows. STMicroelectronics STB7100. édité par PortSIP. NOMADIK (série STn 8800/8810/8815). edité par SJLabs. gratuit. dédié à l'iPhone. …. android. pour Windows Hogunsoft Cont@ct Center. il fonctionne très bien avec la Freebox Fring.

des cartes PCI FX0. Grandstream. des passerelles mistes avec les constructeurs tels: Tandberg. TP • • • • • • • Mise en place de la plate-forme (un IPBX pour deux personnes) Réalisation d’appels entrants et sortants.Notons la fabrication des téléphones IP. Cisco. VCON. E1T1/PRI. Digium… 7. Codian. renvoi d’appel Mise en place des services SDA et groupement d'appel Mise en place d’un Serveur Vocal Interactif (IVR) Mise en place des services audio conférence et de messagerie vocale Mise en place des protocoles SIP. Polycom. Radvision. FVC. des passerelles IP GSM.323 avec études de traces Réalisation d’appels de téléphones portables (GSM) vers les IPphones . FXS. MGCP. H. cisco.

car elle demande un investissement relativement faible pour son déploiement. Maintenant que la normalisation a atteint une certaine maturité. L'avenir de la VOIP Actuellement. Le marché de la téléphonie IP est très jeune mais se développe à une vitesse fulgurante. d'évolutivité et de coût. C'est aujourd'hui que les entreprises doivent investir dans la téléphonie IP si elles veulent y jouer un rôle majeur. Enfin. qui a fait ses preuves et que beaucoup d'entreprises disposent avantage de la téléphonie IP. d'un autre coté l'utilisation massive d'Internet va augmenter le trafic et développer de nouveaux services que pourront développer les opérateurs. le développement de cette technologie représente-t-il un risque ou une opportunité pour les opérateurs traditionnels ? La réponse n'est pas tranchée. il n'est plus dangereux de miser sur le standard H323 qui a été accepté par l'ensemble de la communauté. une stagnation des communications classiques.8.. On peut ainsi vraisemblablement penser que le protocole IP deviendra un jour un standard unique permettant l'interopérabilité des réseaux mondialisés. La téléphonie IP est une bonne solution en matière d'intégration. Elle fera partie intégrante des Intranets d'entreprises dans les années à venir et apparaîtra aussi dans la téléphonie publique pour permettre des communications à bas coût. il est évident que la téléphonie IP va continuer de se développer dans les prochaines années. Bientôt nous téléphonerons tous sur IP. de fiabilité.. La téléphonie IP ouvre la voie de la convergence voix/données et celle de l'explosion de nouveaux services tels que les CTI. . D'un coté. Le fait est que IP est maintenant un protocole très répandu.