IUT A, Université Claude Bernard, Lyon 1 UbicMedia Europe

Mémoire de Licence Pro Conduite de Projet TIC dans les PME

[Etude comparative des Technologies d’encodage Audio-Visuel pour l’Internet et le Multimedia]
Etude avancée du format de fichier Vidéo numérique AVC/H.264

Philippe Gourgand

[2010]
Tuteur en entreprise : M. Perrin Enseignant Suiveur : M. Odin Enseignant Lecteur: Mme. Bureau

Remerciements

La rédaction de ce mémoire m’a permis de rencontrer des gens nouveaux, qui m’ont apporté beaucoup d’aide et de soutien dans mes recherches et que je souhaite aujourd’hui remercier. Tout d’abord, je tiens à remercier Véronique Cohen et l’équipe pédagogique de l’IUT qui m’ont donné envie d’approfondir les compétences nécessaires pour conduire un projet dans le secteur du multimédia dans une entreprise, au point de m’amener aujourd’hui à rédiger un mémoire traitant de ce sujet. Au cours de cette année, une autre personne a fortement influencé mes choix quant à l’orientation de mon mémoire et à l’intérêt que je porte à tout ce qui touche aux aspects technologiques du secteur du multimédia. Je souhaite donc ici saluer Alain Rosset PDG d’UbicMedia SAS qui m’a fait confiance en signant ce contrat d’apprentissage avec moi et qui m’encourage encore après cette année passée ensemble dans cette direction. Je tiens également à adresser des remerciements sincères à Bertrand Perrin, directeur technique et maitre d’apprentissage qui m’a apporté une aide précieuse dans la rédaction de ce mémoire. Je tiens à remercier aussi Lionel Martin qui m’a apporté un regard éclairé (et toutes les documentations techniques à lire en anglais). Enfin, je remercie tous ceux qui m’ont apporté leur soutien et leur aide au cours de cette année, ma famille et plus spécialement mon père, qui a su me soutenir dans mes périodes de doute et sans qui l’achèvement de ce travail aurait été beaucoup plus difficile, sans oublier ma mère pour son grand sens de l’orthographe...

Mon entreprise

UbicMedia SAS, société fondée en 2006.
Sa principale activité est de développer une solution de protection de contenus vidéo « PUMit » ainsi que de promouvoir celle-ci. Cette solution requiert de la part de l’ayant droit, de fournir un fichier MPEG-4 (dont nous parlerons dans l’introduction de ce mémoire), puis une fois le fichier « Pumé » celui-ci devient illisible et non visionnable pour une personne qui n’aurait pas les droits de visionnage ! Tout en permettant la libre circulation du fichier sur l’Internet, et aux personnes voulant acquérir légalement les droits de visionnage, de pouvoir faire cette démarche simplement. Ces fichiers ainsi protégés ne sont accessibles qu’en téléchargement, et non en streaming. La démarche de ce mémoire, était de promouvoir au sein de l’entreprise, l’adoption d’un nouveau format, le H.264, dont le sujet de ce mémoire est dédié, dans une optique de fichier téléchargeable et non en streaming.

Philippe Gourgand – Licence CPTIC - 2010

1

Table des matières
Remerciements.................................................................................................................................................... 1 Introduction : ....................................................................................................................................................... 3 Historique : ...................................................................................................................................................... 4 1 – Description de la Vidéo Numérique et formats de diffusion :....................................................................... 5 1.1 Notions de Production et Diffusion ........................................................................................................... 5 1.2 Notion de CODEC ....................................................................................................................................... 6    La fonction Codage (Compression): .................................................................................................... 6 La fonction Décodage (Décompression): ............................................................................................ 6 La fonction Transcodage (changement de CODEC) : ........................................................................... 7

1.3 Notions de structure d’un fichier Vidéo .................................................................................................... 9 1.4 Notion de débit de données (Bitrate) ..................................................................................................... 11 2 - Etude Avancée du Format vidéo AVC/H.264................................................................................................ 12 2.1 Présentation Technologique ................................................................................................................... 12 2.1.1 Technologie ...................................................................................................................................... 12 2.1.2 Apports et Etude Comparative ......................................................................................................... 21 2.1.3 : Technologies Evolutives de ce format ............................................................................................ 27 3- Solutions Alternatives : Formats Propriétaires et Open-source .................................................................. 33 3.1 – VC-1 (Format Propriétaire) ................................................................................................................... 33 3.2 – X.264 (CODEC Alternatif) ...................................................................................................................... 35 Un Contexte économique et technologique: ................................................................................................ 37 3.3 – Ogg Theora (format open-source) ........................................................................................................ 37 Voici un comparatif visuel du même fichier encodé en H.264 et en Theora ............................................ 38 3.4 – WebM (VP-8) (Format open-source) .................................................................................................... 42 Voici un petit comparatif visuel entre le VP8 et l’AVC/H.264 ................................................................... 43 Conclusion et Prospective: ................................................................................................................................ 44 Annexes : ........................................................................................................................................................... 47 Lexique :......................................................................................................................................................... 47 Bibliographie :................................................................................................................................................ 50 Notes : ........................................................................................................................................................... 51

Philippe Gourgand – Licence CPTIC - 2010

2

Introduction :
Chaque jour, lorsque vous allumez votre téléviseur, votre ordinateur, votre téléphone portable, vous visionnez des clips vidéo, des extraits de films, des émissions de télévision, avec votre Smartphone, votre caméscope, vous saisissez en vidéo des scènes entre amis. Chacune de ces vidéos est numérique et diffusée comme tel par l’Internet, les chaines de télévision TNT, les opérateurs téléphoniques, les sites de diffusion comme YouTube ou DailyMotion et autres supports DVD ou clés USB. Pour l’utilisateur final que nous sommes, ces images sont seulement différenciées par le format (hauteur par largeur) et l’écran de diffusion (petit ou grand) : la notion de « format » importe peu à l’utilisateur puisque la technologie est là pour afficher presque n’importe quelle image sur n’importe quel écran. Pourtant, l’utilisateur lambda est familiarisé avec les « formats » du cinéma : Super8mm, 16mm, 35mm, cinémascope, Panavision, … et les « formats » de la télévision : SECAM en France, PAL en Allemagne, NTSC aux Etats Unis. Chacun de ces formats évoque des notions de qualité d’image (familiale pour le super8 ou professionnelle pour le cinémascope), des spécificités géographiques et donc difficilement compatibles entre les pays : une cassette VHS achetée aux USA ne pouvait être lue sur un magnétoscope français. Dans le monde du numérique d’aujourd’hui, il en va de même. De multiples « formats » sont apparus pour fabriquer des photos et des vidéos, l’utilisateur se perd entre les « formats » de prise de vues, de retouche, de diffusion ou de stockage, et leurs incompatibilités. Pourtant, une homogénéisation des technologies du numérique est en train de voir le jour : Quel est le point commun entre les vidéos diffusées par le célèbre site YOUTUBE, le « flash » incontournable sur Internet, la TNT haute définition et le Blu-ray ? Le format vidéo Advanced Video Coding/H.264 (AVC/H.264 ou h.264). Au gré de mes premières expériences professionnelles, j’ai utilisé diverses technologies dans le domaine de la vidéo et de l’Internet, et dernièrement, au cours de la mission que m’a confiée mon maitre d’apprentissage, j’ai été amené à étudier ce format dans toutes ces composantes. L’étude menée depuis un an m’a permis d’appréhender cette technologie dans sa globalité, grâce à tous les usages que j’ai pu observer et réaliser. Au travers de ce mémoire, je vais vous montrer que le format vidéo Advanced Video Coding/H.264 (AVC/H.264 ou h.264) devient le format universel de captation, de production et de diffusion, et s’adapte à tous les usages présents et futurs. Ce format est-il réellement la solution aux attentes des utilisateurs (particuliers et professionnels), en terme de demandes de Qualité Audiovisuelle et d’Accessibilité Universelle ? Pour répondre à cette problématique, nous devrons comprendre cette technologie, la resituer dans l’ensemble des formats vidéo numériques et ainsi pouvoir en mesurer l’impact sur le futur.

Philippe Gourgand – Licence CPTIC - 2010

3

pour les applications DVB (télévision numérique européenne). La norme MPEG-2 est structurée en profils et niveaux et. l'efficacité du codage est étroitement liée à la complexité du matériel de source et à la mise en œuvre du codeur. le système AVC est intégré en tant que partie 10. partie 2. etc. partie 2. En septembre 2004. Elle sera ensuite complétée par la norme MPEG-2 pour les applications du domaine de la radiodiffusion. Le MPEG-1 est ainsi la première norme présentée pour les applications multimédia. les valeurs de la matrice de quantification et le dispositif de contrôle du débit. ce gain n'est pas suffisant pour justifier une migration du MPEG-2 vers le MPEG-4. MPEG-2 définit uniquement la syntaxe du flux binaire et les caractéristiques du décodeur.Historique : En janvier 1988. Une évaluation officielle subjective indique que le codage MPEG-4. le MPEG-1. soucieuses de mettre au point un système de compression plus efficace. à la norme MPEG-4 (ISO/ IEC 14496-10) et repris sous l’appellation H. le Motion Picture Expert Group (MPEG) réunit les experts de l’Organisation Internationale de Normalisation et la Commission Electrotechnique Internationale (ISO/CEI) pour définir un système normalisé de codage de contenus cinématographiques. Comme dans le cas de MPEG-2. puis étendue aux applications du domaine de la radiodiffusion. Ainsi. Une fois normalisée. les codeurs MPEG-2 affichent des performances différentes selon le type d'algorithme affecté à la compensation de mouvement. laissant aux fabricants le loisir d'appliquer l'algorithme côté codeur. apparait le premier successeur de la norme MPEG-2. le MPEG-4. Philippe Gourgand – Licence CPTIC .). offre un gain d'efficacité de 200 à 400 % par rapport à MPEG-2. partie 2 publiée par l'ISO. Pour ces raisons. En 2003. pour chacun d'eux. MPEG-2 a été très largement utilisée (DVB Norme TV européenne. DVD. En 1999. MPEG-4 a été définie pour des applications multimédia à faibles débits binaires. les instances de normalisation ISO/CIE (MPEG) et l’Union internationale des Télécommunications (UIT) conjuguent leurs efforts au sein du groupe de travail Joint Video Team (JVT) chargé de développer le système de codage Advanced Video Coding ou AVC. A l'instar de la plupart des autres méthodes de codage.264 (H. le débit binaire maximum que le décodeur doit pouvoir traiter est clairement défini.264. En 2001. ATSC Norme TV USA.264/AVC (MPEG-4. Part 10)). le consortium DVB modifie la norme TS 101 1542 (Implémentation Guidelines for the Use of Vidéo and Audio Coding in Broadcasting Applications based on the MPEG-2 Transport Stream) afin d'y inclure également AVC/H.2010 4 .

film de vacances… Pour tourner et monter un film vidéo. AVCHD).Dirac Video Parmi ces formats de fichier. Le logiciel de montage. Il va de soi que les formats dits propriétaires permettent à leurs auteurs de percevoir des royalties à chaque intégration dans un système d’encodage. Un film vidéo est tourné avec une caméra numérique et enregistré.2010 5 . télévision.MPG / . internet. HDV.WMV . se classent en deux catégories : les propriétaires. Exemples de formats :  Propriétaires : . 35mm. et au support d’enregistrement utilisé par la caméra. ou Panavision.Apple QuickTime : .Real Video : .Les différentes normes MPEG : . lui. ProHD. soit sur bande magnétique.rmvb  Libres : .1 – Description de la Vidéo Numérique et formats de diffusion : 1.mp4 . soit directement sur disque dur ou carte mémoire. plus ou moins spécialisés et professionnels. P2. à sa définition standard ou haute. ou sur un téléphone par exemple. développés par les constructeurs de caméras. ceci dans le but d’appréhender cette étude de la meilleure manière possible. Digital Betacam. les constructeurs de matériels et leurs technologies nous obligent à utiliser différents formats : la caméra enregistre dans un format propre à la captation d’images.mov . il convient de différencier :  Les formats de captation (production) utilisés par les caméras Grand Public (DV.Microsoft Windows Media Video : . cinémascope.264 (H. Part 10). DVCam.1 Notions de Production et Diffusion Avant de commencer à parler du format H. c’est-à-dire à partir d’un ordinateur avec un logiciel « Player » particulier. DVD. et les libres provenant d’Organisations non lucratives de développeurs d’applications et de formats libres de droits. en comparaison d’un film cinéma tourné et monté en Super8. les éditeurs de logiciels de montage et d’effets spéciaux et les Institutions internationales et Joint-Ventures. est capable de monter les images dans différents formats. Ces différents formats de fichiers vidéo numériques. Philippe Gourgand – Licence CPTIC .Ogg Theora : . HDCam.  Format de diffusion Ce sont les formats de fichier qui sont utilisés le plus souvent en lecture.rm / . et Professionnel : AVCHD. appelés éditeurs de montage vidéo.264/AVC (MPEG-4. en fonction de l’usage final qui sera fait du film vidéo. en fonction du niveau d’expertise des personnes et surtout en fonction de l’objectif de diffusion de l’œuvre : cinéma. On parle de format numérique à partir du moment où un film vidéo est réalisé. comme le Motion Picture Expert Group (MPEG). 16mm. Il est ensuite monté à l’aide de logiciels. XDCam.ogg . il est primordial d’expliquer tout d’abord certaines notions.

… Il existe de très nombreux codec. comme le MPG. Philippe Gourgand – Licence CPTIC . dont la plupart sont déjà installés dans les systèmes d’exploitation (Windows. sur téléviseur. Cette opération de codage. en utilisant un algorithme particulier. il faut donc que le CODEC approprié y soit installé (et dans le cas d’un CODEC matériel. La lecture du fichier numérique audio/vidéo se fait grâce à un logiciel intégrant le CODEC approprié. observer des tests exécutés avec La plupart des formats audio/vidéo numérique se reconnaissent différents logiciels de transcodage. logiciel 3D. (Audio Video Interleave) ou le Quicktime (.1. Ces logiciels utilisent des « players » pour visualiser le contenu multimédia et permettent la lecture de Au travers de cette étude. contenant les mêmes informations. ils offrent aussi des fonctions plus avancées comme des réglages de colorimétrie. ou décompression.MOV) d’Apple. logiciel d'animation. Mais aussi bien lors de transcodages que ces enveloppes ne permettent pas d’identifier le CODEC utilisé. ou codage.2010 6 . lecteurs multimédia. Certains sont de vrais gestionnaires de données multimédia permettant d'acheter des fichiers en ligne et de gérer les DRM. Ces applications de lecture sont des logiciels de lecture simple et des logiciels d'édition : logiciel de montage vidéo. est la lecture du fichier numérique audio/vidéo. Un codec est une application capable de compresser et/ou décompresser un signal numérique audio/vidéo en l’encodant et/ou le décodant. La décompression est l'opération inverse de la compression. Pour qu’une vidéo soit lisible sur un ordinateur ou tout autre lecteur multimédia. par la forme de leur enveloppe de transport (on dit que les Cela ayant pour but de confronter formats sont encapsulés). nous allons métadonnées. On constate. lors de décodages.  La fonction Décodage (Décompression): La fonction de décodage. et d’un autre côté. l’AVI de Microsoft leurs performances. audio. sur téléphone. qui consiste à transformer une suite de bits A en une suite de bits B plus courte. … Les Codecs encodent des flux pour la transmission ou le stockage. Linux. logiciel d’effets. ce processus correspond à la nécessité de « normer » avec précision un format (16/35mm ou MPG1/MPG2. dans le but de rendre la représentation compressée plus courte que la représentation originale.  La fonction Codage (Compression): La fonction de codage (ou d’encodage) est la compression de données.2 Notion de CODEC CODEC est l’abréviation de COmpresseur-DECompresseur. D'autres sont capables grâce à un moteur de recherche local de cataloguer et organiser ces données. …) des ordinateurs. à l’instar de Google. que Microsoft et Apple développent en interne leurs propres CODEC et les implantent dans leurs systèmes d’exploitation. décodent ces flux pour l’édition ou la restitution du flux. sans saccade et ne consomme pas abusivement la puissance du processeur. On dit qu’un CODEC est performant en lecture si l’image qu’il affiche est nette. consiste à changer la représentation de l'information. téléphones. Il existe deux types de CODEC : les CODEC logiciels et les CODEC matériels On peut comparer le codage d’un film vidéo aux perforations sur le bord d’un film cinéma. Mac. que soit présente une carte de décompression). Dans les deux cas. par exemple) dans le contexte d’un usage précis : projection sur grand écran.

soit la qualité du média à une quantité de données d'information (résolution. Ainsi. finesse des détails) compatible avec le support envisagé au transport. On notera qu'il ne s'agit pas d'un codage au sens strict du terme car le plus souvent la transformation comporte des pertes. ou en changeant sa définition. Il est aussi utilisé pour adapter le média aux matériels. Le transcodage permet d'adapter le format du média au support sur lequel il est transporté. permet de faire contenir un film de plus d'une heure sur un support de 650 Mo (CD). le format SVCD par exemple. soit sa quantité d'information véhiculée en modifiant par exemple le nombre d'images par seconde d'une vidéo. On adaptera donc. stocké ou diffusé.7Go) en raison du codec utilisé pour parvenir à cela : on parle alors d’un codec destructif. est le fait de changer le format de codage d’un média en le comprimant ou l’encapsulant. en vidéo et/ou en audio. La fonction Transcodage (changement de CODEC) : Le transcodage. au prix d'une qualité d'image moins bonne qu'un DVD (4.2010 7 . aux normes différentes en vue de son traitement (interopérabilité). Philippe Gourgand – Licence CPTIC . au stockage ou à la diffusion du média.

(Schéma de transcodage vers différents supports) Philippe Gourgand – Licence CPTIC .2010 8 .

ainsi que d’autres données comme une description des flux que contient le conteneur.AVI peut contenir différents formats de fichiers Philippe Gourgand – Licence CPTIC .3g2) : défini par le 3GPP.2010 9 .wmv) : développé par Microsoft. Inc. des chapitrages.3 Notions de structure d’un fichier Vidéo Un fichier vidéo est composé de plusieurs parties . 3gp (extension . Matroska (extension : . cet élément ne contient que les informations nécessaires pour afficher la vidéo. Le Flux vidéo. il s’agit en général de fichiers texte contenant les données spatiotemporelles permettant de synchroniser les textes avec le film. Les principaux conteneurs vidéo sont : Advanced Streaming Format (extension : .mkv) : développé par CoreCodec. ou « container » il s’agit d’une « capsule » qui va contenir en son sein le flux vidéo et le flux audio ainsi que les fichiers de sous-titres . RealMedia (extension : . QuickTime (extension : .avi) : développé par Microsoft. date. Le conteneur. Le lecteur va ensuite se charger de séparer les deux flux pour les lire.1. etc.asf) : développé par Microsoft. Material eXchange Format (extension : .mpeg) : codec et conteneur défini par le Moving Picture Experts Group. Le type de flux est déterminé par le CODEC utilisé (COdage /DECodage) Il est aussi défini par le nombre d’images par secondes (Frame Per Second-FPS).nut) : développé par des développeurs de MPlayer et FFmpeg.mpg ou . des métadonnées (auteur.mxf) : standard de la SMPTE.mov) : développé par Apple. Le nombre d’images par seconde est défini ainsi : 25 images/sec (Europe) 30 images/sec (USA/ Japon) et 24 images/sec (Cinéma) Le Flux audio. Audio Video Interleave (extension : . cet élément contient la ou les pistes audio incluses dans le fichier vidéo à lire. cette donnée est différente. En fonction de l’utilisation voulue.).3gp ou . il est possible en fonction des spécifications du fichier de contenir plusieurs pistes. MPEG 1/2/4 (extension : . comme sur un DVD par exemple. NUT Container (extension : . Windows Media Video (extension : ..org.rm) : développé par RealNetworks. Ce conteneur a pour principale utilité de faciliter le transport et la lecture d’un fichier. - - - - Il ne faut pas confondre format et conteneur ! Un conteneur . Ogg Media (extension : .ogm) : développé par Xiph. Les fichiers de sous-titres.

Chaque profil a son utilisation finale. Cela indique au logiciel de décompression les ressources machine nécessaires pour décompresser la vidéo. dans la 2ème partie de ce mémoire.1 (le plus élevé) correspond à des limitations sur un certain nombre de paramètres. Philippe Gourgand – Licence CPTIC . Plus son profil est élevé.  Chaque fichier vidéo possède aussi un NIVEAU (Level). et plus sa décompression va requérir de ressources. Ce profil est défini lors du processus de transcodage par le logiciel. celui-ci correspond à des caractéristiques le destinant à des applications différentes. Ces deux notions seront détaillées plus tard. Ce niveau. est une valeur comprise entre 1 (le plus bas) à 5. Chaque fichier vidéo possède un PROFIL. qui lui est propre. il est possible d’influer manuellement sur ces réglages mais cela reste réservé aux utilisateurs expérimentés.2010 10 .

on attribue une valeur de Bitrate.5Mb/s si la vidéo est complexe. les fichiers encodés ont un poids sensiblement inférieur à ceux encodés avec un débit de type constant. Cette donnée est exprimée le plus souvent sous forme de valeur en Kilobit par seconde (Kb/s). En fonction de la définition de la vidéo. à l’inverse pour les séquences complexes. Puisque celui-ci va s’adapter automatiquement à la complexité de la vidéo. Ce type de débit a l’avantage certain de rendre un fichier de qualité supérieure. plus le Bitrate doit être important. est la valeur de son débit de données. c’est-à-dire sa taille. Exemple : une vidéo Haute Définition aura un Bitrate de 6Mb/s (voir 15Mb/s pour un film commercial) alors qu’une vidéo pour l’Internet dans une définition plus standard pourra avoir une qualité correcte avec un débit de 1Mb/S voire 1. Lors du processus d’encodage. Philippe Gourgand – Licence CPTIC . L’amplitude. comme la taille d’un écran d’ordinateur.1.4 Notion de débit de données (Bitrate) Un critère essentiel pour juger de la qualité d’un fichier. Lors de séquences ne nécessitant que peu d’informations la valeur va être réduite automatiquement en fonction de la charge nécessaire. le débit est augmenté.2010 11 . celle-ci est exprimée en pixel. Pour les fichiers de plus grande taille comme des vidéos en Haute Définition (HD) celui-ci peut être exprimé en Mégabit par seconde (Mb/s) Il convient généralement de dire. De plus. Plus la définition est importante. Le Flux audio et le flux vidéo ont chacun un débit propre. que plus le débit est élevé et plus la qualité du flux est excellente.  Le Débit Variable (VBR) Le débit fixé n’est qu’une moyenne. celle-ci correspond à la qualité que l’on veut donner au fichier encodé. à l’inverse si celle-ci est réduite. l’écart entre le début minimum et le débit maximum varie selon les choix de l’utilisateur ou des paramètres prédéfinis du logiciel. appelé le Bitrate. le débit peut être diminué. Cet écart peut être extrême sans pour autant augmenter significativement le poids du fichier. Il convient de différencier 2 types de Bitrate en vidéo :  Le Débit Constant (CBR) Le débit du fichier est fixé à une valeur donnée pour toute la durée de la vidéo et/ou de l’audio.

(Pour la chrominance. le format AVC/H. ce filtre est appliqué pendant l’opération de transcodage. Les précédentes normes étaient limitées à 2 images de références. 2.1 Présentation Technologique 2. ses utilisations et ses évolutions. le consortium chargé de sa normalisation a défini des critères à respecter pour que ce format soit « viable » et surtout performant pour être en mesure de remplacer la précédente norme MPEG2. et pourquoi celui-ci est à même de répondre aux besoins technologiques actuels. ceci permet d’avoir un rendu plus précis des déplacements des zones mobiles.  Une précision au quart de pixel pour la compensation de mouvement. Ceci permet d'utiliser dans certains cas jusqu'à 32 images de référence.264 a été conçu pour remplacer les normes vieillissantes de vidéo aussi bien télévisuelles que cinématographiques.264 présents sur le marché.264) Philippe Gourgand – Licence CPTIC . Il serait difficile de dire qu’il s’agit d’une étude avancée si nous n’évoquions pas les aspects techniques qui sont l’essence même du format AVC/H. la précision de la compensation de mouvement se fait même au huitième de pixel.2 . le consortium MPEG avait inscrit au cahier des charges que ce nouveau format devrait apporter un gain de qualité théorique de 40% en terme de rapport « Poids/qualité visuelle » en opposition au format MPEG-4.264 dans ses utilisations. nous allons définir ce qu’est le format Vidéo AVC/H.264 Au travers de ce mémoire.Etude Avancée du Format vidéo AVC/H. Au travers de différents tests et exemple concrets. il faut savoir que lors de l’élaboration de ce format. nous allons présenter et observer les technologies présentes au sein de ce format. Le choix de l'image de référence intervient au niveau MacroBloc et sous-MacroBloc. Ce format possède différentes technologies lui permettant de compresser plus efficacement les vidéos que les normes précédentes (ex : MPEG-2 et MPEG-4 part 2 ASP)  Une meilleure compensation des mouvements dans l’utilisation des images déjà encodées comme références.2010 12 .)  Un filtrage anti-blocs. Le Format AVC/H. Celle-ci comprend différentes technologies qui doivent être implémentées au sein des différents CODEC AVC/H. Comme nous l’avons vu précédemment.264. nous allons observer comment se comporte le format AVC/H. et en quoi ce format répond aux attentes des consommateurs.264. et a pour but de réduire les artefacts caractéristiques d’un codage par bloc. (n’est pas disponible dans tous les profils H. Avant tout.1. (pixellisation)  Un codage Arithmétique (CABAC : Context-Adaptive Binary Arithmétiques Coding) qui est une technique sophistiquée de codage entropique qui produit d'excellents résultats en terme de compression mais possède une grande complexité demandant une machine puissante pour être décodé. un peu de technique. Dans cet objectif.1 Technologie Au travers de cette partie.264 à proprement parler est une norme. Mais tout d’abord.

Donc en MPEG-2 . Comparons 2 formats utilisés en utilisation commerciale . il faut nuancer ces valeurs. il n’y a qu’un seul fichier pour la globalité du film. et ces fichiers sont dénommés en . aussi du fait de sa plus grande compression. permettant ainsi d’avoir un fichier HD avec un poids inférieur au 5.264 576p 3Mb/s est recommandé AVCHD : entre 5 et 24 Mbit/s en 720p et 1080p Un film H. Par contre. donc complexité. On remarque que le format AVC/H. il peut y avoir une légère coupure de l’image pendant un bref instant. Les chiffres donnés ne sont que des moyennes permettant d’afficher une marge suffisante pour permettre aux CODEC de travailler sur le flux vidéo de manière optimale.264 qualité Blu-ray en 1080p peut « peser » jusqu’à 35Go ! Il est difficile pour ce format de donner une valeur de référence pour 30minutes.264 de « dépasser » les standards précédents en termes de qualité dans une grande variété de circonstances et dans une grande variété d'environnements d'application.2Go nécessaire à un fichier d’1h en 6Mb/s Philippe Gourgand – Licence CPTIC . en obtenant la même qualité avec un Bitrate diminué de moitié. Cela explique pourquoi lorsque l’on visionne un DVD. Le DVD « existant » depuis 1995. De plus. Cela apporte un nouveau standard en termes de qualité de diffusion.264 produit des fichiers dont le « poids » est inférieur à une vidéo MPEG-2. la durée maximale va dépendre de la technologie de compression utilisée (Compression à débit constant ou variable) Ce principe est applicable à tous les formats de vidéo et à tous leurs supports. cela varie en fonction du matériel de captation ou du logiciel utilisé.  Un codage adaptatif de type Huffman à longueur variable (CAVLC : Context-Adaptive Huffman Variable-Length Coding) La numérotation des images permet la création de sous-séquences (ceci permet une « Scalabilité temporelle » que nous étudierons plus tard dans ce mémoire) Ces technologies.264 utilise la plupart du temps un encodage de type Variable. cela est approximatif car dépendant de la qualité visée par le studio responsable de la production du DVD. celui-ci contient plusieurs fichiers Vidéo encodés en MPEG-2 en 720x576 pixels (576p) La particularité du DVD est de concaténer la totalité du film en plusieurs fichiers de 1 Go. carte de décompression HD…). Prenons un DVD par exemple. mais nécessite un PC relativement puissant ou un matériel de décompression dédié (lecteur Blu-ray de salon. le processeur ne décompresse plus le MPEG-2.2010 13 . en AVC/H. Toutefois.576p : 1Go ≈ 30minutes (MPEG-2 : entre 1 Mbit/s et 15 Mbit/s en définition standard (SD : 720 x 576 pixels en PAL)) Sur un Blu-ray où le format AVC/H.VOB.264 est utilisé. et les ordinateurs étant limités à l’époque. car le H. Cela ne produit pas de coupure pendant la lecture. Les images ne nécessitant pas du débit maximum seront bien sûr encodées à un débit moindre. Un VOB correspond à environ 30 minutes de vidéo. il a fallu trouver une astuce pour réduire la charge du processeur lors de la décompression des films. voire plus. la carte graphique s’occupe de cette tâche. Depuis. Cela est dû au changement de « VOB » pendant la lecture. ainsi que plusieurs autres permettent au format AVC/H.

8×16. Exemple : un Blu-ray contient au minimum 2 pistes.…) Ensuite. En effet. lors d’un encodage d’une vidéo d’un format vers celui-ci. 16×8. réencodé la vidéo. Panavision.Concrètement. une zone ayant peu. le CODEC va analyser la vidéo source. l’opération de transcodage débute. ou encore au format cinéma « anamorphosé » (cinémascope. le logiciel a. une zone contenant du mouvement sera définie par des MacroBloc de plus petite taille pouvant ainsi reproduire ce mouvement de manière plus précise. le CODEC va. 4×4) Plus leur taille sera petite.264 peut. Lors de cette opération le logiciel va analyser image par image les éléments (objets) apparents ainsi que leurs trajectoires. (Schéma simplifié du processus d’encodage et de décodage) Philippe Gourgand – Licence CPTIC . Une fois cette opération de transcodage terminée le logiciel va « recoller » les flux Vidéo et Audio dans le fichier conteneur. Lors du transcodage. on dit qu’il effectue un multiplexage. 8×4. nous l’avons dit. plus leur précision sera proche de l’originale. au sein du conteneur supporter différents format audio. Ceux-ci étant généralement désignés ainsi : (16×16. compresser ces images à l’aide de « MacroBloc » ceux-ci sont des blocs de Pixel de différentes tailles. La taille de ces blocs est définie à l’avance par l’analyse de leurs emplacements sur l’image. 8×8.2010 14 . ou pas du tout de mouvement sera définie par des MacroBloc plus « gros » donc moins précis. mais aussi les couleurs des images ainsi que l’aspect de l’image s’il s’agit d’un film en 16/9 ou 4/3. en fonction de l’analyse. Par différence. Car un format comme l’AVC/H. et fait de même avec la ou les différentes pistes son. la VO et la VF. 4×8.

mais la complexité étant moindre. le fichier peut être lu à condition de posséder un logiciel pouvant décompresser la vidéo ou tout autre appareil comme un téléphone compatible ou un lecteur de salon. nous n’aborderons pas l’épineux problème du streaming illégal. Cela permet de laisser le processeur libre pour d’autres opérations. mais certains formats audio dit « lossless » (sans perte) permettent de bénéficier d’un son de grande qualité. pour une utilisation Internet. Un avantage certain pour les personnes qui ne veulent pas télécharger un fichier complet DVD ou HD. Philippe Gourgand – Licence CPTIC . son travail est facilité. Certains Netbook plus « avancés » possèdent un GPU plus puissant. être assez complexe à décompresser et donc à visualiser. (Nous parlons ici de streaming. Mais cela est souvent un argument marketing. Il est possible à l’heure actuelle de visionner certaines vidéos encodées dans ce format à l’aide d’un Smartphone. par exemple. La problématique principale devient alors la « Bande Passante » Il devient nécessaire d’avoir accès à une connexion Internet à haut débit pour bénéficier de l’affichage de film en streaming.264 peut.Comme nous l’avons vu précédemment. Celles-ci deviennent suffisamment puissantes pour décoder en partie ou totalement les flux vidéos. qui sera utilisé plus loin dans ce mémoire. pouvant décompresser des flux HD. A noter. leur poids est plus faible donc plus facile à transporter. car celle-ci a pour rôle d’acheminer le flux vidéo jusqu’à votre ordinateur. un transcodage peut induire une perte de données. qu’il existe aussi des formats vidéo sans perte. à télécharger. Toutefois. La contrepartie. L’ordinateur a toujours le rôle de la décompression. le traitement nécessitera de la part du processeur un apport de puissance bien supérieur.264 ont comme avantage d’être pleinement compatibles avec cette technologie.2010 15 . il existe une « parade » : les Cartes Graphiques ou GPU (Graphic Processor Unit). Toutefois. dont principalement le Motion JPEG 2000. vous êtes tributaire de la technologie Flash de l’éditeur Adobe.) Le streaming a l’avantage de diffuser des fichiers de qualité inférieure. On appelle cela le DXVA (DirectX Video Acceleration) Certains Codec (propriétaires) AVC/H. est que le format AVC/H. les fichiers sont « taillés » pour le streaming. donc de qualité visuelle inférieure. Ceci interdit la lecture de film sur des ordinateurs peu puissants comme les Netbook. Toutefois. Le « problème » de complexité ne s’applique pas. veut dire que pour décoder le ou les flux. dans certaines conditions nécessitant une qualité maximale. Une fois multiplexé. La notion de complexité.

Le Profil « Intra » est utilisé pour les fichiers produits par les caméras de type professionnel.1 Profils On appelle « Profils » un ensemble d’outils. ceci permettant d’avoir une uniformisation des fichiers malgré leurs nombreux profils. C’est aussi un moyen de normer les différents fichiers. Ces outils sont autant d’implémentations qu’il existe de technologies d’optimisation dans le h. puisqu’il va en fonction des réglages définis par l’utilisateur. a la capacité d’être flexible sur ce point.1. Tout fichier possèdera un Profil. Il est donc défini lors du processus de transcodage par le logiciel. présentant leurs technologies et possibilités 16 Philippe Gourgand – Licence CPTIC . le plus généralement le profil « Main » le plus standard Le profil « Baseline » et « extended » sont utilisés pour le streaming Le Profil « High » est utilisé pour les fichiers HD et nécessitant une haute qualité.2010 . sélectionner le bon profil. permettant ainsi au décodeur d’adapter son processus de décodage par rapport au mode de codage préalablement défini. il permet l’édition des fichiers HD ou SD dans les logiciels de montage vidéo professionnel. toutefois il est possible d’influer manuellement sur ces réglages mais cela reste réservé aux utilisateurs expérimentés. (Schéma des 3 Profils les plus utilisés et les plus courants) Ce schéma présente les principales différences entre les profils. chaque profil est défini en fonction des technologies supportées ou non. principalement des algorithmes et des process liés au codage et au décodage de vidéo.1. Un logiciel d’encodage.2.264.

qui seront bienvenues pour un usage professionnel et commercial.2010 17 .Certains Profils ont plusieurs déclinaisons particulièrement le « High » et le « Intra » Les différences sont souvent minimes mais apportent une ou deux améliorations et optimisations. (Schéma des profils utilisés par la plupart des logiciels d’encodage professionnels et amateur) Ce schéma apporte un complément d’information quant à la différenciation des sous profils « Main » et « High » Philippe Gourgand – Licence CPTIC .

(Schéma des Profils utilisés par les studios de Production pour le montage (Intra) et pour une utilisation commerciale (High)) Ce schéma présente les différenciations entre le profil « Main » et les profils « Intra » utilisé en Production ! 18 Philippe Gourgand – Licence CPTIC .2010 .

(Schéma présentant des exemples de profils et niveaux en fonction de la résolution de l’image) Un profil de niveau 1 par exemple ne pourra s’appliquer qu’à une vidéo de 128×96 pixels a 30images/s Alors qu’un niveau 3 ne s’applique que pour les vidéos de 720×576 pixels à 25images/s (Qualité DVD) Vous l’aurez compris pour de la Haute définition. Plus son profil est élevé. est déterminée lors de l’encodage du fichier vidéo.1 voire dans certains cas. mais le niveau d’un fichier est un élément très important à prendre en compte.2. Celle-ci se trouve dans de rares logiciels spécialisés permettant l’édition de Master 2 K ou 4 K pour le Cinéma et l’édition de DVD et Blu-ray. plus particulièrement son flux vidéo : sa résolution. Elle indique au logiciel de décompression les ressources machine nécessaires pour décompresser la vidéo. un niveau 4 est nécessaire. Cette valeur va de 1 à 5. et est en rapport avec les différents éléments qui composent le fichier. car c’est à partir de ce niveau qu’un fichier est capable de posséder une résolution aussi importante. un Blu-ray par exemple doit avoir un niveau plus élevé .1.4. Philippe Gourgand – Licence CPTIC .2 Levels (Niveaux) Nous l’avons déjà abordé dans les notions. son débit (Bitrate) et surtout son profil.2010 19 .1. Cette Valeur. une valeur plus importante allant jusqu’à 5. et plus sa décompression va requérir de ressources.

080@67.5 62.920×1.2 20.7(10) 352×576@25.76 522.048×1.0 (7) 352×288@15.0 (13) 720×576@66.704 50 50 62.536 3.1 3.3 (9) 1.080@120.7 (5) 1.304 6 12 Hi422P.88 19.0 (6) 720×576@25.0 (6) 352×480@30.0 (7) 352×288@30.0 (5) 1.24 8.024@72.2 245.0 (3) 352×288@7.280×720@60.0 (5) 1.5 (5) 352×480@61.536@26.080@72.6 5.0 (4) 1.920×1.88 11.048×1.048×1.62 4 5 12 16 3 40.3 (13) 2.1 (4) 2.08 135 168.152 2.6 (7) 720×480@15.920×1.2 1.0 (6) 720×576@12.304@26.3 (9) 320×240@10.485 3 6 11.280×720@68.024@30.560×1.9 (8) 176×144@15.1 (4) 2.0 (4) 128×96@30.2 (6) 320×240@36.76 3.048×1.485 1.920×1.0 (6) 352×480@30.0 (5) 4.0 (4) 1.7 (11) 1280×720@30.080@60.2 (4) 1.0 (4) 2.680×1.0 (7) 352×288@30.920×1.5 25 25 42 60 60 56 80 80 4.4 (12) 352×576@51.25 1.024@42.3 2 2.0 (5) 720×480@80.0 (13) 2.080@30.1 (10) 720×480@30.1 983.5 1.5 (16) 4.75 405 540 5.080@30. XP.864 240 300 720 960 Philippe Gourgand – Licence CPTIC .5 150 150 200 200 5 589.62 10 12.8 (12) 2.192 14 20 20 17.048×1.2010 20 .1 4. MP (kbit/s) 64 128 192 384 768 2 4 Max video bit rate (VCL) HiP (kbit/s) 80 160 240 480 960 2.0 (4) 176×144@30.9 (8) 176×144@15.12 8.096×2.824 22.8 per frame 99 99 396 396 396 396 792 BP.192 8.096×2.5 30 40 3.Max macroblocks Level per second 1 1b 1.1 1.280×720@68.280×1.3 (9) 1.0 (6) 320×240@36.2 4 108 216 245.7 (5) 2.048@30.920@30.7 (5) 3.1 1. Hi444PP (kbit/s) 256 512 768 1.5 5 Hi10P (kbit/s) 192 384 576 1.5 (2) 320×240@20.024@30.0 (4) 1.072 8 16 Examples for high resolution @ frame rate (max stored frames) 128×96@30.0 (7) 352×576@25.080@64.04 36.

utilisant le format JPEG.com. encode une vidéo en 25 ou 24. car toutes les images sont dans ce format. En termes de technique pure. 97 images JPEG par seconde. C’est principalement pour cela que l’industrie du cinéma a choisi ce format pour les films Blu-ray . ici le Full HD 1080p.Qualité visuelle psychologique . de créer un fichier totalement parfait qualitativement.Poids du fichier .2010 21 . nous allons changer le format de cette vidéo. d’un ordinateur à un autre. (Les temps de travail pouvant varier en fonction de la configuration matériel. Il s’agit d’un format de vidéo.) La bande annonce retenue est celle du film « Scott Pilgrim VS the world » L’avantage de cet extrait. est qu’il est assez court (environ 2minutes). cela permet de voir beaucoup plus facilement à l’œil nu.2 Apports et Etude Comparative Tout d’abord. ou plutôt une bande annonce dans laquelle.1. toutes les vidéos seront encodées sur le même ordinateur. ce gain de place permet de mettre sur un seul disque le film en Haute définition. non compressé. une meilleure précision et compensation du mouvement. encore très utilisé aujourd’hui. ce format apporte un gain de place indéniable . Les images utilisées. Cette Bande annonce a été récupérée sur un site internet. Cela a pour avantage de ne perdre aucune information.HD-trailers. qu’il est composé à la fois de scènes d’action très colorées avec beaucoup de mouvements ainsi que des passages détaillés plus lents. les défauts et artefacts visuels. ce format apporte un plus grand respect des chrominances de l’image. www. Le choix a été porté sur le standard de projection du cinéma numérique. Avant d’effectuer ces tests. Satya Bhabha et Mary Elizabeth Winstead. mais extrêmement lourd (700Mo pour environ 2Minutes de films en HD) Philippe Gourgand – Licence CPTIC . les pistes sons. représentent les acteurs Michael Cera. un film encodé en AVC/H. Sa qualité visuelle est la même qu’une version commerciale Blu-ray. et différents bonus. en opposition au même film encodé dans un format brut de production ou un autre format comme le MPEG-2 voire même son prédécesseur le MPEG-4.Charge du processeur lors de la décompression Nous allons sélectionner un extrait de film.2. Lors d’un comparatif de qualité. L’avantage d’utiliser une vidéo de cette qualité permet d’avoir beaucoup plus de pixels que sur une Vidéo qualité DVD en 576p (720x576). nous aurons des séquences ayant des mouvements rapides mais aussi peu de mouvement. Nous allons comparer le rendu d’un film (un court extrait) selon différents critères : . Le MJPEG 2000. que tout le monde connait. La meilleure manière pour moi de vous démontrer les apports de ce format. Pour que ce comparatif soit représentatif. par un format brut.Pixellisation . le Motion JPEG 2000. est de vous présenter un comparatif visuel sur une vidéo en Haute Définition. Elle est au format Full HD soit 1920x1080.264 « pèse » beaucoup moins de Megaoctet sur un Disque Dur.

Mais en utilisant les réglages de base.Procédure de test : Le fichier ainsi créé est importé dans différents logiciels d’encodage du marché. nous utilisons les paramètres utilisés par monsieur tout le monde.4Mbits Constant Utilisation CPU 10% Philippe Gourgand – Licence CPTIC . Pour être représentatif. Image de référence : Au format JPEG 2000 1920x1080pixels Poids 711Mo Débit 39. Nous pourrions utiliser des milliers de réglages pour affiner les fichiers finaux.2010 22 . nous allons utiliser des logiciels propriétaires payants et d’autres libres et gratuits. J’ai gardé les réglages par défaut de ces logiciels.

2010 23 .6Mo Débit 1.Logiciel : AVS Video Converter Transcodage MPEG-4 sans utilisation de B-frame : 4 Min de traitement Poids 67.6Mo Débit 3.5Mb/s Variable Utilisation CPU : 5% Transcodage H.7Mo Débit 3.29Mb/s Variable Utilisation CPU : 13% Philippe Gourgand – Licence CPTIC .5Mb/s Variable Utilisation CPU : 5% Transcodage MPEG-4 avec utilisation de B-frame : 7 Min de traitement Poids 67.264 : 8 Min de traitement Poids 26.

7Mo Débit 6Mb/s Constant Utilisation CPU : 8% Transcodage VC-1 : 5 Min de traitement Poids 113.4Mo Débit 6Mb/s Variable Utilisation CPU : 15% Transcodage H.264 : 7 Min de traitement Poids 111Mo Débit 6mb/s Constant Utilisation CPU : 10% Philippe Gourgand – Licence CPTIC .2Mb/s Variable Utilisation CPU : 6% Transcodage MPEG 2 HD : 4 Min de traitement Poids 118.Logiciel : Main Concept reference Transcodage MPEG 4 : 6 Min de traitement Poids 117Mo Débit 6.2010 24 .

Logiciel : Adobe Media Encoder Transcodage H.2010 25 .264 : 24 Min de traitement Poids 525.5Mo Variable Utilisation CPU : 20% Transcodage MPEG-2 HD : 6 Min de traitement Poids 351.7Mo Débit 18.8Mo Débit 28.5 Variable Utilisation CPU : 7% Transcodage WMV : 25 Min de traitement Poids 151.5Mo Débit 8Mo Variable Utilisation CPU : 10% Philippe Gourgand – Licence CPTIC .

MainConcept Reference.8Mo Débit 1. De plus. comme nous avons pu le voir précédemment. On peut aussi remarquer que la consommation de ressources processeur durant la lecture varie en fonction du logiciel utilisé pour créer le fichier H. car les algorithmes de compression qui le composent sont plus « méthodiques ». La liste de ce type de logiciel est longue . ou de fichiers à destination d’un baladeur par exemple. Vous pouvez aussi noter les différences de rendu chromatique entre les différents formats ! Philippe Gourgand – Licence CPTIC . La consommation est dépendante de l’algorithme utilisé pour le transcodage du fichier. Si le logiciel est de type professionnel son temps de traitement va souvent être plus long. en moyenne. AVS vidéo Converter.2010 26 . le logiciel Adobe Media Encoder. ne causant ainsi pas d’incompatibilités. mais aussi de sa structure interne. Ce logiciel n’ayant pas pour vocation de faire de la qualité « Broadcast » les fichiers finaux ne sont que trop rarement « normés ». mais aussi de divers paramètres comme son profil et son niveau. En effet ce dernier installe un de ces programmes souvent gratuit ou à un coût dérisoire.1 Mb/s Variable Utilisation CPU : 13% On remarque tout de suite les disparités de poids. Un logiciel n’ayant pas pour vocation d’être « Broadcast » aura une vocation plus grand public : transcodage de film de vacances. car les fichiers traités ont comme finalité d’être publiés ou utilisés par l’utilisateur dans un cadre familial.Logiciel : MediaCoder Transcodage x.264. En fonction de la complexité de la vidéo cela va entrainer un temps et un effort de calcul plus soutenus. Xilisoft vidéo coder. ou simplement publication sur Internet. MediaCoder… Ceux-ci ont un temps de traitement plus court. c’est-à-dire qu’il crée un fichier de type « Broadcast » prêt à être diffusé. est un logiciel Professionnel (il fait partie d’un Workflow complet Adobe Production). et importe dans celui-ci une liste de fichiers qu’il veut transcoder. de temps de calcul et d’utilisation du processeur de la machine. Dans le cas de notre étude ci-dessus. impliquant ainsi le plus souvent des incompatibilités avec certains autres logiciels de visionnage ou plateforme de publication en ligne. SUPER.264 : 6 Min de traitement Poids 22. Ceci est principalement causé par la finalité du logiciel (Professionnel ou Grand public). le logiciel va « normer » le fichier final. en étant sûr que le fichier soit respectueux de la norme.

La vitesse de Connexion internet pour une lecture en Streaming. En octobre 2003.264 développée conjointement par UIT-T et l'ISO. . Les deux groupes ont créé le Joint Video Team (JVT) pour développer la norme H. dont douze basés sur la compression par ondelettes. vous visionnez un film en streaming. et au même moment un membre de la famille commence le téléchargement d’un fichier de grande taille.2.264. Le CODEC SVC nécessite l’utilisation de plusieurs couches « Layers ».264 | ISO/IEC 14496-10 AVC). Ces différents paramètres sont : .1 : Scalable Video Coding (SVC) Il s’agit du nom donné à une extension du format H.La résolution maximale de l’écran. . proposée par l'équipe image du Heinrich-Hertz-Institut (HHI) est choisie par MPEG comme point de départ de son projet de standardisation de SVC. sont proposés. c'est-à-dire que le contenu peut être encodé une fois. Le logiciel chargé de la décompression va automatiquement adapter le décodage en fonction de ces paramètres. sélectionner la ou les couches pouvant être lues et surtout sélectionner en priorité celle qui possède le plus fort ratio Qualité/Poids. chaque couche va être encodée à différents débits. ou MPEG-4 AVC (ITU-T Rec. celles-ci sont réunies dans un seul et même fichier. le groupe Moving Picture Experts Group (MPEG) lance un appel à la communauté scientifique (« Call for Proposals on SVC Technology »). pour permettre à l’utilisateur d’avoir la meilleure expérience possible. Automatiquement la qualité de la vidéo va diminuer. En janvier 2005. Philippe Gourgand – Licence CPTIC .1. Exemple. les groupes MPEG et Video Coding Experts Group (VCEG) se sont entendus pour finaliser le projet SVC comme un amendement de leur standard H. C'est probablement le premier service à utiliser cette norme pour des applications "grand public".3. Les deux propositions restantes étant des extensions de H. Google a lancé son nouveau service "Gmail Video chat" qui utilise un codec H. le lecteur va en fonction de plusieurs paramètres déterminants. L'objectif de SVC est d'offrir un contenu échelonnable. L'une d'elle. dit Scalable.2010 27 . et peut même le faire à la volée. En Novembre 2008.La puissance de décodage de la machine ou de l’appareil mobile qui effectue la décompression. Quatorze projets. Lors du décodage. H.264/MPEG-4 AVC. et offrir ensuite différents paliers de qualité en utilisant différents débits. pour adapter son Bitrate en fonction de la bande passante disponible sur votre ligne.264/MPEG-4 AVC.1.3 : Technologies Evolutives de ce format 2.264/SVC.

Mais la question du poids du fichier ? On pourrait penser que de cumuler des couches implique le cumul du poids de toutes celles-ci. Et croyez-moi. Grace à des algorithmes.net/media/experiencesmoothstreaming Mais aussi en fonction de la résolution de votre écran ! - Philippe Gourgand – Licence CPTIC . 25 à la télévision française. la résolution d’une vidéo.iis. vous téléchargez un film encodé en SVC et le donnez à un ami. télévision. Or pendant la lecture le logiciel va adapter le fichier à son écran plus grand que le vôtre par exemple en utilisant le layer FullHD 1080p alors que vous utilisiez le layer 720p. certaines zones de l’image affichée sont partagées à toutes les couches. celle-ci ne seront lues que si cela est nécessaire. celui-ci n’a sûrement pas le même matériel que vous (ordinateur. souvent plus aigu ! Scalabilité Spatiale : Ce concept permet de changer la taille. le fichier peut être lu depuis un téléphone mobile avec son petit écran ou depuis un Home Cinéma FullHD 1080p voire plus ! Cela dépend du nombre de couches de Scalabilité utilisées. Il y a 3 grands Principes de Scalabilité : . Hypothétiquement. le fichier ne peut plus être pris en défaut. 29. Cependant celle-ci pourra se retrouver accélérée. vous verrez apparaitre des artefacts visuels. Les pixels ont été grossis ainsi que les défauts. vous ne faites que grossir les pixels de cette vidéo. Mais certes le poids du fichier est bien sûr supérieur à un fichier « simple ».2010 28 . et que vous visionnez un film DVD. Scalabilité Qualitative : Cela consiste à rajouter des couches de détails lors de l’encodage du fichier. Microsoft a implémenté cette technologie au sein de sa technologie de diffusion Internet « Silverlight ». On appelle ceci une « interpolation de pixel ». 24 au cinéma. Or la Scalabilité permet grâce à certains algorithmes d’encodage de passer d’une résolution moyenne à une résolution plus grande sans avoir une pareille détérioration. Lorsque vous agrandissez une vidéo dans un lecteur. Démonstration accessible à cette adresse : http://www. Or ce n’est pas le cas. Plus de cas où votre PC n’est pas assez puissant pour décompresser un flux. il y aura une différence au niveau du son. la preuve en est que si vous possédez une télévision HD.Scalabilité temporelle : Chaque vidéo possède un nombre d’image par seconde différent. il est estimé théoriquement a un surpoids de 40% au minimum. comme passer de 24 images par seconde pour un film en salle et 25 images pour sa version DVD. en augmentant le Bitrate de la bande passante dans le cas d’un fichier lu en streaming.97 aux Etats Unis… Le concept de Scalabilité temporelle permet pour une même vidéo de changer ce paramètre sans détériorer le rendu visuel final de la vidéo.Autre exemple. lecteur…). Ceci peut être applicable à toutes les situations.

(Schéma propriété de l’institut Fraunhofer. montrant visuellement les 3 types de Scalabilité) Ce schéma montre de façon concrète. ainsi que l’augmentation ou la baisse de qualité à la volée. les 3 types de Scalabilité existantes. une version DVD et une version HD. l’augmentation ou la réduction de la résolution d’une vidéo. Il est de plus en plus possible de trouver des services proposant différentes versions de fichiers pour des supports tels que des consoles de jeux PSP de Sony et iPhone/iPod touch d’Apple.2010 29 . Philippe Gourgand – Licence CPTIC . La modification de la cadence d’image. ce que font par exemple les services de Video à la demande (VOD) comme il en existe des dizaines en France. (Schéma représentant le cas où l’on voulait créer différents fichiers pour différents types de bandes passantes) En temps normal il est recommandé d’encoder un fichier pour un usage spécifique.

un fichier global pouvant être visionné partout à la fois ! C’est à la fois ce qui fait la force de ce format extrêmement flexible. la question suivante peut être posée : vaut-il mieux posséder plusieurs fichiers pour tous les différents moyens de diffusion. lorsque cette technologie se sera développée.2010 30 .(Schéma de la technologie SVC et des connexions entre chaque Layer) Voici la situation qui pourrait se produire dans quelques années. ou uniformiser le tout ? Philippe Gourgand – Licence CPTIC . de se passer du versionnement des fichiers . vous l’avez compris. Cette technologie permettrait. Un seul fichier lisible partout et surtout différents supports. Cependant. mais aussi sa faiblesse. la taille du fichier augmentant de manière significative. il sera surement nécessaire de tirer la qualité vers le bas. car pour rendre ce fichier accessible au plus grand nombre.

comme les 2 images que vos yeux perçoivent.1.2010 31 . celui-ci est capable d’afficher jusqu’à 3 points de vue de la même image. Et inversement pour l’image droite. jeux…) Pour créer cette impression de relief les lunettes vont chacune à leur tour occulter l’image droite puis l’image gauche…. le MVC est composé de 2 images mises « côte à côte ».264. les 2 verres sont polarisés à la lumière. un critère essentiel a été respecté : la rétrocompatibilité avec le format H. Ces lunettes sont dites « actives ».264. c’est-à-dire que le verre gauche ne va laisser filtrer que l’image gauche. il faut utiliser un logiciel d’encodage qui va utiliser les algorithmes de ce format pour convertir les 2 images en fichier pouvant être visionné par l’utilisateur. la gauche et la droite. va restituer cette « 3D » avec un peu d’aide. En effet.2: Multi-View Video Coding (MVC) Il s’agit de la technologie utilisée pour apporter le cinéma en 3 Dimensions à domicile et au cinéma. 25. Pour en revenir au format MVC. celles-ci sont pour l’heure utilisées dans l’industrie du cinéma exclusivement.3. votre cerveau restitue l’image en 3 Dimensions. et comme l’image est générée par un écran il est estimé que pour avoir une image fluide il est nécessaire de produire au minimum 30 images par secondes dit « FPS » (Frame Per Second) soit au minimum 60 Fps du fait de la 3D. Philippe Gourgand – Licence CPTIC . Cette norme a été finalisée en Juin 2009 et est depuis devenue le standard utilisé dans les « Blu-ray 3D » qui commencent à arriver dans le commerce. A l’heure où j’écris ce mémoire. il est quasiment impossible de regarder une vidéo en 3D avec nos seuls yeux ! Si vous êtes allés au cinéma récemment voir un film en Relief stéréoscopiques. dans ce cas les contraintes techniques sont plus lourdes. Pour créer un fichier en MVC. La stéréoscopie ne s’attaque pas exclusivement au cinéma mais aussi au domaine du jeu vidéo. le logiciel de décompression. Ensuite. A très haute vitesse bien entendu ! Au cinéma. En utilisant 2 de ces images nous obtenons un rendu « stéréoscopique » mais si nous utilisons ces 3 images nous obtenons un rendu dit en 3 dimensions. une réalité virtuelle. Mais une vidéo est une succession de 24 images pour le cinéma. il est donc nécessaire d’utiliser une caméra « stéréoscopiques » avec 2 ou 3 objectifs. Dans notre cas.2. Cette technologie a été créée pour le codage stéréoscopique (l’image en relief) à partir de 2 points de vue. le MVC est une extension du H. Comme pour la technologie SVC. 30 voir bien plus pour le reste. un jeu ne se contente pas d’afficher 25 images par seconde. il vous a fallu des lunettes. un film « 3D » au cinéma doit afficher 48 images par seconde. cela se produira donc 24 fois par seconde. et comme chaque image possède 2 points de vue. Lors de l’établissement de cette norme. (Informatique.

2010 32 . certains acteurs du marché travaillent sur des écrans « 3 dimensions » ne nécessitant pas de lunettes. Cette technologie n’apporte pas vraiment de révolution mais permet cependant d’apporter la 3D stéréoscopique. le logiciel de décompression va se charger de n’afficher qu’une image. donc lors du visionnage on perd 50% de la taille de l’image. L’inconvénient est que pour une vidéo d’une résolution donnée. Mais pour le moment le port obligatoire de lunettes et l’achat de matériels compatibles en sont les principaux freins. la gauche puis la droite….Il existe 2 méthodes de positionnement des images : La méthode séquentielle (Sequential) Les images sont ici présentés une à une. en réunissant les 2 images à l’aide des lunettes. L’avantage de cette méthode est que chaque image arrive dans sa résolution maximale Méthode côte à côte (Side-by-Side) Les images arrivent ici côte à côte. Il sera intéressant de suivre les évolutions de cette technologie. et d’autres comme Disney travaillent sur de nouveaux algorithmes permettant de réduire l’inconfort que certaines personnes ressentent pendant le visionnage de film en relief. car la 3D sera un jour dans nos foyers. Les lunettes vont s’occuper d’occulter les images qui ne correspondent pas. Philippe Gourgand – Licence CPTIC . Le problème du port de lunettes a de fortes chances d’être corrigé. les images sont ici côte à côte.

3. Comme on peut le voir sur ce tableau comparatif. le VC-1 est de moins en moins utilisé dans les supports commerciaux. et profitant de la renommée de Microsoft.2010 33 . son poids pour un fichier de qualité DVD soit 720x576 le débit moyen est de 4Mb/s. En effet. car il est plus performant et dispose d’un taux de compression plus élevé pour une utilisation moins lourde du CPU.Solutions Alternatives : Formats Propriétaires et Open-source 3. Autre inconvénient.264. le H264 a fini par s’imposer. Il a donc été utilisé dans un premier temps. Il a été développé par Microsoft.1 – VC-1 (Format Propriétaire) Ce format a été le premier format utilisé par le défunt HD-DVD et les Blu-ray. Au départ mis sur un même pied d’égalité avec le codec H. au bénéfice du H. Il s’agit de l’évolution du format Windows Media Vidéo 9 (WMV) et Windows Media Audio (WMA). Le VC-1 n’accepte que le 4:2:0 or l’industrie du cinéma utilise au minimum le 4:2:2. mais le format de chrominance c’est-à-dire le respect des couleurs d’origine de ce format n’offre pas les mêmes réglages. Philippe Gourgand – Licence CPTIC . Même si le VC-1 est encore utilisé.264. les caractéristiques techniques sont assez semblables. Ces deux formats sont présents nativement dans les systèmes d’exploitation Windows.

2010 34 .Et surtout. Voici un aperçu de ce que donne le VC-1 en terme de rendu d’une image contrastée. Aperçu VC-1 Profil Main : Philippe Gourgand – Licence CPTIC . Ce format n’est pas abandonné mais il n’est pas destiné à évoluer à l’heure actuelle. il ne dispose pas des technologies de codage entropique.

264 ayant des débit de 30Mb/s en moyenne. ou simplement de lourdeur. de la même qualité que le fichier d’origine dont il est issu. leur permettant d’être plus facilement diffusables ! Celui-ci étant souvent utilisé pour le piratage de film. il est malheureusement associé à cette pratique. « autorisant » ainsi un utilisateur à publier et diffuser sur internet ces fichiers de qualité semblable et à les rendre accessibles au plus grand nombre et gratuitement. issu d’un projet du groupement VideoLAN en 2008.264 (CODEC Alternatif) Vous l’aurez noté. lui permettant ainsi d’être implémenté dans différents logiciels gratuits. je n’ai jamais pu visionner un fichier sans saccade ou sans apparition d’artefacts visuels. Ce n’est pas à proprement parler un format différent. Il permet d’encoder des vidéos dans le format H. le codec est assez performant puisqu’il permet de créer des fichiers HD en 720p d’environ 4 à 6Go ou des fichiers 1080p d’environ 7 à 9Go au lieu des 30 à 35Go du fichier d’origine présent sur le Blu-ray. Il arrive souvent que certains fichiers . il s’agit de son pendant Open-Source. Ces fichiers sont toujours soumis au besoin de puissance de certaines machines. Mettons ici de côté l’aspect illégal de ce process . ceux-ci sont souvent utilisables en « ligne de commande » c’est-à-dire sans interface graphique. le nom de ce CODEC est assez proche du format H.264.264 est utilisé pour transcoder ces fichiers. Ce format est très souvent présent dans les fichier Matroska (. il existe un défaut. Philippe Gourgand – Licence CPTIC .2010 35 . et certaines scènes peuvent être plus complexes à décoder du fait de l’utilisation de débit Variable à fortes amplitudes. De par mon expérience. Il possède les mêmes spécificités que le codec H. C’est tout à fait normal.3. celui-ci est basé sur une bibliothèque libre sous licence GNU. pour les « alléger ». mais un CODEC différent. il n’est pas soumis aux coûts de la licence d’exploitation des brevets H.264. Toutefois étant libre. offrant ainsi au grand public de pouvoir réaliser des encodages H.MKV) ce sont des transcodages de film en qualité Blu-ray H.264.264 soient « défectueux » : en effet il n’est pas rare de récupérer un fichier qui pendant sa décompression va rencontrer quelques problèmes de décomposition.264.264.2 – X. Ce codec est présent dans divers programmes souvent gratuits mais pointus. Le codec x. donc il est nécessaire de passer par des commandes souvent difficiles pour les néophytes ! Cependant.MKV ayant été encodés en x.

2010 36 .Aperçu fichier encodé avec x264 Philippe Gourgand – Licence CPTIC .

Son développement avait pour but principal de concurrencer les formats MPEG-4 et ses déclinaisons (DivX et XviD). en utilisation Internet.Un format de qualité et déjà répandu.Un format moins répandu.Une autre alternative. Le Theora est développé sous Licence BSD. Cette nouvelle version apporte de nombreuses innovations. de type Flash (Adobe) ou Silverlight (Microsoft) si l’on veut que tout le monde puisse la lire. ayant pour but de créer et promouvoir un ensemble de standards audiovisuels (son et vidéo) ouverts. une bataille fait rage pour définir de nouveaux standards de vidéo sur internet. Philippe Gourgand – Licence CPTIC . Or. MAC. en intégrant les différents CODEC nécessaires dans leur propre code. dont UNE nous intéresse en particulier . mais propriétaire et dont la licence d’exploitation est couteuse : le AVC/H. La Balise Vidéo. Cette Balise Vidéo. Le problème.264 . est de trouver un format « universel » pour l’internet. ce sont eux qui permettent le visionnage. ainsi que le Windows Media Video et le Real Video. Chaque personne voulant lire une vidéo. Il est dédié à 100% à un usage Internet. le VP8 devenu : WebM 3. et non à être exploité commercialement et disposé sur support physique Haute Définition. mais qui est libre et donc sans aucune licence d’exploitation : le Ogg Theora . Le Theora est développé par la fondation xiph.2010 37 . Alors. puisqu’il devient plus simple de mettre en place des solutions de streaming. Cette vidéo sera décompressée par les CODEC présents dans la machine (PC. est une grande révolution dans le monde de l’internet. qui puisse être visionné par tous les navigateurs. pour une utilisation sans restriction de ces technologies. Les balises permettent d’ajouter un élément dans une page internet. c’est-à-dire au visionnement de vidéo en streaming sur des pages internet. le format Theora utilise ses propres algorithmes et méthode d’encodages. doit obligatoirement installer le logiciel Flash et/ou Silverlight sur son ordinateur et sur les lecteurs multimédia. trois solutions se présentent : . un format rendu libre par Google.Un Contexte économique et technologique: A l’heure du lancement de la technologie HTML 5. Cette dernière a cédé ses brevets déposés pendant le développement du VP3. Celles-ci permettront d’intégrer directement une vidéo dans une page.) La norme HTML actuelle ne permet l’intégration d’une vidéo qu’en passant par un visualisateur. permettant à chacun d’utiliser le format Theora pour une utilisation privée et commerciale sans aucune restriction ! Il ne s’agit pas d’un MPEG Open-source. c’est-à-dire la dernière version du langage principal du Web. il est recommandé d’utiliser des fichiers à bas débit pour ne pas saturer la bande passante.3 – Ogg Theora (format open-source) Il s’agit d’un format de compression vidéo dit « ouvert » ou open-source sans aucun brevet.264. Celui-ci est réputé de moindre qualité à bas débit comparé au format AVC/H. et est fondé sur le format VP3 développé par la société ON2 technologies.org. téléphone…. dont Theora fournit la vidéo.

L’image sélectionnée affiche un certain contraste de couleur sur son fond avec plusieurs dégradés.H. une réduction de ces images aurait induit une différence moins probante.264. 900Kbits. Ce comparatif permet de différencier AVC/H.264 et en Theora Le même fichier (Scott Pilgrim bande Annonce 1080p en Motion JPEG) a été encodé avec le logiciel Gratuit Handbrake pour les fichiers H. à débit égal le Theora est moins performant.Voici un comparatif visuel du même fichier encodé en H.264 avec ou sans codage entropique CABAC.264 et Ogg Theora. visage et cheveux) On remarque tout de suite un écart important du temps de travail nécessaire au transcodage.264 : 5minutes . au niveau qualitatif . il est plus long à transcoder et son rendu visuel est bien inférieur à celui du H. car nous pourrons plus facilement voir les différences à l’ œil nu. qui lui est pourtant plus complexe. On distingue très clairement les différences au niveau de ces 3 images.264 et le programme FFmpeg2theora (en ligne de commande) pour le Theora Temps de travail : . Philippe Gourgand – Licence CPTIC .Ogg Theora : 15 Minutes Le débit est identique pour les 2 fichiers.2010 38 . Un débit volontairement bas pour de la Full HD. ainsi que plusieurs niveaux de détails complexes (vêtements. preuve que les algorithmes du format Theora ne sont pas aussi optimisés que celui du format AVC/H. le fait d’avoir utilisé une vidéo en FullHD (1920x1080) a vraiment permis de faire ressortir les défauts de l’image. Les images sont ici affichées en taille réelle.

H.264 Sans Codage CABAC Philippe Gourgand – Licence CPTIC .2010 39 .

264 avec Codage Entropique CABAC Philippe Gourgand – Licence CPTIC .2010 40 .H.

Ogg Theora Philippe Gourgand – Licence CPTIC .2010 41 .

Aussi. il faut disposer d'un navigateur compatible. basée sur la célèbre licence BSD. avait été soigneusement étudiée pour éviter toute attaque sur le terrain de la propriété intellectuelle. se verraient retirer tous les droits d'utilisation du format. il faut simplement télécharger un plugin pour DirectShow. supporte Theora (OGG) et Vimeo. tous ceux qui intenteraient des poursuites judiciaires ou même un soutien à une procédure judiciaire mettant en cause le VP8. comme le codage arithmétique adaptatif.264. le prédécesseur du VP8) Le principal développeur du CODEC alternatif x264. l'API qui gère la vidéo dans Windows.264. les processus d’encodage et de décodage sont actuellement assez lents. selon-lui le VP8 ne disposerait pas d’algorithmes avancés qui eux. et les investissements faits par Google. lié à l’acceptation de nouveaux formats de vidéo en streaming pour l’internet. Ce dernier se base sur le format VP8 pour la vidéo et sur le format Ogg Vorbis pour la partie audio. Le VP8 est reconnu supérieur au format Theora (qui lui-même est une amélioration du VP3. développé par la société ON2 Technologies. notamment utilisée par Windows Media Player. Ainsi. supporte déjà WebM (ce qui n'est pas très étonnant. par exemple. le H. mais ils passeront sûrement bientôt au WebM. a émis des critiques à l’encontre du VP8 de Google.1. Ceci ne permettant pas au VP8 d’obtenir des ratios de compression aussi fort que le H. sont présents dans le AVC/H. le décodage matériel n’est pas encore disponible. il parait improbable qu'une société attaque Google. en créant un nouveau format vidéo libre : le WebM. DailyMotion. a été racheté par Google en Février 2010. Toutefois. Pour Windows.164 et le Ogg Theora. Et surtout. le VP8 étant jeune il n’est pas encore assez optimisé.264. dans ces conditions. on peut espérer une résolution de ce problème à moyen terme. au vu des nombreux acteurs du marché soutenant ce codec libre. YouTube appartenant à Google). le célèbre site de partage de vidéos.4 – WebM (VP-8) (Format open-source) Le format VP8.2010 42 . et leur intégration native dans les pages internet développées en HTML5. Philippe Gourgand – Licence CPTIC . La licence de WebM. comme nous l’avons abordé précédemment entre le AVC/H. pour pouvoir encoder et lire des vidéos WebM.3. Le lecteur multimédia VLC est lui aussi capable de lire le format WebM depuis sa version 1. Google a profité du contexte difficile actuel. activer la version HTML5 sur YouTube. Pour bénéficier du WebM. quant à lui. La firme a indiqué par la suite sa volonté de vouloir « libérer » ce format. YouTube. Il s'agit là d'une stratégie ingénieuse : en effet.

et de l’article "First Look: H.2010 43 .264 Ces images sont tirées du site www.264 and VP8 Compared » Philippe Gourgand – Licence CPTIC .Voici un petit comparatif visuel entre le VP8 et l’AVC/H.streamingmedia.com.

Enfin. le gratuit et le payant. un format propriétaire est développé dans un laboratoire d’analyse de grands instituts de recherche. en terme de demandes de Qualité Audiovisuelle et d’Accessibilité Universelle ? Au travers de ce mémoire. En premier lieu. le fichier est « taillé » pour avoir une qualité prémium. Par conséquent. Dans le cadre d’un usage Internet.Conclusion et Prospective: Tout au long de mon développement. de production et de diffusion. et bien sûr si vous disposez d’une télévision compatible ! Ici. un son et une qualité visuelle proche ou identique au film sorti en salle. Internet est un formidable moyen de visionner des vidéos. ainsi que les budgets de développement. mais ces fichiers sont trop souvent soumis à des erreurs de décompression. la différence est peu perceptible car les fichiers étant de taille et de résolution plus réduite qu’un fichier commercial. j’ai voulu démontrer que le format vidéo AVC/H. comme l’apparition d’artefacts visuels. les fichiers transmis en streaming se veulent légers. Ce format sera-t-il réellement la solution aux attentes des utilisateurs (particuliers et professionnels). le choix se fait sur l’un ou l’autre des canaux de diffusion (Internet ou Commercial) L’Internet étant un « endroit » n’ayant pas ou peu de contrôle et où certains voudraient l’emploi de technologie à 100% libre. Je ne peux pas juger de la qualité du travail de ces communautés. Idéologiquement. D’après moi. nous avons pu mettre en évidence plusieurs contradictions dans cet univers de vidéo Professionnel et Grand Public. et un encodage vidéo léger veut dire petit Bitrate. le format libre concurrent n’est pas aussi efficace que son « équivalent » propriétaire ! Un format libre est développé par une communauté d’utilisateurs souvent experts dans leur domaine . nous l’avons démontré. car tout le monde achète des DVD. cependant au résultat final certaines technologies développées ne peuvent supplanter un travail propriétaire. il existe certes une alternative avec les fichiers MKV contenant une vidéo au format H. On peut opposer à cela l’aspect commercial mais qui n’est pas forcément à diaboliser. Le message envoyé aux consommateurs est simple. donc qualité amoindrie.264. s’il veut de la qualité il doit acheter un fichier Haute Définition . Cependant. Souvent l’expertise est bien meilleure et le mode de développement est plus efficace. il devient naturel que le libre soit galvanisé par cette dynamique communautaire qui va de pair avec le libre.2010 44 . et se met peu à peu à s’équiper en lecteur Blu-ray. Mais leurs possibilités ne sont pas les mêmes. le streaming a pu apporter la capacité de visionner un film à tous ceux qui ne peuvent télécharger un fichier complet avec leur bande passante limitée. l’opposition flagrante du libre et du propriétaire.264 deviendra le format universel de captation. ils ne peuvent avoir une réelle valeur pour le consommateur voulant une vraie expérience audiovisuelle ! Philippe Gourgand – Licence CPTIC . les défauts apparaissent peu ou pas. et pourra s’adapter à tous les usages présents et futurs. l’un gratuit l’autre non. nous allons rentrer dans le sujet qui fait débat à l’heure actuelle.

alors que MPEG LA vend l’usage (la licence) d’une technologie d’encodage qui sert de support à des services à valeur ajoutée.264 (objet central de cette étude) déjà très répandu dans nos ordinateurs et sur nos sites Internet. Libre ainsi à chaque éditeur de navigateur de choisir les formats qu'il souhaite prendre en charge. et il y a fort à parier que ce sont les partenaires comme Microsoft. plutôt un piège qui se refermera sur le web et le logiciel libre en 2016. Philippe Gourgand – Licence CPTIC . Les intérêts de ces deux géants sont contradictoires dans le sens où Google vend un service complet à valeur ajoutée. il est fort probable que le format AVC/H.264. Adobe. la redevance sera exigée y compris pour l'encodage de vidéos gratuites pour l'utilisateur. qui facilitent l'incrustation de vidéos dans les pages web. Les cinq années qui viennent seront décisives pour le format AVC/H. Ceci aura pour effet de le rendre gratuit à l’utilisation et on devrait voir apparaitre d’ici quelques mois des applications permettant d’encoder dans ce nouveau format vidéo à qui on a adjoint le format déjà libre de droits Ogg Vorbis pour la partie audio. jusqu’à fin 2015 à faire payer systématiquement des licences pour l'utilisation du format vidéo H. mais deviendra le format de référence de la Vidéo à la Demande (VoD). Toutefois. Ainsi est né le conteneur WebM. MPEG LA est propriétaire du format AVC/H. le W3C (World Wide Web Consortium. le principal portail de diffusion vidéo sur Internet avec plus de 2 milliards de clips visionnés quotidiennement. des droits pour toutes vidéos publiées sur internet. Ces annonces sont lourdes de sens. qui feront évoluer les stratégies actuelles. technologiques et idéologiques considérables. tous supports confondus. En face. et des entreprise et services qui n’existent pas encore.264 sur Internet. puisque le format H. Google annonce aujourd’hui la libération complète des droits sur la technologie du nouveau codec vidéo de On2 nommé VP8 en ouvrant son code source pour que n’importe quel programmeur puisse l’utiliser. chargé de promouvoir la compatibilité des technologies WWW) a refusé de désigner les codecs vidéo standards à utiliser avec le HTML5. Google.La planète Internet se partage entre deux géants : Google et le consortium MPEG LA qui souhaitent tous les deux la plus grande part du marché de la diffusion audiovisuelle dans le monde. pour toute la durée de vie de ce format. organisme de standardisation à but non-lucratif. fondé en octobre 1994. Mozilla. en favorisant par défaut le conteneur WebM de Google. celui-ci a annoncé la gratuité. de la Télévision Numérique Terrestre (TNT) et d’autres média comme le téléphone ou les tablettes numériques.2010 45 . et à chaque éditeur de sites web de choisir le ou les formats qu'il souhaite utiliser. Devant un conflit qui met en opposition des intérêts financiers.264 est associé à la notion de qualité visuelle et de fichiers respectant les normes de diffusion. Même si Google réussit à imposer son standard de diffusion. Cette gratuité consentie par le consortium MPEG LA n'est pas vraiment un cadeau. A partir de 2016. principal moteur de recherche sur Internet est propriétaire de YouTube. le consortium MPEG LA renonce. pour un usage 100% internet.264 ne disparaitra pas aux oubliettes de l’histoire Internet. comme celles proposées sur YouTube ou DailyMotion.

..............................................................................................................................................................1........................................................................................ 1 Introduction : ..............264 (CODEC Alternatif) ................... 47 Lexique :........ 6    La fonction Codage (Compression): ........................264 et en Theora ......................................................................................................................................................................................... 21 2.............1 – VC-1 (Format Propriétaire) ...2 Notion de CODEC ......... 37 3..................................................................................................... 12 2....4 Notion de débit de données (Bitrate) ..................1...............................................................................................................................................Etude Avancée du Format vidéo AVC/H............................3 – Ogg Theora (format open-source) ......................................................................................................... 7 1.............................................................................................................................264...........264 ..................................................................................................................................................1 Technologie ........ 38 3.......................................... 5 1.............................................. 44 Annexes : ................................................. 51 Philippe Gourgand – Licence CPTIC .............................................................................................................................................................................. 4 1 – Description de la Vidéo Numérique et formats de diffusion :..2010 46 ......................... 43 Conclusion et Prospective: ............................. 11 2 ..................................... 47 Bibliographie :............................................................................................................................................................3 Notions de structure d’un fichier Vidéo ................................. 6 La fonction Transcodage (changement de CODEC) : .............................................................................. 33 3........................................................................................................................................................................................................................................................... 27 3... 12 2............................................1 Notions de Production et Diffusion ..................................1 Présentation Technologique ................................................................................... 6 La fonction Décodage (Décompression): .......................... 50 Notes : ................................................................................................. 33 3........................................................................................................ 42 Voici un petit comparatif visuel entre le VP8 et l’AVC/H........................................Solutions Alternatives : Formats Propriétaires et Open-source ................................2 Apports et Etude Comparative ........................1...................................................................................................................................Table des matières Remerciements.......................................................2 – X........................................ 37 Voici un comparatif visuel du même fichier encodé en H..............4 – WebM (VP-8) (Format open-source) ..3 : Technologies Evolutives de ce format .. 12 2................................. 9 1............. 35 Un Contexte économique et technologique: .............................. 3 Historique : ........................................................................................................................................................................................................................... 5 1..................................................................................

b/s ou bps). Le codage entropique est issu de la théorie de l'information. plus l'image est détaillée et sa résolution élevée). la définition standard est de 720x576 pixel soit 576p. du niveau de contraste. Il a été indiqué. que ce soit au niveau de la qualité. pour un ordinateur ou un matériel de projection (plus large est sa bande passante. Pour une vidéo Haute définition. du support. la définition standard est de 1920x1080 pixels soit 1080p. et caractérise. Un signal vidéo étant composé d'une part d'information de luminance. en opposition au variable Bitrate (VBR). Definition standard : Pour une vidéo de Qualité DVD. que l'information de couleur est fournie à partir de 3 couleurs primaires : Red. Il est généralement exprimé en bits par seconde (bit/s. Les appellations 720 et 1080 font référence au nombre de pixels verticaux. pour la hauteur de l’image. Pour la « vraie » haute définition dite « FullHD ». et traite de ces codes et de leurs propriétés.. Ce codage utilise des statistiques sur la source pour construire un code. ayant pour but de transformer la représentation d’une source de données pour sa compression et sa transmission sur un canal de diffusion. Bande Passante : débit théorique ou disponible de transmission de données sur un réseau informatique. ou d'affichage d'une image. à valeur dans un alphabet de taille finie.2010 47 . qui peut se traduire en français par : « taux d'échantillonnage variable » Broadcast : pouvant se traduire par « Diffuser ». il est nécessaire de disposer de deux informations de chrominance pour que les trois informations de couleur (correspondant aux trois couleurs primaires) puissent être reconstituées. le composant de l'ordinateur qui exécute les programmes informatiques. L'information à coder est représentée par une variable aléatoire. Philippe Gourgand – Licence CPTIC . il s’agit du mode d’affichage d’une vidéo sur un écran.. Bitrate : le débit binaire est une mesure de la quantité de données numériques transmises par unité de temps. etc . la définition standard est de 1280x720 pixels soit 720p. Codage entropique : il s’agit d’une méthode de compression sans perte.Annexes : Lexique : Artefacts visuels : cette terminologie définit une ou un ensemble d’altérations de l’aspect visuel d’un élément ou une image. CPU (Central Processing Unit): pouvant se traduire par « Unité centrale de traitement » il s’agit du Processeur. Chrominance : cela désigne la partie de l'image vidéo correspondant à l'information de couleur. pour la luminance. le rouge. Green et Blue. un enregistrement audio ou vidéo qui respecte les normes de diffusion professionnelles. pour respectivement. le vert et le bleu. En vidéo cela correspond à l’apparition d’éléments mal décomposés lors de la lecture entrainant l’apparition de ces artefacts. Constant Bitrate (CBR) est un terme anglais que l'on peut traduire en français par : « taux d'échantillonnage fixe ». Indique la capacité électronique de transmission d'un signal. Alors que le p fait référence au terme « progressive » qui s’oppose au i de « interlace » (entrelacé en français). dans le milieu de la technique vidéo ou radiophonique.

2010 48 . la décompression Vidéo. c’est un microprocesseur présent sur les cartes graphiques au sein d’un ordinateur ou d’une console de jeux vidéo. Luminance    : Un signal vidéo est habituellement composé de trois signaux correspondant aux couleurs fondamentales qui sont notées : R pour le rouge G pour le vert (green en anglais) B pour le bleu On peut par commodité décomposer ce signal en trois autres composantes. Propriété d'un flux vidéo de permettre une transmission et un décodage partiels à un débit évoluant dans un intervalle donné et permettant la restitution d'une résolution ou d'une qualité variables en fonction de ce débit. Le processeur graphique se charge des opérations d’affichage et de manipulation de données graphiques. Blu-ray. la gestion de la mémoire vidéo. un téléchargement car il y a un échange de données brutes entre un client et un serveur. vidéos) d’un ordinateur à un autre via un canal de transmission. En informatique. Streaming : pouvant se traduire par « lecture en flux ou lecture en continu ». services Internet…) grâce à un système d'accès conditionnel. sons. Les processeurs des cartes graphiques modernes (en 2009) ont une structure hautement parallèle qui les rend efficaces pour une large palette de tâches graphiques comme le rendu 3D. le traitement du signal vidéo. Scalabilite : anglicisme dont la traduction proposée par l'AFNOR serait "échelonnabilité". La luminance est alors la partie du signal vidéo correspondant à l'intensité lumineuse produite. Très utilisée sur Internet. le débit total étant celui nécessaire à la plus haute résolution à la plus haute qualité. désigne un principe utilisé principalement pour l'envoi de contenu en « direct » (ou en léger différé). en général internet ou intranet. par des mesures techniques de protection. du point de vue théorique. De nos jours. appelées respectivement chrominance et saturation. cette technologie permet la lecture d'un flux audio ou vidéo (cas de la vidéo à la demande) à mesure qu'il est diffusé. Néanmoins la lecture en continu est. logiciels…) ou de transmission (télédiffusion. Philippe Gourgand – Licence CPTIC . GPU (Graphic Processing Unit) : pouvant se traduire par « Processeur Graphique ». la notion de téléchargement est très maladroitement associée par abus de langage. en OpenGL. uniquement aux téléchargements de fichiers stockés sur disque dur. mais le stockage est provisoire et n'apparaît pas directement sous forme de fichier sur le disque dur du destinataire. Ces dispositifs peuvent s'appliquer à tous types de supports numériques physiques (disques. images. DRM (Digital Right Management) : pouvant se traduire par « Gestion des Droits Numériques » ayant pour objectif de contrôler l'utilisation qui est faite des œuvres numériques. données. Elle s'oppose ainsi à la diffusion par téléchargement de fichiers qui nécessite de récupérer l'ensemble des données d'un morceau ou d'un extrait vidéo avant de pouvoir l'écouter ou le regarder. DVD. soit le niveau entre le noir et le blanc. le téléchargement est l’opération de transmission d’informations (programmes. en Direct3D. La couleur et l'intensité de cette couleur correspondent à l'autre partie du signal. après un passage par la mémoire vive des ordinateurs.Downloading : pouvant se traduire par « Téléchargement ». Ceci s'effectue sans transcodage.

Le consommateur final ne peut en aucun cas agir sur les images du programme. les bars. ni retransmettre le programme à destination de tiers par quelque procédé que ce soit. les tâches à accomplir entre les différents acteurs d'un processus. Workflow : pouvant se traduire par « Flux de travaux ». restaurants et les lieux accueillant du public de passage. et pour visualisation sur tout matériel de réception. établissements de santé. cafés. notamment les boutiques. On appelle Workflow la modélisation et la gestion informatique de l'ensemble des tâches à accomplir et des différents acteurs impliqués dans la réalisation d'un processus métier (aussi appelé processus opérationnel ou bien procédure d'entreprise) De façon plus pratique. par tous réseaux de communications électroniques et notamment. à sa demande et à l’heure de son choix. etc. par tout mode de sécurisation. commerces. et fournit à chacun des acteurs les informations nécessaires pour la réalisation de sa tâche. tels que « streaming » (diffusion linéaire) ou « downloading » (téléchargement). ni visionner ce programme sans s’acquitter au préalable d’un droit correspondant aux conditions commerciales fixées par l’opérateur en cas d’offre payante. les délais.2010 49 . armées. les modes de validation. via le réseau Internet. après paiement d’un prix. par câble. le Workflow décrit le circuit de validation. Définition validée par le Centre National de la Cinématographie (CNC). prisons.Video a la Demande : est entendue comme la mise à disposition des programmes au consommateur final. salles d’attentes. hôtels et résidences de tourisme. par tous procédés de diffusion cryptée. et ce. par voie hertzienne terrestre. par satellite et par réseaux de télécommunications. pour une représentation dans le cadre du « cercle de famille » ainsi que dans les circuits fermés (c’est à dire dans une unité de lieu spécifique accessible au public. bureaux.). telles que les collectivités dans lesquels les usagers effectuent des séjours temporaires. Philippe Gourgand – Licence CPTIC .

htm Article Wikipédia http://fr.fr/2009/03/22/le-h264-le-codec-le-plus-avance-au-monde/#installation SVC Site internet Camera Video .eetimes.eu/blog/test-webm-vs-theora.com/news-62-36515-google-libere-le-codec-video-vp8.ac.264 AVC http://www.html Site internet Fraunhofer Institut http://ip.wikipedia.hhi.html Article Wikipédia http://fr.wikipedia.264 Advanced Video Compression Standard.com/index.com/design/industrial-control/4017613/Tutorial-The-H-264-Scalable-Video-Codec-SVCoutils d’analyse des fichier SVC .org/wiki/H.hdfever.SVC Analyzer 2.org/wiki/WebM Comparatif WebM & Theora http://www. Second Edition 2010 De Iain E.fr/2010/03/05/smooth-streaming-silverlight-avc-svc-h264-youtube-sous-titre/ tutoriel http://www.vcodex.wikipedia.2010 50 . Richardson http://www.Forum http://www.fansub-streaming.264/MPEG-4_AVC http://www.php/svc-analyzer-20.html Ogg Theora: Site internet Généraliste Ars Technica http://arstechnica.html http://en.0 http://www.vcodex.html Biographie http://www4.cfm?pge=3284 Sites internet : H.rgu.ars Google WebM : Site Internet « Le site du Zéro » http://www.com/fr_FR/innovation/actus/thematique/tous_les_dossiers/att00006850/ddm_200605f r.orange.uk/eng/aboutus/page.com/h264.hdfever.de/imagecom_G1/savce/index.com/h264mpeg4/index.com/open-source/news/2010/02/ogg-theora-vs-h264-head-to-head-comparisons.com/2010/05/encodage-de-video-webm-en-ligne-de-commande.svc-analyzer.html Blog http://blog.html Philippe Gourgand – Licence CPTIC .Bibliographie : Ouvrages de référence : The H.org/wiki/Codage_vidéo_scalable Dossier France Telecom datant de 2006 http://www.siteduzero.cameravideo.nicolargo.pdf Application d’une technologie SVC concurrente http://www.net/forum/news-de-video/13724-h-264-svc-un-format-unir.

2010 51 .Notes : Philippe Gourgand – Licence CPTIC .

Philippe Gourgand – Licence CPTIC .2010 52 .

2010 53 .Philippe Gourgand – Licence CPTIC .

Mots clés : Video Compression: Il s’agit de la méthode de compression de données. Le transcodage est l’opération par laquelle on passe pour changer le format de codage d’un media (vidéo et audio). stocké. Le but est de trouver le meilleur rapport Poids/Qualité pour ne pas dénaturer une vidéo. ce terme est utilisé pour désigner une opération permettant de modifier l’aspect visuel.264) devient le format universel de captation.264 ou h. de production et de diffusion. Débit (Bitrate) : Le débit est une mesure quantitative. transporté et diffusé. d’un système. Encodage/transcodage: Le terme « encodage » signifie toute opération de codage d’un objet en données informatiques. permettant de mesurer les données numériques transmises en ko/s. ayant pour but d’améliorer l’efficacité du codage vidéo par rapport à d’autres formats.264: Il s’agit d’une norme de codage vidéo. la resituer dans l’ensemble des formats vidéo numériques existants et ainsi pouvoir en mesurer l’impact sur le futur. d’un réseau. spatiale. et s’adapte à tous les usages présents et futurs. télévision. CODEC : Cette appellation vient de « compression-décompression ». Ce format est-il réellement la solution aux attentes des utilisateurs (particuliers et professionnels). Mo/s… On peut aussi l’appeler la « bande passante ». en terme de demandes de Qualité Audiovisuelle et d’Accessibilité Universelle ? Pour répondre à cette problématique. il s’agit d’un procédé permettant la compression et la décompression de données numériques. Cette norme définit des fichiers pour différents usages (internet.264 (AVC/H. la taille et la qualité. Cela permet d’adapter le format en fonction du support sur lequel il est. MPEG-4: Il s’agit d’une norme d’objets audiovisuels définie par le consortium « Moving Picture Experts Group » (MPEG). jeux vidéo…) AVC (Advanced Video Coding) . qualitative : Le terme « Scalabilité » est un anglicisme désignant l’extensibilité d’un processus. En vidéo. Il peut s’agir d’un outil matériel ou dans notre cas.Philippe Gourgand Etudiant en Licence Pro « Conduite de Projet TIC dans les PME » Salarié chez UbicMedia SAS – Europe Numériseur Passionné de vidéo et de cinéma Résumé : Au travers de ce mémoire. utilisée pour réduire la quantité de données d’un fichier vidéo (Video et Son). d’un logiciel. . plus le débit est élevé et plus grande sera la qualité ! Scalabilité temporelle. Son principal intérêt est de réduire le poids des fichiers. nous devrons comprendre cette technologie. je vais vous montrer que le format vidéo Advanced Video Coding/H.H. En vidéo. Elle apporte aussi plusieurs technologies permettant un meilleur respect de la qualité d’origine. améliorant aussi la transmission d’informations.

Sign up to vote on this title
UsefulNot useful