Professional Documents
Culture Documents
mtadonnes et gestion
Toute reproduction sans autorisation du Centre franais dexploitation du droit de copie est strictement interdite.
Techniques de lIngnieur TE 5 885 1
DMAM : MDIAS NUMRIQUES, MTADONNES ET GESTION ___________________________________________________________________________________
Toute reproduction sans autorisation du Centre franais dexploitation du droit de copie est strictement interdite.
TE 5 885 2 Techniques de lIngnieur
__________________________________________________________________________________ DMAM : MDIAS NUMRIQUES, MTADONNES ET GESTION
Toute reproduction sans autorisation du Centre franais dexploitation du droit de copie est strictement interdite.
Techniques de lIngnieur TE 5 885 3
DMAM : MDIAS NUMRIQUES, MTADONNES ET GESTION ___________________________________________________________________________________
Digital Content Management & MAM larrive du direct-to-disk (DTD) au dbut des annes 1990 avec
Le terme de Digital Content Management (DCM) est quelquefois laccroissement des capacits de stockage, entranant la disparition
utilis [24]. Il recouvre un domaine plus vaste, incluant : progressive de lusage de la bande magntique ;
les documents papier (ditions, images, fax) ; la puissance des chips ddis DSP (Digital Signal Processing)
les documents sous forme lectronique (messagerie, permettant lamlioration de la qualit du codage audio (de 48
bureautique) ; 96 kHz, de 16 24 bits) et le son multicanal, la fois en musique
les documents publis sur le Web, sur Intranet, Extranet ou avec le SACD et le DVD-Audio, et pour les pistes son du DVD-Video
Internet (grs par le Web Content Management, WCM) ; (AC-3 5.1 7.1, DTS Half et Full Range).
les documents mdias (photos, vido, audio).
Du ct de la radio, la chane de production-distribution, depuis
En outre, il reflte la volont des entreprises de rationaliser et les solutions de reportage mobile, le montage en DTD et la gestion
doptimiser lutilisation du contenu gnr ou acquis (Enterprise de la multidiffusion confie un systme DMAM, devient intgrale-
Content Management, ECM). ment numrique et informatique.
Le terme de Digital Asset Management (DAM) est aussi utilis,
soit dans le sens large du DCM, soit dans le sens plus rduit de la La vido a bnfici des techniques numriques au milieu des
gestion des mdias numriques, DMAM [27]. annes 1970 avec lapparition des premiers quipements numri-
ques en production tlvision (DTBC, correcteur numrique de base
de temps vido ; mmoire numrique de trame ; convertisseur
numrique de standards TV). La norme CCIR 601 (devenue ITU-R
2. Mdias et numrique BT.601) dfinit en 1982 les paramtres de la vido numrique en stu-
dio de production, avec une frquence dchantillonnage leve
(13,5 MHz). Sensuit le dveloppement des magntoscopes numri-
ques professionnels. Mais les capacits de stockage et les dbits de
Ce paragraphe, aprs un bref rappel des principes de la numrisa-
transmission trs levs vont ncessiter ladoption de normes de
tion et de lvolution des mdias vers le numrique (tableau 1), ta-
rduction de dbit dans les annes 1992-1994. Ces techniques de
blit le contour du domaine des mdias numriques.
compression numrique vont permettre, dune part le dveloppe-
ment de magntoscopes numriques moins coteux pour les profes-
sionnels (Digital Betacam, puis DVCPRO ou DVCAM), linstitutionnel
2.1 De laudio-visuel analogique et le grand public (format DV), ainsi que lapparition du DVD-Video, et
dautre part la diffusion de bouquets numriques de programmes de
au numrique et linformatique tlvision ( partir de 1994), puis le streaming vido sur Internet.
loppos, la fin des annes 1990, la publication de normes a permis
le dveloppement de la tlvision haute dfinition, en particulier aux
La numrisation de mdias audio-photo-vido se traduit par une tats-Unis (voir larticle [TE 5 674], rf. [30]).
reprsentation discontinue dans le temps et code par une srie de
nombres de la grandeur physique (par exemple, lumire colore Linformatique fait modestement son apparition dans les studios
dune image capte, ou vibration acoustique dun son). Ce nombre de production vido avec le gnrateur de caractres, ou traite-
constitu de chiffres binaires 0 ou 1 est ensuite traduit en signal ment de texte adapt lcran de tlvision. Puis ce seront les
lectrique 2 niveaux bas ou haut, enregistrable sur une bande stations infographiques, et ensuite les stations de montage
magntique (magntoscope/magntophone numrique, ou enre- virtuel (non-linear editing). Le milieu des annes 1990 voit
gistreur informatique) ou sur un disque magntique ou optique (CD, linsertion progressive de serveurs vido informatiques pour la
DVD). Le numrique permet donc une mme forme de reprsenta- diffusion et la production. Enfin, des enregistreurs informatiques
tion, un codage des images, des sons ou des textes. (DLT, LTO, SDLT) permettent de stocker et darchiver des volumes
Tout processus de numrisation sapparente une mesure et importants de programmes numriss. Tout au long de la chane
comporte trois tapes : production diffusion tlvision un systme dautomatisation
1) lchantillonnage ou frquence (en kHz, ou MHz) de la informatis, et maintenant de DMAM, permet de grer les
mesure des points dimage ou des chantillons sonores ; nombreuses fonctions et processus.
2) la quantification ou comparaison de chaque chantillon
une chelle de mesure, dont on dtermine la prcision en nombre La photo et le film sont les plus anciens des mdias modernes.
de niveaux, qui se traduira par le nombre de bits (binary digits) attri- Bnficiant dune finesse de dtails incomparable (voir
bu par ltape suivante ; larticle [TE 5 674], rf. [30]), ils achvent leur rvolution num-
3) le codage ou reprsentation numrique de la valeur des rique.
chantillons.
La photo satellite a trs tt bnfici des techniques numriques
Le son est le premier mdia avoir franchi ltape du tout-num- pour tre transmise ou analyse. Puis le numrique sest dvelopp
rique, tout dabord dans le domaine du tlphone numrique au dans le domaine de limagerie scientifique et mdicale. Le dvelop-
dbut des annes 1970, puis avec la captation de musique en num- pement des scanners professionnels puis grand public a permis la
rique et sa distribution sur CD-Audio ds 1982. Les premiers ache- numrisation des diapositives et des tirages papier. Mais cest loffre
teurs de CD-Audio scrutaient alors le dos des pochettes pour y dappareils photonumriques, dont la dfinition se rapproche cha-
dcouvrir les trois lettres DDD (pour Digital recording/mixing/maste- que anne de celle de lmulsion photochimique, qui constitue une
ring) qui signifiaient que la captation, la post-production et lenre- tape dcisive dans le passage de la photo au numrique. Et linfor-
gistrement taient intgralement en numrique. Au dbut, la matique permet, avec des logiciels spcifiques, de manipuler, traiter
captation utilisait encore des magntophones multipistes bandes et cataloguer les collections de photos.
magntiques pour stocker les 0 et 1.
Cest dans ltape de la post-production que le numrique a com-
Puis les studios denregistrement et de post-production ont menc simplanter dans lindustrie du cinma pour raliser des
bnfici de : effets spciaux, le rglage des couleurs (talonnage), ... Les
stations de travail informatiques pour le traitement et le mon- premires spcifications du cinma numrique sont proposes en
tage des squences sonores (DAW, Digital Audio Workstation) ; dcembre 2003, soit plus de 20 ans aprs celles de la vido num-
consoles numriques de mlange de voies et de leur facilit rique, conditionnant lapparition de camras et de projecteurs
dautomation accrue ; appropris.
Toute reproduction sans autorisation du Centre franais dexploitation du droit de copie est strictement interdite.
TE 5 885 4 Techniques de lIngnieur
__________________________________________________________________________________ DMAM : MDIAS NUMRIQUES, MTADONNES ET GESTION
(0)
En conclusion, lvolution des mdias de lanalogique au numri- de circuits numriques et de leur miniaturisation, dabord
que (cf. tableau 1) sest donc effectue grce au dveloppement : relais, puis tubes, transistors, et enfin base de circuits intgrs,
de microprocesseurs ou de DSP (Digital Signal Processor), en une
des techniques numriques de base (chantillonnage, codage quarantaine dannes (1939-1982) ;
numrique binaire, modulation par impulsions codes), sur plus de systmes numriques bass sur les machines informati-
dune centaine dannes (1841-1948) ! ; ques (1944-1977) ;
Toute reproduction sans autorisation du Centre franais dexploitation du droit de copie est strictement interdite.
Techniques de lIngnieur TE 5 885 5
DMAM : MDIAS NUMRIQUES, MTADONNES ET GESTION ___________________________________________________________________________________
Toute reproduction sans autorisation du Centre franais dexploitation du droit de copie est strictement interdite.
TE 5 885 6 Techniques de lIngnieur
__________________________________________________________________________________ DMAM : MDIAS NUMRIQUES, MTADONNES ET GESTION
lenregistrement sur support optique pour distribution : DVD- 3.1 Exemples de mtadonnes
Video.
lenregistrement grand public sur bande magntique D-VHS,
ou disque optique r-enregistrable DVD-RW/+RW, ou disque Le tableau 2 prsente la liste de mtadonnes associes un pro-
magntique de rcepteur-dcodeur-enregistreur (Tivo, Pilotime). gramme de tlvision. Quelques mtadonnes seront ensuite
le stockage numrique de masse : sur bandes ou disques dtailles : une mtadonne de reprage (le Time Code) et des
magntiques, ou disques optiques pour des banques dimages mtadonnes didentification (ISAN et UMID).
(0)
animes numriques.
La transmission de vidos numriques : Tableau 2 Exemple de mtadonnes associes
la diffusion de tlvision numrique : les bouquets numri- un programme de tlvision
ques de tlvision DVB (Digital Video Broadcasting).
Titre
les liaisons de contribution numrique entre les studios avec
possibilit de post-traitement ultrieure (par exemple, le rseau Dates (production/1re diffusion)
Eurovision de lUER). Les liaisons de distribution primaire entre No didentification
une rgie de diffusion et une station de transmission (station
dmission satellite ou tte de rseau cbl ou metteur hertzien Time Code
terrestre). Les liaisons dmission (ou distribution secondaire) Format source (cassette/fichier)
finales vers le tlspectateur.
Pistes audio (+ version langue)
la vido sur Internet : programmes des tlvisions diffuses
ou en archive, squences de banques de vidos. Dure
communication individuelle ou de groupe : visiophone et Droits dexploitation
vidoconfrence.
Description de la qualit technique des images et des sons
Le cinma numrique (D-cinema) dont les premires spcifica-
tions ont t dfinies en 2004. Description du niveau de protection des mineurs ( 10/ 12/ 16/
18 ans)
Description du contenu
2.2.4 Textes associs un mdia numrique lments secondaires (logo, sous-titre...)
lments de tournage (documents Word, Excel, tlcopies, pense-
Dans le cadre de la gestion numrique des mdias, diffrents bte...)
types de textes peuvent tre utiliss, en particulier lors de ltape
danalyse et dindexation, car ils contiennent de nombreuses infor-
mations associs aux mdias :
3.1.1 Time Code
les dossiers de production qui contiennent script, liste des con-
tributeurs (ralisateur, acteurs, ...) ; Lune des premires mtadonnes utilise dans le monde de la
les dossiers juridiques, incluant la liste des ayants droit et les vido, puis de laudio et du film, le code temporel (SMPTE 12M-1999)
contrats ; est un nombre de 90 bits (ou 80 bits) ralisant le reprage de chaque
les conducteurs dantenne, listant tout ce qui est en cours de image vido. Chaque numro comporte :
(0)
Toute reproduction sans autorisation du Centre franais dexploitation du droit de copie est strictement interdite.
Techniques de lIngnieur TE 5 885 7
DMAM : MDIAS NUMRIQUES, MTADONNES ET GESTION ___________________________________________________________________________________
Toute reproduction sans autorisation du Centre franais dexploitation du droit de copie est strictement interdite.
TE 5 885 8 Techniques de lIngnieur
__________________________________________________________________________________ DMAM : MDIAS NUMRIQUES, MTADONNES ET GESTION
(0)
Descriptive Toute information utilise pour le catalogage, la recherche, laccs et ladministration du Contenu.
Exemples : tiquettes, auteur, localisation, date et heure, version, etc.
Autres Exemples : scripts, dfinitions des noms et des formats dautres mtadonnes, mtadonnes propres lutilisateur.
(0)
tant donn le domaine des deux socits lorigine de linitiative pour le domaine Broadcast, les standards SMPTE et les dve-
EBU et SMPTE, la majorit des mtadonnes proposes ont une loppements EBU P/META et TV-Anytime.
vise dexploitation lie la pratique professionnelle de la produc-
tion-diffusion audiovisuelle et film plutt qu la gestion et la Cependant, un important travail de recherche de compatibilit est
recherche documentaire. Il faut noter que ces socits ont dcid en en cours, pour permettre lchange, limport et lexport de mta-
1999 de rejoindre linitiative ISO MPEG-7, davantage oriente donnes entre divers domaines dapplication.
multimdia ( 3.3.3) afin de normaliser le dictionnaire SMPTE des Avant de dtailler les diverses tentatives de normalisation des
mtadonnes comme un schma de description spcifique leurs mtadonnes, on prsente quelques normes de reprsentation for-
types dusage. melle, ou codage, des mtadonnes.
Toute reproduction sans autorisation du Centre franais dexploitation du droit de copie est strictement interdite.
Techniques de lIngnieur TE 5 885 9
DMAM : MDIAS NUMRIQUES, MTADONNES ET GESTION ___________________________________________________________________________________
(0)
Toute reproduction sans autorisation du Centre franais dexploitation du droit de copie est strictement interdite.
TE 5 885 10 Techniques de lIngnieur
__________________________________________________________________________________ DMAM : MDIAS NUMRIQUES, MTADONNES ET GESTION
synthse, ...) et correspond lessence dans le langage SMPTE ( Ce sont des structures de mtadonnes dcrivant et annotant le
1.1). MPEG sest ensuite attach, ds fin 1996 (lappel propositions, contenu (essence) audiovisuel. Ils sont dfinis avec le langage DDL,
call for proposals, datant doctobre 1998), lidentification de ces bas sur le XML Schema Language [TE 5 887, 1], et peuvent
contenus. Cest lobjet de la norme MPEG-7 [11] [29] auparavant sexprimer sous forme textuelle (pour diter, rechercher, filtrer) ou
appele Multimedia Content Description Interface (figure 5), dont la sous forme compresse binaire (pour stockage et transmission). Ils
version finale a t publie lautomne 2001 et 2002. sont principalement conus pour dcrire des caractristiques de
haut niveau des zones, segments, objets, vnements, et dautres
Une description MPEG-7 peut vivre indpendamment du contenu mtadonnes permanentes relies (figure 6) :
dcrit, et elle est indpendante du codage et du format du contenu. des lments de base : outils et types de donnes ;
MPEG-7 veut enrichir la description textuelle des contenus par : la description du contenu (essence) :
aspects structurels des composantes spatiales, temporelles ou
des approches permettant lindexation automatique ; spatio-temporelles du contenu (transition de scne, segmentation
des approches permettant denrichir une description textuelle dune image en zones, suivi de mouvement par zone). Les
dlments perceptifs lis au contenu . segments peuvent ensuite tre dcrits plus finement sur la base
Toute reproduction sans autorisation du Centre franais dexploitation du droit de copie est strictement interdite.
Techniques de lIngnieur TE 5 885 11
DMAM : MDIAS NUMRIQUES, MTADONNES ET GESTION ___________________________________________________________________________________
Toute reproduction sans autorisation du Centre franais dexploitation du droit de copie est strictement interdite.
TE 5 885 12 Techniques de lIngnieur
__________________________________________________________________________________ DMAM : MDIAS NUMRIQUES, MTADONNES ET GESTION
Interactivit
Organisation du contenu Collections Modles utilisateur
Navigation Prfrences
Cration et et accs utilisateur
production
Rsums
Gestion
Mdia du contenu Usage Historique
utilisateur
Description Vues
du contenu
lments de base
de caractristiques perceptuelles de bas niveau (couleurs, textu- Il reste alors reprsenter la structure segmentaire et les mta-
res, formes, mouvements, timbre du son, description de la donnes avec un langage tel que XML (figure 8 les traits verti-
mlodie, ...) et dune information smantique (annotations tex- caux gauche ont t rajouts pour expliciter la correspondance
tuelles), entre la structure de la reprsentation en XML et celle de la
aspects conceptuels et smantiques de la ralit capture squence vido).
par le contenu, avec des objets, des vnements, des concepts
Toutefois, le dcoupage hirarchique prdtermin na rien duni-
abstraits et des relations ;
versel. Ainsi, les notions de scne et de squence sont loin dtre
la gestion du contenu (essence) :
communment acceptes. Quant aux notions de plan et dimage, si
information de cration : titre, annotation textuelle, crateur, elles ont un fondement objectif, elles ne reprsentent pas forcment
lieux et dates ; information de classification en catgories (genre, des units de description pertinentes.
sujet, objectif, langue, ...) ; information concernant lexistence de
matriels du mme contenu,
3.3.3.2 Descripteurs MPEG-7
information du support de stockage : format, codage et
compression ; identification du master et de ses diffrentes ver- Les descripteurs MPEG-7 sont principalement conus pour
sions (Media Profiles), dcrire des caractristiques audio ou visuelles au niveau physique
information dusage du contenu : pointeurs vers les droits (indiques comme tant de bas niveau dabstraction ) telles que
dutilisation, historique de lutilisation, information financire ; couleur, texture, mouvement, nergie audio, etc., aussi bien que des
lorganisation du contenu (essence) : collections de contenu attributs du contenu audio-visuel, de lessence (indiqus alors
audio-visuel, segments, vnements, et/ou objets ; comme tant de plus haut niveau dabstraction ) tels que lieu,
la navigation et laccs : le butinage efficace du contenu temps, qualit, etc. On espre que la plupart des descripteurs physi-
(essence) laide de rsums, partitions et dcompositions (seg- ques, de bas niveau, puissent tre extraits automatiquement.
ments spatiaux, temporels ou frquentiels), versions du matriel
audio-visuel ; Descripteurs visuels
linteraction avec lutilisateur : prfrences, historique dutili- Les descripteurs visuels sont bass sur des caractristiques
sation. visuelles permettant de mesurer la similarit entre des images ou
MPEG-7 doit permettre dassocier des descripteurs un docu- des vidos.
ment structur. On peut les classer en :
Par exemple, on modlise un document multimdia compos outils de description gnriques :
daudio et de vido (figure 7). On peut dfinir la vido en squen- lments de base (utiliss par les autres descripteurs visuels) :
ces, elles-mmes dfinies en scnes, dfinies en plans, puis en grille (grid layout), sries temporelles (time series), vues 2D dun
images dfinies en objets. chaque segment sera associe une objet 3D, coordonnes spatiales 2D, interpolation temporelle,
balise structurelle (tag). descripteurs de couleur : espace des couleurs, quantification de
On peut attacher chaque niveau de dcoupage des lments couleur, couleur dominante, histogramme de couleur dans
de description, par exemple des champs de la description apparte- lespace HSV (Hue, Saturation, Value), distribution spatiale des cou-
nant la Dublin Core, DC (rectangles colors ou griss de la leurs, structure des couleurs (similaire un histogramme par blocs
figure 7). Ainsi, on va dire quune scne a un type, un identifiant, de 8 8 pixels), couleur dun groupe dimages vido ou fixes,
une description, une longueur, un temps minimale, un temps descripteurs de texture : texture homogne (fonctions de
maximal, un format et une relation dautres lments. Outre les Gabor), texture homogne (simplifi) pour recherche, texture non
champs de type Dublin Core, on peut aussi associer des descrip- homogne (distribution spatiale de 5 types dartes),
teurs physiques dfinis par MPEG-7 (cf. 3.3.3.2) extraits si possi- descripteurs de forme : rgion, contour, forme 3D,
ble automatiquement (rectangles en tiret de la figure 7). Ainsi au descripteurs de mouvement (pour la vido) : mouvement de
niveau objet, on lui associera une position, une forme, une cou- camra, trajectoire dun objet, mouvement paramtrique, degr
leur, une texture, ... dactivit,
Toute reproduction sans autorisation du Centre franais dexploitation du droit de copie est strictement interdite.
Techniques de lIngnieur TE 5 885 13
DMAM : MDIAS NUMRIQUES, MTADONNES ET GESTION ___________________________________________________________________________________
DC. Titre
DC. Crateur
DC. Sujet DC. Type
DC. diteur DC. Identifiant
DC. Description DC. Description
DC. Contributeur DC. Sujet
DC. Date DC. Contributeur. Prsentateur
Document DC. Type DC. Format. Dure
multimdia DC. Format DC. Couverture. T. min
DC. Identifiant DC. Couverture. T. max
DC. Source DC. Relation. Parties
DC. Langue Descripteurs
Audio Vido DC. Relation. Parties MPEG-7
DC. Droits
Texte
DC. Type Script
DC. Identifiant Transcription
Piste Piste effets
Piste parole Squence 1 Squence 2 Squence 3 etc. DC. Description Liste de montage EDL
musique sonores
DC. Format. Dure + Images cls
DC. Couverture. t. dbut Localisation
Partition Liste DC. Couverture. t. fin Distribution acteurs
Liste des DC. Relation. Parties Objets scne
Code MIDI des effets Scne 1.1 Scne 1.2 Scne 1.3 etc.
phonmes
Tempo sonores
Texte
Script
Plan 1.1.1 Plan 1.1.2 Plan 1.1.3 DC. Type Transcription
DC. Identifiant Liste de montage EDL
DC. Description Image cl
DC. Format. Dure + Distance camra
Image 1 Image 120 DC. Couverture. t. dbut Angle camra
DC. Couverture. t. fin Mouvement camra
DC. Relation. Parties clairage
Ouverture en fondu
Objet 1 Objet 2 Objet 3
Fermeture en fondu
descripteurs de localisation : de zones dimage, spatio- On le voit, ltendue des domaines couverts par les schmas de
temporelle ; description et les descripteurs MPEG-7 est trs vaste. Cependant, elle
outils de description de plus haut niveau, spcifiques une nest pas uniformment explore : les descripteurs du signal numri-
application, telle que la reconnaissance de visages. Une image de que audio ou visuel, utiliss par exemple pour des recherches par
visage normalise de 56 lignes 56 valeurs dintensit/ligne, les similarit [TE 5 889, 3] font lobjet de la plus grande attention au
yeux tant positionns la 16e et 31e colonne de la 24e ligne, est dtriment des descripteurs du contenu (essence). Or, ces derniers
analyse. On en extrait des valeurs de luminance de pixels, qui sont pourtant, dun point de vue archivistique, les plus importants.
seront ensuite utilises pour la reconnaissance de visages. Cette disproportion sexplique par le fait que les experts chargs de la
normalisation taient essentiellement les reprsentants de la com-
Descripteurs audio munaut MPEG, lorigine des spcialistes du traitement du signal,
Les descripteurs audio sont bass sur des caractristiques per- de la reconnaissance de forme et de la vision artificielle.
mettant de mesurer la similarit entre des sons, tels que la musique
et la parole.
3.3.4 Broadcast & standards de mtadonnes
On peut les classer en :
outils de description gnriques, qui incluent un groupe de Comme rsultat du Groupe de travail EBU/SMPTE Task Force sur
descripteurs de bas niveau pour des caractristiques audio, appel lharmonisation des standards pour lchange des programmes
le MPEG-7 Audio Framework (figure 9) ; sous forme de flux binaires [3], des dveloppements pour la norma-
outils de description de plus haut niveau assurant les fonction- lisation des mtadonnes dans le domaine de laudiovisuel, et en
nalits suivantes : particulier de la radio-tlvision, ont t effectus par divers
description de signature audio, dcrivant le profil spectral acteurs :
(spectral flatness), le Comit Technique de la SMPTE, dans le domaine de la pro-
description du timbre (identification, recherche et filtrage) duction des programmes ;
bas sur les descripteurs de timbre dinstrument harmonique ou le groupe P/META de lUER dans les domaines des changes
percussion, Business-to-Business entre socits de production ou de
recherche de mlodie, Broadcast ;
reconnaissance et indexation gnrales de sons, le consortium TV-Anytime dans le domaine Broadcaster-to-
description de la parole. Consumer.
Toute reproduction sans autorisation du Centre franais dexploitation du droit de copie est strictement interdite.
TE 5 885 14 Techniques de lIngnieur
__________________________________________________________________________________ DMAM : MDIAS NUMRIQUES, MTADONNES ET GESTION
Toute reproduction sans autorisation du Centre franais dexploitation du droit de copie est strictement interdite.
Techniques de lIngnieur TE 5 885 15
DMAM : MDIAS NUMRIQUES, MTADONNES ET GESTION ___________________________________________________________________________________
Content Distributors
Third Parties
Interactive
Metadata Resolving
application
Applications authority
developers
Ancillary services
Content
Usage & Programme Internet
Creators
Rights aggregators Service Consumers
Production
Manager Internet publisher
inc. pre/post
B2B B2C
(0)
(mappings) entre les travaux de MPEG-7, de la SMPTE, etc. Un dic-
Tableau 8 Sets de mtadonnes descriptives Geneva tionnaire commun serait bien sr lidal, mais semble extrmement
Scheme MXF [35] difficile raliser. Par ailleurs, il est essentiel de dvelopper des
outils traduisant KLV en XML et vice-versa.
Set Name Set Name
Production Collection Scripting
Scene Collection Shot (plan) 4. Environnement tout-
Clip Collection Key Points (points cls)
numrique & MAM
Titles (titres) Participant
Group Contacts list
Le contenu (donnes de mdias + mtadonnes) doit tre mani-
Branding (nom gnrique) Person pulable et utilisable. Cest le rle du systme de Digital Media Asset
Identification Organization Management, dont les fonctions sont prcises ci-aprs. Mais ce
contenu nest grable quau sein de chanes tout-numriques, dont
Episode Location (lieux) quelques modles darchitecture sont ensuite proposs.
Event (vnement) Address
Publication Communications
Award (prix) Contract 4.1 Fonctions dun systme de gestion
Captions Description (sous-titres) Rights (droits) des mdias numriques
Annotation Image Format
Classification Device parameters (quipe- Le schma de principe dun systme de recherche de documents
ments) audio-vido numriques permet dillustrer les diffrentes fonctions
quaura grer, ou avec lesquelles aura collaborer un systme de
Setting Period Name-Value DMAM (figure 13).
1. leur arrive dans la chane, les sources audio/vido (cassettes/
Exemples dapplications : visionnage dune mission en diffr, disques, liaisons de contribution, ...) sont numrises et stockes
enregistrement dun programme de tlvision tout en regardant un dans un serveur de mdias diffrents niveaux de qualit (en ter-
autre, accs dun contenu la demande. mes de dbit, de dfinition selon lusage vis : consultation ou
Cela implique un schma de description et de rfrencement du browsing, archivage, distribution).
contenu (essence), la gestion des mtadonnes et la gestion des 2. Paralllement, un processus danalyse manuelle et automati-
droits [4] [5]. que a lieu fournissant des mtadonnes : donnes textuelles
TV-Anytime utilise un DDL MPEG-7 ( 3.3.3.1) pour dcrire la (mots-cls, rsums, ...), descripteurs (de colorimtrie de texture, de
structure des mtadonnes et XML pour les coder. formes, de visages, de mouvements, de mlodie, hauteur de son,
...) ; mais aussi textes (issus de sous-titres, du tltexte, de lcran
de la transcription de la bande son, ...), images-cls, rsums
3.3.5 Vers une compatibilit ? visuels, ... Tous ces index sont stocks dans une base de donnes
gre par un systme de gestion SGBD.
Le MPEG-7 Integration Group [14] a t form pour proposer un 3. Un traitement des media assets peut consister dans lassem-
cadre permettant linteroprabilit entre les systmes de mta- blage (editing) et le reformatage du contenu pour une distribution
donnes (figure 12). Cela passe par un dictionnaire de termes et de ultrieure : sur le Web, en tlvision interactive ou sur support auto-
dfinitions au sein de chaque schma, ainsi que par des passerelles nome (CD, DVD).
Toute reproduction sans autorisation du Centre franais dexploitation du droit de copie est strictement interdite.
TE 5 885 16 Techniques de lIngnieur
__________________________________________________________________________________ DMAM : MDIAS NUMRIQUES, MTADONNES ET GESTION
(b) Metadata
4. Lors dune interrogation, le systme au travers dun serveur grer les processus [TE 5 889, 4] ;
Web prsente une interface dinterrogation. Lutilisateur prcise les distribuer [TE 5 891, 1] ;
divers paramtres de sa recherche, qui sont ensuite traits par le grer et protger les droits associs [TE 5 891, 2] ;
systme et affins interactivement avec lutilisateur. Celui-ci obtient
une liste de rsultats qui, aprs slection finale, dclenchera la dis- vendre [TE 5 891, 3].
tribution du contenu souhait partir du serveur mdia.
5. Paralllement, des fonctions de contrle daccs de gestion des
droits et de commerce lectronique assurent une transaction 4.2 Positionnement dun systme
scurise et lgale avec le client.
de DMAM
Le processus de base dune gestion dassets recouvre donc et
relie les fonctions suivantes, qui seront dtailles dans chacun des
paragraphes des trois articles suivants de cette srie : Tout systme tout-numrique peut se reprsenter avec un modle
acqurir [TE 5 887, 1] ; avec plusieurs plans (figure 14) :
analyser et indexer [TE 5 887, 2] ;
diter [TE 5 887, 3] ; 1) celui des contenants , cest celui de la plate-forme com-
stocker et servir [TE 5 889, 1] ; portant les quipements et les logiciels :
grer les donnes et mtadonnes [TE 5 889, 2] ; des serveurs avec leur systme dexploitation et leurs applica-
rechercher [TE 5 889, 3] ; tifs [TE 5 889, 1],
Toute reproduction sans autorisation du Centre franais dexploitation du droit de copie est strictement interdite.
Techniques de lIngnieur TE 5 885 17
DMAM : MDIAS NUMRIQUES, MTADONNES ET GESTION ___________________________________________________________________________________
MPEG-7 SMPTE
Schema library dictionary
4.3 Chanes tout-numrique
& mtadonnes
Dublin
Core entities
4.3.1 Chane de tlvision
List of semantic
definitions
Pour lessentiel, la production tlvisuelle se subdivise en activi-
TV-Anytime ts, reprsentes dans le modle de la figure 15 comme des blocs
Internal
harmonization rpartis sur lensemble du premier plan vertical (vido). Dautres
blocs quivalents sont placs sur chacun des plans verticaux sui-
Etc. vants, savoir laudio, les donnes et les mtadonnes. Les activits
rattaches au plan vertical sont traverses par quatre couches de
communication horizontales, savoir applications, rseau, liaison
de donnes et couche physique. Un plan de commande et de con-
trle sous-tend ces deux ensembles de couches et plans orthogo-
naux, auxquels il est rattach.
Figure 12 Processus dintgration des mtadonnes [14]
Activits
des rseaux pour leur interconnexion et limport/export, avec Les activits reprsentent en fait les diffrentes tapes de la
les protocoles ; production : pr-production, acquisition, production, puis post-
production, distribution, stockage, transmission et archivage. Ces
2) celui du Contenu , comprenant lEssence (media data
sept activits peuvent tre utilises pour modliser pratiquement
daudio, de vido, ...) et les Mtadonnes associes ;
tout ce qui ressort du domaine de la production-distribution tl-
3) celui du systme de DMAM et de ses diverses fonctions ( visuelle. Il va sans dire que ces dfinitions seront diffrentes si, par
4.1), qui gre le contenu sur la plate-forme de niveau 1, via des exemple, elles concernent des actualits plutt quune srie tl-
modules logiciels tels que le SGBD ([TE 5 889, 2]), le HSM vise (sitcom), mais en rgle gnrale, elles sappliqueront toutes
([TE 5 889, 1]), modules dautomatisation ; les situations de production.
Serveur de mdia
Audio/Vido
non compresse
Source Media Distribution du contenu
Acquisition A/V
audio/ Distribution
Accs conditionnel et gestion des droits
Compression
Rponse
la requte
Edit
Serveur Web
Entre
requte
Traitement
Acquisition Gestion des donnes Requte et Distribution Utilisateurs
du mdia
Toute reproduction sans autorisation du Centre franais dexploitation du droit de copie est strictement interdite.
TE 5 885 18 Techniques de lIngnieur
__________________________________________________________________________________ DMAM : MDIAS NUMRIQUES, MTADONNES ET GESTION
Workflow
4
Acqurir-Indexer-
Acqu rir-Indexer-diter/Stocker-G
diter/Stocker-Grer-Rechercher/S
rer-Rechercher/Scuriser-Distribuer-Vendre
curiser-Distribuer-Vendre
Acqurir-Indexer-diter/Stocker-Grer-Rechercher/Scuriser-Distribuer-Vendre
Digital media
Media Asset Management
3
Mtadonnes
tadonnes
Mtadonn es
Contenu
Donnes mdia
Plan mtadonnes
Plan donnes
Plan audio
Plan vido
Applications
communication
Post-production
Transmission
Pr-production
Rseau
et mission
production
Couches
Distribution
Saisie et
Archivage
Stockage
Liaison donnes
Physique
Activits
Plan commande et contrle
Toute reproduction sans autorisation du Centre franais dexploitation du droit de copie est strictement interdite.
Techniques de lIngnieur TE 5 885 19
DMAM : MDIAS NUMRIQUES, MTADONNES ET GESTION ___________________________________________________________________________________
Essence et mtadonnes
Quelques
Consommation Distribution
Les plans verticaux du modle sont au nombre de quatre et con- mtadonnes
cernent le contenu (essence + mtadonnes). limines
Distribution
Le premier est lessence vido, terme faisant exclusivement rf-
rence aux flux binaires vido. De mme, lessence audio ne con- Quelques
Consommation Packaging mtadonnes
cerne que les flux sonores. Lessence donnes reprsente
linformation ayant une valeur intrinsque. Elle se distingue de limines
lessence vido et de lessence audio. Ainsi, le tltexte et le sys-
tme dincrustation de lgendes (technique de sous-titrage en Interaction Composition
temps rel utilis principalement dans les pays dots de systmes
de tlvision analogique 525 lignes) sont-ils considrs comme Stockage
tant de lessence donnes, puisquil sagit dinformations significa-
tives en tant que telles.
Commande Synthse
Viennent enfin les mtadonnes, qui nont aucune valeur en soi.
Elles sont lies dune manire ou dune autre aux essences vido,
audio et donnes. Le code horaire (Time Code) est un bon exemple
de mtadonnes. Pris indpendamment, il na aucune valeur, mais laboration Analyse
associ la trame vido, il permet son identification et son reprage.
Acquisition
Couches de communication
Production Post-production
Le modle de la figure 15 est recoup transversalement par plu-
sieurs couches de communication reprsentes par des plans hori- Flux de mtadonnes Flux dessence
zontaux. Ces couches de communication ressemblent la pile du
modle de rfrence sept couches OSI (Open Systems Intercon- Figure 16 Flux Essence et mtadonnes [6]
nection) de lISO. Quatre couches ont sembl suffisantes pour repr-
senter des installations ou un systme de tlvision. La premire
couche en commenant par le bas est la couche physique, qui con-
4.3.2 Chane de cinma numrique
cerne les caractristiques lectriques et mcaniques du systme, ou
la connectique. La suivante est la couche de la liaison des donnes,
qui concerne les protocoles reliant les dispositifs directement con- La SMPTE [15] a initi en janvier 2000 la conception dun modle
nects. Donc, si un organe de commande est branch sur un magn- darchitecture (figure 17) dun systme de cinma numrique, ou D-
toscope, la couche de la liaison de donnes gre la communication Cinema, permettant de dfinir les modules techniques spcifier.
directe entre ces deux lments. La couche rseau qui se trouve Ce modle prsente dabord les diffrentes fonctions requises dans
juste au-dessus commande les protocoles faisant le lien entre les la chane :
dispositifs indirectement connects. Enfin, la couche application, mastering, production dun fichier-source numrique pour les
qui domine le tout, commande les applications et ce que le modle images et les sons ;
OSI appellerait la couche de prsentation. compression, rduction de dbit (en option) pour rduire les
dures, et par consquent les cots de distribution ;
Plan de commande et de contrle encryption, permettant la protection (optionnelle) des mdias
film par chiffrement et leur contrle daccs (conditional access) ;
Le plan de commande et de contrle constitue les fondations du packaging, ou formatage avant distribution ;
modle. Cette couche concerne tous les autres lments du modle, transport, pour la transmission vers les salles de cinma ;
essentiellement pour assurer la coordination entre tous les l- storage, stockage sur supports informatiques ;
ments se trouvant au-dessus delle. Dans les situations de transfert, les fonctions inverses de dchiffrement (decryption) et de
mmorisation, manipulation, surveillance, diagnostic, etc., la cou- dcompression ;
che de commande et de contrle assure galement la gestion du display, ou fonction de projection.
contenu sur lensemble des activits, plans et couches. Le plan de
commande et de contrle ne ralise donc pas uniquement une fonc- Lintrt de ce modle est aussi dillustrer lassociation des mta-
tion de commande, mais il exerce aussi une fonction de gestion. Par donnes aux diffrentes fonctions.
exemple, sil savrait ncessaire de rpartir la largeur de bande de
frquences des canaux de transmission entre les dispositifs, la tche
serait effectue par le plan de commande et de contrle.
4.4 MPEG-21
Ce plan assure aussi linterface avec les utilisateurs du systme.
La figure 16 prsente le mme systme de production-distribu- MPEG-21 peut tre considr comme un modle et un ensemble
tion mais sous forme de cycle dynamique des flux dEssence et de doutils ayant lambition de sappliquer au monde universel du mul-
Mtadonnes. Les fonds griss montrent les zones correspondant timdia et de sa gestion.
des besoins utilisateurs diffrents, appelant des modles opration- Les premiers lments de la norme MPEG-21 [10], qui en com-
nels appropris. Par exemple, un modle oprationnel utilis en dis- prend 9 au total, ont t publis en 2002 et 2003.
tribution (delivery), partir dune rgie finale, ne doit pas permettre
un utilisateur denvoyer un ensemble de clips qui ncessitent un Dnomme Multimedia Framework ou e-Commerce for e-
montage pralable ou lajout deffets spciaux. Le programme doit Content , la norme MPEG-21 ambitionne de fournir un cadre gn-
tre prt diffuser (PAD). Au contraire, dans une zone de cra- rique pour permettre une utilisation transparente et accrue de conte-
tion et de production (Production et Post-production), il est totale- nus numriques, et en particulier leur distribution et leur transaction
ment appropri dchanger un grand nombre de composantes de au travers dune grande varit de rseaux et dquipements.
contenu avec les mtadonnes permettant de les assembler en un MPEG-21 est donc une norme qui recouvre un champ beaucoup
produit fini. plus large que les normes MPEG-1/-2/-4, qui sont des normes de
Toute reproduction sans autorisation du Centre franais dexploitation du droit de copie est strictement interdite.
TE 5 885 20 Techniques de lIngnieur
__________________________________________________________________________________ DMAM : MDIAS NUMRIQUES, MTADONNES ET GESTION
Originator Exhibitor
conditional conditional
acccess key access key
management management
Transport system
(optional) (optional)
Packaging
Audio Audio
Audio
Audio compression decompression
system
(optional) (optional)
Metadata Metadata Metadata Metadata
Auxiliary Auxiliary
Auxiliary
Auxiliary compression decompression
system
(optional) (optional)
Metadata Metadata Metadata Metadata
Metadata
Metadata
System
control &
monitoring
Theatre
management Auditorium
Remote system/Monitoring/ system control
Exhibition information/Other system
communication (all optional) Metadata
reprsentation (codage) numrique, et que la norme MPEG-7 qui est Digital Item
une norme de description du contenu multimdia. Ce nest pas LA
Cest un objet numrique structur avec une reprsentation, une
norme de DMAM, mais cest une norme qui devrait progressive-
identification et des mtadonnes normalises dans le cadre de
ment tre intgre aux fonctions de DMAM.
MPEG-21.
Pour atteindre son objectif, MPEG-21 a tabli un modle denvi-
ronnement multimdia et a propos une architecture de briques Cet article numrique peut tre complexe. Par exemple, le Digital
technologiques normaliser. Item compilation musicale peut tre constitu de musique
(audio), de photos, dun clip vido, danimations graphiques, du
texte des paroles des chansons, des partitions, des fichiers MIDI, de
4.4.1 lments de base du modle linterview avec les chanteurs, dactualits relies une chanson, de
la dclaration dune personnalit, de la position au hit parade, des
informations de navigation guide par les prfrences utilisateurs,
Pour dessiner le cadre multimdia (multimedia framework), le
des bonnes occas , ...
modle propos (figure 18 plan horizontal du bas) dfinit deux
entits de base : les utilisateurs (Users) et lobjet ou article numri- Cest le document Digital Item Declaration DID ( 4.4.2) qui spci-
que (Digital Item). fiera la composition, la structure et lorganisation du Digital Item.
Toute reproduction sans autorisation du Centre franais dexploitation du droit de copie est strictement interdite.
Techniques de lIngnieur TE 5 885 21
DMAM : MDIAS NUMRIQUES, MTADONNES ET GESTION ___________________________________________________________________________________
Examples :
Examples : Content
Storage Management Management
Content Personalization & Usage
Metrics & Interfaces
Examples :
Event Reporting
Intellectual
Rights & Permissions
Property
Authentication
Management
Encryption
& Protection
Watermarking
Examples :
Resource Management (QoS) Terminals
Graceful Degradation & Networks
Resource Abstraction
Digital Item
User A User B
Authorization/Value Exchange
Transaction/Use/Relationship
Toute reproduction sans autorisation du Centre franais dexploitation du droit de copie est strictement interdite.
TE 5 885 22 Techniques de lIngnieur
__________________________________________________________________________________ DMAM : MDIAS NUMRIQUES, MTADONNES ET GESTION
Fichier de format
Figure 19 Principaux lments du modle de Digital Item Un format de fichier polyvalent est en cours dimplmenta-
Declaration [10] tion, qui pourrait reprendre des concepts de MPEG-4.
Toute reproduction sans autorisation du Centre franais dexploitation du droit de copie est strictement interdite.
Techniques de lIngnieur TE 5 885 23
DMAM : MDIAS NUMRIQUES, MTADONNES ET GESTION ___________________________________________________________________________________
<DIDL>
<Container>
<Descriptor>
<Statement type=text/xml> MEPG-7
<mpeg7:Mpeg7> Descriptor
Creation
<mpeg7:DescriptionUnit text/xml
Information
xsi:type=CreationInformationType>
<mpeg7:Creation>
<mpeg7:Title>Musical package</mpeg7:Title>
Item
</mpeg7:Creation>
</mpeg7:DescriptionUnit>
</mpeg7:Mpeg7> Music package
Descriptor
</Statement> (one song plus
text/plain
two photos)
</Descriptor>
<Item>
<Descriptor>
<Statement type=text/plain> Item
Music Package (one song plus two photos) music.mp3
</Statement>
</Descriptor>
<Item>
<Component>
<Resource ref=music.mp3 type=audio/mp3/>
</Component> Item
</Item> photo1.jpg
<Item>
<Component>
<Resource ref=photo1.jpg type=image/jpg/>
</Component>
</Item>
<Item>
Item
<Component> photo2.jpg
<Resource ref=photo2.jpg type=image/jpg/>
</Component>
</Item>
</Item>
</Container>
Figure 20 Exemple de Digital Item
</DIDL>
Declaration en XML [18]
Identifier :
backCover.jpeg GRid
Descriptions :
metadata
Album title
MPEG-21
cover.jpeg Label
music album
coverNotes.html
Identifier :
ISRC
Descriptions :
track1.aac track2.aac track3.aac Lead Singer
metadata metadata metadata Orchestra
Conductor
Concert Hall
Identifier : Engineer
lyrics1.aac lyrics2.aac ISMN Label
metadata metadata Descriptions :
Title
Composer
Lyricist
Duration
Singer
Toute reproduction sans autorisation du Centre franais dexploitation du droit de copie est strictement interdite.
TE 5 885 24 Techniques de lIngnieur