05/12/2011

Le web sémantique :
Une infrastructure indispensable aux systèmes de KM tè d
Dr. Rim Faiz Rim.Faiz@ihec.rnu.tn rimfaiz@yahoo.fr a @ya oo

Mastère Recherche Informatique

KM et technologies
le web sémantique et les technologies qu’il sous-tend, intéresse de plus en plus les organisations en quête d’interopérabilité et d’automatisation plus importante de la gestion de leurs informations et de leurs connaissances. Les systèmes de KM tirent également partie de cette nouvelle infrastructure qui leur offre la possibilité d’exploiter l’ensemble des ressources informationnelles des organisations grâce à l’utilisation d’un langage commun.

2

1

05/12/2011

Un principe simple
L’idée principale du WS repose sur la séparation entre les informations et leur présentation présentation. Il s’agit d’en faciliter la gestion et le traitement. Ces opérations sont d’autant plus simples que les ressources sont identifiées de manière unique et organisées autour d’une ontologie dont l'objectif est de fournir des représentations formelles d'une partie du monde. d Une ontologie est donc un modèle d'organisation des connaissances dans un domaine donné.
3

Un principe simple (suite)
Concrètement, le WS peut être vu comme une infrastructure au sein de laquelle chaque ressource est couplée à des métaq q p données qui sont définies à l’aide de langages permettant de décrire les ressources ainsi que les relations qui les lient à l’aide de marqueurs sémantiques. Dans ce domaine, deux langages sont aujourd’hui en concurrence : d’un côté le couple RDF et OWL, supportés par le W3C, et de l’autre Topic Maps, un standard proposé par l’ISO. Ces langages constituent un socle pour définir des ontologies, entités indispensables pour faciliter l’exploitation automatique ou semi-automatique de l’information par un ordinateur tout en gardant la signification du contenu pour les êtres humains.
4

2

05/12/2011

Du rôle central des ontologies
D’un point de vue strictement structurel, le WS s’appui sur les technologies XML. Par contre, d’un point de vue sémantique, il nécessite l’utilisation de deux formalismes complémentaires :
un formalisme de représentation des p connaissances, les ontologies. et un formalisme de raisonnement, l’inférence.
5

Du rôle central des ontologies
Dans le cadre de l’entreprise et du KM, le WS et l’utilisation des l’ ili i d ontologies offrent trois avancées l i ff i é majeures :
des possibilités de recherche améliorées, une automatisation des tâches possibles bien plus importantes, importantes une interopérabilité des systèmes.

6

3

sémantique d’effectuer des recherches complexes constituées d’éléments possédant une relation sémantique 7 Le Web aujourd'hui Le Web Sémantique W3C Semantic Web Activity Marja-Riita Koivunen and Eric Miller. l’objectif d’une ontologie est de modéliser les différents concepts d’un domaine et surtout de définir les liens qui existent entre ces concepts. Nov. t En effet.05/12/2011 Recherche améliorée (1) Les ontologies offrent des capacités de recherche très i t è puissantes. Chaque élément des documents qui utilisent cette ontologie possède une représentation sémantique. 2001 8 4 .

05/12/2011 Recherche améliorée (2) : Exemple la recherche des dirigeants des entreprises pharmaceutiques est beaucoup plus simple à l’aide d’une ontologie car celle-ci décrit les liens qui existent entre un dirigeant et une entreprise. il devient très facile d’automatiser certaines tâches grâce à des algorithmes d’inférence. 10 5 . etc. De ce fait. d’activité. L’inférence est un processus q p p qui permet de p produire de nouvelles informations à partir d'autres informations tenues pour acquises en utilisant de règles formelles. entre une entreprise et un secteur d activité. 9 Automatisation accrue (1) L’utilisation d’une ontologie permet à un ordinateur de d connaître la signification d chaque élé ît l i ifi ti de h élément d t des documents et les relations qui les lient.

les algorithmes d’inférence définissent des actions à réaliser en f ti é li fonction d t ti des types d concepts de t et des relations existantes entre eux. En d’autres termes. avec des chaînes de raisonnement plus importantes.05/12/2011 Automatisation accrue (2) Dans son expression la plus basique. des mécanismes plus complexes. 12 6 . Si par contre les informations fournies ne sont pas semblables. on définit des tâches à partir des méta-données. peuvent être requis. on est en mesure l aide l’ontologie d’exploiter les entités du document pour réaliser les tâches définies de manière totalement automatique. 11 Automatisation accrue (3) Ainsi. ensuite grâce à la description du document à l’aide de l ontologie. l’inférence revêt la f êt l forme d’un simple mécanisme d « pattern d’ i l é i de tt matching » un mécanisme qui permet de comparer deux modèles et de les apparier s’ils sont semblables.

Centre hospitalier universitaire de Rouen > g py g <meta name=DC.css' type='text/css'> </head> <body class=doccismefgeneral> 13 http://doccismef.chu-rouen. Toute utilisation partielle ou totale de ce document doit mentionner la source><link rel=schema.txt'> <link rel='StyleSheet' href='/stylesheetreq.fr/ <…> Exemple de méta-données 14 7 .RFC1766 href='http://www.fr> <meta name=DC.org/rfc/rfc1766.Rights content=Copyright CHU de Rouen. Benoit Thirion .Language scheme=RFC1766 content=fr> <meta name=DC. name=DC.Format scheme=IMT content=text/html> <meta name=DC. Méta-données avec le Dublin Core <html> <head><title>Résultat de la recherche Logique sur Doc ’CISMeF</title> <meta name=DC Creator contentéquipe CISMeF : Stéfan Darmoni.Creator Darmoni Magaly Douyère.Publisher content=Rouen University Hospital . cismef@chu-rouen.05/12/2011 Ex.ietf. Jean-Philippe Leroy. Josette Piot.

pour qu’un tel système puisse jouer pleinement son rôle de support pour le transfert et le partage des savoirs de l’entreprise il doit être en l entreprise. groupware. ont multipliées les systèmes pour g . 16 8 . les efforts consentis sur les middleware n’ont de véritables impacts que sur les processus et très peu sur les modèles de données. G. 15 L’interopérabilité des systèmes d’information (2) Malheureusement. Aujourd’hui. doivent faire l’objet de développements spécifiques aussi coûteux que difficiles à réaliser et maintenir. . la plupart des organisations. au cours des années. possédant chacun un modèle de données propres. etc.E. pour intégrer différentes sources de données. mesure d’accéder à l’ensemble des sources de données. p y p gérer l’information et la connaissance : bases de données. En effet. Au final. Intranet.05/12/2011 L’interopérabilité des systèmes d’information (1) Parmi les différents aspects informatiques du KM celui de l’interopérabilité du système de gestion des l interopérabilité connaissances avec les systèmes d’information existant est sans doute l’un des plus importants. elles ont mis en place des systèmes indépendants et hétérogènes. Ceci handicape énormément les systèmes dèl d d é C i h di é é tl tè de KM qui.D.

s’employer à réfléchir à la meilleure façon de traiter les connaissances tacites. de ce fait. c’est un moyen simple d’adresser la gestion des connaissances explicites en relation avec les usages et processus métiers. problème le WS semble aujourd’hui être le moyen qui aujourd hui s’impose pour faciliter l’intégration des systèmes de KM au SI de l’entreprise. En effet. l’entreprise peut. 18 9 . malgré l’hétérogénéité de leurs sources. le WS peut être utilisé pour l é i l l ê ili é la mise en place de serveurs de connaissances dont le rôle est : d’unifier et d’organiser l’accès aux différentes sources d’information disponibles dans l’entreprise. Il s’agit de systèmes de médiation qui permettent aux utilisateurs d’avoir une vision partagée des connaissances de l’entreprise. les ontologies offrent la possibilité de représenter et d’organiser la connaissance à l’aide d’un unique modèle de données commun à l’ensemble des applications de l’entreprise.. Le grand intérêt des serveurs de connaissances réside dans leur capacité à intégrer l’existant.05/12/2011 L’interopérabilité des systèmes d’information (3) Parmi les différentes solutions possibles à ce problème. D’un i d D’ point de vue opérationnel. libérée d’une importante partie de cette tâche. Les ontologies fournissent les interfaces idéales entre l’information et les diverses applications qui souhaitent les utiliser à des fins de traitement. 17 L’interopérabilité des systèmes d’information (4) Le WS fournit ainsi une infrastructure facilitant l’intégration de sources d’informations hétérogènes. p g de plus.

D’autre part. d’ontologies La création d’une ontologie est une affaire de spécialistes dans la mesure où il faut avoir des compétences à la fois dans le domaine à modéliser mais aussi en représentation des connaissances et en linguistique. les outils permettant de créer et de gérer les ontologies ne sont pas encore assez matures pour permettre « l’i d t i li ti » d l’ tili ti d ontologies d l’industrialisation de l’utilisation des t l i dans l les entreprises. Toutefois. Une pluridisciplinarité des compétences encore rare… 20 10 . En effet. les entreprises qui souhaitent se lancer dans la mise en place d’ontologies sur l’ensemble de leur système d’information risquent de se trouver d information confrontées à quelques difficultés. certains éditeurs de logiciels proposent des solutions complètes qui intègrent les différents standards. à l’heure actuelle. Ils ne sont pas d’accès faciles et il n’existe pas encore de véritables standards.05/12/2011 Que des avantages ? Même si le WS semble promis à un bel avenir en entreprise. que des avantages. il f t noter que cette approche ne t i faut t tt h présente pas. essentiellement dues à la relative « jeunesse » du marché. il n’existe pas de méthodologies prouvées et surtout éprouvées pour guider les entreprises dans la création d ontologies. 19 Que des avantages ? D’une part.

. Le Web est difficilement exploitable par des machines. Le Web est exploité par des personnes qui recherchent des informations par l’intermédiaire d’un moteur de recherche et qui exploitent elles mêmes elles-mêmes le(s) résultat(s). 22 11 .05/12/2011 Vision du web Sémantique Du Web d’aujourd’hui ..

Le Web dynamique : Génération à la volée du contenu au moyen de base de données ou de transformations XML. 23 Les trois générations du Web Le Web statique : HTML à la main permettant l’accès uniforme à l’i f l’ è if l’information. Les machines peuvent traiter un volume d’informations plus grand et être plus efficace que des humains à conditions que l’on les munissent d’une certaine forme d’intelligence. 24 12 ... au Web de demain Le Web sera exploité principalement par des machines qui traiteront elles mêmes les questions formulées par elles-mêmes des personnes et qui délivreront des résultats.05/12/2011 . Le Web Sémantique. pas de prise en compte des contenus dynamiques. ti mais difficulté de maintenance. d’i t lli qu’il existe une infrastructure leur permettant d’exploiter correctement les informations.

. Pas de possibilité d’exploiter des connaissances pour une gestion plus intelligente des informations : recherches par le contenu des documents.. Pas de typage : que des chaînes de caractères ! 26 13 . seulement une aide pour les humains pas pour les machines. la séquence. 25 XML Fausse idée reçue : XML n’est pas sémantique ! On peut définir ses propres balises : <auteur>. <titre> Mais ne signifie pas plus qu’une balise <H1>. . XML c’est de la ”syntaxe pauvre” : permet c est syntaxe pauvre d’exprimer seulement l’enchâssement (ou la hiérarchie). la co-occurrence. résolution de problèmes. raisonnements.05/12/2011 HTML Balises HTML qui ont un sens pour la mise en forme : − <H1> : titre − <H2> : sous-titre Mélange du fond et de la forme. Aucune sémantique par rapport au contenu : qui est l’auteur ? Quand le document a été rédigé ? Moteurs de recherches et indexation des pages.

Changement de contexte de déploiement : le Web et ses dérivés : intranet.05/12/2011 Le Web Sémantique Le Web sémantique proposé initialement par Tim Berners-Lee (W3 Consortium) est une nouvelle infrastructure devant permettre à des agents logiciels d’aider plus efficacement différents types d’utilisateurs dans leurs accès aux ressources sur le Web (sources d’informations et services). wap. .. notion Pas obligatoirement de techniques radicalement nouvelles : outils de l’Intelligence Artificielle (représentation des connaissances) connus depuis les années 70-80! Changement d’échelle. 27 Premières caractéristiques du Web sémantique Les méta-données sont au coeur de la démarche avec une grande diversité dans l’interprétation et l’utilisation de cette notion. wireless. Changement de niveau d’interopérabilité. 28 14 . d’ouverture.. de niveau de standardisation.

30 15 . etc..05/12/2011 Problématique Web actuel de plus en plus volumineux et diversifié Informations et les services sont de moins en moins exploitables Web actuel n’est pas fait pour être manipulé de façon intelligente par les programmes informatiques Frustrations dans la recherche sur le web actuel Perte d t P t de temps considérable avant d’obtenir idé bl t d’ bt i l’information désirée 29 Evolutions à venir : le web sémantique Définition du « Semantic Web » : chantier d recherche d W3C h ti de h h du Constat des insuffisances du web actuel : absence de description et d’indexation des ressources. hétérogénéité des formats… p pas de structure explicite du web. p Objectifs : meilleure structuration du web.. exploitation sémantique de la nature du web.

pour une exploitation optimale. documents et services (norme //RDF//). sécuriser ces échanges .05/12/2011 Proposition de solutions Rendre sémantique le web. Introduire une « couche sémantique » permettant la description des contenus (méta-données) la t t ti d l structuration des ressources (li (liens h hypertextes éti t t étiquetés) té ) … avec un certain niveau de formalisation permettre la recherche d’informations à partir des concepts. des notions.. c'est compléter l ' t lét les b li balises HTML par d des b li balises «porteuses de sens» (XML) . c'est multiplier et organiser les mots-clés dans le document même (sans que le lecteur ne voit de différence) A un niveau plus élevé. p pour exprimer ces descriptions les échanger et intégrer des informations hétérogènes traduire entre différents formalismes raisonner à partir de ces descriptions. mécanismes.... langages. c'est travailler à l'indexation de toutes les ressources du web. et non plus de simples chaînes de caractères (mots-clés) 32 16 . 31 Web Sémantique : infrastructure Infrastructures standards : protocoles. .

Associer aux ressources Web des informations structurées descriptives sous la forme de métadonnées (ou annotations). 34 17 . MAIS : de manière totalement automatisée sur les connaissances et plus seulement sur les documents 33 La vision du Web sémantique en résumé… Le Web sémantique repose sur des langages et une infrastructure infrastructure. utilisables par des machines. Objectif : donner la possibilité d’enrichir le Web actuel à l’aide d’informations dites «sémantiques». du WS Permettent d’exprimer différents types de méta-données (ré) introduction des problématiques documentaires de catalogage (avec les méta-données) et d’indexation (avec les ontologies).05/12/2011 Web Sémantique : infrastructure Vocabulaires partagés pour différentes communautés ontologies … comme conceptualisations partagées au coeur partagées.

net Réseaux et Systèmes d'Information Santé au service des professionnels 36 18 . Un exemple : le portail médical Caducee. documents notion de « granularité » de l’information. ontologies. classifications… principe fondamental du web sémantique : séparation du contenu des documents de l’organisation de ce contenu 35 Quelles conséquences du web sémantique ? Travail en profondeur dans la « trame » des documents. nouvelles formes de représentation de l’information : en amont (conception avec XML).05/12/2011 Principes et outils du WS quadruple normalisation nécessaire. thésaurus. possibilités inédites de recherche intelligente sur le contenu. en aval (recherche). quatre directions de recherche : identification des ressources numériques description des ressources : systèmes de métadonnées structuration des documents numériques : XML indexation des ressources : langages de description.

relations. Ajouter des règles d'inférence 38 19 .05/12/2011 Le web demain Simplifier le rôle de l'utilisateur dans la recherche l utilisateur et l'exploitation de l'information grâce à : de meilleurs moteurs de recherche l'intégration facilité des sources de données la découverte. prédicats. l'exploitation et la combinaison de services des possibilités accrues de raisonnement sur les données 37 Comment y arriver ? Apprendre la sémantique à la machine (IA/KR) structure du document dictionnaires connaissances sur la langue etc. Ajouter des informations sémantiques destinées aux machines (SW) Ajouter des concepts.

aspect informationnel Voir le Web comme un ensemble de services combinables. complémentaires … à terme ? Voir le Web comme un vaste réseau interconnecté p par des liens sémantiques. aspect fonctionnel Les points de vue du communicateur.. Topic Maps. du gardien de la connaissance et du commerçant !! 39 Qu'est ce qui fait l'unité du WS? Une infrastructure que peuvent utiliser différents agents logiciels ou … "médiateurs" utilisant des médiateurs technologies voisines. langages (ceux du W3C. Intégrant la représentation de connaissance g p dans le monde Web et … XML Création systématique de standards 40 20 . …) et … de plus en plus d'outils.05/12/2011 Trois perspectives .. q aspect communicationnel Voir le Web comme un vaste ensemble de ressources munis d'annotations ou de métadonnées. protocoles de communication.

. extranet de niveaux d'interopérabilité. d'ouverture.05/12/2011 Une infrastructure pour… exprimer des descriptions sémantiques des ressources construire des cartes de sites retrouver ces ressources naviguer dans ses ressources les échanger et intégrer des informations de ressources hétérogènes les traduire entre différents formalismes effectuer des raisonnements à partir de ces descriptions sécuriser ces échanges …. Mais changement d'échelle de contexte de déploiement le Web et ses dérivés : intranet.. de niveau de standardisation 42 21 . Métadonnées ingénierie de la connaissance représentation de la connaissance ... Utilisable dans différents domaines applicatifs 41 Le Web sémantique et l'existant S'appuient sur un existant riche … adapté .

h h de navigation intersujet et interdocument dispositifs d'assistance à l'indexation.. elles visent toutes l'automatisation du traitement des contenus 43 Applications potentielles Recherche d’information d information Maintenance de base documentaire Commerce électronique Services immatériels (e-work. e-business) ….. espace de travail pour réexploiter les données extraites les applications du Web sémantique sont nombreuses nombreuses.05/12/2011 L'automatisation du traitement des contenus passe par le Web sémantique Fonctions de classification.. 44 22 . de d recherche.

en décomposant par exemple les domaines d'une société en familles et sousfamilles. Enfin. Les méta-données allouées aux documents (RDF) contribuent à améliorer les capacités d'analyse des modules de recherche. Concrètement. 45 Des technologies de description et de classification La boîte à outils du Web sémantique couvre plusieurs grands enjeux de la gestion documentaire : Les ressources ontologiques (OWL) permettent de fournir aux portails un cadre général de catégorisation. généralement basés sur des mécanismes d'indexation 'plein texte' (questions / réponses).05/12/2011 Des technologies de description et de classification L'apport du Web sémantique à l'entreprise ? Il se place principalement sur le terrain de la gestion des connaissances (KM). le champs taxinomique (Topic Map) affine la structuration des objets manipulés. en les étendant par exemple aux requêtes multicritères et croisées. 46 23 . d un d'un niveau de modélisation (XML) supplémentaire contribuant à améliorer la pertinence de leurs fonctions de recherche et de classification. il dote les portails traditionnels.

Étienne Canaud. M. Zacklad et al.05/12/2011 Exemple de topic map (1) 47 D’après Jean-François Baget. 48 24 . Caussanel. Jérôme Euzenat et Mohand Saïd-Hacid Exemple de topic map (2) D’après J.

.. 50 25 . exploiter et raisonner sur l contenus d ressources i les t des Des connaissances qui s'appuient sur des ontologies. Intégration automatique d'informations provenant de sources hétérogènes. td hété è Utilisation et combinaison automatique de services Web 49 Recherches fondamentales pour le WS Méta-données et a otat o s éta do ées annotations Ontologies pour le WS Intégration de sources d'information hétérogènes Services Web et WS et bien sûr les langages pour le WS et . Utilisation de métadonnées.05/12/2011 La vision du Web sémantique en résumé… Différents langages pour décrire.

”The Semantic Web : What. IEEE Distributed Systems Online.org/0403/d/o3004. ScientifAmerican.ieee. How ”. http://websemantique.w3. Interopérabilité des systèmes. March http://dsonline.sciam. May.05/12/2011 Conclusion Le web sémantique : une infrastructure indispensable aux systèmes de KM Possibilité de recherche améliorée.org/ http://www. Tim Berners-Lee.com).oasis-open. p y 51 Bibliographie www. ”The Semantic Web”.org/WEBONLY/ http://www spectrum ieee org/WEBONLY/ Frank Van Harmelen (2004). Why. Automatisation plus importante de la gestion des informations et des connaissances.computer.htm 52 26 .org.com (www.spectrum.org/RDF www. James Hendler and Ora Lassila (2001).

05/12/2011 Quelques acronymes URL : Uniform Resource Locator URI : Universal Resource Identifier HTML : Hyper Text Markup Language XML : eXtended Markup p Language XSDL : XML Schema Definition Language RDF : Resource Description Framework DAML : DARPA Agent Markup Language OIL : Ontology Inference Layer DARPA : Defence Advanced Research Project Agency W3C : World Wide Web Consortium 53 54 27 .

Regroupement dans un référentiel de ressources d’apprentissage (« learning objects repository »). Associées à d pages W b l A ié des Web..... les méta-données sont un élément de base du Web sémantique. Description par des fiches de métadonnées. De leurs conditions de productions quels acteurs : professionnels / usagers de "base" statique / dynamique . Pour des recherches intelligentes et l’intégration dans des environnements d’apprentissage..05/12/2011 Méta-données et annotations Grande diversité annotations documentaires annotations structurelles annotations sur les contenus . 56 28 . Variété de leur rôles catalogage recherche d'information aide à la navigation construction dynamique de ressources : adaptation et personnalisation .. 55 Méta-données et Web sémantique Processus multi acteurs dans lequel des personnes publient ou repèrent d ressources è t des intéressantes.

p Par leur formalisation. métadonnées.05/12/2011 Ontologies Spécifications déclaratives des concepts et des rôles dans un domaine de disco rs n discours. 57 Ontologies. agents logiciels et … utilisateurs www. Fournissent des vues structurées et partageables des ressources. Donnent un vocabulaire pour les méta-données. permettent l'automatisation de certains raisonnements.semanticweb.org 58 29 .

transformant ainsi l'Internet en une vaste base de données construite avec un langage structuré. le WS apparaît comme une véritable révolution dans l'accès à l'information sur les réseaux. essentiellement sur le terrain de la gestion des connaissances. mieux qu'un outil documentaire (1) Sur un plan technique. Les ontologies sont l'un des outils utilisés pour y parvenir. technologies vont être utilisées dans les entreprises.05/12/2011 Le web sémantique. dans un proche avenir ces mais avenir. 59 Le web sémantique. mieux qu'un outil documentaire (2) Les futurs usages du web sémantique sont encore peu prévisibles mais. l un Ce sont des langages formalisés et consensuels qui. décrivant un domaine du monde réel. La mise en œuvre du web intelligent concerne donc tous les aspects de la gestion documentaire et particulièrement l'automatisation du traitement des l automatisation contenus. permettent " de lier le contenu exploitable par la machine avec sa signification pour les humains ". Il consiste en un enrichissement sémantique de l'information par l'ajout d'une couche permettant la description des contenus et la structuration des ressources avec un certain degré de formalisation. Les professionnels de l'information apparaissent donc à juste titre des partenaires privilégiés 60 30 . L'objectif étant de donner un sens aux informations que même les ordinateurs pourraient comprendre.