Welcome to Scribd, the world's digital library. Read, publish, and share books and documents. See more
Download
Standard view
Full view
of .
Save to My Library
Look up keyword
Like this
5Activity
0 of .
Results for:
No results containing your search query
P. 1
integration donnees - 20p de rappel et du web semantique

integration donnees - 20p de rappel et du web semantique

Ratings:

4.5

(2)
|Views: 269 |Likes:
Published by api-3750267

More info:

Published by: api-3750267 on Oct 17, 2008
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as PDF, TXT or read online from Scribd
See more
See less

03/18/2014

pdf

text

original

5
L\u2019int\u00e9gration de sources de donn\u00e9es
Mohand-Sa\u00efd Hacid* et Chantal Reynaud\u2020

*LIRIS, UFR Informatique
Universit\u00e9 Claude Bernard Lyon 1
43, Blvd du 11 novembre 1918
69622 Villeurbanne

mshacid@bat710.univ-lyon.fr
\u2020LRI, B\u00e2timent 490

Universit\u00e9 Paris-Sud
91405 Orsay cedex
cr@lri.fr

R\u00e9sum\u00e9

La diversit\u00e9 des sources d\u2019information distribu\u00e9es et leur h\u00e9t\u00e9rog\u00e9n\u00e9it\u00e9 est une des principales difficult\u00e9s rencontr\u00e9es par les utilisateurs du Web aujourd\u2019hui. L\u2019infrastructure du Web s\u00e9mantique doit permettre leur int\u00e9gration donnant ainsi l\u2019impression \u00e0 l\u2019utilisateur qu\u2019il utilise un syst\u00e8me homog\u00e8ne. Les solutions \u00e0 l\u2019int\u00e9gration d\u2019information propos\u00e9es dans le cadre du Web s\u00e9mantique tireront parti des recherches concernant les approches m\u00e9diateurs et les entrep\u00f4ts de donn\u00e9es. Les premi\u00e8res r\u00e9alisations sont en cours. Un des premiers verrous scientifiques \u00e0 lever concerne le passage \u00e0 l\u2019\u00e9chelle du Web. Parmi les travaux futurs, dont le d\u00e9veloppement doit \u00eatre favoris\u00e9, figurent la mise en oeuvre de syst\u00e8mes de m\u00e9diation d\u00e9centralis\u00e9s, l\u2019\u00e9tude des probl\u00e8mes li\u00e9s \u00e0 l\u2019int\u00e9gration de donn\u00e9es multim\u00e9dias, l\u2019int\u00e9gration temps r\u00e9el et \u00e9galement la prise en compte de la complexit\u00e9 croissante des donn\u00e9es \u00e0 int\u00e9grer, signe d\u2019une \u00e9volution vers une int\u00e9gration de connaissances.

Mots-cl\u00e9s : int\u00e9gration d\u2019information, approches m\u00e9diateurs,
entrep\u00f4ts de donn\u00e9es.
Abstract

The diversity of the distributed information sources and their heterogeneity is one of the main difficulties met by Web users today. The infrastructure of the semantic Web should allow their integration giving the illusion that he uses an homogeneous system. Solutions to integration in the setting of the semantic Web will benefit from research in mediator systems and data warehouses. The first achievements are under development. One of the first scientific challenges to be addressed is Web scalability. Future research work must focalize on decentralized mediation systems, the study of problems arising when integrating multimedia data, real-time integration and must deal with the complexity of information which will lead to knowledge integration.

Keywords : information integration, mediator approaches, data
warehouses.
1. PR\u00c9SENTATION ET IMPORTANCE DE LA
PROBL\u00c9MATIQUE DU POINT DE VUE DES
USAGES

La diversit\u00e9 des sources d\u2019information distribu\u00e9es et leur h\u00e9t\u00e9rog\u00e9n\u00e9it\u00e9 sont une des principales difficult\u00e9s rencontr\u00e9es par les utilisateurs du Web aujourd\u2019hui. Cette h\u00e9t\u00e9rog\u00e9n\u00e9it\u00e9 peut provenir du format ou de la structure des sources (sources structur\u00e9es : bases de donn\u00e9es relationnelles, sources semi-structur\u00e9es : documents XML, ou non structur\u00e9es : textes), du mode d\u2019acc\u00e8s et de requ\u00eate ou de l\u2019h\u00e9t\u00e9rog\u00e9n\u00e9it\u00e9 s\u00e9mantique : entre les sch\u00e9mas conceptuels ou ontologies implicites ou explicites sous-jacentes. Il est en effet illusoire de penser qu\u2019une m\u00eame ontologie \u201c universelle \u201d sera largement utilis\u00e9e. Par ailleurs, les termes sont parfois exprim\u00e9s dans des langues diff\u00e9rentes.

La prise en compte de ces probl\u00e8mes est une des cl\u00e9s de la mise en place d\u2019applications Web s\u00e9mantique. Elle s\u2019av\u00e8rera encore plus fondamentale si l\u2019on adh\u00e8re \u00e0 la vision, \u00e0 plus long terme, d\u2019agents logiciels capables de raisonner en acc\u00e9dant \u00e0 des ressources vari\u00e9es. Dans ce contexte, le Web s\u00e9mantique doit d\u2019abord \u00eatre une infrastructure dans laquelle l\u2019int\u00e9gration des informations d\u2019une vari\u00e9t\u00e9 de sources peut \u00eatre r\u00e9alis\u00e9e et facilit\u00e9e. Le Web s\u00e9mantique devrait donc tirer largement b\u00e9n\u00e9fice des recherches d\u00e9j\u00e0 effectu\u00e9es en int\u00e9gration d\u2019information,

concernant en particulier la r\u00e9alisation de syst\u00e8mes de m\u00e9diation et la
r\u00e9alisation d\u2019entrep\u00f4ts de donn\u00e9es et des r\u00e9sultats d\u00e9j\u00e0 obtenus.

L\u2019aide apport\u00e9e par les syst\u00e8mes de m\u00e9diation peut recouvrir diff\u00e9rentes formes : d\u00e9couvrir les sources pertinentes \u00e9tant donn\u00e9e une requ\u00eate pos\u00e9e, puis aider \u00e0 acc\u00e9der \u00e0 ces sources pertinentes, \u00e9vitant \u00e0 l\u2019utilisateur d\u2019interroger lui-m\u00eame chacune d\u2019elles selon leurs propres modalit\u00e9s et leur propre vocabulaire, enfin combiner automatiquement les r\u00e9ponses partielles obtenues de plusieurs sources de fa\u00e7on \u00e0 d\u00e9livrer une r\u00e9ponse globale. De tels syst\u00e8mes de m\u00e9diation offrent \u00e0 l\u2019utilisateur une vue uniforme et centralis\u00e9e des donn\u00e9es distribu\u00e9es, cette vue pouvant aussi correspondre \u00e0 une vision plus abstraite, condens\u00e9e, qualitative des donn\u00e9es et donc, plus signifiante pour l\u2019utilisateur. Ces syst\u00e8mes de m\u00e9diation sont, par ailleurs, tr\u00e8s utiles, en pr\u00e9sence de donn\u00e9es h\u00e9t\u00e9rog\u00e8nes, car ils donnent l\u2019impression d\u2019utiliser un syst\u00e8me homog\u00e8ne. Parmi les diff\u00e9rentes grandes cat\u00e9gories d\u2019applications de ces syst\u00e8mes de m\u00e9diation, on peut citer les applications de recherche d\u2019information, celles d\u2019aide \u00e0 la d\u00e9cision en ligne (avec entre autres l\u2019utilisation d\u2019entrep\u00f4ts de donn\u00e9es) et celles, de mani\u00e8re plus g\u00e9n\u00e9rale, de gestion de connaissances au sens large.

A titre d\u2019illustration tr\u00e8s simple du premier type d\u2019applications, supposons qu\u2019un utilisateur pose la requ\u00eate suivante : quels sont les films de Woody Allen \u00e0 l\u2019affiche \u00e0 Paris ce soir ? o\u00f9 ? leurs critiques ? Supposons l\u2019existence de deux sources d\u2019information. La premi\u00e8re, Internet Movie Data Base, utilise un syst\u00e8me de gestion de bases de donn\u00e9es relationnel et contient une liste de films, pr\u00e9cisant pour chacun le titre, les acteurs et le cin\u00e9aste. La seconde, Pariscope, qui peut utiliser des fichiers XML, contient, par film, les salles o\u00f9 le film peut \u00eatre vu et, pour chaque salle, le nom de la salle et l\u2019adresse. La r\u00e9ponse \u00e0 la requ\u00eate devra \u00eatre construite en interrogeant chacune d\u2019elles et en combinant les r\u00e9sultats de l\u2019interrogation de fa\u00e7on \u00e0 offrir \u00e0 l\u2019utilisateur une r\u00e9ponse globale.

Plus r\u00e9cemment, de nouvelles applications ont vu le jour dans les entreprises : eCRM, Business Intelligence, eERP , eKM, etc. Ces applications, que l\u2019on d\u00e9signe parfois sous le vocable de WebHouse [19] si elles sont men\u00e9es dans le contexte du Web, s\u2019appuyent sur la construction d\u2019entrep\u00f4ts de donn\u00e9es sur le Web. Elles se trouvent \u00e9galement confront\u00e9es au probl\u00e8me de la m\u00e9diation puisqu\u2019elles mettent en \u0153uvre un processus d\u2019acquisition de donn\u00e9es, souvent en temps r\u00e9el, provenant de sources multiples, distribu\u00e9es et h\u00e9t\u00e9rog\u00e8nes. La conception d\u2019outils de m\u00e9diation intelligents entre les utilisateurs et les sources d\u2019informations, accessibles via le Web ou stock\u00e9es localement, est

Activity (5)

You've already reviewed this. Edit your review.
1 hundred reads
1 thousand reads
jlkazadi liked this
Taoufik Rachad liked this
m.lamolle liked this

You're Reading a Free Preview

Download
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->