Welcome to Scribd, the world's digital library. Read, publish, and share books and documents. See more
Download
Standard view
Full view
of .
Save to My Library
Look up keyword
Like this
12Activity
0 of .
Results for:
No results containing your search query
P. 1
etude universitaire - repartition des donnees d un DW

etude universitaire - repartition des donnees d un DW

Ratings:

4.5

(2)
|Views: 443 |Likes:
Published by api-3750267

More info:

Published by: api-3750267 on Oct 17, 2008
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as PDF, TXT or read online from Scribd
See more
See less

03/18/2014

pdf

text

original

MODELISATION DE LA REPARTITION DES DONNEES
D\u2019UNDATAWAREHOUSE
Karima TEKAYA
Assistante en informatique
Karima.Tekaya@.isi.rnu.tn
Abdelaziz ABDELLATIF
Ma\u00eetre-assistant en Informatique
abdelaziz.abdellatif@fst.rnu.tn
Adresse professionnelle
Facult\u00e9 des sciences de Tunis, D\u00e9partement informatique,
Campus universitaire - 2092 Manar II
R\u00e9sum\u00e9 : Les utilisateurs des data warehouses ne cessent d\u2019augmenter. A l\u2019image des entreprises,

ces utilisateurs sont de plus en plus r\u00e9partis g\u00e9ographiquement sur plusieurs sites. Les data warehouses centralis\u00e9s ne sont donc plus adapt\u00e9s \u00e0 ce genre d\u2019entreprises. Pour r\u00e9pondre \u00e0 ce nouveau besoin, nous avons propos\u00e9 une d\u00e9marche de mod\u00e9lisation de la r\u00e9partition des donn\u00e9es d\u2019un Data Warehouse. Celle-ci, se base essentiellement sur un ensemble de matrices permettant la mod\u00e9lisation de l'int\u00e9gration logique des donn\u00e9es du Data Warehouse d'un c\u00f4t\u00e9 et leur r\u00e9partition entre les diff\u00e9rents Data Marts de l'organisation d'un autre c\u00f4t\u00e9.

Summary: The users of Data Warehouses do not cease increasing. With the image of the
companies, these users are divided more and more geographically on several sites. Centralized
Data Warehouses thus are not adapted more to this kind of companies. To meet this new
requirement, we proposed a methodology of modelling the distribution of the data of a Data

Warehouse. This one is based primarily on a set of matrices allowing the modelling of the integration of the data in a Data Warehouse. Secondly, their distribution between different Data Marts.

Mots cl\u00e9s : Data warehouse, Data mart, Mod\u00e9lisation, R\u00e9partition, Int\u00e9gration.
1
1- INTRODUCTION

Un Data Warehouse (DW) r\u00e9pond aux probl\u00e8mes de donn\u00e9es surabondantes et localis\u00e9es sur de multiples syst\u00e8mes h\u00e9t\u00e9rog\u00e8nes. Le DW est un entrep\u00f4t de donn\u00e9es

permettant
un

stockage interm\u00e9diaire des donn\u00e9es issues des applications

de
production,

dans lesquelles les utilisateurs finaux puisent avec des outils de restitution et d'analyse.

L'int\u00e9gration du DW dans une structure unique a pour but d\u2019\u00e9viter aux donn\u00e9es concern\u00e9es par plusieurs sujets d'\u00eatre dupliqu\u00e9es. Le DW est fragment\u00e9 en plusieurs bases appel\u00e9es Data Mart(DM). Un Data Mart est l\u2019impl\u00e9mentation d\u2019un DW pour un domaine bien sp\u00e9cifique. En effet, c\u2019est un sous ensemble d\u2019un DW [1].

On peut avoir plusieurs Data Mart au sein d\u2019une m\u00eame entreprise [2]. Ces data marts peuvent \u00eatre r\u00e9partis par d\u00e9partement, les donn\u00e9es utilis\u00e9es sont extraites \u00e0 partir du DW principal (centralis\u00e9).

2- PROBLEMATIQUE

Un syst\u00e8me d\u2019information est compos\u00e9 d\u2019une composante d\u00e9cisionnelle et d\u2019une composante op\u00e9rationnelle. Le syst\u00e8me d\u2019information op\u00e9rationnel englobe toutes les informations concernant l\u2019activit\u00e9 de l\u2019entreprise, ces donn\u00e9es sont stock\u00e9es dans une base appel\u00e9e base de production.

Le syst\u00e8me d\u2019information d\u00e9cisionnel englobe des informations provenant de bases de production ou de sources diverses et externes \u00e0 l\u2019entreprise servant comme support d\u2019aide \u00e0 la d\u00e9cision. L\u2019ensemble de ces informations est stock\u00e9 dans le DW.

Le syst\u00e8me d\u2019information est en \u00e9volution, il fait face aujourd\u2019hui aux probl\u00e8mes

de
d\u00e9centralisation

des entreprises, les utilisateurs sont de plus en plus nombreux, ils exercent des activit\u00e9s h\u00e9t\u00e9rog\u00e8nes

et
appartiennent
g\u00e9n\u00e9ralement \u00e0 des sites \u00e9loign\u00e9s

g\u00e9ographiquement. Ceci a eu comme cons\u00e9quence la d\u00e9centralisation du syst\u00e8me d\u00e9cisionnel.

Les besoins informationnels et les utilisations des donn\u00e9es peuvent \u00eatre diff\u00e9rentes d\u2019un site \u00e0 un autre. De ce fait, une organisation centralis\u00e9e des donn\u00e9es peut \u00eatre non ad\u00e9quate \u00e0 cette nouvelle architecture r\u00e9partie. Un DW r\u00e9parti pourra r\u00e9pondre plus efficacement aux besoins des utilisateurs. Les donn\u00e9es peuvent \u00eatre organis\u00e9es par sujet et une meilleure utilisation du DW est garantie. La r\u00e9partition d\u2019un DW en plusieurs DM est la solution la plus ad\u00e9quate pour un syst\u00e8me diff\u00e9r\u00e9 puisqu\u2019elle permet de rapprocher les donn\u00e9es aux utilisateurs et am\u00e9liorer l\u2019organisation des donn\u00e9es.

Plusieurs contraintes techniques peuvent
\u00eatre rajout\u00e9es :
\u2212

La communication des informations strat\u00e9giques aux diff\u00e9rents d\u00e9cideurs s\u2019av\u00e8re de plus en plus co\u00fbteuse de point de vu financier (co\u00fbt des acc\u00e8s) et temporel (temps d\u2019acc\u00e8s).

\u2212

Le DW est centralis\u00e9 dans une base unique, le stockage des donn\u00e9es sur un ordinateur central peut souffrir d\u2019une tr\u00e8s longue charge de traitement ce qui peut influer sur sa performance.

\u2212

En plus, le volume du DW augmente tr\u00e8s rapidement ce qui ralentit les acc\u00e8s et gonfle le stockage [7], [8] et [9].

\u2212

D\u2019autre part, la centralisation des donn\u00e9es pourrait devenir le point sensible du syst\u00e8me informatique.

De ces faits, la centralisation d\u2019un DW peut se refl\u00e9ter n\u00e9gativement sur sa performance et ses fins. Pour faire face \u00e0 ces diff\u00e9rents probl\u00e8mes, le syst\u00e8me op\u00e9rationnel opte pour l\u2019adaptation des bases de donn\u00e9es r\u00e9parties. Le syst\u00e8me d\u2019information d\u00e9cisionnel opte pour la r\u00e9partition du DW en DM. Plusieurs d\u00e9marches de mod\u00e9lisation ont \u00e9t\u00e9 propos\u00e9es pour mod\u00e9liser les bases de production r\u00e9parties. Par contre, aucune

2

Dans [4] une d\u00e9marche exhaustive a \u00e9t\u00e9 propos\u00e9e pour mod\u00e9liser l\u2019int\u00e9gration des donn\u00e9es d\u2019un DW (Figure 1). Celle-ci se base essentiellement sur l\u2019ajout d\u2019un mod\u00e8le

d\u2019int\u00e9gration
des

donn\u00e9es permettant de mod\u00e9liser l\u2019int\u00e9gration des donn\u00e9es (MID) dans le DW. Ce mod\u00e8le sert \u00e0 identifier pour les donn\u00e9es du mod\u00e8le logique de donn\u00e9es obtenu : leurs sources de donn\u00e9es, les transformations \u00e9ventuelles qu\u2019elles doivent subir, leurs modes de rafra\u00eechissement dans le DW et leurs fr\u00e9quences d\u2019utilisation. Dans [12] une d\u00e9marche exhaustive de mod\u00e9lisation de la r\u00e9partition des donn\u00e9es d\u2019une base de production a \u00e9t\u00e9 bien d\u00e9velopp\u00e9e (Figure1). Celle-ci se base essentiellement sur l\u2019ajout d\u2019un mod\u00e8le de r\u00e9partition des donn\u00e9es (MRD) en tenant compte d\u2019un processus de r\u00e9partition et en int\u00e9grant un programme d\u2019optimisation des diff\u00e9rentes allocations en fonction des d\u00e9bits binaires \u00e9chang\u00e9s, les fiabilit\u00e9s des \u00e9changes et les caract\u00e9ristiques du r\u00e9seau. Dans [16], une adaptation du mod\u00e8le ASM (Abstract State Machines) a \u00e9t\u00e9 \u00e9ffectu\u00e9e pour mod\u00e9liser un data warehouse r\u00e9parti.

d\u00e9marche exhaustive n\u2019a \u00e9t\u00e9 propos\u00e9e pour la mod\u00e9lisation de la r\u00e9partition des donn\u00e9es d\u2019un DW.

3- CONTRIBUTION
La contribution apport\u00e9e par cet article est
de
proposer
une
d\u00e9marche

de mod\u00e9lisation de la r\u00e9partition des donn\u00e9es d\u2019un DW. Celle-ci se base essentiellement sur les niveaux de mod\u00e9lisation classiques, en ajoutant un ensemble de concepts de base, int\u00e9grer de nouveaux mod\u00e8les et proposer un formalisme de pr\u00e9sentation.

Dans la section suivante, nous allons citer l\u2019\u00e9tat de l\u2019art. Dans la section 5, nous allons proposer les concepts de base de notre d\u00e9marche, les mod\u00e8les n\u00e9cessaires et le formalisme propos\u00e9.

4- ETAT DE L\u2019ART

Les m\u00e9thodologies trouv\u00e9es dans la litt\u00e9rature ont g\u00e9n\u00e9ralement pour objectif d'int\u00e9grer le DW dans une structure unique et ont comme r\u00e9sultat un entrep\u00f4t de donn\u00e9es centralis\u00e9 [3] et [4]. Cet entrep\u00f4t est appel\u00e9 DW,

s\u2019il est g\u00e9n\u00e9ralis\u00e9 aux activit\u00e9s de l\u2019entreprise, ou bien DM s\u2019il est sp\u00e9cifique \u00e0 un d\u00e9partement particulier.

5- SOLUTION PROPOSEE
5.1- Concepts de base

Nous visons par cette d\u00e9marche le c\u00f4t\u00e9 logique et organisationnel des donn\u00e9es qui n\u2019a pas \u00e9t\u00e9 bien mis en \u00e9vidence dans l\u2019\u00e9tat de l\u2019art. L\u2019objectif vis\u00e9 est, donc, de mod\u00e9liser les donn\u00e9es contenues dans un DW central et en m\u00eame temps leur r\u00e9partition entre plusieurs bases de donn\u00e9es distantes qui seront les futurs DM de l\u2019entreprise.

On a constat\u00e9 dans l\u2019\u00e9tat de l\u2019art que tous les travaux concern\u00e9s par la mod\u00e9lisation de la r\u00e9paration des donn\u00e9es des DW sont orient\u00e9s vers la mod\u00e9lisation physique [5] et [6]. Des algorithmes de r\u00e9partition verticale des donn\u00e9es ont \u00e9t\u00e9 propos\u00e9es dans [14] et [15]. L\u2019id\u00e9e de r\u00e9partition des donn\u00e9es d\u2019un DW a \u00e9t\u00e9 \u00e9voqu\u00e9e par Noaman, A.Y. et K. Barker dans [7] et [8]. Ils se sont bas\u00e9s sur l\u2019architecture ANSI/SPARC pour la mod\u00e9lisation des donn\u00e9es des DW. La d\u00e9marche propos\u00e9e par ces auteurs se base essentiellement sur l\u2019approche Top/Down. Ils ont aussi d\u00e9velopp\u00e9 un algorithme de fragmentation horizontale des tables de faits dans [9].

Pour g\u00e9n\u00e9raliser notre d\u00e9marche, nous proposons un formalisme que nous pourrons adapter \u00e0 n\u2019importe quelle approche de conception. G\u00e9n\u00e9ralement la mod\u00e9lisation d\u2019un syst\u00e8me d\u2019information se base sur trois niveaux :

3

Activity (12)

You've already reviewed this. Edit your review.
1 hundred reads
1 thousand reads
Med Malek Teyeb liked this
jlkazadi liked this
Hadjer Ali liked this
domperso liked this
yrabaa liked this
ame fontome liked this
tittif liked this
Jamil Dimassi liked this

You're Reading a Free Preview

Download
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->