Professional Documents
Culture Documents
DATA WAREHOUSE
Architecture et technique de ce composant de l'informatique décisionnelle.
Impact sur l'architecture du système d'information (alimentation, restitution, serveur).
Les évolutions pour le DATAWAREHOUSE distribué.
Réalisé par :
Abbes RHARRAB
Brahim JIHAD
Mohcine ELJABIRY
L’informatique décisionnelle (en anglais : DSS pour Decision Support
System ou encore BI pour Business Intelligence) désigne les moyens,
les outils et les méthodes qui permettent de collecter, consolider,
modéliser et restituer les données, matérielles ou immatérielles,
d'une entreprise en vue d'offrir une aide à la décision et de
permettre aux responsables de la stratégie d'entreprise d’avoir une
vue d’ensemble de l’activité traitée.
Les méta-données: « données sur les données». permettent de stocker des informations telles
que le nom de la base de production dont la donnée est extraite, la date et l’heure de la dernière
extraction, etc…
Une architecture informatique décisionnelle est généralement constituée des
éléments suivants :
Les bases de production contenant les informations
Nous allons donc voir dans ce chapitre les outils et les méthodes permettant
d’alimenter un data warehouse tout en minimisant l’impact sur les systèmes de
productions.
De part sa nature, un data warehouse est alimenté via les informations de
l’entreprise. Or ces informatique sont stocké sous les formes les plus heterogene. On
peut retrouver ainsi plusieurs type de base de données (acces, DB2, MySQL,…), des
tableurs, des fichiers a plats… Il existe une quasi infinité de format de source.
En générale, on retrouve trois types de contraintes à la mise en œuvre d’un data
warehouse :
Alimentation des données de production aux normes des données du référentiel.
La mise en place d'un système ETL demande une expertise spéciale et fait appel à
plusieurs types de ressources humaines.
Extract: L'extraction des données est la première des étapes des systèmes ETL. Le
but de cette étape, est comme son nom l’indique : la lecture et l’extraction des
données du système source.
Transform: La transformation est la tâche la plus complexe et qui demande
beaucoup de réflexion.
Load: Le chargement permet de transférer les données vers leur destination finale.
Avant d’entreprendre toute démarche de construction d’un « Data warehouse », il est
nécessaire de se poser un certain nombre de questions afin de vérifier que le projet
que l’on étudie se situe bien dans le cadre d’un projet de « type » Data warehouse.
Mais extraire une synthèse à partir d’un tel volume de donnée (souvent de l’ordre de
plusieurs téraoctets) n’ai pas chose aisée. Il faut une architecture du système
adéquate. Les données peuvent être séparées par vue métier au sein de mini data
warehouse nommé datamarts et couplé avec un mode de stockage en cube OLAP