Business Intelligence Datawarehouse : •

• Un entrepôt de données est une collection de données thématiques, intégrées, non volatiles et historisées, organisées pour la prise de décision (Bill Immon) Un entrepôt de données est un stockage intermédiaire de données issues d’applications de production, dans lequel les utilisateurs finaux puisent avec des outils de restitution et d’analyse. Trois fonctions essentielles : o o o collecte de données de bases existantes et chargement gestion des données dans l’entrepôt analyse de données pour la prise de décision

Non volatiles et historisées : Il n’y a pas de suppressions, ce qui nécessite un référentiel de temps. Intégrées : Les données sont sémantiquement intégrées. On procède par Data Reconciliation ou Data Clearing, ou Data Cleansing. Le nettoyage doit être fait le plus tôt possible dans la chaîne de traitement. Datamart : C’est un extrait du datawarehouse. Il est orienté utilisateurs, mais permet aussi de gagner en performance. Ce sont souvent des bases de données multidimensionnelles. Référentiel : Il contient les meta données, toutes les règles de calculs, d’extractions, d’intégrations, de nettoyage… Les référentiels ne sont pas encore trop partagés entre les différentes étapes, mais des standards arrivent ; OIM, CWMI.. Modèle multidimensionnel (Cube) : Il est centré sur une activité. C’est un modèle de stockage, il relate un fait. ETL (Extract, Transform, Load) : Outil de transfert de données d’une BDD à une autre, capable de gérer une programmation et des transformations telles que dé-normalisation, agrégation, etc. A distinguer des Entreprise Application Integration (EAI), qui gèrent des réplications en temps réel. • • • D’automatiser des transferts de données avancés De développer des processus d’alimentation à un haut niveau d’abstraction De disposer d’une bibliothèque de validations et transformations complexes clés en main Récupèrent les données des systèmes opérationnels Convertissent, transforment et stockent les données dans l’entrepôt

• •

il permet de répondre aux problématiques de reporting opérationnel et de validation des données sans surcharger le serveur de production. qui est effacé périodiquement. Il permet : • • De produire un reporting opérationnel à partir de données de détaillées D’attendre la complétude des données pour le calcul d’indicateurs agrégés o • Exemple : calcul de délais. DataStage  Carleton.• Outils :  Ardent Software. Tableau comparatif entre transactionnel et décisionnel . Warehouse Administrator Outils de requête : Permettent aux utilisateurs d ’interroger les données dans une base relationnelle sans écrire le « code sql » • Editeurs et outils :  Brio Technologies / Hyperion : Brio Query.  Business Objects : BusinessObjects / Crystal Report  Andyne : GQL Pablo.  Cognos : Impromptu  Oracle : Reports ODS (Operational Data Store) est une copie. Sagent Solution  SAS Institute. ETI*Extract  Hummingbird. Genio  Informatica. rafraîchie fréquemment. des bases de production . Passport  ETI. de taux … Les données ne sont pas conservées dans l’ODS. Powermart  Sagent.

Membre : Éléments de base composant une dimension OLAP (On Line Analytical Processing) : . organisés selon un mode hiérarchique.Données Traitements Conception BDD Transactionnel OLTP (Online Transactionnal Processing)  Conservées le temps de leur validité  Sont détaillées  Données personnelles  Mise à jour directement  Temps de validité + temps de transaction  Requêtes plutôt simples  Répétitifs  Sensibles aux performances  Orientées fonction  Relativement statiques     Agents opérationnels Des milliers Dizaines centaines Mo/Go Décisionnel OLAP (Online Analytical Processing)  Historisées  Agrégées  Anonymes  Recalculées  Temps d’extraction + temps de validité + temps de transaction  Requêtes complexes  Requêtes variées  Problèmes de performance  Orientée sujet  Evolutive pour répondre aux nouveaux besoins  Décideurs  Des centaines  Milliers millions  Go/To Utilisateurs Nombre de tuples accédés Taille de la BDD Dimension : c’est un ensemble d'éléments. appelés Membres.

La structure d'un modèle OLAP permet une navigation dans les données plus rapide et plus intuitive. Un cube est constitué de dimensions (20 au maximum). Relationel Olap      Informix : Metacube Microstrategy : DSS Oracle : Discoverer Sterling Software : Eureka:Suite SAP BW   Multidimensionnel Olap       Cognos : Powerplay Hyperion Solutions : Essbase Server Microsoft : SQL Server 7. Un cube est l'équivalent d'une table dans une base de données relationnelle. .0 Olap Services Oracle : Express Server SAS Institute : SAS/MDDB Seagate Software : Holos Cube : •   c’est un réceptacle où les données sont stockées dans une base de données OLAP.  C'est un modèle de données optimisé pour la restitution et l'analyse des données.

 Roll up :  Agréger selon une dimension  Semaine è Mois  Drill down :  Détailler selon une dimension  Mois è Semaine  Slice et Dice:  Sélection et projection selon 1 axe  Mois = 04-2003 . Mois) Couche sémantique : univers .Produit)è(Région. Projeter(Région. Produit)  Pivot :  Tourne le cube pour visualiser une face  (Région.

supprimées. relations..) H-Olap : outil qui combine les deux technologies – les données sont stockées dans une base de données relationnelle une structure multidimensionnelle est l’utilisateur de manipuler les données. index.Alimentation en delta Capacité à ne traiter.. Relationel ou multidimensionnel ? • M-Olap : outil Olap qui repose sur une base de données multidimensionnelle (axes d’analyses.. entre deux sessions d’alimentation du datawarehouse. générée pour permettre à • • – La construction d’un data warehouse doit servir un objectif économique – – Réduction des coûts (faible parce que peu d’automatisation) Réduction des délais . … dans l’intervalle. que des données « utiles » : celles qui ont été créées. modifiées.. cubes.) R-Olap : outil Olap qui repose sur une base de données relationnelle (tables.

Exemple : 50% du temps à traiter de l’information et 4/5 collecter et transformer les données des utilisateurs de ces 50% est est passé consacré à .