Professional Documents
Culture Documents
Module :
Informatique décisionnelle
(Business Intelligence)
Aouatef ROUAHI
aouatef.rouahi@laposte.net
2
Syllabus du cours
Objectifs
Sensibiliser les étudiants à l’importance du décisionnel;
Se familiariser avec les technologies de l'informatique décisionnelle;
Appréhender les enjeux et les problématiques de la gestion et du traitement de
données.
Pré-requis
Algorithmique, Programmation, Statistiques, et Bases de données.
12/08/2021
3
Organisation du cours
Data Warehouse
(10h) : cours 6h, TP 4h;
Rédaction en binôme d'un rapport d'étude.
Analyse de données
(8h) : cours 4h, TP 4h;
Évaluation individuelle écrite 1h.
Data Mining
(8h) : cours 4h, TP 4h;
Évaluation individuelle écrite 1h.
Visualisation de données
(10h): cours 5h, TP 5h;
Projet individuel de programmation.
12/08/2021
4
Data Warehouse
Les Entrepôts de
Données
(Data Warehouse)
5
PLAN Veuillez nous suivre…
Introduction Architecture
Définition DW Préparation
Stockage
Présentation Actualités & Perspectives
Conclusion
Références
Domaines Editeurs
d’application &
Outils
12/08/2021
Cycle Décisionnel
Enjeux et Difficultés
6
Introduction Données de Production VS Données
Décisionnelles
««Une
«La
Une
«Une action
donnéeréalisée
connaissance
information enpar
comme
est un fonction
estélémentunebrut,
définition
des connaissances
information
qui
unen’a pas encore
donnée disponibles.»
comprise.»
été interprété,
interprétée. »
1 1
Informatio
n
Connaissan
ce
Décision
1
Bruno Chaudet, « Introduction à la communication organisationnelle »
12/08/2021
Cycle Décisionnel
Enjeux et Problématique
7
Introduction Données de Production VS Données
Décisionnelles
Cycle Décisionnel
Enjeux et Difficultés
8
Introduction Données de Production VS Données
Décisionnelles
Informatique de production
Un mode d’exploitation de données tourné vers la saisie, le stockage, la mise à
jour, la sécurité et l’intégrité des données.
l'informatique décisionnelle
Un mode d’exploitation de données visant à fournir à tout utilisateur reconnu et
autorisé, les informations nécessaires à son métier.
Une vision analytique de l'activité de l'entreprise;
Un suivi du fonctionnement de l'entreprise;
Un suivi de la performance de l’entreprise;
Une prédiction des tendances prospectives;
Etc.
12/08/2021
Cycle Décisionnel
Enjeux et Difficultés
9
Introduction Données de Production VS Données
Décisionnelles
Orienté Sujet
Intégré
Non Volatile 10
Définition Historisé
Un support du processus d’AAD
Orienté Sujet
Intégré
Non Volatile 11
Définition Historisé
Un support du processus d’AAD
Orienté Sujet
Intégré
Non Volatile 12
Définition Historisé
Un support du processus d’AAD
Orienté Sujet
Intégré
Non Volatile 13
Définition Historisé
Un support du processus d’AAD
Orienté Sujet
Intégré
Non Volatile 14
Définition Historisé
Un support du processus d’AAD
Un référentiel temps doit être associé à toute structure « clé » dans le data
warehouse.
12/08/2021
Orienté Sujet
Intégré
Non Volatile 15
Définition Historisé
Un support du processus d’AAD
16
Domaines d’application
Commerce
… Banque
Econométrie Domaines
d’application
Assurance
du Data
Warehousing
Santé
Web
Logistique
12/08/2021
Zone Préparation
Zone Stockage 17
Architecture Zone Présentation
L’acquisition de données;
L’alimentation de l’entrepôt;
L’analyse de données.
12/08/2021
Zone Préparation
Zone Stockage 18
Architecture Zone Présentation
ETL Requêteurs
Extraction
EIS
Transformation
Chargement Data Mining
…
Zone Préparation
Zone Stockage 19
Architecture Zone Présentation
M, F
1, 0
M, F
Male, Female
TND
USD
EUR EUR
12/08/2021
Zone Préparation
Zone Stockage 20
Architecture Zone Présentation
Modélisation Multidimensionnelle
Zone Préparation
Zone Stockage 21
Architecture Zone Présentation
Fait - Dimension:
Une mesure économique (Quantités achetées, montant
des achats, etc.).
La table de faits contient les indicateurs de performances.
Les enregistrements sont identifiés par une clé multiple
composée de la concaténation des clés des tables de
dimensions.
La granularité définit le niveau de détails de la table de
faits = nombre de dimensions liées.
Exemple: une ligne de commande par :
Produit; -
+ client;
+ jour.
+
12/08/2021
Zone Préparation
Zone Stockage 22
Architecture Zone Présentation
Fait - Dimension:
Un axe d’analyse (Client, Produit, Temps, etc.).
La table de dimensions est identifiée par une clé primaire
unique correspondant à l’un des composants de la clé
multiple de la table de faits et un ensemble d’attributs
permettant de décrire les aspects intéressants de cette
dimension.
Zone Préparation
Zone Stockage 23
Architecture Zone Présentation
Le schéma en étoile
12/08/2021
Zone Préparation
Zone Stockage 24
Architecture Zone Présentation
Le schéma en flocon
12/08/2021
Zone Préparation
Zone Stockage 25
Architecture Zone Présentation
Exercice
L’ED doit fournir le CA des ventes d’un produit, par date, client, et vendeur, ainsi
que toutes les sommations possibles de chiffre d’affaires dans une année donnée.
Une vente est caractérisée par: produit, client, vendeur, date, prix de vente.
Produit : code produit, code famille, libellé
Client : code client, type client
Vendeur : code vendeur, nom, code service
Date : jour, semaine, mois
Donner le schéma en étoile, en flocon de cet entrepôt?
12/08/2021
Zone Préparation
Zone Stockage 26
Architecture Zone Présentation
Réponse
Modèle en étoile
12/08/2021
Zone Préparation
Zone Stockage 27
Architecture Zone Présentation
Réponse
Modèle en flocon
12/08/2021
Zone Préparation
Zone Stockage 28
Architecture Zone Présentation
Data Mart
Un data Mart est un sous-ensemble de données extrait du data warehouse et ciblé
sur un sujet unique, destiné à répondre aux besoins d’un secteur ou d’une fonction
particulière de l’entreprise.
Zone Préparation
Zone Stockage 29
Architecture Zone Présentation
Restitution de l’information
« Les données ne naissent pas pertinentes, elles le deviennent».
Requêtes : Donner une réponse à une question plus ou moins complexe (type SQL);
Editeurs 30
Outils et Editeurs Outils
12/08/2021
Editeurs 31
Outils et Editeurs Outils
Actualités 32
Actualités et Perspectives Perspectives
Actualités 33
Actualités et perspectives Perspectives
34
Conclusion
Un projet du Data Warehousing
Un pari à gagner
Ne pas sous-estimer la complexité d’un projet du Data Warehousing;
35
Travail à faire
Etc.
12/08/2021
Livres
WWW 36
Bibliographie Recherche
Bibliographie – Livres
Rob Mattison, «Data Warehousing -Strategies, Technologies and Technics», IEEE
Computer Society, 1996.
J.-M. Franco, «Le Data Warehouse -Le Data Mining», Eyrolles, 1997.
W. H. Inmon, «Managing the Data Warehouse», Wiley, 1997.
Bédard, Y., et al., Data Warehousing for Spatial Data: Research Issues, Proceedings of the
International Symposium: Geomatics in the Era of Radarsat (GER'97), May 25-30, 1997.
Ralph Kimball et al., « The Data Warehouse Lifecycle Toolkit: Expert Methods for
Designing, Developing, and Deploying Data Warehouses », Wiley, 1998.
J.-M. Franco, S. De Lignerolles, «Piloter l'entreprise grâce au data warehouse», Eyrolles,
2000.
12/08/2021
Livres
WWW 37
Bibliographie Recherche
Bibliographie – Livres
W. H. Inmon, «Building the Data Warehouse», Wiley, 2e: 2000.
Ralph Kimball, Richard Merz, «The Data Webhouse Toolkit: Building the Web-Enabled
Data Warehouse», Wiley, 2000.
Ralph Kimball, Margy Ross. «The Data Warehouse Toolkit: The Complete Guide to
Dimensional Modeling», Vuibert, 2e: 2003.
Robert Laberge, «The Data Warehouse Mentor: Practical Data Warehouse and Business
Intelligence Insights», McGraw-Hill Osborne Media, 2011.
W.H. Inmon, Krish Krishnan, «Building the Unstructured Data Warehouse», Technics
Publications, LLC, 2011.
12/08/2021
Livres
WWW 38
Bibliographie Recherche
Bibliographie – WWW
http://inmoninstitute.com/ : The Inmon Institute
http://www.mediatid.fr/datawarehouse : Forum
http://www.datawarehouse.com/
http://www.datawarehousing.com/
12/08/2021
Livres
WWW 39
Bibliographie Recherche
Bibliographie – Recherche
ACM SIGMOD : The ACM Special Interest Group on Management of Data
http://www.sigmod.org/
Livres
WWW 40
Bibliographie Recherche
Bibliographie – Recherche
ACM SIG KDD : The ACM Special Interest Group on Knowledge Discovery and Data
Mining
Conférence scientifique spécialisée
http://www.sigkdd.org/
12/08/2021 41