You are on page 1of 41

Université de Tunis

Institut Supérieur de Gestion de Tunis

Module :
Informatique décisionnelle

(Business Intelligence)

Aouatef ROUAHI
aouatef.rouahi@laposte.net

ISG – Master en Informatique Appliquée à la Gestion 12/08/2021


12/08/2021

2
Syllabus du cours
 Objectifs
 Sensibiliser les étudiants à l’importance du décisionnel;
 Se familiariser avec les technologies de l'informatique décisionnelle;
 Appréhender les enjeux et les problématiques de la gestion et du traitement de
données.

 Pré-requis  
 Algorithmique, Programmation, Statistiques, et Bases de données.
12/08/2021

3
Organisation du cours 
 Data Warehouse
 (10h) : cours 6h, TP 4h;
 Rédaction en binôme d'un rapport d'étude.
 Analyse de données
 (8h) : cours 4h, TP 4h;
 Évaluation individuelle écrite 1h.
 Data Mining
 (8h) : cours 4h, TP 4h;
 Évaluation individuelle écrite 1h.
 Visualisation de données
 (10h): cours 5h, TP 5h;
 Projet individuel de programmation.
12/08/2021

4
Data Warehouse

Les Entrepôts de
Données
(Data Warehouse)

Module : Informatique décisionnelle (Business Intelligence)


12/08/2021

5
PLAN Veuillez nous suivre…

Introduction Architecture
Définition DW  Préparation
 Stockage
 Présentation Actualités & Perspectives
Conclusion
Références

Domaines Editeurs
d’application &
Outils
12/08/2021

 Cycle Décisionnel
 Enjeux et Difficultés
6
Introduction  Données de Production VS Données
Décisionnelles

««Une
«La
Une
«Une action
donnéeréalisée
connaissance
information enpar
comme
est un fonction
estélémentunebrut,
définition
des connaissances
information
qui
unen’a pas encore
donnée disponibles.»
comprise.»
été interprété,
interprétée. »
1 1

Donnée mis en contexte.»1

Informatio
n

Connaissan
ce

Décision

 1
Bruno Chaudet, « Introduction à la communication organisationnelle »
12/08/2021

 Cycle Décisionnel
 Enjeux et Problématique
7
Introduction  Données de Production VS Données
Décisionnelles

 Une pression concurrentielle continue;


 Une explosion des données;
 Distribuées,
 Détaillées,
 Hétérogènes.

Comment prendre des décisions


dans un environnement
parfaitement hétérogène?
12/08/2021

 Cycle Décisionnel
 Enjeux et Difficultés
8
Introduction  Données de Production VS Données
Décisionnelles

 Informatique de production
Un mode d’exploitation de données tourné vers la saisie, le stockage, la mise à
jour, la sécurité et l’intégrité des données.
 l'informatique décisionnelle 
Un mode d’exploitation de données visant à fournir à tout utilisateur reconnu et
autorisé, les informations nécessaires à son métier.
 Une vision analytique de l'activité de l'entreprise;
 Un suivi du fonctionnement de l'entreprise;
 Un suivi de la performance de l’entreprise;
 Une prédiction des tendances prospectives;
 Etc.
12/08/2021

 Cycle Décisionnel
 Enjeux et Difficultés
9
Introduction  Données de Production VS Données
Décisionnelles

Données Opérationnelles Données décisionnelles


Orientées application Orientées activité
Volumes limités Gros volumes
Vue instantanée Vue historisée
Cohérence atomique Cohérence globale
Structure rigide Structure flexible
Usage répété Usage ad-hoc
… …
12/08/2021

 Orienté Sujet
 Intégré
 Non Volatile 10
Définition  Historisé
 Un support du processus d’AAD

«Un entrepôt de données est une collection de données orientées sujet,


intégrées, non volatiles et historisées, organisées pour le support d’un
processus d’aide à la décision.» Bill Inmon (1991).
12/08/2021

 Orienté Sujet
 Intégré
 Non Volatile 11
Définition  Historisé
 Un support du processus d’AAD

«Un entrepôt de données est une collection de données orientées sujet,


intégrées, non volatiles et historisées, organisées pour le support d’un
processus d’aide à la décision.» Bill Inmon (1991).
 Données orientées sujet:
Une vue synthétique permettant de réaliser des analyses transversales aux
structures fonctionnelles et organisationnelles de l'entreprise.
12/08/2021

 Orienté Sujet
 Intégré
 Non Volatile 12
Définition  Historisé
 Un support du processus d’AAD

«Un entrepôt de données est une collection de données orientées sujet,


intégrées, non volatiles et historisées, organisées pour le support d’un
processus d’aide à la décision.» Bill Inmon (1991).
 Données intégrées:
Un besoin d’ homogénéisation des données hétérogènes afin de parfaire la
cohérence globale de l’entrepôt de données.
12/08/2021

 Orienté Sujet
 Intégré
 Non Volatile 13
Définition  Historisé
 Un support du processus d’AAD

«Un entrepôt de données est une collection de données orientées sujet,


intégrées, non volatiles et historisées, organisées pour le support d’un
processus d’aide à la décision.» Bill Inmon (1991).
 Données non volatiles:
Seulement les actions d’ajout et de lecture qui sont autorisées et aucune
opération de mise à jour n’est permise.
12/08/2021

 Orienté Sujet
 Intégré
 Non Volatile 14
Définition  Historisé
 Un support du processus d’AAD

«Un entrepôt de données est une collection de données orientées sujet,


intégrées, non volatiles et historisées, organisées pour le support d’un
processus d’aide à la décision.» Bill Inmon (1991).
 Données historisées:
 L'historisation est nécessaire pour suivre dans le temps l'évolution des
différentes valeurs des indicateurs à analyser.

 Un référentiel temps doit être associé à toute structure « clé » dans le data
warehouse.
12/08/2021

 Orienté Sujet
 Intégré
 Non Volatile 15
Définition  Historisé
 Un support du processus d’AAD

«Un entrepôt de données est une collection de données orientées sujet,


intégrées, non volatiles et historisées, organisées pour le support d’un
processus d’aide à la décision.» Bill Inmon (1991).
 Un support d’un processus d’aide à la décision :
Le data warehouse est un élément essentiel dans le processus d’extraction de
connaissances à partir de données (KDD).
12/08/2021

16
Domaines d’application
Commerce

… Banque

Econométrie Domaines
d’application
Assurance
du Data
Warehousing

Santé
Web

Logistique
12/08/2021

 Zone Préparation
 Zone Stockage 17
Architecture  Zone Présentation

 L’acquisition de données;

 Le pré-traitement des données ;

 L’alimentation de l’entrepôt;

 L’analyse de données.
12/08/2021

 Zone Préparation
 Zone Stockage 18
Architecture  Zone Présentation

Donnée Zone de Zone de Zone de Information


Préparation Stockage Présentation

ETL Requêteurs
Extraction
EIS
Transformation
Chargement Data Mining

Une zone de préparation:


présentation: une zoneaux
l’accès
stockage: le stockage temporaire de
donnéesdes
permanent stockagedans
contenues
données des le DW à
données
l’aide extraites
d’une
nettoyées. pour
palette deslaoutils
réalisation des dont
d’analyse transformations.
l'information est visualisée à
travers des interfaces interactives.
12/08/2021

 Zone Préparation
 Zone Stockage 19
Architecture  Zone Présentation

 ETL : Extract – Transform – Load


 Découvrir et extraire les données brutes;
 Transformer les données extraites;
 Charger les données nettoyées dans l’entrepôt de données.

M, F

1, 0
M, F
Male, Female

TND
USD

EUR EUR
12/08/2021

 Zone Préparation
 Zone Stockage 20
Architecture  Zone Présentation

 Modélisation Multidimensionnelle

Une méthode de conception logique qui vise à


présenter les données sous une forme
standardisée intuitive permettant des accès
hautement performants en se basant sur les
notions Fait - Dimension.
12/08/2021

 Zone Préparation
 Zone Stockage 21
Architecture  Zone Présentation

 Fait - Dimension:
 Une mesure économique (Quantités achetées, montant
des achats, etc.).
 La table de faits contient les indicateurs de performances.
 Les enregistrements sont identifiés par une clé multiple
composée de la concaténation des clés des tables de
dimensions.
  La granularité définit le niveau de détails de la table de
faits = nombre de dimensions liées.
 Exemple: une ligne de commande par :
 Produit; -
 + client;
 + jour.
+
12/08/2021

 Zone Préparation
 Zone Stockage 22
Architecture  Zone Présentation

 Fait - Dimension:
 Un axe d’analyse (Client, Produit, Temps, etc.).
 La table de dimensions est identifiée par une clé primaire
unique correspondant à l’un des composants de la clé
multiple de la table de faits et un ensemble d’attributs
permettant de décrire les aspects intéressants de cette
dimension.

 Une organisation hiérarchique (Temps, Région, etc.).


 La granularité d’une dimension = nombre des niveaux hiérarchiques.
 Une dimension temps est obligatoire dans tout modèle.
12/08/2021

 Zone Préparation
 Zone Stockage 23
Architecture  Zone Présentation

 Le schéma en étoile
12/08/2021

 Zone Préparation
 Zone Stockage 24
Architecture  Zone Présentation

 Le schéma en flocon
12/08/2021

 Zone Préparation
 Zone Stockage 25
Architecture  Zone Présentation

 Exercice
L’ED doit fournir le CA des ventes d’un produit, par date, client, et vendeur, ainsi
que toutes les sommations possibles de chiffre d’affaires dans une année donnée.
Une vente est caractérisée par: produit, client, vendeur, date, prix de vente.
 Produit : code produit, code famille, libellé
 Client : code client, type client
 Vendeur : code vendeur, nom, code service
 Date : jour, semaine, mois
Donner le schéma en étoile, en flocon de cet entrepôt?
12/08/2021

 Zone Préparation
 Zone Stockage 26
Architecture  Zone Présentation

 Réponse

Modèle en étoile
12/08/2021

 Zone Préparation
 Zone Stockage 27
Architecture  Zone Présentation

 Réponse

Modèle en flocon
12/08/2021

 Zone Préparation
 Zone Stockage 28
Architecture  Zone Présentation

 Data Mart
 Un data Mart est un sous-ensemble de données extrait du data warehouse et ciblé
sur un sujet unique, destiné à répondre aux besoins d’un secteur ou d’une fonction
particulière de l’entreprise.

 Un modèle réduit du data warehouse:


 Facilement compréhensible;
 Facilement manipulable.
Data Mart
Service Marketing
 
Data Mart
Service GRH
12/08/2021

 Zone Préparation
 Zone Stockage 29
Architecture  Zone Présentation
 Restitution de l’information
« Les données ne naissent pas pertinentes, elles le deviennent».
 Requêtes : Donner une réponse à une question plus ou moins complexe (type SQL);

 EIS (Executive Information Systems): Outils de visualisation et de navigation dans les


données statistiques avec un interfaçage graphique;

 Applications spécialisées (ad-hoc) : Applications développées spécialement pour les


besoins décisionnels de l’entreprise;

 Data Mining : Outils et techniques évolués de prédiction, simulation, etc.


12/08/2021

 Editeurs 30
Outils et Editeurs   Outils
12/08/2021

 Editeurs 31
Outils et Editeurs   Outils

Préparation Stockage Présentation

Warehouse Manager Oracle, Sybase, Informix, Discoverer (Oracle),


(Prism), Access (SAS), Ingres (CA), DB2 (IBM), ESPERANT (Software
DataStage (VMark), Tandem, Teradata, etc. AG), Explorer (Business
InfoRefiner (Platinum), Objects), etc.
PASSPORT &
NATURAL (Software
AG), etc.

Octopus, Kettle, MySQL, Postgresql, Mondarian, Palo, etc.
CloverETL, etc. Biz gres, etc.
12/08/2021

 Actualités 32
Actualités et Perspectives  Perspectives

 Actualités :  l’enquête Decideo sur le décisionnel en entreprise pour l’année


2011

 Le nombre d'applications décisionnelles;

 Le décisionnel pour métiers.


12/08/2021

 Actualités 33
Actualités et perspectives  Perspectives

 Perspectives : Axes de recherche


 Extraction automatique des données;
 Auto administration des entrepôts de données;
 Le data warehouse distribué;
 Entreposage et analyse en ligne de données non-structurées et semi-structurées;
 Entreposage et analyse en ligne de données spatiales et spatio-temporelles;
 Entreposage et analyse en ligne de données en flots;
 Real-time business intelligence;
 Sécurité des entrepôts de données;
 Gestion et maintenance des entrepôts de données;
 Data warehouse et Grid computing;
 Data warehouse et Cloud computing.
12/08/2021

34
Conclusion
Un projet du Data Warehousing
Un pari à gagner
 Ne pas sous-estimer la complexité d’un projet du Data Warehousing;

 La mise en place d’une démarche rigoureuse;

 Une équipe compétente et expérimentée;

 Des partenaires influents;

 La conscience de l’importance du projet.


12/08/2021

35
Travail à faire

Un rapport d’étude d’un entrepôt de données

 l'entrepôt de données transport de Rennes Métropole


http://data.keolis-rennes.com/,

 la collection des manuscrits numérisées de la Bibliothèque Nationale


de France http://www.bnf.fr/

 Etc.
12/08/2021

 Livres
 WWW 36
Bibliographie  Recherche

Bibliographie – Livres
 Rob Mattison, «Data Warehousing -Strategies, Technologies and Technics», IEEE
Computer Society, 1996.
 J.-M. Franco, «Le Data Warehouse -Le Data Mining», Eyrolles, 1997.
 W. H. Inmon, «Managing the Data Warehouse», Wiley, 1997.
 Bédard, Y., et al., Data Warehousing for Spatial Data: Research Issues, Proceedings of the
International Symposium: Geomatics in the Era of Radarsat (GER'97), May 25-30, 1997.
 Ralph Kimball et al., « The Data Warehouse Lifecycle Toolkit: Expert Methods for
Designing, Developing, and Deploying Data Warehouses », Wiley, 1998.
 J.-M. Franco, S. De Lignerolles, «Piloter l'entreprise grâce au data warehouse», Eyrolles,
2000.
12/08/2021

 Livres
 WWW 37
Bibliographie  Recherche

Bibliographie – Livres
 W. H. Inmon, «Building the Data Warehouse», Wiley, 2e: 2000.

 Ralph Kimball, Richard Merz, «The Data Webhouse Toolkit: Building the Web-Enabled
Data Warehouse», Wiley, 2000.

 Ralph Kimball, Margy Ross. «The Data Warehouse Toolkit: The Complete Guide to
Dimensional Modeling», Vuibert, 2e: 2003.

 Laura Reeves, «A Manager's Guide to Data Warehousing», Wiley, 2009.

 Robert Laberge, «The Data Warehouse Mentor: Practical Data Warehouse and Business
Intelligence Insights», McGraw-Hill Osborne Media, 2011.

 W.H. Inmon, Krish Krishnan, «Building the Unstructured Data Warehouse», Technics
Publications, LLC, 2011.
12/08/2021

 Livres
 WWW 38
Bibliographie  Recherche
Bibliographie – WWW
 http://inmoninstitute.com/ : The Inmon Institute

 http://www.tdwi.org : The Data Warehousing Institute

 http://www.cait.wustl.edu/cait/papers/prism/ : Société Prism Solutions fondée par W.H.


Inmon

 http://www.dwinfocenter.org/ : The Data Warehousing Information Center 

 http://www.olapcouncil.org/ : Outils OLAP

 http://www.mediatid.fr/datawarehouse : Forum

 http://www.datawarehouse.com/

 http://www.datawarehousing.com/
12/08/2021

 Livres
 WWW 39
Bibliographie  Recherche

Bibliographie – Recherche
 ACM SIGMOD : The ACM Special Interest Group on Management of Data
 http://www.sigmod.org/

 VLDB : The International conference on Very Large Data Bases


 37th conference: Seattle, Washington, August 29 - September 3, 2011
 http://www.vldb.org/

 DaWaK : Data Warehousing and Knowledge Discovery


 13th International Conference on Data Warehousing and Knowledge
Discovery -DaWaK '11
 http://www.dexa.org
12/08/2021

 Livres
 WWW 40
Bibliographie  Recherche

Bibliographie – Recherche
 ACM SIG KDD : The ACM Special Interest Group on Knowledge Discovery and Data
Mining
 Conférence scientifique spécialisée
 http://www.sigkdd.org/

 BIDW: Business Intelligence and Data Warehousing


 2nd Annual International Conference on BIDW, 27 - 28 June 2011, Singapore
 http://www.bizintelligenceconf.org/
Merci Pour
Votre Attention

12/08/2021 41

You might also like