You are on page 1of 5

UN / FS / DMI/ Master I, SLED

Cours : Entrepôts de données


Travaux dirigés :
Questions de cours :
1. C’est quoi un entrepôt de données (EDD) ou système (SD) ?
2. C’est quoi un magasin de données ?
3. À quoi servent les outils d’analyse dans un EDD ?
4. Quelles peuvent être les sources qui alimentent en données l’EDD ?
5. Quelles sont les techniques utilisées dans l’analyse des données ?
6. Quels sont les deux principaux modèles multidimensionnels qui existent ?
7. Que représentent les faits dans un modèle multidimensionnel ?
8. Quelles sont les phases de l’alimentation d’un EDD ?
9. C’est quoi l’analyse en ligne (OLAP) ?
10. Quels sont les trois niveaux de représentation des données dans le
processus décisionnel ?
11. C’est quoi un cube de données et à quoi sert-il ?
12. Donnez quelques différences entre les systèmes transactionnels
(OLTP) et les systèmes décisionnels (OLAP).

Exercice 1 :
On considère un entrepôt de données permettant d’observer les ventes de produits
d’une entreprise. Le schéma des tables est le suivant :
• CLIENT (id-client, région, ville, pays, département)
• PRODUIT (id-prod, catégorie, coût-unitaire, fournisseur, prixunitaire, nom-
prod)
• TEMPS (id-tps, mois, nom-mois, trimestre, année)
• VENTE (id-prod, id-tps, id-client, date-expédition, prix-de-vente, frais-de-
livraison)
Questions
1. Indiquer quelles sont la (les) table(s) de fait et les tables de dimension de cet
entrepôt.
2. Donner pour chaque dimension, sa (multi-) hiérarchie.
3. Donner la représentation du schéma en étoile de l’entrepôt.
4. On veut transformer ce schéma en schéma en flocon. Donner la nouvelle
représentation de la table TEMPS (ajouter des paramètres / attributs, si
nécessaire).

1
Exercice 2 :
Une entreprise de fabrication de vaisselle jetable souhaite mettre en place un
système d’information décisionnel sous la forme d’un data mart (un mini entrepôt
de données) pour observer son activité de ventes aux niveaux des différents lieux
de distributions de ses articles et cela dans plusieurs villes. Ces lieux de
distributions sont renseignés par leur enseigne, leur type (en fonction de leur
surface), leur adresse (code postal et ville), leur département, leur région. Les
ventes sont renseignées selon une période qui se décline en mois, en trimestre et
année. Les ventes sont observées par le nombre d’articles selon le type, et le
chiffre d’affaires.
- Quel est le fait à observer ?
- Quels sont les axes d’analyse, et la ou les mesure.s ?
- Construire le modèle en étoile de ce data mart.

Exercice 3 :
Vendre correctement à l’aide des entrepôts de données
Une entreprise vend des produits regroupés par familles. Une vente correspond à
un produit et un seul ; la vente est effectuée par l’un des vendeurs du service de
vente spécialisé dans le produit. L’entrepôt doit pouvoir fournir le chiffre d’affaires
des ventes d’un produit, par date, client, et vendeur, ainsi que toutes les
sommations possibles de chiffre d’affaires.
Les objectifs de l’entrepôt sont les suivants :
• produit, caractérisé par : code_produit, code_famille, etc...
• client, caractérisé par : code_client, nom, CSP (catégorie socio-
professionnelle), etc …
• vente, caractérisée par : code_date, code_produit, code_client,
code_vendeur, Chiffre d’affaires
• vendeur, caractérisé par : code_vendeur, nom, code_service, etc...
• date, caractérisée par : code_dat, semaine, mois, année, etc...
1. Donner les définitions des termes suivants : table de faits, table de dimension,
indicateur, hiérarchie
2. Tracer le schéma en étoile dimensionnel du Datawarehouse, en précisant pour
chaque table sa nature dimensionnelle (table de faits ou table de dimension),
ses clés, ainsi que la nature des champs.
3. Que peut-on effectuer comme action afin d’obtenir un schéma de données en
flocon.

Exercice 4 :
Les entrepôts de données pour améliorer notre business

2
Un distributeur (grossiste) approvisionne plusieurs magasins en produits, en
effectuant au plus une livraison par jour et par magasin. Les informations qui
figurent sur chaque bon de livraison sont les suivantes : le numéro du bon de
livraison, la date de livraison, la référence du magasin, et pour chaque type de
produit livré sa référence et la quantité livrée (le nombre d’articles). Ces
informations sont stockées chez le distributeur, et accumulées pendant des
longues périodes afin de les analyser pour améliorer le service de distribution.
Les analyses se font suivant plusieurs axes, et à plusieurs niveaux, en analysant
les mouvements des produits par jour et par mois, par ville et par région, par
fournisseur et par catégorie de produit.
On supposera qu’un fournisseur peut fournir au distributeur des produits dans
plusieurs catégories et qu’une catégorie de produit peut être fournie par plusieurs
fournisseurs.
Définir le schéma dimensionnel du Datawarehouse permettant d’analyser la
quantité livrée par ville et catégorie de produits, en faisant apparaître clairement
les dimensions et les indicateurs.
En ramenant la solution à trois dimensions, essayer de représenter une opération
de coupe (slicing) et d’extraction (dicing).

Exercice 5 :
1°) Concevoir un modèle en étoile qui permet d’analyser les ventes d’une
entreprise de restauration rapide. Le principe est de mesurer les ventes grâce aux
quantités vendues et aux bénéfices, en fonction des ventes réalisées par jour, dans
un restaurant donné, pour un aliment donné. L’objectif est de pouvoir analyser les
ventes par jour, par semaine, par mois et par année. Les restaurants peuvent être
regroupés en fonction de leur ville et de leur pays.
2°) Modifier ce modèle en un modèle en flocon de neige pour modéliser
explicitement les hiérarchies des dimensions représentant le temps et la
localisation géographique des magasins.
3°) On souhaite à présent mesurer le nombre de commandes qui est donné par
jour et par restaurant. Etendre le modèle précédent afin de prendre en compte cet
aspect.

Exercice 6 :
La société Chausséria, installée dans l’Arrondissement de Ngaoundéré 3e, désire
construire un entrepôt de données pour suivre l'évolution de ses ventes de
chaussures. L’entreprise Chausséria dispose de deux magasins « Chauss_Dang
» et « Chauss_Bini » et vend plusieurs modèles de chaussures.
1. Proposez un modèle conceptuel et logique d’entrepôt de données
DW_Chausseria pour observer l’évolution des ventes en termes du nombre total

3
de paires de chaussures vendues par rapport aux axes MOIS, ANNÉE, MAGASIN
et MODÈLE.
Quel est le type du modèle obtenu ? Argumentez
2. On peut maintenant imaginer que la société désire aussi étudier la répartition de
ses ventes suivant d'autres critères, comme Genre (Homme/Femme/Enfant),
Pointure, ou encore Couleur. Proposer un nouveau modèle conceptuel de
l’entrepôt de données DW_Chausseria_Nouveau en prenant en compte toutes les
dimensions anciennes et nouvelles citées ci-dessus.
3. Soit la représentation relationnelle du data mart Chausseria_01_02. Proposez
un tableau multidimensionnel pour observer le nombre total de paires de
chaussures vendues par rapport aux axes MAGASIN et MODÈLE puis un Tableau
multidimensionnel selon les 2 axes MAGASIN et MODÈLE.

Exercice 3 :
Aider l’UN à gérer ses étudiants par les entrepôts de données
L’UN cherche à étudier les facteurs influant sur la réussite de ses étudiants aux
examens. Pour cela elle décide de construire un entrepôt de données.
Elle souhaite pouvoir répondre aux questions suivantes :
• Quel est le nombre de réussites aux examens par cours, pour l’année
2022 ?
• Quel est le nombre de réussites aux examens d’un cours obligatoire, pour
l’année 2022 ?
• Quel est le nombre de réussites aux examens par sexe (féminin,
masculin), pour l’année 2021 et 2020 ?
• Combien d’étudiants ayant 22 ans ont réussi leur examen d’entrepôt de
données ?
• Quel est le nombre de réussites aux examens pendant le semestre 1 de
l’année 2023 ?
Pour cela elle dispose des données suivantes : Pour chaque examen passé, on
connaît l’âge et le sexe de l’étudiant, le nom du cours (les cours peuvent être
regroupés en cours obligatoire et cours à option), la date de l’examen, la note
obtenue et si l’examen est réussi ou non.
Proposez un modèle pour cette application. Recherchez tout d’abord les
différentes dimensions et proposez une hiérarchie et catégorisation pour ces
dimensions.

Cas d’étude 1 :
On veut construire un entrepôt de données afin de stocker les informations sur les
consultations d’un pays. On veut notamment connaître le nombre de

4
consultations, par rapport à différents critères (personnes, médecins, spécialités,
etc. Ces informations sont stockées dans les relations suivantes :
• PERSONNE (id, nom, tel, adresse, sexe)
• MEDECIN (id, tel, adresse, spécialité)
• CONSULTATION (id_med, id_pers, date, prix)
Travail à faire :
1. Proposer un schéma relationnel qui tienne compte de la date, du jour de
la semaine, du mois, du trimestre et de l’année.
2. Quelle est la table des faits ?
3. Quels sont les faits ?
4. Combien de dimensions ont été retenues ?
5. Quelles sont les hiérarchies des dimensions ? Dessinez-les.
6. Faites une représentation du cube OLAP sans tenir compte des hiérarchies.
7. A partir de ce cube, indiquez quelles opérations OLAP (roll up,
drill down, slice, dice) faut-il appliquer pour obtenir les informations suivantes :
a. Le coût total des consultations par médecin en 2012 et 2013 ;
b.Le nombre de consultations par jour de la semaine, par spécialité etpar sexe du
patient ;
c. Le coût des consultations par patiente pour les mois d’octobre.

Cas d’étude 2 :
On dispose d’un outil OLAP pour analyser les salaires selon l’âge et le niveau
d’étude des personnes et la situation géographique des entreprises. L’analyse
selon l’âge peut se faire par année ou par décade (tranches de 10 années à
partir
de 14 ans et jusqu’à 73 ans). L’analyse du niveau d’étude peut se faire par le
niveau d’enseignement atteint en fin d’études (primaire, secondaire, supérieur)
ou par le dernier diplôme obtenu (certificat de fin d’étude primaire, BEPC, Bac,
Licence, Master). L’analyse de la situation géographique peut se faire par ville,
département, région ou pays.

Travail à faire :
1. Quel est le schéma relationnel en étoile le plus approprié pour cette analyse.
2. Quelle est la table des faits ?
3. Quels sont les faits ?
4. Combien de dimensions ont été retenues ? Quelles sont-elles ?
5. Quelles sont les hiérarchies des dimensions ? Dessinez-les.
6. Faites une représentation du cube OLAP en tenant en compte les hiérarchies.

You might also like