Professional Documents
Culture Documents
ENTREPTS DE DONNES
CONCEPTION ET IMPLMENTATION
PR ZIYATI HOUSSAINE
Plan
Data Information
Temp. City Weather
8 Rain
Sun 8 Copenhagen Rain
23
12 Clouded 23 EL Jadida Sun
Paris 12 London Clouded
El Jadida
London Dcision
Destination El Jadida
DFINITION (ID)
Informatique Dcisionnelle - Business intelligence, dcisionnel- est
l'exploitation des donnes de l'entreprise dans le but de faciliter la prise de
dcision par les dcideurs, c'est--dire la comprhension du fonctionnement
actuel et l'anticipation des actions pour un pilotage clair de l'entreprise.
Besoins
Quels sont les rsultats des ventes par gamme de produit et par rgion pour
l'anne dernire ?
Quelle est l'volution des chiffres d'affaires par type de magasin et par priode ?
Les outils
d Informatique Dcisionnelle
Entrept de donnes
Il rcolte, stocke et gre efficace des gros volumes donnes pour la prise de dcision
Il assure un regroupement homogne et exploitable de donnes htrognes, trs
nombreuses et distribues
Fouille de donnes
Classification, prdiction.
Architecture multi-niveaux
Entrept de donnes
Dfinition
B. Inmon :
Caractristiques dED
Orient Mtier (Data Mart )
8
Sous-ensemble de donnes du data warehouse cibl sur un sujet unique,
Destin rpondre aux besoins dun secteur ou dune fonction particulire de
lentreprise.
Un modle rduit :
Facilement comprhensible et manipulable.
Service Marketing
Service GRH
Caractristiques dED
Donnes intgres
Normalisation des donnes
Dfinition dun rfrentiel unique
h,f
1,0 h,f
homme, femme
GBP
EUR
DCan
USD
Mr ZIYATI Entrept de Donnes 9
Caractristiques dED
Donnes non volatiles
Ajout
Suppression
Accs
Modification Chargement
Caractristiques dED
Donnes dates
Calendrier Rpertoire
Entrept de Code Anne Mois
Code Anne Mois
donnes
1 2005 Mai 1 Dupont Paris
2 2006 Juillet 1 Durand Lyon
Mr ZIYATI Entrept de Donnes 11
2 Dupont Marseille
BD vs ED
Prsentation de donnes
Donnes
fortement
agrges
M
A
e
x
t
e Donnes
agrges
A
S
D
y
o
n
n
t
n
h
Donnes
dtailles e
t
Entrepot de donnes s
i
q
u
e Donnes
e dtailles
historises
Conception dED
Table de dimension
Axe danalyse selon lequel vont tre tudies les donnes observables
Contient le dtail sur les faits
Lensemble des informations descriptives
Cl primaire
Attributs de la dimension
Table de dimension
Les types
Dimension dgnre (Degenerate dimension)
Dimension causale (Causal dimension)
Dimension conforme (Conformed dimension)
Junk dimension La dimension dgnre est une cl de
Mini dimension dimension dans la table de fait qui est en
gnral sans attribut. Par exemple No de bon de
commande, No dinterruption de service, etc.
Il sagit dune dimension qui provoque des
faits. Un bon exemple de ce genre de
dimension est la dimension Promotion qui
en gnral peut provoquer des ventes.
partage lorsque la dimension est utilise par
les faits de plus quun data mart. dimension
Produit partage par les data mart Finance ,
Marketing
Dimension qui contient toutes sorte de flags,
statuts, codes qui ne font partie daucune
dimension rgulire
Mr ZIYATI Entrept de Donnes 16
03/10/2015
Granularit
La granularit est le niveau de dtail de linformation
Une dimension contient des membres organiss en hirarchie :
Chacun des membres appartient un niveau hirarchique (ou niveau de granularit) particulier.
Table de faits
Table principale du modle dimensionnel
Contient les donnes observables (les faits) sur le sujet tudi
selon divers axes danalyse (les dimensions)
FK vers
les tables de dimensions
Faits (mesures)
DFINITION
Un fait (attribut) reprsente la valeur dune mesure,
mesure ou calcule, selon un membre de chacune des
Mr ZIYATI Entrept de Donnes 18
Dimensions.
03/10/2015
Table de faits
Trois types de mesures :
Granularit
Table de faits
Granularit
Table de faits
+
FINESSE
Modlisation dun DW
Schma en toile
Inconvnients:
Redondance dans les dimensions
Toutes les dimensions ne concernent pas les mesures
Schma en flocon
Avantages:
Normalisation des dimensions
conomie despace disque
Inconvnients:
Modle plus complexe (jointure)
Requtes moins performantes
SCHMA EN CONSTELLATION
Plusieurs tables de faits pour dcrire plusieurs sries de donnes sur le mtier
tudi et partageant les tables dimensionnelles
37
Mr ZIYATI
Entrept de Donnes
Cl de substitution
Performance
Acclre laccs aux donnes du moment ou lon va utiliser un index
numrique vu que le type de donnes de la cl de substitution est numrique.
Historique des changements et granularit infinie
Si lon dsire garder lhistorique des changements de la dimension selon
certains critres (SCD) nous devons grer la cl de substitution (Sinon,
nous nous retrouverons facilement avec plusieurs enregistrements de la
mme cl daffaire dans la dimension)
Modlisation dimensionnelle
Exemple de modlisation
Dim client
Faits Cl_client
Dim client
Nom Faits
Cl_client Cl_client
Prnom Cl_client
Nom
Adresse Cl_dmog
Prnom
Date_naissance
Adresse
Date_nais
Dim_dmographique
Revenus Cl_dmog
Niveau_tude Revenus
Nb_enfants Niveau_tude
Statut_marital Nb_enfants
Profil_financier Statut_marital
Profil_achat Profil_financier
Mr ZIYATI 41
Entrept de Donnes Profil_achat
ENTREPT DE DONNES
CONCEPTION DENTREPT DE DONNES
Pr Ziyati Houssaine
03/10/2015
Approches
Les deux approches les plus connues dans la conception des Data Warehouse
sont : Buttom-up et hybride.
TCHES DE CONCEPTION
Modlisation et conception du Data Warehouse,
Alimentation du Data Warehouse,
Mise en uvre du Data Warehouse,
Administration et maintenance du Data Warehouse
Conception
Cycle de vie
Conception
R.Kimball (Buttom up ) B.Inmon (Top Down )
Conception
Buttom up
Approche ascendante ,illustre par R. Kimball comme suit :
Conception
Approche Buttom -up
Conception
Approche Buttom -up
DIMENSIONS COMMUNES
PROCESSUS
DENTREPRISE Date Produit Magasin Promotion Entrept Fournisseur Contrat Transporteur
Ventes au dtail X X X X
Stock vente
X X X
dtail
Livraison pour
X X X
vente dtail
Stock entrept X X X X
Livraisons
X X X X
entrept
Commandes
X X X X X X
Conception
prsentation relationnelle vs multidimensionelle
Conception
Buttom up
EXERCICE (1)
EXERCICE (1)
EXERCICE (2)
LED doit fournir le CA des ventes dun produit, par date, client, et vendeur,
ainsi que toutes les sommations possibles de chiffre daffaires dans une anne
donne.
Une vente est caractrise par: produit, client, vendeur, date, prix de vente.
Produit : code produit, code famille, libell
Client : code client, type client
Vendeur : code vendeur, nom, code service
Date : jour, semaine, mois
Donner le schma en toile, en flocon de cet entrept?
Exemple