You are on page 1of 28

03/10/2015

ENTREPTS DE DONNES
CONCEPTION ET IMPLMENTATION

PR ZIYATI HOUSSAINE

Plan

Introduction lInformatique Dcisionnelle (ID)


Les outils de lID (Entrept de Donnes)
Les Caractristiques dED
Conception dEntrept de donnes
Modlisation relationnelle
Modlisation dimensionnelle
Etude de cas

Mr ZIYATI Entrept de Donnes 2


03/10/2015

Data Information
Temp. City Weather
8 Rain
Sun 8 Copenhagen Rain
23
12 Clouded 23 EL Jadida Sun
Paris 12 London Clouded
El Jadida
London Dcision
Destination El Jadida

DFINITION (ID)
Informatique Dcisionnelle - Business intelligence, dcisionnel- est
l'exploitation des donnes de l'entreprise dans le but de faciliter la prise de
dcision par les dcideurs, c'est--dire la comprhension du fonctionnement
actuel et l'anticipation des actions pour un pilotage clair de l'entreprise.

Mr ZIYATI Entrept de Donnes 3

Besoins

Pour prendre de bonnes dcisions , on doit accder en temps rel aux


donnes de l'entreprise, traiter ces donnes, extraire l'information pertinente :

Quels sont les rsultats des ventes par gamme de produit et par rgion pour
l'anne dernire ?
Quelle est l'volution des chiffres d'affaires par type de magasin et par priode ?

NOUVELLES ATTENTES DES SYSTMES DINFORMATION

Considrer des quantits de donnes historises trs importantes


Donnes organises selon diffrentes dimensions (temps, espace
gographique, gammes de produit, )

Mr ZIYATI Entrept de Donnes 4


03/10/2015

Les outils
d Informatique Dcisionnelle
Entrept de donnes
Il rcolte, stocke et gre efficace des gros volumes donnes pour la prise de dcision
Il assure un regroupement homogne et exploitable de donnes htrognes, trs
nombreuses et distribues

Analyse en ligne (OLAP)


catgorie de traitements ddis laide la dcision dont des requtes
interactives complexes sur des gros volumes de donnes
les donnes sont organises selon plusieurs axes danalyse et selon diffrents
niveaux de dtail
les traitements permettent interactivement de changer de points de vue, de
changer de niveau de dtail, et effectuer les oprations OLTP classiques

Fouille de donnes
Classification, prdiction.

Mr ZIYATI Entrept de Donnes 5

Architecture multi-niveaux

Data Source Data Storage OLAP Front End


Mr ZIYATI Entrept de Donnes 6
03/10/2015

Entrept de donnes
Dfinition

B. Inmon :

Un DW est une collection de donnes thmatiques, intgres, non


volatiles et historises, organises pour la prise de dcision.

Mr ZIYATI Entrept de Donnes 7

Caractristiques dED
Orient Mtier (Data Mart )
8
Sous-ensemble de donnes du data warehouse cibl sur un sujet unique,
Destin rpondre aux besoins dun secteur ou dune fonction particulire de
lentreprise.

Un modle rduit :
Facilement comprhensible et manipulable.

Service Marketing

Service GRH

Mr ZIYATI Entrept de Donnes


03/10/2015

Caractristiques dED
Donnes intgres
Normalisation des donnes
Dfinition dun rfrentiel unique

h,f

1,0 h,f

homme, femme

GBP
EUR
DCan

USD
Mr ZIYATI Entrept de Donnes 9

Caractristiques dED
Donnes non volatiles

Traabilit des informations et des dcisions prises


Copie des donnes de production

Bases de production Entrepts de donnes

Ajout
Suppression

Accs
Modification Chargement

Mr ZIYATI Entrept de Donnes 10


03/10/2015

Caractristiques dED
Donnes dates

Les donnes persistent dans le temps


Mise en place dun rfrentiel temps

Image de la base en Mai 2005 Image de la base en Juillet 2006


Rpertoire Rpertoire
Base de Nom Ville Nom Ville
production
Dupont Paris Dupont Marseille
Durand Lyon Durand Lyon

Calendrier Rpertoire
Entrept de Code Anne Mois
Code Anne Mois
donnes
1 2005 Mai 1 Dupont Paris
2 2006 Juillet 1 Durand Lyon
Mr ZIYATI Entrept de Donnes 11
2 Dupont Marseille

BD vs ED

Mr ZIYATI Entrept de Donnes 12


03/10/2015

Prsentation de donnes

Donnes
fortement
agrges
M
A
e
x
t
e Donnes
agrges
A
S
D
y
o
n
n
t
n
h
Donnes

dtailles e
t
Entrepot de donnes s
i
q
u
e Donnes
e dtailles
historises

Mr ZIYATI Axe historique 13


Entrept de Donnes

Conception dED

Nouvelle mthode de conception autour des concepts mtiers


Ne pas normaliser au maximum
Introduire de nouveaux types de table :
Table de faits
Table de dimensions
Introduire de nouveaux modles :
Modle en toile
Modle en flocon de neige
Modle de constellation

Mr ZIYATI Entrept de Donnes 14


03/10/2015

Table de dimension

Axe danalyse selon lequel vont tre tudies les donnes observables
Contient le dtail sur les faits
Lensemble des informations descriptives

Cl primaire

Attributs de la dimension

Mr ZIYATI Entrept de Donnes 15

Table de dimension
Les types
Dimension dgnre (Degenerate dimension)
Dimension causale (Causal dimension)
Dimension conforme (Conformed dimension)
Junk dimension La dimension dgnre est une cl de
Mini dimension dimension dans la table de fait qui est en
gnral sans attribut. Par exemple No de bon de
commande, No dinterruption de service, etc.
Il sagit dune dimension qui provoque des
faits. Un bon exemple de ce genre de
dimension est la dimension Promotion qui
en gnral peut provoquer des ventes.
partage lorsque la dimension est utilise par
les faits de plus quun data mart. dimension
Produit partage par les data mart Finance ,
Marketing
Dimension qui contient toutes sorte de flags,
statuts, codes qui ne font partie daucune
dimension rgulire
Mr ZIYATI Entrept de Donnes 16
03/10/2015

Granularit
La granularit est le niveau de dtail de linformation
Une dimension contient des membres organiss en hirarchie :
Chacun des membres appartient un niveau hirarchique (ou niveau de granularit) particulier.

Mr ZIYATI Entrept de Donnes 17

Table de faits
Table principale du modle dimensionnel
Contient les donnes observables (les faits) sur le sujet tudi
selon divers axes danalyse (les dimensions)

FK vers
les tables de dimensions

Faits (mesures)

DFINITION
Un fait (attribut) reprsente la valeur dune mesure,
mesure ou calcule, selon un membre de chacune des
Mr ZIYATI Entrept de Donnes 18
Dimensions.
03/10/2015

Table de faits
Trois types de mesures :

1) Additif: additionnable suivant toutes les tables de dimensions


Quantits vendus, chiffre daffaires .
2) Semi additif :additionnable suivant quelques dimensions
Soldes dun compte bancaire
Pas de sens dadditionner sur les dates car cela reprsente
des instantans dun niveau
3) Non additif: non additionnable quelque soit la table de dimension
Prix unitaire

Mr ZIYATI Entrept de Donnes 19

Granularit
Table de faits

Il doit tre au mme niveau de dtail que les tables


de dimensions :
EXEMPLE
2 MDH est un fait cot de ventes
Dimension Produit(Catgorie)
Dimension rgion(ville)
Dimension Temps(trimeste1).

(Catgorie, ville, trimestre1 2MDH)

Mr ZIYATI Entrept de Donnes 20


03/10/2015

Granularit
Table de faits

Q :Que reprsente un enregistrement de la table de faits ?


R :La granularit danalyse , elle dfinit le niveau de dtail dun fait (mesure)

+
FINESSE

Mr ZIYATI Entrept de Donnes 21

Modlisation dun DW

Modlisation : dimensions & mesures


Schma en toile: la table des faits au centre et les tables de
dimensions autour
Schma en flocon: mme principe que dans le schma en toile
mais certaines dimensions ont
normalises
Schma en constellation. combinaison des deux schemas prcits

Mr ZIYATI Entrept de Donnes 22


03/10/2015

Schma en toile

Mr ZIYATI Entrept de Donnes 23

Schma en toile (2)

Une table de fait centrale et des dimensions


Les dimensions nont pas de liaison entre elles
Avantages:
Facilit de navigation
Nombre de jointures limit

Inconvnients:
Redondance dans les dimensions
Toutes les dimensions ne concernent pas les mesures

Mr ZIYATI Entrept de Donnes 24


03/10/2015

Schma en flocon

Mr ZIYATI Entrept de Donnes 25

Schma en flocon (2)


Normalisation

Mr ZIYATI Entrept de Donnes


26
03/10/2015

Schma en flocon (2)


Hirarchies

Mr ZIYATI Entrept de Donnes


27

Schma en flocon (2)


Hirarchies (Types)

Hirarchies strictes et simples

Mr ZIYATI Entrept de Donnes


28
03/10/2015

Schma en flocon (2)


Hirarchies (Types)

Hirarchies multiples alternatives Hirarchies multiples parallles

Mr ZIYATI Entrept de Donnes 29

Schma en flocon (3)

Les dimensions dcomposes en sous hirarchies


La table de dimension de niveau hirarchique le plus bas est relie la table
de fait. On dit quelle a la granularit la plus fine

Avantages:
Normalisation des dimensions
conomie despace disque
Inconvnients:
Modle plus complexe (jointure)
Requtes moins performantes

Mr ZIYATI Entrept de Donnes 30


03/10/2015

SCHMA EN CONSTELLATION
Plusieurs tables de faits pour dcrire plusieurs sries de donnes sur le mtier
tudi et partageant les tables dimensionnelles

Mr ZIYATI Entrept de Donnes 31

VOLUTION DES DIMENSIONS

Dimensions volution lente


Dimensions volution rapide

Mr ZIYATI Entrept de Donnes 32


03/10/2015

Evolutions des dimensions

Dimensions volution lente


Un client peut changer dinfos (statut, # denfants)
Un produit peut changer de noms ou dinformation
Gestion de la situation, 3 solutions:
crasement de lancienne valeur
Visionnement (valeur prcdente/courante)
Garder lhistorique
Dimensions volution rapide

Mr ZIYATI Entrept de Donnes 33

Dimensions volution lente (1/3)

crasement de lancienne valeur :


Correction des informations errones
Avantage:
Facile mettre en uvre
Inconvnients:
Perte de la trace des valeurs antrieures des attributs
Perte de la cause de lvolution dans les faits mesurs

Mr ZIYATI Entrept de Donnes 34


03/10/2015

Dimensions volution lente (2/3)


Ajout dun nouvel enregistrement:
Utilisation dune cl de substitution
Avantages:
Permet de suivre lvolution des attributs
Permet de segmenter la table de faits en fonction de lhistorique
Inconvnient:
Accroit le volume de la table

Mr ZIYATI Entrept de Donnes 35

Dimensions volution lente (2/3)


Modlisation dimensionnelle

Mr ZIYATI Entrept de Donnes 36


03/10/2015

Dimensions volution lente (3/3)

Ajout dun nouvel attribut:


Valeur origine/valeur courante
Avantages:
Avoir deux visions simultanes des donnes :
Voir les donnes rcentes avec lancien attribut
Voir les donnes anciennes avec le nouvel attribut
Voir les donnes comme si le changement navait pas eu lieu
Inconvnient:
Inadapt pour suivre plusieurs valeurs dattributs intermdiaires

37
Mr ZIYATI
Entrept de Donnes

Dimensions volution lente (3/3)


Modlisation dimensionnelle

Cl de substitution

Performance
Acclre laccs aux donnes du moment ou lon va utiliser un index
numrique vu que le type de donnes de la cl de substitution est numrique.
Historique des changements et granularit infinie
Si lon dsire garder lhistorique des changements de la dimension selon
certains critres (SCD) nous devons grer la cl de substitution (Sinon,
nous nous retrouverons facilement avec plusieurs enregistrements de la
mme cl daffaire dans la dimension)

Mr ZIYATI Entrept de Donnes 38


03/10/2015

Modlisation dimensionnelle
Exemple de modlisation

Mr ZIYATI Entrept de Donnes 39

volution des dimensions

Dimensions volution lente


Dimensions volution rapide
Subit des changements trs frquents (tous les mois) dont on
veut prserver lhistorique
Solution: isoler les attributs qui changent rapidement

Mr ZIYATI Entrept de Donnes 40


03/10/2015

Dimensions volution rapide (suite)

Dim client

Faits Cl_client
Dim client
Nom Faits
Cl_client Cl_client
Prnom Cl_client
Nom
Adresse Cl_dmog
Prnom
Date_naissance
Adresse

Date_nais
Dim_dmographique
Revenus Cl_dmog
Niveau_tude Revenus
Nb_enfants Niveau_tude
Statut_marital Nb_enfants
Profil_financier Statut_marital
Profil_achat Profil_financier
Mr ZIYATI 41
Entrept de Donnes Profil_achat

ENTREPT DE DONNES
CONCEPTION DENTREPT DE DONNES

Pr Ziyati Houssaine
03/10/2015

Approches

Lapproche base sur les besoins danalyse (TOP-DOWN APPROAH)


Inmon, ..
Lapproche base sur les sources de donnes (BOTTOM-UP APROACH)
R.Kimbal
Lapproche hybride.

Les deux approches les plus connues dans la conception des Data Warehouse
sont : Buttom-up et hybride.

Mr ZIYATI Entrept de Donnes 43

TCHES DE CONCEPTION
Modlisation et conception du Data Warehouse,
Alimentation du Data Warehouse,
Mise en uvre du Data Warehouse,
Administration et maintenance du Data Warehouse

Mr ZIYATI Entrept de Donnes 44


03/10/2015

Conception
Cycle de vie

Mr ZIYATI Entrept de Donnes 45

Conception
R.Kimball (Buttom up ) B.Inmon (Top Down )

Mr ZIYATI Entrept de Donnes 46


03/10/2015

Conception
Buttom up
Approche ascendante ,illustre par R. Kimball comme suit :

Mr ZIYATI Entrept de Donnes 47

Conception
Approche Buttom -up

Architecture de bus de lentrept de donnes


1. Construction entrept de donnes en une seule tape : tche pratiquement impossible.
2. Construction de morceaux indpendants (Approche incrmentale)
3. Tous les processus de lorganisation seront reprsents par des modles dimensionnels
partageant un ensemble complet de dimensions communes et conformes (conformes ~
similaires).

Mr ZIYATI Entrept de Donnes 48


03/10/2015

Conception
Approche Buttom -up

Matrice de bus de lentrept de donnes

DIMENSIONS COMMUNES
PROCESSUS
DENTREPRISE Date Produit Magasin Promotion Entrept Fournisseur Contrat Transporteur

Ventes au dtail X X X X

Stock vente
X X X
dtail

Livraison pour
X X X
vente dtail

Stock entrept X X X X

Livraisons
X X X X
entrept
Commandes
X X X X X X

Mr ZIYATI Entrept de Donnes 49

Conception
prsentation relationnelle vs multidimensionelle

Mr ZIYATI Entrept de Donnes 50


03/10/2015

Conception
Buttom up

Mr ZIYATI Entrept de Donnes 51

EXERCICE (1)

On souhaite construire un entrept de donnes afin de stocker les informations


sur les consultations dun pays. On veut notamment connatre le nombre de
consultations, par rapport diffrents critres (personnes, mdecins, spcialits,
etc. Ces informations sont stockes dans les
Relations suivantes :

PERSONNE (id, nom, tel, adresse, sexe)


MEDECIN (id, tel, adresse, spcialit)
CONSULTATION (#id_med, #id_pers, datee, prix)

Proposer un schma relationnel qui tienne compte de la date, et lanne.

Mr ZIYATI Entrept de Donnes 52


03/10/2015

EXERCICE (1)

Proposer un schma relationnel qui tienne compte de la date, du mois, du


trimestre et de lanne.

Mr ZIYATI Entrept de Donnes 53

EXERCICE (2)

LED doit fournir le CA des ventes dun produit, par date, client, et vendeur,
ainsi que toutes les sommations possibles de chiffre daffaires dans une anne
donne.
Une vente est caractrise par: produit, client, vendeur, date, prix de vente.
Produit : code produit, code famille, libell
Client : code client, type client
Vendeur : code vendeur, nom, code service
Date : jour, semaine, mois
Donner le schma en toile, en flocon de cet entrept?

Mr ZIYATI Entrept de Donnes 54


03/10/2015

Exemple

Mr ZIYATI Entrept de Donnes 55

You might also like