Introduction à la B.I.

Avec SQL Server 2008
Version 1.0

VALENTIN Pauline

..................................................................................... 3 1........................I........................... 6 3.......................................I......... 12 Conclusion ............... 11 5 6 Qu’est ce que Reporting Services ? ........................... 8 4 Introduction à Analysis Services .....................1 2.....................................................................................3 L’ETL ...................................................................................I............................................................................................... et SQL Server 2008 ........................I..... avec SQL Server 2008 Sommaire 1 Présentation de la B....2 Introduction à la B........................... 13 Dotnet France Association – Valentin Pauline .......................................................................................2 3..... 4 2...........2 Définition du datawarehouse ...S...........2 Présentation rapide de SQL Server 2008............................................ 9 4........... 3 2 Le datawarehouse ..............................................2 L’infrastructure OLAP ...........1 1................................................... .................. 3 La B.......................................................................1 3.......................................................S....S...................................................................... 9 Le data mining .................................... 6 Tâches de S........................................................................................................................ 6 Package : unité de travail de S..................................... 4 Conception du datawarehouse ....... 5 3 Premières notions d’Integration Services .................S..............................................................I.............................................................................................. ................................................ : définition et apport à l’entreprise ...............1 4.....................................................................

SQL Server 2008 contient trois plateformes. technique… Tous conservent des informations propres à leurs fonctions : listes des clients. o Reporting Services. SQL Server 2008 est un système de gestion de bases de données relationnelles. Ce cours abordera néanmoins les notions générales pour appréhender au mieux ces plateformes.I. ce qui lui permet de mesurer les indicateurs de performance de l’entreprise (chiffre d’affaire.I. qui permet d’intégrer des données provenant de différentes sources pour les ranger dans un entrepôt central . agrégées lors de S. Ce service permet la réalisation de nombreuses applications. il est important de comprendre la définition et l’utilité d’un projet BI au sein d’une entreprise. En plus de son moteur.. marketing. Pour plus de détails sur le moteur de SQL Server 2008. des cours sont disponibles dans la partie « SQL Server 2008 Implementation and Maintenance ». les outils et les méthodes qui permettent de collecter. d'une entreprise en vue d'offrir une aide à la décision et de permettre aux responsables de la stratégie d'entreprise d’avoir une vue d’ensemble de l’activité traitée. les services comptabilité. une base de données MySQL…). Une entreprise est généralement composée de plusieurs services tels que les ressources humaines. Moteur BD IS AS RS SQL Server 2008 Figure 1: Composants de SQL Server 2008 Ces trois services seront expliqués en détails dans des chapitres complémentaires.1 Présentation rapide de SQL Server 2008 Produit par Microsoft. consolider. des employés.A.3 Introduction à la B. et transactions. emplois du temps… L’accumulation de ces données nécessite donc leur sauvegarde dans le but d’une future exploitation. et SQL Server 2008 1. calculs de bénéfices à l’année…).S. o Analysis Services. modéliser et restituer les données. notamment grâce au langage T-SQL (Transact-SQL). avec SQL Server 2008 1 Présentation de la B. Le stockage. . indispensables pour réaliser un projet BI : o Integration Services. chaque service a bien souvent sa façon de stocker ses informations (par exemple dans un fichier Excel.S. commercial. et sa manière de calculer les Dotnet France Association – Valentin Pauline . Pour commencer.I.S. gérer et publier des rapports résultant des analyses réalisées lors de S. chiffres. qui permet de créer. Cependant. : définition et apport à l’entreprise « L’informatique décisionnelle (ou BI pour Business Intelligence) désigne les moyens. qui permet d’analyser les données. requêtes.2 La B.S. la manipulation et l’analyse de ces données se font au sein de son moteur de bases de données. grâce à des fonctions d’analyse multidimensionnelle . matérielles ou immatérielles. » Source : wikipédia Voici la définition que l’on retrouve généralement lorsque l’on parle d’informatique décisionnelle. On constate ainsi régulièrement que chaque service possède son tableau de bord. 1.I.

avec SQL Server 2008 indicateurs. la première étape d’un projet BI est de créer un entrepôt central pour avoir une vision globale des données de chaque service. ou il peut être seulement issu de celui-ci. Avant d’évoquer les bases de celles-ci. avec sa vérité et ses critères. cela constituerait une utilité évidente et un réel apport à la société. SQL Server 2008 met donc à disposition trois plateformes qui illustrent ce cheminement (cf. si seulement une catégorie de services ou métiers est concernée. figure 2). Datamart service technique Datamart service commercial Datamart RH Datawarehouse Figure 3: Datawarehouse et Datamart Dotnet France Association – Valentin Pauline . 2 Le datawarehouse 2.I. afin de répondre aux problématiques de celle-ci. Cet entrepôt porte le nom de datawarehouse. Par définition. il est essentiel de connaitre le concept du datawarehouse. En effet. si l’on veut considérer les données de l’entreprise dans son ensemble.4 Introduction à la B. une mise en relation et une analyse de toutes les données permettraient de réaliser des études et des prévisions sur le comportement et la « santé » de l’entreprise.1 Définition du datawarehouse Comme expliqué précédemment. Pourtant. Réunir les données de chaque service Solution BI Analyser mes données agrégées (indicateurs) Obtenir une évaluation de mon entreprise Figure 2: Solution BI Le but de la BI est d’apporter une vision globale des données de l’entreprise. ou tout simplement. On peut également parler de datamart. Ainsi. un datamart peut être contenu dans un datawarehouse. Pour y arriver. afin de l’évaluer. la tâche s’avère rude voire parfois impossible.

2. quantifiables et agrégeables. Une dimension organise ainsi les données contenues dans la table en fonction d’un domaine d’intérêt. Viennent donc les notions de table de fait et tables de dimensions : Figure 4: Schéma en étoile Une table de dimension contient des colonnes. vient son « remplissage » avec Integration Services. puis en trimestre… Une fois les dimensions et les faits identifiés. Il faut tout prendre en compte et poser les bonnes questions : Arrivera t-il que les dirigeants de l’entreprise changent d’avis sur la périodicité des rapports de leur activité (toutes les semaines au lieu de tous les mois par exemple) ? Au lieu d’avoir un compte rendu statique. Pour les différencier. une quantité de produits… Les mesures sont en fait les critères ou indicateurs que l’on veut étudier en fonction de différents axes ou dimensions. C’est là la différence avec des sources de données transactionnelles (systèmes OLTP). le type de produit… Les colonnes d’une table de faits représentent les faits ou les mesures.S. le but ici est d’apporter une plus grande liberté qui reposerait sur les désirs et les besoins des dirigeants.I.S. Exemples de dimension : le temps. par exemple. avec SQL Server 2008 Un datawarehouse représente en fait une base de données. Mais avant. mais aussi les identifiants qui font références aux tables de dimensions situées tout autour de la table de fait. non volatiles (c'est-à-dire qu’une fois les données rentrées dans l’entrepôt. Ses données sont généralement numériques. Une table de faits contient donc les mesures dont on a besoin. On parle alors de schéma en étoile. on peut spécifier dans le nom s’il s’agit d’une table de faits ou de dimension.5 Introduction à la B. celles-ci étant intégrées (elles auront subi une sorte de nettoyage qui les normalisera). il est indispensable de définir sa structure. en fait.2 Conception du datawarehouse Avant de remplir le datawarehouse dans S. Dotnet France Association – Valentin Pauline . si l’on choisit d’admettre une dimension temps qui concernerait des années. et historisées (ou datées). Cette partie de conception demande une connaissance pointue des besoins et attentes de l’entreprise concernée. On peut en effet inclure des dimensions hiérarchiques. une simple base de données avec nos tables de fait et de dimensions. elles y restent pour de bon). la conception de celui-ci s’impose. et parfois de schéma en flocon de neige quand le schéma s’étend encore plus.I. Le schéma du datawarehouse est. le lieu. en tant que simples tables.. celle-ci peut être « décomposée » en semestre. chaque colonne correspondant à un attribut. cet entrepôt central sera rempli. basé sur des critères fixes. on crée les tables directement sur SQL Server. Après la conception du datawarehouse. Exemples : un montant. Grâce à la plateforme SQL Server Integration Services.

La phase d’ETL est ici incontournable car elle conditionne et influence la qualité du projet par la suite.I.I.I. Excel… . on appelle package l’environnement dans lequel on travaille. Dans cette partie seront expliquées les notions propres à I. Access…). On peut construire plusieurs packages Integration Services. … Figure 5: Principe de l'ETL Ce processus se déroule donc en trois étapes : o Extraction des données à partir d’une ou plusieurs sources de données telles que fichier plat. et cela sous l’interface « Business Intelligence Development Studio » (B.6 Introduction à la B. MySQL…). il commence par extraire les données provenant de différentes sources (Excel. OLE DB (source relationnelles telles que SQL Server. puis les charge dans le datawarehouse. les données doivent être insérées. o Transformation des données agrégées .S. fichier brut.).S. 3. o Chargement des données dans la banque de données de destination (datawarehouse). 3.S.S. les packages et les tâches d’intégration. Dotnet France Association – Valentin Pauline . avec SQL Server 2008 3 Premières notions d’Integration Services SQL Server Integration Services est donc la première plateforme à aborder.1 L’ETL Une fois la structure du datawarehouse définie. Dans Integration Services. L’outil qui va permettre le remplissage de notre base est l’ETL (Extract-Transform-Loading). les transforme si besoin est.2 Package : unité de travail de S. : l’ETL. Comme son nom l’indique.D.

S. ce qui facilite son utilisation.S (outil graphique pour la création de packages)… Dotnet France Association – Valentin Pauline . tous les éléments qui composent le package. il décrit. elle est nommée « tâche de flux de données ». se compose d’un flux de contrôle et.I. avec SQL Server 2008 Figure 6: Interface d'un package SSIS Chaque package contient toutes les tâches d’intégration et fonctionne grâce au principe du « glisser-déposer ». On retient donc qu’un package S. A l’intérieur de cette tâche se trouve un flux de données (Data Flow) contenant au minimum une source.I. d’un ou plusieurs flux de données.7 Introduction à la B. concepteur S. figure 7). il permet de gérer des évènements qui peuvent survenir durant les étapes d’un package. La création et la gestion des packages sont maitrisées grâce à des assistants et outils fournis par S. Quant à l’onglet « Package Explorer ».S. L’enchainement des tâches d’un package est orchestré par le flux de contrôle (Control Flow).S. Exemples : assistant configuration de packages. assistant importation et exportation.I. une transformation et une destination (cf. de façon arborescente. figure 6).S.S. éventuellement. Figure 7: Contenu d'un package On remarque également qu’un package contient un onglet « Event Handlers » (cf. Lorsqu’une tâche a pour objectif d’assurer la transformation des données.I.

(en langage VB par exemple) . celui-ci permettant la communication et l'échange de données entre systèmes ou applications.I. et de requêtes SQL . o Tâche de script : elle permet de créer des fonctions non disponibles directement dans les autres tâches de S. Chaque conteneur contient donc un ensemble de tâches liées entre elles par le même objectif.S. Les tâches S.3 Tâches de S.S. et d’objets SQL Server .I. o Tâches de transfert de bases de données. Comme expliqué précédemment.I.S. qui concernent souvent soit la maintenance. par le protocole http .S. o Tâche « Envoyer un message » : elle permet l’envoi de messages notifiant le succès ou l’échec d’un évènement. o Tâche « Sauvegarder la base de données » .8 Introduction à la B. Il est possible de regrouper certaines tâches entre elles dans ce qu’on appelle un conteneur. Il existe ainsi des conteneurs répétitifs qui permettent de créer une boucle qui exécutera leurs tâches un certain nombre de fois. o Tâche « Vérifier l’intégrité de la base de données ». de procédures stockées.S. de connexions.I. de processus.S participent chacune à sa manière à l’élaboration de l’entrepôt de données. o Tâche FTP : elle permet à un package de télécharger des fichiers de données depuis un serveur distant . les tâches de flux de données aident à la transformation des données. o Tâches d’exécution de package. de messages d’erreur. o Tâche XML : elle permet de travailler avec des données XML . o Tâche « Mettre à jour les statistiques » d’une ou plusieurs bases de données . En voici quelques unes : Exemples de tâches concernant le flux : o Tâche de service web : elle permet de lancer une méthode de service web. Il existe de nombreuses autres tâches. soit le flux en lui-même. Exemples de tâches concernant la maintenance : o Tâches de nettoyage d’historique ou de maintenance . Dotnet France Association – Valentin Pauline . Elles se trouvent toutes dans la boîte à outil du Data Flow. avec SQL Server 2008 3.

4. Ainsi. Ces analyses comprennent un traitement sur des bases de données volumineuses et permettent de comprendre les métriques et les éléments qui influent sur le fonctionnement de l’entreprise. avec SQL Server 2008 4 Introduction à Analysis Services SQL Server Analysis Services est la plateforme qui permet de créer et gérer des structures multidimensionnelles et des modèles d’exploration de données. coefficients de corrélation. ce chiffre étant calculé chaque trimestre. les mesures étant des données quantitatives. Analysis Services fournit des fonctions OLAP (On Line Analytical Processing). d’analyser l’activité de l’entreprise grâce à des statistiques : moyennes mobiles. L’exemple de la figure 7 montre un cube simple à trois dimensions : il présente le chiffre d’affaire que produit un magasin situé sur trois sites (Paris. et s’en sert pour effectuer des calculs. Un cube reprend les mesures de la table de fait que l’on a pu établir lors de la conception du datawarehouse. Dotnet France Association – Valentin Pauline . à la période de temps et au type d’article choisis. leur gestion avec SQL Server Management Studio. valeurs cumulées… L’élément principal de l’infrastructure OLAP est le cube (ou hypercube).9 Introduction à la B. sacs et chaussures). qui permet l’analyse de ces données. Figure 8: Représentation d'un cube OLAP Les dimensions d’un cube peuvent être affinées par une représentation hiérarchique (cf. La création des cubes OLAP et des modèles d’exploration se fait avec SQL Server Business Intelligence Development Studio.1 L’infrastructure OLAP Les fonctions OLAP permettent. à partir des entrepôts de données. C’est en fait une base de données multidimensionnelle. proposant trois catégories d’articles (vêtements. figure 8). et des applications d’exploration de données (data mining). à l’intersection des trois axes se trouve le montant des bénéfices correspondant à la ville. Toulouse et Bordeaux).I. Pour cela.

On peut choisir de mettre plus d’une mesure à l’intersection des axes (cf. Dotnet France Association – Valentin Pauline . On réalise des « glisser-déposer » des dimensions choisis jusqu’à un tableau. on peut effectuer un forage avant dans la hiérarchie des dimensions. ou elles peuvent résulter d’un calcul (mesures calculées). et le drill up désigne le forage arrière (on réalise une jointure des composants qui détaillent la dimension). L’exemple ci-dessous (cf. c'est-à-dire le passage à un niveau plus détaillé (on zoome sur la dimension). et avec le signe . avec SQL Server 2008 Figure 9: Cube OLAP avec hiérarchies de dimensions Une telle structure permet d’accéder à un niveau plus précis de données. qui ressemble d’ailleurs beaucoup aux tableaux croisés dynamiques que l’on trouve sur Excel. figure 9) présente le nombre de ventes réalisées par pays et types d’articles. Les croisements entre les différents axes nous permettent alors d’accéder à plusieurs indicateurs ou mesures.I. figure 9). Figure 10: Drill down et Drill up Grâce au signe . on parle alors de « forage » : le drill down désigne le forage avant. Les mesures que contient un cube peuvent être déjà existantes dans la table de fait (mesures physiques). un forage arrière.10 Introduction à la B. Ces forages sont utiles lors de la création de cubes. puis par ville et modèles d’articles (après un drill down).

avec SQL Server 2008 Figure 11: Cube OLAP avec groupes de mesures Le langage qui permet d’interroger les cubes OLAP est le langage MDX (Multidimensional Expressions). Un KPI indique par une valeur ou une couleur (échelle prédéfinie) la tendance d’une mesure vis-à-vis des objectifs requis. Une fois que le problème en termes de données est identifié. o On déploie les connaissances en vue d’une utilisation effective. La notion de procédures stockées est également prise en compte dans Analysis Services. o On extrait et évalue les connaissances résultant de ces analyses . o On les prépare en vue de leur future utilisation .11 Introduction à la B. il permet d’extraire des connaissances à partir d'un volume de données (moins important que dans le cas d’OLAP).2 Le data mining Le data mining est un processus de fouille de données.. Dotnet France Association – Valentin Pauline . des indicateurs clés de performance qui montrent l’évolution de l’entreprise en matière de qualité et les objectifs à atteindre.. 4. elles permettent d’étoffer les fonctions basiques du langage MDX. C#. Il est possible d’en écrire sous différents langages (VB. C++.I. C’est aussi ce langage qui est utilisé par Analysis Services pour construire les cubes. Les analyses réalisées par les fonctions OLAP sont utilisées pour évaluer l’entreprise. o On les modélise grâce à des analyses et algorithmes de fouille de données .). comme leur nom l’indique. Les KPI (Key Performance Indicator) sont. Vient donc la notion de KPI. plusieurs étapes sont nécessaires : o On accède aux données sélectionnées .

Il fournit également des interfaces de programmation d'application (API) qui permettent d’étendre les rapports sous d’autres environnements. Ces rapports peuvent ensuite être utilisés à l’intérieur de l’entreprise ou diffusés à l’extérieur (fournisseurs et clients) grâce à un portail web. Le data mining propose une série de tâches pour aider dans l’examen des données : o la classification en fonction de caractéristiques définies . Ils peuvent donc être : o Internes : administrables avec des conditions d’accès . o la régression linéaire qui présente les relations entre les données . o la segmentation qui permet la division d’une population en groupes homogènes . tabulaire. matriciel ou libre. graphique. o l’analyse de séquences qui identifie les chemins pris par les clients (sur un site web par exemple). o Embarqués : affichage général dans tous les services de l’entreprise. o Collaboratifs : échangés entre plusieurs entreprises. De nombreuses formes de restitution sont possibles tels que les formats interactif. o Externes : disponibles via Internet . Dotnet France Association – Valentin Pauline .I. avec SQL Server 2008 Figure 12: Méthodologie du data mining Par cette méthodologie et à ses nombreux algorithmes. le data mining permet de concevoir des schémas et modèles d’exploration de données. 5 Qu’est ce que Reporting Services ? SQL Server Reporting Services offre un ensemble d’outils et de services prêts à l’emploi pour définir.12 Introduction à la B. gérer et déployer des rapports. o l’association qui examine le comportement de ces groupes .

il est important de se rendre compte de l’utilité de l’informatique décisionnelle. La BI est riche en solutions et concepts.I. Dotnet France Association – Valentin Pauline . et elle permet de mettre en place des projets pour les grandes entreprises d’aujourd’hui. avec SQL Server 2008 6 Conclusion Pour conclure ce chapitre.13 Introduction à la B. Microsoft l’a compris en améliorant ses trois services sus SQL Server 2008.

Sign up to vote on this title
UsefulNot useful