Introduction à SSIS

Thibault Denizet

....................... Transform.......................................................................................... 3 Rappel sur la Business Intelligence......................................................................... 7 3............1 4 Conclusion ............ 6 3...................................2 SSIS .. 13 Dotnet France Association .............................................................................................................................................................................1 ETL (Extract..................................1 Créer un projet ..........................................................................1................Introduction Sommaire 1 2 Introduction à SQL Server 2008 Integration services ............................................................... Load) ................... 4 3 L’espace de travail d’Integration Services ..................... 6 L’environnement ......... 4 2.................................................................

Load) ou s’informer sur ce sujet à l’aide de l’outil proposé par Microsoft : Integration Services. Transform. La dernière fonctionnalité étant les Reporting services que nous verrons dans le prochain cours. et aborde donc une des deux autres principales fonctions liée à la Business Intelligence : l’ETL. Il devrait vous fournir une partie des connaissances nécessaires au passage de la certification MCTS sur la Business Intelligence.Introduction 1 Introduction à SQL Server 2008 Integration services Ce cours s’adresse aux personnes souhaitant apprendre à mettre en place un ETL (Extract.3 SSIS . Dotnet France Association . puis nous détaillerons les éléments de l’interface de SQL Server Business Development Studio. nous allons donc voir ce qu’est un ETL après un bref rappel sur la Business Intelligence. Il fait suite au cours SQL Server 2008 Analysis Services. Dans ce chapitre d’introduction.

4 SSIS . d’épurer. aux outils OLAP. La BI est utile à tous les niveaux d’une entreprise. Plus simplement. En effet. un ETL est divisé en trois étapes comme son nom le suggère : Extraire des données d’applications et de bases de données de production (Fichier plat.Introduction 2 Rappel sur la Business Intelligence Avant de commencer. aux tableaux de bord. etc. quelles régions sont les plus lucratives. il est important de se demander ce qu’est un ETL. etc. Dotnet France Association . d’assembler de grosses quantités de données d’une base de données vers une autre.). que ce soit le directeur qui doit prendre des décisions mondiales pour son entreprise. Dans une période telle que la notre où l’information est primordiale. Business Intelligence(BI) peut se traduire par informatique décisionnelle. tel qu’un entrepôt de données et/ou des magasins de données. 2. Transformer ces données afin de les rassembler sous un même format exploitable par les outils d’analyse et de reporting. Transform. c’est un intergiciel (c’est-à-dire un logiciel qui interagit entre plusieurs applications) dont la fonction est de déplacer. Extraction puis transformation des données de l’entreprise provenant des applications et des bases de données transactionnelles vers les destinations créées précédemment. ou un sous-chef quelconque qui a besoin de savoir lequel de ses secteurs est le moins rentable. au datamining. quels marchés ne sont pas rentables. Elle apporte des aides aux sociétés sur les décisions qu’elles ont à prendre. nous allons faire un petit résumé de ce qu’est la Business Intelligence. Voici les principales fonctions de la BI : Conception d’une base de données de stockage. bases de données transactionnelles. des analyses très complexes sur les millions de données d’une entreprise permettent d’avoir une bonne vision de l’évolution de la société.1 ETL (Extract. Et bien. Load) Mais avant de s’attaquer à SQL Server Integration Services. la BI fournit un environnement d’aide à la décision très efficace si conçu de façon optimale. afin que vous ne soyez pas perdu dans la suite du cours. Excel. Exploitation de ces données grâce aux reporting services.

) Chargement Entrepôt de données Le schéma ci-dessus représente un processus d’ETL. puis transformées et enfin chargées dans une base de données de destination. Dotnet France Association . magasins de données. mais c’est également une fonction assez délicate à mettre en place en raison de la grande hétérogénéité des sources de données. Transformation Des données Extraction Sources des données (fichier plats. ici un entrepôt de données.5 - SSIS . etc.Introduction Charger ces données rafraichies et nettoyées dans des éléments de stockage permettant une exploitation décisionnelle : entrepôts de données. on voit que les données sont extraites des sources. etc. Il faut savoir que l’ETL représente plus de 60% de la réalisation d’une solution décisionnelle. SSIS (SQL Server Integration Services) est une fonctionnalité développée par Microsoft pour mettre en place des ETL à l’aide d’une interface graphique. OLTP.

Vous êtes maintenant sur l’espace de travail de SSIS que nous allons étudier plus en détail. Nous allons dans cette partie voir l’ensemble de ces outils.Introduction 3 L’espace de travail d’Integration Services Dans cette partie. rien de plus simple. SQL Server 2008 Integration services propose de nombreux éléments facilitant la création d’un processus d’ETL.1 Créer un projet Pour créer un nouveau projet. Choisissez un nom et un emplacement pour votre solution. La fonction SQL Server Integration Services n’est malheureusement pas disponible avec les versions express.6 SSIS . automatisé ou non. il suffit d’aller dans le menu Fichier puis Nouveau > projet. 3. Dotnet France Association . Afin de créer une solution d’intégration. nous allons découvrir l’environnement de travail de SSIS. vous devez possédez Visual studio et SQL Server 2008 pour avoir accès au Business Intelligence Development Studio. Sélectionnez Business Intelligence puis projet Integration Services.

1 L’environnement SSIS .1 L’explorateur de solutions L’explorateur de solutions présente l’arborescence de votre projet SSIS.7 3.Introduction SQL Server 2008 Integration Services dispose de nombreuses fonctionnalités permettant une prise en main intuitive comme nous allons le voir tout de suite. Dotnet France Association . Le dossier Divers stocke les fichiers tels que les images ou les documents. Les sources de données représentent des connexions qui peuvent être utilisées dans plusieurs packages.1.1. Les vues de sources de données sont des sousensembles des sources de données. elles peuvent être partagées par plusieurs packages. Les packages SSIS sont tout simplement les packages présents dans votre projet.1. Il vous permet ainsi de naviguer facilement au sein de vos solutions. 3.

2 La Fenêtre propriétés Cette fenêtre contient toutes les caractéristiques techniques de votre package.1. elles sont assez simples à comprendre. des éléments de flux de contrôle/données ainsi que des variables.1. de voir le contenu des différents gestionnaires et d’accéder aux variables et aux exécutables. comme vous pouvez le voir. son namespace.1. Pour les propriétés des packages.8 SSIS . on retrouve en bas de la fenêtre. on dispose de quatre onglets : Flux de contrôles.3 Les onglets et la boîte à outils Comme on le voit sur l’image ci-dessous. 3. En effet.1. elle contient de nombreuses autres fonctionnalités en réalité. l’ordinateur de création. *Ceci n’est qu’un extrait de la boîte à outils du flux de contrôle. l’explorateur de package. ses autorisations. etc… De plus. Le dernier. flux de données. une zone affichant une explication sur la propriété sélectionnée. une pour chacun des trois premiers onglets. Nous n’allons pas lister les propriétés de chaque élément de SSIS. mais également celles des connexions.* Dotnet France Association . Cet onglet ne nécessite donc pas d’outil particulier. il n’existe en fait pas une seule boîte à outils mais trois.Introduction 3. permet de naviguer dans le package. on retrouve la date de création. La boîte à outils est abordée dans cette partie car elle est intimement liée à ces onglets. gestionnaires d’événements et explorateur de package.

1. . Dotnet France Association . les transformations qu’elles vont subir. et ce pour chaque tâche de flux de données définie dans l’onglet flux de contrôle.1 Flux de contrôle Cet onglet permet de gérer les tâches et les éléments de contrôle que notre package devra exécuter. 3. . de notifications.Introduction Il est temps d’étudier plus en profondeur les onglets qui nous aideront grandement à réaliser nos solutions SSIS. et leurs destinations. La boîte à outils se divise en deux catégories : Tâche du flux de contrôle : Contient les boucles et les tâches nécessaires à la préparation de la transformation des données.Sources de flux de données : Sélectionner les sources des données à déplacer.2 Flux de données C’est au niveau de cet onglet que s’effectue la sélection des données à transférer. La boîte à outils de cet onglet se divise en trois catégories : .1. 3. Tâche du plan de maintenance : Contient les tâches de nettoyage (d’historique par exemple). de réorganisation.3.Transformation du flux de données : Sélection des transformations que l’on va appliquer aux données (Sur notre exemple. Elle représente les actions que le packages doit accomplir.1.1.Destination du flux de données : Choisir où les données transformées seront stockées.9 SSIS . de reconstruction. un simple tri).3.

3.Introduction Lorsque le package s’exécute.3 Gestionnaire d’événements SSIS . l’événement OnError qui se produit lorsqu’une erreur apparait. ou encore OnWarning lorsqu’un avertissement se produit. Les signifient que les caractéristiques des tâches n’ont pas encore été définis ou bien qu’il y eu une erreur durant la définition des propriétés de la tâche. Nous verrons plus en détail les sous-dossiers du package dans la suite du cours.4 Explorateur de package Cet onglet présente le package sous forme arborescente.1.10 3. Le gestionnaire d’événements permet donc de rendre nos packages plus performants en définissant des actions à accomplir lorsque des événements inattendus se produisent. Dotnet France Association . 3.3. On peut par exemple envoyer un mail au responsable lorsqu’une tâche ne parvient pas au terme de son exécution.1. les éléments qui le contiennent peuvent déclencher des événements. Par exemple.1.1.

Chaque erreur dispose d’une description afin de comprendre ce qu’il s’est passé.1.5 Liste d’erreurs et sortie La liste d’erreur est. % d’avancement.5 Résultats d’exécution SSIS .) 3. Etant donné le nombre assez conséquent de telles connexions (banques de données sources. etc.Introduction Cet onglet n’apparait qu’une fois le package exécuté.1.txt. Dotnet France Association .1.* 3. les tâches accomplies ou non. il est nécessaire d’avoir une interface pour les gérer. une liste des erreurs et des avertissements qui sont apparues durant l’exécution.3.). il répertorie les erreurs.11 3. C’est le rôle du Gestionnaire de connexions. tableaux Excel.1. comme vous l’avez compris.4 Gestionnaire de connexions Les packages créés avec SSIS ont besoin d’être connectés à divers éléments pour fonctionner. fichiers plats. ici des connexions à des fichiers Excel et . comme son nom l’indique. les événements et des informations de bases à propos de l’exécution (durée.1. *Le gestionnaire de connexions peut gérer de nombreuses connexions. etc.1.

Si des erreurs et/ou des avertissements se sont produits. elle nous indiquera sur quelles tâches cela est arrivé. Si tout se passe bien.12 SSIS .Introduction La sortie affiche le résultat de l’exécution du package. elle affichera plutôt quelque chose comme cela : Dotnet France Association .

13 SSIS . nous allons pouvoir attaquer le second chapitre « Mettre en place une solution SSIS » dans lequel nous allons apprendre à maîtriser Integration Services concrètement. Dotnet France Association .Introduction 4 Conclusion Vous connaissez maintenant tout l’espace de travail de SSIS.

Master your semester with Scribd & The New York Times

Special offer for students: Only $4.99/month.

Master your semester with Scribd & The New York Times

Cancel anytime.