Professional Documents
Culture Documents
Thibault Denizet
SSIS - Introduction
Sommaire
1 2
Introduction SQL Server 2008 Integration services ...................................................................... 3 Rappel sur la Business Intelligence.................................................................................................. 4 2.1 ETL (Extract, Transform, Load) ................................................................................................ 4
Lespace de travail dIntegration Services ....................................................................................... 6 3.1 Crer un projet ........................................................................................................................ 6 Lenvironnement ............................................................................................................. 7
3.1.1 4
Conclusion ..................................................................................................................................... 13
SSIS - Introduction
SSIS - Introduction
Conception dune base de donnes de stockage, tel quun entrept de donnes et/ou des magasins de donnes.
Extraction puis transformation des donnes de lentreprise provenant des applications et des bases de donnes transactionnelles vers les destinations cres prcdemment.
Exploitation de ces donnes grce aux reporting services, au datamining, aux outils OLAP, aux tableaux de bord.
5 -
SSIS - Introduction Charger ces donnes rafraichies et nettoyes dans des lments de stockage permettant une exploitation dcisionnelle : entrepts de donnes, magasins de donnes, etc.
Extraction
Sources des donnes (fichier plats, OLTP, etc.)
Chargement
Entrept de donnes
Le schma ci-dessus reprsente un processus dETL, on voit que les donnes sont extraites des sources, puis transformes et enfin charges dans une base de donnes de destination, ici un entrept de donnes. Il faut savoir que lETL reprsente plus de 60% de la ralisation dune solution dcisionnelle, mais cest galement une fonction assez dlicate mettre en place en raison de la grande htrognit des sources de donnes. SSIS (SQL Server Integration Services) est une fonctionnalit dveloppe par Microsoft pour mettre en place des ETL laide dune interface graphique.
SSIS - Introduction
Afin de crer une solution dintgration, vous devez possdez Visual studio et SQL Server 2008 pour avoir accs au Business Intelligence Development Studio. La fonction SQL Server Integration Services nest malheureusement pas disponible avec les versions express. SQL Server 2008 Integration services propose de nombreux lments facilitant la cration dun processus dETL, automatis ou non. Nous allons dans cette partie voir lensemble de ces outils.
3.1
Crer un projet
Pour crer un nouveau projet, rien de plus simple, il suffit daller dans le menu Fichier puis Nouveau > projet. Slectionnez Business Intelligence puis projet Integration Services. Choisissez un nom et un emplacement pour votre solution.
Vous tes maintenant sur lespace de travail de SSIS que nous allons tudier plus en dtail.
7 3.1.1 Lenvironnement
SSIS - Introduction
SQL Server 2008 Integration Services dispose de nombreuses fonctionnalits permettant une prise en main intuitive comme nous allons le voir tout de suite. 3.1.1.1 Lexplorateur de solutions Lexplorateur de solutions prsente larborescence de votre projet SSIS. Il vous permet ainsi de naviguer facilement au sein de vos solutions. Les sources de donnes reprsentent des connexions qui peuvent tre utilises dans plusieurs packages. Les vues de sources de donnes sont des sousensembles des sources de donnes, elles peuvent tre partages par plusieurs packages. Les packages SSIS sont tout simplement les packages prsents dans votre projet. Le dossier Divers stocke les fichiers tels que les images ou les documents.
SSIS - Introduction 3.1.1.2 La Fentre proprits Cette fentre contient toutes les caractristiques techniques de votre package, mais galement celles des connexions, des lments de flux de contrle/donnes ainsi que des variables. Pour les proprits des packages, comme vous pouvez le voir, on retrouve la date de cration, lordinateur de cration, ses autorisations, son namespace, etc De plus, on retrouve en bas de la fentre, une zone affichant une explication sur la proprit slectionne. Nous nallons pas lister les proprits de chaque lment de SSIS, elles sont assez simples comprendre.
3.1.1.3
Les onglets et la bote outils Comme on le voit sur limage ci-dessous, on dispose de quatre onglets : Flux de contrles, flux de donnes, gestionnaires dvnements et explorateur de package.
La bote outils est aborde dans cette partie car elle est intimement lie ces onglets. En effet, il nexiste en fait pas une seule bote outils mais trois, une pour chacun des trois premiers onglets. Le dernier, lexplorateur de package, permet de naviguer dans le package, de voir le contenu des diffrents gestionnaires et daccder aux variables et aux excutables. Cet onglet ne ncessite donc pas doutil particulier.
*Ceci nest quun extrait de la bote outils du flux de contrle, elle contient de nombreuses autres fonctionnalits en ralit.*
SSIS - Introduction
Il est temps dtudier plus en profondeur les onglets qui nous aideront grandement raliser nos solutions SSIS. 3.1.1.3.1 Flux de contrle Cet onglet permet de grer les tches et les lments de contrle que notre package devra excuter. Elle reprsente les actions que le packages doit accomplir.
La bote outils se divise en deux catgories : Tche du flux de contrle : Contient les boucles et les tches ncessaires la prparation de la transformation des donnes. Tche du plan de maintenance : Contient les tches de nettoyage (dhistorique par exemple), de reconstruction, de rorganisation, de notifications.
Cest au niveau de cet onglet que seffectue la slection des donnes transfrer, les transformations quelles vont subir, et leurs destinations, et ce pour chaque tche de flux de donnes dfinie dans longlet flux de contrle.
La bote outils de cet onglet se divise en trois catgories : - Sources de flux de donnes : Slectionner les sources des donnes dplacer. - Transformation du flux de donnes : Slection des transformations que lon va appliquer aux donnes (Sur notre exemple, un simple tri). - Destination du flux de donnes : Choisir o les donnes transformes seront stockes.
SSIS - Introduction
Lorsque le package sexcute, les lments qui le contiennent peuvent dclencher des vnements. Par exemple, lvnement OnError qui se produit lorsquune erreur apparait, ou encore OnWarning lorsquun avertissement se produit. On peut par exemple envoyer un mail au responsable lorsquune tche ne parvient pas au terme de son excution. Le gestionnaire dvnements permet donc de rendre nos packages plus performants en dfinissant des actions accomplir lorsque des vnements inattendus se produisent. Les signifient que les caractristiques des tches nont pas encore t dfinis ou bien quil y eu une erreur durant la dfinition des proprits de la tche. 3.1.1.3.4 Explorateur de package
Cet onglet prsente le package sous forme arborescente. Nous verrons plus en dtail les sous-dossiers du package dans la suite du cours.
SSIS - Introduction
Cet onglet napparait quune fois le package excut, il rpertorie les erreurs, les tches accomplies ou non, les vnements et des informations de bases propos de lexcution (dure, % davancement, etc.) 3.1.1.4 Gestionnaire de connexions
Les packages crs avec SSIS ont besoin dtre connects divers lments pour fonctionner. Etant donn le nombre assez consquent de telles connexions (banques de donnes sources, fichiers plats, tableaux Excel, etc.), il est ncessaire davoir une interface pour les grer. Cest le rle du Gestionnaire de connexions, comme son nom lindique.
*Le gestionnaire de connexions peut grer de nombreuses connexions, ici des connexions des fichiers Excel et .txt.* 3.1.1.5 Liste derreurs et sortie
La liste derreur est, comme vous lavez compris, une liste des erreurs et des avertissements qui sont apparues durant lexcution. Chaque erreur dispose dune description afin de comprendre ce quil sest pass.
12
SSIS - Introduction
La sortie affiche le rsultat de lexcution du package. Si des erreurs et/ou des avertissements se sont produits, elle nous indiquera sur quelles tches cela est arriv. Si tout se passe bien, elle affichera plutt quelque chose comme cela :
13
SSIS - Introduction
4 Conclusion
Vous connaissez maintenant tout lespace de travail de SSIS, nous allons pouvoir attaquer le second chapitre Mettre en place une solution SSIS dans lequel nous allons apprendre matriser Integration Services concrtement.