You are on page 1of 6

1

Les bases de donnes

Aujourdhui indispensables dans tous les systmes de gestion de linformation, les bases de donnes sont une volution logique de laugmentation de la demande de stockage de donnes.

Historique
Ds les dbuts de linformatique, lun des soucis majeurs de lutilisateur fut de pouvoir stocker massivement des donnes et de pouvoir en disposer rgulirement an den extraire de nouvelles informations, de les consulter et de les modier. De 1950 1960, seul existait le chier pour satisfaire cette demande. Les applications devaient donc tre compltes par une programmation qui se faisait souvent en langage machine (assembleur). RCA (Radio Corporation of America) proposa une machine spcialise pour rpondre ce besoin, le BIZMAC, commercialis en 1958. Au dbut des annes 60, larrive de COBOL (COmmon Business Oriented Language) permit de crer des structures de donnes hirarchises. Cest ce moment que le concept de base de donnes prit son essor et quapparurent les premiers systmes de gestion de bases de donnes. Comme ils fonctionnaient en relation troite avec COBOL, le modle de reprsentation des donnes tait calqu sur les structures de donnes de COBOL. Les bases de donnes hirarchiques taient nes.

SQL

Lun des premiers systmes de gestion de bases de donnes hirarchiques commercialiss fut IMS (Information Management System) dIBM, puis DL1 et Systme 2000. Grce aux langages plus modernes, permettant de manipuler les donnes de manire plus dynamique, avec, notamment, des pointeurs dadresse, les informaticiens mirent au point les bases de donnes dites "en rseau". Ce terme indique plus prcisment un modle de donnes organises en mailles, cest--dire de structures de donnes reprsentes par des nuds rejoints par des arcs orients. Le terme "rseau", assez impropre aujourdhui, aurait d tre remplac par graphe, mais on ne refait pas lhistoire... Ce modle est issu des travaux du CODASYL (Conference On DAta SYstem and Language) qui dbutrent en 1968. Les systmes commercialiss furent IDMS (Integrated Data Management System) dIBM, IDS (Integrated Data Store) dHoneywell, DBMS 10 de DEC ou encore SOCRATE de CII-Bull.
NOTE Cest une base de donnes IDS qui a t utilise pour la conqute spatiale amricaine dans le cadre du programme Apollo.

La quatrime volution est ne des remarquables travaux mathmatiques dun chercheur de la socit IBM : Edgar F. CODD. Celui-ci partit du principe que lon pouvait tablir entre les donnes des relations logiques de type "quivalence", "ngation", "infriorit" et mme des oprations comme la "jointure". Ce modle thorique, dit "modle relationnel", t lobjet dune communication en juin 1970 dans le journal ACM et dans le cadre du projet System/R. Les premires ralisations de systmes de gestion de bases de donnes relationnels quant elles ne furent entreprises quen 1974, titre exprimental (XRM dIBM), et dotes dun langage dinterrogation des donnes pousant les concepts de la thorie relationnelle (SEQUEL, Structured English QUEry Language Dr Donald Chamberlin). Lavantage de cette conception est la simplicit : les donnes stockes sont organises en tables (tableaux dont les colonnes sont htrognes et les lignes en accs direct grce un index ou "clef"). Cette organisation logique des donnes permet de saffranchir dune grande partie des problmes physiques lis au stockage.

Chapitre 1

Les bases de donnes

Toute lattention se reportait alors sur ltude du langage dinterrogation de la base de donnes. SEQUEL devint, dans une seconde version amliore, SEQUEL 2 et fut annonc par IBM sous le nom commercial de Sytem R. Le nom SEQUEL donn lorigine au langage dinterrogation fut en partie conserv, mais transform en SQL (Structured Query Langage) en 1976 parce que lacronyme SEQUEL constituait dj une marque. System R, premier systme de gestion de bases de donnes relationnel, introduit titre exprimental chez certains clients dIBM, permit dafner le langage dinterrogation des donnes et aboutit au produit SQL/DS. Hlas, IBM arrivait un peu tard, car dj, une petite socit du nom de "Relationnel Software Inc" avait doubl "big blue" en commercialisant un SGBDR dot du langage dinterrogation SQL. En loccurrence il sagissait du produit ORACLE. Finalement le SGBDR dIBM sortit en 1981 et une version diffrente, mais nanmoins prtendument compatible, vit le jour en 1983 avec, comme nom de code, DB2. En parallle, des universitaires de Californie, Michael STONEBRAKER et Eugene WONG, commencrent raliser titre exprimental un nouveau prototype au sein de la prestigieuse Berkeley University. Leur projet, adoptant des concepts un peu diffrents, fut baptis Ingres et le langage daccs QUEL. Avec quelques autres professeurs, ils formrent alors une socit Relational Technology Inc. et annoncrent, en 1981, la premire version commerciale de leur SGBDR. Une kyrielle de produits SQL rent ensuite leur apparition : DG/SQL (1984), SYBASE (1986), INFORMIX, RDB, UNIFY, etc. Lors de lavnement du micro-ordinateur, diffrents diteurs se penchrent de nouveau sur le problme des bases de donnes. IBM prit le parti de ne pas sen mler, jugeant quune base de donnes implante sur un micro-ordinateur ne prsentait pas dintrt (systmes individuels, faibles capacits de stockage...). Mais des diteurs plus novateurs se regrouprent an de mettre au point un assemblage de formats de chiers capable de rpondre facilement une structuration des donnes sous forme de "tables". A cette occasion, ils crrent le modle XBase bas sur des chiers ISAM (Indexed Sequential Access Method, chier squentiel accs index). Selon ce modle, chaque table est un chier et des chiers annexes viennent enrichir la structure de la table et des contraintes.

SQL

Ds lors, des produits spciques commencrent voir le jour. Le premier fut dBase dAshton Tate qui connut un succs immdiat. Mais dBase essuya les pltres et fut svrement concurrenc par des SGBD plus modernes comme RBase de Microrim, Paradox dAnsa, rachet trs tt par Borland, puis Corel, ou encore FoxBase (dnomm ensuite FoxPro), etc. Larrive de linterface graphique Windows de Microsoft conduisit les diteurs un double mouvement : adapter cette nouvelle interface les produits en mode caractre existant (ce fut le cas de Paradox de Borland puis de dBase et, nalement, de FoxPro) ou crer des SGBD ddis Windows (en particulier ACCESS de Microsoft ou APPROCH de Lotus). Le dernier n de ce type de SGBD est MySQL, produit "libre" faible intgrit, destin des volumes de donnes moyen et particulirement adapt la cration de sites Web dynamiques base de documents accessibles en lecture. Dautres langages dinterrogation ont vu le jour. Pour nen citer quun, notons QBE, systme mis au point concurremment SQL, mais qui na connu de succs que grce lintroduction de Paradox. QBE (Query By Example, interrogation par lexemple) a t invent par Moshe Zloof (IBM 1977) et mis en place ds la premire version de Paradox (1.0 pour DOS), en 1985, par ANSA Software, lditeur de Paradox. Pour interroger une table avec ce systme, il suft de proposer une image de la rponse (un "squelette" de table) et, par un mcanisme danalogie, QBE va rechercher les occurrences dans les tables qui correspondent aux diffrents critres tablis. Cependant, vous entendez parler de QBE bien souvent tort... En effet, la plupart des diteurs de SGBD et certains produits dextraction de donnes proposent une interface graphique permettant de construire visuellement des requtes SQL et sintitulent pompeusement QBE, alors que le langage invent par Zloof ny est nullement prsent !

Chapitre 1

Les bases de donnes

Vocabulaire de base
Voici une liste de termes ncessaire la comprhension des propos tenus dans cet ouvrage :
m

Base de donnes. Une base de donnes permet de structurer des donnes en relation les unes avec les autres (clients, factures, stock, etc.) pour les traiter en lots ou sparment, ou encore pour les archiver. SGBDR (Systme de gestion de bases de donnes relationnel). Ensemble de modules et despace de stockage informatique, logiciel, capable de traiter les donnes dune base de donnes. En gnral un SGBDR se compose dun moteur relationnel et dun espace de stockage. Le moteur relationnel doit tre capable dinsrer, de modier, de supprimer et dextraire des donnes, mais aussi dorganiser la structure de stockage des donnes en diffrentes composantes comme des tables, des index, des contraintes, etc. En anglais, cet acronyme est RDBMS (Relational Data Base Management System). SQL (Structured Query Langage, langage de requte structur). Lobjet essentiel de cet ouvrage ! Table. Ensemble de donnes relatives un mme concept. Table des clients, table des commandes (voir Figure 1.1).

Figure 1.1
La table client.db (Paradox).

10

SQL

Colonne. Elment vertical dans une table, reprsentant un ensemble de valeurs dun attribut. Colonne Nom de la table des clients, colonne Mode de paiement de la table des commandes (voir Figure 1.2).

Figure 1.2
La colonne CLI_PRENOM de la table client.db (Paradox).

NOTE Nous ne parlerons jamais de "champ" dans cet ouvrage. Le terme de champ dsigne laspect visuel de linformation contenue dans une colonne, lorsque la valeur de la colonne de la table est vue travers une interface graphique.

Ligne. Elment horizontal dans une table, reprsentant une numration des valeurs des diffrents attributs (colonnes) pour une mme rfrence (identiant) (voir Figure 1.3).

Figure 1.3
Une ligne de la table Client.db (Paradox).

You might also like