You are on page 1of 125

Universit´ de la M´diterran´e e e e Facult´ des Sciences de Luminy e

Le langage C
Licences Maths & Informatique – Master Math´matiques – Master C.C.I. e

Henri Garreta D´partement d’Informatique - LIF e

` TABLE DES MATIERES

` TABLE DES MATIERES

Table des mati`res e
´ e 1 El´ments de base 1.1 Structure g´n´rale d’un programme . . . . . . . e e 1.2 Consid´rations lexicales . . . . . . . . . . . . . e 1.2.1 Pr´sentation du texte du programme . . e 1.2.2 Mots-cl´s . . . . . . . . . . . . . . . . . e 1.2.3 Identificateurs . . . . . . . . . . . . . . 1.2.4 Op´rateurs . . . . . . . . . . . . . . . . e 1.3 Constantes litt´rales . . . . . . . . . . . . . . . e 1.3.1 Nombres entiers . . . . . . . . . . . . . 1.3.2 Nombres flottants . . . . . . . . . . . . 1.3.3 Caract`res et chaˆ e ınes de caract`res . . . e 1.3.4 Expressions constantes . . . . . . . . . . 1.4 Types fondamentaux . . . . . . . . . . . . . . . 1.4.1 Nombres entiers et caract`res . . . . . . e 1.4.2 Types ´num´r´s . . . . . . . . . . . . . e ee 1.4.3 Nombres flottants . . . . . . . . . . . . 1.5 Variables . . . . . . . . . . . . . . . . . . . . . 1.5.1 Syntaxe des d´clarations . . . . . . . . . e 1.5.2 Visibilit´ des variables . . . . . . . . . . e 1.5.3 Allocation et dur´e de vie des variables e 1.5.4 Initialisation des variables . . . . . . . . 1.5.5 Variables locales statiques . . . . . . . . 1.5.6 Variables critiques . . . . . . . . . . . . 1.5.7 Variables constantes et volatiles . . . . . 1.6 Variables, fonctions et compilation s´par´e . . . e e 1.6.1 Identificateurs publics et priv´s . . . . . e 1.6.2 D´claration d’objets externes . . . . . . e . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 5 5 5 6 6 6 7 7 7 7 8 9 9 11 11 11 11 12 13 13 14 14 15 15 15 16 18 18 18 19 19 19 20 21 21 22 22 22 23 23 24 24 25 27 28 28 29 30 31 31 32 33 34 34 34 34

2 Op´rateurs et expressions e 2.1 G´n´ralit´s . . . . . . . . . . . . . . . . . . . . . . e e e 2.1.1 Lvalue et rvalue . . . . . . . . . . . . . . . 2.1.2 Priorit´ des op´rateurs . . . . . . . . . . . . e e 2.2 Pr´sentation d´taill´e des op´rateurs . . . . . . . . e e e e 2.2.1 Appel de fonction () . . . . . . . . . . . . . 2.2.2 Indexation [] . . . . . . . . . . . . . . . . . 2.2.3 S´lection . . . . . . . . . . . . . . . . . . . e 2.2.4 S´lection dans un objet point´ -> . . . . . . e e 2.2.5 N´gation ! . . . . . . . . . . . . . . . . . . . e 2.2.6 Compl´ment ` 1 ~ . . . . . . . . . . . . . . e a 2.2.7 Les c´l`bres ++ et -- . . . . . . . . . . . . . ee 2.2.8 Moins unaire - . . . . . . . . . . . . . . . . 2.2.9 Indirection * . . . . . . . . . . . . . . . . . 2.2.10 Obtention de l’adresse & . . . . . . . . . . . 2.2.11 Op´rateur sizeof . . . . . . . . . . . . . . e 2.2.12 Conversion de type (“cast” operator) . . . . 2.2.13 Op´rateurs arithm´tiques . . . . . . . . . . e e 2.2.14 D´calages << >> . . . . . . . . . . . . . . . e 2.2.15 Comparaisons == != < <= > >= . . 2.2.16 Op´rateurs de bits & | ^ . . . . . . . . . . . e 2.2.17 Connecteurs logiques && et || . . . . . . . 2.2.18 Expression conditionnelle ? : . . . . . . . . 2.2.19 Affectation = . . . . . . . . . . . . . . . . . 2.2.20 Autres op´rateurs d’affectation += *= etc. e 2.2.21 L’op´rateur virgule , . . . . . . . . . . . . e 2.3 Autres remarques . . . . . . . . . . . . . . . . . . . 2.3.1 Les conversions usuelles . . . . . . . . . . . 2.3.2 L’ordre d’´valuation des expressions . . . . e 2.3.3 Les op´rations non abstraites . . . . . . . . e 2

c H. Garreta, 1988-2006

` TABLE DES MATIERES

` TABLE DES MATIERES

3 Instructions 3.1 Syntaxe . . . . . . . . . . . . . . . . . . . 3.2 Pr´sentation d´taill´e des instructions . . e e e 3.2.1 Blocs . . . . . . . . . . . . . . . . 3.2.2 Instruction-expression . . . . . . . 3.2.3 Etiquettes et instruction goto . . . 3.2.4 Instruction if...else... . . . . 3.2.5 Instructions while et do...while 3.2.6 Instruction for . . . . . . . . . . . 3.2.7 Instruction switch . . . . . . . . . 3.2.8 Instructions break et continue . 3.2.9 Instruction return . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

36 36 37 37 37 38 38 39 40 41 42 43 44 44 44 44 45 46 46 46 47 48 48 48 48 49 50 52 52 52 52 53 54 54 56 56 57 58 58 60 61 62 64 64 64 65 66 66 68 69 70 72 74 74 76 77 77 78 3

4 Fonctions 4.1 Syntaxe ANSI ou “avec prototype” . . . . . . 4.1.1 D´finition . . . . . . . . . . . . . . . . e 4.1.2 Type de la fonction et des arguments . 4.1.3 Appel des fonctions . . . . . . . . . . 4.1.4 D´claration “externe” d’une fonction . e 4.2 Syntaxe originale ou “sans prototype” . . . . 4.2.1 D´claration et d´finition . . . . . . . . e e 4.2.2 Appel . . . . . . . . . . . . . . . . . . 4.2.3 Coexistence des deux syntaxes . . . . 4.3 Arguments des fonctions . . . . . . . . . . . . 4.3.1 Passage des arguments . . . . . . . . . 4.3.2 Arguments de type tableau . . . . . . 4.3.3 Arguments par adresse . . . . . . . . . 4.3.4 Arguments en nombre variable . . . . 5 Objets structur´s e 5.1 Tableaux . . . . . . . . . . . . . . . . 5.1.1 Cas g´n´ral . . . . . . . . . . . e e 5.1.2 Initialisation des tableaux . . . 5.1.3 Chaˆ ınes de caract`res . . . . . e 5.2 Structures et unions . . . . . . . . . . 5.2.1 Structures . . . . . . . . . . . . 5.2.2 Unions . . . . . . . . . . . . . . 5.2.3 Champs de bits . . . . . . . . . 5.3 Enum´rations . . . . . . . . . . . . . . e 5.4 D´clarateurs complexes . . . . . . . . e 5.4.1 Cas des d´clarations . . . . . . e 5.4.2 Pointeurs et tableaux constants 5.4.3 La d´claration typedef . . . . e 5.4.4 Cas des types d´sincarn´s . . . e e

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . et volatils . . . . . . . . . . . .

6 Pointeurs 6.1 G´n´ralit´s . . . . . . . . . . . . . . . . . . . . . . . . . . . . e e e 6.1.1 D´claration et initialisation des pointeurs . . . . . . . e 6.1.2 Les pointeurs g´n´riques et le pointeur NULL . . . . . . e e 6.2 Les pointeurs et les tableaux . . . . . . . . . . . . . . . . . . 6.2.1 Arithm´tique des adresses, indirection et indexation . e 6.2.2 Tableaux dynamiques . . . . . . . . . . . . . . . . . . 6.2.3 Tableaux multidimensionnels . . . . . . . . . . . . . . 6.2.4 Tableaux multidimensionnels dynamiques . . . . . . . 6.2.5 Tableaux de chaˆ ınes de caract`res . . . . . . . . . . . e 6.2.6 Tableaux multidimensionnels formels . . . . . . . . . . 6.2.7 Tableaux non n´cessairement index´s ` partir de z´ro e e a e 6.2.8 Matrices non dynamiques de taille inconnue . . . . . . 6.3 Les adresses des fonctions . . . . . . . . . . . . . . . . . . . . 6.3.1 Les fonctions et leurs adresses . . . . . . . . . . . . . . 6.3.2 Fonctions formelles . . . . . . . . . . . . . . . . . . . .
c H. Garreta, 1988-2006

` TABLE DES MATIERES

` TABLE DES MATIERES

6.4

6.3.3 Tableaux de fonctions . 6.3.4 Flou artistique . . . . . Structures r´cursives . . . . . . e 6.4.1 D´claration . . . . . . . e 6.4.2 Exemple . . . . . . . . . 6.4.3 Structures mutuellement

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . r´cursives e

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

79 80 81 81 81 83 85 85 86 88 88 88 90 93 95 97 97 97 98 99 99 100 101 102 104 104 104 105 106 108 109 110 112 112 114 115 116 117 118 120 121 121 121

7 Entr´es-sorties e 7.1 Flots . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.1.1 Fonctions g´n´rales sur les flots . . . . . . . . . . . . . . . e e 7.1.2 Les unit´s standard d’entr´e-sortie . . . . . . . . . . . . . e e 7.2 Lecture et ´criture textuelles . . . . . . . . . . . . . . . . . . . . e 7.2.1 Lecture et ´criture de caract`res et de chaˆ e e ınes . . . . . . . 7.2.2 Ecriture avec format printf . . . . . . . . . . . . . . . . 7.2.3 Lecture avec format scanf . . . . . . . . . . . . . . . . . 7.2.4 A propos de la fonction scanf et des lectures interactives 7.2.5 Les variantes de printf et scanf . . . . . . . . . . . . . . 7.3 Op´rations en mode binaire . . . . . . . . . . . . . . . . . . . . . e 7.3.1 Lecture-´criture . . . . . . . . . . . . . . . . . . . . . . . . e 7.3.2 Positionnement dans les fichiers . . . . . . . . . . . . . . . 7.4 Exemples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.4.1 Fichiers “en vrac” . . . . . . . . . . . . . . . . . . . . . . 7.4.2 Fichiers binaires et fichiers de texte . . . . . . . . . . . . . 7.4.3 Fichiers en acc`s relatif . . . . . . . . . . . . . . . . . . . e 7.5 Les fichiers de bas niveau d’UNIX . . . . . . . . . . . . . . . . . 8 Autres ´l´ments du langage C ee 8.1 Le pr´processeur . . . . . . . . . . . . . . . . . . . . . e 8.1.1 Inclusion de fichiers . . . . . . . . . . . . . . . 8.1.2 D´finition et appel des “macros” . . . . . . . . e 8.1.3 Compilation conditionnelle . . . . . . . . . . . 8.2 La modularit´ de C . . . . . . . . . . . . . . . . . . . . e 8.2.1 Fichiers en-tˆte . . . . . . . . . . . . . . . . . . e 8.2.2 Exemple : stdio.h . . . . . . . . . . . . . . . . 8.3 Deux ou trois choses bien pratiques... . . . . . . . . . . 8.3.1 Les arguments du programme principal . . . . 8.3.2 Branchements hors fonction : setjmp.h . . . . 8.3.3 Interruptions : signal.h . . . . . . . . . . . . . 8.4 La biblioth`que standard . . . . . . . . . . . . . . . . e 8.4.1 Aide ` la mise au point : assert.h . . . . . . . a 8.4.2 Fonctions utilitaires : stdlib.h . . . . . . . . . 8.4.3 Traitement de chaˆ ınes : string.h . . . . . . . 8.4.4 Classification des caract`res : ctype.h . . . . . e 8.4.5 Fonctions math´matiques : math.h . . . . . . . e 8.4.6 Limites propres ` l’impl´mentation : limits.h, a e . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . float.h . . . . . . . . . . . . . . . . . .

Imprim´ le 12 d´cembre 2006 e e

Henri.Garreta@UnivMed.fr

4

c H. Garreta, 1988-2006

1

´ ´ ELEMENTS DE BASE

1
1.1

´ e El´ments de base
Structure g´n´rale d’un programme e e

La transformation d’un texte ´crit en langage C en un programme ex´cutable par l’ordinateur se fait en deux e e ´tapes : la compilation et l’´dition de liens. La compilation est la traduction des fonctions ´crites en C en des e e e proc´dures ´quivalentes ´crites dans un langage dont la machine peut ex´cuter les instructions. Le compilateur e e e e lit toujours un fichier, appel´ fichier source, et produit un fichier, dit fichier objet. e Chaque fichier objet est incomplet, insuffisant pour ˆtre ex´cut´, car il contient des appels de fonctions ou des e e e r´f´rences ` des variables qui ne sont pas d´finies dans le mˆme fichier. Par exemple, le premier programme que ee a e e vous ´crirez contiendra d´j` la fonction printf que vous n’aurez certainement pas ´crite vous-mˆme. L’´dition e ea e e e de liens est l’op´ration par laquelle plusieurs fichiers objets sont mis ensemble pour se compl´ter mutuellee e ment : un fichier apporte des d´finitions de fonctions et de variables auxquelles un autre fichier fait r´f´rence e ee et r´ciproquement. L’´diteur de liens (ou linker ) prend en entr´e plusieurs fichiers objets et biblioth`ques (une e e e e e vari´t´ particuli`re de fichiers objets) et produit un unique fichier ex´cutable. L’´diteur de liens est largement ee e e ind´pendant du langage de programmation utilis´ pour ´crire les fichiers sources, qui peuvent mˆme avoir ´t´ e e e e ee ´crits dans des langages diff´rents. e e Chaque fichier source entrant dans la composition d’un programme ex´cutable est fait d’une succession d’un e nombre quelconque d’´l´ments ind´pendants, qui sont : ee e – – – – – des des des des des directives pour le pr´processeur (lignes commen¸ant par #), e c constructions de types (struct, union, enum, typedef), d´clarations de variables et de fonctions externes, e d´finitions de variables et e d´finitions de fonctions. e

Seules les expressions des deux derni`res cat´gories font grossir le fichier objet : les d´finitions de fonce e e tions laissent leur traduction en langage machine, tandis que les d´finitions de variables se traduisent par des e r´servations d’espace, ´ventuellement garni de valeurs initiales. Les autres directives et d´clarations s’adressent e e e au compilateur et il n’en reste pas de trace lorsque la compilation est finie. En C on n’a donc pas une structure syntaxique englobant tout, comme la construction  Program ... end.  du langage Pascal ; un programme n’est qu’une collection de fonctions assortie d’un ensemble de variables globales. D’o` la question : par o` l’ex´cution doit-elle commencer ? La r`gle g´n´ralement suivie par l’´diteur u u e e e e e de liens est la suivante : parmi les fonctions donn´es il doit en exister une dont le nom est main. C’est par elle e que l’ex´cution commencera ; le lancement du programme ´quivaut ` l’appel de cette fonction par le syst`me e e a e d’exploitation. Notez bien que, ` part cela, main est une fonction comme les autres, sans aucune autre propri´t´ a ee sp´cifique ; en particulier, les variables internes ` main sont locales, tout comme celles des autres fonctions. e a Pour finir cette entr´e en mati`re, voici la version C du c´l`bre programme-qui-dit-bonjour, sans lequel on e e ee ne saurait commencer un cours de programmation1 : #include <stdio.h> int main() { printf("Bonjour\n"); return 0; }

1.2
1.2.1

Consid´rations lexicales e
Pr´sentation du texte du programme e

Le programmeur est maˆ ıtre de la disposition du texte du programme. Des blancs, des tabulations et des sauts ` la ligne peuvent ˆtre plac´s ` tout endroit o` cela ne coupe pas un identificateur, un nombre ou un a e e a u symbole compos´2 . e
1 Le programme montr´ ici est ´crit selon des r`gles strictes. En fait, la plupart des compilateurs acceptent que main soit d´clar´e e e e e e void au lieu de int, ou que ce type ne figure pas, et que l’instruction  return 0 ;  n’apparaisse pas explicitement. 2 N´anmoins, les directives pour le pr´processeur (cf. section 8.1) doivent comporter un # dans la premi`re position de la ligne. e e e Cela ne constitue pas une exception ` la r`gle donn´e ici, car le pr´processeur n’est pas le compilateur C et ne travaille pas sur la a e e e syntaxe du langage.

c H. Garreta, 1988-2006

5

1.2 Consid´rations lexicales e

´ ´ 1 ELEMENTS DE BASE

Les commentaires commencent par /* et se terminent par */ : /* Ce texte est un commentaire et sera donc ignor´ par le compilateur */ e Les commentaires ne peuvent pas ˆtre imbriqu´s : ´crit dans un programme, le texte  /* voici un grand e e e /* et un petit */ commentaire */  est erron´, car seul  /* voici un grand /* et un petit */  sera e vu comme un commentaire par le compilateur. Les langages C et C++ cohabitant dans la plupart des compilateurs actuels, ces derniers acceptent ´galement e comme commentaire tout texte compris entre le signe // et la fin de la ligne o` ce signe apparaˆ : u ıt // Ceci est un commentaire ` la mode C++. a Le caract`re anti-slash \ pr´c´dant imm´diatement un saut ` la ligne masque ce dernier : la ligne suivante e e e e a est consid´r´e comme devant ˆtre concat´n´e ` la ligne courante. Cela est vrai en toute circonstance, y compris ee e e e a a ` l’int´rieur d’une chaˆ de caract`res. Par exemple, le texte e ıne e message = "anti\ constitutionnellement"; est compris comme ceci :  message = "anti 1.2.2 Mots-cl´s e

constitutionnellement" ; 

Les mots suivants sont r´serv´s. Leur fonction est pr´vue par la syntaxe de C et ils ne peuvent pas ˆtre e e e e utilis´s dans un autre but : e auto double int struct 1.2.3 break else long switch case enum register typedef char extern return union const float short unsigned continue for signed void default goto sizeof volatile do if static while

Identificateurs

Un identificateur est une suite de lettres et chiffres contigus, dont le premier est une lettre. Lorsque seul le compilateur est concern´, c’est-`-dire lorsqu’il s’agit d’identificateurs dont la port´e est incluse dans un seul e a e fichier (nous dirons de tels identificateurs qu’ils sont priv´s) : e – en toute circonstance une lettre majuscule est tenue pour diff´rente de la lettre minuscule correspondante ; e – dans les identificateurs, le nombre de caract`res discriminants est au moins de 31. e Attention, lorsqu’il s’agit d’identificateurs externes, c’est-`-dire partag´s par plusieurs fichiers sources, il est a e possible que sur un syst`me particulier l’´diteur de liens sous-jacent soit trop rustique pour permettre le respect e e de ces deux prescriptions. Le caract`re (appel´  blanc soulign´ ) est consid´r´ comme une lettre ; il peut donc figurer ` n’importe e e e ee a quelle place dans un identificateur. Cependant, par convention un programmeur ne doit pas utiliser des identificateurs qui commencent par ce caract`re. Cela assure qu’il n’y aura jamais de conflit avec les noms introduits e (` travers les fichiers  .h ) pour les besoins des biblioth`ques, car ces noms commencent par un tel blanc a e soulign´. ♥ e 1.2.4 Op´rateurs e

Symboles simples : ( = ) , [ + ] . * ! / ~ % < | > & ? ^ :

Symboles compos´s : e -> ++ -<= >= == != && || << >> += -= *= /= %= <<= >>= |= &= ^= Tous ces symboles sont reconnus par le compilateur comme des op´rateurs. Il est interdit d’ins´rer des e e caract`res blancs ` l’int´rieur d’un symbole compos´. En outre, il est conseill´ d’encadrer par des blancs toute e a e e e utilisation d’un op´rateur. Dans certaines circonstances cette r`gle est plus qu’un conseil, car sa non-observance e e cr´e une expression ambigu¨. e e 6
c H. Garreta, 1988-2006

1

´ ´ ELEMENTS DE BASE

1.3

Constantes litt´rales e

1.3
1.3.1

Constantes litt´rales e
Nombres entiers

Les constantes litt´rales num´riques enti`res ou r´elles suivent les conventions habituelles, avec quelques e e e e particularit´s. e Les constantes litt´rales sont sans signe : l’expression −123 est comprise comme l’application de l’op´rateur e e unaire − ` la constante 123 ; mais puisque le calcul est fait pendant la compilation, cette subtilit´ n’a aucune a e cons´quence pour le programmeur. Notez aussi qu’en C original, comme il n’existe pas d’op´rateur + unaire, la e e notation +123 est interdite. Les constantes litt´rales enti`res peuvent aussi s’´crire en octal et en hexad´cimal : e e e e – une constante ´crite en octal (base 8) commence par 0 (z´ro) ; e e – une constante ´crite en hexad´cimal (base 16) commence par 0x ou 0X. e e Voici par exemple trois mani`res d’´crire le mˆme nombre : e e e 27 033 0x1B D´tail ` retenir : on ne doit pas ´crire de z´ro non significatif ` gauche d’un nombre : 0123 ne repr´sente e a e e a e pas la mˆme valeur que 123. e Le type d’une constante enti`re est le plus petit type dans lequel sa valeur peut ˆtre repr´sent´e. Ou, plus e e e e exactement : – si elle est d´cimale : si possible int, sinon long, sinon unsigned long ; e – si elle est octale ou hexad´cimale : si possible int, sinon unsigned int, sinon unsigned long. e Certains suffixes permettent de changer cette classification : – U, u : indique que la constante est d’un type unsigned ; – L, l : indique que la constante est d’un type long. Exemples : 1L, 0x7FFFU. On peut combiner ces deux suffixes : 16UL.

1.3.2

Nombres flottants

Une constante litt´rale est l’expression d’un nombre flottant si elle pr´sente, dans l’ordre : e e – une suite de chiffres d´cimaux (la partie enti`re), e e – un point, qui joue le rˆle de virgule d´cimale, o e – une suite de chiffres d´cimaux (la partie fractionnaire), e – une des deux lettres E ou e, – ´ventuellement un signe + ou -, e – une suite de chiffres d´cimaux. e Les trois derniers ´l´ments forment l’exposant. Exemple : 123.456E-78. ee On peut omettre : – la partie enti`re ou la partie fractionnaire, mais pas les deux, e – le point ou l’exposant, mais pas les deux. Exemples : .5e7, 5.e6, 5000000., 5e6 Une constante flottante est suppos´e de type double, ` moins de comporter un suffixe explicite : e a – les suffixes F ou f indiquent qu’elle est du type float ; – les suffixes L ou l indiquent qu’elle est du type long double. Exemples : 1.0L, 5.0e4f

1.3.3

Caract`res et chaˆ e ınes de caract`res e

Une constante de type caract`re se note en ´crivant le caract`re entre apostrophes. Une constante de type e e e chaˆ de caract`res se note en ´crivant ses caract`res entre guillemets. Exemples, trois caract`res : ıne e e e e ’A’ "A" ’2’ ’"’ "" "’" Quatre chaˆ ınes de caract`res : e "Bonjour ` tous !" a On peut faire figurer n’importe quel caract`re, mˆme non imprimable, dans une constante caract`re ou e e e chaˆ de caract`res en utilisant les combinaisons suivantes, appel´es s´quences d’´chappement : ıne e e e e
c H. Garreta, 1988-2006

7

1.3 Constantes litt´rales e

´ ´ 1 ELEMENTS DE BASE

\n \t \b \r \f \a \\ ’ " \d3 d2 d1

nouvelle ligne (LF) tabulation (HT) espace-arri`re (BS) e retour-chariot (CR) saut de page (FF) signal sonore (BELL) \ ’ " le caract`re qui a pour code le nombre octal d3 d2 d1 . S’il commence par un ou deux z´ros e e et si cela ne cr´e pas une ambigu¨ e, on peut aussi le noter \d2 d1 ou \d1 e ıt´

Par exemple, la chaˆ suivante d´finit la suite des 9 caract`res3 A, escape (de code ASCII 27), B, ”, C, saut ıne e e de page, D, \ et E : "A\033B\"C\fD\\E" Une constante de type caract`re appartient au type char, c’est-`-dire entier repr´sent´ sur un octet. La e a e e valeur d’une constante caract`re est le nombre qui repr´sente le caract`re de mani`re interne ; de nos jours il e e e e s’agit presque toujours du code ASCII4 . Une constante de type chaˆ de caract`res repr´sente une suite finie de caract`res, de longueur quelconque. ıne e e e Le codage interne d’une chaˆ de caract`res est le suivant (voyez la figure 1) : ıne e – les caract`res constituant la chaˆ sont rang´s en m´moire, de mani`re contigu¨, dans l’ordre o` ils e ıne e e e e u figurent dans la chaˆ ; ıne – un caract`re nul est ajout´ imm´diatement apr`s le dernier caract`re de la chaˆ pour en indiquer la fin ; e e e e e ıne, – la constante chaˆ repr´sente alors, ` l’endroit o` elle est ´crite, l’adresse de la cellule o` a ´t´ rang´ le ıne e a u e u ee e premier caract`re de la chaˆ e ıne.

"Bonjour" B o n j o u r\ 0
Fig. 1 – Repr´sentation de la chaˆ "Bonjour" e ıne Par cons´quent, une constante chaˆ de caract`res a pour type celui d’un tableau de caract`res (c’est-`-dire e ıne e e a  char[] ) et pour valeur l’adresse d’une cellule de la m´moire. e Par caract`re nul on entend le caract`re dont le code interne est 0 ; on peut le noter indiff´remment 0, ’\000’ e e e ou ’\0’ (mais certainement pas ’0’) ; il est utilis´ tr`s fr´quemment en C. Notez que, dans une expression, e e e ’\0’ est toujours interchangeable avec 0. 1.3.4 Expressions constantes

Une expression constante est une expression de l’un des types suivants : – toute constante litt´rale ; exemples : 1, ’A’, "HELLO", 1.5e-2 ; e – une expression correcte form´e par l’application d’un op´rateur courant (arithm´tique, logique, etc.) ` une e e e a ou deux expressions constantes ; exemples : -1, ’A’ - ’a’, 2 * 3.14159265, "HELLO" + 6 ; e e e – l’expression constitu´e par l’application de l’op´rateur & (op´rateur de calcul de l’adresse, voyez la section 2.2.10) ` une variable statique, ` un champ d’une variable statique de type structure ou ` un ´l´ment a a a ee d’un tableau statique dont le rang est donn´ par une expression constante ; exemples : &x, &fiche.nom, e &table[50] ; e e a – l’expression constitu´e par l’application de l’op´rateur sizeof ` un descripteur de type. Exemples : sizeof(int), sizeof(char *) ; e e a – l’expression constitu´e par l’application de l’op´rateur sizeof ` une expression quelconque, qui ne sera pas ´valu´e ; exemples : sizeof x, sizeof(2 * x + 3). e e Les expressions constantes peuvent ˆtre ´valu´es pendant la compilation. Cela est fait ` titre facultatif par e e e a les compilateurs de certains langages. En C ce n’est pas facultatif : il est garanti que toute expression constante (et donc toute sous-expression constante d’une expression quelconque) sera effectivement ´valu´e avant que e e
3 Nous 4 En

verrons qu’en fait cette chaˆ comporte un caract`re de plus qui en marque la fin. ıne e standard le langage C ne pr´voit pas le codage Unicode des caract`res. e e

8

c H. Garreta, 1988-2006

1

´ ´ ELEMENTS DE BASE

1.4

Types fondamentaux

l’ex´cution ne commence. En termes de temps d’ex´cution, l’´valuation des expressions constantes est donc e e e enti`rement  gratuite . e

1.4

Types fondamentaux
Types de base Nombres entiers Anonymes Petite taille – sign´s e – non sign´s e Taille moyenne – sign´s e – non sign´s e Grande taille – sign´s e – non sign´s e Nomm´s e Nombres flottants Simples Grande pr´cision e Pr´cision encore plus grande e ´ ´ Types derives Tableaux Fonctions Pointeurs Structures Unions

char unsigned char short unsigned short long unsigned long enum float double long double

[ ] ( ) * struct union Tab. 1 – Les types du langage C

Le tableau 1 pr´sente l’ensemble des types connus du compilateur C. L’organisation g´n´rale de cet ensemble e e e est ´vidente : on dispose de deux sortes de types de base, les nombres entiers et les nombres flottants, et d’une e famille infinie de types d´riv´s obtenus en appliquant quelques proc´d´s r´cursifs de construction soit ` des e e e e e a types fondamentaux soit ` des types d´riv´s d´finis de la mˆme mani`re. a e e e e e Cette organisation r´v`le un trait de l’esprit de C : le pragmatisme l’emporte sur l’esth´tisme, parfois mˆme e e e e sur la rigueur. Dans d’autres langages, les caract`res, les bool´ens, les constantes symboliques, etc., sont cod´s e e e de mani`re interne par des nombres, mais ce fait est officiellement ignor´ par le programmeur, qui reste oblig´ e e e de consid´rer ces donn´es comme appartenant ` des ensembles disjoints. En C on a fait le choix oppos´, laissant e e a e au programmeur le soin de r´aliser lui-mˆme, ` l’aide des seuls types num´riques, l’implantation des types de e e a e niveau sup´rieur. e 1.4.1 Nombres entiers et caract`res e

La classification des types num´riques ob´it ` deux crit`res : e e a e a e e – Si on cherche ` repr´senter un ensemble de nombres tous positifs on pourra adopter un type non sign´ ; au contraire si on doit repr´senter un ensemble contenant des nombres positifs et des nombres n´gatifs on e e devra utiliser un type sign´ 5 . e – Le deuxi`me crit`re de classification des donn´es num´riques est la taille requise par leur repr´sentation. e e e e e Comme pr´c´demment, c’est un attribut d’un ensemble, et donc d’une variable devant repr´senter tout e e e ´l´ment de l’ensemble, non d’une valeur particuli`re. Par exemple, le nombre 123 consid´r´ comme un ee e ee ´l´ment de l’ensemble {0 ... 65535} est plus encombrant que le mˆme nombre 123 quand il est consid´r´ ee e ee comme un ´l´ment de l’ensemble {0 ... 255}. ee
5 On dit parfois qu’une donn´e  est un entier sign´  ou  est un entier non sign´ . C’est un abus de langage : le caract`re sign´ e e e e e ou non sign´ n’est pas un attribut d’un nombre (un nombre donn´ est positif ou n´gatif, c’est tout) mais de l’ensemble de nombres e e e qu’on a choisi de consid´rer et, par extension, de toute variable cens´e pouvoir repr´senter n’importe quelle valeur de cet ensemble. e e e

c H. Garreta, 1988-2006

9

1.4 Types fondamentaux

´ ´ 1 ELEMENTS DE BASE

Avec N chiffres binaires (ou bits) on peut repr´senter : e – soit les 2N nombres positifs 0, 1, ... 2N − 1 (cas non sign´) ; e – soit les 2N nombres positifs et n´gatifs −2N −1 , ... 2N −1 − 1 (cas sign´). e e De plus, la repr´sentation sign´e et la repr´sentation non sign´e des ´l´ments communs aux deux domaines e e e e ee (les nombres 0, 1, ... 2N −1 − 1) co¨ ıncident. ` Le type caractere. Un objet de type char peut ˆtre d´fini, au choix, comme e e – un nombre entier pouvant repr´senter n’importe quel caract`re du jeu de caract`res de la machine utilis´e ; e e e e – un nombre entier occupant la plus petite cellule de m´moire adressable s´par´ment6 . Sur les machines e e e actuelles les plus r´pandues cela signifie g´n´ralement un octet (8 bits). e e e Le plus souvent, un char est un entier sign´ ; un unsigned char est alors un entier non sign´. Lorsque les e e char sont par d´faut non sign´s, la norme ANSI pr´voit la possibilit´ de d´clarer des signed char. e e e e e On notera que la signification d’un char en C, un entier petit, est tr`s diff´rente de celle d’un char en Pascal e e (dans ce langage, l’ensemble des caract`res et celui des nombres sont disjoints). En C, ch ´tant une variable de e e type char, rien ne s’oppose ` l’´criture de l’expression ch - ’A’ + 32 qui est tout ` fait homog`ne, puisque a e a e enti`rement faite de nombres. e ` Le caractere  impossible . Toutes les valeurs qu’il est possible de ranger dans une variable de type char sont en principe des caract`res l´gaux. Or la plupart des programmes qui lisent des caract`res doivent e e e ˆtre capables de manipuler une valeur suppl´mentaire, distincte de tous les  vrais  caract`res, signifiant  la e e e fin des donn´es . Pour cette raison, les variables et fonctions qui repr´sentent ou renvoient des caract`res sont e e e souvent d´clar´es int, non char : n’importe quelle valeur appartenant au type int mais n’appartenant pas au e e type char peut alors servir d’indicateur de fin de donn´es. Par exemple, une telle valeur est d´finie dans le e e fichier stdio.h, c’est la constante symbolique EOF. Les entiers courts et longs. Il est garanti que toute donn´e repr´sentable dans le type short est e e repr´sentable aussi dans le type long7 (en bref : un long n’est pas plus court qu’un short !), mais la taille e exacte des donn´es de ces types n’est pas fix´e par la norme du langage. e e De nos jours on trouve souvent : unsigned short : 16 bits short : 16 bits unsigned long : 32 bits long : 32 bits pour pour pour pour repr´senter e repr´senter e repr´senter e repr´senter e un un un un nombre entier compris entre 0 et 65.535 nombre entier compris entre -32.768 et 32.767 nombre entier entre 0 et 4.294.967.296 entier entre -2.147.483.648 et 2.147.483.647

Le type int. En principe, le type int correspond ` la taille d’entier la plus efficace, c’est-`-dire la plus a a adapt´e ` la machine utilis´e. Sur certains syst`mes et compilateurs int est synonyme de short, sur d’autres il e a e e est synonyme de long. Le type int peut donc poser un probl`me de portabilit´8 : le mˆme programme, compil´ sur deux machines e e e e distinctes, peut avoir des comportements diff´rents. D’o` un conseil important : n’utilisez le type int que pour e u des variables locales destin´es ` contenir des valeurs raisonnablement petites (inf´rieures en valeur absolue ` e a e a 32767) . Dans les autres cas il vaut mieux expliciter char, short ou long selon le besoin. ´ A propos des booleens. En C il n’existe donc pas de type bool´en sp´cifique. Il faut savoir qu’` tout e e a endroit o` une expression bool´enne est requise (typiquement, dans des instructions comme if ou while) on u e peut faire figurer n’importe quelle expression ; elle sera tenue pour vraie si elle est non nulle, elle sera consid´r´e ee fausse sinon. Ainsi, dans un contexte conditionnel, expr (c’est-`-dire expr  vraie ) ´quivaut ` a e a expr != 0 (expr diff´rente de 0). Inversement, lorsqu’un op´rateur (´galit´, comparaison, etc.) produit une valeur bool´enne, e e e e e
6 A retenir : un objet de type char est  unitaire  aussi bien du point de vue des tailles que de celui des adresses. Quelle que soit la machine utilis´e, le compilateur C fera en sorte que le programmeur voie ces objets de la mani`re suivante : si t est un tableau e e de char, la taille (au sens de l’op´rateur sizeof, cf. section 2.2.11) de t[0] vaut une unit´ de taille, et l’´cart entre les adresses de e e e t[1] et t[0] vaut une unit´ d’adressage. On peut dire que ces propri´t´s d´finissent le type char (ou, si vous pr´f´rez, les unit´s de e e e e ee e taille et d’adressage). 7 Si on consid`re un type comme l’ensemble de ses valeurs, on a donc les inclusions larges char ⊆ short ⊆ long (et aussi float e ⊆ double ⊆ long double). 8 Un programme ´crit pour une machine ou un syst`me A est dit portable s’il suffit de le recompiler pour qu’il tourne correctement e e sur une machine diff´rente B. Par exemple,  putchar(’A’) ;  est une mani`re portable d’obtenir l’affichage du caract`re A, tandis e e e que  putchar(65) ;  est (sur un syst`me utilisant le code ASCII) une mani`re non portable d’obtenir le mˆme affichage. Etre e e e portable est un crit`re de qualit´ et de fiabilit´ important. On invoque l’efficacit´ pour justifier l’´criture de programmes non e e e e e portables ; l’exp´rience prouve que, lorsque son ´criture est possible, un programme portable est toujours meilleur qu’un programme e e non portable pr´tendu ´quivalent. e e

10

c H. Garreta, 1988-2006

1

´ ´ ELEMENTS DE BASE

1.5

Variables

il rend 0 pour faux et 1 pour vrai. Signalons aux esth`tes que le fichier <types.h> comporte les d´clarations : e e enum { false, true }; typedef unsigned char Boolean; qui introduisent la constante false valant 0, la constante true valant 1 et le type Boolean comme le type le moins encombrant dans lequel on peut repr´senter ces deux valeurs. e 1.4.2 Types ´num´r´s e e e

Un type ´num´r´, ou ´num´ration, est constitu´ par une famille finie de nombres entiers, chacun associ´ e ee e e e e a ` un identificateur qui en est le nom. Mis ` part ce qui touche ` la syntaxe de leur d´claration, il n’y a pas a a e grand-chose ` dire ` leur sujet. La syntaxe de la d´claration des ´num´rations est expliqu´e ` la section 5.3. Par a a e e e e a exemple, l’´nonc´ : e e enum jour_semaine { lundi, mardi, mercredi, jeudi, vendredi, samedi, dimanche }; introduit un type ´num´r´, appel´ enum jour semaine, constitu´ par les constantes lundi valant 0, mardi e ee e e valant 1, mercredi valant 2, etc. Ainsi, les expressions mardi + 2 et jeudi repr´sentent la mˆme valeur. e e Les valeurs d’un type ´num´r´ se comportent comme des constantes enti`res ; elles font donc double emploi e ee e avec celles qu’on d´finit ` l’aide de #define (cf. section 8.1.2). Leur unique avantage r´side dans le fait que e a e certains compilateurs d´tectent parfois, mais ce n’est pas exig´ par la norme, les m´langes entre objets de types e e e ´num´r´s distincts ; ces types sont alors le moyen d’augmenter la s´curit´ des programmes. e ee e e A propos des types ´num´r´s voyez aussi la section 5.3. e ee 1.4.3 Nombres flottants

La norme ANSI pr´voit trois types de nombres flottants : float (simple pr´cision), double (double pr´cision) e e e et long double (pr´cision ´tendue). La norme ne sp´cifie pas les caract´ristiques de tous ces types. Il est garanti e e e e que toute valeur repr´sentable dans le type float est repr´sentable sans perte d’information dans le type double, e e et toute valeur repr´sentable dans le type double l’est dans le type long double. e Typiquement, sur des syst`mes de taille moyenne, un float occupe 32 bits et un double 64, ce qui donne e par exemple des float allant de -1.70E38 ` -0.29E-38 et de 0.29E-38 ` 1.70E38 avec 7 chiffres d´cimaux a a e significatifs, et des double allant de -0.90E308 ` -0.56E-308 et de 0.56E-308 ` 0.90E308 avec 15 chiffres a a d´cimaux significatifs. e Les long double correspondent g´n´ralement aux flottants de grande pr´cision manipul´s par certains e e e e coprocesseurs arithm´tiques ou les biblioth`ques de sous-programmes qui les simulent. Mais il n’est pas exclu e e que sur un syst`me particulier un long double soit la mˆme chose qu’un double. e e

1.5
1.5.1

Variables
Syntaxe des d´clarations e

La forme compl`te de la d´claration d’une variable sera expliqu´e ` la section 5.4. Dans le cas le plus simple e e e a on trouve sp´cification var-init , var-init , ... var-init ; e o` sp´cification est de la forme : u e  auto     register  static   extern    rien et chaque var-init est de la forme : identificateur = expression rien 11        unsigned   char     short   signed  const       long  rien  volatile int     rien float        double    long double                                

c H. Garreta, 1988-2006

1.5 Variables

´ ´ 1 ELEMENTS DE BASE

Exemples : int x, y = 0, z; extern float a, b; static unsigned short cpt = 1000; Les d´clarations de variables peuvent se trouver : e – en dehors de toute fonction, il s’agit alors de variables globales ; – ` l’int´rieur d’un bloc, il s’agit alors de variables locales ; a e – dans l’en-tˆte d’une fonction, il s’agit alors d’arguments formels, plac´s e e – soit dans les parenth`ses de l’en-tˆte (fonction d´finie en syntaxe ANSI avec un prototype), e e e – soit entre le nom de la fonction et le { initial (fonction d´finie en syntaxe originale ou sans prototype). e Exemple. Avec prototype : long i = 1; int une_fonction(int j) { short k; ... } Sans prototype : long i = 1; int une_fonction(j) int j; { short k; ... } Ci-dessus, i est une variable globale, k une variable locale et j un argument formel de une fonction. 1.5.2 Visibilit´ des variables e

La question de la visibilit´ des identificateurs (c’est-`-dire  quels sont les identificateurs auxquels on peut e a faire r´f´rence en un point d’un programme ? ) est r´gl´e en C comme dans la plupart des langages comportant ee e e la structure de bloc, avec une simplification : les fonctions ne peuvent pas ˆtre imbriqu´es les unes dans les e e autres, et une complication : tout bloc peut comporter ses propres d´finitions de variables locales. e Un bloc est une suite de d´clarations et d’instructions encadr´e par une accolade ouvrante “{” et l’accolade e e fermante “}” correspondante. Le corps d’une fonction est lui-mˆme un bloc, mais d’autres blocs peuvent ˆtre e e imbriqu´s dans celui-l`. e a Variables locales. Tout bloc peut comporter un ensemble de d´clarations de variables, qui sont alors e dites locales au bloc en question. Une variable locale ne peut ˆtre r´f´renc´e que depuis l’int´rieur du bloc o` e ee e e u elle est d´finie ; en aucun cas on ne peut y faire r´f´rence depuis un point ext´rieur ` ce bloc. Dans le bloc o` il e ee e a u est d´clar´, le nom d’une variable locale masque toute variable de mˆme nom d´finie dans un bloc englobant le e e e e bloc en question. Toutes les d´clarations de variables locales ` un bloc doivent ˆtre ´crites au d´but du bloc, avant la premi`re e a e e e e instruction. Arguments formels. Pour ce qui concerne leur visibilit´, les arguments formels des fonctions sont consid´r´s e ee comme des variables locales du niveau le plus haut, c’est-`-dire des variables d´clar´es au d´but du bloc le plus a e e e ext´rieur9 . Un argument formel est accessible de l’int´rieur de la fonction, partout o` une variable locale plus e e u profonde ne le masque pas. En aucun cas on ne peut y faire r´f´rence depuis l’ext´rieur de la fonction. ee e Variables globales. Le nom d’une variable globale ou d’une fonction peut ˆtre utilis´ depuis n’importe e e quel point compris entre sa d´claration (pour une fonction : la fin de la d´claration de son en-tˆte) et la fin e e e du fichier o` la d´claration figure, sous r´serve de ne pas ˆtre masqu´e par une variable locale ou un argument u e e e e formel de mˆme nom. e La question de la visibilit´ inter-fichiers est examin´e ` la section 1.6. On peut noter d’ores et d´j` qu’elle ne e e a ea se pose que pour les variables globales et les fonctions, et qu’elle concerne l’´dition de liens, non la compilation, e
9 Par

cons´quent, on ne doit pas d´clarer un argument formel et une variable locale du niveau le plus haut avec le mˆme nom. e e e

12

c H. Garreta, 1988-2006

1

´ ´ ELEMENTS DE BASE

1.5

Variables

car le compilateur ne traduit qu’un fichier source ` la fois et, pendant la traduction d’un fichier, il ne  voit  a pas les autres.

1.5.3

Allocation et dur´e de vie des variables e

Les variables globales sont toujours statiques, c’est-`-dire permanentes : elles existent pendant toute la a dur´e de l’ex´cution. Le syst`me d’exploitation se charge, imm´diatement avant l’activation du programme, de e e e e les allouer dans un espace m´moire de taille ad´quate, ´ventuellement garni de valeurs initiales. e e e A l’oppos´, les variables locales et les arguments formels des fonctions sont automatiques : l’espace correse pondant est allou´ lors de l’activation de la fonction ou du bloc en question et il est rendu au syst`me lorsque e e le contrˆle quitte cette fonction ou ce bloc. Certains qualifieurs (static, register, voir les sections 1.5.5 et o 1.5.6) permettent de modifier l’allocation et la dur´e de vie des variables locales. e Remarque. On note une grande similitude entre les variables locales et les arguments formels des fonctions : ils ont la mˆme visibilit´ et la mˆme dur´e de vie. En r´alit´ c’est presque la mˆme chose : les arguments formels e e e e e e e sont de vraies variables locales avec l’unique particularit´ d’ˆtre automatiquement initialis´s (par les valeurs des e e e arguments effectifs) lors de l’activation de la fonction.

1.5.4

Initialisation des variables

Variables statiques. En toute circonstance la d´claration d’une variable statique peut indiquer une valeur e initiale ` ranger dans la variable. Cela est vrai y compris pour des variables de types complexes (tableaux ou a structures). Exemple : double x = 0.5e3; int t[5] = { 11, 22, 33, 44, 55 }; Bien que la syntaxe soit analogue, une telle initialisation n’a rien en commun avec une affectation comme celles qui sont faites durant l’ex´cution du programme. Il s’agit ici uniquement de pr´ciser la valeur qui doit e e ˆtre d´pos´e dans l’espace allou´ ` la variable, avant que l’ex´cution ne commence. Par cons´quent : e e e ea e e – la valeur initiale doit ˆtre d´finie par une expression constante (calculable durant la compilation) ; e e – une telle initialisation est enti`rement gratuite, elle n’a aucune incidence ni sur la taille ni sur la dur´e du e e programme ex´cutable produit. e Les variables statiques pour lesquelles aucune valeur initiale n’est indiqu´e sont remplies de z´ros. L’ine e terpr´tation de ces z´ros d´pend du type de la variable. e e e Variables automatiques. Les arguments formels des fonctions sont automatiquement initialis´s lors de e leur cr´ation (au moment de l’appel de la fonction) par les valeurs des arguments effectifs. Cela est la d´finition e e mˆme des arguments des fonctions. e La d´claration d’une variable locale peut elle aussi comporter une initialisation. Mais il ne s’agit pas de la e mˆme sorte d’initialisation que pour les variables statiques : l’initialisation repr´sente ici une affectation tout ` e e a fait ordinaire. Ainsi, plac´e ` l’int´rieur d’un bloc, la construction e a e int i = exp; ´quivaut au couple e int i; ... i = exp ; /* d´claration */ e /* affectation */ /* d´claration + initialisation */ e

Par cons´quent : e – l’expression qui donne la valeur initiale n’a pas ` ˆtre constante, puisqu’elle est ´valu´e ` l’ex´cution, a e e e a e chaque fois que la fonction ou le bloc est activ´ ; e u e a – une telle initialisation  coˆte  le mˆme prix que l’affectation correspondante, c’est-`-dire le temps d’´valuation de l’expression qui d´finit la valeur initiale. e e Les variables automatiques pour lesquelles aucune valeur initiale n’est indiqu´e sont allou´es avec une valeur e e impr´visible. e Remarque. Dans le C original, une variable automatique ne peut ˆtre initialis´e que si elle est simple e e (c’est-`-dire autre que tableau ou structure). Cette limitation ne fait pas partie du C ANSI. a
c H. Garreta, 1988-2006

13

1.5 Variables

´ ´ 1 ELEMENTS DE BASE

1.5.5

Variables locales statiques

Le qualifieur static, plac´ devant la d´claration d’une variable locale, produit une variable qui est e e – pour sa visibilit´, locale ; e – pour sa dur´e de vie, statique (c’est-`-dire permanente). e a Elle n’est accessible que depuis l’int´rieur du bloc o` elle est d´clar´e, mais elle est cr´´e au d´but de e u e e ee e l’activation du programme et elle existe aussi longtemps que dure l’ex´cution de celui-ci. Exemple : e void bizarre1(void) { static int cpt = 1000; printf("%d ", cpt); cpt++; } Lorsque la d´claration d’une telle variable comporte une initialisation, il s’agit de l’initialisation d’une vae riable statique : elle est effectu´e une seule fois avant l’activation du programme. D’autre part, une variable e locale statique conserve sa valeur entre deux activations cons´cutives de la fonction. Ainsi, des appels successifs e de la fonction ci-dessus produisent l’affichage des valeurs 1000, 1001, 1002, etc. On aurait pu obtenir un effet analogue avec le programme int cpt = 1000; void bizarre2(void) { printf("%d ", cpt); cpt++; } mais ici la variable cpt est globale et peut donc ˆtre modifi´e inconsid´r´ment par une autre fonction, ou entrer e e ee en conflit avec un autre objet de mˆme nom, tandis que dans la premi`re version elle n’est visible que depuis e e l’int´rieur de la fonction et donc ` l’abri des manipulations maladroites et des collisions de noms. On notera e a pour finir que la version suivante est erron´e : e void bizarre3(void) { int cpt = 1000; printf("%d ", cpt); cpt++; } En effet, tous les appels de bizarre3 afficheront la mˆme valeur 1000. e Attention. Malgr´ tout le bien qu’on vient d’en dire, les variables locales statiques ont une particularit´ e e potentiellement fort dangereuse : il en existe une seule instance pour toutes les activations de la fonction dans laquelle elles sont d´clar´es. Ainsi, dans l’exemple suivant : e e void fonction_suspecte(void) { static int i; ... α fonction_suspecte(); β ... } la valeur de la variable i avant et apr`s l’appel de fonction suspecte (c’est-`-dire aux points α et β) peut e a ne pas ˆtre la mˆme, car la deuxi`me activation de fonction suspecte acc`de aussi ` i. Cela est tout ` fait e e e e a a inhabituel pour une variable locale. Cons´quence ` retenir : les variables locales statiques se marient mal avec e a la r´cursivit´. e e 1.5.6 Variables critiques

Le qualifieur register pr´c´dant une d´claration de variable informe le compilateur que la variable en e e e question est tr`s fr´quemment acc´d´e pendant l’ex´cution du programme et qu’il y a donc lieu de prendre e e e e e toutes les dispositions utiles pour en acc´l´rer l’acc`s. Par exemple, dans certains calculateurs de telles variables ee e sont log´es dans un registre de l’unit´ centrale de traitement (CPU) plutˆt que dans la m´moire centrale ; de e e o e cette mani`re l’acc`s ` leur valeur ne met pas en œuvre le bus de la machine. e e a Les variables ainsi d´clar´es doivent ˆtre locales et d’un type simple (nombre, pointeur). Elles sont automae e e tiquement initialis´es ` z´ro chaque fois qu’elles sont cr´´es. Le compilateur accorde ce traitement sp´cial aux e a e ee e 14
c H. Garreta, 1988-2006

1

´ ´ ELEMENTS DE BASE

1.6

Variables, fonctions et compilation s´par´e e e

variables dans l’ordre o` elles figurent dans les d´clarations. Lorsque cela n’est plus possible (par exemple, parce u e que tous les registres de la CPU sont pris) les d´clarations register restantes sont ignor´es. Il convient donc e e d’appliquer ce qualifieur aux variables les plus critiques d’abord. Exemple : char *strcpy(char *dest, char *srce) { register char *d = dest, *s = srce; while ((*d++ = *s++) != 0) ; return dest; } Attention. L’utilisation du qualifieur register est int´ressante lorsque l’on doit utiliser un compilateur e rustique, peu  optimisateur . Or de nos jours les compilateurs de C ont fini par devenir tr`s perfectionn´s et e e int`grent des algorithmes d’optimisation, parmi lesquels la d´termination des variables critiques et leur allocation e e dans les registres de la CPU. Il s’av`re alors que le programmeur, en appliquant le qualifieur register ` ses e a variables pr´f´r´es (qu’il croit critiques alors qu’elles ne le sont pas r´ellement), g`ne le travail du compilateur eee e e et obtient un programme moins efficace que s’il n’avait jamais utilis´ ce qualifieur. e 1.5.7 Variables constantes et volatiles

Le qualifieur const plac´ devant une variable ou un argument formel informe le compilateur que la variable e ou l’argument en question ne changera pas de valeur tout au long de l’ex´cution du programme ou de l’activation e de la fonction. Ce renseignement permet au compilateur d’optimiser la gestion de la variable, la nature exacte d’une telle optimisation n’´tant pas sp´cifi´e. Par exemple un compilateur peut juger utile de ne pas allouer e e e du tout une variable qualifi´e const et de remplacer ses occurrences par la valeur initiale10 indiqu´e lors de la e e d´claration. Il est conseill´ de toujours d´clarer const les variables et les arguments formels qui peuvent l’ˆtre. e e e e Note. C’est regrettable mais, pour la plupart des compilateurs, une variable qualifi´e const n’est pas tout e a ` fait une expression constante au sens de la section 1.3.4. En particulier, pour ces compilateurs une variable, mˆme qualifi´e const, ne peut pas ˆtre utilis´e pour indiquer le nombre d’´l´ments dans une d´claration de e e e e ee e tableau. Le C ANSI introduit aussi les notions de pointeur constant et de pointeur sur constante, expliqu´es ` la e a section 5.4.2. Le sens du qualifieur volatile d´pend lui aussi de l’impl´mentation. Il diminue le nombre d’hypoth`ses, et e e e donc d’optimisations, que le compilateur peut faire sur une variable ainsi qualifi´e. Par exemple toute variable e dont la valeur peut ˆtre modifi´e de mani`re asynchrone (dans une fonction de d´tection d’interruption, ou par e e e e un canal d’entr´e-sortie, etc.) doit ˆtre qualifi´e volatile, sur les syst`mes o` cela a un sens. Cela pr´vient e e e e u e le compilateur que sa valeur peut changer myst´rieusement, y compris dans une section du programme qui ne e comporte aucune r´f´rence ` cette variable. ee a Les compilateurs sont tenus de signaler toute tentative d´celable de modification d’une variable const. Mis e a ` part cela, sur un syst`me particulier ces deux qualifieurs peuvent n’avoir aucun autre effet. Ils n’appartiennent e pas au C original.

1.6
1.6.1

Variables, fonctions et compilation s´par´e e e
Identificateurs publics et priv´s e

Examinons maintenant les r`gles qui r´gissent la visibilit´ inter-fichiers des identificateurs. La question ne e e e concerne que les noms de variables et de fonctions, car les autres identificateurs (noms de structures, de types, etc.) n’existent que pendant la compilation et ne peuvent pas ˆtre partag´s par deux fichiers. Il n’y a pas de e e probl`me pour les variables locales, dont la visibilit´ se r´duit ` l’´tendue de la fonction ou du bloc contenant e e e a e leur d´finition. Il ne sera donc question que des noms des variables globales et des noms des fonctions. e Jargon. Identificateurs publics et priv´s. Un nom de variable ou de fonction d´fini dans un fichier source et e e pouvant ˆtre utilis´ dans d’autres fichiers sources est dit public. Un identificateur qui n’est pas public est appel´ e e e priv´. e Regle 1.
10 La d´claration d’une variable const doit n´cessairement comporter une initialisation car sinon, une telle variable ne pouvant e e pas ˆtre affect´e par la suite, elle n’aurait jamais de valeur d´finie. e e e

c H. Garreta, 1988-2006

15

1.6 Variables, fonctions et compilation s´par´e e e

´ ´ 1 ELEMENTS DE BASE

– Sauf indication contraire, tout identificateur global est public ; – le qualifieur static, pr´c´dant la d´claration d’un identificateur global, rend celui-ci priv´. e e e e On prendra garde au fait que le qualifieur static n’a pas le mˆme effet quand il s’applique ` un identificateur e a local (static change la dur´e de vie, d’automatique en statique, sans toucher ` la visibilit´) et quand il s’applique e a e a ` un identificateur global (static change la visibilit´, de publique en priv´e, sans modifier la dur´e de vie). e e e Lorsqu’un programme est d´compos´ en plusieurs fichiers sources il est fortement conseill´, pour ne pas dire e e e obligatoire, d’utiliser le qualifieur static pour rendre priv´s tous les identificateurs qui peuvent l’ˆtre. Si on ne e e suit pas cette recommandation on verra des fichiers qui ´taient corrects s´par´ment devenir erron´s lorsqu’ils e e e e sont reli´s, uniquement parce qu’ils partagent ` tort des identificateurs publics. e a 1.6.2 D´claration d’objets externes e

Nous ne consid´rons donc d´sormais que les noms publics. Un identificateur r´f´renc´ dans un fichier alors e e ee e qu’il est d´fini dans un autre fichier est appel´ externe. En g´n´ral, les noms externes doivent faire l’objet d’une e e e e d´claration : le compilateur ne traitant qu’un fichier ` la fois, les propri´t´s de l’objet externe doivent ˆtre e a ee e indiqu´es pour que la compilation puisse avoir lieu correctement. e Jargon. D´finition et d´claration d’une variable ou d’une fonction. Aussi bien une d´claration qu’une e e e d´finition d’un nom de variable ou de fonction est une formule qui sp´cifie la classe syntaxique (variable ou e e fonction) et les attributs (type, valeur initiale, etc.) de l’identificateur en question. En plus de cela : – une d´finition produit la cr´ation de l’objet dont l’identificateur est le nom ; e e e a ue ee – une d´claration se limite ` indiquer que l’objet en question a dˆ ˆtre cr´´ dans un autre fichier qui sera fourni lors de l’´dition de liens. e ( Cr´er  une variable ou une fonction c’est r´server l’espace correspondant, rempli par l’´ventuelle valeur e e e initiale de la variable ou par le code de la fonction). Regle 2. – Toute variable doit avoir ´t´ d´finie (c’est-`-dire d´clar´e normalement) ou d´clar´e externe avant son ee e a e e e e utilisation ; – une fonction peut ˆtre r´f´renc´e alors qu’elle n’a encore fait l’objet d’aucune d´finition ni d´claration e ee e e e externe ; elle est alors suppos´e ˆtre e e – externe, – ` r´sultat entier (int), a e – sans prototype (cf. section 4.2) ; – par cons´quent, si une fonction n’est pas ` r´sultat entier alors elle doit ˆtre soit d´finie soit d´clar´e e a e e e e e externe avant son appel, mˆme si elle est ult´rieurement d´finie dans le fichier o` figure l’appel. e e e u La d´claration externe d’une variable s’obtient en faisant pr´c´der une d´claration ordinaire du mot-cl´ e e e e e extern. Exemple : extern unsigned long n; Dans un autre fichier cette variable aura ´t´ d´finie : ee e unsigned long n; La d´claration externe d’une variable doit ˆtre identique, au mot extern pr`s, ` sa d´finition. Sauf pour les e e e a e deux points suivants : e e – une d´claration externe ne doit pas comporter d’initialisateur (puisque la d´claration externe n’alloue pas la variable), e e – dans une d´claration externe de tableau, il est inutile d’indiquer la taille de celui-ci (puisque la d´claration externe n’alloue pas le tableau). Exemple. Dans le fichier o` sont d´finies les variables n et table, on ´crira : u e e unsigned long n = 1000; int table[100]; Dans un autre fichier, o` ces variables sont uniquement r´f´renc´es, on ´crira : u ee e e extern unsigned long n; extern int table[]; La d´claration externe d’une fonction s’obtient en ´crivant l’en-tˆte de la fonction, pr´c´d´ du mot extern e e e e e e et suivi d’un point-virgule ; le mot extern est facultatif. Exemple : d´finition de la fonction e 16
c H. Garreta, 1988-2006

1

´ ´ ELEMENTS DE BASE

1.6

Variables, fonctions et compilation s´par´e e e

double carre(double x) { return x * x; } D´claration externe dans un autre fichier : e double carre(double x); ou double carre(double); ou l’un ou l’autre de ces ´nonc´s, pr´c´d´ du mot extern. e e e e e En syntaxe originale (c’est-`-dire  sans prototype ) il faut en outre ne pas ´crire les arguments formels. a e D´finition : e double carre(x) double x; { return x * x; } D´claration externe dans un autre fichier : e double carre(); Regle 3. Dans l’ensemble des fichiers qui constituent un programme, chaque nom public : – doit faire l’objet d’une et une seule d´finition ; e e e e u e – peut ˆtre d´clar´ externe (y compris dans le fichier o` il est d´fini) un nombre quelconque de fois. Cette r`gle volontariste est simple et elle exprime la meilleure fa¸on de programmer. Il faut savoir cependant e c que chaque syst`me tol`re des ´carts, qui r´v`lent surtout la rusticit´ de l’´diteur de liens sous-jacent. La clart´ e e e e e e e e des concepts et la fiabilit´ des programmes y perdent beaucoup. e Un comportement fr´quent est le suivant : appelons momentan´ment  d´claration-d´finition  une expression e e e e g´n´rale de la forme e e externopt declaration Nous pouvons donner la r`gle relˆch´e : e a e Regle 3’. Dans l’ensemble des fichiers qui constituent un programme, chaque nom public peut faire l’objet d’un nombre quelconque de d´clarations-d´finitions, mais : e e – il doit y avoir au moins une d´claration-d´finition sans le mot-cl´ extern ; e e e – il peut y avoir au plus une d´claration-d´finition comportant un initialisateur. e e Des techniques et conseils pour ´crire des programmes modulaires en C sont expos´s ` la section 8.2. e e a = initialisateur rien ;

c H. Garreta, 1988-2006

17

2

´ OPERATEURS ET EXPRESSIONS

2
2.1

Op´rateurs et expressions e
G´n´ralit´s e e e

Dans cette section nous ´tudions les op´rateurs et les expressions du langage C. Les expressions simples sont e e les constantes litt´rales (0, ’A’, 0.31416e1, etc.), les constantes symboliques (lundi, false, etc.) et les noms de e variables (x, nombre, etc.). Les op´rateurs servent ` construire des expressions complexes, comme 2 * x + 3 ou e a sin(0.31416e1). Les propri´t´s d’une expression complexe d´coulent essentiellement de la nature de l’op´rateur ee e e qui chapeaute l’expression. On peut distinguer les expressions pures des expressions avec effet de bord 11 . Dans tous les cas une expression repr´sente une valeur. Une expression pure ne fait que cela : l’´tat du syst`me est le mˆme avant et apr`s son e e e e e ´valuation. Au contraire, une expression ` effet de bord modifie le contenu d’une ou plusieurs variables. Par e a exemple, l’expression y + 1 est pure, tandis que l’affectation x = y + 1 (qui en C est une expression) est ` effet a de bord, car elle modifie la valeur de la variable x. Comme nous le verrons, en C un grand nombre d’expressions ont de tels effets. Remarque 1. Les op´rateurs dont il sera question ici peuvent aussi apparaˆ dans les d´clarations, pour e ıtre e la construction des types d´riv´s (tableaux, pointeurs et fonctions) comme dans la d´claration complexe : e e e char (*t[20])(); La signification des expressions ainsi ´crites est alors tr`s diff´rente de celle des expressions figurant dans la e e e partie ex´cutable des programmes, mais on peut signaler d’ores et d´j` que toutes ces constructions ob´issent aux e ea e mˆmes r`gles de syntaxe, notamment pour ce qui concerne la priorit´ des op´rateurs et l’usage des parenth`ses. e e e e e La question des d´clarations complexes sera vue ` la section 5.4. e a Remarque 2. C’est une originalit´ de C que de consid´rer les  d´signateurs  complexes (les objets point´s, e e e e les ´l´ments des tableaux, les champs des structures, etc.) comme des expressions construites avec des op´rateurs ee e et ob´issant ` la loi commune, notamment pour ce qui est des priorit´s. On se souvient qu’en Pascal les signes e a e qui permettent d’´crire de tels d´signateurs (c’est-`-dire les s´lecteurs [], ^ et .) n’ont pas statut d’op´rateur. Il e e a e e ne viendrait pas ` l’id´e d’un programmeur Pascal d’´crire 2 + (t[i]) afin de lever une quelconque ambigu¨ e a e e ıt´ sur la priorit´ de + par rapport ` celle de [], alors qu’en C de telles expressions sont habituelles. Bien sˆr, dans e a u 2 + (t[i]) les parenth`ses sont superflues, car la priorit´ de l’op´rateur [] est sup´rieure ` celle de +, mais ce e e e e a n’est pas le cas dans (2 + t)[i], qui est une expression ´galement l´gitime. e e 2.1.1 Lvalue et rvalue

Toute expression poss`de au moins deux attributs : un type et une valeur. Par exemple, si i est une variable e enti`re valant 10, l’expression 2 * i + 3 poss`de le type entier et la valeur 23. e e Dans la partie ex´cutable des programmes on trouve deux sortes d’expressions : e – Lvalue (expressions signifiant  le contenu de... ). Certaines expressions sont repr´sent´es par une formule e e qui d´termine un emplacement dans la m´moire ; la valeur de l’expression est alors d´finie comme le e e e contenu de cet emplacement. C’est le cas des noms des variables, des composantes des enregistrements et des tableaux, etc. Une lvalue poss`de trois attributs : une adresse, un type et une valeur. Exemples : x, e table[i], fiche.numero. e a – Rvalue (expressions signifiant  la valeur de... ). D’autres expressions ne sont pas associ´es ` un emplacement de la m´moire : elles ont un type et une valeur, mais pas d’adresse. C’est le cas des constantes et e des expressions d´finies comme le r´sultat d’une op´ration arithm´tique. Une rvalue ne poss`de que deux e e e e e attributs : type, valeur. Exemples : 12, 2 * i + 3. Toute lvalue peut ˆtre vue comme une rvalue ; il suffit d’ignorer le contenant (adresse) pour ne voir que le e contenu (type, valeur). La raison principale de la distinction entre lvalue et rvalue est la suivante : seule une lvalue peut figurer ` gauche du signe = dans une affectation ; n’importe quelle rvalue peut apparaˆ ` droite. a ıtre a Cela justifie les appellations lvalue ( left value ) et rvalue ( right value ). Les sections suivantes pr´ciseront, pour chaque sorte d’expression complexe, s’il s’agit ou non d’une lvalue. e Pour les expressions simples, c’est-`-dire les constantes litt´rales et les identificateurs, la situation est la suivante : a e – sont des lvalue : – les noms des variables simples (nombres et pointeurs), – les noms des variables d’un type struct ou union
11 Effet de bord est un barbarisme ayant pour origine l’expression anglaise side effect qu’on peut traduire par effet secondaire souvent un peu cach´, parfois dangereux. e

18

c H. Garreta, 1988-2006

´ 2 OPERATEURS ET EXPRESSIONS

2.2

Pr´sentation d´taill´e des op´rateurs e e e e

– ne sont pas des lvalue : – les constantes, – les noms des variables de type tableau, – les noms des fonctions. 2.1.2 Priorit´ des op´rateurs e e

C comporte de tr`s nombreux op´rateurs. La plupart des caract`res sp´ciaux d´signent des op´rations et e e e e e e subissent les mˆmes r`gles syntaxiques, notamment pour ce qui concerne le jeu des priorit´s et la possibilit´ de e e e e parenth´sage. La table 2 montre l’ensemble de tous les op´rateurs, class´s par ordre de priorit´. e e e e prior 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 op´rateurs e () [] ! ~ *bin / + -bin << >> < <= == != &bin ^ | && || ? : = *= , sens de l’associativit´ e → sizeof (type) ← → → → → → → → → → → ← >>= &= ^= |= ← →

. ++ %

-> --

-un

*un

&un

>

>=

/=

%=

+=

-=

<<=

Tab. 2 – Op´rateurs du langage C e Remarque. Dans certains cas un mˆme signe, comme -, d´signe deux op´rateurs, l’un unaire (` un argue e e a ment), l’autre binaire (` deux arguments). Dans le tableau 2, les suffixes un et bin pr´cisent de quel op´rateur a e e il s’agit. Le signe → indique l’associativit´  de gauche ` droite  ; par exemple, l’expression x - y - z signifie (x e a y) - z. Le signe ← indique l’associativit´ de  droite ` gauche  ; par exemple, l’expression x = y = z signifie e a x = (y = z). Notez que le sens de l’associativit´ des op´rateurs pr´cise la signification d’une expression, mais en aucun e e e cas la chronologie de l’´valuation des sous-expressions. e

2.2
2.2.1

Pr´sentation d´taill´e des op´rateurs e e e e
Appel de fonction ()

Op´ration : application d’une fonction ` une liste de valeurs. Format : e a exp 0 ( exp 1 , ... exp n ) exp 1 , ... exp n sont appel´s les arguments effectifs de l’appel de la fonction. exp 0 doit ˆtre de type fonction e e rendant une valeur de type T ou bien12 adresse d’une fonction rendant une valeur de type T. Alors exp 0 ( exp 1 , ... exp n ) poss`de le type T. La valeur de cette expression d´coule de la d´finition de la fonction (` l’int´rieur e e e a e de la fonction, cette valeur est pr´cis´e par une ou plusieurs instructions  return exp ; ). e e L’expression exp 0 ( exp 1 , ... exp n ) n’est pas une lvalue. Exemple : y = carre(2 * x) + 3; sachant que carre est le nom d’une fonction rendant un double, l’expression carre(2 * x) a le type double. Un coup d’œil au corps de la fonction (cf. section 1.6.2) pourrait nous apprendre que la valeur de cette expression n’est autre que le carr´ de son argument, soit ici la valeur 4x2 . e
12 Cette

double possibilit´ est comment´e ` la section 6.3.4. e e a

c H. Garreta, 1988-2006

19

2.2 Pr´sentation d´taill´e des op´rateurs e e e e

2

´ OPERATEURS ET EXPRESSIONS

Les contraintes support´es par les arguments effectifs ne sont pas les mˆmes dans le C ANSI et dans le C e e original (ceci est certainement la plus grande diff´rence entre les deux versions du langage) : e A. En C ANSI, si la fonction a ´t´ d´finie ou d´clar´e avec prototype (cf. section 4.1) : ee e e e – le nombre des arguments effectifs doit correspondre ` celui des arguments formels13 ; a – chaque argument effectif doit ˆtre compatible, au sens de l’affectation, avec l’argument formel correspone dant ; – la valeur de chaque argument effectif subit ´ventuellement les mˆmes conversions qu’elle subirait dans e e l’affectation argument formel = argument effectif B. En C original, ou en C ANSI si la fonction n’a pas ´t´ d´finie ou d´clar´e avec prototype : ee e e e – aucune contrainte (de nombre ou de type) n’est impos´e aux arguments effectifs ; e – tout argument effectif de type char ou short est converti en int ; – tout argument effectif de type float est converti en double ; – les autres arguments effectifs ne subissent aucune conversion. Par exemple, avec la fonction carre d´finie ` la section 1.6.2, l’appel e a y = carre(2); est erron´ en C original (la fonction re¸oit la repr´sentation interne de la valeur enti`re 2 en  croyant  que e c e e c’est la repr´sentation interne d’un double) mais il est correct en C ANSI (l’entier 2 est converti en double au e moment de l’appel). Toutes ces questions sont reprises plus en d´tail ` la section 4. e a Remarque 1. Bien noter que les parenth`ses doivent apparaˆ e ıtre, mˆme lorsque la liste des arguments est e vide. Leur absence ne provoque pas d’erreur, mais change compl`tement le sens de l’expression. Cela constitue e un pi`ge assez vicieux tendu aux programmeurs dont la langue maternelle est Pascal. e Remarque 2. Il faut savoir que lorsqu’une fonction a ´t´ d´clar´e comme ayant des arguments en nombre ee e e variable (cf. section 4.3.4) les arguments correspondant ` la partie variable sont trait´s comme les arguments a e des fonctions sans prototype, c’est-`-dire selon les r`gles de la section B ci-dessus. a e Cette remarque est loin d’ˆtre marginale car elle concerne, excusez du peu, les deux fonctions les plus e utilis´es : printf et scanf. Ainsi, quand le compilateur rencontre l’instruction e printf(expr 0 , expr 1 , ... expr k ); il v´rifie que expr 0 est bien de type char *, mais les autres param`tres effectifs expr 1 , ... expr k sont trait´s e e e selon les r`gles de la section B. e 2.2.2 Indexation []

´ Definition restreinte (´l´ment d’un tableau). Op´ration : acc`s au ieme ´l´ment d’un tableau. Format : ee e e ee exp 0 [ exp 1 ] exp 0 doit ˆtre de type  tableau d’objets de type T , exp 1 doit ˆtre d’un type entier. Alors exp 0 [exp 1 ] est de e e type T ; cette expression d´signe l’´l´ment du tableau dont l’indice est donn´ par la valeur de exp 1 . e ee e Deux d´tails auxquels on tient beaucoup en C : e – le premier ´l´ment d’un tableau a toujours l’indice 0 ; ee e e ee a a – il n’est jamais v´rifi´ que la valeur de l’indice dans une r´f´rence ` un tableau appartient ` l’intervalle 0...N − 1 d´termin´ par le nombre N d’´l´ments allou´s par la d´claration du tableau. Autrement dit, il e e ee e e n’y a jamais de  test de d´bordement . e Exemple. L’expression t[0] d´signe le premier ´l´ment du tableau t, t[1] le second, etc. e ee En C, les tableaux sont toujours ` un seul indice ; mais leurs composantes peuvent ˆtre ` leur tour des a e a tableaux. Par exemple, un ´l´ment d’une matrice rectangulaire sera not´ : ee e m[i][j] Une telle expression suppose que m[i] est de type  tableau d’objets de type T  et donc que m est de type  tableau de tableaux d’objets de type T . C’est le cas, par exemple, si m a ´t´ d´clar´e par une expression de ee e e la forme (NL et NC sont des constantes) : double m[NL][NC];
13 Il

existe n´anmoins un moyen pour ´crire des fonctions avec un nombre variable d’arguments (cf. section 4.3.4) e e

20

c H. Garreta, 1988-2006

´ 2 OPERATEURS ET EXPRESSIONS

2.2

Pr´sentation d´taill´e des op´rateurs e e e e

´ ` Definition complete (indexation au sens large). Op´ration : acc`s ` un objet dont l’adresse est donn´e e e a e par une adresse de base et un d´placement. Format : e exp 0 [ exp 1 ] exp 0 doit ˆtre de type  adresse d’un objet de type T , exp 1 doit ˆtre de type entier. Alors exp 0 [exp 1 ] d´signe e e e l’objet de type T ayant pour adresse (voir la figure 2) : valeur(exp 0 ) + valeur(exp 1 ) × taille(T)

exp0

exp1

Fig. 2 – L’indexation Il est clair que, si exp 0 est de type tableau, les deux d´finitions de l’indexation donn´es co¨ e e ıncident. Exemple : si t est un tableau d’entiers et p un  pointeur vers entier  auquel on a affect´ l’adresse de t[0], alors les e expressions suivantes d´signent le mˆme objet : e e t[i] p[i] *(p + i) *(t + i) Dans un cas comme dans l’autre, l’expression exp 0 [exp 1 ] est une lvalue, sauf si elle est de type tableau. 2.2.3 S´lection . e

Op´ration : acc`s ` un champ d’une structure ou d’une union. Format : e e a exp . identif exp doit poss´der un type struct ou union, et identif doit ˆtre le nom d’un des champs de la structure ou de e e l’union en question. En outre, exp doit ˆtre une lvalue. Alors, exp.identif d´signe le champ identif de l’objet e e d´signe par exp. e Cette expression est une lvalue, sauf si elle est de type tableau. Exemple. Avec la d´claration e struct personne { long int num; struct { char rue[32]; char *ville; } adresse; } fiche; les expressions fiche.num fiche.adresse fiche.adresse.rue etc. d´signent les divers champs de la variable fiche. Seules les deux premi`res sont des lvalue. e e 2.2.4 S´lection dans un objet point´ -> e e

Op´ration : acc`s au champ d’une structure ou d’une union point´e. Format : e e e exp->identif exp doit poss´der le type  adresse d’une structure ou d’une union  et identif doit ˆtre le nom d’un des champs e e de la structure ou de l’union en question. Dans ces conditions, exp->identif d´signe le champ identif de la e structure ou de l’union dont l’adresse est indiqu´e par la valeur de exp. e Cette expression est une lvalue, sauf si elle est de type tableau. Ainsi, exp->identif est strictement synonyme de (*exp).identif (remarquez que les parenth`ses sont indise pensables). Par exemple, avec la d´claration : e
c H. Garreta, 1988-2006

21

2.2 Pr´sentation d´taill´e des op´rateurs e e e e

2

´ OPERATEURS ET EXPRESSIONS

struct noeud { int info; struct noeud *fils, *frere; } *ptr; les expressions suivantes sont correctes : ptr->info ptr->fils->frere ptr->fils->frere->frere

2.2.5

N´gation ! e

Op´ration : n´gation logique. Format : e e !exp Aucune contrainte. Cette expression d´signe une valeur de l’ensemble {0, 1}, d´finie par : e e !exp ≡ 1, si exp = 0 0, si exp = 0

Cette expression n’est pas une lvalue. Remarque. Bien que cela ne soit pas exig´ par le langage C, on ´vitera de  nier  (et plus g´n´ralement e e e e de comparer ` z´ro) des expressions d’un type flottant (float, double). A cause de l’impr´cision inh´rente ` la a e e e a plupart des calculs avec de tels nombres, l’´galit´ ` z´ro d’un flottant n’est souvent que le fruit du hasard. e ea e

2.2.6

Compl´ment ` 1 ~ e a

Op´ration : n´gation bit ` bit. Format : e e a ~exp exp doit ˆtre d’un type entier. Cette expression d´signe l’objet de mˆme type que exp qui a pour codage interne e e e la configuration de bits obtenue en inversant chaque bit du codage interne de la valeur de exp : 1 devient 0, 0 devient 1. Cette expression n’est pas une lvalue. Remarque. Le compl´ment ` un n’est pas une op´ration abstraite (cf. section 2.3.3). La portabilit´ d’un e a e e programme o` cet op´rateur figure n’est donc pas assur´e. u e e

2.2.7

Les c´l`bres ++ et -ee

Il existe deux op´rateurs unaires ++ diff´rents : l’un est postfix´ (´crit derri`re l’op´rande), l’autre pr´fix´ e e e e e e e e (´crit devant). e 1. Op´ration : post-incr´mentation. Format : e e exp++ exp doit ˆtre de type num´rique (entier ou flottant) ou pointeur. Ce doit ˆtre une lvalue. Cette expression est e e e caract´ris´e par : e e – un type : celui de exp ; – une valeur : la mˆme que exp avant l’´valuation de exp++ ; e e e – un effet de bord : le mˆme que celui de l’affectation exp = exp + 1. 2. Op´ration : pr´-incr´mentation. Format : e e e ++exp exp doit ˆtre de type num´rique (entier ou flottant) ou pointeur. Ce doit ˆtre une lvalue. Cette expression est e e e caract´ris´e par : e e – un type : celui de exp ; – une valeur : la mˆme que exp apr`s l’´valuation de exp++ ; e e e e – un effet de bord : le mˆme que celui de l’affectation exp = exp + 1. Les expressions exp++ et ++exp ne sont pas des lvalue. 22
c H. Garreta, 1988-2006

´ 2 OPERATEURS ET EXPRESSIONS

2.2

Pr´sentation d´taill´e des op´rateurs e e e e

Exemple. L’affectation y = x++ ; y = ++x ; ´quivaut ` e a y = x; x = x + 1; x = x + 1; y = x;

L’op´rateur ++ b´n´ficie de l’arithm´tique des adresses au mˆme titre que +. Ainsi, si exp est de type e e e e e  pointeur vers un objet de type T , la quantit´ effectivement ajout´e ` exp par l’expression exp++ d´pend de e e a e la taille de T. Il existe de mˆme deux op´rateurs unaires -- donnant lieu ` des expressions exp-- et --exp. L’explication e e a est la mˆme, en rempla¸ant +1 par −1. e c Application : r´alisation d’une pile. Il est tr`s agr´able de constater que les op´rateurs ++ et -- et la e e e e mani`re d’indexer les tableaux en C se combinent harmonieusement et permettent par exemple la r´alisation e e simple et efficace de piles par des tableaux, selon le sch´ma suivant : e – d´claration et initialisation d’une pile (OBJET est un type pr´d´fini, d´pendant du probl`me particulier e e e e e consid´r´ ; MAXPILE est une constante repr´sentant un majorant du nombre d’´l´ments dans la pile) : ee e ee OBJET espace[MAXPILE]; int nombreElements = 0; e – op´ration  empiler la valeur de x  : if (nombreElements >= MAXPILE) erreur("tentative d’empilement dans une pile pleine"); espace[nombreElements++] = x; – op´ration  d´piler une valeur et la ranger dans x  : e e if (nombreElements <= 0) erreur("tentative de depilement d’une pile vide"); x = espace[--nombreElements]; On notera que, si on proc`de comme indiqu´ ci-dessus, la variable nombreElements poss`de constamment e e e la valeur que son nom sugg`re : le nombre d’´l´ments effectivement pr´sents dans la pile. e ee e

2.2.8

Moins unaire -

Op´ration : changement de signe. Format : e -exp exp doit ˆtre une expression num´rique (enti`re ou r´elle). Cette expression repr´sente l’objet de mˆme type e e e e e e que exp dont la valeur est l’oppos´e de celle de exp. Ce n’est pas une lvalue. e

2.2.9

Indirection *

Op´ration : acc`s ` un objet point´. On dit aussi  d´r´ference . Format : e e a e ee *exp exp doit ˆtre une expression de type  adresse d’un objet de type T . *exp repr´sente alors l’objet de type T e e ayant pour adresse la valeur de exp. L’expression *exp est une lvalue. Remarque 1. On prendra garde au fait qu’il existe un bon nombre d’op´rateurs ayant une priorit´ sup´rieure e e e a ` celle de *, ce qui oblige souvent ` utiliser des parenth`ses. Ainsi par exemple les expressions Pascal e↑[i] et a e e[i]↑ doivent respectivement s’´crire, en C, (*e)[i] et *(e[i]), la deuxi`me pouvant aussi s’´crire *e[i]. e e e Remarque 2. L’expression *p signifie acc`s ` la m´moire dont p contient l’adresse. C’est une op´ration e a e e  sans filet . Quel que soit le contenu de p, la machine pourra toujours le consid´rer comme une adresse e et acc´der ` la m´moire correspondante. Il appartient au programmeur de prouver que cete m´moire a ´t´ e a e e ee effectivement allou´e au programme en question. Si c’est le pas on dit que la valeur de p est une adresse valide ; e dans le cas contraire, les pires erreurs sont ` craindre ` plus ou moins court terme. a a
c H. Garreta, 1988-2006

23

2.2 Pr´sentation d´taill´e des op´rateurs e e e e

2

´ OPERATEURS ET EXPRESSIONS

2.2.10

Obtention de l’adresse &

Op´ration : obtention de l’adresse d’un objet occupant un emplacement de la m´moire. Format : e e &exp exp doit ˆtre une expression d’un type quelconque T. Ce doit ˆtre une lvalue. e e L’expression &exp a pour type  adresse d’un objet de type T  et pour valeur l’adresse de l’objet repr´sent´ e e par exp. L’expression &exp n’est pas une lvalue. Ainsi, si i est une variable de type int et p une variable de type  pointeur vers un int , alors ` la suite a de l’instruction p = &i; i et *p d´signent le mˆme objet. e e Exemple 1. Une utilisation fr´quente de cet op´rateur est l’obtention de l’adresse d’une variable en vue de e e la passer ` une fonction pour qu’elle modifie la variable : a scanf("%d%lf%s", &i, &t[j], &p->nom); Exemple 2. Une autre utilisation ´l´gante de cet op´rateur est la cr´ation de composantes  fixes  dans ee e e les structures chaˆ ees. Le programme suivant d´clare une liste chaˆ ee circulaire repr´sent´e par le pointeur ın´ e ın´ e e entree et r´duite pour commencer ` un unique maillon qui est son propre successeur (voir figure 3) ; d’autres e a maillons seront cr´´s dynamiquement durant l’ex´cution : ee e

entree

en_tete_fixe
Fig. 3 – Maillon fixe en tˆte d’une liste chaˆ ee e ın´

struct en_tete { long taille; struct en_tete *suivant; } en_tete_fixe = { 0, &en_tete_fixe }; struct en_tete *entree = &en_tete_fixe; Remarque. Une expression r´duite ` un nom de tableau, ` un nom de fonction ou ` une constante chaˆ e a a a ıne de caract`res est consid´r´e comme une constante de type adresse ; l’op´rateur & appliqu´ ` de telles expressions e ee e ea est donc sans objet. Un tel emploi de & devrait ˆtre consid´r´ comme erron´, mais beaucoup de compilateurs se e ee e contentent de l’ignorer. 2.2.11 Op´rateur sizeof e

Op´ration : calcul de la taille correspondant ` un type. Premi`re forme : e a e sizeof ( descripteur-de-type ) Cette expression repr´sente un nombre entier qui exprime la taille qu’occuperait en m´moire un objet poss´dant e e e le type indiqu´ (les descripteurs de types sont expliqu´s ` la section 5.4). e e a Deuxi`me forme : e sizeof exp exp est une expression quelconque (qui n’est pas ´valu´e par cette ´valuation de sizeof). L’expression sizeof e e e exp repr´sente la taille qu’occuperait en m´moire un objet poss´dant le mˆme type que exp. e e e e Dans un cas comme dans l’autre sizeof... est une expression constante. En particulier, ce n’est pas une lvalue. La taille des objets est exprim´e en nombre d’octets. Plus exactement, l’unit´ choisie est telle que la valeur e e de sizeof(char) soit 1 (on peut aussi voir cela comme une d´finition du type char). e 24
c H. Garreta, 1988-2006

´ 2 OPERATEURS ET EXPRESSIONS

2.2

Pr´sentation d´taill´e des op´rateurs e e e e

Remarque 1. Dans le C original, le type de l’expression sizeof... est int. Dans le C ANSI, ce type peut changer d’un syst`me ` un autre (int, long, unsigned, etc.). Pour cette raison il est d´fini, sous l’appellation e a e size t, dans le fichier stddef.h. Il est recommand´ de d´clarer de type size t toute variable (resp. toute e e fonction) devant contenir (resp. devant renvoyer) des nombres qui repr´sentent des tailles. e Remarque 2. Lorsque son op´rande est un tableau (ou une expression de type tableau) la valeur rendue e par sizeof est l’encombrement effectif du tableau. Par exemple, avec la d´claration e char tampon[80]; l’expression sizeof tampon vaut 80, mˆme si cela paraˆ en contradiction avec le fait que tampon peut ˆtre vu e ıt e comme de type  adresse d’un char . Il en d´coule une propri´t´ bien utile : quel que soit le type du tableau e ee t, la formule sizeof t / sizeof t[0] exprime toujours le nombre d’´l´ments de t. ee 2.2.12 Conversion de type (“cast” operator)

Op´ration : conversion du type d’une expression. Format : e ( type 2 ) exp type 2 repr´sente un descripteur de type ; exp est une expression quelconque. L’expression ci-dessus d´signe un e e ´l´ment de type type 2 qui est le r´sultat de la conversion vers ce type de l’´l´ment repr´sent´ par exp. ee e ee e e L’expression (type 2 )exp n’est pas une lvalue. Les conversions l´gitimes (et utiles) sont14 : e – Entier vers un entier plus long (ex. char → int). Le codage de exp est ´tendu de telle mani`re que la e e valeur repr´sent´e soit inchang´e. e e e – Entier vers un entier plus court (ex. long → short). Si la valeur de exp est assez petite pour ˆtre repr´e e sentable dans le type de destination, sa valeur est la mˆme apr`s conversion. Sinon, la valeur de exp est e e purement et simplement tronqu´e (une telle troncation, sans signification abstraite, est rarement utile). e – Entier sign´ vers entier non sign´, ou le contraire. C’est une conversion sans travail : le compilateur se e e borne ` interpr´ter autrement la valeur de exp, sans effectuer aucune transformation de son codage interne. a e – Flottant vers entier : la partie fractionnaire de la valeur de exp est supprim´e. Par exemple, le flottant e 3.14 devient l’entier 3. Attention, on peut voir cette conversion comme une r´alisation de la fonction e math´matique partie enti`re, mais uniquement pour les nombres positifs : la conversion en entier de e e -3.14 donne -3, non -4. – Entier vers flottant. Sauf cas de d´bordement (le r´sultat est alors impr´visible), le flottant obtenu est e e e celui qui approche le mieux l’entier initial. Par exemple, l’entier 123 devient le flottat 123.0. – Adresse d’un objet de type T1 vers adresse d’un objet de type T2 . C’est une conversion sans travail : le compilateur donne une autre interpr´tation de la valeur de exp, sans effectuer aucune transformation de e son codage interne. Danger ! Une telle conversion est enti`rement plac´e sous la responsabilit´ du programmeur, le compilateur e e e l’accepte toujours. – Entier vers adresse d’un objet de type T. C’est encore une conversion sans travail : la valeur de exp est interpr´t´e comme un pointeur, sans transformation de son codage interne. ee Danger ! Une telle conversion est enti`rement plac´e sous la responsabilit´ du programmeur. De plus, si e e e la repr´sentation interne de exp n’a pas la taille voulue pour un pointeur, le r´sultat est impr´visible. e e e Toutes les conversions o` l’un des types en pr´sence, ou les deux, sont des types struct ou union sont u e interdites. Note 1. Si type 2 et le type de exp sont num´riques, alors la conversion effectu´e ` l’occasion de l’´valuation e e a e de l’expression ( type 2 ) exp est la mˆme que celle qui est faite lors d’une affectation e x = expr ; o` x repr´sente une variable de type type 2 . u e Note 2. En toute rigueur, le fait que l’expression donn´e par un op´rateur de conversion de type ne soit e e pas une lvalue interdit des expressions qui auraient pourtant ´t´ pratiques, comme ee ((int) x)++; /* DANGER ! */
14 Attention, il y a quelque chose de trompeur dans la phrase  conversion de exp . N’oubliez pas que, contrairement ` ce que a sugg`re une certaine mani`re de parler, l’´valuation de l’expression (type)exp ne change ni le type ni la valeur de exp. e e e

c H. Garreta, 1988-2006

25

2.2 Pr´sentation d´taill´e des op´rateurs e e e e

2

´ OPERATEURS ET EXPRESSIONS

Cependant, certains compilateurs acceptent cette expression, la traitant comme x = (le type de x)((int) x + 1) ; Exemple 1. Si i et j sont deux variables enti`res, l’expression i / j repr´sente leur division enti`re (ou e e e euclidienne, ou encore leur quotient par d´faut). Voici deux mani`res de ranger dans x (une variable de type e e float) leur quotient d´cimal : e x = (float) i / j; x = i / (float) j; Et voici deux mani`res de se tromper (en n’obtenant que le r´sultat de la conversion vers le type float de e e leur division enti`re) e x = i / j; /* ERREUR */ x = (float)(i / j); /* ERREUR */

Exemple 2. Une utilisation pointue et dangereuse, mais parfois n´cessaire, de l’op´rateur de conversion de e e type entre types pointeurs consiste ` s’en servir pour  voir  un espace m´moire donn´ par son adresse comme a e e poss´dant une certaine structure alors qu’en fait il n’a pas ´t´ ainsi d´clar´ : e ee e e – d´claration d’une structure : e struct en_tete { long taille; struct en_tete *suivant; }; – d´claration d’un pointeur  g´n´rique  : e e e void *ptr; – imaginez que –pour des raisons non d´taill´es ici– ptr poss`de ` un endroit donn´ une valeur qu’il est e e e a e l´gitime de consid´rer comme l’adresse d’un objet de type struct en tete (alors que ptr n’a pas ce e e type-l`). Voici un exemple de manipulation cet objet : a ((struct en_tete *) ptr)->taille = n; Bien entendu, une telle conversion de type est faite sous la responsabilit´ du programmeur, seul capable de e garantir qu’` tel moment de l’ex´cution du programme ptr pointe bien un objet de type struct en tete. a e ´ N.B. L’appel d’une fonction bien ecrite ne requiert jamais un  cast . L’op´rateur de changee ment de type est parfois n´cessaire, mais son utilisation diminue toujours la qualit´ du programme qui l’emploie, e e pour une raison facile ` comprendre : cet op´rateur fait taire le compilateur. En effet, si expr est d’un type poina e teur et type 2 est un autre type pointeur, l’expression (type 2 )expr est toujours accept´e par le compilateur sans e le moindre avertissement. C’est donc une mani`re de cacher des erreurs sans les r´soudre. e e Exemple typique : si on a oubli´ de mettre en tˆte du programme la directive #include <stdlib.h>, e e l’utilisation de la fonction malloc de la biblioth`que standard soul`ve des critiques : e e ... MACHIN *p; ... p = malloc(sizeof(MACHIN)); ... A la compilation on a des avertissements. Par exemple (avec gcc) : monProgramme.c: In function ‘main’ monProgramme.c:9:warning: assignment makes pointer from integer without a cast On croit r´soudre le probl`me en utilisant l’op´rateur de changement de type e e e ... p = (MACHIN *) malloc(sizeof(MACHIN)); /* CECI NE REGLE RIEN! */ ... et il est vrai que la compilation a lieu maintenant en silence, mais le probl`me n’est pas r´solu, il est seulement e e cach´. Sur un ordinateur o` les entiers et les pointeurs ont la mˆme taille cela peut marcher, mais ailleurs la e u e valeur rendue par malloc sera endommag´e lors de son affectation ` p. A ce sujet, voyez la remarque de la page e a 65. Il suffit pourtant de bien lire l’avertissement affich´ par le compilateur pour trouver la solution. L’affectation e p = malloc(...) lui fait dire qu’on fabrique un pointeur (p) ` partir d’un entier (le r´sultat de malloc) sans a e op´rateur cast. Ce qui est anormal n’est pas l’absence de cast, mais le fait que le r´sultat de malloc soit tenu e e pour un entier 15 , et il n’y a aucun moyen de rendre cette affectation juste aussi longtemps que le compilateur
15 Rappelez-vous

que toute fonction appel´e et non d´clar´e est suppos´e de type int. e e e e

26

c H. Garreta, 1988-2006

´ 2 OPERATEURS ET EXPRESSIONS

2.2

Pr´sentation d´taill´e des op´rateurs e e e e

fera une telle hypoth`se fausse. La solution est donc d’informer ce dernier ` propos du type de malloc, en e a faisant pr´c´der l’affectation litigieuse soit d’une d´claration de cette fonction e e e void *malloc (size_t); soit, c’est mieux, d’une directive ad hoc : #include <stdlib.h> ... p = malloc(sizeof(MACHIN)); ... 2.2.13 Op´rateurs arithm´tiques e e

Ce sont les op´rations arithm´tiques classiques : addition, soustraction, multiplication, division et modulo e e (reste de la division enti`re). Format : e    +      -     * exp1 exp2   /         % Aucune de ces expressions n’est une lvalue. Avant l’´valuation de l’expression, les op´randes subissent les conversions  usuelles  (cf. section 2.3.1). Le e e langage C supporte l’arithm´tique des adresses (cf. section 6.2.1). e A propos de la division. En C on note par le mˆme signe la division enti`re, qui prend deux op´randes e e e entiers (short, int, long, etc.) et donne un r´sultat entier, et la division flottante dans laquelle le r´sultat est e e flottant (float, double). D’autre part, les r`gles qui commandent les types des op´randes et du r´sultat des e e e expressions arithm´tiques (cf. section 2.3.1), et notamment la r`gle dite  du plus fort , ont la cons´quence e e e importante suivante : dans l’expression expr 1 / expr 2 – si expr 1 et expr 2 sont toutes deux enti`res alors  /  est traduit par l’op´ration  division enti`re 16 , et e e e le r´sultat est entier, e – si au moins une des expressions expr 1 ou expr 2 n’est pas enti`re, alors l’op´ration faite est la division e e flottante des valeurs de expr 1 et expr 2 toutes deux converties dans le type double. Le r´sultat est une e valeur double qui approche le rationnel expr1 du mieux que le permet la la pr´cision du type double. e expr2 Il r´sulte de cette r`gle un pi`ge auquel il faut faire attention : 1/2 ne vaut pas 0.5 mais 0. De mˆme, dans e e e e int somme, nombre; float moyenne; ... moyenne = somme / 100; la valeur de moyenne n’est pas ce que ce nom sugg`re, car somme et 100 sont tous deux entiers et l’expression e somme / 100 est enti`re, donc tronqu´e (et il ne faut pas croire que l’affectation ult´rieure ` la variable flottante e e e a moyenne pourra retrouver les d´cimales perdues). Dans ce cas particulier, la solution est simple : e moyenne = somme / 100.0; Mˆme probl`me si le d´nominateur avait ´t´ une variable enti`re, comme dans e e e ee e moyenne = somme / nombre; ici la solution est un peu plus compliqu´e : e moyenne = somme / (double) nombre;
16 On prendra garde au fait que si les op´randes ne sont pas tous deux positifs la division enti`re du langage C ne coincide pas e e avec le  quotient par d´faut  (quotient de la  division euclidienne  des matheux). e Ici, si q est le quotient de a par b alors |q| est le quotient de |a| par |b|. Par exemple, la valeur de (−17)/5 ou de 17/(−5) est −3 alors que le quotient par d´faut de −17 par 5 est plutˆt −4 (−17 = 5 × (−4) + 3). e o

c H. Garreta, 1988-2006

27

2.2 Pr´sentation d´taill´e des op´rateurs e e e e

2

´ OPERATEURS ET EXPRESSIONS

2.2.14

D´calages << >> e

Op´ration : d´calages de bits. Format : e e exp1 << >> exp2

exp 1 et exp 2 doivent ˆtre d’un type entier (char, short, long, int...). L’expression exp 1 << exp 2 (resp. exp 1 >> e exp 2 ) repr´sente l’objet de mˆme type que exp 1 dont la repr´sentation interne est obtenue en d´calant les bits e e e e de la repr´sentation interne de exp 1 vers la gauche17 (resp. vers la droite) d’un nombre de positions ´gal ` la e e a valeur de exp 2 . Autrement dit, exp 1 << exp 2 est la mˆme chose (si << 1 apparaˆ exp 2 fois) que e ıt ((exp 1 << 1) << 1) ... << 1 Remarque analogue pour le d´calage ` droite >>. e a Les bits sortants sont perdus. Les bits entrants sont : – dans le cas du d´calage ` gauche, des z´ros ; e a e e a e e e – dans le cas du d´calage ` droite : si exp 1 est d’un type non sign´, des z´ros ; si exp 1 est d’un type sign´, des copies du bit de signe18 . Par exemple, si on suppose que la valeur de exp 1 est cod´e sur huit bits, not´s e e b7b6b5b4b3b2b1b0 (chaque bi vaut 0 ou 1), alors exp 1 << 1 exp 1 >> 1 exp 1 >> 1 ≡ ≡ ≡ b6b5b4b3b2b1b00 0b 7 b 6 b 5 b 4 b 3 b 2 b 1 b7b7b6b5b4b3b2b1 (cas non sign´) e (cas sign´) e

Avant l’´valuation du r´sultat, les op´randes subissent les conversions usuelles (cf. section 2.3.1). Ces exe e e pressions ne sont pas des lvalue. Remarque. Les op´rateurs de d´calage de bits ne sont pas des op´rations abstraites (cf. section 2.3.3). La e e e portabilit´ d’un programme o` ils figurent n’est donc pas assur´e. e u e 2.2.15 Comparaisons == != < <= > >=

Il s’agit des comparaisons usuelles : ´gal, diff´rent, inf´rieur, inf´rieur ou ´gal, sup´rieur, sup´rieur ou ´gal. e e e e e e e e Format :    ==      !=         < exp1 exp2  <=       >        >= exp 1 et exp 2 doivent ˆtre d’un type simple (nombre ou pointeur). Cette expression repr´sente l’un des ´l´ments e e ee (de type int) 1 ou 0 selon que la relation indiqu´e est ou non v´rifi´e par les valeurs de exp 1 et exp 2 . e e e Avant la prise en compte de l’op´rateur, les op´randes subissent les conversions usuelles (cf. section 2.3.1). e e Ces expressions ne sont pas des lvalue. Notez que, contrairement ` ce qui se passe en Pascal, ces op´rateurs ont une priorit´ sup´rieure ` celle des a e e e a connecteurs logiques, ce qui ´vite beaucoup de parenth`ses disgracieuses. Ainsi, en C, l’expression e e 0 <= x && x < 10 est correctement ´crite. e ˆ ˆ A propos de  etre vrai  et  etre non nul . Comme on a dit (cf. section 1.4.1), le type bool´en e
17 Par convention la droite d’un nombre cod´ en binaire est le cˆt´ des bits de poids faible (les unit´s) tandis que la gauche est e o e e celui des bits de poids forts (correspondant aux puissances 2k avec k grand). 18 De cette mani`re le d´calage ` gauche correspond (sauf d´bordement) ` la multiplication par 2exp2 , tandis que le d´calage ` e a e e a e a droite correspond ` la division enti`re par 2exp2 , aussi bien si exp 1 est sign´e que si elle est non sign´e a e e e

28

c H. Garreta, 1988-2006

´ 2 OPERATEURS ET EXPRESSIONS

2.2

Pr´sentation d´taill´e des op´rateurs e e e e

n’existe pas en C. N’importe quelle expression peut occuper la place d’une condition ; elle sera tenue pour fausse si elle est nulle, pour vraie dans tous les autres cas. Une cons´quence de ce fait est la suivante : ` la place de e a if (i != 0) etc. while (*ptchar != ’\0’) etc. for (p = liste; p != NULL; p = p->suiv) etc. on peut ´crire respectivement e if (i) etc. while (*ptchar) etc. for (p = liste; p; p = p->suiv) etc. On admet g´n´ralement qu’` cause de propri´t´s techniques des processeurs, ces expressions raccourcies e e a ee repr´sentent une certaine optimisation des programmes. C’est pourquoi les premiers programmeurs C, qui ne e disposaient que de compilateurs simples, ont pris l’habitude de les utiliser largement. On ne peut plus aujourd’hui conseiller cette pratique. En effet, les compilateurs actuels sont suffisamment perfectionn´s pour effectuer e spontan´ment cette sorte d’optimisations et il n’y a plus aucune justification de l’emploi de ces comparaisons e implicites qui rendent les programmes bien moins expressifs. Attention. La relation d’´galit´ se note ==, non =. Voici une faute possible chez les nouveaux venus ` C e e a en provenance de Pascal qui, pour traduire le bout de Pascal if a = 0 then etc., ´crivent e if (a = 0) etc. Du point de vue syntaxique cette construction est correcte, mais elle est loin d’avoir l’effet escompt´. En tant e qu’expression, a = 0 vaut 0 (avec, comme effet de bord, la mise ` z´ro de a). Bien sˆr, il fallait ´crire a e u e if (a == 0) etc.

2.2.16

Op´rateurs de bits & | ^ e et ou exclusif sur les bits des repr´sentations internes e    exp2

Ces op´rateurs d´signent les op´rations logiques et, ou e e e des valeurs des op´randes. Format : e   & | exp1  ^

exp 1 et exp 2 doivent ˆtre d’un type entier. Cette expression repr´sente un objet de type entier dont le codage e e interne est construit bit par bit ` partir des bits correspondants des valeurs de exp 1 et exp 2 , selon la table a suivante, dans laquelle (exp)i signifie  le ieme bit de exp  : (exp 1 )i 0 0 1 1 (exp 2 )i 0 1 0 1 (exp 1 & exp 2 )i 0 0 0 1 (exp 1 ^ exp 2 )i 0 1 1 0 (exp 1 | exp 2 )i 0 1 1 1

Avant l’´valuation du r´sultat, les op´randes subissent les conversions usuelles (cf. section 2.3.1). Ces exe e e pressions ne sont pas des lvalue. Exemple. Il n’y a pas beaucoup d’exemples  de haut niveau 19 d’utilisation de ces op´rateurs. Le plus e utile est sans doute la r´alisation d’ensembles de nombres naturels inf´rieurs ` une certaine constante pas trop e e a grande, c’est-`-dire des sous-ensembles de l’intervalle d’entiers [ 0 ... N − 1 ], N valant 8, 16 ou 32. a Par exemple, les biblioth`ques graphiques comportent souvent une fonction qui effectue l’affichage d’un texte e affect´ d’un ensemble d’attributs (gras, italique, soulign´, capitalis´, etc.). Cela ressemble ` ceci : e e e a void afficher(char *texte, unsigned long attributs); Pour faire en sorte que l’argument attributs puisse repr´senter un ensemble d’attributs quelconque, on e associe les attributs ` des entiers conventionnels : a
19 En effet, ces op´rateurs sont principalement destin´s ` l’´criture de logiciel de bas niveau, comme les pilotes de p´riph´rique e e a e e e (les c´l`bres  drivers ), c’est-`-dire des programmes qui re¸oivent les informations transmises par les composants mat´riels ou qui ee a c e commandent le fonctionnement de ces derniers. Dans de telles applications on est souvent aux pries avec des nombres dont chaque bit a une signification propre, ind´pendante des autres. Ces programmes sortent du cadre de ce cours. e

c H. Garreta, 1988-2006

29

2.2 Pr´sentation d´taill´e des op´rateurs e e e e

2

´ OPERATEURS ET EXPRESSIONS

#define GRAS 1 /* en binaire: 00...000001 */ #define ITALIQUE 2 /* en binaire: 00...000010 */ #define SOULIGNE 4 /* en binaire: 00...000100 */ #define CAPITALISE 8 /* en binaire: 00...001000 */ etc. Les valeurs utilis´es pour repr´senter les attributs sont des puissances de 2 distinctes, c’est-`-dire des nombres e e a qui, ´crits en binaire, comportent un seul 1 plac´ diff´remment de l’un ` l’autre. e e e a L’utilisateur d’une telle fonction emploie l’op´rateur | pour composer, lors de l’appel, l’ensemble d’attributs e qu’il souhaite : afficher("Bonjour", GRAS | SOULIGNE); /* affichage en gras et italique */ (avec les constantes de notre exemple, la valeur de l’expression GRAS | SOULIGNE est un nombre qui, en binaire, s’´crit 00...000101). e De son cˆt´, le concepteur de la fonction utilise l’op´rateur & pour savoir si un attribut appartient ou non ` oe e a l’ensemble donn´ : e ... if ((attributs & GRAS) != 0) prendre les dispositions n´cessaires pour afficher en gras e else if ((attributs & ITALIQUE) != 0) prendre les dispositions n´cessaires pour afficher en italique e ...

2.2.17

Connecteurs logiques && et ||

Op´rations : conjonction et disjonction. Format : e exp1 && || exp2

exp 1 et exp 2 sont deux expressions de n’importe quel type. Cette expression repr´sente un ´l´ment de type int e ee parmi { 0, 1 } d´fini de la mani`re suivante : e e Pour ´valuer exp 1 && exp 2 : exp 1 est ´valu´e d’abord et e e e – si la valeur de exp 1 est nulle, exp 2 n’est pas ´valu´e et exp 1 && exp 2 vaut 0 ; e e – sinon exp 2 est ´valu´e et exp 1 && exp 2 vaut 0 ou 1 selon que la valeur de exp 2 est nulle ou non. e e Pour ´valuer exp 1 || exp 2 : exp 1 est ´valu´e d’abord et e e e – si la valeur de exp 1 est non nulle, exp 2 n’est pas ´valu´e et exp 1 || exp 2 vaut 1 ; e e – sinon exp 2 est ´valu´e et exp 1 || exp 2 vaut 0 ou 1 selon que la valeur de exp 2 est nulle ou non. e e Ces expressions ne sont pas des lvalue. Applications. Ainsi, C garantit que le premier op´rande sera ´valu´ d’abord et que, s’il suffit ` d´terminer e e e a e le r´sultat de la conjonction ou de la disjonction, alors le second op´rande ne sera mˆme pas ´valu´. Pour le e e e e e programmeur, cela est une bonne nouvelle. En effet, il n’est pas rare qu’on ´crive des conjonctions dont le e premier op´rande  prot`ge  (dans l’esprit du programmeur) le second ; si cette protection ne fait pas partie e e de la s´mantique de l’op´rateur pour le langage utilis´, le programme r´sultant peut ˆtre faux. Consid´rons e e e e e e l’exemple suivant : un certain tableau table est form´ de nombre chaˆ e ınes de caract`res ; soit ch une variable e chaˆ L’op´ration  recherche de ch dans table  peut s’´crire : ıne. e e ... i = 0; while (i < nombre && strcmp(table[i], ch) != 0) i++; ... Ce programme est juste parce que la condition strcmp(table[i], ch) != 0 n’est ´valu´e qu’apr`s avoir v´rifi´ e e e e e que la condition i < nombre est vraie (un appel de strcmp(table[i], ch) avec un premier argument table[i] invalide peut avoir des cons´quences tout ` fait d´sastreuses). e a e Une autre cons´quence de cette mani`re de concevoir && et || est stylistique. En C la conjonction et la e e disjonction s’´valuent dans l’esprit des instructions plus que dans celui des op´rations. L’application pratique de e e cela est la possibilit´ d’´crire sous une forme fonctionnelle des algorithmes qui dans d’autres langages seraient e e 30
c H. Garreta, 1988-2006

´ 2 OPERATEURS ET EXPRESSIONS

2.2

Pr´sentation d´taill´e des op´rateurs e e e e

s´quentiels. Voici un exemple : le pr´dicat qui caract´rise la pr´sence d’un ´l´ment dans une liste chaˆ ee. Version e e e e ee ın´ (r´cursive) habituelle : e int present(INFO x, LISTE L) { /* l’information x est-elle dans la liste L ? */ if (L == NULL) return 0; else if (L->info == x) return 1; else return present(x, L->suivant); } Version dans un style fonctionnel, permise par la s´mantique des op´rateurs && et || : e e int existe(INFO x, LISTE L) { /* l’information x est-elle dans la liste L ? */ return L != NULL && (x == L->info || existe(x, L->suivant)); } 2.2.18 Expression conditionnelle ? :

Op´ration : sorte de if...then...else... pr´sent´ sous forme d’expression, c’est-`-dire renvoyant une valeur. e e e a Format : exp 0 ? exp 1 : exp 2 exp 0 est d’un type quelconque. exp 1 et exp 2 doivent ˆtre de types compatibles. Cette expression est ´valu´e de e e e la mani`re suivante : e La condition exp 0 est ´valu´e d’abord e e – si sa valeur est non nulle, exp 1 est ´valu´e et d´finit la valeur de l’expression conditionnelle. Dans ce cas, e e e exp 2 n’est pas ´valu´e ; e e – sinon, exp 2 est ´valu´e et d´finit la valeur de l’expression conditionnelle. Dans ce cas, exp 1 n’est pas e e e ´valu´e. e e L’expression exp 0 ?exp 1 :exp 2 n’est pas une lvalue. Exemple. L’op´rateur conditionnel n’est pas forc´ment plus facile ` lire que l’instruction conditionnelle, mais e e a permet quelquefois de r´els all´gements du code. Imaginons un programme devant afficher un des textes non e e ou oui selon que la valeur d’une variable reponse est nulle ou non. Solutions classiques de ce micro-probl`me : e if (reponse) printf("la r´ponse est oui"); e else printf("la r´ponse est non"); e ou bien, avec une variable auxiliaire : char *texte; ... if (reponse) texte = "oui"; else texte = "non"; printf("la r´ponse est %s", texte); e Avec l’op´rateur conditionnel c’est bien plus compact : e printf("la r´ponse est %s", reponse ? "oui" : "non"); e 2.2.19 Affectation =

Op´ration : affectation, consid´r´e comme une expression. Format : e ee exp 1 = exp 2 exp 1 doit ˆtre une lvalue. Soit type 1 le type de exp 1 ; l’affectation ci-dessus repr´sente le mˆme objet que e e e ( type 1 ) exp 2
c H. Garreta, 1988-2006

31

2.2 Pr´sentation d´taill´e des op´rateurs e e e e

2

´ OPERATEURS ET EXPRESSIONS

(la valeur de exp 2 convertie dans le type de exp 1 ), avec pour effet de bord le rangement de cette valeur dans l’emplacement de la m´moire d´termin´ par exp 1 . e e e L’expression exp 1 = exp 2 n’est pas une lvalue. Contrairement ` ce qui se passe dans d’autres langages, une affectation est donc consid´r´e en C comme a ee une expression : elle  fait  quelque chose, mais aussi elle  vaut  une certaine valeur et, ` ce titre, elle peut a figurer comme op´rande dans une sur-expression. On en d´duit la possibilit´ des affectations multiples, comme e e e dans l’expression : a = b = c = 0; comprise comme a = (b = (c = 0)). Elle aura donc le mˆme effet que les trois affectations a = 0 ; b = 0 ; e c = 0 ; Autre exemple, lecture et traitement d’une suite de caract`res dont la fin est indiqu´e par un point : e e ... while ((c = getchar()) != ’.’) exploitation de c ... Des contraintes p`sent sur les types des deux op´randes d’une affectation exp 1 = exp 2 . Lorsqu’elles sont e e satisfaites on dit que exp 1 et exp 2 sont compatibles pour l’affectation. Essentiellement : – deux types num´riques sont toujours compatibles pour l’affectation. La valeur de exp 2 subit ´ventuellement e e une conversion avant d’ˆtre rang´e dans exp 1 . La mani`re de faire cette conversion est la mˆme que dans e e e e le cas de l’op´rateur de conversion (cf. section 2.2.12) ; e – si exp 1 et exp 2 sont de types adresses distincts, certains compilateurs (dont ceux conformes ` la norme a ANSI) les consid´reront comme incompatibles tandis que d’autres compilateurs se limiteront ` donner un e a message d’avertissement lors de l’affectation de exp 2 ` exp 1 ; a – dans les autres cas, exp 1 et exp 2 sont compatibles pour l’affectation si et seulement si elles sont de mˆme e type. D’autre part, de la signification du nom d’une variable de type tableau (cf. 5.1.1) et de celle d’une variable de type structure (cf. 5.2.1) on d´duit que : e – on ne peut affecter un tableau ` un autre, mˆme s’ils sont d´finis de mani`re rigoureusement identique a e e e (un nom de tableau n’est pas une lvalue) ; – on peut affecter le contenu d’une variable de type structure ou union ` une autre, ` la condition qu’elles a a aient ´t´ explicitement d´clar´es comme ayant exactement le mˆme type. ee e e e

2.2.20

Autres op´rateurs d’affectation += *= etc. e

Op´ration binaire vue comme une modification du premier op´rande. Format : e e                 exp1                += -= *= /= %= >>= <<= &= ^= |=                                exp2

exp 1 doit ˆtre une lvalue. Cela fonctionne de la mani`re suivante : si • repr´sente l’un des op´rateurs + - * / % e e e e >> << & ^ |, alors exp 1 • = exp 2 peut ˆtre vue comme ayant la mˆme valeur et le mˆme effet que e e e exp 1 = exp 1 • exp 2 mais avec une seule ´valuation de exp 1 . L’expression r´sultante n’est pas une lvalue. e e ´ Exemple. Ecrivons la version it´rative usuelle de la fonction qui calcule xn avec x flottant et n entier non e n´gatif : e 32
c H. Garreta, 1988-2006

´ 2 OPERATEURS ET EXPRESSIONS

2.2

Pr´sentation d´taill´e des op´rateurs e e e e

double puissance(double x, int n) { double p = 1; while (n != 0) { if (n % 2 != 0) /* n est-il impair ? */ p *= x; x *= x; n /= 2; } return p; } Remarque. En examinant ce programme, on peut faire les mˆmes commentaires qu’` l’occasion de plusieurs e a autres ´l´ments du langage C : ee – l’emploi de ces op´rateurs constitue une certaine optimisation du programme. En langage machine, la e suite d’instructions qui traduit textuellement a += c est plus courte que celle qui correspond ` a = b a + c. Or, un compilateur rustique traitera a = a + c comme un cas particulier de a = b + c, sans voir l’´quivalence avec la premi`re forme. e e – h´las, l’emploi de ces op´rateurs rend les programmes plus denses et moins faciles ` lire, ce qui favorise e e a l’apparition d’erreurs de programmation. – de nos jours les compilateurs de C sont devenus assez perfectionn´s pour d´celer automatiquement la pose e sibilit´ de telles optimisations. Par cons´quent, l’argument de l’efficacit´ ne justifie plus qu’on obscurcisse e e e un programme par l’emploi de tels op´rateurs. e Il faut savoir cependant qu’il existe des situations o` l’emploi de ces op´rateurs n’est pas qu’une question u e d’efficacit´. En effet, si exp 1 est une expression sans effet de bord, alors les expressions exp 1 • = exp 2 et exp 1 e = exp 1 • exp 2 sont r´ellement ´quivalentes. Mais ce n’est plus le cas si exp 1 a un effet de bord. Il est clair, e e par exemple, que les deux expressions suivantes ne sont pas ´quivalentes (la premi`re est tout simplement e e erron´e)20 : e nombre[rand() % 100] = nombre[rand() % 100] + 1; nombre[rand() % 100] += 1; /* ERRONE ! */ /* CORRECT */

2.2.21

L’op´rateur virgule , e

Op´ration : ´valuation en s´quence. Format : e e e exp 1 , exp 2 exp 1 et exp 2 sont quelconques. L’´valuation de exp 1 , exp 2 consiste en l’´valuation de exp 1 suivie de l’´valuation e e e de exp 2 . L’expression exp 1 , exp 2 poss`de le type et la valeur de exp 2 ; le r´sultat de l’´valuation de exp 1 est e e e  oubli´ , mais non son ´ventuel effet de bord (cet op´rateur n’est utile que si exp 1 a un effet de bord). e e e L’expression exp 1 , exp 2 n’est pas une lvalue. Exemple. Un cas fr´quent d’utilisation de cet op´rateur concerne la boucle for (cf. section 3.2.6), dont la e e syntaxe requiert exactement trois expressions ` trois endroits bien pr´cis. Parfois, certaines de ces expressions a e doivent ˆtre doubl´es : e e ... for (pr = NULL, p = liste; p != NULL; pr = p, p = p->suivant) if (p->valeur == x) break; ... Remarque syntaxique. Dans des contextes o` des virgules apparaissent normalement, par exemple lors u d’un appel de fonction, des parenth`ses sont requises afin de forcer le compilateur ` reconnaˆ e a ıtre l’op´rateur e virgule. Par exemple, l’expression uneFonction(exp 1 , (exp 2 , exp 3 ), exp 4 ); repr´sente un appel de uneFonction avec trois arguments effectifs : les valeurs de exp 1 , exp 3 et exp 4 . Au passage, e l’expression exp 2 aura ´t´ ´valu´e. Il est certain que exp 2 aura ´t´ ´valu´e avant exp 3 , mais les sp´cifications du eee e eee e e langage ne permettent pas de placer les ´valuations de exp 1 et exp 4 par rapport ` celles de exp 2 et exp 3 . e a
20 La

fonction rand() renvoie un entier al´atoire distinct chaque fois qu’elle est appel´e. e e

c H. Garreta, 1988-2006

33

2.3 Autres remarques

2

´ OPERATEURS ET EXPRESSIONS

2.3
2.3.1

Autres remarques
Les conversions usuelles

Les r`gles suivantes s’appliquent aux expressions construites ` l’aide d’un des op´rateurs *, /, %, +, -, <, <=, e a e >, >=, ==, !=, &, ^, |, && et ||. Mutatis mutandis, elles s’appliquent aussi ` celles construites avec les op´rateurs a e *=, /=, %=, +=, -=, <<=, >>=, &=, ^= et |=. Dans ces expressions, les op´randes subissent certaines conversions avant que l’expression ne soit ´valu´e. e e e En C ANSI ces conversions, dans l’ ordre  logique  o` elles sont faites, sont les suivantes : u – Si un des op´randes est de type long double, convertir l’autre dans le type long double ; le type de e l’expression sera long double. – Sinon, si un des op´randes est de type double, convertir l’autre dans le type double ; le type de l’expression e sera double. e – Sinon, si un des op´randes est de type float, convertir l’autre dans le type float ; le type de l’expression sera float21 . – Effectuer la promotion enti`re : convertir les char, les short, les ´num´rations et les champs de bits en e e e des int. Si l’une des valeurs ne peut pas ˆtre repr´sent´e dans le type int, les convertir toutes dans le e e e type unsigned int. – Ensuite, si un des op´randes est unsigned long, convertir l’autre en unsigned long ; le type de l’exprese sion sera unsigned long. – Sinon, si un des op´randes est long et l’autre unsigned int22 : e – si un long peut repr´senter toutes les valeurs unsigned int, alors convertir l’op´rande de type unsigned e e int en long. Le type de l’expression sera long ; e – sinon, convertir les deux op´randes en unsigned long. Le type de l’expression sera unsigned long. – Sinon, si un des op´randes est de type long, convertir l’autre en long ; le type de l’expression sera long. e – Sinon, si un des op´randes est de type unsigned int, convertir l’autre en unsigned int ; le type de l’exe pression sera unsigned int. – Sinon, et si l’expression est correcte, c’est que les deux op´randes sont de type int ; le type de l’expression e sera int. 2.3.2 L’ordre d’´valuation des expressions e

Les seules expressions pour lesquelles l’ordre (chronologique) d’´valuation des op´randes est sp´cifi´ sont les e e e e suivantes : –  exp 1 && exp 2  et  exp 1 || exp 2  : exp 1 est ´valu´e d’abord ; exp 2 n’est ´valu´e que si la valeur de exp 1 e e e e ne permet pas de conclure ; –  exp 0 ? exp 1 : exp 2  exp 0 est ´valu´e d’abord. Une seule des expressions exp 1 ou exp 2 est ´valu´e e e e e ensuite ; –  exp 0 , exp 0  : exp 1 est ´valu´e d’abord, exp 2 est ´valu´e ensuite. e e e e Dans tous les autres cas, C ne garantit pas l’ordre chronologique dans lequel les op´randes intervenant e dans une expression ou les arguments effectifs d’un appel de fonction sont ´valu´s ; il ne faut donc pas faire e e d’hypoth`se ` ce sujet. La question ne se pose que lorsque ces op´randes et arguments sont ` leur tour des e a e a expressions complexes ; elle est importante dans la mesure o` C favorise la programmation avec des effets de u bord. Par exemple, si i vaut 1, l’expression a[i] + b[i++] peut aussi bien additionner a[1] et b[1] que a[2] et b[1]. L’ordre d’´valuation des op´randes d’une affectation n’est pas fix´ non plus. Pour ´valuer exp 1 = exp 2 , on e e e e peut ´valuer d’abord l’adresse de exp 1 et ensuite la valeur de exp 2 , ou bien faire l’inverse. Ainsi, le r´sultat de e e l’affectation a[i] = b[i++] est impr´visible. e 2.3.3 Les op´rations non abstraites e

Beaucoup d’op´rateurs ´tudi´s dans cette section (op´rateurs arithm´tiques, comparaisons, logiques, etc.) e e e e e repr´sentent des op´rations abstraites, c’est-`-dire poss´dant une d´finition formelle qui ne fait pas intervenir e e a e e les particularit´s de l’implantation du langage. Bien sˆr, les op´randes sont repr´sent´s dans la machine par des e u e e e
21 Cette r`gle est apparue avec le C ANSI : le compilateur accepte de faire des calculs sur des flottants en simple pr´cision. Dans e e le C original, elle s’´nonce plus simplement :  sinon, si l’un des op´randes est de type float, convertir les deux op´randes dans le e e e type double ; le type de l’expression sera double . 22 Cette r`gle compliqu´e est apparue avec le C ANSI. En C original, le type unsigned  tire vers lui  les autres types. e e

34

c H. Garreta, 1988-2006

´ 2 OPERATEURS ET EXPRESSIONS

2.3

Autres remarques

configurations de bits, mais seule leur interpr´tation comme des entit´s de niveau sup´rieur (nombres entiers, e e e flottants...) est utile pour d´finir l’effet de l’op´ration en question ou les contraintes qu’elle subit. e e A l’oppos´, un petit nombre d’op´rateurs, le compl´ment ` un (~), les d´calages (<< et >>) et les op´rations e e e a e e bit-`-bit (&, ^ et |), n’ont pas forc´ment de signification abstraite. Les transformations qu’ils effectuent sont a e d´finies au niveau des bits constituant le codage des op´randes, non au niveau des nombres que ces op´randes e e e repr´sentent. De telles op´rations sont r´serv´es aux programmes qui remplissent des fonctions de tr`s bas e e e e e niveau, c’est-`-dire qui sont aux points de contact entre la composante logicielle et la composante mat´rielle a e d’un syst`me informatique. e L’aspect de cette question qui nous int´resse le plus ici est celui-ci : la portabilit´ des programmes contenant e e des op´rations non abstraites n’est pas assur´e. Ce d´faut, qui n’est pas r´dhibitoire dans l’´criture de fonctions e e e e e de bas niveau (ces fonctions ne sont pas destin´es ` ˆtre port´es), doit rendre le programmeur tr`s pr´cautionneux e ae e e e d`s qu’il s’agit d’utiliser ces op´rateurs dans des programmes de niveau sup´rieur, et le pousser ` : e e e a – isoler les op´rations non abstraites dans des fonctions de petite taille bien rep´r´es ; e ee – documenter soigneusement ces fonctions ; – constituer des jeux de tests validant chacune de ces fonctions.

c H. Garreta, 1988-2006

35

3

INSTRUCTIONS

3
3.1

Instructions
Syntaxe

Dans les descriptions syntaxiques suivantes le suffixe  opt  indique que la formule qu’il qualifie est optionnelle. Une formule avec des points de suspension, comme  ´l´ment ... ´l´ment , indique un ´l´ment pouvant ee ee ee apparaˆ un nombre quelconque, ´ventuellement nul, de fois. ıtre e instruction → instruction-bloc → instruction-expression → instruction-goto → instruction-if → instruction-while → instruction-do → instruction-for → instruction-break → instruction-continue → instruction-switch → instruction-return → instruction-vide → identificateur : instruction instruction-bloc → { d´claration ... d´claration e e instruction ... instruction } instruction-expression → expression ; instruction-goto → goto identif ; instruction-if → if ( expression ) instruction else instruction → if ( expression ) instruction instruction-while → while ( expression ) instruction instruction-do → do instuction while ( expression ) ; instruction-for → for ( expression opt ; expression opt ; expression opt ) instruction instruction-break → break ; instruction-continue → continue ; instruction-switch → switch ( expression ) { instruction-ou-case ... instruction-ou-case } instruction-ou-case → case expression-constante : instruction opt → default : instruction → instruction instruction-return → return expression opt ; instruction-vide → ; C et le point-virgule. Comme l’indique la syntaxe de l’instruction-bloc, en C le point-virgule n’est pas 36
c H. Garreta, 1988-2006

3 INSTRUCTIONS

3.2

Pr´sentation d´taill´e des instructions e e e

un s´parateur d’instructions mais un terminateur de certaines instructions. Autrement dit, il appartient ` la e a syntaxe de chaque instruction de pr´ciser si elle doit ou non ˆtre termin´e par un point-virgule, ind´pendamment e e e e de ce par quoi l’instruction est suivie dans le programme. L’oubli du point-virgule ` la fin d’une instruction qui en requiert un est toujours une erreur, quelle que soit a la situation de cette instruction. Un surnombre de points-virgules cr´e des instructions vides. e

3.2
3.2.1

Pr´sentation d´taill´e des instructions e e e
Blocs

Un bloc est une suite de d´clarations et d’instructions encadr´e par les deux accolades { et }. Du point de e e vue de la syntaxe il se comporte comme une instruction unique et peut figurer en tout endroit o` une instruction u simple est permise. Le bloc le plus ext´rieur d’une fonction et les autres blocs plus profonds ont le mˆme statut. En particulier, e e quelle que soit sa position dans le programme, un bloc peut comporter ses propres d´clarations de variables. Sauf e si elle est d´clar´e extern, une variable d´finie dans un bloc est locale ` ce bloc et donc inconnue ` l’ext´rieur. e e e a a e Dans le bloc o` elle est d´finie, une telle variable masque, sans le d´truire, tout autre objet de mˆme nom connu u e e e a ` l’ext´rieur du bloc. e Sauf si elles sont qualifi´es static (ou extern), de telles variables sont cr´´es et ´ventuellement initialis´es e ee e e lors de l’activation du bloc ; elles sont d´truites d`s que le contrˆle quitte le bloc. Il ne faut donc pas esp´rer e e o e qu’une telle variable conserve sa valeur entre deux passages dans le bloc. Les variables locales aux blocs permettent d’optimiser la gestion de l’espace local. Par exemple, dans un programme tel que if (...) { type 1 n; ... } else { type 2 x; ... } les variables n et x n’existeront jamais simultan´ment ; le compilateur peut donc leur allouer le mˆme emplacee e ment de la m´moire. e

3.2.2

Instruction-expression

Format : expression ; Mais oui, il suffit d’´crire un point-virgule derri`re n’importe quelle expression pour en faire une instruction. e e Exemples : 123; i++; x = 2 * x + 3; printf("%d\n", n); a b c d

Intuitivement, une instruction-expression repr´sente l’ordre  ´valuez cette expression, ensuite oubliez le e e r´sultat . Il est clair que si l’expression n’a pas d’effet de bord, cela n’aura servi ` rien (exemple a). L’aspect e a utile de cette notion est : toute expression avec effet de bord pourra ˆtre ´valu´e uniquement pour son effet de e e e bord (exemple b). Avec deux cas particuliers tr`s int´ressants : e e – puisque l’affectation est une expression, on retrouve bien l’instruction d’affectation, fondamentale dans tous les langages de programmation (exemple c) ; – toute fonction peut ˆtre appel´e  comme une proc´dure  (exemple23 d ), c’est-`-dire en ignorant la valeur e e e a qu’elle rend.
23 On

verra le moment venu (cf. section 7.2.5 d) que printf rend un r´sultat parfois utile. e

c H. Garreta, 1988-2006

37

3.2 Pr´sentation d´taill´e des instructions e e e

3

INSTRUCTIONS

Remarque. Une cons´quence regrettable de tout cela est un pi`ge assez vicieux tendu aux pascaliens. e e Imaginons que lirecaractere soit le nom d’une fonction sans argument. L’appel correct de cette fonction s’´crit : e lirecaractere(); Cependant, puisque le nom d’une fonction est une expression (une constante valant l’adresse de la fonctio) et que toute expression suivie d’un point-virgule est une instruction correcte, l’´nonc´ e e lirecaractere; sera trouv´ l´gal par le compilateur. Or cette expression (tout ` fait analogue ` l’exemple a ci-dessus) ne produit e e a a pas l’appel de la fonction et ne traduit donc probablement pas la pens´e du programmeur. e 3.2.3 Etiquettes et instruction goto

Format : ´tiquette : instruction e Une ´tiquette est un identificateur ; elle doit ˆtre plac´e devant une fonction, s´par´e de celle-ci par un e e e e e caract`re deux points. Elle n’a pas ` faire l’objet d’une d´claration explicite ; il suffit de l’´crire devant une e a e e instruction pour qu’elle soit automatiquement connue comme un nom ` port´e locale. Elle est alors utilisable a e partout dans la fonction o` elle apparaˆ (avant et apr`s l’instruction qu’elle pr´fixe) et elle reste inconnue en u ıt e e dehors de la fonction. L’instruction goto ´tiquette ; e transf`re le contrˆle ` l’instruction pr´fix´e par l’´tiquette en question. e o a e e e Th´oriquement, tout algorithme peut ˆtre programm´ sans utiliser l’instruction goto. Dans certains langages e e e comme Pascal, elle est utilis´e pour obtenir l’abandon d’une structure de contrˆle (exemple : une boucle) depuis e o l’int´rieur de la structure. Un tel emploi de goto est avantageusement remplac´ en C par l’utilisation des e e instructions return, break et continue. Il est donc rare que l’on ait besoin de l’instruction goto en C. Elle ne se r´v`le utile que lorsqu’il faut e e abandonner plusieurs structures de contrˆle (if, while, for...) imbriqu´es les unes dans les autres. Exemple : o e for (i = 0; i < N1; i++) { for (j = 0; j <= N2; j++) for (k = 0; k <= N2; k++) { ... if (...) goto grande_boucle; ... } ... grande_boucle: /* ici on a quitt´ les deux boucles internes (sur j et k) */ e ... /* mais on est toujours dans la boucle la plus externe (sur i) */ } 3.2.4 Instruction if...else...

Formats : if (expression) instruction 1 else instruction 2 et if (expression) instruction 1 Dans la premi`re forme, expression est ´valu´e : si elle est vraie (i.e. non nulle) instruction 1 est ex´cut´e ; e e e e e si elle est fausse (nulle) instruction 2 est ex´cut´e. Dans la deuxi`me forme, expression est ´valu´e : si elle est e e e e e vraie instruction 1 est ex´cut´e ; sinon, rien n’est ex´cut´. e e e e 38
c H. Garreta, 1988-2006

3 INSTRUCTIONS

3.2

Pr´sentation d´taill´e des instructions e e e

On notera que l’expression conditionnelle doit figurer entre parenth`ses. Celles-ci font partie de la syntaxe e du if, non de celle de l’expression. Lorsque plusieurs instructions if sont imbriqu´es, il est convenu que chaque else se rapporte au dernier e if pour lequel le compilateur a rencontr´ une condition suivie d’exactement une instruction. Le listing du e programme peut (et doit !) traduire cela par une indentation (marge blanche) expressive, mais il ne faut pas oublier que le compilateur ne tient pas compte des marges. Par exemple, le programme suivant est probablement incorrect ; en tout cas, son indentation ne traduit pas convenablement les rapports entre les if et les else : if (nombrePersonnes != 0) if (nombrePersonnes != nombreAdultes) printf("Il y a des enfants!"); else printf("Il n’y a personne!"); Ce probl`me se pose dans tous les langages qui offrent deux vari´t´s d’instruction conditionnelle. On le r´sout e ee e soit par l’utilisation d’instructions vides : if (nombrePersonnes != 0) if (nombrePersonnes != nombreAdultes) printf("Il y a des enfants!"); else ; else printf("Il n’y a personne!"); soit, plus simplement, en utilisant des blocs : if (nombrePersonnes != 0) { if (nombrePersonnes != nombreAdultes) printf("Il y a des enfants!"); } else printf("Il n’y a personne!"); Remarque. La syntaxe pr´voit exactement une instruction entre la condition et le else. Par cons´quent, un e e exc`s de points-virgules ` la suite de instruction 1 constitue une erreur. Voici une faute qu’on peut faire quand e a on d´bute : e if (nombrePersonnes != 0) { if (nombrePersonnes != nombreAdultes) printf("Il y a des enfants!"); }; else printf("Il n’y a personne!"); Il y a maintenant deux instructions entre la ligne du if et celle du else : une instruction-bloc { ... } et une instruction vide  ; . Le compilateur signalera donc une erreur sur le else. 3.2.5 Instructions while et do...while

Ces instructions correspondent respectivement aux instructions while...do... et repeat...until... du langage Pascal. Notez que la syntaxe exige que la condition figure entre parenth`ses. Formats : e while (expression) instruction et do instruction while (expression); Le fonctionnement de ces instructions est d´crit par les organigrammes de la figure 4. Fondamentalement, e il s’agit de r´it´rer l’ex´cution d’une certaine instruction tant qu’une certaine instruction, vue comme une e e e condition, reste vraie. Dans la structure while on v´rifie la condition avant d’ex´cuter l’instruction, tandis que e e dans la structure do...while on la v´rifie apr`s. e e
c H. Garreta, 1988-2006

39

3.2 Pr´sentation d´taill´e des instructions e e e

3

INSTRUCTIONS

expression != 0
oui non oui

instruction

instruction

expression != 0
non

suite du programme

suite du programme

Fig. 4 – Instruction while (` gauche) et do...while (` droite) a a

L’instruction do...while... ex´cute donc au moins une fois l’instruction qui constitue son corps avant e d’´valuer la condition de continuation. C’est en cela qu’elle est l’analogue de l’instruction repeat...until du e Pascal. Mais on notera que la condition figurant dans une instruction do...while ( faire tant que... ) et celle qui figurerait dans une instruction repeat...until ´quivalente ( r´p´ter jusqu’` ce que... ) sont inverses l’une e e e a de l’autre. 3.2.6 Instruction for

Format : for ( expr 1 ; expr 2 ; expr 3 ) instruction Par d´finition, cette construction ´quivaut strictement ` celle-ci : e e a expr 1 ; while (expr 2 ) { instruction expr 3 ; } Ainsi, dans la construction for(expr 1 ; expr 2 ; expr 3 ) : – expr 1 est l’expression qui effectue les initialisations n´cessaires avant l’entr´e dans la boucle ; e e e e e – expr 2 est le test de continuation de la boucle ; il est ´valu´ avant l’ex´cution du corps de la boucle ; – expr 3 est une expression (par exemple une incr´mentation) ´valu´e ` la fin du corps de la boucle. e e e a Par exemple, l’instruction Pascal : for i:=0 to 9 do t[i]:=0 se traduit tout naturellement en C for (i = 0; i < 10; i++) t[i] = 0; Les expressions expr 1 et expr 3 peuvent ˆtre absentes (les points-virgules doivent cependant apparaˆ e ıtre). Par exemple for ( ; expr 2 ; ) instruction ´quivaut ` e a while (expr 2 ) instruction La condition de continuation expr 2 peut elle aussi ˆtre absente. On consid`re alors qu’elle est toujours vraie. e e Ainsi, la boucle  ind´finie  peut se programmer : e for ( ; ; ) instruction Bien entendu, il faut dans ce cas que l’abandon de la boucle soit programm´ ` l’int´rieur de son corps (sinon ea e cette boucle ind´finie devient infinie !). Exemple : e 40
c H. Garreta, 1988-2006

3 INSTRUCTIONS

3.2

Pr´sentation d´taill´e des instructions e e e

for (;;) { printf("donne un nombre (0 pour sortir): "); scanf("%d", &n); if (n == 0) break; ... exploitation de la donn´e n e ... } Lorsque l’abandon de la boucle correspond aussi ` l’abandon de la proc´dure courante, break est avantaa e geusement remplac´e par return comme dans : e char *adresse_de_fin(char *ch) { /* renvoie adresse du caract`re qui suit la cha^ne ch */ e ı for (;;) if (*ch++ == 0) return ch; } 3.2.7 Instruction switch

Format : switch ( expression ) corps Le corps de l’instruction switch prend la forme d’un bloc {...} renfermant une suite d’instructions entre lesquelles se trouvent des constructions de la forme case expression-constante : ou bien default : Le fonctionnement de cette instruction est le suivant : expression est ´valu´e ; e e – s’il existe un ´nonc´ case avec une constante qui ´gale la valeur de expression, le contrˆle est transf´r´ ` e e e o eea l’instruction qui suit cet ´nonc´ ; e e – si un tel case n’existe pas, et si l’´nonc´ default existe, alors le contrˆle est transf´r´ ` l’instruction qui e e o eea suit l’´nonc´ default ; e e – si la valeur de expression ne correspond ` aucun case et s’il n’y a pas d’´nonc´ default, alors aucune a e e instruction n’est ex´cut´e. e e Attention. Lorsqu’il y a branchement r´ussi ` un ´nonc´ case, toutes les instructions qui le suivent sont e a e e ex´cut´es, jusqu’` la fin du bloc ou jusqu’` une instruction de rupture (break). Autrement dit, l’instruction e e a a switch s’apparente beaucoup plus ` une sorte de goto  param´tr´  (par la valeur de l’expression) qu’` a e e a l’instruction case...of... de Pascal. Exemple (idiot) : j = 0; switch (i) { case 3: j++; case 2: j++; case 1: j++; } Si on suppose que i ne peut prendre que les valeurs 0 ... 3, alors l’instruction ci-dessus a le mˆme effet que e l’affectation j = i. Pour obtenir un comportement similaire ` celui du case...of... de Pascal, on doit utiliser l’instruction a break, comme dans l’exemple suivant, dans lequel on compte la fr´quence de chaque chiffre et des caract`res e e blancs dans un texte :
c H. Garreta, 1988-2006

41

3.2 Pr´sentation d´taill´e des instructions e e e

3

INSTRUCTIONS

nb_blancs = nb_autres = 0; for (i = 0; i < 10; ) nb_chiffre[i++] = 0; while ((c = getchar()) != EOF) switch (c) { case ’0’: case ’1’: case ’2’: case ’3’: case ’4’: case ’5’: case ’6’: case ’7’: case ’8’: case ’9’: nb_chiffre[c - ’0’]++; break; case ’ ’: case ’\n’: case ’\t’: nb_blancs++; break; default: nb_autres++; }

3.2.8

Instructions break et continue

Formats : break; continue; Dans la port´e d’une structure de contrˆle (instructions for, while, do et switch), l’instruction break e o provoque l’abandon de la structure et le passage ` l’instruction ´crite imm´diatement derri`re. L’utilisation de a e e e break ailleurs qu’` l’int´rieur d’une de ces quatre instructions constitue une erreur (que le compilateur signale). a e Par exemple la construction for (expr 1 ; expr 2 ; expr 3 ) { ... break; ... } ´quivaut ` e a { for (expr 1 ; expr 2 ; expr 3 ) { ... goto sortie; ... } sortie: ; } L’instruction continue est moins souvent utilis´e. Dans la port´e d’une structure de contrˆle de type boucle e e o (while, do ou for), elle produit l’abandon de l’it´ration courante et, le cas ´ch´ant, le d´marrage de l’it´ration e e e e e suivante. Elle agit comme si les instructions qui se trouvent entre l’instruction continue et la fin du corps de la boucle avaient ´t´ supprim´es pour l’it´ration en cours : l’ex´cution continue par le test de la boucle (pr´c´d´, ee e e e e e e dans le cas de for, par l’ex´cution de l’expression d’incr´mentation). e e Lorsque plusieurs boucles sont imbriqu´es, c’est la plus profonde qui est concern´e par les instructions break e e et continue. Dans ce cas, l’emploi de ces instructions ne nous semble pas œuvrer pour la clart´ des programmes. e 42
c H. Garreta, 1988-2006

3 INSTRUCTIONS

3.2

Pr´sentation d´taill´e des instructions e e e

3.2.9

Instruction return

Formats : return expression ; et return ; Dans un cas comme dans l’autre l’instruction return provoque l’abandon de la fonction en cours et le retour a ` la fonction appelante. Dans la premi`re forme expression est ´valu´e ; son r´sultat est la valeur que la fonction renvoie ` la fonction e e e e a appelante ; c’est donc la valeur que l’appel de la fonction repr´sente dans l’expression o` il figure. Si n´cessaire, e u e la valeur de expression est convertie dans le type de la fonction (d´clar´ dans l’en-tˆte), les conversions autoris´es e e e e ´tant les mˆmes que celles faites ` l’occasion d’une affectation. e e a Dans la deuxi`me forme, la valeur retourn´e par la fonction reste ind´termin´e. On suppose dans ce cas que e e e e la fonction appelante n’utilise pas cette valeur ; il est donc prudent de d´clarer void cette fonction. e Absence d’instruction return dans une fonction. Lorsque la derni`re instruction (dans l’ordre de e l’ex´cution) d’une fonction est termin´e, le contrˆle est rendu ´galement ` la proc´dure appelante. Tout se passe e e o e a e comme si l’accolade fermante qui termine le corps de la fonction ´tait en r´alit´ ´crite sous la forme e e ee ... return; }

c H. Garreta, 1988-2006

43

4 FONCTIONS

4

Fonctions

Beaucoup de langages distinguent deux sortes de sous-programmes24 : les fonctions et les proc´dures. L’appel e d’une fonction est une expression, tandis que l’appel d’une proc´dure est une instruction. Ou, si on pr´f`re, e ee l’appel d’une fonction renvoie un r´sultat, alors que l’appel d’une proc´dure ne renvoie rien. e e En C on retrouve ces deux mani`res d’appeler les sous-programmes, mais du point de la syntaxe le langage e ne connaˆ que les fonctions. Autrement dit, un sous-programme est toujours suppos´ renvoyer une valeur, mˆme ıt e e lorsque celle-ci n’a pas de sens ou n’a pas ´t´ sp´cifi´e. C’est pourquoi on ne parlera ici que de fonctions. ee e e C’est dans la syntaxe et la s´mantique de la d´finition et de l’appel des fonctions que r´sident les principales e e e diff´rences entre le C original et le C ANSI. Nous expliquons principalement le C ANSI, rassemblant dans une e section sp´cifique (cf. section 4.2) la mani`re de faire du C original. e e

4.1
4.1.1

Syntaxe ANSI ou “avec prototype”
D´finition e

Une fonction se d´finit par la construction : e type opt ident ( d´claration-un-ident , ... d´claration-un-ident ) e e instruction-bloc Notez qu’il n’y a pas de point-virgule derri`re le “)” de la premi`re ligne. La pr´sence d’un point-virgule e e e a ` cet endroit provoquerait des erreurs bien bizarres, car la d´finition serait prise pour une d´claration (cf. e e section 4.1.4). La syntaxe indiqu´e ici est incompl`te ; elle ne convient qu’aux fonctions dont le type est d´fini simplement, e e e par un identificateur. On verra ult´rieurement (cf. section 5.4.1) la mani`re de d´clarer des fonctions rendant e e e un r´sultat d’un type plus complexe. e La premi`re ligne de la d´finition d’une fonction s’appelle l’en-tˆte, ou parfois le prototype, de la fonction. e e e Chaque formule d´claration-un-ident poss`de la mˆme syntaxe qu’une d´claration de variable25 . e e e e Exemple. int extract(char *dest, char *srce, int combien) { /* copie dans dest les combien premiers caract`res de srce */ e /* renvoie le nombre de caract`res effectivement copi´s e e */ int compteur; for (compteur = 0; compteur < combien && *srce != ’\0’; compteur++) *dest++ = *srce++; *dest = ’\0’; return compteur; } Contrairement ` d’autres langages, en C on ne peut pas d´finir une fonction ` l’int´rieur d’une autre : toutes a e a e les fonctions sont au mˆme niveau, c’est-`-dire globales. C’est le cas notamment de main, qui est une fonction e a comme les autres ayant pour seule particularit´ un nom convenu. e 4.1.2 Type de la fonction et des arguments

L’en-tˆte de la fonction d´finit le type des objets qu’elle renvoie. Ce peut ˆtre : e e e e – tout type num´rique ; – tout type pointeur ; – tout type struct ou union. Si le type de la fonction n’est pas indiqu´, le compilateur suppose qu’il s’agit d’une fonction ` r´sultat e a e entier. Ainsi, l’exemple pr´c´dent aurait aussi pu ˆtre ´crit de mani`re ´quivalente (mais cette pratique n’est e e e e e e pas conseill´e) : e
24 La notion de sous-programme (comme les procedures de Pascal, les subroutines de Fortran, etc.) est suppos´e ici connue du e lecteur. 25 Restriction : on n’a pas le droit de  mettre en facteur  un type commun ` plusieurs arguments. Ainsi, l’en-tˆte de la fonction a e extract donn´e en exemple ne peut pas s’´crire sous la forme char *extract(char *dest, *srce, int n). e e

44

c H. Garreta, 1988-2006

4 FONCTIONS

4.1

Syntaxe ANSI ou “avec prototype”

extract(char *dest, char *srce, int combien) etc. ´ Fonctions sans resultat. Lorsqu’une fonction ne renvoie pas une valeur, c’est-`-dire lorsqu’elle corresa pond plus ` une proc´dure qu’` une vraie fonction, il est prudent de la d´clarer comme rendant un objet de type a e a e voidvoid. Ce type est garanti incompatible avec tous les autres types : une tentative d’utilisation du r´sultat e de la fonction provoquera donc une erreur ` la compilation. Le programmeur se trouve ainsi ` l’abri d’une a a utilisation intempestive du r´sultat de la fonction. Exemple : e void extract(char *dest, char *srce, int combien) { /* copie dans dest les combien premiers caract`res de srce */ e /* maintenant cette fonction ne renvoie rien */ int compteur; for (compteur = 0; compteur < combien && *srce != ’\0’; compteur++) *dest++ = *srce++; *dest = ’\0’; } Fonctions sans arguments. Lorsqu’une fonction n’a pas d’arguments, sa d´finition prend la forme e type opt ident ( void ) instruction-bloc On notera que, sauf cas exceptionnel, on ne doit pas ´crire une paire de parenth`ses vide dans la d´claration ou e e e la d´finition d’une fonction. En effet, un en-tˆte de la forme e e type ident() ne signifie pas que la fonction n’a pas d’arguments, mais (cf. section 4.2.2) que le programmeur ne souhaite pas que ses appels soient contrˆl´s par le compilateur. oe 4.1.3 Appel des fonctions

L’appel d’une fonction se fait en ´crivant son nom, suivi d’une paire de parenth`ses contenant ´ventuellement e e e une liste d’arguments effectifs. Notez bien que les parenth`ses doivent toujours apparaˆ e ıtre, mˆme si la liste d’arguments est vide : si un e nom de fonction apparaˆ dans une expression sans les parenth`ses, alors il a la valeur d’une constante adresse ıt e (l’adresse de la fonction) et aucun appel de la fonction n’est effectu´. e Passage des arguments. En C, le passage des arguments se fait par valeur. Cela signifie que les arguments formels26 de la fonction repr´sentent d’authentiques variables locales initialis´es, lors de l’appel de la fonction, e e par les valeurs des arguments effectifs27 correspondants. Supposons qu’une fonction ait ´t´ d´clar´e ainsi ee e e type fonction ( type 1 arg formel 1 , ... type k arg formel k ) etc. alors, lors d’un appel tel que fonction ( arg effectif 1 , ... arg effectif k ) la transmission des valeurs des arguments se fait comme si on ex´cutait les affectations : e arg formel 1 = arg effectif 1 ... arg formel k = arg effectif k Cela a des cons´quences tr`s importantes : e e e e e – les erreurs dans le nombre des arguments effectifs sont d´tect´es et signal´es, – si le type d’un argument effectif n’est pas compatible avec celui de l’argument formel correspondant, une erreur est signal´e, e e e e – les valeurs des arguments effectifs subissent les conversions n´cessaires avant d’ˆtre rang´es dans les arguments formels correspondants (exactement les mˆmes conversions qui sont faites lors des affectations). e
26 Les arguments formels d’une fonction sont les identificateurs qui apparaissent dans la d´finition de la fonction, d´clar´s ` e e e a l’int´rieur de la paire de parenth`ses. e e 27 Les arguments effectifs d’un appel de fonction sont les expressions qui apparaissent dans l’expression d’appel, ´crites ` l’int´rieur e a e de la paire de parenth`ses caract´ristiques de l’appel. e e

c H. Garreta, 1988-2006

45

4.2 Syntaxe originale ou “sans prototype”

4

FONCTIONS

Remarque. Le langage ne sp´cifie pas l’ordre chronologique des ´valuations des arguments effectifs d’un e e appel de fonction. Ces derniers doivent donc ˆtre sans effets de bord les uns sur les autres. Par exemple, il est e impossible de pr´voir quelles sont les valeurs effectivement pass´es ` une fonction lors de l’appel : e e a x = une_fonction(t[i++], t[i++]); /* ERREUR !!! */ Si i0 est la valeur de i juste avant l’ex´cution de l’instruction ci-dessus, alors cet appel peut aussi bien e se traduire par une fonction(t[i0 ], t[i0 + 1]) que par une fonction(t[i0 + 1], t[i0 ]) ou mˆme par e une fonction(t[i0 ], t[i0 ]). Ce n’est sˆrement pas indiff´rent ! u e Appel d’une fonction inconnue. En C une fonction peut ˆtre appel´e alors qu’elle n’a pas ´t´ d´finie e e ee e (sous-entendu : entre le d´but du fichier et l’endroit o` l’appel figure). Le compilateur suppose alors e u – que la fonction renvoie un int, – que le nombre et les types des arguments formels de la fonction sont ceux qui correspondent aux arguments effectifs de l’appel (ce qui, en particulier, empˆche les contrˆles et conversions mentionn´s plus haut). e o e De plus, ces hypoth`ses sur la fonction constituent pour le compilateur une premi`re d´claration de la e e e fonction. Toute d´finition ou d´claration ult´rieure tant soit peu diff´rente sera qualifi´e de  red´claration e e e e e e ill´gale 28 . e Lorsque les hypoth`ses ci-dessus ne sont pas justes, en particulier lorsque la fonction ne renvoie pas un int, e il faut : – soit ´crire la d´finition de la fonction appel´e avant celle de la fonction appelante, e e e – soit ´crire, avant l’appel de la fonction, une d´claration externe de cette derni`re, comme expliqu´ ` la e e e ea section 4.1.4. 4.1.4 D´claration “externe” d’une fonction e

Une d´claration externe d’une fonction est une d´claration qui n’est pas en mˆme temps une d´finition. On e e e e  annonce  l’existence de la fonction (d´finie plus loin, ou dans un autre fichier) tout en pr´cisant le type de son e e r´sultat et le nombre et les types de ses arguments, mais on ne donne pas son corps, c’est-`-dire les instructions e a qui la composent. Cela se fait en ´crivant e – soit un en-tˆte identique ` celui qui figure dans la d´finition de la fonction (avec les noms des arguments e a e formels), suivi d’un point-virgule ; – soit la formule obtenue ` partir de l’en-tˆte pr´c´dent, en y supprimant les noms des arguments formels. a e e e Par exemple, si une fonction a ´t´ d´finie ainsi ee e void truc(char dest[80], char *srce, unsigned long n, float x) { corps de la fonction } alors des d´clarations externes correctes sont : e extern void truc(char dest[80], char *srce, unsigned long n, float x); ou ou extern void machin(char [80], char *, unsigned long, float); Ces expressions sont appel´es des prototypes de la fonction. Le mot extern est facultatif, mais le pointe virgule est essentiel. Dans la premi`re forme, les noms des arguments formels sont des identificateurs sans e aucune port´e. e

4.2
4.2.1

Syntaxe originale ou “sans prototype”
D´claration et d´finition e e

´ Definition. En syntaxe originale la d´finition d’une fonction prend la forme e type opt ident ( ident , ... ident ) d´claration ... d´claration e e instruction-bloc
28 C’est une erreur surprenante, car le programmeur, oubliant que l’appel de la fonction a entraˆ e une d´claration implicite, ın´ e con¸oit sa d´finition ou d´claration ult´rieure comme ´tant la premi`re d´claration de la fonction. c e e e e e e

46

c H. Garreta, 1988-2006

4 FONCTIONS

4.2

Syntaxe originale ou “sans prototype”

Les parenth`ses de l’en-tˆte ne contiennent ici que la liste des noms des arguments formels. Les d´clarations e e e de ces arguments se trouvent imm´diatement apr`s l’en-tˆte, avant l’accolade qui commence le corps de la e e e fonction. Exemple : int extract(dest, srce, combien) /* copie dans dest les combien premiers caract`res de srce */ e /* renvoie le nombre de caract`res effectivement copi´s e e */ char *dest, char *srce; int combien; { int compteur; for (compteur = 0; compteur < combien && *srce != ’\0’; compteur++) *dest++ = *srce++; *dest = ’\0’; return compteur; } ´ Declaration externe. En syntaxe originale, la d´claration externe de la fonction pr´c´dente prend une e e e des formes suivantes : extern int extract(); ou int extract(); Comme on le voit, ni les types, ni mˆme les noms, des arguments formels n’apparaissent dans une d´claration e e externe29 . 4.2.2 Appel

En syntaxe originale, lors d’un appel de la fonction le compilateur ne tient aucun compte ni du nombre ni des types des arguments formels 30 , indiqu´s lors de la d´finition de la fonction. Chaque argument est ´valu´ e e e e s´par´ment, puis e e – les valeurs des arguments effectifs de type char ou short sont converties dans le type int ; – les valeurs des arguments effectifs de type float sont converties dans le type double ; – les valeurs des arguments effectifs d’autres types sont laiss´es telles quelles. e Juste avant le transfert du contrˆle ` la fonction, ces valeurs sont copi´es dans les arguments formels coro a e respondants. Ou plus exactement, dans ce que la fonction appelante croit ˆtre les emplacements des arguments e formels de la fonction appel´e : il n’y a aucune v´rification de la concordance, ni en nombre ni en type, des e e arguments formels et des arguments effectifs. Cela est une source d’erreurs tr`s importante. Par exemple, la e fonction carre ayant ´t´ ainsi d´finie ee e double carre(x) double x; { return x * x; } l’appel x = carre(2); est erron´, car la fonction appelante d´pose la valeur enti`re 2 ` l’adresse du premier argument formel (qu’elle e e e a  croit  entier). Or la fonction appel´e croit recevoir le codage d’un nombre flottant double. Le r´sultat n’a e e aucun sens. Des appels corrects auraient ´t´ ee x = carre((double) 2); ou x = carre(2.0);
cons´quent, les d´clarations externes montr´es ici sont sans aucune utilit´, puisque int est le type suppos´ des fonctions e e e e e non d´clar´es. e e 30 Mais oui, vous avez bien lu ! C’est l` la principale caract´ristique de la s´mantique d’appel des fonctions du C original. a e e
29 Par

c H. Garreta, 1988-2006

47

4.3 Arguments des fonctions

4

FONCTIONS

4.2.3

Coexistence des deux syntaxes

A cˆt´ de ce que nous avons appel´ la syntaxe ANSI, la syntaxe originale pour la d´finition et la d´claration oe e e e externe des fonctions fait partie elle aussi du C ANSI ; de nos jours les programmeurs ont donc le choix entre l’une ou l’autre forme. Lorsque la fonction a ´t´ d´finie ou d´clar´e sous la syntaxe originale, les appels de ee e e e fonction sont faits sans v´rification ni conversion des arguments effectifs. Au contraire, lorsque la fonction a ´t´ e ee sp´cifi´e sous la syntaxe ANSI, ces contrˆles et conversions sont effectu´s. e e o e A cause de cette coexistence, si une fonction n’a pas d’argument, la d´finition de son en-tˆte en C ANSI doit e e s’´crire sous la forme bien peu heureuse : e type opt ident ( void ) car une paire de parenth`ses sans rien dedans signifierait non pas que la fonction n’a pas d’arguments, mais e qu’elle est d´clar´e sans prototype, c’est-`-dire que ses appels doivent ˆtre trait´s sans contrˆle des arguments. e e a e e o Exemples : int getchar(void); double moyenne(); /* une fonction sans arguments dont les appels seront contrˆl´s */ oe /* une fonction avec ou sans arguments, aux appels incontrˆl´s */ oe

4.3
4.3.1

Arguments des fonctions
Passage des arguments

L’id´e maˆ e ıtresse est qu’en C le passage des arguments des fonctions se fait toujours par valeur. Apr`s avoir fait e les conversions opportunes la valeur de chaque argument effectif est affect´e ` l’argument formel correspondant. e a Si l’argument effectif est d’un type simple (nombre, pointeur) ou d’un type struct ou union, sa valeur est recopi´e dans l’argument formel correspondant, quelle que soit sa taille, c’est-`-dire quel que soit le nombre e a d’octets qu’il faut recopier. 4.3.2 Arguments de type tableau

Apparaissant dans la partie ex´cutable d’un programme, le nom d’un tableau, et plus g´n´ralement toute e e e expression d´clar´e  tableau de T , est consid´r´e comme ayant pour type  adresse d’un T  et pour valeur e e ee l’adresse du premier ´l´ment du tableau. Cela ne fait pas intervenir la taille effective du tableau31 . Ainsi lorsqu’un ee argument effectif est un tableau, l’objet effectivement pass´ ` la fonction est uniquement l’adresse du premier ea ´l´ment et il suffit que l’espace r´serv´ dans la fonction pour un tel argument ait la taille, fixe, d’un pointeur. ee e e D’autre part, en C il n’est jamais v´rifi´ que les indices des tableaux appartiennent bien ` l’intervalle 0...N − 1 e e a d´termin´ par le nombre d’´l´ments indiqu´ dans la d´claration. Il en d´coule la propri´t´ suivante : e e ee e e e ee Dans la d´claration d’un argument formel t de type  tableau de T  : e – l’indication du nombre d’´l´ments de t est sans utilit´32 ; ee e – les formules  type t[ ]  et  type *t  sont tout ` fait ´quivalentes ; a e – la fonction pourra ˆtre appel´e indiff´remment avec un tableau ou un pointeur pour argument effectif. e e e Exemple. L’en-tˆte  vague  de la fonction suivante e int strlen(chaˆ de caract`res s) { ıne e int i = 0; while (s[i] != 0) i++; return i; } peut indiff´remment ˆtre concr´tis´e de l’une des trois mani`res suivantes : e e e e e int strlen(char s[80]) int strlen(char s[]) int strlen(char *s)
31 Il n’en est pas de mˆme lors de la d´finition, o` la taille du tableau ne peut pas ˆtre ignor´e (elle est indispensable pour e e u e e l’allocation de l’espace m´moire). e 32 Attention, cette question se complique notablement dans le cas des tableaux multidimensionnels. Cf. 6.2.3

48

c H. Garreta, 1988-2006

4 FONCTIONS

4.3

Arguments des fonctions

Dans les trois cas, si t est un tableau de char et p l’adresse d’un char, les trois appels suivants sont corrects : l1 = strlen(t); l2 = strlen(p); l3 = strlen("Bonjour"); A retenir : parce que les arguments effectifs sont pass´s par valeur, les tableaux sont pass´s par adresse. e e Passage par valeur des tableaux. Cependant, puisque les structures sont pass´es par valeur, elles e fournissent un moyen pour obtenir le passage par valeur d’un tableau, bien que les occasions o` cela est n´cessaire u e semblent assez rares. Il suffit de d´clarer le tableau comme le champ unique d’une structure  enveloppe  ne e servant qu’` cela. Exemple : a struct enveloppe { int t[100]; }; void possible_modification(struct enveloppe x) { x.t[50] = 2; } main() { struct enveloppe x; x.t[50] = 1; possible_modification(x); printf("%d\n", x.t[50]); } La valeur affich´e est 1, ce qui prouve que la fonction appel´e n’a modifi´ qu’une copie locale du tableau e e e envelopp´, c’est-`-dire que celui-ci a bien ´t´ pass´ par valeur (les structures seront vues ` la section 5.2.1). e a ee e a

4.3.3

Arguments par adresse

Les arguments qui sont d’un type simple (char, int, pointeur...) ou bien des struc ou des union sont toujours pass´s par valeur. Lorsque l’argument effectif est une variable, ce m´canisme empˆche qu’elle puisse e e e ˆtre modifi´e par la fonction appel´e. Or une telle modification est parfois souhaitable ; elle requiert que la e e e fonction puisse acc´der non seulement ` la valeur de la variable, mais aussi ` son adresse. e a a C’est ce qui s’appelle le passage par adresse des arguments. Alors que certains langages le prennent en charge, C ne fournit aucun m´canisme sp´cifique : le passage de l’adresse de l’argument doit ˆtre programm´ e e e e explicitement en utilisant comme argument un pointeur vers la variable. Par exemple, supposons avoir ` ´crire une fonction ae int quotient(a, b) cens´e renvoyer le quotient de la division euclidienne de l’entier a par l’entier b et devant en plus remplacer a e par le reste de cette division. On devra la d´finir : e int quotient(int *a, int b) { int r = *a / b; *a = *a % b; return r; } Ci-dessus, b repr´sente un entier ; a l’adresse d’un entier. La notation *a fait r´f´rence ` une variable (ou, e ee a plus g´n´ralement, une lvalue) appartenant ` la proc´dure appelante. e e a e L’argument effectif correspondant ` un tel argument formel doit ˆtre une adresse. Souvent, cela est obtenu a e par l’utilisation de l’op´rateur &. Par exemple, si x, y et z sont des variables enti`res, un appel correct de la e e fonction pr´c´dente sera e e z = quotient(&x, y); Bien entendu, l’op´rateur & ne doit pas ˆtre utilis´ si l’argument effectif est d´j` une adresse. Le sch´ma e e e ea e suivant r´sume les principales situations possibles. Soient les fonctions e
c H. Garreta, 1988-2006

49

4.3 Arguments des fonctions

4

FONCTIONS

f(int a) { ... } g(int *b) { ... } h(int c, int *d) { ... } A l’int´rieur de la fonction h, des appels corrects de f et g sont : e f(c); f(*d); g(&c); g(d); cette derni`re expression correspondant, bien sˆr, ` g(&*d). e u a 4.3.4 Arguments en nombre variable

Le langage C permet de d´finir des fonctions dont le nombre d’arguments n’est pas fix´ et peut varier d’un e e appel ` un autre. Nous exposons ici la mani`re dont cette facilit´ est r´alis´e dans le C ANSI. Dans le C a e e e e original elle existe aussi ; elle consiste ` utiliser, sans garde-fou, une faiblesse du langage (la non-v´rification du a e nombre d’arguments effectifs) et une caract´ristique du syst`me sous-jacent (le sens d’empilement des arguments e e effectifs). Mais tout cela est suffisamment casse-cou pour que nous pr´f´rions n’expliquer que la mani`re ANSI ee e de faire, un peu plus fiable. Une fonction avec un nombre variable d’arguments est d´clar´e en explicitant quelques arguments fixes, au e e moins un, suivis d’une virgule et de trois points :  , ...  . Exemple : int max(short n, int x0, ...) Une telle fonction peut ˆtre appel´e avec un nombre quelconque d’arguments effectifs, mais il faut qu’il y en e e ait au moins autant qu’il y a d’arguments formels nomm´s, ici deux. Exemple d’appel : e m = max(3, p, q, r); Pour les arguments nomm´s, l’affectation des valeurs des arguments effectifs aux arguments formels est faite e comme d’ordinaire. Pour les arguments anonymes elle s’effectue comme pour une fonction sans prototype : les char et les short sont convertis en int, les float en double et il n’y a aucune autre conversion. A l’int´rieur de la fonction on acc`de aux arguments anonymes au moyen des macros va start et va arg e e d´finies dans le fichier stdarg.h, comme le montre l’exemple suivant : e #include <stdarg.h> int max(short n, int x1, ...) { va_list magik; int x, i, m; m = x1; va_start(magik, x1); for (i = 2; i <= n; i++) if ((x = va_arg(magik, int)) > m) m = x; return m; } Des a b c appels corrects de cette fonction seraient : = max(3, p, q, r); = max(8, x[0], x[1], x[2], x[3], x[4], x[5], x[6], x[7]); = max(2, u, 0);

Les ´l´ments d´finis dans le fichier stdarg.h sont : ee e va list pointeur D´claration de la variable pointeur, qui sera automatiquement g´r´e par le dispositif d’acc`s e ee e aux arguments. Le programmeur choisit le nom de cette variable, mais il n’en fait rien d’autre que la mettre comme argument dans les appels des macros va start et va arg. 50
c H. Garreta, 1988-2006

4 FONCTIONS

4.3

Arguments des fonctions

va start(pointeur , dernier argument) Initialisation de la variable pointeur ; dernier argument doit ˆtre le dere nier des arguments explicitement nomm´s dans l’en-tˆte de la fonction. e e va arg(pointeur , type) Parcours des arguments anonymes : le premier appel de cette macro donne le premier argument anonyme ; chaque appel suivant donne l’argument suivant le dernier d´j` obtenu. Chaque fois, ea type doit d´crire le type de l’argument qui est en train d’ˆtre r´f´renc´. e e ee e Comme l’exemple le montre, le principe des fonctions avec un nombre variable d’arguments est de d´clarer e effectivement au moins un argument, dont la fonction peut d´duire l’adresse des autres. Il faut aussi choisir le e moyen d’indiquer ` la fonction le nombre de valeurs r´ellement fournies. Dans l’exemple ci-dessus ce nombre est a e pass´ comme premier argument ; une autre technique consiste ` utiliser une valeur  intruse  (ex : le pointeur e a NULL parmi des pointeurs valides). La fonction printf est un autre exemple de fonction avec un nombre variable d’arguments. Elle est d´clar´e (dans le fichier stdio.h) : e e int printf(char *, ...); Ici encore, le premier argument (le format) renseigne sur le nombre et la nature des autres arguments. La question des fonctions formelles (fonctions arguments d’autres fonctions) et d’autres remarques sur les fonctions et leurs adresses sont trait´es ` la section 6.3.1. e a

c H. Garreta, 1988-2006

51

´ 5 OBJETS STRUCTURES

5
5.1
5.1.1

Objets structur´s e
Tableaux
Cas g´n´ral e e

Dans le cas le plus simple la d´claration d’un tableau se fait par une formule comme : e type-de-base nom [ expression opt ] ; Exemple : unsigned long table[10]; L’expression optionnelle qui figure entre les crochets sp´cifie le nombre d’´l´ments du tableau. Le premier e ee ´l´ment poss`de toujours l’indice 0. Par cons´quent, un tableau t d´clar´ de taille N poss`de les ´l´ments ee e e e e e ee t0 , t1 , ... tN −1 . Ainsi la d´finition pr´c´dente alloue un tableau de 10 ´l´ments, nomm´s respectivement table[0], e e e ee e table[1], ... table[9]. L’expression optionnelle qui figure entre les crochets doit ˆtre de type entier et constante au sens de la e section 1.3.4, c’est-`-dire une expression dont tous les ´l´ments sont connus au moment de la compilation. De a ee cette mani`re le compilateur peut l’´valuer et connaˆ la quantit´ d’espace n´cessaire pour loger le tableau. Elle e e ıtre e e est obligatoire lorsqu’il s’agit d’une d´finition, car il y a alors allocation effective du tableau. Elle est facultative e dans le cas des d´clarations qui ne sont pas des d´finitions, c’est-`-dire : e e a – lors de la d´claration d’un tableau qui est un argument formel d’une fonction ; e – lors de la d´claration d’un tableau externe (d´fini dans un autre fichier). e e ´ Semantique du nom d’un tableau. En g´n´ral lorsque le nom d’un tableau apparaˆ dans une expression e e ıt il y joue le mˆme rˆle qu’une constante de type adresse ayant pour valeur l’adresse du premier ´l´ment du e o ee tableau. Autrement dit, si t est de type tableau, les deux expressions t sont ´quivalentes. e Les exceptions ` cette r`gle, c’est-`-dire les expressions de type tableau qui ne sont pas ´quivalentes ` a e a e a l’adresse du premier ´l´ment du tableau, sont ee – l’occurrence du nom du tableau dans sa propre d´claration ; e – l’apparition d’un nom du tableau comme argument de sizeof. Ce sont les seules occasions o` le compilateur veut bien se souvenir qu’un nom de tableau repr´sente aussi un u e espace m´moire poss´dant une certaine taille. e e De tout cela, il faut retenir en tout cas que le nom d’un tableau n’est pas une lvalue et donc qu’il n’est pas possible d’affecter un tableau ` un autre. Si a et b sont deux tableaux, mˆme ayant des types identiques, a e l’affectation b = a sera – comprise comme l’affectation d’une adresse ` une autre, et a – rejet´e, car b n’est pas modifiable. e Tableaux multidimensionnels. C ne pr´voit que les tableaux ` un seul indice, mais les ´l´ments des e a ee tableaux peuvent ` leur tour ˆtre des tableaux. La d´claration d’un tableau avec un nombre quelconque d’indices a e e suit la syntaxe : type nom [ expression opt ] [ expression opt ] ... [ expression opt ] qui est un cas particulier de formules plus g´n´rales expliqu´es ` la section 5.4.1. Par exemple, la d´claration e e e a e double matrice[10][20]; introduit matrice comme ´tant le nom d’un tableau de 10 ´l´ments33 qui, chacun ` son tour, est un tableau de e ee a 20 ´l´ments de type double. ee 5.1.2 Initialisation des tableaux &t[0]

Une variable de type tableau peut ˆtre initialis´e lors de sa d´claration. Cela se fait par une expression ayant e e e la syntaxe : { expression , expression , ... expression }
33 Dans le cas d’une matrice, la coutume est d’appeler ces ´l´ments les lignes de la matrice. Cela permet de dire alors :  en C les ee matrices sont rang´es par lignes . e

52

c H. Garreta, 1988-2006

´ 5 OBJETS STRUCTURES

5.1

Tableaux

Exemple : int t[5] = { 10, 20, 30, 40, 50 }; Les expressions indiqu´es doivent ˆtre des expressions constantes au sens de la section 1.3.4. S’il y a moins e e d’expressions que le tableau a d’´l´ments, les ´l´ments restants sont remplis de z´ros (cas des variables globales) ee ee e ou bien restent ind´termin´s (cas des variables locales). S’il y a plus d’expressions d’initialisation que d’´l´ments e e ee dans le tableau, une erreur est signal´e. e D’autre part, la pr´sence d’un initialisateur dispense d’indiquer la taille du tableau. Il est convenu que ce e dernier doit avoir alors pour taille le nombre effectif de valeurs initiales. Par exemple, la d´finition e int t[] = { 10, 20, 30, 40, 50 }; alloue un tableau ` 5 composantes garni avec les valeurs indiqu´es. a e Lorsque le tableau comporte des sous-tableaux, c’est-`-dire lorsque c’est un tableau ` plusieurs indices, la a a liste des expressions d’initialisation peut comporter des sous-listes indiqu´es ` leur tour avec des accolades, mais e a ce n’est pas une obligation. Le cas ´ch´ant, la r`gle de compl´tion par des z´ros s’applique aussi aux sous-listes. e e e e e Par exemple, les d´clarations e int t1[4][4] = { { 1, 2, 3 }, { 4, 5, 6 }, { 7, 8, 9 } }; int t2[4][4] = { 1, 2, 3, 4, 5, 6, 7, 8, 9 }; allouent et garnissent les deux tableaux de la figure 5.

1 4 7 0

2 5 8 0

3 6 9 0

0 0 0 0

1 5 9 0

2 6 0 0

3 7 0 0

4 8 0 0

t1

t2

Fig. 5 – Tableaux initialis´s e Remarque. Rappelons que ces repr´sentations rectangulaires sont tr`s conventionnelles. Dans la m´moire e e e de l’ordinateur ces deux tableaux sont plutˆt arrang´s comme sur la figure . o e

t1 1 2 3 0 4 5 6 0 7 8 9 0 0 0 0 0 t2 1 2 3 4 5 6 7 8 9 0 0 0 0 0 0 0
Fig. 6 – Tableaux  ` plat  a Si la taille d’une composante est un diviseur de la taille d’un entier, les tableaux sont  tass´s  : chaque e composante occupe le moins de place possible. En particulier, dans un tableau de char (resp. de short), chaque composante occupe un (resp. deux) octet(s). 5.1.3 Chaˆ ınes de caract`res e

Les chaˆ ınes de caract`res sont repr´sent´es comme des tableaux de caract`res. Un caract`re nul suit le dernier e e e e e caract`re utile de la chaˆ et en indique la fin. Cette convention est suivie par le compilateur (qui range les e ıne chaˆ ınes constantes en leur ajoutant un caract`re nul), ainsi que par les fonctions de la librairie standard qui e construisent des chaˆ ınes. Elle est suppos´e v´rifi´e par les fonctions de la librairie standard qui exploitent des e e e chaˆ ınes. Par cons´quent, avant de passer une chaˆ ` une telle fonction, il faut s’assurer qu’elle comporte bien e ıne a un caract`re nul ` la fin. e a
c H. Garreta, 1988-2006

53

5.2 Structures et unions

5

´ OBJETS STRUCTURES

Donnons un exemple classique de traitement de chaˆ ınes : la fonction strlen (extraite de la biblioth`que e standard) qui calcule le nombre de caract`res utiles d’une chaˆ : e ıne int strlen(char s[]) { register int i = 0; while (s[i++] != ’\0’) ; return i - 1; } Une constante-chaˆ de caract`res apparaissant dans une expression a le mˆme type qu’un tableau de ıne e e caract`res c’est-`-dire, pour l’essentiel, le type  adresse d’un caract`re . Par exemple, si p a ´t´ d´clar´ e a e ee e e char *p; l’affectation suivante est tout ` fait l´gitime : a e p = "Bonjour. Comment allez-vous?"; Elle affecte ` p l’adresse de la zone de la m´moire o` le compilateur a rang´ le texte en question (l’adresse du ’B’ a e u e de "Bonjour..."). Dans ce cas, bien que l’expression *p soit une lvalue (ce qui est une propri´t´ syntaxique), ee elle ne doit pas ˆtre consid´r´e comme telle car *p repr´sente un objet m´moris´ dans la zone des constantes, e ee e e e et toute occurrence de *p comme op´rande gauche d’une affectation : e *p = expression; constituerait une tentative de modification d’un objet constant. Cette erreur est impossible ` d´celer ` la a e a compilation. Selon le syst`me sous-jacent, soit une erreur sera signal´e ` l’ex´cution, provoquant l’abandon e e a e imm´diat du programme, soit aucune erreur ne sera signal´e mais la validit´ de la suite du traitement sera e e e compromise. Initialisation. Comme tous les tableaux, les variables-chaˆ ınes de caract`res peuvent ˆtre initialis´es lors e e e de leur d´claration. De ce qui a ´t´ dit pour les tableaux en g´n´ral il d´coule que les expressions suivantes sont e ee e e e correctes : char message1[80] = { ’S’, ’a’, ’l’, ’u’, ’t’, ’\0’ }; char message2[] = { ’S’, ’a’, ’l’, ’u’, ’t’, ’\0’ }; (la deuxi`me formule d´finit un tableau de taille 6). Heureusement, C offre un raccourci : les deux expressions e e pr´c´dentes peuvent s’´crire de mani`re tout ` fait ´quivalente : e e e e a e char message1[80] = "Salut"; char message2[] = "Salut"; Il faut bien noter cependant que l’expression "Salut" qui apparaˆ dans ces deux exemples n’est pas du tout ıt trait´ par le compilateur comme les autres chaˆ e ınes de caract`res constantes rencontr´es dans les programmes. e e Ici, il ne s’agit que d’un moyen commode pour indiquer une collection de valeurs initiales ` ranger dans un a tableau. A ce propos, voir aussi la remarque 2 de la section 6.2.1.

5.2
5.2.1

Structures et unions
Structures

Les structures sont des variables compos´es de champs de types diff´rents. Elles se d´clarent sous la syntaxe e e e suivante : struct nomopt ’{’ declaration ... declaration ’}’ rien nom ’,’ ... nom rien ’ ;’

A la suite du mot-cl´ struct on indique : e – facultativement, le nom que l’on souhaite donner ` la structure. Par la suite, l’expression  struct nom  a pourra ˆtre employ´e comme une sorte de nom de type ; e e – facultativement, entre accolades, la liste des d´clarations des champs de la structure. Chaque champ peut e avoir un type quelconque (y compris un autre type structure, bien sˆr) ; u e e e e – facultativement, la liste des variables que l’on d´finit ou d´clare comme poss´dant la structure ici d´finie. Exemple. struct fiche { int numero; char nom[32], prenom[32]; } a, b, c; 54
c H. Garreta, 1988-2006

´ 5 OBJETS STRUCTURES

5.2

Structures et unions

Cette d´claration introduit trois variables a, b et c, chacune constitu´e des trois champs numero, nom et e e prenom ; en mˆme temps elle donne ` cette structure le nom fiche. Plus loin, on pourra d´clarer de nouvelles e a e variables analogues ` a, b et c en ´crivant simplement a e struct fiche x, y; (remarquez qu’il faut ´crire  struct fiche  et non pas  fiche ). Nous aurions pu aussi bien faire les e d´clarations : e struct fiche { int numero; char nom[32], prenom[32]; }; struct fiche a, b, c, x, y; ou encore struct { int numero; char nom[32], prenom[32]; } a, b, c, x, y; mais cette derni`re forme nous aurait empˆch´ par la suite de d´clarer aussi facilement d’autres variables de e e e e mˆme type, ou de cr´er un pointeur sur une telle structure (ce qui est indispensable dans le cas des structures e e r´cursives, par exemple les maillons des listes chaˆ ees). e ın´ Comme dans beaucoup de langages, on acc`de aux champs d’une variable de type structure au moyen de e l’op´rateur  . . Exemple : e a.numero = 1234; Les structures supportent les manipulations  globales 34 : – on peut affecter une expression d’un type structure ` une variable de type structure (pourvu que ces deux a types soient identiques) ; – les structures sont pass´es par valeur lors de l’appel des fonctions ; e – le r´sultat d’une fonction peut ˆtre une structure. e e La possibilit´ pour une fonction de rendre une structure comme r´sultat est officielle dans le C ANSI ; sur e e ce point les compilateurs plus anciens pr´sentent des diff´rences de comportement. D’autre part il est facile de e e voir que -sauf dans le cas de structures vraiment tr`s simples- les transmettre comme r´sultats des fonctions est e e en g´n´ral peu efficace. e e Voici quelques informations sur la disposition des champs des structures. Elles sont sans importance lorsque les structures sont exploit´es par le programme qui les cr´e, mais deviennent indispensables lorsque les structures e e sont partag´es entre sous-programmes ´crits dans divers langages ou lorsqu’elles servent ` d´crire les articles e e a e d’un fichier existant en dehors du programme. Position. C garantit que les champs d’une structure sont allou´s dans l’ordre o` ils apparaissent dans la e u d´claration. Ainsi, avec la d´finition e e struct modele { type 1 a, b; type 2 c, d, e; type 3 f; } on trouve, dans le sens des adresses croissantes : x.a, x.b, x.c, x.d, x.e et enfin x.f35 . Contigu¨ e. Les champs des structures subissent en g´n´ral des contraintes d’alignement d´pendant du ıt´ e e e syst`me sous-jacent, qui engendrent des trous anonymes entre les champs. Il s’agit souvent des mˆmes r`gles e e e que celles qui p`sent sur les variables simples. Deux cas relativement fr´quents sont les suivants : e e a a – les champs de type char sont ` n’importe quelle adresse, tous les autres champs devant commencer ` une adresse paire ; – les champs d’un type simple doivent commencer ` une adresse multiple de leur taille (les short ` une a a adresse paire, les long ` une adresse multiple de quatre, etc.). a
34 L’expression correcte de cette propri´t´ consisterait ` dire qu’une structure, comme une expression d’un type primitif, b´n´ficie e e a e e de la s´mantique des valeurs, par opposition ` un tableaux qui, lui, est assujetti ` la s´mantique des valeurs. e a a e 35 Alors que, avec la d´claration correspondante en Pascal (facile ` imaginer), beaucoup de compilateurs alloueraient les champs e a dans l’ordre : x.b, x.a, x.e, x.d, x.c et enfin x.f.

c H. Garreta, 1988-2006

55

5.2 Structures et unions

5

´ OBJETS STRUCTURES

Initialisation. Une variable de type structure peut ˆtre initialis´e au moment de sa d´claration, du moins e e e dans le cas d’une variable globale. La syntaxe est la mˆme que pour un tableau. Exemple : e struct fiche { int numero; char nom[32], prenom[32]; } u = { 1234, "DURAND", "Pierre" }; Comme pour les tableaux, si on indique moins de valeurs que la structure ne comporte de champs, alors les champs restants sont initialis´s par des z´ros. Donner plus de valeurs qu’il n’y a de champs constitue une erreur. e e 5.2.2 Unions

Tandis que les champs des structures se suivent sans se chevaucher, les champs d’une union commencent tous au mˆme endroit et, donc, se superposent. Ainsi, une variable de type union peut contenir, ` des moments e a diff´rents, des objets de types et de tailles diff´rents. La taille d’une union est celle du plus volumineux de ses e e champs. La syntaxe de la d´claration et de l’utilisation d’une union est exactement la mˆme que pour les structures, e e avec le mot union ` la place du mot struct. Exemple (la struct adresse virt est d´finie ` la section 5.2.3) : a e a union mot_machine { unsigned long mot; char *ptr; struct adresse_virt adrv; } mix; La variable mix pourra ˆtre vue tantˆt comme un entier long, tantˆt comme l’adresse d’un caract`re, tantˆt e o o e o comme la structure bizarre d´finie ci-apr`s. Par exemple, le programme suivant teste si les deux bits hauts d’une e e certaine variable m, de type unsigned long, sont nuls : mix.mot = m; if (mix.adrv.tp == 0) etc. Remarque 1. Dans ce genre de probl`mes, les op´rateurs binaires de bits (&, |, ^) s’av`rent ´galement tr`s e e e e e utiles. L’instruction pr´c´dente pourrait aussi s’´crire (sur une machine 32 bits, o` int est synonyme de long) : e e e u if (m & 0xC0000000 == 0) etc. (l’´criture binaire du chiffre hexa C est 1100). Bien sˆr, les programmes de cette sorte n’´tant pas portables, ces e u e deux mani`res de faire peuvent ˆtre ´quivalentes sur une machine et ne pas l’ˆtre sur une autre. e e e e Remarque 2. Les unions permettent de consid´rer un mˆme objet comme poss´dant plusieurs types ; elles e e e semblent donc faire double emploi avec l’op´rateur de conversion de type. Ce n’est pas le cas. D’une part, cet e op´rateur ne supporte pas les structures, tandis qu’un champ d’une union peut en ˆtre une. e e D’autre part, lorsque l’on change le type d’un objet au moyen de l’op´rateur de changement de type, C e convertit la donn´e, afin que l’expression ait, sous le nouveau type, une valeur vraisemblable et utile. Par e exemple, si x est une variable r´elle (float), l’expression  (int) x  convertit x en l’entier dont la valeur est e la plus voisine de la valeur qu’avait le r´el x. Cela implique une transformation, ´ventuellement assez coˆteuse, e e u de la valeur de x. A l’oppos´, lorsqu’on fait r´f´rence ` un champ d’une union, la donn´e ne subit aucune e ee a e transformation, mˆme si elle a ´t´ affect´e en faisant r´f´rence ` un autre champ. Par exemple, si l’on d´clare e ee e ee a e union { float reel; int entier; } x; et qu’ensuite on ex´cute les affectations : e x.reel = 12.5; i = x.entier; l’entier i obtenu sera celui dont la repr´sentation binaire co¨ e ıncide avec la repr´sentation binaire du nombre e flottant 12.5 ; cet entier n’a aucune raison d’ˆtre voisin de 12. e 5.2.3 Champs de bits

Le langage C permet aussi d’utiliser des structures et des unions dont les champs, tous ou seulement certains, sont faits d’un nombre quelconque de bits. De tels champs doivent ˆtre ainsi d´clar´s : e e e 56
c H. Garreta, 1988-2006

´ 5 OBJETS STRUCTURES

5.3

Enum´rations e

unsignedopt intopt identificateur rien

’:’ constante-entiere

Chaque constante pr´cise le nombre de bits qu’occupe le champ. Le type doit obligatoirement ˆtre entier. e e Lorsque le type et le nom du champ sont absents, le nombre indiqu´ de bits est quand mˆme r´serv´ : on suppose e e e e qu’il s’agit de bits de  rembourrage  entre deux champs nomm´s. e Chacun de ces champs est log´ imm´diatement apr`s le champ pr´c´dent, sauf si cela le met ` cheval sur e e e e e a deux mots (de type int) ; dans ce cas, le champ est log´ au d´but du mot suivant. e e Exemple : la structure struct adresse_virt { unsigned depl : 9; unsigned numpagv : 16; : 5; unsigned tp : 2; }; d´coupe un mot de 32 bits en en quatre champs, comme indiqu´36 sur la figure 7. e e
29 24 8 0

tp

numpag
Fig. 7 – Champs de bits

depl

Attention. Dans tous les cas, les champs de bits sont tr`s d´pendants de l’implantation. Par exemple, e e certaines machines rangent les champs de gauche ` droite, d’autres de droite ` gauche. Ainsi, la portabilit´ a a e des structures contenant des champs de bits n’est pas assur´e ; cela limite leur usage ` une certaine cat´gorie e a e de programmes, comme ceux qui communiquent avec leur machine-hˆte ` un niveau tr`s bas (noyau d’un o a e syst`me d’exploitation, gestion des p´riph´riques, etc.). Ces programmes sont rarement destin´s ` ˆtre port´s e e e e ae e d’un syst`me ` un autre. e a

5.3

Enum´rations e

Les ´num´rations ne constituent pas un type structur´. Si elles figurent ici c’est uniquement parce que la e e e syntaxe de leur d´claration poss`de des points communs avec celle des structures. Dans les cas simples, cette e e syntaxe est la suivante : enum nomopt ’{’ id-valeur ’,’ ... id-valeur ’}’ rien nom ’,’ ... nom rien ’ ;’

o` chaque id-valeur est ` son tour de la forme u a identificateur Exemple : enum jourouvrable { lundi, mardi, mercredi, jeudi, vendredi } x, y; A la suite d’une telle d´claration, le type enum jourouvrable est connu ; les variables x et y le poss`dent. e e Ce type est form´ d’une famille finie de symboles qui repr´sentent des constantes enti`res : lundi (´gale ` 0), e e e e a mardi (´gale ` 1), etc. Dans ce programme on pourra ´crire : e a e enum jourouvrable a, b, c; On aurait aussi bien pu introduire toutes ces variables par les d´clarations e enum jourouvrable { lundi, mardi, mercredi, jeudi, vendredi }; ... enum jourouvrable x, y, a, b, c;
36 Sur

’=’ expression-constante rien

un syst`me o` un mot est fait de 32 bits (sinon un champ serait ` cheval sur deux mots, ce qui est interdit). e u a

c H. Garreta, 1988-2006

57

5.4 D´clarateurs complexes e

5

´ OBJETS STRUCTURES

ou encore enum { lundi, mardi, mercredi, jeudi, vendredi } x, y, a, b, c; mais cette derni`re forme nous aurait empˆch´ par la suite de d´clarer aussi facilement d’autres variables du e e e e mˆme type. Bien sˆr, les ´num´rations peuvent se combiner avec la d´claration typedef (cf. section 5.4.3) : e u e e e apr`s la d´claration e e typedef enum jourouvrable { lundi, mardi, mercredi, jeudi, vendredi } JOUROUVRABLE; les expressions  enum jourouvrable  et  JOUROUVRABLE  sont ´quivalentes. e Les nombres entiers et les valeurs de tous les types ´num´r´s sont totalement compatibles entre eux. Par e ee cons´quent, l’affectation d’un entier ` une variable d’un type ´num´r´ ou l’affectation r´ciproque ne provoquent e a e ee e en principe aucun avertissement de la part du compilateur . Ainsi, en C, les types ´num´r´s ne sont qu’une e ee deuxi`me mani`re de donner des noms ` des nombres entiers (la premi`re mani`re ´tant l’emploi de la directive e e a e e e #define, voir section 8.1.2). Par d´faut, la valeur de chacune de ces constantes est ´gale au rang de celle-ci dans l’´num´ration (lundi e e e e vaut 0, mardi vaut 1, etc.). On peut alt´rer cette s´quence en associant explicitement des valeurs ` certains e e a ´l´ments : ee enum mois_en_r { janvier = 1, fevrier, mars, avril, septembre = 9, octobre, novembre, decembre }; (fevrier vaut 2, mars vaut 3, octobre vaut 10, etc.)

5.4

D´clarateurs complexes e

Jusqu’ici nous avons utilis´ des formes simplifi´es des d´clarations. Tous les objets ´taient soit simples, soit e e e e des tableaux, des fonctions ou des adresses d’objets simples. Il nous reste ` voir comment d´clarer des  tableaux a e de pointeurs  , des  tableaux d’adresses de fonctions , des  fonctions rendant des adresses de tableaux , etc. Autrement dit, nous devons expliquer la syntaxe des formules qui permettent de d´crire des types de complexit´ e e quelconque. La question concerne au premier chef les descripteurs de types, qui apparaissent dans trois sortes d’´nonc´s : e e – les d´finitions de variables (globales et locales), les d´clarations des param`tres formels des fonctions, les e e e d´clarations des variables externes et les d´clarations des champs des structures et des unions ; e e – les d´finitions des fonctions et les d´clarations des fonctions externes ; e e – les d´clarations de types (typedef) e La mˆme question r´apparaˆ dans des constructions qui d´crivent des types sans les appliquer ` des identie e ıt e a ficateurs. Appelons cela des types d´sincarn´s. Ils sont utilis´s e e e – par l’op´rateur de changement de type lorsque le type de destination n’est pas d´fini par un identificateur : e e  (char *) expression  ; – comme argument de sizeof (rare) :  sizeof(int [100])  ; – dans les prototypes des fonctions :  strcpy(char *, char *) ;  5.4.1 Cas des d´clarations e

Un d´clarateur complexe se compose de trois sortes d’ingr´dients : e e – un type  terminal  qui est un type de base (donc num´rique), enum, struct ou union ou bien un type e auquel on a donn´ un nom par une d´claration typedef ; e e – un certain nombre d’occurrences des op´rateurs (), [] et * qui repr´sentent des proc´d´s r´cursifs de e e e e e construction de types complexes ; e – l’identificateur qu’il s’agit de d´clarer. Ces formules ont mauvaise r´putation. Si elles sont faciles ` lire et ` traiter par le compilateur, elles s’av`rent e a a e difficiles ` composer et ` lire par le programmeur, car les symboles qui repr´sentent les proc´d´s r´cursifs de a a e e e e construction sont peu expressifs et se retrouvent plac´s ` l’envers de ce qui aurait sembl´ naturel. e a e Pour cette raison nous allons donner un proc´d´ m´canique qui, ` partir d’une sorte de description  ` e e e a a l’endroit , facile ` concevoir, fabrique la d´claration C souhait´e. Appelons description naturelle d’un type une a e e expression de l’un des types suivants : – la description correcte en C d’un type de base, d’un type enum, d’une struct ou union ou le nom d’un type baptis´ par typedef ; e 58
c H. Garreta, 1988-2006

´ 5 OBJETS STRUCTURES

5.4

D´clarateurs complexes e

– la formule  tableau de T , o` T est la description naturelle d’un type ; u – la formule  adresse d’un T  (ou  pointeur sur un T ), o` T est la description naturelle d’un type ; u – la formule  fonction rendant un T , o` T est la description naturelle d’un type. u Dans ces conditions, nous pouvons ´noncer la  recette de cuisine  du tableau 3. e Pour obtenir la d´claration d’une variable ou d’une fonction : e 1. Ecrivez : – ` gauche, la description naturelle du type, a – ` droite, l’identificateur ` d´clarer (un seul). a a e 2. Tant que l’expression ` gauche n’est pas un type de base, enum, struct ou union, a transformez les deux expressions de la mani`re suivante : e (a) fonction rendant un exp g exp d → exp g (exp d )() (b) tableau de exp g exp d → exp g (exp d )[] (c) pointeur sur exp g exp d → exp g *exp d De plus, dans les r`gles (a) et (b), si exp d n’est pas de la forme *exp, alors les parenth`ses e e autour de exp d peuvent ˆtre omises. e Tab. 3 – Construction d’un d´clarateur complexe e Exemple 1. Soit ` d´clarer tabPtr comme un tableau (de dimension ind´termin´e) de pointeurs d’entiers. a e e e Appliquant les r`gles du tableau 3, nous ´crirons successivement : e e tableau de pointeur sur int pointeur sur int pointeur sur int int tabPtr (tabPtr)[] tabPtr[] *tabPtr[]

La partie gauche de la ligne ci-dessus se r´duisant ` un type simple, cette ligne constitue la d´claration C e a e cherch´e, comme il faudra l’´crire dans un programme :  int *tabPtr[] ; . e e Exemple 2. Pour la comparer ` la pr´c´dente, cherchons ` ´crire maintenant la d´claration de ptrTab, un a e e ae e pointeur sur un tableau37 d’entiers : pointeur sur un tableau de int tableau de int int ptrTab *ptrTab (*ptrTab)[]

Les parenth`ses ci-dessus ne sont pas facultatives, car elles encadrent une expression qui commence par * e (dit autrement, elles sont n´cessaires, car [] a une priorit´ sup´rieure ` *). e e e a Les d´clarations pour lesquelles le membre gauche est le mˆme (` la fin des transformations) peuvent ˆtre e e a e regroup´es. Ainsi, les d´clarations de tabPtr et ptrTab peuvent ˆtre ´crites ensemble : e e e e int *tabPtr[], (*ptrTab)[]; En toute rigueur les r`gles a et b de ce tableau devraient ˆtre plus complexes, car la description naturelle e e du type d’une fonction inclut en g´n´ral la sp´cification des types des arguments (le prototype de la fonction), e e e et la description naturelle d’un type tableau comporte l’indication du nombre de composantes de celui-ci. En r´alit´ ces indications s’ajoutent aux r`gles donn´es ici, presque sans modifier le processus que ces r`gles e e e e e ´tablissent : tout simplement, des informations annexes sont ´crites ` l’int´rieur des crochets des tableaux et e e a e des parenth`ses des fonctions. e Exemple 3. Soit ` d´clarer une matrice de 10 lignes et 20 colonnes. Nos pouvons ´crire successivement : a e e tableau de 10 tableau de 20 double tableau de 20 double tableau de 20 double double double matrice (matrice)[10] matrice[10] (matrice[10])[20] matrice[10][20]

37 La notion de pointeur sur un tableau est assez acad´mique, puisqu’une variable de type tableau repr´sente d´j` l’adresse de e e ea celui-ci (dans la notion d’ adresse d’un tableau  il y a une double indirection). En pratique on n’en a presque jamais besoin.

c H. Garreta, 1988-2006

59

5.4 D´clarateurs complexes e

5

´ OBJETS STRUCTURES

Exemple 4. Quand on ´crit des programmes relevant du calcul num´rique on a souvent besoin de variables e e de type  adresse d’une fonction R → R . Voici comment ´crire un tel type e adresse de fonction (avec argument double) rendant double fonction (avec argument double) rendant double double La d´claration cherch´e est donc  double (*adrFon)(double) . e e Exemple 5. Cet exemple abominable est extrait de la biblioth`que UNIX. La fonction signal renvoie e l’adresse d’une  proc´dure , c’est-`-dire d’une fonction rendant void. Voici comment il faudrait la d´clarer en e a e syntaxe originale, c’est-`-dire sans sp´cifier les arguments de la fonction signal (cette d´claration est fournie a e e dans le fichier <signal.h>) : fonction pointeur pointeur fonction void rendant un pointeur sur fonction rendant void sur fonction rendant un void sur fonction rendant un void rendant un void signal (signal)() signal() *signal() (*signal())() adrFon *adrFon (*adrFon)(double)

En syntaxe ANSI il faut en plus donner les types des arguments des fonctions. On nous dit que les arguments de la fonction signal sont un int et un pointeur sur une fonction prenant un int et rendant un void. En outre, signal rend un pointeur vers une telle fonction. Nous savons d´j` ´crire le type  pointeur sur une fonction ea e prenant un int et rendant un void  (ce n’est pas tr`s diff´rent de l’exemple pr´c´dent) : e e e e void (*fon)(int); Attaquons-nous ` signal : a fonction (avec arguments int sig et int (*fon)(int)) rendant un pointeur sur fonction (avec argument int) rendant void signal pointeur sur fonction (avec argument int) rendant void (signal)(int sig, int (*fon)(int)) pointeur sur fonction (avec argument int) rendant void signal(int sig, int (*fon)(int)) fonction (avec argument int s) rendant void *signal(int sig, int (*fon)(int)) void (*signal(int sig, int (*fon)(int)))(int) Finalement, la d´claration cherch´e est e e void (*signal(int sig, int (*fon)(int)))(int) ; Comme annonc´, les expressions finales obtenues sont assez lourdes ` dig´rer pour un humain. A leur d´charge e a e e on peut tout de mˆme dire qu’une fois ´crites elles se r´v`lent bien utiles puisqu’elles font apparaˆ les types e e e e ıtre de leurs ´l´ments terminaux comme ils seront employ´s dans la partie ex´cutable des programmes. Ainsi, ` la ee e e a vue de l’expression float matrice[10][20]; on comprend sans effort suppl´mentaire qu’un ´l´ment de la matrice s’´crira matrice[i][j] et que cette formule e ee e repr´sentera un objet de type float. De mˆme, l’´nonc´ e e e e void (*signal(sig, func))(); nous fera reconnaˆ imm´diatement l’expression (*signal(2,f))(n) comme un appel correct de la  proc´dure  ıtre e e rendue par l’appel de signal. 5.4.2 Pointeurs et tableaux constants et volatils

Les qualifieurs const et volatile peuvent aussi apparaˆ dans les d´clarateurs complexes. Plutˆt que de ıtre e o rendre encore plus lourdes des explications qui le sont d´j` beaucoup, contentons-nous de montrer des exemples ea significatifs. Les cas les plus utiles sont les suivants : 1. La formule : const type *nom d´clare nom comme un pointeur vers un objet constant ayant le type indiqu´ (la variable point´e, *nom, ne doit e e e pas ˆtre modifi´e). e e 2. La formule 60
c H. Garreta, 1988-2006

´ 5 OBJETS STRUCTURES

5.4

D´clarateurs complexes e

type *const nom d´clare nom comme un pointeur constant vers un objet ayant le type indiqu´ (c’est la variable nom qui ne doit e e pas ˆtre modifi´e). e e 3. Plus simplement, la formule const type nom[expr opt ] d´clare nom comme un tableau d’objets constants38 (nom[i] ne doit pas ˆtre modifi´). e e e Ainsi par exemple les d´clarations e int e, *pe, *const pce = &e, te[100]; const int ec = 0, *pec, *const pcec = &ec, tec[100]; d´clarent successivement : e – e : un entier – pe : un pointeur vers un entier – pce : un pointeur constant vers un entier (qui doit ˆtre obligatoirement initialis´, puisqu’il est constant) e e – te : un tableau de 100 entiers – ec : un entier constant – pec : un pointeur vers un entier constant – pcec : un pointeur constant vers un entier constant – tec : un tableau de 100 entiers constants Toute affectation avec pour membre gauche pce, ec, *pec, pcec, *pcec ou tec[i] est ill´gale. e En r´sum´, la seule vraie nouveaut´ introduite ici est la notion de pointeur constant et la syntaxe de e e e sa d´claration  type-point´ *const pointeur . Signalons enfin que toute cette explication reste valable en e e rempla¸ant le mot const et la notion d’objet constant par le mot volatile et le concept d’ objet volatil (cf. c section 1.5.7). On a donc la possibilit´ de d´clarer des tableaux d’objets volatils, des pointeurs volatils vers des e e objets, volatils ou non, etc. 5.4.3 La d´claration typedef e

Cette construction est l’homologue de la d´claration type du langage Pascal. Elle permet de donner un nom e a ` un type dans le but d’all´ger par la suite les expressions o` il figure. Syntaxe : e u typedef d´claration e Pour d´clarer un nom de type, on fait suivre le mot r´serv´ typedef d’une expression identique ` une e e e a d´claration de variable, dans laquelle le rˆle du nom de la variable est jou´ par le nom du type qu’on veut e o e d´finir. Exemple : les d´clarations e e typedef float MATRICE[10][20]; ... MATRICE mat; sont ´quivalentes ` e a float mat[10][20]; Voici un autre exemple : typedef struct noeud { int info; struct noeud *fils_gauche, *fils_droit; } NOEUD; Cette expression d´clare l’identificateur NOEUD comme le nom du type  la structure noeud  . Des variables e a, b, c de ce type pourront par la suite ˆtre d´clar´es aussi bien par l’expression e e e struct noeud a, b, c; que par NOEUD a, b, c; Remarquez l’utilisation diff´rente d’un nom de structure (pr´c´d´ du mot struct) et d’un nom de type. Par e e e e tradition, les noms des types d´finis ` l’aide de la d´claration typedef sont ´crits en majuscules. e a e e L’ensemble des r`gles de syntaxe qui s’appliquent aux d´clarations de variables s’appliquent ´galement ici. e e e Par exemple, on peut introduire plusieurs noms de types dans un seul ´nonc´ typedef. Ainsi, ` la suite de e e a
38 Notez qu’il n’y a pas besoin d’une notation sp´ciale pour d´clarer un tableau constant d’objets (variables) puisque la signification e e ordinaire des tableaux est exactement celle-l`. a

c H. Garreta, 1988-2006

61

5.4 D´clarateurs complexes e

5

´ OBJETS STRUCTURES

typedef struct noeud { int info; struct noeud *fils_gauche, *fils_droit; } NOEUD, *ARBRE; les identificateurs NOEUD et ARBRE sont des synonymes pour  struct noeud  et  struct noeud * . Dans la construction des d´clarateurs complexes, le nom d’un type qui a fait l’objet d’une d´claration e e typedef peut ˆtre utilis´ comme type de base. Par exemple : e e typedef float LIGNE[20]; typedef LIGNE MATRICE[10]; est une autre mani`re d’introduire le type MATRICE d´j` vu. De mˆme e ea e typedef void PROCEDURE(int); PROCEDURE *signal(int sig, PROCEDURE *func); est une autre mani`re (nettement plus facile ` lire, n’est-ce pas ?) de d´clarer la fonction signal vue pr´c´demment. e a e e e 5.4.4 Cas des types d´sincarn´s e e

Tout cela devient encore plus ´sot´rique lorsqu’on doit construire un type sans l’appliquer ` un identificateur. e e a Le principe est alors le suivant : construisez la d´claration correcte d’un nom quelconque X, puis effacez X. e De telles expressions sont utiles dans trois circonstances : 1. Pour construire un op´rateur de changement de type. Exemple : la fonction malloc alloue un bloc de e m´moire de taille donn´e, dont elle renvoie l’adresse. Dans les biblioth`ques du C original39 , cette fonction e e e est d´clar´e comme rendant l’adresse d’un char, et l’utilisateur doit convertir le r´sultat de malloc dans le e e e type qui l’int´resse. Supposons avoir besoin d’espace pour ranger un tableau de N r´els en double pr´cision. e e e D´clarations40 : e char *malloc(size_t); ... double *p; Utilisation : p = (double *) malloc(N * sizeof(double)); /* D´CONSEILL´ EN C ANSI */ E E

Le type d´sincarn´  double *  apparaissant ci-dessus a ´t´ d´duit d’une d´claration de pointeur,  double e e ee e e *ptr  en effa¸ant le nom d´clar´, ptr. c e e Rappelons qu’en C ANSI l’expression ci-dessus s’´crit plus simplement (voyez ` la section 2.2.12, notamment e a a ` la page 26, des indications et mises en garde ` propos de l’op´rateur de changement de type) : a e p = malloc(N * sizeof(double)); 2. Comme argument de l’op´rateur sizeof. Essayons par exemple d’´crire autrement l’affectation pr´c´dente. e e e e D´clarons un tableau T de N doubles : e double T[N] Supprimons T, il reste  double [N] . Par cons´quent, l’appel de la fonction malloc montr´ ci-dessus peut e e s’´crire aussi41 : e p = (double *) malloc(sizeof(double [N])); 3. Dans les prototypes des fonctions, en C ANSI. Par exemple, la biblioth`que standard C comporte la e fonction qsort, qui impl´mente une m´thode de tri rapide d’un tableau (algorithme Quicksort) programm´ en e e e toute g´n´ralit´. Les arguments de cette fonction sont le tableau ` trier, le nombre de ses ´l´ments, la taille de e e e a ee chacun et une fonction qui repr´sente la relation d’ordre utilis´e (le  crit`re de tri ) : elle re¸oit deux adresses e e e c d’´l´ments du tableau et rend un nombre n´gatif, nul ou positif exprimant la comparaison. ee e La fonction qsort est donc ainsi d´clar´e dans le fichier stdlib.h : e e void qsort(const void*, size_t, size_t, int (*)(const void*, const void*));
39 Dans la biblioth`que ANSI (fichier stdlib.h) la fonction malloc est d´clar´e comme rendant une valeur de type  void * . e e e Ce type ´tant compatible avec tous les autres types pointeur, le probl`me expos´ ici ne se pose pas. e e e 40 Le type size t (d´fini dans <stddef.h>) repr´sente un entier sans signe e e 41 L’exemple montr´ ici,  sizeof(double [N]) , est franchement ´sot´rique. La notation  N * sizeof(double)  est bien plus e e e raisonnable.

62

c H. Garreta, 1988-2006

´ 5 OBJETS STRUCTURES

5.4

D´clarateurs complexes e

Note. Ce n’est pas requis par la syntaxe mais, lorsqu’ils sont bien choisis, les noms des arguments sont une aide pour le programmeur. Exemple : void qsort(const void *tableau, size_t nombre, size_t taille, int (*compare)(const void *adr1, const void *adr2));

c H. Garreta, 1988-2006

63

6 POINTEURS

6
6.1

Pointeurs
G´n´ralit´s e e e

Un pointeur est une variable dont la valeur est l’adresse d’une cellule de la m´moire. e Les premiers langages ´volu´s ne permettaient pas les manipulations de pointeurs, de telles op´rations ´tant e e e e obligatoirement confin´es dans les programmes ´crits en assembleur. Le langage Pascal a introduit les pointeurs e e parmi les types de donn´es disponibles dans des langages g´n´ralistes. Mais ils y sont pr´sent´s comme des e e e e e entit´s fort myst´rieuses, dont l’utilisateur n’est cens´ connaˆ ni la structure ni le comportement. Cela n’en e e e ıtre facilite pas le maniement aux programmeurs d´butants. Beaucoup des difficult´s ` comprendre les pointeurs e e a proviennent plus du secret qui les entoure que de leur r´elle difficult´ d’emploi. e e Un pointeur n’est pas un concept unique, sans ressemblance avec les autres types de donn´es, car une adresse e n’est en fin de compte rien d’autre qu’un nombre entier (l’indice d’un ´l´ment du tableau qu’est la m´moire de ee e l’ordinateur). Un pointeur devrait donc supporter toutes les op´rations qu’on peut faire subir ` un nombre et e a qui gardent un sens lorsque ce nombre exprime un rang. Ce qui est tout ` fait sp´cifique d’un pointeur p est la possibilit´ de mentionner la variable dont la valeur a e e de p est l’adresse. Un pointeur correctement initialis´ est toujours le renvoi ` une deuxi`me variable, la variable e a e point´e, accessible ` partir du contenu de p. e a Dans tous les langages o` ils existent, le principal int´rˆt des pointeurs r´side dans la possibilit´ de r´aliser u ee e e e des structures de donn´es r´cursives (listes et arbres) : des structures dans lesquelles un champ est virtuellement e e aussi complexe que la structure elle-mˆme. En plus de cet aspect, en C les pointeurs sont le moyen d’am´liorer e e l’acc`s aux ´l´ments des tableaux ordinaires, en incorporant au langage des techniques d’adressage indirect e ee couramment utilis´es en assembleur. e 6.1.1 D´claration et initialisation des pointeurs e

Nous avons ´tudi´ ` la section pr´c´dente la syntaxe des d´clarations des pointeurs. Dans le cas le plus e e a e e e simple, cette syntaxe est type *variable Si par la suite on affecte ` une telle variable l’adresse d’un certain objet, on fait r´f´rence ` ce dernier par a ee a l’expression : *variable Par exemple, l’expression char *p; d´finit la variable p comme  pointeur vers un char . Lorsqu’elle aura ´t´ correctement initialis´e, elle contiendra e ee e l’adresse d’un caract`re, auquel on pourra faire r´f´rence par l’expression e ee *p Initialisation des pointeurs. Un pointeur contient en principe une adresse valide. Il existe trois mani`res e sˆres de donner une telle valeur ` un pointeur : u a 1. Prendre l’adresse d’une variable existant par ailleurs. Exemple, d´claration : e type x, *p; Initialisation : p = &x; p contient maintenant une adresse valide, l’adresse de la variable x. Par la suite, les expressions x et *p d´signeront le mˆme objet (le contenu de x). e e 2. Provoquer l’allocation d’un nouvel espace, c’est-`-dire allouer dynamiquement une variable anonyme. a Exemple, d´claration : e type *p; Initialisation : p = malloc(sizeof(type)); Apr`s cette instruction, une variable tout ` fait analogue ` la variable x de l’exemple pr´c´dent existe. e a a e e Comme dans l’exemple pr´c´dent, *p en d´signe le contenu. La diff´rence est qu’ici elle n’a pas de nom propre : e e e e 64
c H. Garreta, 1988-2006

6 POINTEURS

6.1

G´n´ralit´s e e e

si la valeur de p venait ` ˆtre alt´r´e (sans avoir ´t´ auparavant sauvegard´e dans un autre pointeur), la variable ae ee ee e point´e deviendrait inaccessible et serait d´finitivement perdue. e e 3. Obtenir une valeur par des calculs l´gitimes sur des pointeurs. Par exemple, comme on le verra bientˆt, e o avec les d´clarations e type t[10], *p, *q; suivies de l’initialisation p = &t[0]; l’expression q = p + 3; affecte ` q l’adresse du quatri`me ´l´ment du tableau t, c’est-`-dire &t[3]. a e ee a Il existe aussi une mani`re risqu´e, en tout cas non portable, de donner une valeur ` un pointeur : lui affecter e e a une constante ou une expression num´rique, dans le style de : e p = (struct machin *) 0x2A3E; De telles expressions, indispensables dans certaines fonctions de bas niveau (contrˆle d’organes mat´riels, etc.), o e rendent non portables les programmes o` elles figurent. Elles doivent donc ˆtre ´vit´es chaque fois que cela est u e e e possible. A propos de la taille des pointeurs et celle des entiers. Une expression comme l’affectation ci-dessus soul`ve un autre probl`me : existe-t-il une relation entre la taille d’un nombre entier (types int et e e unsigned int) et celle d’un pointeur ? Le langage ne prescrit rien ` ce sujet ; il est donc parfois erron´ et toujours a e dangereux de supposer qu’un entier puisse contenir un pointeur. Cette question peut sembler tr`s secondaire, e l’utilisation de variables enti`res pour conserver ou transmettre des pointeurs paraissant bien marginale. Or e c’est ce qu’on fait, peut-ˆtre sans s’en rendre compte, lorsqu’on appelle une fonction qui renvoie un pointeur e sans avoir pr´alablement d´clar´ la fonction. Par exemple, supposons que sans avoir d´clar´ la fonction malloc e e e e e (ni inclus le fichier <stdlib.h>) on ´crive l’affectation e p = (struct machin *) malloc(sizeof(struct machin)); Le compilateur rencontrant malloc pour la premi`re fois, il postule que cette fonction renvoie un int et ins`re e e a ` cet endroit le code qui convertit un entier en un pointeur. Cette conversion peut fournir un r´sultat tout ` fait e a erron´. Notamment, sur un syst`me o` les entiers occupent deux octets et les pointeurs quatre, les deux octets e e u hauts du r´sultat de malloc seront purement et simplement remplac´s par z´ro. La question est d’autant plus e e e vicieuse que le programme ci-dessus se comportera correctement sur tous les syst`mes dans lesquels les entiers e et les pointeurs ont la mˆme taille. e 6.1.2 Les pointeurs g´n´riques et le pointeur NULL e e (ou tout simplement p = t; )

Certaines fonctions de la biblioth`que, comme malloc, rendent comme r´sultat une  adresse quelconque , e e a ` charge pour l’utilisateur de la convertir en l’adresse sp´cifique qui lui convient. La question est : comment e d´clarer de tels pointeurs peu typ´s ou pas typ´s du tout ? e e e Le C original n’ayant rien pr´vu ` ce sujet, la tradition s’´tait cr´´e de prendre le type char * pour  pointeur e a e ee vers n’importe quoi . En effet, sur beaucoup de syst`mes les adresses des objets de taille non unitaire supportent e des contraintes d’alignement (les short aux adresse paires, les long aux adresses multiples de quatre, etc.), alors que les adresses des caract`res sont les seules ` ne subir aucune restriction. e a Le C ANSI introduit un type sp´cifique pour repr´senter de telles adresses g´n´riques : le type void *. Ce e e e e type est compatible avec tout autre type pointeur : n’importe quel pointeur peut ˆtre affect´ ` une variable de e ea type void * et r´ciproquement42 . Par exemple, le fichier standard <stdlib.h> contient la d´claration suivante e e de la fonction malloc : void *malloc(size_t size); Appel : p = malloc(sizeof(struct machin)); Note. A la section 2.2.12 (page 26) nous expliquons pourquoi l’emploi d’un op´rateur de changement de e type en association avec malloc est dangereux et d´conseill´, en C ANSI. e e
42 Avec une protection suppl´mentaire : le type void ´tant incompatible avec tous les autres types, l’objet point´ par une variable e e e d´clar´e de type void * ne pourra pas ˆtre utilis´ tant que la variable n’aura pas ´t´ convertie en un type pointeur pr´cis. e e e e e e e

c H. Garreta, 1988-2006

65

6.2 Les pointeurs et les tableaux

6

POINTEURS

Le pointeur NULL. Une des principales applications des pointeurs est la mise en œuvre de structures r´cursives de taille variable : listes chaˆ ees de longueur inconnue, arbres de profondeur quelconque, etc. Pour e ın´ r´aliser ces structures il est n´cessaire de poss´der une valeur de pointeur, distincte de toute adresse valide, e e e repr´sentant la fin de liste, la structure vide, etc. e C garantit qu’aucun objet valide ne se trouve ` l’adresse 0 et l’entier 0 est compatible avec tout type pointeur. a Cette valeur peut donc ˆtre utilis´e comme la valeur conventionnelle du  pointeur qui ne pointe vers rien  ; e e c’est l’´quivalent en C de la constante nil de Pascal. En pratique on utilise plutˆt la constante NULL qui est e o d´finie dans le fichier <stddef.h> : e #define NULL ((void *) 0)

6.2
6.2.1

Les pointeurs et les tableaux
Arithm´tique des adresses, indirection et indexation e

´ Arithmetique. Certaines des op´rations arithm´tiques d´finies sur les nombres gardent un sens lorsque e e e l’un des op´randes ou les deux sont des adresses : e – l’addition et la soustraction d’un nombre entier ` une adresse ; a – la soustraction de deux adresses (de types rigoureusement identiques). L’id´e de base de ces extensions est la suivante : si exp exprime l’adresse d’un certain objet O1 alors exp+1 e exprime l’adresse de l’objet de mˆme type que O1 qui se trouverait dans la m´moire imm´diatement apr`s O1 e e e e et exp−1 l’adresse de celui qui se trouverait imm´diatement avant. e De mani`re analogue, si exp 1 et exp 2 sont les adresses respectives de deux objets O1 et O2 de mˆme type et e e contigus (O2 apr`s O1 ), il semble naturel de donner ` exp 2 −exp 1 la valeur 1. e a L’arithm´tique des adresses d´coule de ces remarques. D’un point de vue technique, ajouter 1 ` un pointeur e e a c’est le consid´rer momentan´ment comme un entier et lui ajouter une fois la taille de l’objet point´. On peut e e e aussi dire cela de la mani`re suivante : exp 1 et exp 2 ´tant deux expressions de type  adresse d’un objet de type e e T  et n une expression enti`re, nous avons : e exp 1 + n ≡ (T *) ((unsigned long) exp 1 + n×sizeof(T )) et exp2 − exp1 ≡ (unsigned long)exp2 − (unsigned long)exp1 sizeof(T)

L’indexation. Il d´coule des explications pr´c´dentes que l’arithm´tique des adresses ne se justifie que si e e e e on peut consid´rer un pointeur p comme l’adresse d’un ´l´ment t[i0 ] d’un tableau, ´ventuellement fictif. On e ee e peut alors interpr´ter p + i comme l’adresse de t[i0 + i] et q − p comme l’´cart entre les indices correspondant e e a ` ces deux ´l´ments. Les pointeurs avec leur arithm´tique et l’acc`s aux ´l´ments des tableaux sont donc des ee e e ee concepts tr`s voisins. En r´alit´ il y a bien plus qu’un simple lien de voisinage entre ces deux concepts, car l’un e e e est la d´finition de l’autre : e Soit exp une expression quelconque de type adresse et ind une expression enti`re. Par d´finition, l’expression : e e *(exp + ind ) se note : exp[ind ] On en d´duit que si on a l’une ou l’autre des d´clarations e e type t[100]; ou type *t; alors dans un cas comme dans l’autre on peut ´crire indiff´remment e e t[0] ou *t ou t[i] ou *(t + i) Bien entendu, un programme est plus facile ` lire si on montre une certaine constance dans le choix des a notations. Exemple. Le programme suivant parcourt un tableau en utilisant un pointeur : 66
c H. Garreta, 1988-2006

6 POINTEURS

6.2

Les pointeurs et les tableaux

char s[10] = "Hello"; main() { char *p = s; while (*p != ’\0’) fputc(*p++, stdout); } Remarque 1. La similitude entre un tableau et un pointeur est grande, notamment dans la partie ex´cutable e des fonctions. Mais il subsiste des diff´rences, surtout dans les d´clarations. Il ne faut pas oublier que les e e d´clarations e int *p, t[100]; introduisent p comme une variable pointeur et t comme une constante pointeur. Ainsi, les expressions p = t et p++ sont l´gitimes, mais t = p et t++ sont ill´gales, car elles tentent de modifier une  non variable  (un nom e e de tableau n’est pas une lvalue). Remarque 2. Dans ce mˆme esprit, rappelons la diff´rence qu’il peut y avoir entre les deux d´clarations e e e suivantes : char s[] = "Bonsoir"; et char *t = "Bonsoir"; s est (l’adresse d’) un tableau de caract`res (figure 8) e

s B o n s o i r\ 0
Fig. 8 – Chaˆ de caract`res  variable  ıne e

tandis que t est l’adresse d’un (tableau de) caract`re(s) (figure 9) e

t o n s o i r \0 B o n s o i r \ A u 0 revo

Fig. 9 – Constante chaˆ de caract`res ıne e

On pourra r´f´rencer ces caract`res indiff´remment par s[i], *(s + i), t[i] ou *(t + i). Cependant, ee e e dans le premier cas le compilateur a allou´ un vrai tableau de 8 caract`res, et y a copi´ la chaˆ donn´e ; dans e e e ıne e le second cas, la chaˆ a ´t´ rang´e avec les autres constantes litt´rales et le compilateur n’a allou´ qu’une ıne e e e e e variable de type pointeur dans laquelle il a rang´ l’adresse de cette constante. Par suite, s n’est pas une variable e mais *s, s[i] et *(s + i) en sont, tandis que t est une variable mais *t, t[i] et *(t + i) n’en sont pas43 . A ce propos voir aussi la section 5.1.3. L’arithm´tique des adresses permet d’am´liorer l’efficacit´ de certains traitements de tableaux44 , en mettant e e e a ` profit le fait que l’indirection est plus rapide que l’indexation. Autrement dit, l’acc`s ` une donn´e ` travers e a e a une expression de la forme *p est r´put´e (l´g`rement) plus rapide que l’acc`s ` la mˆme donn´e ` travers l’expression e e e e e a e e a *(q + i) (ou, ce qui est la mˆme chose, q[i]) e D´veloppons un exemple classique : la fonction strcpy(dest, srce) copie la chaˆ de caract`res srce e ıne e dans l’espace point´ par dest. Premi`re forme : e e
43 C’est uniquement d’un point de vue technique que ces expressions ne sont pas des variables car du point de vue de la syntaxe elles sont des lvalue tout ` fait l´gitimes et le compilateur ne nous interdira pas de les faire apparaˆ a e ıtre ` gauche d’une affectation. a 44 Bien sˆ r, il s’agit de petites ´conomies dont le b´n´fice ne se fait sentir que lorsqu’elles s’appliquent ` des parties des programmes u e e e a qui sont vraiment critiques, c’est-`-dire ex´cut´es de mani`re tr`s fr´quente. a e e e e e

c H. Garreta, 1988-2006

67

6.2 Les pointeurs et les tableaux

6

POINTEURS

char *strcpy(char dest[], char srce[]) { register int i = 0; while ((dest[i] = srce[i]) != ’\0’) i++; return dest; } Deuxi`me forme : e char *strcpy(char *dest, char *srce) { register char *d = dest, *s = srce; while ((*d++ = *s++) != ’\0’) ; return dest; } La deuxi`me forme est plus efficace, car on y a supprim´ l’indexation. Pour s’en convaincre, il suffit de e e consid´rer que la boucle qui figure dans la premi`re forme ´quivaut ` : e e e a while ((*(dest + i) = *(srce + i)) != ’\0’) i++; 6.2.2 Tableaux dynamiques

L’´quivalence entre les tableaux et les pointeurs permet de r´aliser des tableaux dynamiques, c’est-`-dire e e a des tableaux dont la taille n’est pas connue au moment de la compilation mais uniquement lors de l’ex´cution, e lorsque le tableau commence ` exister. Pour cela il suffit de a – remplacer la d´claration du tableau par celle d’un pointeur ; e – allouer l’espace ` l’ex´cution, avant toute utilisation du tableau, par un appel de malloc ; a e – dans le cas d’un tableau local, lib´rer l’espace ` la fin de l’utilisation. e a Pour tout le reste, l’utilisation de ces tableaux dynamiques est identique ` celle des tableaux normaux (ce a qui, pour le programmeur, est une tr`s bonne nouvelle !). Exemple : la fonction ci-dessous calcule dans un e tableau la N eme ligne du triangle de Pascal45 et s’en sert dans des calculs auxquels nous ne nous int´ressons e pas ici. On notera qu’une seule ligne diff`re entre la version ` tableau statique et celle avec tableau dynamique. e a Programmation avec un tableau ordinaire (statique) : void Blaise(int N) { int n, p, i; int tab[N_MAX + 1]; for (n = 0; n <= N; tab[0] = tab[n] for (p = n - 1; tab[p] += +

/* N_MAX est une constante connue ` la compilation */ a

n++) { = 1; p > 0; p--) tab[p - 1]; /* exploitation de tab ; par exemple, affichage : */ for (i = 0; i <= n; i++) printf("%5d", tab[i]); printf("\n");

} } Programmation avec un tableau dynamique : void Blaise(int N) { int n, p, i; int *tab;

/* ici, pas besoin de constante connue ` la compilation */ a

tab = malloc((N + 1) * sizeof(int)); if (tab == NULL) return;
45 Rappelons que les coefficients de la neme ligne du triangle de Pascal sont d´finis r´cursivement ` partir de ceux de la n − 1eme e e a p p−1 p ligne par : Cn = Cn−1 + Cn−1 .

68

c H. Garreta, 1988-2006

6 POINTEURS

6.2

Les pointeurs et les tableaux

for (n = 0; n <= N; tab[0] = tab[n] for (p = n - 1; tab[p] += +

n++) { = 1; p > 0; p--) tab[p - 1]; /* exploitation de tab ; par exemple, affichage : */ for (i = 0; i <= n; i++) printf("%5d", tab[i]); printf("\n"); /* ` ne pas oublier ( tab est une variable locale) */ a

} free(tab); }

Remarque. L’emploi de tableaux dynamiques ` plusieurs indices est beaucoup plus compliqu´ que celui a e des tableaux ` un indice comme ci-dessus, car il faut g´rer soi-mˆme les calculs d’indices, comme le montre la a e e section suivante. 6.2.3 Tableaux multidimensionnels

´ Reflexions sur la double indexation. Supposons que nous ayons ` ´crire un programme qui op`re a e e sur des matrices ` N L lignes et N C colonnes. La d´claration d’une telle matrice est facile ` construire (cf. a e a section 5.4.1) : tableau de NL tableau de NC float tableau de NC float float m1 (m1)[NL] ou m1[NL] (m1[NL])[NC] ou m1[NL][NC]

Un ´l´ment particulier de cette matrice sera not´ m1[i][j]. D’apr`s ce que nous savons d´j`, on peut ee e e ea l’interpr´ter de la mani`re suivante46 : e e m1[i][j] = *(m1[i] + j) = *(float *)((unsigned int) m1[i] + j × sizeof(float)) Le probl`me est : avec la d´claration que nous avons donn´e, que signifie m1[i] ? Il est int´ressant de constater e e e e que cette expression n’est pas une lvalue, puisqu’elle est de type  tableau de... , mais que, ` part cela, elle est a trait´e comme un ´l´ment d’un tableau ordinaire. Autrement dit, si on supposait avoir la d´claration e ee e typedef float LIGNE[NC]; /* LIGNE = tableau de NC float */ alors m1[i] serait une expression de type LIGNE valant : m1[i] = *(m1 + i) = *(LIGNE *)((unsigned) m1 + i × sizeof(LIGNE)) = *(LIGNE *)((unsigned) m1 + i × NC × sizeof(float)) En oubliant pour un instant les types des pointeurs, il nous reste m1[i][j] = *(m1 + (i × NC + j) × sizeof(float)) Nous retrouvons l’expression classique i × NC + j caract´risant l’acc`s ` un ´l´ment mi,j d’une matrice N L×N C. e e a ee Cette expression traduit la disposition  par lignes  des tableaux rectangulaires, comme le montre la figure 10.

m1 i x NC j

m1[i][j]
Fig. 10 – Tableau bidimensionnel statique Etudions une autre mani`re d’acc´der aux ´l´ments de cette mˆme matrice. Soient les d´clarations e e ee e e
46 Pour

all´ger les formules, nous supposons ici que la taille d’un int, et donc celle d’un unsigned, sont ´gales ` celle d’un pointeur. e e a

c H. Garreta, 1988-2006

69

6.2 Les pointeurs et les tableaux

6

POINTEURS

float m1[NL][NC], *m2[NL]; La deuxi`me se lit, compte tenu des priorit´s : float *(m2[NL]). La variable m2 est donc d´clar´e comme e e e e un tableau de NL pointeurs vers des nombres flottants. Pour r´aliser la matrice dont nous avons besoin, il nous e suffit d’initialiser correctement ces pointeurs : chacun sera l’adresse d’une ligne de la matrice pr´c´dente. Nous e e aurons la configuration de la figure 11.

m2 i m2[i]

j

m2[i][j]
Fig. 11 – Tableau bidimensionnel r´alis´ avec un tableau de pointeurs e e Il est remarquable qu’un ´l´ment de la nouvelle  matrice  ainsi d´clar´e se note encore ee e e m2[i][j] mais maintenant, cette expression se traduira (en continuant ` n´gliger les conversions des types pointeurs) par : a e m2[i][j] = *(m2[i] + j × sizeof(float)) = *(*(m2 + i × sizeof(float *)) + j × sizeof(float)) Les multiplications par sizeof(float) et sizeof(float *) sont r´alis´es de mani`re tr`s rapide par les e e e e calculateurs (ce sont des multiplications par des puissances de 2), nous pouvons les ignorer. Il reste que nous avons remplac´  m1 + i × NC + j  par  *(m2 + i) + j . Nous avons donc bien ´limin´ une  vraie  e e e multiplication : notre deuxi`me mani`re est plus efficace. En contrepartie nous occupons un peu plus d’espace e e (les NL pointeurs suppl´mentaires). e De plus, il nous faut initialiser le tableau de pointeurs m2. La matrice m1 existant par ailleurs, cela se fait ici par une expression d’une ´tonnante simplicit´ : e e for (i = 0; i < NL; i++) m2[i] = m1[i];

6.2.4

Tableaux multidimensionnels dynamiques

Les consid´rations pr´c´dentes montrent pourquoi dans la r´alisation d’une matrice dynamique on devra e e e e renoncer au m´canisme de double indexation ordinaire. En effet, NC doit ˆtre connu ` la compilation pour que e e a l’expression i × NC + j ait un sens. Or nous sommes maintenant parfaitement ´quip´s pour r´aliser une telle matrice. Supposons que la fonction e e e void unCalcul(int nl, int nc) impl´mente un algorithme qui requiert une matrice locale ` nl lignes et nc e a colonnes. Version statique : #define NL 20 #define NC 30 ... void unCalcul(int nl, int nc) { double mat[NL][NC]; /* en esp´rant que nl ≤ NL et nc ≤ NC */ e int i, j;

70

c H. Garreta, 1988-2006

6 POINTEURS

6.2

Les pointeurs et les tableaux

/* utilisation de la matrice mat. Par exemple : */ for (i = 0; i < nl; i++) for (j = 0; j < nc; j++) mat[i][j] = 0; etc. } Version dynamique : void unCalcul(int nl, int nc) { double **mat; int i, j; /* initialisation des pointeurs */ mat = malloc(nl * sizeof(double *)); if (mat == NULL) return 0; for (i = 0; i < nl; i++) { mat[i] = malloc(nc * sizeof(double)); if (mat[i] == NULL) { for (j = 0; j < i; j++) free(mat[j]); free(mat); } } /* utilisation de la matrice mat. Par exemple : */ for (i = 0; i < nl; i++) for (j = 0; j < nc; j++) mat[i][j] = 0; etc. /* lib´ration (indispensable dans le cas d’une variablelocale) */ e for (j = 0; j < nl; j++) free(mat[j]); free(mat); } Dans cette mani`re de proc´der, les lignes de la matrice sont allou´es ` l’occasion de nl appels distincts de e e e a malloc. La matrice est r´alis´e par des morceaux de m´moire ´parpill´e, comme le montre la figure 12. e e e e e

m2

Fig. 12 – Matrice dynamique (lignes allou´es s´par´ment) e e e

¨ Variante : lignes contigues. Une l´g`re variante consiste ` allouer d’un seul coup toute la m´moire e e a e n´cessaire aux lignes de la matrice47 . La structure de la matrice ressemble alors ` celle de la figure 11 : e a
47 Notez que les expressions  sizeof *mat  et  sizeof *mat[0]  ´quivalent respectivement `  sizeof(double *)  et e a  sizeof(double) . Elles ont l’avantage d’ˆtre ind´pendantes du type effectif de mat. e e

c H. Garreta, 1988-2006

71

6.2 Les pointeurs et les tableaux

6

POINTEURS

int unCalcul(int nl, int nc) { double **mat; int i, j; /* initialisation des pointeurs */ mat = malloc(nl * sizeof *mat); if (mat == NULL) return 0; /* ´chec */ e mat[0] = malloc(nl * nc * sizeof *mat[0]); if (mat[0] == NULL) { free(mat); return 0; /* ´chec */ e } for (i = 1; i < nl; i++) mat[i] = mat[i - 1] + nc; /* utilisation de la matrice mat. Par exemple : */ for (i = 0; i < nl; i++) for (j = 0; j < nc; j++) mat[i][j] = 0; etc. /* lib´ration (indispensable dans le cas d’une variablelocale) */ e free(mat[0]); free(mat); return 1; }

/* succ`s */ e

longueur maximum d'une chaîne B o n s o i r \0 \0 C a v a ? \0 C e n ' e st B y e \0

p as

un

texte

g é n i a l !\ 0

Fig. 13 – Matrice de caract`res e

6.2.5

Tableaux de chaˆ ınes de caract`res e

Le remplacement d’un tableau ` deux indices par un tableau de pointeurs se r´v`le encore plus utile dans a e e le traitement des tableaux de chaˆ ınes de caract`res. Ici, cette technique entraˆ une ´conomie de place sube ıne e stantielle, puisqu’elle permet de remplacer un tableau rectangulaire dont la largeur est d´termin´e par la plus e e grande longueur possible d’une chaˆ (avec un espace inoccup´ tr`s important) comme celui de la figure 13, ıne e e par un espace lin´aire dans lequel chaque chaˆ n’occupe que la place qui lui est n´cessaire, comme le montre e ıne e la figure 14.

B o n s o i r \0\0 C a

v a ? \0 B y e \ C e 0

n ' e s ...

encombrement réel des caractères
Fig. 14 – Tableau de chaˆ ınes de caract`res e Nous allons illustrer cette m´thodologie par un exemple tr`s simple mais tout ` fait typique. Notre programme e e a 72
c H. Garreta, 1988-2006

6 POINTEURS

6.2

Les pointeurs et les tableaux

lit des lignes de caract`res au terminal et les range dans une table, jusqu’` la rencontre de la fin de fichier ou e a la lecture d’une ligne vide. Ensuite, il ordonne les lignes lues ; finalement il affiche les lignes ordonn´es. e Les lignes lues sont rang´es les unes ` la suite des autres dans un tableau unique, nomm´ espace, dont le e a e pointeur libre indique la premi`re place disponible. La table des mots, not´e mots, est une table de renvois e e dans espace. La figure 14 illustre ces structures de donn´es. Notez que le tri se fait en ordonnant la table des e pointeurs ; les caract`res eux-mˆmes ne sont nullement d´plac´s. e e e e Les fonctions gets (lecture de chaˆ ıne), puts (´criture de chaˆ e ıne), strcmp (comparaison de chaˆ ınes) et strlen (longueur d’une chaˆ ıne) appartiennent ` la biblioth`que standard et sont expliqu´es dans les sections suivantes. a e e #include <stdio.h> #include <string.h> #define MAXMOTS 100 #define MAXCARS 3000 char char char int espace[MAXCARS]; *libre = espace; *mots[MAXMOTS]; nbr_mots = 0;

void tri(char *t[], int n) { for (;;) { int i, ok = 1; for (i = 1; i < n; i++) if (strcmp(t[i - 1], t[i]) > 0) { char *w = t[i - 1]; t[i - 1] = t[i]; t[i] = w; ok = 0; } if (ok) return; n--; } } void main(void) { int i; while(gets(libre) != NULL && *libre != ’\0’) { mots[nbr_mots++] = libre; libre += strlen(libre) + 1; } tri(mots, nbr_mots); for (i = 0; i < nbr_mots; i++) printf("%s\n", mots[i]); } Remarque. On peut signaler qu’une structure tout ` fait analogue ` notre table mots est cr´´e par le a a ee compilateur lorsqu’on initialise un tableau de chaˆ ınes de caract`res, comme dans : e char *messages[] = { "Fichier inexistant", "Volume ou repertoire inexistant", "Nom de fichier incorrect", "Erreur physique d’entree-sortie", "Autre erreur" }; La seule diff´rence entre notre tableau mots et le tableau messages que cr´erait le compilateur par suite e e de la d´claration ci-dessus est la suivante : les ´l´ments de mots sont des pointeurs vers un espace modifiable e ee faisant partie de la m´moire attribu´e pour les variables de notre programme, tandis que messages est fait de e e pointeurs vers des cellules de la  zone de constantes , espace immodifiable allou´ et garni une fois pour toutes e par le compilateur.
c H. Garreta, 1988-2006

73

6.2 Les pointeurs et les tableaux

6

POINTEURS

6.2.6

Tableaux multidimensionnels formels

Nous avons vu que si un argument formel d’une fonction ou une variable externe est un tableau ` un seul a indice, alors l’indication du nombre de ses ´l´ments est sans utilit´ puisqu’il n’y a pas d’allocation d’espace. ee e Mais que se passe-t-il pour les tableaux ` plusieurs indices ? Si un tableau a ´t´ d´clar´ a ee e e T table[N1 ][N2 ] ... [Nk−1 ][Nk ] ; (N1 , N2 , etc. sont des constantes) alors un acc`s comme e table[i1 ][i2 ] ... [ik−1 ][ik ] se traduit par *( (T *)table + i1 × N2 × N3 × · · · × Nk + · · · + ik−1 × Nk + ik ) Qu’il y ait ou non allocation d’espace, il faut que ce calcul puisse ˆtre effectu´. D’o` la r`gle g´n´rale : e e u e e e lorsqu’un argument formel d’une fonction est un tableau ` plusieurs indices, la connaissance de la premi`re a e dimension d´clar´e est sans utilit´ mais les autres dimensions d´clar´es doivent ˆtre connues du compilateur. e e e e e e Pour un tableau ` deux indices, cela donne : il est inutile d’indiquer combien il y a de lignes, mais il faut a absolument que, en compilant la fonction, le compilateur connaisse la taille d´clar´e pour chaque ligne. Par e e exemple, la fonction suivante effectue la multiplication par un scalaire k de la matrice m d´clar´e NL × NC (deux e e constantes connues dans ce fichier) : void k_fois(double k, double m[][NC]) { int i, j; for (i = 0; i < NL; i++) for (j = 0; j < NC; j++) m[i][j] *= k; } Remarque. Bien entendu, une autre solution aurait consist´ ` faire soi-mˆme les calculs d’indice : ea e void k_fois(double k, void *m) { int i, j; for (i = 0; i < NL; i++) for (j = 0; j < NC; j++) *((double *) m + i * NC + j) *= k; } Tout ce qu’on y gagne est un programme bien plus difficile ` lire ! a

6.2.7

Tableaux non n´cessairement index´s ` partir de z´ro e e a e

En principe, les tableaux de C sont index´s ` partir de z´ro : sans qu’il soit n´cessaire de le sp´cifier, un e a e e e tableau T d´clar´ de taille N est fait des ´l´ments T0 , T1 . . . TN −1 . Nous avons vu que, dans la grande majorit´ e e ee e des applications, cette convention est commode et fiable. Il existe cependant des situations dans lesquelles on souhaiterait pouvoir noter les ´l´ments d’un tableau ee T1 , T2 . . . TN ou, plus g´n´ralement, Ta , Ta+1 . . . Tb , a et b ´tant deux entiers quelconques v´rifiant a ≤ b. Nous e e e e allons voir que l’allocation dynamique fournit un moyen simple et pratique48 pour utiliser de tels tableaux. ` Cas des tableaux a un indice. La fonction dTable49 cr´e un tableau d’´l´ments de type double dont e ee les indices sont les entiers iMin, iMin+1, . . . iMax :
48 Nous expliquons ici une technique massivement employ´e dans la biblioth`que de calcul scientifique Numerical Recipes ( c e e Numerical Recipes Software) bas´e sur le livre Numerical Recipes in C (W. Press, S. Teukolsky, W. Vetterling et B. Flannery, e Cambridge University Press, 1992). 49 Strictement parlant, la norme du langage C ne garantit pas que la technique expos´e ici fonctionne correctement sur tous e les syst`mes. D’obscures contraintes techniques font que sur certains mat´riels ou syst`mes l’arithm´tique des adresses subit des e e e e limitations drastiques et, notamment, rendent le r´sultat de la soustraction d’un entier ` un pointeur peut ˆtre incorrect ou e a e inutilisable.

74

c H. Garreta, 1988-2006

6 POINTEURS

6.2

Les pointeurs et les tableaux

double *dTable(int iMin, int iMax) { double *res = malloc((iMax - iMin + 1) * sizeof(double)); if (res == NULL) { erreurTable = 1; return NULL; } erreurTable = 0; return res - iMin; } (Si on avait besoin de tableaux de float, de int, etc. on ´crirait des fonctions analogues fTable, iTable, e etc.). La variable globale erreurTable est rendue n´cessaire par le fait qu’un r´sultat NULL ne suffit pas ici ` e e a caract´riser l’´chec de l’allocation ; en effet, res - iMin peut ˆtre nul alors que l’allocation a r´ussi et res = e e e e NULL. La figure 15 illustre le r´sultat rendu par la fonction pr´c´dente lors d’un appel comme dTable(5, 10). e e e

adresse rendue comme résultat par dTable

cellules effectivement allouées
Fig. 15 – Adresse rendue par la fonction dTable 0n acc`de aux ´l´ments d’un tel tableau ` l’aide d’un indice compris entre les valeurs indiqu´es mais, ` part e ee a e a cela, de mani`re tout ` fait habituelle ; en particulier, sans aucune perte d’efficacit´. Exemple d’utilisation : e a e ... double *t = dTable(5, 10); ... for (i = 5; i <= 10; i++) t[i] = 1000 + i; ... for (i = 5; i <= 10; i++) printf("%.1f\n", t[i]); ... Attention. Un tableau cr´´ par un appel de la fonction dTable est dynamiquement allou´, cependant sa ee e lib´ration est un peu plus complexe que pour les tableaux dynamiques ordinaires. En particulier, ` la suite du e a programme ci-dessus, un appel comme free(t); g´n´rera certainement une erreur ` l’ex´cution. Il aurait fallu d´finir une structure plus complexe qu’un simple e e a e e tableau, incluant soit la valeur de iMin, soit celle de res (actuellement des variables locales de la fonction dTable) pour g´rer correctement la lib´ration ult´rieure d’un tel tableau. e e e ` Cas des tableaux a plusieurs indices. Les remarques pr´c´dentes, avec celles faites ` la section 6.2.4, e e a sugg`rent une mani`re de mettre en œuvre des matrices dont les lignes et les colonnes ne sont pas index´es ` e e e a partir de z´ro. e La fonction dMatrice cr´e une matrice dont les lignes sont index´es par les entiers lMin, lMin+1 . . . lMax e e et les colonnes sont index´es par les entiers cMin, cMin+1 . . . cMax : e double **dMatrice(int lMin, int lMax, int cMin, int cMax) { int nbLin, nbCol, i; double *espace, **lignes, *p; nbLin = lMax - lMin + 1; nbCol = cMax - cMin + 1; espace = malloc(nbLin * nbCol * sizeof(double)); if (espace == NULL) { erreurTable = 1; return NULL; }

c H. Garreta, 1988-2006

75

6.2 Les pointeurs et les tableaux

6

POINTEURS

lignes = malloc(nbLin * sizeof(double *)); if (lignes == NULL) { erreurTable = 1; free(espace); return NULL; } p = espace - cMin; for (i = 0; i < nbLin; i++) { lignes[i] = p; p += nbCol; } erreurTable = 0; return lignes - lMin; } Comme pr´c´demment, l’emploi de ces matrices ne s’accompagne d’aucune perte d’efficacit´. Voici un e e e exemple d’utilisation : ... double **m = dMatrice(5, 10, -3, 3); ... for (i = 5; i <= 10; i++) for (j = -3; j <= 3; j++) m[i][j] = 1000 * i + j; ... for (i = 5; i <= 10; i++) { for (j = -3; j <= 3; j++) printf("%10.1f ", m[i][j]); printf("\n"); } ...

6.2.8

Matrices non dynamiques de taille inconnue

Un dernier cas qui se pr´sente parfois est celui o` on doit ´crire une fonction op´rant sur des matrices e u e e ordinaires (c.-`-d. non dynamiques) alors que leurs dimensions ne sont pas connues lors de la compilation. a Par exemple, voici la fonction qui effectue le produit de deux matrices A et B en d´posant le r´sultat dans e e une troisi`me matrice C. Les arguments nla et nca repr´sentent le nombre effectif de lignes et de colonnes de e e A, tandis que ncb est le nombre effectif de colonnes de B. Les arguments dNca, dNcb et dNcc repr´sentent les e nombres de colonnes avec lesquels les matrices A, B et C ont ´t´ respectivement d´clar´s . ee e e void produitMatrices(double *A, double *B, double *C, int nla, int nca, int ncb, int dNca, int dNcb, int dNcc) { int i, j, k; double s; for (i = 0; i < nla; i++) for (j = 0; j < ncb; j++) { s = 0; for (k = 0; k < nca; k++) s += A[i * dNca + k] * B[k * dNcb + j]; C[i * dNcc + j] = s; } } Exemple d’appel (NLA, NCA, etc., sont des constantes introduites par des #define, tandis que nla, nca, etc. sont des variables) : 76
c H. Garreta, 1988-2006

/*1*/ /*1*/

6 POINTEURS

6.3

Les adresses des fonctions

double A[NLA][NCA], B[NLB][NCB], C[NLC][NCC]; ... obtention des valeurs des variables nla, nca, etc., et des matrices A et B ... produitMatrices(&A[0][0], &B[0][0], &C[0][0], nla, nca, ncb, NCA, NCB, NCC); ... On notera que la fonction produitMatrices peut ˆtre optimis´e en supprimant des multiplications qui sont e e faites dans la boucle la plus profonde (la seule qui doit nous int´resser, du point de vue de l’efficacit´). Pour cela, e e il suffit de remplacer les deux lignes marqu´es /*1*/ par ceci (ia et ib sont des variables locales nouvelles) : e ... ia = i * dNca; ib = j; for (k = 0; k < nca; k++) { s += A[ia] * B[ib]; ia += 1; ib += dNcb; } ...

/*2*/ /*2*/ /*2*/ /*2*/ /*2*/ /*2*/ /*2*/

6.3
6.3.1

Les adresses des fonctions
Les fonctions et leurs adresses

En ´tudiant les d´clarateurs complexes (section 5.4) nous avons appris que la syntaxe de C permettait e e de manipuler le type  fonction rendant un [objet de type] T  (T repr´sente un autre type), cette p´riphrase e e constituant elle-mˆme un d´clarateur que le programmeur peut composer librement avec les autres d´clarateurs, e e e  adresse d’un [objet de type] T  et  tableau de [objets de type] T . Tout cela sugg`re qu’en C on aura le e droit de travailler avec des variables qui repr´sentent des fonctions, des tableaux de fonctions, des fonctions e renvoyant comme r´sultat d’autres fonctions, etc. Qu’en est-il exactement ? e Le concept le plus simple qu’on peut souhaiter dans ce domaine est celui de variable dont la valeur est une fonction. Il va falloir y renoncer, pour une raison facile ` comprendre : la taille d’une fonction ne peut pas a se d´duire de son type50 . C’est un inconv´nient r´dhibitoire, car toute d´finition de variable doit entraˆ e e e e ıner la r´servation d’un espace m´moire pour en contenir la valeur, ce qui demande de connaˆ combien d’octets sont e e ıtre n´cessaires. e En revanche, le langage C permet d’utiliser un concept ` peine plus complexe que le pr´c´dent : celui de a e e variable dont la valeur est l’adresse d’une fonction. Il n’y a plus de probl`me de taille (la taille d’une adresse e – ou pointeur – est constante), et la syntaxe pour d´clarer une telle variable a d´j` ´t´ expliqu´e dans la section e eae e e sur les d´clarateurs complexes (cf. section 5.4). Exemple : e double (*uneFonction)(int n, double x); Cet ´nonc´ d´clare uneFonction comme une variable (un pointeur) destin´e ` contenir des adresses de fonctions e e e e a ayant deux arguments, un int et un double, et rendant une valeur double. Cette d´claration n’initialise pas e uneFonction (sauf, si c’est une variable globale, avec la valeur 0, peu utile ici) et, ` part le type des arguments a et du r´sultat, ne laisse rien deviner sur les caract´ristiques des fonctions dont uneFonction contiendra les e e adresses. Si, par la suite, uneFonction re¸oit l’adresse d’une fonction φ pour valeur, alors l’expression suivante est c correcte et repr´sente un appel de φ (en supposant k de type int et u et v de type double) : e u = (*uneFonction)(k, v);
50 Notez que, malgr´ les apparences, il n’est pas d´lirant de rapprocher les fonctions et les donn´es. Une fois compil´e (traduite e e e e en langage machine), une fonction est une suite d’octets qui occupe une portion de m´moire exactement comme, par exemple, un e tableau de nombres. La principale diff´rence est dans la possibilit´ ou l’impossibilit´ de pr´dire le nombre d’octets occup´s. e e e e e Pour un tableau, par exemple, ce nombre d´coule sans ambigu¨ e de la d´claration. Pour une fonction il ne d´pend pas de la e ıt´ e e d´claration (qui ne pr´cise que le type du r´sultat et le nombre et les types des arguments) mais du nombre d’instructions qui e e e composent la fonction, c’est-`-dire de ce qu’elle fait et comment elle le fait. a

c H. Garreta, 1988-2006

77

6.3 Les adresses des fonctions

6

POINTEURS

Comment le programmeur obtient-il des adresses de fonctions ? Il faut savoir que, de la mˆme mani`re que e e le nom d’un tableau repr´sente son adresse de base, le nom d’une fonction repr´sente l’adresse de celle-ci. Ainsi, e e si on a la d´finition de fonction e double maFonction(int nbr, double val) { etc. } alors l’expression maFonction : – poss`de le type  adresse d’une fonction ayant pour arguments un int et un double et rendant un e double  ; – a pour valeur l’adresse o` commence la fonction maFonction ; u – n’est pas une lvalue. Par cons´quent, l’affectation suivante est tout ` fait l´gitime : e a e uneFonction = maFonction; A partir de cette affectation (et tant qu’on aura pas chang´ la valeur de uneFonction) les appels de e (*uneFonction) seront en fait des appels de maFonction. Examinons deux applications de cela parmi les plus importantes. 6.3.2 Fonctions formelles

Le probl`me des fonctions formelles, c’est-`-dire des fonctions arguments d’autres fonctions, est r´solu en C e a e par l’utilisation d’arguments de type  pointeur vers une fonction . ´ Exemple 1 : resolution de f (x) = 0 par dichotomie. Si f est une fonction continue, d´finie sur un e intervalle [ a . . . b ] telle que f (a) et f (b) ne sont pas de mˆme signe, la fonction dicho recherche xε ∈ [ a . . . b ] e telle qu’il existe x0 ∈ [ a . . . b ] v´rifiant |xε − x0 | ≤ ε et f (x0 ) = 0. En clair : dicho d´termine xε , qui est une e e solution de l’´quation f (x) = 0 si on tol`re une erreur d’au plus ε. e e Les arguments de la fonction dicho sont : les bornes a et b de l’intervalle de recherche, la pr´cision ε voulue e et surtout la fonction f dont on cherche un z´ro. Voici cette fonction : e double dicho(double a, double b, double eps, double (*f)(double)) { double x; /* hypoth`se : f(a) * f(b) <= 0 */ e if ((*f)(a) > 0) { x = a; a = b; b = x; } while (fabs(b - a) > eps) { x = (a + b) / 2; if ((*f)(x) < 0) a = x; else b = x; } return x; } L’argument f est d´clar´ comme un pointeur vers une fonction ; par cons´quent *f est une fonction et (*f)(x) e e e un appel de cette fonction. Si une fonction est le nom d’une fonction pr´c´demment d´finie, changeant de signe e e e sur l’intervalle [0, 1], un appel correct de dicho serait x = dicho(0.0, 1.0, 1E-8, une_fonction); Autre exemple du mˆme tonneau e y = dicho(0.0, 3.0, 1E-10, cos); Remarque. En syntaxe originale, ou  sans proptotypes , la fonction dicho s’´crirait e double dicho(a, b, eps, f) double a, b, eps, (*f)(); { etc. (la suite est la mˆme) e } Exemple 2 : utilisation de qsort. Reprenons notre programme de la section 6.2.5 (tri d’un tableau de chaˆ ınes de caract`res) en rempla¸ant la fonction de tri na¨ par la fonction qsort de la biblioth`que standard. e c ıf e 78
c H. Garreta, 1988-2006

6 POINTEURS

6.3

Les adresses des fonctions

Cette fonction est expliqu´e ` la section 8.4.2, elle trie un tableau par rapport ` un crit`re quelconque. Si elle e a a e nous int´resse ici c’est parce qu’elle prend ce crit`re, repr´sent´ par une fonction, pour argument : e e e e #include <stdio.h> #include <string.h> #define MAXMOTS 100 #define MAXCARS 3000 char espace[MAXCARS], *libre = espace; char *mots[MAXMOTS]; int nbr_mots = 0; /* La d´claration suivante se trouve aussi dans <stdlib.h> : */ e void qsort(void *base, size_t nmemb, size_t size, int (*comp)(const void *, const void *)); int comparer(const void *a, const void *b) { /* Les arguments de cette fonction doivent ^tre d´clar´s "void *" (voyez la */ e e e /* d´claration de qsort). En r´alit´, dans les appels de cette fonction que */ e e e /* nous faisons ici, a et b sont des adresses de "cha^nes", c’est-`-dire des */ ı a /* adresses d’adresses de char */ return strcmp(*(char **)a, *(char **)b); } main() { int i; while(gets(libre) != NULL && *libre != ’\0’) { mots[nbr_mots++] = libre; libre += strlen(libre) + 1; } qsort(mots, nbr_mots, sizeof(char *), comparer); for (i = 0; i < nbr_mots; i++) printf("%s\n", mots[i]); } Remarque. La d´finition de comparer peut paraˆ bien compliqu´e. Pour la comprendre, il faut consid´rer e ıtre e e les diverses contraintes auxquelles elle doit satisfaire : – comparer figurant comme argument dans l’appel de qsort, son prototype doit correspondre exactement51 a ` celui indiqu´ dans le prototype de qsort ; e – a et b, les arguments formels de comparer, ´tant de type void *, on ne peut acc´der aux objets qu’ils e e pointent sans leur donner auparavant (` l’aide de l’op´rateur de conversion de type) un type pointeur a e  utilisable  ; – d’apr`s la documentation de qsort, nous savons que comparer sera appel´e avec deux adresses de chaˆ e e ınes pour arguments effectifs ; une chaˆ ´tant de type char *, le type  adresse de chaˆ  est char **, ce ıne e ıne qui explique la fa¸on dont a et b apparaissent dans l’appel de strcmp. c 6.3.3 Tableaux de fonctions

Le programme suivant montre l’utilisation d’un tableau d’adresses de fonctions : chaque ´l´ment du tableau ee table est form´ de deux champs : e – le nom d’une fonction standard, sous forme de chaˆ de caract`res ; ıne e – l’adresse de la fonction correspondante. Notre programme lit des lignes constitu´es d’un nom de fonction, suivi d’un ou plusieurs blancs, suivis d’un e nombre r´el ; il ´value et affiche alors la valeur de la fonction mentionn´e appliqu´e au nombre donn´. La frappe e e e e e d’une ligne r´duite au texte fin arrˆte le programme. e e #include <stdio.h> double sin(double), cos(double), exp(double), log(double);
51 En syntaxe  sans prototype , aucun contrˆle n’est fait sur le type des arguments de comparer, et toute cette question est bien o plus simple. Mais attention : quelle que soit la syntaxe employ´e, on ne peut pas ignorer le fait que comparer sera appel´e (par e e qsort) avec pour arguments effectifs les adresses des chaˆ ınes ` comparer. a

c H. Garreta, 1988-2006

79

6.3 Les adresses des fonctions

6

POINTEURS

struct { char *nom; double (*fon)(double); } table[] = { "sin", sin, "cos", cos, "exp", exp, "log", log }; #define NBF (sizeof table / sizeof table[0]) main() { char nom[80]; double x; int i; for(;;) { scanf("%s", nom); if (strcmp(nom, "fin") == 0) break; scanf("%lf", &x); for(i = 0; i < NBF && strcmp(table[i].nom, nom) != 0; i++) ; if (i < NBF) printf("%f\n", (*table[i].fon)(x)); else printf("%s ???\n", nom); } } Voici une ex´cution de ce programme : e sin 1 0.841471 cos 1 0.540302 atn 1 atn ??? fin Remarque. La d´claration du tableau table pr´sente une caract´ristique peu fr´quente : des fonctions e e e e sont r´f´renc´es mais elles ne sont pas en mˆme temps appel´es. En effet, les noms des fonctions sin, cos, ee e e e exp, etc. apparaissent dans cette d´claration sans ˆtre accompagn´s d’une paire de parenth`ses ; il n’y a aucun e e e e signe indiquant au compilateur qu’il s’agit de fonctions. C’est pourquoi ce programme sera trouv´ erron´ par le e e compilateur ` moins qu’on lui donne les d´clarations externes des fonctions, soit explicitement : a e double sin(double), cos(double), exp(double), log(double); soit en incluant un fichier dans lequel sont ´crites ces d´clarations : e e #include <math.h> 6.3.4 Flou artistique

A ce point de notre expos´ vous ˆtes en droit de trouver que les rˆles respectifs des objets de type  fonce e o tion...  et des objets de type  adresse d’une fonction...  sont confus. Examinons une fonction bien ordinaire, sinus. La d´claration de cette fonction, extraite du fichier <math.h>, est : e double sin(double); D’autre part, la d´finition d’une variable de type  adresse d’une fonction double ` un argument double  est : e a double (*f)(double); Voici l’initialisation de f par l’adresse de la fonction sin et deux appels ´quivalents de cette fonction (x, y e et z sont des variables double) : 80
c H. Garreta, 1988-2006

6 POINTEURS

6.4

Structures r´cursives e

f = sin; y = (*f)(x); z = sin(x); Quelle que soit la valeur de x, y et z re¸oivent la mˆme valeur. Pourtant, les trois lignes ci-dessus ne sont c e pas coh´rentes. La premi`re montre que f et sin sont de mˆme type (` savoir  adresse d’une fonction... ) ; or e e e a f doit ˆtre d´r´f´renc´ pour appeler la fonction, tandis que sin n’a pas besoin de l’ˆtre. e eee e e On peut comprendre la raison de cette incoh´rence. Apr`s avoir constat´ l’impossibilit´ de d´clarer des e e e e e variables de type  fonction...  , car une fonction n’a pas de taille d´finie, et donc l’obligation de passer par des e variables  adresse de fonction... , on a voulu faire cohabiter la rigueur (un pointeur doit ˆtre d´r´f´renc´ pour e eee e acc´der ` l’objet qu’il pointe) et la tradition (le sinus de x s’est toujours ´crit sin(x)). Cela a conduit ` d´finir e a e a e l’op´rateur d’appel de fonction aussi bien pour une expression de type  fonction...  que pour une expression e de type  adresse d’une fonction... . Ainsi, les deux expressions (*f)(x) et sin(x) sont correctes ; l’exp´rience e montre que cette tol´rance n’a pas de cons´quences n´fastes. Il n’en d´coule pas moins que les deux expressions e e e e u = f(x); v = (*sin)(x); sont accept´es elles aussi (elles ont la mˆme valeur que les pr´c´dentes). e e e e

6.4
6.4.1

Structures r´cursives e
D´claration e

Les structures r´cursives font r´f´rence ` elles-mˆmes. Elles sont principalement utilis´es pour implanter des e ee a e e structures de donn´es dont la d´finition formelle est un ´nonc´ r´cursif. Parmi les plus fr´quemment rencontr´es : e e e e e e e les listes et les arbres, comme les arbres binaires. Ainsi, par exemple, on peut donner la d´finition r´cursive suivante : un arbre binaire est e e – soit un symbole conventionnel signifiant  la structure vide  ; – soit un triplet ( valeur , fils g , fils d ) constitu´ d’une information dont la nature d´pend du probl`me e e e ´tudi´ et de deux descendants qui sont des arbres binaires. e e Bien entendu, du point de vue technique il n’est pas possible de d´clarer un champ d’une structure comme e ayant le mˆme type que la structure elle-mˆme (une telle structure serait ipso facto de taille infinie !). On e e contourne cette difficult´ en utilisant les pointeurs. Un arbre binaire est repr´sent´ par une adresse, qui est : e e e – soit l’adresse nulle ; – soit l’adresse d’une structure constitu´e de trois champs : une information et deux descendants qui sont e des adresses d’arbres binaires. Typiquement, la d´claration d’une telle structure sera donc calqu´e sur la suivante : e e struct noeud { type valeur; struct noeud *fils_gauche, *fils_droit; }; Notez que le nom de la structure (noeud) est ici indispensable, pour indiquer le type des objets point´s par e les champs fils gauche et fils droit.

6.4.2

Exemple

Le programme suivant effectue le mˆme travail que celui du 6.2.5, mais ` la place d’une table on utilise un e a arbre binaire de recherche (voir, par exemple, R. Sedgewick, Algorithmes en langage C, chapitre 14) pour ranger les mots. La structure de donn´es mise en œuvre est repr´sent´e sur la figure 16. e e e #include <stdlib.h> #include <stdio.h> #define MAXCARS 3000 char espace[MAXCARS], *libre = espace;
c H. Garreta, 1988-2006

81

6.4 Structures r´cursives e

6

POINTEURS

typedef struct noeud { char *mot; struct noeud *fils_gauche, *fils_droit; } NOEUD, *POINTEUR; POINTEUR alloc(char *m, POINTEUR g, POINTEUR d) { POINTEUR p = malloc(sizeof(NOEUD)); p->mot = m; p->fils_gauche = g; p->fils_droit = d; return p; }

POINTEUR insertion(POINTEUR r, char *mot) { if (r == NULL) r = alloc(mot, NULL, NULL); else if (strcmp(mot, r->mot) <= 0) r->fils_gauche = insertion(r->fils_gauche, mot); else r->fils_droit = insertion(r->fils_droit, mot); return r; }

libre

j e a n \0 a n d r é \0 p a u l \ 0
racine mot fils gauche fils droit

...

...

...

...

Fig. 16 – Arbre binaire de mots

void parcours(POINTEUR r) { if (r != NULL) { parcours(r->fils_gauche); printf("%s\n", r->mot); parcours(r->fils_droit); } } 82
c H. Garreta, 1988-2006

...

6 POINTEURS

6.4

Structures r´cursives e

main() { POINTEUR racine = NULL; char *p; p = gets(libre); while(*p != ’\0’) { libre += strlen(p) + 1; racine = insertion(racine, p); p = gets(libre); } parcours(racine); }

6.4.3

Structures mutuellement r´cursives e

Donnons-nous le probl`me suivant : repr´senter une  liste de familles  ; chaque famille est une  liste e e d’individus , avec la particularit´ que chaque individu fait r´f´rence ` sa famille. Les structures famille et e ee a individu se pointent mutuellement, chacune intervenant dans la d´finition de l’autre. Comment les d´clarer ? e e

... ...
Liste de familles Liste d'individus

...

...

Fig. 17 – Structures mutuellement r´cursives e

Pour r´soudre ce probl`me le compilateur C tol`re qu’on d´clare un pointeur vers une structure non encore e e e e d´finie. Plus pr´cis´ment, si la structure ayant le nom indiqu´ n’a pas encore ´t´ d´clar´e, l’expression  struct e e e e ee e e nom  est l´gitime. Elle identifie un type incomplet et on peut l’utiliser ` tout endroit o` sa taille n’est pas e a u requise, notamment dans la d´claration d’un pointeur vers une telle structure. Cela nous permet de d´clarer nos e e structures mutuellement r´cursives sous la forme : e typedef struct famille { char *nom; struct individu *membres; struct famille *famille_suivante; } FAMILLE; typedef struct individu { char *prenom; struct individu *membre_suivant; struct famille *famille; } INDIVIDU; Une autre solution aurait ´t´ : ee
c H. Garreta, 1988-2006

...

83

6.4 Structures r´cursives e

6

POINTEURS

typedef struct famille FAMILLE; typedef struct individu INDIVIDU; struct famille { char *nom; INDIVIDU *membres; FAMILLE *famille_suivante; }; struct individu { char *prenom; INDIVIDU *membre_suivant; FAMILLE *famille; };

84

c H. Garreta, 1988-2006

´ 7 ENTREES-SORTIES

7

Entr´es-sorties e

Strictement parlant, les op´rations d’entr´e-sortie ne font pas partie du langage C ; elles sont effectu´es par e e e des fonctions de la biblioth`que que chaque syst`me offre avec le compilateur. Or, C est n´ et a v´cu longtemps e e e e en milieu UNIX avant d’ˆtre transport´ ailleurs ; la biblioth`que UNIX a donc souvent ´t´ prise pour r´f´rence, e e e ee ee semant quelque confusion car la r´alisation de certaines fonctions d’UNIX est inutile, voire impossible sur e certains syst`mes. La norme ANSI y a mis bon ordre ; en principe la liste des fonctions standard est maintenant e clairement ´tablie et un programme qui n’utilise que ces fonctions doit pouvoir ˆtre transport´ d’un syst`me e e e e a ` un autre sans modification. Rien n’empˆche que telle ou telle r´alisation particuli`re du langage propose des e e e fonctions additionnelles ; il faudra alors vous r´f´rer ` la documentation sp´cifique. ee a e

7.1

Flots

Quelles que soient les particularit´s du syst`me d’exploitation sous-jacent, les fonctions de la biblioth`que e e e standard des entr´es-sorties font en sorte que les fichiers soient vus par le programmeur comme des flots, c’este a `-dire des suites d’octets qui repr´sentent des donn´es selon une des deux modalit´s suivantes : e e e – soit le fichier contient les caract`res qui constituent l’expression ´crite des donn´es en question d’apr`s une e e e e certaine syntaxe. Ces caract`res sont eux-mˆmes repr´sent´s selon une convention largement r´pandue, e e e e e presque toujours le code ASCII. De tels fichiers sont appel´s fichiers de texte. Leur principale qualit´ est e e d’ˆtre exploitables par un logiciel, un syst`me ou un ´quipement diff´rents de celui qui les a produits ; en e e e e particulier, ils peuvent ˆtre affich´s, ´dit´s, imprim´s, etc. ; e e e e e – soit le fichier contient des donn´es enregistr´es sous une forme qui est la copie exacte de leur codage dans e e la m´moire de l’ordinateur. On l’appelle alors fichier binaire. Les op´rations de lecture ou d’´criture sur de e e e tels fichiers sont tr`s rapides, car elles ne requi`rent pas un travail d’analyse ou de synth`se de l’expression e e e ´crite des donn´es. En revanche, les fichiers binaires ne sont pas ´ditables ou imprimables ; ils ne sont pas e e e cens´s ˆtre transportables d’un logiciel ` un autre, encore moins d’un syst`me ` un autre. e e a e a Du point de vue du langage C (il n’en est peut ˆtre pas de mˆme pour le syst`me sous-jacent) ˆtre de texte e e e e ou binaire n’est pas une propri´t´ d’un fichier, mais de la mani`re dont il est trait´ par un programme. Ainsi ee e e la distinction entre ces deux types de fichiers ne se fait pas lors de la d´claration ou de l’ouverture52 du fichier, e mais par le choix des fonctions de lecture ou d’´criture qui sont utilis´es : certaines fonctions (fgets et fputs, e e lecture et ´criture d’une ligne, et fscanf et fprintf, lecture et ´criture de donn´es format´es) n’ont de sens que e e e e sur un flot de texte. D’autres fonctions (fread, fwrite) effectuent la lecture et l’´criture de paquets d’octets e sans interpr´tation aucune, et correspondent donc plutˆt aux flots binaires53 . e o Les flots binaires sont de simples suites d’octets. Les flots de texte ont une structure l´g`rement plus riche, e e puisqu’ils sont cens´s ˆtre organis´s comme des suites de lignes. Chaque ligne est faite d’un nombre quelconque e e e de caract`res distincts de ’\n’ et se termine par le caract`re ’\n’. Mˆme si sur un syst`me particulier les fichiers e e e e de texte ne sont pas ainsi organis´s, ou si le caract`re qui indique la fin d’une ligne est diff´rent, la biblioth`que e e e e standard fera en sorte qu’ils puissent ˆtre vus de cette mani`re par le programmeur54 . e e Tampons. Un fichier est dit tamponn´ 55 lorsque les transferts physiques d’octets entre le fichier et un e programme qui le lit ou l’´crit se font par paquets de taille fixe, la taille du tampon, mˆme si les ´changes e e e logiques sont faits par paquets de taille variable ou mˆme octet par octet. Par d´faut un flot est toujours associ´ e e e a ` un tampon de taille pr´d´termin´e, mais le programmeur peut, ` l’aide de la fonction setvbuf (cf. section e e e a 7.1.1), modifier la taille de ce dernier ou mˆme le supprimer compl`tement. e e Ce mode de gestion des fichiers r´duit le nombre d’op´rations physiques d’entr´e - sortie (beaucoup plus e e e lentes, quelles que soient les performances des disques durs actuels, que les transferts d’information purement internes) mais introduit un d´calage dans leur chronologie. Ce que le programmeur croit ˆtre une op´ration e e e d’´criture dans un fichier n’est en r´alit´ qu’une  op´ration logique , c’est-`-dire une recopie dans un tampon e e e e a situ´ en m´moire, dont le contenu sera transf´r´ ult´rieurement vers le fichier. Par cons´quent, il est difficile ou e e ee e e impossible de savoir dans quel ´tat se trouve le fichier ` un moment donn´ ; de plus, si le programme vient ` e a e a subir une terminaison anormale, une partie des informations logiquement ´crites dans le fichier seront perdues, e
y a quand-mˆme un point de d´tail qu’il fait fixer lors de l’ouverture (voyez la fonction fopen) : y a-t-il lieu de guetter les e e marques de fins-de-ligne pour les transformer dans le caract`re ’\n’ et r´ciproquement ? e e 53 Cons´quence : sauf si le syst`me sous-jacent l’interdit, un fichier ´crit comme un flot de texte peut ˆtre lu comme un flot binaire. e e e e Cela revient ` ignorer le fait que les octets dont il se compose repr´sentent des donn´es d’un ordre sup´rieur. La d´marche inverse, a e e e e lire comme un flot de texte un fichier binaire, n’a pas de signification et peut provoquer des erreurs fatales (les fins de ligne seront absentes ou incomprises, le tampon d´bordera, etc.). e 54 En particulier, le couple (CR,LF ) utilis´ par certains syst`mes est traduit en lecture par l’unique caract`re ’\n’. Inversement, e e e sur de tels syst`mes, l’´criture  logique  du caract`re ’\n’ se traduit par l’´criture effective du couple (CR,LF ). e e e e 55 En bon franglais, on dit plutˆt  bufferis´ . o e
52 Il

c H. Garreta, 1988-2006

85

7.1 Flots

´ 7 ENTREES-SORTIES

parce qu’elles n’ont jamais ´t´ physiquement transf´r´es56 . ee ee 7.1.1 Fonctions g´n´rales sur les flots e e

Les flots sont repr´sent´s dans les programmes par des variables de type FILE *. La structure FILE est e e d´finie dans le fichier <stdio.h>. Pour utiliser un ou plusieurs flots il faut donc ´crire en tˆte de son programme e e e la directive #include <stdio.h> puis une d´claration de la forme e FILE *fichier ; Un fichier est donc repr´sent´ en C par une variable d’un type pointeur. Par cons´quent, sa d´claration e e e e n’autorise aucune des op´rations propres aux fichiers, aussi longtemps qu’on n’aura pas fait le n´cessaire (voyez e e la fonction fopen ci-apr`s) pour qu’il pointe sur une structure l´gitimement allou´e et qui constitue la description e e e d’un fichier ouvert. Parmi les principales fonctions qui effectuent les op´rations g´n´rales (ouverture, fermeture, etc.) sur les flots e e e nous avons : FILE *fopen(const char *nom, const char *mode) Cette fonction ouvre le fichier dont le nom est indiqu´ par la chaˆ nom et rend un pointeur sur le flot e ıne correspondant, ou NULL si l’op´ration a ´chou´ (fichier absent, etc.). Le nom doit ˆtre correct pour le e e e e syst`me d’exploitation sous-jacent ; cela ne regarde pas le langage C. e Les valeurs permises pour mode sont : "r" (read ) ouverture d’un fichier. Le fichier doit exister ; son contenu n’est pas d´truit. Le descripteur du e flot cr´´ est positionn´ en lecture et au d´but du fichier. En principe, seules les op´rations de lecture ee e e e sont permises sur ce flot. "r+" comme "r", mais les op´rations d’´criture sont permises aussi. e e "w" (write) cr´ation d’un fichier. Le fichier peut exister ou non ; s’il existe, son contenu est enti`rement e e effac´. Le descripteur du flot cr´´ est positionn´ en ´criture et au d´but du fichier (qui est vide). En e ee e e e principe, seules les op´rations d’´criture sont permises sur ce flot. e e "w+" comme "w", mais les op´rations de lecture sont permises aussi. e "a" (append) allongement d’un fichier. Le fichier existe ou non ; s’il existe, son contenu n’est pas effac´. Le e descripteur du flot cr´´ est positionn´ en ´criture et ` la fin du fichier. Seules les op´rations d’´criture ee e e a e e sont permises. "a+" comme "a", mais les op´rations de lecture sont permises aussi. e "rb", "r+b", "wb", "w+b", "ab", "a+b" : si on envisage d’utiliser le fichier en mode binaire il faut ajouter la lettre b au mode ("r+b", "w+b" et "a+b" peuvent se noter aussi "rb+", "wb+" et "ab+") . Remarque 1. La seule diff´rence que la lettre b dans le mode introduit dans le fonctionnement de toutes e les fonctions d’entr´e-sortie est la suivante : si le fichier est  de texte  (i.e. si la lettre b ne figure pas e dans le mode) alors : – en lecture, chaque occurrence d’une marque de fin de ligne est d´tect´e et, si cette marque n’est pas le e e caract`re ’\n’ lui-mˆme, remplac´e par l’unique caract`re ’\n’, e e e e e e – toute demande d’´criture du caract`re ’\n’ produit en fait l’envoi effectif au fichier de la marque de fin de ligne requise par le syst`me sous-jacent. e Il n’est donc pas exclu que sur un syst`me d’exploitation donn´ l’ajout de la lettre b au mode soit sans e e effet. C’est notamment le cas d’UNIX, o` les fins de ligne sont indiqu´es par le caract`re ’\n’. u e e Remarque 2. Sur l’int´rˆt qu’il peut y avoir ` effectuer des lectures et des ´critures sur le mˆme fichier, ee a e e voir les remarques faites ` la section 7.4.3 ` propos des fichiers en acc`s relatif. a a e int fflush(FILE *flot) Dans le cas d’un flot de sortie, cette fonction provoque l’´criture  physique  imm´diate du tampon en e e cours de remplissage. Elle rend EOF en cas d’erreur, z´ro dans les autres cas. e D’apr`s la norme officielle du langage C, l’effet de fflush sur un flot qui n’est pas un flot de sortie est e ind´fini. Mais pour la plupart des biblioth`ques actuelles, l’appel de cette fonction sur un flot d’entr´e e e e
56 S’il existe une probabilit´ non n´gligeable pour qu’un programme ait une fin anormale (par exemple ` cause de conditions e e a d’exploitation difficiles) il est prudent de programmer des appels r´guliers de la fonction fflush, cf. section 7.1.1. e

86

c H. Garreta, 1988-2006

´ 7 ENTREES-SORTIES

7.1 Flots

supprime les caract`res disponibles dans le tampon. Par exemple, dans le cas fr´quent o` l’entr´e standard e e u e correspond au clavier, l’appel fflush(stdin) fait disparaˆ tous les caract`res d´j` tap´s mais pas encore ıtre e ea e lus par le programme. Remarque. Si le fichier physique qui correspond au flot indiqu´ est un organe interactif, par exemple e l’´cran d’un poste de travail, alors la fonction fflush est implicitement appel´e dans deux circonstances e e tr`s fr´quentes : e e e e e – l’´criture du caract`re ’\n’ qui produit l’´mission d’une marque de fin de ligne et la vidange effective du tampon, – le d´but d’une op´ration de lecture sur l’unit´ d’entr´e associ´e (les organes d’entr´e-sortie interactifs e e e e e e forment g´n´ralement des couples) ; ainsi, par exemple, une lecture au clavier provoque la vidange du e e tampon d’´criture ` l’´cran. Cela permet qu’une question soit effectivement affich´e avant que l’utilisae a e e teur ne doive taper la r´ponse correspondante. e int fclose(FILE *flot) Cette fonction ferme le flot indiqu´, produisant l’´criture physique des tampons, la restitution de l’espace e e allou´ pour le tampon et les descripteurs du flot, etc. Elle rend z´ro en cas de succ`s, une autre valeur en e e e cas d’erreur. A la suite d’un appel comme fclose(flot) l’emploi de la variable flot est ill´gitime. e Oublier de fermer, par un appel de fclose, un fichier qui a ´t´ ouvert en lecture n’est en g´n´ral pas une ee e e erreur importante. Mais oublier de fermer un fichier qui a ´t´ ouvert en ´criture (c’est-`-dire un fichier ee e a qui vient d’ˆtre cr´´) peut ˆtre fatal pour l’information qui y a ´t´ ´crite, car e ee e eee – le contenu du tampon d’´criture en cours de formation lors de la terminaison du programme ne sera e probablement pas sauvegard´ dans le fichier ; e – dans certains syst`mes, les fichiers nouvellement cr´´s ne subissent les op´rations qui les rendent connus e ee e du syst`me d’exploitation (comme l’inclusion de leur nom dans un r´pertoire) qu’au moment de leur e e fermeture. Un fichier qui n’a jamais ´t´ ferm´ a donc une existence tr`s pr´caire. ee e e e int feof(FILE *flot) Cette fonction n’a d’int´rˆt que si flot d´signe un fichier en lecture. Elle renvoie une valeur non nulle si ee e et seulement si l’indicateur de fin de fichier du flot indiqu´ est vrai. Cela se produit non pas lorsque le e fichier est positionn´ sur sa fin mais lorsqu’il est plac´ au-del` de sa fin. e e a Autrement dit, feof(fic) devient vrai imm´diatement apr`s qu’une lecture sur fic a ´chou´ parce qu’il e e e e n’y avait plus [assez] d’informations dans fic pour la satisfaire. En particulier, feof n’est jamais vrai apr`s l’ouverture (en lecture) du fichier, mˆme lorsque ce dernier e e est vide. Il faut au moins une [tentative de] lecture pour, ´ventuellement, le rendre vrai. e Cette sp´cification de la fonction feof fonde le sch´ma suivant, de lecture s´quentielle d’un fichier : e e e FILE *fichier; ... fichier = fopen(nom, "rb"); v´rification du succ`s de l’ouverture de fichier e e ... lecture de donn´es sur fichier e while ( ! feof(fichier)) { traitement des donn´es lues e lecture de donn´es sur fichier e } ... int ferror(FILE *flot) Cette fonction renvoie une valeur non nulle si et seulement si l’indicateur d’erreur du flot indiqu´ est e  vrai . Elle doit ˆtre appel´e imm´diatement apr`s une entr´e-sortie sur ce flot pour savoir si l’op´ration e e e e e e en question a ´chou´. La variable globale enti`re errno (d´clar´e dans <errno.h>) contient alors un code e e e e e renseignant sur la nature de l’erreur. FILE *tmpfile(void) Cette fonction cr´e un fichier temporaire en mode "w+b", sans nom externe, qui sera automatiquement e d´truit ` la terminaison du programme. Elle renvoie le flot associ´ ou NULL en cas d’erreur. e a e int setvbuf(FILE *flot, char *tampon, int mode, size t taille)
c H. Garreta, 1988-2006

87

7.2 Lecture et ´criture textuelles e

7

´ ENTREES-SORTIES

Cette fonction red´finit le tampon associ´ ` un flot ouvert. Elle doit ˆtre appel´e apr`s l’ouverture du e ea e e e flot mais avant toute lecture ou ´criture. L’argument mode doit ˆtre une des trois constantes suivantes, e e d´finies dans <stdio.h> : e IOFBF Tampon de taille fixe. L’´criture ou la lecture physique a lieu lorsque le tampon contient taille e caract`res. e IOLBF Tampon ´gal ` une ligne. L’´criture ou la lecture physique a lieu lors de la rencontre du caract`re e a e e ’\n’ qui d´termine la fin des lignes. e IONBF Pas de tampon. Une ´criture ou une lecture physique a lieu ` chaque lecture ou ´criture logique. e a e L’argument taille indique la taille voulue pour le tampon. L’argument tampon, s’il n’est pas NULL, est cens´ pointer un espace (de taille au moins ´gale ` taille) qui sera utilis´ comme tampon. Si tampon est e e a e NULL, alors la fonction alloue un espace propre.

7.1.2

Les unit´s standard d’entr´e-sortie e e

Sans que le programmeur n’ait ` prendre aucune disposition particuli`re, l’ex´cution d’un programme coma e e mence avec trois flots de texte automatiquement ouverts par le syst`me. Ils sont connect´s (on dit affect´s) aux e e e organes d’entr´e-sortie les plus  naturels  par rapport ` la mani`re dont on utilise l’ordinateur. Ces fichiers e a e sont d´clar´s dans <stdio.h>, de la mani`re suivante : e e e FILE *stdin, *stdout, *stderr; stdin est l’unit´ standard d’entr´e. Elle est habituellement affect´e au clavier du poste de travail. e e e stdout est l’unit´ standard de sortie. Elle est habituellement affect´e ` l’´cran du poste de travail. e e a e e e a e stderr est l’unit´ standard d’affichage des erreurs. Elle est aussi affect´e ` l’´cran du poste de travail. Les fonctions de lecture (resp. d’´criture) qui ne sp´cifient pas un autre flot utilisent stdin (resp. stdout). e e Remarque. L’utilisation des unit´s standard apparaˆ encore plus int´ressante lorsque l’on sait que dans e ıt e UNIX et plusieurs autres syst`mes d’exploitation il est permis de r´affecter les unit´s standard lors d’une e e e ex´cution du programme, sans qu’il faille recompiler ce dernier. En UNIX et MS-DOS cela fonctionne de la e mani`re suivante : supposons que prog1 soit un programme qui n’utilise que les unit´s standard stdin et e e stdout. Activ´ par la commande prog1, il lira ses donn´es au clavier et affichera ses r´sultats ` l’´cran. Mais e e e a e s’il est lanc´ par la commande e prog1 < fichier1 (resp. : prog1 > fichier2) alors le fichier fichier1 (resp. fichier2) remplacera le clavier (resp. l’´cran). De mani`re similaire, supposons e e que prog2 soit un autre programme qui fait ses entr´es-sorties de la mˆme mani`re. Alors la commande e e e prog1 | prog2 active en parall`le ces deux programmes avec la sortie standard de prog1 connect´e ` l’entr´e standard de prog2 e e a e (les sorties de prog1 sont lues et exploit´es par prog2 au fur et ` mesure qu’elles sont produites par prog1). e a Bien entendu, tout cela se combine. Par exemple, la commande prog1 < fichier1 | prog2 > fichier2 active prog1 et prog2. Les donn´es de prog1 sont lues dans fichier1, ses r´sultats sont fournis ` titre de e e a donn´es ` prog2, dont les r´sultats sont ´crits dans fichier2. e a e e

7.2
7.2.1

Lecture et ´criture textuelles e
Lecture et ´criture de caract`res et de chaˆ e e ınes

Les fonctions de lecture-´criture les plus simples effectuent la lecture ou l’´criture d’un caract`re isol´ ou e e e e bien la lecture ou l’´criture d’une ligne. Pour la lecture nous avons : e int fgetc(FILE *flot) Renvoie le caract`re suivant sur le flot indiqu´, ou EOF si la fin du fichier est atteinte ou si une erreur e e survient. C’est une vraie fonction.

88

c H. Garreta, 1988-2006

´ 7 ENTREES-SORTIES

7.2

Lecture et ´criture textuelles e

int getc(FILE *flot) Fait la mˆme chose que fgetc mais c’est peut ˆtre macro. e e L’int´rˆt d’utiliser une macro r´side dans l’efficacit´ sup´rieure des (petites) macros par rapport aux ee e e e (petites) fonctions57 . Il ne faut pas oublier cependant qu’il y a deux cas o` les macros ne peuvent pas ˆtre u e utilis´es : e – lorsque l’argument a un effet de bord. Une expression comme *s++ = fgetc(table_de_fichiers[i++]) est correcte (mais peu utilis´e), tandis que e *s++ = getc(table_de_fichiers[i++]) est certainement erron´e, car ayant un effet ind´fini (on ne peut pas dire combien de fois i sera e e incr´ment´) ; e e – lorsqu’il faut obtenir l’adresse de l’op´ration en question, pour la passer comme argument d’une autre e fonction. Par exemple, si getc est une macro, un appel comme appliquer(getc, fichier) sera certainement trouv´ incorrect par le compilateur. e int getchar(void) getchar() ´quivaut ` getc(stdin) ; e a char *fgets(char *s, int n, FILE *flot) Lecture d’une ligne en veillant ` ne pas d´border. Plus pr´cis´ment, cette fonction lit des caract`res sur a e e e e le flot indiqu´ et les place dans l’espace point´ par s. Elle s’arrˆte lorsqu’elle a lu n−1 caract`res ou e e e e lorsqu’elle a rencontr´ un caract`re ’\n’ de fin de ligne (ce caract`re est copi´ dans le tableau). Un e e e e caract`re ’\0’ est ajout´ ` la fin du tableau. La fonction rend s, ou NULL si une erreur ou la fin du fichier e ea a ´t´ rencontr´e. ee e Lisez aussi la remarque faite ci-apr`s ` propos de la fonction gets. e a char *gets(char *s) Lecture d’une ligne sur le flot stdin. Les caract`res lus sont rang´s dans l’espace point´ par s. Elle renvoie e e e le mˆme r´sultat que fgets mais, contrairement ` cette derni`re e e a e – il n’y a pas de test de d´bordement58 ; e – le caract`re de fin de ligne est remplac´ par ’\0’. e e Atention. L’argument de gets doit ˆtre l’adresse d’un espace disponible (accessible en ´criture) et de e e taille suffisante, dans lequel gets puisse ranger les caract`res qui seront lus. e Exemples. Pour illustrer ces fonctions, voici deux exercices d’´cole. D’une part, l’´criture d’une fonction e e analogue ` gets en utilisant getchar : a char *myGets(char *s) { int c, i = 0; c = getchar(); while (c != ’\n’) { if (c == EOF) return NULL; s[i++] = c; c = getchar(); } s[i] = ’\0’; return s; } D’autre part, l’´criture d’une fonction analogue ` getchar (version fonction) en utilisant gets : e a
57 Il s’agit d’entr´es-sorties tamponn´es, c’est-`-dire de simples transferts entre m´moires. S’il s’´tait agi d’op´rations physiques, le e e a e e e gain de temps obtenu en utilisant getc ` la place de fgetc aurait ´t´ n´gligeable devant le temps requis par l’entr´e-sortie elle-mˆme. a e e e e e 58 Ainsi, gets lit des caract`res jusqu’` la rencontre de ’\n’, sans se pr´occuper de savoir si l’espace dans lequel ces caract`res e a e e sont rang´s est de taille suffisante pour les recevoir ; autrement dit, tout appel de gets peut entraˆ e ıner un d´bordement de m´moire. e e C’est la raison pour laquelle on dit que tout programme comportant ne serait-ce qu’un appel de gets est bogu´. e

c H. Garreta, 1988-2006

89

7.2 Lecture et ´criture textuelles e

7

´ ENTREES-SORTIES

int myGetchar(void) { static char tampon[256] = ""; static char *pos = tampon; if (*pos == 0) { if (gets(tampon) == NULL) return EOF; strcat(tampon, "\n"); pos = tampon; } return *pos++; } Voyons maintenant les fonctions d’´criture : e int fputc(int caractere, FILE *flot) ´ Ecrit le caractere indiqu´ sur le flot indiqu´. Renvoie le caract`re ´crit ou EOF si une erreur survient. e e e e C’est une vraie fonction. int putc(int caractere, FILE *flot) Fait la mˆme chose que fputc mais peut ˆtre une macro. Voir ` ce propos les remarques faites ` l’occasion e e a a de l’introduction de getc. int putchar(int caractere) putchar(c) ´quivaut ` putc(c, stdout). e a int fputs(const char *s, FILE *flot) ´ Ecrit la chaˆ s sur le flot indiqu´. La fonction renvoie EOF en cas d’erreur, une valeur ≥ 0 dans les ıne e autres cas. int puts(const char *s) Cette fonction ´crit la chaˆ s sur le flot stdout. Elle renvoie le mˆme r´sultat que fputs. Contrairement e ıne e e a ` fputs un caract`re ’\n’ est ajout´ ` la suite de la chaˆ e ea ıne. int ungetc(int c, FILE *flot)  D´lecture  du caract`re c. Cette fonction remet le caract`re c dans le flot indiqu´, o` il sera trouv´ e e e e u e lors de la prochaine lecture. Sur chaque flot, seule la place pour un caract`re  d´lu  est garantie. On ne e e peut pas  d´lire  le caract`re EOF. e e Cette op´ration incarne donc l’id´e de restitution (` l’unit´ d’entr´e, qui en est le fournisseur) d’un e e a e e caract`re lu ` tort. C’est une mani`re de r´soudre un probl`me que pose l’´criture d’analyseurs lexicaux, e a e e e e o` la fin de certaines unit´s lexicales est indiqu´e par un caract`re qui les suit sans en faire partie. Exemple : u e e e la lecture d’un nombre entier non n´gatif : e int lirentier(FILE *flot) { /* lecture d’un entier (simpliste) */ int c, x = 0; c = getc(flot); while (’0’ <= c && c <= ’9’) { x = 10 * x + c - ’0’; c = getc(flot); } /* ici, c est le caract`re suivant le nombre */ e ungetc(c, flot); return x; } 7.2.2 Ecriture avec format printf

La fonction d’´criture sur l’unit´ de sortie standard (en principe l’´cran du poste de travail) avec conversion e e e et mise en forme des donn´es est : e printf( format , expr 1 , expr 2 , ... expr n ) 90
c H. Garreta, 1988-2006

´ 7 ENTREES-SORTIES

7.2

Lecture et ´criture textuelles e

format est une chaˆ qui joue un rˆle particulier. Elle est form´e de caract`res qui seront ´crits normalement, ıne o e e e m´lang´s ` des indications sur les types des expressions expr 1 , expr 2 , ... expr n et sur l’aspect sous lequel il faut e e a ´crire les valeurs de ces expressions. e Cela fonctionne de la mani`re suivante : la fonction printf parcourt la chaˆ format et reconnaˆ certains e ıne ıt groupes de caract`res comme ´tant des sp´cifications de format. C’est le caract`re % qui d´clenche cette ree e e e e connaissance. La fonction printf recopie sur le flot de sortie tout caract`re qui ne fait pas partie d’une telle e sp´cification. La ieme sp´cification d´termine la mani`re dont la valeur de expr i sera ´crite. e e e e e Les sp´cifications de format reconnues par la fonction printf sont expliqu´es dans la table 4 (page 92). e e Notez que seuls les ´l´ments 1 (le caract`re %) et 6 (la lettre qui indique le type de la conversion) sont ee e obligatoires dans une sp´cification de format. e Exemple 1. Supposons qu’on ait donn´ la d´claration-initialisation e e float x = 123.456; Voici une liste d’appels de printf, avec l’affichage produit par chacun : Appel printf(">%f<", x); printf(">%12f<", x); printf(">%12.2f<", x); printf(">%.2f<", x); printf(">%-12.2f<", x); printf(">%+-12.2f<", x); printf(">% -12.2f<", x); printf(">%12.2f<", x); printf(">%012.2f<", x); printf(">%.0f<", x); printf(">%#.0f<", x); Affichage obtenu >123.456001< > 123.456001< > 123.46< >123.46< >123.46 < >+123.46 < > 123.46 < > 123.46< >000000123.46< >123< >123.<

Exemple 2. La liste suivante illustre l’utilisation de la largeur et de la pr´cision pour les chaˆ e ınes. Supposons avoir donn´ les d´clarations : e e char *s = "ABCDEFG"; int l = -10, n = 5; Voici une liste d’appels de printf, avec l’affichage produit par chacun : Appel printf("printf(">%5s<", s); printf("printf(">%10s<", s); printf("printf(">%-10s<", s); printf("printf(">%10.5s<", s); printf("printf(">%-10.5s<", s); printf("printf(">%.5s<", s); printf("printf(">%*.*s<", l, n, s); Affichage obtenu >ABCDEFG< > ABCDEFG< >ABCDEFG < > ABCDE< >ABCDE < >ABCDE< >ABCDE <

La largeur du champ (cf. tableau 4, n 3) peut ˆtre indiqu´e par le caract`re * ` la place d’un nombre. Elle ˚ e e e a est alors d´finie par la valeur de l’argument dont c’est le tour, qui doit ˆtre de type entier. Il en est de mˆme e e e pour la sp´cification de la pr´cision (cf. tableau 4, n 4). Par exemple, i et j ´tant des variables enti`res et x e e ˚ e e une variable flottante, l’expression printf("%*.*f", i, j, x); ´crit la valeur de x sur un nombre de caract`res ´gal ` la valeur de i, avec un nombre de chiffres apr`s la virgule e e e a e ´gal ` la valeur de j. e a

c H. Garreta, 1988-2006

91

7.2 Lecture et ´criture textuelles e

7

´ ENTREES-SORTIES

Chaque sp´cification de format se compose, dans l’ordre indiqu´, des ´l´ments suivants : e e ee 1. Obligatoirement, le caract`re %. e 2. Facultativement, un ou plusieurs modifieurs, dans un ordre quelconque, parmi : - : cadrer ` gauche du champ (par d´faut le cadrage se fait ` droite) ; a e a + : imprimer le signe du nombre mˆme lorsque celui-ci est positif ; e espace : si le premier caract`re n’est pas un signe, placer un espace au d´but d’un nombre ; e e 0 : compl´ter les nombres par des z´ros (` la place de blancs) ; e e a # : utiliser le format alternatif, lorsqu’il existe (voir ci-dessous). 3. Facultativement, un nombre qui indique la largeur du champ. Il s’agit d’une largeur minimum, automatiquement augment´e si elle se r´v`le insuffisante. e e e 4. Facultativement, un point suivi d’un nombre qui indique la pr´cision : e – dans les conversions e, E ou f : le nombre de chiffres ` ´crire apr`s la virgule d´cimale ; ae e e – dans les conversions g ou G : le nombre de chiffres significatifs ; – pour une chaˆ : le nombre maximum de caract`res ` afficher ; ıne e a – pour un entier (conversions d et u) : le nombre minimum de chiffres. Le cas ´ch´ant, des z´ros seront e e e ajout´s ` gauche. e a 5. Facultativement, une lettre qui compl`te l’information sur la nature de l’argument et, le cas ´ch´ant, modifie e e e en cons´quence la largeur du champ : e h (associ´e ` d ou u) : l’argument est un short. Cette indication est sans effet si un int et un short sont e a la mˆme chose ; e l (associ´e ` d, u, x ou X) : l’argument est un long ou un unsigned long. Cette indication est sans effet e a si un int et un long sont la mˆme chose ; e L (associ´e ` f, e, E, g ou G) : l’argument est un long double. e a 6. Obligatoirement, un caract`re de conversion, parmi e d : argument : int ; impression : notation d´cimale sign´e. e e o : argument : int ; impression : notation octale non sign´e. e Format alternatif (voir # au point 2) : un 0 est imprim´ au d´but du nombre. e e x : argument : int ; impression : notation hexad´cimale non sign´e avec les chiffres 0...9abcdef. e e Format alternatif : le nombre est pr´c´d´ de 0x. e e e X : comme x mais avec ABCDEF et 0X ` la place de abcdef et 0x. a u : argument : int ; impression : notation d´cimale non sign´e. e e c : argument : unsigned char ; impression : un seul caract`re. e s : argument : char * ; impression : chaˆ de caract`res. ıne e f : argument : double ; impression : notation en  virgule fixe  [-]zzz.fff. Le nombre de f est donn´ par e la pr´cision. Pr´cision par d´faut : 6. Si la pr´cision vaut z´ro, le point est supprim´. e e e e e e Format alternatif : le point est toujours imprim´. e e : argument : double. Impression : notation en  virgule flottante  [-]z.ffffff e±nn. Le nombre de f est donn´ par la pr´cision. Pr´cision par d´faut : 6. Si la pr´cision vaut z´ro, le point est supprim´. e e e e e e e Format alternatif : le point est toujours imprim´. e E : comme %e avec E ` la place de e. a g : argument : double ; impression : comme %e si l’exposant est inf´rieur ` -4 ou sup´rieur ` la pr´cision, e a e a e comme %f sinon. Format alternatif : le point est toujours imprim´. e G : comme %g avec E ` la place de e. a p : argument : void * ; impression : d´pend de l’implantation (par exemple %X). e n : argument : int *. Aucune impression. Effet : l’argument correspondant doit ˆtre l’adresse d’une e variable enti`re, qui recevra pour valeur le nombre de caract`res effectivement ´crits jusqu’` pr´sent e e e a e par l’appel en cours de la fonction printf. % : pas d’argument correspondant ; impression : le caract`re %. e Tab. 4 – Sp´cifications de format pour printf, fprintf et sprintf e

92

c H. Garreta, 1988-2006

´ 7 ENTREES-SORTIES

7.2

Lecture et ´criture textuelles e

7.2.3

Lecture avec format scanf

La fonction de lecture avec format ` l’unit´ d’entr´e standard (en principe le clavier du poste de travail) est a e e scanf( format , adresse 1 , adresse 2 , ... adresse n ) L’argument format est une chaˆ qui indique la mani`re de convertir les caract`res qui seront lus ; adresse 1 , ıne e e adresse 2 , ... adresse n indiquent les variables devant recevoir les donn´es lues. Ce sont des  sorties  de la e fonction scanf, par cons´quent il est essentiel que ces arguments soient des adresses de variables ` lire. e a La fonction scanf constituant un vrai analyseur lexical, les donn´es lues ont de nombreuses occasions d’ˆtre e e incorrectes et on peut s’attendre ` ce que scanf soit d’un maniement difficile. L’exp´rience ne d´coit pas cette a e e¸ attente ! Voici un bon conseil : si un programme ne fonctionne pas comme il le devrait, commencez par v´rifier e les valeurs lues par la fonction scanf (par exemple avec des appels de printf suivant imm´diatement les appels e de scanf). Les sp´cifications de format reconnues par la fonction scanf sont expliqu´es dans la table 5 (page 94). e e Fonctionnement : scanf parcourt le format. Elle rend la main lorsque la fin du format est atteinte ou sur une erreur. Jusque-l` : a – Tout caract`re ordinaire du format, c’est-`-dire qui n’est ni un caract`re d’espacement (blanc, tabulation) e a e ni un caract`re faisant partie d’une sp´cification de format (commen¸ant par %), doit s’identifier au cae e c ract`re courant du flot d’entr´e. Si cette identification a lieu, le caract`re courant est lu, sans ˆtre rang´ e e e e e dans aucune variable, et le parcours du format se poursuit. Si l’identification n’a pas lieu, l’activation de scanf se termine. – Les sp´cifications de format commencent par %. Elles indiquent la mani`re d’analyser les caract`res lus e e e sur le flot d’entr´e et de ranger les valeurs ainsi obtenues. Voir le tableau 5. e – Dans le format, les caract`res ordinaires et les sp´cifications peuvent ˆtre s´par´s entre eux par des e e e e e caract`res d’espacement. Le nombre de ces espacements est sans importance, mais leur pr´sence indique e e que les donn´es correspondantes peuvent ˆtre s´par´es dans le flot d’entr´e par un nombre quelconque de e e e e e caract`res d’espacement ou de fin de ligne. e – S’il n’y a pas d’espacement, dans le format, entre les caract`res ordinaires ou les sp´cifications, alors les e e donn´es correspondantes dans le flot d’entr´e doivent ˆtre adjacentes. e e e – Cependant, les espacements au d´but des nombres sont toujours saut´s. e e On peut m´langer des appels de scanf et d’autres fonctions de lecture. Chaque appel d’une telle fonction e commence par lire le premier caract`re que l’appel pr´c´dent n’a pas  consomm´ . e e e e Exemple 1. Lecture d’un entier : scanf("%d", &x); Exemple 2. Lecture de deux entiers s´par´s par une virgule et encadr´s par une paire de parenth`ses : e e e e scanf("(%d,%d)", &x, &y); Donn´es correctes : e (22,33) ( 22 , ou 33 ) ( 22, 33) (des blancs, mais uniquement devant les nombres). Donn´es incorrectes : e (trop de blancs). Exemple 3. Comme ci-dessus mais avec une syntaxe plus souple (les blancs sont tol´r´s partout) : ee scanf(" ( 22 ; (%d 33 ,%d ) )", &x, &y); Toutes les donn´es de l’exemple pr´c´dent sont correctes. Exemple de donn´e incorrecte : e e e e Exemple 4. Lecture d’un caract`re59 : e char calu; ... scanf("%c", &calu); Remarque. Nous avons indiqu´ par ailleurs qu’en C on range souvent les caract`res dans des variables de e e type int afin de permettre la m´morisation d’une valeur  intruse , EOF. Cependant, notez bien qu’ici nous e sommes oblig´s de d´clarer la variable calu de type char ; le programme e e
59 Rappelons

que fgetc, getc et getchar font ce travail bien plus simplement.

c H. Garreta, 1988-2006

93

7.2 Lecture et ´criture textuelles e

7

´ ENTREES-SORTIES

Chaque sp´cification de format se compose, dans l’ordre indiqu´, des ´l´ments suivants : e e ee 1. Obligatoirement, le caract`re %. e 2. Facultativement, le caract`re * qui indique une suppression d’affectation : lire une donn´e comme indiqu´ et e e e l’ oublier  (c’est-`-dire ne pas le ranger dans une variable). a 3. Facultativement, un nombre donnant la largeur maximum du champ (utile, par exemple, pour la lecture de nombres coll´s les uns aux autres). e 4. Facultativement, une lettre qui apporte des informations compl´mentaires sur la nature de l’argument core respondant : h devant d, i, o, u, x : l’argument est l’adresse d’un short (et non pas l’adresse d’un int) ; l devant d, i, o, u, x : l’argument est l’adresse d’un long (et non pas l’adresse d’un int). Devant e, f, g : l’argument est l’adresse d’un double (et non pas d’un float) ; L devant e, f, g : l’argument est l’adresse d’un long double (et non pas d’un float). 5. Obligatoirement, un caract`re de conversion parmi e d – Argument : int *. Donn´e : nombre entier en notation d´cimale. e e i – Argument : int *. Donn´e : entier en notation d´cimale, octale (pr´c´d´ de 0) ou hexad´cimale e e e e e e (pr´c´d´ de 0x ou 0X). e e e o – Argument : int *. Donn´e : entier en octal (pr´c´d´ ou non de 0). e e e e u – Argument : unsigned int *. Donn´e : entier en notation d´cimale. e e x – Argument : int *. Donn´e : entier en notation hexad´cimale (pr´c´d´ ou non de 0x ou 0X). e e e e e c – Argument : char *. Donn´e : autant de caract`res que la largeur du champ l’indique (par d´faut : e e e 1). Ces caract`res sont copi´s dans l’espace dont l’adresse est donn´e en argument. Les blancs et e e e tabulations ne sont pas pris pour des s´parateurs (ils sont copi´s comme les autres caract`res) et il e e e n’y a pas de ’\0’ automatiquement ajout´ ` la fin de la chaˆ ea ıne. s – Argument : char *. Donn´e : chaˆ de caract`res termin´e par un caract`re d’espacement (blanc, e ıne e e e tabulation, fin de ligne) qui n’en fait pas partie. Un ’\0’ sera automatiquement ajout´ apr`s les e e caract`res lus. e e – Argument : float *. Donn´e : nombre flottant, c’est-`-dire dans l’ordre : signe facultatif, suite de e a chiffres, point d´cimal et suite de chiffres facultatifs, exposant (e ou E, signe facultatif et suite de e chiffres) facultatif. f – Comme e. g – Comme e. p – Argument : void ** (ou void *, pour ce que ¸a change...). Donn´e : nombre exprimant un pointeur c e comme il serait imprim´ par printf avec le format %p. e n – Argument : int *. Aucune lecture. Effet : l’argument correspondant doit ˆtre l’adresse d’une variable e enti`re ; celle-ci re¸oit pour valeur le nombre de caract`res effectivement lus jusqu’` ce point par le e c e a pr´sent appel de la fonction scanf. e [caract`re...caract`re] – Argument : char *. Donn´e : la plus longue suite faite de caract`res appartenant e e e e ` l’ensemblea indiqu´ entre crochets. Un caract`re au moins sera lu. Un ’\0’ est ajout´ ` la fin de a e e ea la chaˆ lue. ıne [^caract`re...caract`re] – Argument : char *. Donn´e : comme ci-dessus mais les caract`res permis sont e e e e maintenant ceux qui n’appartiennent pas ` l’ensemble indiqu´. a e % Pas d’argument. Le caract`re % doit se pr´senter sur le flot d’entr´e. e e e
a Pour

sp´cifier le caract`re ] l’´crire imm´diatement apr`s le [ initial. e e e e e

Tab. 5 – Sp´cifications de format pour scanf, fscanf et sscanf e int calu; ... scanf("%c", &calu); aurait ´t´ incorrect (bien qu’il puisse fonctionner correctement sur certains syst`mes), car on y fournit ` scanf ee e a l’adresse d’un entier (fait de plusieurs octets) pour y ranger un caract`re, alors que scanf, d’apr`s l’analyse du e e format,  croit  recevoir l’adresse d’un char (un octet). Or on ne doit pas faire d’hypoth`se sur la mani`re dont e e sont organis´s les octets qui composent un entier, le langage C ne pr´cisant rien ` ce sujet. Une autre solution e e a 94
c H. Garreta, 1988-2006

´ 7 ENTREES-SORTIES

7.2

Lecture et ´criture textuelles e

correcte aurait ´t´ la suivante : ee int calu; char tmp; ... scanf("%c", &tmp); calu = tmp; Exemple 5. Lecture d’un nombre entier et du caract`re le suivant imm´diatement, quel qu’il soit : e e int nblu; char calu; ... scanf("%d%c", &nblu, &calu); Exemple 6. Lecture d’un nombre entier et du premier caract`re non blanc le suivant : e int nblu; char calu; ... scanf("%d %c", &nblu, &calu); 7.2.4 A propos de la fonction scanf et des lectures interactives

A propos de  sauter les blancs . Nous avons dit que les sp´cifications qui constituent le format e peuvent ˆtre s´par´es entre elles par un ou plusieurs blancs, ce qui indique que les donn´es ` lire correspondantes e e e e a peuvent alors ˆtre s´par´es par un nombre quelconque de blancs. e e e Pour la fonction scanf, les blancs dans le format se traduisent donc par l’ordre  ` pr´sent, sautez tous a e les caract`res blancs qui se pr´sentent . Or la seule mani`re pour l’ordinateur de s’assurer qu’il a bien saut´ e e e e tous les caract`res blancs consiste ` lire (sans le consommer) le premier caract`re non blanc qui les suit. Si la e a e lecture se fait dans un fichier, cela ne pose pas de probl`me, les caract`res ` lire existant tous d`s le d´part. e e a e e Mais cela peut cr´er des situations confuses dans le cas d’une lecture interactive mettant en œuvre le clavier et e un op´rateur vivant. Exemple : e int x, y = 33; ... printf("donne x : "); scanf(" %d ", &x); /* a¨e... */ ı printf("donne y : "); scanf("%d", &y); printf("x = %d, y = %d\n", x, y); Parce qu’on a ´crit, peut-ˆtre sans faire attention, des blancs apr`s le format %d, le premier appel de scanf e e e ci-dessus signifie  lisez un entier et tous les blancs qui le suivent . L’op´rateur constatera avec ´tonnement que e e pour que son premier nombre sont pris en compte il est oblig´ de composer le deuxi`me ! Exemple de dialogue e e (le signe ¶ repr´sentant la frappe de la touche  Entr´e ) : e e donne x : 11¶ ¶ ¶ la machine ne r´agit pas... ! ? e 22¶ donne y : x = 11, y = 22 Notez que faire suivre le premier nombre d’un caract`re non blanc conventionnel n’est pas une bonne solution e car, ce caract`re n’´tant pas consomm´, il fait ´chouer la lecture du second nombre : e e e e donne x : 11¶ donne y : x = 11, y = 33 Le¸on ` retenir : dans le format de scanf, les blancs ne sont pas de la d´coration, ils jouent un rˆle bien c a e o pr´cis. e ` A propos de la lecture d’un caractere. Une autre situation g´n´ratrice de confusion est celle o` des e e u lectures de nombres sont suivies par des lectures de caract`res ou de chaˆ e ınes. Par exemple, le programme na¨ ıf suivant lit des nombres les uns ` la suite des autres et affiche le carr´ de chacun : a e
c H. Garreta, 1988-2006

95

7.2 Lecture et ´criture textuelles e

7

´ ENTREES-SORTIES

int x, c; ... do { printf("donne un nombre : "); scanf("%d", &x); ← lecture d’un nombre printf("%d ^ 2 = %d\n", x, x * x); printf("un autre calcul (O/N) ? "); c = getchar(); ← lecture d’un caract`re e } while (c == ’O’); printf("au revoir...");\end{verbatim} Voici un dialogue (la r´plique de l’op´rateur est soulign´e, le signe ¶ repr´sente la frappe de la touche  Entr´e ) : e e e e e donne un nombre : 14¶ 14 ^ 2 = 196 un autre calcul (O/N) ? au revoir... La machine n’a pas attendu la r´ponse (O ou N) de l’op´rateur... ! Que s’est-il pass´ ? L’op´rateur a compos´ e e e e e un nombre suivi imm´diatement d’un caract`re fin-de-ligne (traduction de la frappe de la touche  Entr´e ). e e e Cette fin de ligne est in´vitable mais n’a pas ´t´ consomm´e par scanf et est rest´e disponible pour des lectures e ee e e ult´rieures. L’appel de getchar (qui, dans l’esprit du programmeur, aurait dˆ provoquer une nouvelle lecture e u physique) trouve cette fin-de-ligne et l’affecte ` c comme r´ponse, ce qui fait quitter la boucle. Ainsi, pour a e que ce programme se comporte comme son programmeur attend il faudrait qu’` la suite de l’invite  donne un a nombre : , l’utilisateur saisisse un nombre imm´diatement suivi d’un caract`re O ou N qui est la r´ponse ` une e e e a question qui ne lui a pas encore ´t´ pos´e ! ee e Cela n’est pas raisonnable, bien sˆr. La bonne mani`re de faire consiste ` vider le tampon d’entr´e avant u e a e de proc´der ` une lecture de caract`re. Dans beaucoup d’environnements on peut faire cela avec la fonction e a e fflush : int x, c; char s[BUFSIZ]; ... do { printf("donne un nombre : "); scanf("%d", &x); printf("%d ^ 2 = %d\n", x, x * x); printf("un autre calcul (O/N) ? "); ici, le tampon de stdin contient (au moins) un ’\n’ fflush(stdin); maintenant le tampon est vide c = getchar(); } while (c == ’O’); printf("au revoir..."); ... Si la fonction fflush est inop´rante sur le flot stdin (un tel comportement est permis par la norme du e langage C) alors on peut r´soudre le mˆme probl`me en faisant des appels r´p´t´s de la fonction getchar, de e e e e ee mani`re ` consommer tous les caract`res restant dans le tampon jusqu’` la fin-de-ligne, ce caract`re devant ˆtre e a e a e e consomm´ lui aussi. L’exemple ci-dessus devient e ... scanf("%d", &x); printf("%d ^ 2 = %d\n", x, x * x); printf("un autre calcul (O/N) ? "); ici, le tampon de stdin contient (au moins) un ’\n’ while (getchar() != ’\n’) ; maintenant le tampon est vide c = getchar(); ...

96

c H. Garreta, 1988-2006

´ 7 ENTREES-SORTIES

7.3

Op´rations en mode binaire e

7.2.5

Les variantes de printf et scanf

Voici la famille au complet, comme elle est d´clar´e (en syntaxe ANSI) dans le fichier <stdio.h> : e e int printf(const char *format, ... ) Nous avons d´crit cette fonction. Ajoutons seulement qu’elle renvoie le nombre de caract`res effectivement e e ´crits (on utilise rarement cette information) ou un nombre n´gatif en cas d’erreur. e e int fprintf(FILE *flot, const char *format, ... ) Comme printf mais sur le flot indiqu´ (` la place de stdout). Ainsi e a printf( format , exp 1 , ... , exp k ) ´quivaut ` e a fprintf(stdout, format , exp 1 , ... , exp k ) int sprintf(char *destination, const char *format, ... ) Cette fonction effectue les mˆmes mises en forme que ses deux sœurs, avec la diff´rence que les caract`res e e e produits ne sont pas ajout´s ` un flot, mais sont concat´n´s ensemble dans la chaˆ destination. Elle e a e e ıne permet donc de dissocier les deux fonctionnalit´s de printf, transcodage et ´criture des donn´es, afin e e e d’utiliser la premi`re sans la deuxi`me. e e int scanf(const char *format, ... ) Nous avons d´crit cette fonction. Ajoutons qu’elle renvoie EOF si une fin de fichier ou une erreur a empˆch´ e e e toute lecture ; autrement elle rend le nombre de variables lues avec succ`s. Cette indication fournit une e mani`re bien pratique pour d´tecter, dans les programmes simples, la fin d’une s´rie de donn´es. Exemple : e e e e for(;;) { printf("donne un nombre : "); if (scanf("%d", &x) < 1) break; exploitation du nombre lu } printf("au revoir..."); La boucle pr´c´dente sera arrˆt´e par n’importe quel caract`re non blanc ne pouvant pas faire partie d’un e e ee e nombre. int fscanf(FILE *flot, const char *format, ... ) Comme scanf mais sur le flot indiqu´ (` la place de stdin). Ainsi e a scanf( format , exp 1 , ... , exp k ) ´quivaut ` e a fscanf(stdin, format , exp 1 , ... , exp k ) int sscanf(const char *source, const char *format, ... ) Cette fonction effectue la mˆme analyse lexicale que ses sœurs, avec la particularit´ que le texte analys´ e e e n’est pas pris dans un flot, mais dans la chaˆ source. ıne

7.3
7.3.1

Op´rations en mode binaire e
Lecture-´criture e

size t fread(void *destination, size t taille, size t nombre, FILE *flot) Cette fonction essaye de lire sur le flot indiqu´ nombre objets, chacun ayant la taille indiqu´e, et les e e copie les uns ` la suite des autres dans l’espace point´ par destination. Elle renvoie le nombre d’objets a e effectivement lus, qui peut ˆtre inf´rieur au nombre demand´, ` cause de la rencontre de la fin du fichier60 , e e e a d’une erreur, etc. size t fwrite(const void *source, size t taille, size t nombre, FILE *flot) Cette fonction ´crit les nombre objets, chacun ayant la taille indiqu´e, qui se trouvent les uns ` la suite e e a des autres ` l’adresse indiqu´e par source. Elle renvoie le nombre d’objets ´crits, qui peut ˆtre inf´rieur a e e e e au nombre demand´ (en cas d’erreur). e
60 Lorsqu’un fichier est lu par des appels de la fonction fread, comparer avec z´ro le nombre d’objets effectivement lus est la e mani`re la plus pratique de d´tecter la fin du fichier. e e

c H. Garreta, 1988-2006

97

7.3 Op´rations en mode binaire e

7

´ ENTREES-SORTIES

7.3.2

Positionnement dans les fichiers

int fseek(FILE *flot, long deplacement, int origine) Cette fonction positionne le pointeur du fichier associ´ au flot indiqu´. La premi`re lecture ou ´criture e e e e ult´rieure se fera ` partir de la nouvelle position. Celle-ci est obtenue en ajoutant la valeur de d´placement e a e a ` une valeur de base qui peut ˆtre la position courante, la fin ou le d´but du fichier. C’est l’argument e e origine qui indique de quelle base il s’agit ; la valeur de cet argument doit ˆtre une des constantes (d´finies e e dans <stdio.h>) : SEEK SET : base = le d´but du fichier e SEEK CUR : base = la position courante SEEK END : base = la fin du fichier La fonction renvoie z´ro en cas de succ`s, une valeur non nulle en cas d’erreur. Sur un fichier de texte, il e e vaut mieux utiliser getpos et setpos. Un appel de cette fonction sur un fichier en ´criture produit la vidange du tampon (fseek implique e fflush). Lire ci-apr`s les explications sur l’acc`s relatif aux fichiers. e e void rewind(FILE *flot) Positionnement au d´but du fichier du pointeur de fichier associ´ au flot indiqu´. Un appel de cette fonction e e e ´quivaut ` fseek(flot, 0L, SEEK SET) suivi de la mise ` z´ro de tous les indicateurs d’erreur. e a a e void fgetpos(FILE *flot, fpos t *ptr) Place dans ptr la position courante dans le flot indiqu´ en vue de son utilisation par setpos. Le type e fpos t (d´fini dans <stdio.h>) a une taille suffisante pour contenir une telle information. e void fsetpos(FILE *flot, const fpos t *ptr) La valeur de ptr provenant d’un appel de getpos, cette fonction positionne le flot indiqu´ ` l’emplacement ea correspondant. ` ´ ´ L’acces relatif aux elements des fichiers. La principale application des fonctions de positionnement est la r´alisation de ce qu’on appelle l’acc`s relatif 61 ou parfois acc`s direct aux composantes d’un fichier : e e e l’acc`s ` une composante (on dit un enregistrement) que ce soit pour le lire ou pour l’´crire, ` partir de la e a e a donn´e de son rang dans le fichier sans ˆtre oblig´ d’acc´der au pr´alable aux enregistrements qui le pr´c`dent. e e e e e e e Pour donner une signification utilisable ` la notion de  neme article , il faut que le fichier puisse ˆtre vu a e comme une suite d’articles de mˆme taille (mais la biblioth`que C ignorera ce fait ; le fichier restera une suite e e d’octets). Cela s’obtient g´n´ralement en d´clarant une structure qui repr´sente un article, selon le mod`le : e e e e e typedef struct { ... champs dont se composent tous les articles ... } ARTICLE;... Un fichier destin´ ` ˆtre utilis´ en acc`s relatif sera d´clar´ normalement, et ouvert de fa¸on ` autoriser les eae e e e e c a lectures et les ´critures : e FILE *fichier; ... fichier = fopen(nom , "rb+"); Si les articles sont num´rot´s ` partir de z´ro, l’op´ration  lecture de l’enregistrement de rang n  se e e a e e programme alors selon le sch´ma suivant : e ARTICLE article; ... fseek(fichier, n * sizeof(ARTICLE), SEEK_SET); fread( & article, sizeof(ARTICLE), 1, fichier); ... exploitation des valeurs des champs de article ... L’op´ration  ´criture de la composante de rang n  ob´it au sch´ma e e e e
61 L’acc`s relatif s’oppose ` l’acc`s s´quentiel, dans lequel une composante ne peut ˆtre lue ou ´crite autrement qu’` la suite de e a e e e e a la lecture ou de l’´criture de la composante qui la pr´c`de. e e e

98

c H. Garreta, 1988-2006

´ 7 ENTREES-SORTIES

7.4

Exemples

ARTICLE article; ... affectation des champs de article ... fseek(fichier, n * sizeof(ARTICLE), SEEK_SET); fwrite( & article, sizeof(ARTICLE), 1, fichier); ... Attention. La possibilit´ d’effectuer des lectures et des ´critures sur le mˆme fichier pose des probl`mes e e e e dans la gestion des tampons associ´s au fichier que les fonctions de la biblioth`que standard ne r´solvent pas. e e e Ainsi chaque fois qu’une s´rie de lectures sur un fichier va ˆtre suivie d’une s´rie d’´critures sur le mˆme fichier, e e e e e ou r´ciproquement, il appartient au programmeur de pr´voir l’´criture effective du tampon, soit par un appel e e e explicite de la fonction fflush, soit par un appel d’une fonction de positionnement comme fseek. Notez que cette contrainte est satisfaite si on pratique des acc`s relatifs selon les sch´mas indiqu´s ci-dessus, puisqu’il y a e e e toujours un appel de fseek entre deux acc`s au fichier, quel que soit leur mode. e

7.4

Exemples

Les programmes suivants sont assez na¨ ; ils se proposent d’illustrer les fonctions de traitement de fichiers, ıfs aussi bien pour les fichiers de texte que pour les fichiers binaires. 7.4.1 Fichiers “en vrac”

Le programme suivant fait une copie identique d’un fichier (ce programme n’est pas bien utile, g´n´ralement e e une fonction du syst`me d’exploitation fait ce travail) : e #include <stdio.h> #define PAS_D_ERREUR #define ERREUR_OUVERTURE #define ERREUR_CREATION FILE *srce, *dest; main() { char tampon[512]; int nombre; printf("source : "); gets(tampon); srce = fopen(tampon, "rb"); if (srce == NULL) return ERREUR_OUVERTURE; printf("destination : "); gets(tampon); dest = fopen(tampon, "wb"); if (dest == NULL) return ERREUR_CREATION; while ((nombre = fread(tampon, 1, 512, srce)) > 0) fwrite(tampon, 1, nombre, dest); fclose(dest); fclose(srce); return PAS_D_ERREUR; } L’essentiel de ce programme est sa boucle while. Elle se compose d’un appel de fread demandant la lecture de 512 octets, suivi d’un appel de fwrite pour ´crire les nombre octets effectivement lus. Supposons que le e
c H. Garreta, 1988-2006

0 1 2

/* codes conventionnels */ /* ` l’usage du syst`me */ a e /* d’exploitation */

99

7.4 Exemples

7

´ ENTREES-SORTIES

N fichier ` copier comporte N octets ; ces deux op´rations seront ex´cut´es 512 fois avec nombre ´gal ` 512 puis a e e e e a (sauf si N est multiple de 512) une derni`re fois avec nombre ´gal au reste de la division de N par 512. e e

7.4.2

Fichiers binaires et fichiers de texte

L’objet du programme suivant est la constitution d’un fichier d’articles ` partir d’un fichier de texte qui se a pr´sente comme une r´p´tition du groupe suivant : e e e – un nom et un pr´nom sur la mˆme ligne ; e e – une adresse sur la ligne suivante ; – un entier seul sur une ligne, exprimant un certain  nombre de passages  (` un p´age autoroutier). a e Exemple TOMBAL Pierre Rue de la Gaiete de Vivre 10 MENSOIF Gerard Allee ’Les verts’ 20 etc. Le programme est ind´pendant de la nature du fichier de texte, qui peut ˆtre aussi bien le clavier d’un e e terminal qu’un fichier existant par ailleurs. /* constitution d’un fichier d’articles */ /* ` partir d’un fichier de texte */ a #include <stdio.h> #include <stdlib.h> #include <string.h> #define #define #define #define #define PAS_D_ERREUR ERREUR_OUVERTURE ERREUR_CREATION ERREUR_ECRITURE ERREUR_FERMETURE 0 1 2 3 4 /* un article du fichier */

struct { char nom[32], prenom[32]; char adresse[80]; int nombre_de_passages; } art; FILE *srce; FILE *dest; main() { char nom[256];

/* fichier de texte */ /* fichier binaire */

printf("source : "); gets(nom); if ((srce = fopen(nom, "r")) == NULL) exit(ERREUR_OUVERTURE); printf("destination : "); gets(nom); if ((dest = fopen(nom, "wb")) == NULL) exit(ERREUR_CREATION); 100
c H. Garreta, 1988-2006

´ 7 ENTREES-SORTIES

7.4

Exemples

for (;;) { if (fscanf(srce, " %s %s ", art.nom, art.prenom) != 2) break; fgets(art.adresse, 80, srce); /* enlevons le ’\n’ : */ art.adresse[strlen(art.adresse) - 1] = ’\0’; fscanf(srce, " %d ", &art.nombre_de_passages); if (fwrite(&art, sizeof art, 1, dest) != 1) exit(ERREUR_ECRITURE); } if (fclose(dest) != 0) exit(ERREUR_ECRITURE); exit(PAS_D_ERREUR); } Notez les diverses fonctions qui ont ´t´ utilis´es pour lire du texte. Le nombre de passages est lu par scanf, ee e car cette fonction est la seule qui convertit les nombres. Le nom et le pr´nom sont lus par scanf aussi, car cela e nous arrange bien que les blancs soient pris pour des s´parateurs et enlev´s. Mais l’adresse est lue par gets, car e e elle peut contenir des blancs qui ne doivent pas ˆtre supprim´s. e e

7.4.3

Fichiers en acc`s relatif e

Dans le programme pr´c´dent nous avons vu un fichier binaire organis´ en articles et trait´ s´quentiellement e e e e e (chaque article ´tant ´crit ` la suite du pr´c´dent). Voyons un exemple o` ce mˆme fichier est trait´ en acc`s e e a e e u e e e relatif. Imaginons que le fichier cr´´ ` l’exemple pr´c´dent soit le fichier des abonn´s ` un certain p´age, et que ee a e e e a e nous disposions par ailleurs d’un fichier binaire contenant les num´ros des abonn´s qui ont emprunt´ ce p´age e e e e durant une p´riode donn´e. On nous demande d’´crire un programme pour incr´menter la valeur du champ e e e e nbr passages de chaque abonn´ concern´. e e

#include <stdio.h> #define PAS_D_ERREUR 0 #define ERREUR_OUVERTURE_ABONNES 1 #define ERREUR_OUVERTURE_PASSAGES 2 struct { char nom[32], prenom[32]; char adresse[80]; int nombre_de_passages; } art; FILE *passages, *abonnes; main() { char nom[256]; long n; printf("fichier des passages : "); if ((passages = fopen(gets(nom), "rb")) == NULL) exit(ERREUR_OUVERTURE_PASSAGES); printf("fichier des abonnes : "); if ((abonnes = fopen(gets(nom), "rb+")) == NULL) exit(ERREUR_OUVERTURE_ABONNES);
c H. Garreta, 1988-2006

101

7.5 Les fichiers de bas niveau d’UNIX

7

´ ENTREES-SORTIES

for (;;) { if (fread(&n, sizeof n, 1, passages) != 1) break; fseek(abonnes, n * sizeof art, SEEK_SET); fread(&art, sizeof art, 1, abonnes); art.nombre_de_passages++; fseek(abonnes, n * sizeof art, SEEK_SET); fwrite(&art, sizeof art, 1, abonnes); } fclose(abonnes); exit(PAS_D_ERREUR); }

7.5

Les fichiers de bas niveau d’UNIX

Les fichiers de bas niveau du syst`me UNIX ne sont pas fondamentalement distincts des flots que l’on vient e de d´crire. En fait, les flots et les fichiers de bas niveau sont deux mani`res de voir depuis un programme les e e mˆmes entit´s de base (les fichiers). Les fichiers de bas niveau sont la mani`re habituelle de r´aliser les fichiers e e e e binaires lorsqu’on ne poss`de pas un C ANSI. e Dans le syst`me UNIX chaque processus dispose, pour g´rer ses fichiers, d’une table de descripteurs de e e fichiers. Lorsque les fichiers sont g´r´s au plus bas niveau, ils sont repr´sent´s tout simplement par un indice dans ee e e cette table. Par exemple, les trois unit´s standard stdin, stdout et stderr sont respectivement repr´sent´es e e e en tant que fichiers par les descripteurs d’indices 0, 1 et 2. Les fonctions disponibles sont : int open(char *nom, int mode, int permissions) Ouvre un fichier existant ayant le nom externe indiqu´. L’argument mode doit avoir pour valeur une des e constantes symboliques (d´finies dans <ioctl.h> ou dans <sys/file.h>) : e O RDONLY : ouverture en lecture seulement O WRONLY : ouverture en ´criture seulement e O RDWR : ouverture en lecture / ´criture e Cette fonction renvoie le num´ro du descripteur ouvert pour le fichier, ou un nombre n´gatif en cas d’erreur. e e Pour l’argument permissions voir ci-dessous. int creat(char *nom, int permissions) Cr´e un fichier nouveau, ayant le nom indiqu´, et l’ouvre en ´criture. Comme pour la fonction open, e e e l’argument permissions indique que le droit de lecture, le droit d’´criture ou le droit d’ex´cution est e e accord´ ou non au propri´taire du fichier, aux membres de son groupe de travail ou ` tous les utilisateurs e e a du syst`me. Cela fait trois groupes de trois bits, soit un nombre qui s’´crit particuli`rement bien en octal. e e e Par exemple : fic = creat("tmp/monfic", 0751); cr´e un fichier nouveau et lui accorde les permissions : e propri´taire e groupe autres lecture 1 1 0 ´criture e 1 0 0 ex´cution e 1 1 1 en octal 7 5 1

int read(int fichier, char *adresse, int nombre) Lit nombre octets depuis le fichier indiqu´ et les range ` partir de l’adresse indiqu´e. Renvoie le nombre e a e d’octets effectivement lus, qui peut ˆtre inf´rieur ` nombre (fin de fichier, erreur de lecture, etc.). e e a int write(int fichier, void *adresse, int nombre) Ecrit les nombre octets qui se trouvent ` l’adresse indiqu´e dans le fichier indiqu´. Rend le nombre a e e d’octets effectivement ´crits, qui peut ˆtre inf´rieur ` nombre (erreur d’´criture, etc.). e e e a e int close(int descfic) Ferme le fichier indiqu´. e

102

c H. Garreta, 1988-2006

´ 7 ENTREES-SORTIES

7.5

Les fichiers de bas niveau d’UNIX

long lseek(int fichier, long rang, int origine) Positionne le fichier indiqu´ sur l’octet ayant le rang indiqu´. Ce rang exprime une position... e e ...relative au d´but du fichier (si origine = 0) e ...relative ` la position courante (si origine = 1) a ...relative ` la fin du fichier (si origine = 2) a Exemple. Voici la version UNIX (et, de plus, non ANSI) du programme, donn´ plus haut, qui effectue une e copie identique d’un fichier quelconque. Au sujet de l’utilisation qui est faite des arguments de main voir la section 8.3.1. main(int argc, char *argv[]) { int srce, dest, n; char tampon[512]; if (argc < 3 || (srce = open(argv[1], 0, 0777)) < 0 || (dest = creat(argv[2], 0777)) < 0) return 1; while ((n = read(srce, tampon, 512)) > 0) write(dest, tampon, n); close(dest); close(srce); return 0; }

c H. Garreta, 1988-2006

103

´ ´ 8 AUTRES ELEMENTS DU LANGAGE C

8

Autres ´l´ments du langage C ee

Cette section regroupe un ensemble de notions ayant en commun que leur int´rˆt apparaˆ surtout ` l’occasion ee ıt a de l’´criture de gros programmes. Ce sont des ´l´ments importants du langage mais, sauf quelques exceptions, e ee on peut s’en passer aussi longtemps qu’on limite la pratique de C ` des exercices de petite taille. a

8.1

Le pr´processeur e

Le pr´processeur transforme le texte source d’un programme avant que la compilation ne commence. e G´n´ralement associ´es au processus de la compilation, ses actions semblent en faire partie, mais il faut sae e e voir que le pr´processeur est un programme s´par´, largement ind´pendant du compilateur. En particulier le e e e e pr´processeur ne connaˆ pas la syntaxe du langage C. Les transformations qu’il effectue sur un programme e ıt sont simplement des ajouts, des suppressions et des remplacements de morceaux de texte nullement astreints ` a correspondre aux entit´s syntaxiques du langage. e Les directives destin´es au pr´processeur comportent, dans l’ordre : e e e – un signe # (qui, en syntaxe originale, doit occuper la premi`re position de la ligne) ; – un mot-cl´ parmi include, define, if, ifdef, ifndef, else et endif qui identifie la directive. Nous e passerons sous silence quelques autres directives mineures comme pragma, line ou error ; – le corps de la directive, dont la structure d´pend de la nature de celle-ci. e 8.1.1 Inclusion de fichiers

La possibilit´ d’inclure des fichiers sources dans d’autres fichiers sources s’av`re tr`s utile, par exemple e e e pour ins´rer dans chacun des fichiers s´par´s qui constituent un programme l’ensemble de leurs d´clarations e e e e communes (types, structures, etc.). Ainsi ces d´finitions sont ´crites dans un seul fichier, ce qui en facilite la e e maintenance. Un cas particulier tr`s important de ce partage des d´clarations est celui des biblioth`ques livr´es avec le e e e e compilateur. Elles sont essentiellement compos´es de fonctions utilitaires d´j` compil´es dont seul le fichier objet e ea e est fourni. Pour que les appels de ces fonctions puissent ˆtre correctement compil´s62 dans des programmes qui e e les utilisent, un certain nombre de fichiers en-tˆte sont livr´s avec les biblioth`ques, comprenant e e e – principalement, les prototypes des fonctions qui forment la biblioth`que ou qui incarnent une fonctionnalit´ e e particuli`re (les entr´es - sorties, la gestion des chaˆ e e ınes de caract`res, la biblioth`que math´matique, etc.) ; e e e – souvent, un ensemble de directives #define et de d´clarations struct, union et typedef qui d´finissent e e les constantes et les types n´cessaires pour utiliser la biblioth`que en question ; e e – parfois, quelques directives #include concernant d’autres fichiers en-tˆte lorsque les ´l´ments d´finis dans e ee e le fichier en-tˆte en question ne peuvent eux-mˆmes ˆtre compris sans ces autres fichiers ; e e e – plus rarement, quelques d´clarations de variables externes. e Cette directive poss`de deux formes : e #include "nom-de-fichier " C’est la forme g´n´rale. Le fichier sp´cifi´ est ins´r´ ` l’endroit o` la directive figure avant que la compilation e e e e eea u ne commence ; ce doit ˆtre un fichier source ´crit en C. La chaˆ de caract`res "nom-de-fichier " doit ˆtre un e e ıne e e nom complet et correct pour le syst`me d’exploitation utilis´. e e La deuxi`me forme est : e #include <nom-de-fichier > Ici, le nom est incomplet ; il ne mentionne pas le chemin d’acc`s au fichier, car il est convenu qu’il s’agit d’un e fichier appartenant au syst`me, faisant partie de la biblioth`que standard : le pr´processeur  sait  dans quels e e e r´pertoires ces fichiers sont rang´s. Ce sont des fichiers dont le nom se termine par .h (pour header, en-tˆte) et e e e qui contiennent les d´clarations n´cessaires pour qu’un programme puisse utiliser correctement les fonctions de e e la biblioth`que standard. e Exemples (avec des noms de fichier en syntaxe UNIX) : #include <stdio.h> #include "/users/henri/projet_grandiose/gadgets.h"
62 Notez bien qu’il ne s’agit pas de fournir les fonctions de la biblioth`que (cela est fait par l’apport du fichier objet au moment de e l’´dition de liens) mais uniquement de donner l’information requise pour que les appels de ces fonctions puissent ˆtre correctement e e traduits par le compilateur. Pour cette raison on ne trouve jamais dans les fichiers en-tˆte ni des variables non externes, ni le corps e des fonctions.

104

c H. Garreta, 1988-2006

´ ´ 8 AUTRES ELEMENTS DU LANGAGE C

8.1

Le pr´processeur e

Attention. Il ne faut pas confondre inclusion de fichiers et compilation s´par´e. Les fichiers que l’on inclut e e au moyen de la directive #include contiennent du texte source C qui sera compil´ chaque fois que l’inclusion e sera faite (c’est pourquoi ces fichiers ne contiennent jamais de fonctions). Le service rendu par la directive #include est de permettre d’avoir un texte en un seul exemplaire, non de permettre de le compiler une seule fois. 8.1.2 D´finition et appel des “macros” e

Les macros sans argument63 se d´finissent par la directive : e #define nom corps Le nom de la macro est un identificateur. Le corps de la macro s’´tend jusqu’` la fin de la ligne64 . Partout e a dans le texte o` le nom de la macro apparaˆ en qualit´ d’identificateur (ce qui exclut les commentaires, les u ıt e chaˆ ınes de caract`res et les occurrences o` le nom de la macro est coll´ ` un autre identificateur), il sera remplac´ e u ea e par le corps de la macro, lequel est un texte quelconque n’ayant ` ob´ir ` aucune syntaxe. Par exemple, entre a e a l’endroit o` figurent les deux directives suivantes : u #define NBLIGNES 15 #define NBCOLONNES (2 * NBLIGNES) et la fin du fichier o` elles apparaissent, chaque occurrence de l’identificateur NBLIGNES sera remplac´e par le u e texte 15 et chaque occurrence de l’identificateur NBCOLONNES par le texte (2 * 15). Au moins d’un point de vue logique, ces remplacements se feront avant que la compilation ne commence. Ainsi, ` la place de a double matrice[NBLIGNES][NBCOLONNES]; le compilateur trouvera double matrice[15][(2 * 15)]; (il remplacera imm´diatement 2 * 15 par 30). e Attention. Voici une erreur que l’on peut faire : #define NBLIGNES 15; #define NBCOLONNES (2 * NBLIGNES); C’est une erreur difficile ` d´celer, car le compilateur ne signalera ici rien de particulier. Mais plus loin il donnera a e pour erron´e une d´claration comme : e e double matrice[NBLIGNES][NBCOLONNES]; En effet, cette expression qui paraˆ sans d´faut aura ´t´ transform´e par le pr´processeur en65 ıt e ee e e double matrice[15;][(2 * 15;);]; Macros avec arguments. Elles se d´finissent par des expressions de la forme : e #define nom(ident 1 , ... ident k ) corps Il ne doit pas y avoir de blanc entre le nom de la macro et la parenth`se ouvrante. Comme pr´c´demment, e e e le corps de la macro s’´tend jusqu’` la fin de la ligne. Les identificateurs entre parenth`ses sont les arguments e a e de la macro ; ils apparaissent aussi dans le corps de celle-ci. Les utilisations (on dit les appels) de la macro se font sous la forme nom(texte 1 , ... texte k ) Cette expression sera remplac´e par le corps de la macro, dans lequel ident 1 aura ´t´ remplac´ par texte 1 , e ee e ident 2 par texte 2 , etc. Exemple66 : #define permuter(a, b, type) { type w_; w_ = a; a = b; b = w_; } Exemple d’appel : permuter(t[i], t[j], short *) R´sultat de la substitution (on dit aussi d´veloppement) de la macro : e e { short * w_; w_ = t[i]; t[i] = t[j]; t[j] = w_; }
63 Le mot macro est une abr´viation de l’expression  macro-instruction  d´signant un m´canisme qui existe depuis longtemps e e e dans beaucoup d’assembleurs. Les macros avec arguments sont appel´es aussi pseudo-fonctions. e 64 Mais il d´coule de la section 1.2.1 que le corps d’une macro peut occuper en fait plusieurs lignes : il suffit que chacune d’elles, e sauf la derni`re, se termine par le caract`re \. e e 65 Pour permettre de trouver ce genre d’erreurs, certains compilateurs C poss`dent une option (sous UNIX l’option -E) qui produit e l’affichage du programme source uniquement transform´ par le pr´processeur. e e 66 Dans cet exemple, les accolades { et } donnent au corps de la macro une structure de bloc qui sera comprise et exploit´e par e le compilateur, mais cette structure est parfaitement indiff´rente au pr´processeur. e e

c H. Garreta, 1988-2006

105

8.1 Le pr´processeur e

8

´ ´ AUTRES ELEMENTS DU LANGAGE C

Les appels de macros ressemblent beaucoup aux appels de fonctions. La mˆme facilit´, ne pas r´crire un e e e certain code source, peut ˆtre obtenue avec une macro et avec une fonction. Mais il faut comprendre que ce n’est e pas du tout la mˆme chose. Alors que le corps d’une fonction figure en un seul exemplaire dans le programme e ex´cutable dont elle fait partie, le corps d’une macro est recopi´ puis compil´ ` chaque endroit o` figure l’appel e e ea u de la macro. Il faut donc que le corps d’une macro soit r´duit, sans quoi son utilisation peut finir par ˆtre tr`s on´reuse e e e e en termes d’espace occup´. Un autre inconv´nient des macros est que leur d´finition  hors syntaxe  les rend e e e tr`s difficiles ` maˆ e a ıtriser au-del` d’un certain degr´ de complexit´ (pas de variables locales, etc.). a e e En faveur des macros : leur efficacit´. Le texte de la macro ´tant recopi´ ` la place de l’appel, on gagne ` e e ea a chaque fois le coˆt d’un appel de fonction. Il eˆt ´t´ bien peu efficace d’appeler une fonction pour ne faire que la u u ee permutation de deux variables ! Autre int´rˆt des macros, elles sont ind´pendantes des types de leurs arguments ee e ou mˆme, comme ci-dessus, elles peuvent avoir un type pour argument. e En d´finitive, la principale utilit´ des macros est d’am´liorer l’expressivit´ et la portabilit´ des programmes e e e e e en centralisant la d´finition d’op´rations compliqu´es, proches du mat´riel ou sujettes ` modification. Voici un e e e e a exemple ´l´mentaire : en C original (dans lequel on ne dispose pas du type void *) la fonction malloc doit ˆtre ee e g´n´ralement utilis´e en association avec un changement de type : e e e p = (machin *) malloc(sizeof(machin)); Des telles expressions peuvent figurer ` de nombreux endroits d’un programme. Si nous d´finissons la macro a e #define NOUVEAU(type) ((type *) malloc(sizeof(type))) alors les allocations d’espace m´moire s’´criront de mani`re bien plus simple et expressive e e e p = NOUVEAU(machin); De plus, un ´ventuel remplacement ult´rieur de malloc par un autre proc´d´ d’obtention de m´moire sera e e e e e facile et fiable, puisqu’il n’y aura qu’un point du programme ` modifier. a Attention. 1. Il est quasiment obligatoire d’´crire les arguments et le corps des macros entre parenth`ses, e e pour ´viter des probl`mes li´s aux priorit´s des op´rateurs. Par exemple, la macro e e e e e #define TVA(p) 0.196 * p est tr`s imprudente, car une expression comme (int) TVA(x) sera d´velopp´e en (int) 0.196 * x, ce qui vaut e e e toujours 0. Premi`re correction : e #define TVA(p) (0.186 * p) Le probl`me pr´c´dent est corrig´, mais il y en a un autre : l’expression TVA(p1 + p2) est d´velopp´e en e e e e e e (0.186 * p1 + p2), ce qui est probablement erron´. D’o` la forme habituelle : e u #define TVA(p) (0.186 * (p)) 2. Il ne faut jamais appeler une macro inconnue avec des arguments qui ont un effet de bord, car ceux-ci peuvent ˆtre ´valu´s plus d’une fois. Exemple classique : on dispose d’une macro nomm´e toupper qui transforme e e e e toute lettre minuscule en la majuscule correspondante, et ne fait rien aux autres caract`res. Elle pourrait ˆtre e e ainsi d´finie (mais on n’est pas cens´ le savoir) : e e #define toupper(c) (’a’ <= (c) && (c) <= ’z’ ? (c) + (’A’ - ’a’) : (c)) On voit que l’´valuation de toupper(c) comporte au moins deux ´valuations de c. Voici un tr`s mauvais appel e e e de cette macro : calu = toupper(getchar()) En effet, cette expression se d´veloppe en e calu = (’a’ <= (getchar()) && (getchar()) <= ’z’ ? (getchar()) + (’A’ - ’a’) : (getchar())); A chaque appel, au moins deux caract`res sont lus, ce qui n’est sˆrement pas l’effet recherch´. On notera e u e que si toupper avait ´t´ une fonction, l’expression toupper(getchar()) aurait ´t´ tout ` fait correcte. Mais ee ee a puisque ce n’en est pas une, il faut l’appeler avec un argument sans effet de bord. Par exemple : { calu = getchar(); calu = toupper(calu); } 8.1.3 Compilation conditionnelle

Les directives de conditionnelle (compilation) se pr´sentent sous les formes suivantes : e 106
c H. Garreta, 1988-2006

´ ´ 8 AUTRES ELEMENTS DU LANGAGE C    #if expression  #ifdef identificateur   #ifndef identificateur ... texte compil´ si la condition est vraie, ignor´ si elle est fausse e e ... #else ... texte compil´ si la condition est fausse, ignor´ si elle est vraie e e ... #endif La partie else est facultative ; on a donc droit aussi aux formes :     #if expression #ifdef identificateur   #ifndef identificateur ... texte compil´ si la condition est vraie, ignor´ si elle est fausse e e ... #endif

8.1

Le pr´processeur e

Lorsque le premier ´l´ment de cette construction est #if expression, expression doit pouvoir ˆtre ´valu´e ee e e e par le pr´processeur. Ce doit donc ˆtre une expression constante ne contenant pas l’op´rateur de changement e e e de type ni les op´rateurs sizeof ou &. Elle sera ´valu´e et e e e – si elle est vraie, c’est-`-dire non nulle, alors le texte qui se trouve entre #if et #else sera trait´ par le a e compilateur, tandis que celui qui figure entre #else et #endif sera purement et simplement tenu pour inexistant ; – si elle est fausse, c’est-`-dire nulle, c’est le premier texte qui sera ignor´ tandis que le second sera lu par a e le compilateur. Dans la forme sans #else, si la condition est fausse aucun texte ne sera compil´. e Les directives #ifdef identificateur #ifndef identificateur ´quivalent respectivement ` e a #if  identificateur est le nom d’une macro actuellement d´finie  e #if  identificateur n’est pas le nom d’une macro actuellement d´finie  e La compilation conditionnelle se r´v`le ˆtre un outil pr´cieux pour contrˆler les parties des programmes e e e e o qui d´pendent de la machine ou du syst`me sous-jacent. On obtient de la sorte des textes sources qui restent e e portables malgr´ le fait qu’ils contiennent des ´l´ments non portables. Voici un exemple : les fonctions de lecturee ee ´criture sur des fichiers binaires ne sont pas les mˆmes dans la biblioth`que ANSI et dans la biblioth`que UNIX e e e e classique. Une mani`re d’´crire un programme ind´pendant de ce fait consiste ` enfermer les appels de ces e e e a fonctions et les d´clarations qui s’y rapportent dans des s´quences conditionnelles. D´claration : e e e ... #ifdef BINAIRES_ANSI FILE *fic; #else int fic; #endif ... Ouverture : ... #ifdef BINAIRES_ANSI fic = fopen(nom, "r"); ok = (fic != NULL); #else fic = open(nom, 0); ok = (fic >= 0); #endif ...
c H. Garreta, 1988-2006

107

8.2 La modularit´ de C e

8

´ ´ AUTRES ELEMENTS DU LANGAGE C

Lecture : ... #ifndef BINAIRES_ANSI ok = (fread(&art, sizeof(art), 1, fic) == 1); #else ok = (read(fic, &art, sizeof(art)) == sizeof(art)); #endif ... L’emploi de la compilation conditionnelle associ´e ` la d´finition de noms de macros est rendu encore plus e a e commode par le fait qu’on peut utiliser – des noms de macros normalement d´finis (#define...) ; e – des noms de macros d´finis dans la commande qui lance la compilation, ce qui permet de changer le texte e qui sera compil´ sans toucher au fichier source. De plus, puisque ces d´finitions se font au niveau de la e e commande de compilation, elles pourront ˆtre faites par des proc´dures de commandes (scripts) donc e e automatis´es ; e – un ensemble de noms de macros pr´d´finis dans chaque syst`me, pour le caract´riser. Par exemple dans e e e e le compilateur des syst`mes UNIX la macro UNIX est d´finie et vaut 1. e e Remarque. Le pr´processeur du C ANSI offre ´galement l’op´rateur defined qui permet d’´crire les die e e e rectives #ifdef ident (resp. #ifndef ident) sous la forme #if defined ident (resp. #if !defined ident). D’autre part, la construction #if expression1 ... #else #if expression2 ... #endif #endif peut en C ANSI s’abr´ger en e #if expression1 ... #elif expression2 ... #endif

8.2

La modularit´ de C e

A ce point de notre expos´ nous pouvons nous poser une question importante : le langage C est-il modulaire ? e La modularit´ est une qualit´ que les bonnes m´thodes de conception doivent poss´der. Elle n’est pas facile ` e e e e a d´finir ; on peut toutefois la cerner ` travers quelques crit`res67 . Une m´thode de conception doit e a e e – aider ` diviser chaque nouveau probl`me en sous-probl`mes qu’on peut r´soudre s´par´ment (crit`re de a e e e e e e d´composabilit´ ) ; e e – favoriser la production de composants logiciels qui peuvent se combiner librement pour produire de nouveaux syst`mes (crit`re de composabilit´ ) ; e e e e e e – permettre au concepteur d’´crire des modules dont chacun peut ˆtre compris isol´ment par un lecteur humain (crit`re de compr´hensibilit´ ) ; e e e – permettre qu’une petite modification des sp´cifications du probl`me entraˆ uniquement la modification e e ıne d’un petit nombre des modules de la solution (crit`re de continuit´ ) ; e e ea – assurer que l’effet d’une condition anormale se produisant dans un module restera localis´ ` ce module ou, au pire, n’atteindra qu’un petit nombre de modules  voisins  ( crit`re de protection). e Th´oriquement, tout langage de programmation peut servir ` mettre en œuvre une m´thode de conception e a e modulaire, mais dans certains cas il faut une telle dose de ruse et d’autodiscipline, pour un r´sultat si peu fiable, e que le jeu n’en vaut pas la chandelle. En pratique un langage est dit modulaire lorsqu’on peut, sans douleur et sans artifice, en faire l’outil d’une m´thode de conception modulaire. L’exp´rience montre que les crit`res e e e pr´c´dents induisent sur le langage en question quelques contraintes assez pr´cises, comme celles-ci : e e e a e – les modules doivent correspondre ` des entit´s syntaxiques du langage ;
67 Suivant l’analyse de Bertrand Meyer (Conception et programmation par objets, InterEditions, 1990) ` laquelle il semble difficile a d’ajouter ou de retrancher quelque chose.

108

c H. Garreta, 1988-2006

´ ´ 8 AUTRES ELEMENTS DU LANGAGE C

8.2

La modularit´ de C e

– chaque module doit partager des informations avec aussi peu d’autres modules que possible, et quand un tel partage existe il doit concerner aussi peu d’´l´ments que possible ; ee – quand deux modules partagent des informations, cela doit ˆtre clairement indiqu´ dans leurs deux textes. e e A la lumi`re de ces principes la modularit´ de C apparaˆ fort rudimentaire, pour ne pas dire inexistante. e e ıt Si l’on prend pour modules les fichiers sources qui composent un programme, on constate qu’aucune structure syntaxique ne signale les modules ni n’en d´limite la port´e, d’autant plus que le caract`re non syntaxique de la e e e directive #include brouille l’organisation du programme en fichiers distincts. Aucune d´claration particuli`re e e n’est requise pour indiquer que des objets sont partag´s entre plusieurs modules. Chaque module communique e avec tous les autres et, sauf sp´cification contraire, tous les objets de chaque module sont partag´s. e e Bien sˆr, la compilation s´par´e est une des id´es-cl´s du langage, et il est possible de rendre inaccessibles u e e e e les noms qui peuvent ˆtre priv´s. Mais le langage offre peu d’outils pour rendre fiable le partage des noms qui e e doivent ˆtre publics, et ces outils restent d’un emploi facultatif, subordonn´ ` l’autodiscipline du programmeur. e ea Par exemple, si dans un module B on doit r´f´rencer une variable ou une fonction d´finie dans un module A, il ee e suffit d’´crire dans B une d´claration comme extern int x ;. Cet ´nonc´ postule l’existence d’un objet nomm´ e e e e e x, ce qui sera contrˆl´ par l’´diteur de liens. Mais il donne ` x des attributs (la classe variable, le type int) que oe e a l’objet d´sign´ par x ne poss`de pas forc´ment ; aucune v´rification cependant ne sera faite. Ainsi la compilation e e e e e de B se fait dans la plus totale ins´curit´. e e

8.2.1

Fichiers en-tˆte e

Le seul moyen dont dispose l’auteur d’un module A pour s’assurer que les autres modules qui forment un programme utilisent correctement les variables et fonctions qu’il rend publiques consiste ` ´crire un fichier enae tˆte (fichier A.h) contenant toutes les d´clarations publiques. Ce fichier doit ˆtre inclus par la directive #include e e e dans le module qui implante les objets publics (fichier A.c) et dans chacun des modules qui les utilisent. De cette mani`re tous ces fichiers  voient  les mˆmes d´finitions de types, les mˆmes d´clarations de variables e e e e e et les mˆmes prototypes de fonctions ; ces d´clarations sont ´crites en un seul endroit, et toute modification de e e e l’une d’entre elles se r´percute sur tous les fichiers qui en d´pendent. e e La n´cessit´ de ces fichiers en-tˆte apparaˆ encore plus grande quand on consid`re le cas des biblioth`ques, e e e ıt e e c’est-`-dire des modules que leurs fonctionnalit´s placent en position de prestataires de services vis-`-vis des a e a autres modules qui composent un programme ; on parle alors de module serveur et de modules clients. En fait, on peut presque toujours voir la modularit´ en termes de serveurs et clients, car il y a toujours une hi´rarchie e e parmi les modules. Le propre des biblioth`ques est d’ˆtre con¸ues de mani`re ind´pendante des clients, afin de e e c e e pouvoir ˆtre utilis´es dans un programme pr´sent et un nombre quelconque de programmes futurs. L’int´rˆt de e e e ee leur associer le meilleur dispositif pour minimiser le risque de mauvaise utilisation est ´vident. e Typiquement, un fichier en-tˆte comportera les ´l´ments suivants : e ee – Des directives #include concernant les autres fichiers en-tˆte n´cessaires pour la compr´hension (par le e e e compilateur) des ´l´ments qui apparaissent dans le fichier en-tˆte en question. ee e – Des d´finitions de constantes, soit sous forme de directives #define soit sous forme de type ´num´r´, qui e e ee sont des informations symboliques ´chang´es entre le serveur et ses clients. Exemple : dans une biblioth`que e e e graphique, les noms conventionnels des couleurs. – Des d´finitions de structures (struct, union) et de types (typedef) qui d´finissent la nature des objets e e manipul´s par la biblioth`que. Typiquement, ces types permettent aux clients de d´clarer les objets qui e e e sont les arguments et les r´sultats des fonctions de la biblioth`que. Exemple : dans une biblioth`que e e e graphique, la d´finition de types point, segment, etc. e e e – Les d´clarations extern des variables publiques du serveur. Les d´finitions correspondantes (sans le qualifieur extern) figureront dans le module serveur. Remarque. L’emploi de variables publiques est d´conseill´ ; un module ne devrait offrir que des fonce e tions68 . e e – Les d´clarations des fonctions publiques du serveur. Les d´finitions correspondantes figureront dans le module serveur. En syntaxe originale seules les d´clarations des fonctions qui ne rendent pas un entier e sont n´cessaires, mais mˆme dans ce cas c’est une bonne habitude que d’y mettre les d´clarations de toutes e e e les fonctions, cela constitue un germe de documentation. Bien entendu, tous les noms de variables et fonctions du module serveur qui ne figurent pas dans le fichier en-tˆte doivent ˆtre rendus priv´s (en les qualifiant static). e e e
68 S’il est utile qu’un client puisse consulter ou modifier une variable du serveur, ´crivez une fonction qui ne fait que cela (mais e en contrˆlant la validit´ de la consultation ou de la modification). C’est bien plus sˆ r que de donner libre acc`s ` la variable. o e u e a

c H. Garreta, 1988-2006

109

8.2 La modularit´ de C e

8

´ ´ AUTRES ELEMENTS DU LANGAGE C

8.2.2

Exemple : stdio.h

A titre d’exemple visitons rapidement le plus utilis´ des fichiers en-tˆte de la biblioth`que standard : stdio.h. e e e Notre but n’est pas de prolonger ici l’´tude des entr´es-sorties, mais d’illustrer les indications du paragraphe e e pr´c´dent sur l’´criture des fichiers en-tˆte. Le texte ci-apr`s est fait de morceaux de la version MPW (Macintosh e e e e e Programmer Workshop) du fichier stdio.h auquel nous avons enlev´ ce qui ne sert pas notre propos : e /* * * * * * * */ stdIO.h -- Standard C I/O Package Modified for use with Macintosh C Apple Computer, Inc. 1985-1988 Copyright American Telephone & Telegraph Used with permission, Apple Computer Inc. (1985) All rights reserved. α

#ifndef __STDIO__ #define __STDIO__ #include <stddef.h> #include <stdarg.h> /* * Miscellaneous constants */ #define EOF (-1) #define BUFSIZ 1024 #define SEEK_SET 0 #define SEEK_CUR 1 #define SEEK_END 2

/* * The basic data structure for a stream is the FILE. */ typedef struct { β int _cnt; unsigned char *_ptr; unsigned char *_base; unsigned char *_end; unsigned short _size; unsigned short _flag; unsigned short _file; } FILE; /* * Things used internally: */ extern FILE _iob[]; int _filbuf (FILE *); int _flsbuf (int, FILE *); /* * The */ #define #define #define standard predefined streams stdin stdout stderr (&_iob[0]) (&_iob[1]) (&_iob[2])

γ

/* * File access functions */ int fclose (FILE *); int fflush (FILE *); FILE *fopen (const char *, const char *); int setvbuf (FILE *, char *, int, size_t); 110

δ

c H. Garreta, 1988-2006

´ ´ 8 AUTRES ELEMENTS DU LANGAGE C

8.2

La modularit´ de C e

/* * */ int int int int int int

Formatted input/output functions printf (const char *, ...); fprintf (FILE *, const char *, ...); sprintf (char *, const char *, ...); scanf (const char *, ...); fscanf (FILE *, const char *, ...); sscanf (const char *, const char *, ...); ε

/* * Character input/output functions and macros */ int fgetc (FILE *); int ungetc (int, FILE *); int fputc (int, FILE *); char *fgets (char *, int, FILE *); char *gets (char *); int puts (const char *); int fputs (const char *, FILE *); #define getc(p) (--(p)->_cnt >= 0 \ ? (int) *(p)->_ptr++ : _filbuf(p)) #define getchar() getc(stdin) #define putc(x, p) (--(p)->_cnt >= 0 \ ? ((int) (*(p)->_ptr++ = (unsigned char) (x))) \ : _flsbuf((unsigned char) (x), (p))) #define putchar(x) putc((x), stdout) /* * Direct input/output functions */ size_t fread (void *, size_t, size_t, FILE *); size_t fwrite (const void *, size_t, size_t, FILE *); #endif __STDIO__ Renvois : α Lorsque les fichiers en-tˆte sont d’un int´rˆt g´n´ral ils finissent par ˆtre inclus dans de nombreux autres e ee e e e fichiers, eux-mˆmes inclus les uns dans les autres. Le compilateur risque alors de lire plusieurs fois un mˆme e e fichier, ce qui entraˆ un travail inutile et parfois des erreurs li´es ` des red´finitions. Par exemple, imaıne e a e ginons que MonBazar.h soit un fichier comportant la directive #include <stdio.h>. Dans la compilation d’un fichier commen¸ant par les deux directives c #include <stdio.h> #include "MonBazar.h" le compilateur risquerait de compiler deux fois le fichier stdio.h. Les deux premi`res directives de ce e fichier r´solvent ce probl`me : lorsque ce fichier est pris en compte une premi`re fois, le nom __STDIO__ e e e (nom improbable arbitrairement associ´ ` stdio.h) devient d´fini. Durant la pr´sente compilation, la e a e e directive #ifndef __STDIO__ fera que l’int´rieur du fichier ne sera plus jamais lu par le compilateur. Tous e les fichiers en-tˆte peuvent ˆtre prot´g´s de cette mani`re contre les inclusions multiples. e e e e e β On peut noter ici que la vue du type FILE qu’ont les modules clients est tr`s diff´rente de celle qu’ils e e auraient en utilisant un langage tr`s modulaire comme Modula II ou Ada. Dans ces langages les noms e et les types des champs d’une structure comme FILE resteraient priv´s, ainsi que la structure elle-mˆme ; e e seul le type adresse d’une telle structure serait rendu public. Cela s’appelle un type opaque et augmente la fiabilit´ des programmes. e En C nous n’avons pas d’outils pour proc´der de la sorte : ou bien un type est priv´, connu uniquement e e du module serveur, ou bien il faut  tout dire  ` son sujet. L’utilisation d’un pointeur g´n´rique, dans le a e e style de typedef void *FILE_ADDRESS; dissimulerait bien l’information sur la structure FILE, mais aurait la cons´quence de rendre impossibles ` e a d´celer les mauvaises utilisations du type en question par le client. Notez d’autre part que la connaissance e
c H. Garreta, 1988-2006

111

8.3 Deux ou trois choses bien pratiques...

8

´ ´ AUTRES ELEMENTS DU LANGAGE C

dans les modules clients des noms des champs de la structure FILE est indispensable pour l’utilisation des macros comme getc ou putc. γ Tous les noms qui apparaissent dans le fichier en-tˆte deviennent de ce fait publics, mˆme ceux qu’on e e aurait aim´ garder priv´s alors qu’on ne le peut pas, par exemple parce qu’ils apparaissent dans le corps e e d’une macro, comme ici le nom de la table des descripteurs de fichiers iob. Le langage C n’ayant rien pr´vu ` ce effet, la  privacit´  n’est assur´e que par une convention entre le syst`me et les utilisateurs : e a e e e tout nom commen¸ant par un blanc soulign´   appartient au syst`me et l’utilisateur doit feindre d’en c e e ignorer l’existence. Ceci n’est pas la meilleure mani`re de donner les prototypes des fonctions dans un fichier en-tˆte. Dans une e e d´claration qui n’est pas une d´finition, la syntaxe n’exige pas les noms des arguments mais uniquement e e leurs types. Cependant, s’ils sont bien choisis, ces noms apportent une information suppl´mentaire qui e augmente la s´curit´ d’utilisation de la biblioth`que. Par exemple, les prototypes e e e FILE *fopen(const char *, const char *); size_t fread(void *, size_t, size_t, FILE *); ne seraient d’aucune utilit´ ` un programmeur qui h´siterait ` propos du rˆle ou de l’ordre des arguments ea e a o de ces fonctions, contrairement ` leurs versions  ´quivalentes  : a e FILE *fopen(const char *filename, const char *mode); size_t fread(void *buffer, size_t size, size_t count, FILE *stream); ε Les appels de fonctions avec des arguments variables ne b´n´ficient pas des v´rifications syntaxiques que e e e le C ANSI effectue lorsque la fonction a fait l’objet d’une d´finition de prototype. Sauf pour les arguments e nomm´s (le premier ou les deux premiers), les arguments que l’on passe ` l’une de ces six fonctions e a ´chappent donc ` tout contrˆle du compilateur. L’information concernant la nature de ces arguments est e a o port´e par le format ; elle ne pourra ˆtre exploit´e qu’` l’ex´cution. e e e a e

δ

Autres remarques. Le premier client de ce dispositif doit ˆtre le fournisseur lui-mˆme. Pour que la e e protection contre l’erreur recherch´e soit effective, il faut que chacun des fichiers qui r´alisent l’implantation des e e variables et fonctions  promises  dans stdio.h comporte la directive #include <stdio.h> De cette mani`re on garantit que l’auteur et l’utilisateur de chaque variable ou fonction sont bien d’accord e sur la d´finition de l’entit´ en question. e e Une autre r`gle ` respecter par l’auteur du ou des modules serveurs : qualifier static tous les noms qui ne e a sont pas d´clar´s dans le fichier en-tˆte, pour ´viter les collisions de noms. Le fichier en-tˆte joue ainsi, pour ce e e e e e qui concerne les variables et les fonctions, le rˆle de liste officielle des seuls noms publics. o

8.3
8.3.1

Deux ou trois choses bien pratiques...
Les arguments du programme principal

Cette section ne concerne que les environnements, comme UNIX ou MS-DOS, dans lesquels les programmes sont activ´s en composant une commande de la forme nom-du-programme argument 1 ... argument k . e L’ex´cution d’un programme commence par la fonction main. Tout se passe comme si le syst`me d’exploitae e tion avait appel´ cette fonction comme une fonction ordinaire. Il faut savoir que lors de cet appel, des arguments e sont fournis au programme. Voici l’en-tˆte complet de main, en syntaxe ANSI : e int main(int argc, char *argv[]) avec : argc : nombre d’arguments du programme argv : tableau de chaˆ ınes de caract`res, qui sont les arguments du programme. Par convention, le premier e argument est le nom du programme lui-mˆme. e Imaginons avoir ´crit un programme qui, une fois compil´, se nomme echo ; supposons que ce programme e e soit lanc´ par la commande : e echo Pierre Paul alors, main re¸oit les arguments que montre la figure 18. c Supposons que tout ce que l’on demande ` echo soit de recopier la liste de ses arguments. Voici comment a on pourrait ´crire ce programme : e 112
c H. Garreta, 1988-2006

´ ´ 8 AUTRES ELEMENTS DU LANGAGE C

8.3

Deux ou trois choses bien pratiques...

e c h o\ 0 argc 3 argv

P i e r r e\ 0

P a u l \0

NULL
Fig. 18 – Arguments de main

main(int argc, char *argv[]) { int i; for (i = 0; i < argc; i++) printf("%s\n", argv[i]); return 0; } La frappe de la commande  echo Pierre Paul  produit l’affichage de echo Pierre Paul La principale application de ce m´canisme est la fourniture ` un programme des param`tres dont il peut e a e d´pendre, comme des noms de fichiers, des tailles de tableaux, etc. Par exemple, voici une nouvelle version du e programme de copie de fichiers donn´ ` la section 7.4.1, qui prend les noms des fichiers source et destination ea comme arguments : #include <stdio.h> #define #define #define #define PAS_D_ERREUR ERREUR_OUVERTURE ERREUR_CREATION PAS_ASSEZ_D_ARGUMENTS 0 1 2 3

FILE *srce, *dest; main(int argc, char *argv[]) { char tampon[512]; int nombre; if (argc < 3) return PAS_ASSEZ_D_ARGUMENTS; if ((srce = fopen(argv[1], "rb")) == NULL) return ERREUR_OUVERTURE; if ((dest = fopen(argv[2], "wb")) == NULL) return ERREUR_CREATION; while ((nombre = fread(tampon, 1, 512, srce)) > 0) fwrite(tampon, 1, nombre, dest); fclose(dest); return PAS_D_ERREUR; } Si nous appelons copier le fichier ex´cutable produit en compilant le texte ci-dessus, alors nous pourrons e l’ex´cuter en composant la commande e copier fichier-source fichier-destination
c H. Garreta, 1988-2006

113

8.3 Deux ou trois choses bien pratiques...

8

´ ´ AUTRES ELEMENTS DU LANGAGE C

8.3.2

Branchements hors fonction : setjmp.h

Le m´canisme des longs branchements permet d’obtenir la terminaison imm´diate de toutes les fonctions e e qui ont ´t´ appel´es (et ne sont pas encore termin´es) depuis que le contrˆle est pass´ par un certain point du ee e e o e programme, quel que soit le nombre de ces fonctions. Il est r´alis´ ` l’aide des deux fonctions : e ea int setjmp(jmp_buf contexte); void longjmp(jmp_buf contexte, int code); Cela fonctionne de la mani`re suivante : tout d’abord il faut d´clarer une variable, g´n´ralement globale, de e e e e type jmp buf (type d´fini dans le fichier en-tˆte setjmp.h) : e e #include <setjmp.h> ... jmp_buf contexte; L’appel setjmp(contexte); enregistre dans contexte certaines informations traduisant l’´tat du syst`me, puis renvoie z´ro. Ensuite, l’appel e e e longjmp(contexte, valeur); remet le syst`me dans l’´tat qui a ´t´ enregistr´ dans la variable contexte. Plus pr´cis´ment, le syst`me se e e ee e e e e trouve comme si l’appel de setjmp(contexte) venait tout juste de se terminer, en rendant cette fois non pas z´ro mais la valeur indiqu´e dans l’appel de longjmp. e e Le principal service rendu par ce dispositif est de permettre de programmer simplement, et en maˆ ıtrisant le  point de chute , l’abandon d’une famille de fonctions qui se sont mutuellement appel´es. Examinons un e exemple classique : supposons qu’une certaine fonction expression soit un analyseur syntaxique pr´sentant e deux caract´ristiques fr´quentes : e e – la fonction expression est ` l’origine d’une imbrication dynamique fort complexe (expression appelle a une fonction terme, qui appelle une fonction facteur qui ` son tour appelle une fonction primaire laquelle a rappelle expression, etc.) ; – chacune des fonctions expression, terme, facteur, etc., peut ` tout moment rencontrer une erreur dans a ses donn´es, qui rend la poursuite du traitement inutile ou impossible. e

main analyse()

analyse

setjmp

setjmp(c) expression expression() longjmp(c,v) terme

terme()

Fig. 19 – Branchement hors fonction

Voici comment l’appel de expression pourrait ˆtre emball´ dans une fonction  enveloppe  nomm´e e e e analyse (voir la figure 19) : 114
c H. Garreta, 1988-2006

´ ´ 8 AUTRES ELEMENTS DU LANGAGE C

8.3

Deux ou trois choses bien pratiques...

#include <setjmp.h> ... jmp_buf contexte; ... int analyse(void) { if (setjmp(contexte) == 0) { expression(); return SUCCES; } else return ERREUR; } Fonctionnement : lorsque la fonction analyse est activ´e, setjmp est appel´e et rend 0 ; elle est donc e e imm´diatement suivie par l’appel de expression. Si le travail de expression se termine normalement, alors e analyse rendra SUCCES et elle aura ´t´ transparente. D’autre part, dans la fonction expression et toutes celles ee appel´es  au-dessus  d’elle (terme, facteur, etc.), il est possible d’effectuer l’appel e longjmp(contexte, 1); qui ram`ne le contrˆle dans la fonction analyse, exactement sur la partie condition de l’instruction e o if (setjmp(contexte) == 0) mais cette fois la valeur rendue par setjmp sera 1 et analyse rendra donc la valeur ERREUR. Remarques. 1. L’appel de longjmp se pr´sente comme une remise du syst`me dans l’un des ´tats par lesquels e e e il est pass´. Cela est vrai, sauf pour ce qui concerne la valeur des variables, notamment les variables globales : e elles ne reprennent pas la valeur qu’elles avaient lorsque longjmp a ´t´ appel´e. ee e 2. On ne peut effectuer un appel de longjmp que pour ramener le syst`me dans l’une des fonctions appel´es e e et non encore termin´es, pour laquelle l’espace local est encore allou´ dans la pile. Appeler longjmp avec un e e contexte qui a ´t´ m´moris´ dans une fonction dont l’activation est termin´e est une erreur aux cons´quences ee e e e e ind´finies, mˆme si cette fonction a ´t´ rappel´e depuis. Par exemple, un appel longjmp(c,v) qui serait plac´ e e ee e e dans la fonction main apr`s l’appel analyse() (voir la figure 19) serait erron´, car il utiliserait le contexte d’une e e activation de fonction (la fonction analyse) qui n’existe plus. 8.3.3 Interruptions : signal.h

L’objet de la fonction signal est la d´tection d’´v´nements asynchrones qui peuvent se produire pendant e e e l’ex´cution d’un programme.  Asynchrones  signifie qu’on ne peut pas pr´voir le moment o` ils se produiront, e e u car ils ne r´sultent pas d’instructions normalement ins´r´es dans la s´quence qui forme le programme. e ee e Un certain ensemble de types d’´v´nements, d´pendant de chaque syst`me, est r´cup´rable ` travers le e e e e e e a m´canisme d´crit ici. En g´n´ral on traite de la mˆme mani`re le vrai et le faux asynchronisme. Une coupure e e e e e e de courant ou une interruption provoqu´e par l’utilisateur sont des ´v´nements vraiment impr´visibles. Une e e e e r´f´rence ` travers un pointeur invalide ou une division par z´ro ne sont pas r´ellement asynchrones (si on avait ee a e e connu parfaitement le programme et les donn´es on aurait pu pr´dire tr`s exactement de tels ´v´nements), mais e e e e e il est commode de les consid´rer comme tels et de les r´cup´rer de la mˆme mani`re. e e e e e La fonction signal est d´clar´e dans le fichier signal.h de la fa¸on suivante : e e c void (*signal(int numero, void (*manip)(int)))(int); Ce prototype n’est pas tr`s facile ` lire. D´finissons le type PROCEDURE comme celui d’une fonction sans e a e r´sultat d´fini ayant un argument de type int : e e typedef void PROCEDURE(int); Avec cela, la d´claration pr´c´dente se r´crit plus simplement : e e e e PROCEDURE *signal(int numero, PROCEDURE *manip); et elle nous apprend que la fonction signal prend deux arguments, ` savoir un int et l’adresse d’une PROCEDURE, a et renvoie l’adresse d’une PROCEDURE. Lors d’un appel de signal, l’argument numero doit d´signer un des ´v´nements qu’il est possible de r´cup´rer. e e e e e L’effet de signal est d’enregistrer la PROCEDURE donn´e en argument, de telle mani`re que si l’´v´nement en e e e e question se produit, alors elle sera automatiquement appel´e par le syst`me avec pour argument le num´ro de e e e l’´v´nement. La fonction signal rend l’adresse de la PROCEDURE qui ´tait jusqu’alors enregistr´e pour ce mˆme e e e e e ´v´nement. e e
c H. Garreta, 1988-2006

115

8.4 La biblioth`que standard e

8

´ ´ AUTRES ELEMENTS DU LANGAGE C

Six ´v´nements sont pr´vus par le standard ANSI (ils ne sont pas tous implant´s dans tous les syst`mes ; en e e e e e outre, chaque syst`me peut ajouter ses propres particularit´s) : e e SIGABRT : fin anormale du programme (appel de la fonction abort) SIGINT : interruption provoqu´e par l’utilisateur (touche Ctrl-C, etc.) e SIGTERM : demande d’arrˆt de l’utilisateur (interruption  forte ) e SIGFPE : erreur arithm´tique (division par z´ro, etc.) e e SIGSEGV : acc`s m´moire ill´gal (souvent : mauvais pointeur dans l’acc`s ` une donn´e, d´bordement de e e e e a e e tableau) SIGILL : instruction ill´gale (souvent : mauvais pointeur dans l’appel d’une fonction) e La biblioth`que fournit en outre deux m´canismes de r´cup´ration d’une interruption pr´d´finis : e e e e e e SIG DFL : le m´canisme par d´faut utilis´ par le syst`me pour l’´v´nement en question lorsque la fonction e e e e e e signal n’a pas ´t´ appel´e ee e SIG IGN : le m´canisme trivial qui consiste ` ignorer l’´v´nement e a e e Exemple. Supposons qu’une section d’un certain programme effectue des calculs tr`s complexes dont la dur´e e e risque d’inqui´ter l’utilisateur final. On souhaite donc offrir ` ce dernier la possibilit´ d’interrompre le programme e a e lorsqu’il estime que celui-ci devient excessivement long, en appuyant sur une touche particuli`re69 . L’utilisateur e apprendra alors l’´tat d’avancement de son calcul (traduit par la valeur de la variable iteration numero) et e aura ` choisir entre la continuation et la terminaison du programme : a #include <signal.h> int iteration_numero; typedef void PROCEDURE(int); void voirSkissPass(int numero) { int c; printf("J’en suis a l’iteration: %d\nOn arrete? ", iteration_numero); do c = getchar(); while ((c = toupper(c)) != ’O’ && c != ’N’); if (c == ’O’) exit(1); /* abandonner le programme */ else return; /* reprendre le travail interrompu */ } main() { PROCEDURE *maniprec; ... autres op´rations e ... /* entr´e dans la section on´reuse */ e e maniprec = signal(SIGINT, voirSkissPass); ... calculs terriblement complexes ... /* sortie de la section on´reuse */ e signal(SIGINT, maniprec); ... autres op´rations e ... }

8.4

La biblioth`que standard e

La biblioth`que standard ANSI se compose de deux sortes d’´l´ments : e ee e e – un ensemble de fichiers objets 70 contenant le code compil´ des fonctions de la biblioth`que et participant,
plusieurs syst`mes, comme UNIX et VMS, il s’agit de la combinaison des deux touches  Ctrl  et  C . e s’agit en r´alit´ de fichiers  biblioth`ques  (extensions .a, .lib, .dll, etc.), mais de tels fichiers ne sont que des fichiers e e e objets un peu arrang´s pour en faciliter l’emploi par les ´diteurs de liens. e e
69 Sur 70 Il

116

c H. Garreta, 1988-2006

´ ´ 8 AUTRES ELEMENTS DU LANGAGE C

8.4

La biblioth`que standard e

pour la plupart sans qu’il y soit n´cessaire de l’indiquer explicitement,71 ` l’´dition de liens de votre e a e programme, – un ensemble de fichiers en-tˆte contenant les d´clarations n´cessaires pour que les appels de ces fonctions e e e puissent ˆtre correctement compil´s. e e Ces fichiers en-tˆte sont organis´s par th`mes ; nous reprenons cette organisation pour expliquer les princie e e paux ´l´ments de la biblioth`que. ee e Des parties importantes de la biblioth`que standard ont d´j` ´t´ expliqu´es ; notamment : e eaee e – la biblioth`que des entr´es - sorties (associ´e au fichier stdio.h), ` la section 7 ; e e e a a – les listes variables d’arguments (introduites dans le fichier stdarg.h) ` la section 4.3.4 ; – les branchements hors-fonction (d´clar´s dans le fichier setjmp.h) ` la section 8.3.2 ; e e a – la r´cup´ration des interruptions (avec le fichier signal.h) ` la section 8.3.3. e e a Nous passerons sous silence certains modules mineurs (comme la gestion de la date et l’heure). Au besoin, reportez-vous ` la documentation de votre syst`me. a e 8.4.1 Aide ` la mise au point : assert.h a

Cette  biblioth`que  ne contient aucune fonction. Elle se compose d’une macro unique : e void assert(int expression) qui fonctionne de la mani`re suivante : si l’expression indiqu´e est vraie (c’est-`-dire non nulle) au moment o` e e a u la macro est ´valu´e, il ne se passe rien. Si l’expression est fausse (c.-`-d. si elle vaut z´ro), un message est e e a e imprim´ sur stderr, de la forme e Assertion failed: expression, file fichier , line numero ensuite l’ex´cution du programme est avort´e. Exemple na¨ : e e ıf #include <assert.h> ... #define TAILLE 100 int table[TAILLE]; ... for (i = 0; j < TAILLE; i++) { ... assert(0 <= i && i < TAILLE); table[i] = 0; ... } l’ex´cution de ce programme donnera (puisqu’une faute de frappe a rendu infinie la boucle for ) : e Assertion failed: 0 <= i && i < TAILLE, file ex.c, line 241 La macro assert est un outil pr´cieux pour la mise au point des programmes. Sans elle, il arrive seuvent e qu’une situation anormale produite en un point d’un programme ne se manifeste qu’en un autre point sans rapport avec avec le premier ; il est alors tr`s difficile de remonter depuis la manifestation du d´faut jusqu’` e e a sa cause. Beaucoup de temps peut ˆtre gagn´ en postant de telles assertions aux endroits  d´licats , o` les e e e u variables du programme doivent satisfaire des contraintes cruciales. Il est clair, cependant, que cet outil s’adresse au programmeur et n’est utile que pendant le d´veloppement e du programme. Les appels de assert ne doivent pas figurer dans l’ex´cutable livr´ ` l’utilisateur final, pour deux e ea raisons : d’une part, ce dernier n’a pas ` connaˆ des d´tails du programme source (en principe il ne connaˆ a ıtre e ıt mˆme pas le langage de programmation employ´), d’autre part parce que les appels de assert ralentissent les e e programmes. Lorsque la mise au point d’un programme est termin´e, on doit donc neutraliser tous les appels de assert e qui y figurent. Cela peut s’obtenir en une seule op´ration, simplement en d´finissant en tˆte du programme72 e e e l’identificateur NDEBUG : #define NDEBUG peu importe la valeur
71 Notez que, sous UNIX, lorsque des fichiers de la biblioth`que standard ne sont pas implicites, il y a un moyen simple de les e indiquer explicitement. Par exemple, l’option -lm dans la commande gcc sp´cifie l’apport de la biblioth`que /lib/libm.a (ce fichier e e contient le code des fonctions math´matiques). e 72 Sous UNIX il n’est mˆme pas n´cessaire d’ajouter une ligne au programme : il suffit de composer la commande gcc en sp´cifiant e e e une option  -D , comme ceci : gcc -DNEBUG -o monprog monprog.c etc.

c H. Garreta, 1988-2006

117

8.4 La biblioth`que standard e

8

´ ´ AUTRES ELEMENTS DU LANGAGE C

juste avant d’effectuer la compilation finale du programme. Celle-ci se fera alors comme si tous les appels de assert avaient ´t´ gomm´s. ee e N.B. Le fait qu’il soit possible et utile de faire disparaˆ les appels de assert du programme ex´cutable ıtre e final montre bien que assert n’est pas la bonne mani`re de d´tecter des erreurs que le programmeur ne peut pas e e ´viter, comme les erreurs dans les donn´es saisies. Ainsi – sauf pour un programme ´ph´m`re ` usage strictement e e e e e a personnel – le code suivant n’est pas acceptable : ... scanf("%d", &x); assert(0 <= x && x <= N); ...

/* NON ! */

La v´rification que 0 <= x && x <= N porte sur une valeur lue ` l’ex´cution et garde tout son int´rˆt dans e a e ee le programme final, lorsque les assert sont d´sarm´s. C’est pourquoi elle doit plutˆt ˆtre programm´e avec du e e o e e  vrai  code : ... scanf("%d", &x); if( ! (0 <= x && x <= N)) { fprintf(stderr, "Erreur. La valeur de x doit ^tre comprise entre 0 et %d\n", N); e exit(-1); } ... 8.4.2 Fonctions utilitaires : stdlib.h

int atoi(const char *s), long atol(const char *s), double atof(const char *s) Ces fonctions calculent et rendent l’int (resp. le long, le double) dont la chaˆ s est l’expression ´crite. ıne e Exemple int i; char *s; ... affectation de s ... i = atoi(s); maintenant i a la valeur num´rique dont la chaˆ e ıne s est l’expression textuelle Note. Pour faire le travail inverse de atoi ou une autre des fonctions pr´c´dentes on peut employer e e sprintf selon le sch´ma suivant : e int i; char s[80]; ... affectation de i ... sprintf(s, "%d", i); maintenant la chaˆ ıne s est l’expression textuelle de la valeur de i int rand(void) Le ieme appel de cette fonction rend le ieme terme d’une suite d’entiers pseudo-al´atoires compris entre 0 e et la valeur de la constante RAND MAX, qui vaut au moins 32767. Cette suite ne d´pend que de la valeur de e la semence donn´e lors de l’appel de srand, voir ci-dessous. Si srand n’a pas ´t´ appel´e, la suite obtenue e ee e est celle qui correspond ` srand(1). a Voyez srand ci apr`s. e void srand(unsigned int semence) Initialise une nouvelle suite pseudo-al´atoire, voir rand ci-dessus. Deux valeurs diff´rentes de la semence e e – ´loign´es ou proches, peu importe – donnent lieu ` des suites tout ` fait diff´rentes, du moins ` partir e e a a e a du deuxi`me terme. e Application. Pour que la suite al´atoire fournie par les appels de rand que fait un programme soit e diff´rente ` chaque ex´cution de ce dernier il fait donc commencer par faire un appel de srand en veillant e a e 118
c H. Garreta, 1988-2006

´ ´ 8 AUTRES ELEMENTS DU LANGAGE C

8.4

La biblioth`que standard e

a ` lui passer un argument diff´rent chaque fois. Une mani`re d’obtenir cela consiste ` utiliser l’heure e e a courante (elle change tout le temps !), par exemple ` travers la fonction time73 . a Par exemple, le programme suivant initialise et affiche une suite pseudo-al´atoire de dix nombres flottants e xi v´rifiant 0 ≤ xi ≤ 1 : e #include <stdio.h> #include <stdlib.h> #include <time.h> main() { int i; float x; srand(time(NULL)); /* version C de randomize */ rand(); /* le premier tirage est tr`s li´ ` la semence */ e e a for(i = 0; i < 10; i++) { x = rand() / (float) RAND_MAX; printf("%f\n", x); } } void *malloc(size t taille) Alloue un espace pouvant m´moriser un objet ayant la taille indiqu´e, ou NULL en cas d’´chec. Cet espace e e e n’est pas initialis´. e void *calloc(size t nombre, size t taille) Alloue un espace suffisant pour loger un tableau de nombre objets, chacun ayant la taille indiqu´e, ou e NULL en cas d’´chec. L’espace allou´ est initialis´ par des z´ros. e e e e void free(void *adresse) Indique au syst`me que l’espace m´moire ayant l’adresse indiqu´e n’est plus utile au programme. Cette e e e adresse doit n´cessairement provenir d’un appel de malloc, calloc ou realloc. e void *realloc(void *adr, size t taille) R´-allocation d’espace. La valeur de adr doit provenir d’un appel de malloc, calloc ou realloc. Cette e fonction essaie d’agrandir ou de r´tr´cir (usage rare) l’espace point´ par adr afin qu’il ait la la taille e e e demand´e. Si cela peut se faire sur place alors la fonction renvoie la mˆme adresse adr. Sinon, elle obtient e e un nouvel espace ayant la taille voulue, y copie le contenu de l’espace point´ par adr, lib`re cet espace, e e enfin renvoie l’adresse de l’espace nouvellement allou´. e void exit(int code) Produit l’arrˆt normal (fermeture des fichiers ouverts, etc.) du programme. La valeur du code indiqu´ est e e transmise au syst`me d’exploitation, cette valeur est utilis´e lorsque le programme a ´t´ appel´ dans le e e ee e cadre d’un proc´dure de commandes (ou script). La signification de ce code d´pend du syst`me ; on peut e e e utiliser les constantes : – EXIT SUCCESS : la valeur conventionnelle qui indique, pour le syst`me sous-jacent, que le e programme a r´ussi ` accomplir sa mission ; e a e – EXIT FAILURE : le programme n’a pas r´ussi. void abort(void) Provoque un arrˆt anormal du programme (c’est un ´v´nement d´tect´ par la fonction signal). e e e e e int system(const char *commande) Suspend momentan´ment l’ex´cution du programme en cours, demande ` l’interpr`te des commandes du e e a e syst`me d’exploitation d’ex´cuter la commande indiqu´e et rend le code donn´ par cette commande (cette e e e e
73 La fonction time renvoie le nombre de secondes ´coul´es depuis le premier janvier 1970. Elle renvoie donc un nombre entier qui e e change toutes les secondes. Si on doit ´crire un programme devant initialiser plusieurs suites al´atoires distinctes en moins d’une seconde – ce qui est e e quand mˆme rarissime – on aura un probl`me, qu’on peut r´gler en faisant intervenir d’autres fonctions de mesure du temps. Par e e e exemple clock compte le temps (mais c’est un temps relatif au lancement du programme) en fractions de seconde, par exemple des millisecondes.

c H. Garreta, 1988-2006

119

8.4 La biblioth`que standard e

8

´ ´ AUTRES ELEMENTS DU LANGAGE C

valeur d´pend du syst`me). La chaˆ commande doit ˆtre l’expression compl`te, avec options et arguments, e e ıne e e d’une commande l´gale pour le syst`me utilis´. e e e Toutes les versions de C n’offrent pas ce service, mais on peut savoir ce qu’il en est : l’appel system(NULL) rend une valeur non nulle si l’interpr`te de commandes peut effectivement ˆtre appel´ depuis un proe e e gramme, z´ro sinon. e Exemple (bien connu des utilisateurs de Dev-C++ ; pause est une commande MS-DOS/Windows) : system("pause"); char *getenv(char *nom) Rend la chaˆ qui est la valeur de la variable d’environnement ayant le nom indiqu´, ou NULL si une ıne e telle variable n’est pas d´finie. La notion de variable d’environnement est d´finie au niveau du syst`me e e e sous-jacent. void qsort(void *tab, size t nbr, size t taille, int (*comp)(const void *, const void *)) Quick sort, ou tri rapide. Cette fonction trie sur place (c’est-`-dire sans utiliser un tableaux auxiliaire), a par ordre croissant, un tableau dont tab donne l’adresse de base, form´ de nbr objets chacun ayant la e taille indiqu´e. e Pour comparer les ´l´ments du tableau, qsort utilise la fonction qui est la valeur de l’argument comp. ee Cette fonction doit prendre les adresses de deux objets comme ceux dont le tableau est fait, et rendre une valeur n´gative, nulle ou positive selon que le premier objet est respectivement inf´rieur, ´gal ou sup´rieur e e e e au second. Voir ` la section 6.3.2, exemple 2, un mod`le d’utilisation de cette fonction. a e int bsearch(const void *ptr, const void *tab, size t nbr, size t taille, int (*comp)(const void *, const void *)) Binary search, recherche dichotomique. Cette fonction recherche dans un tableau qui doit ˆtre tri´, ayant e e l’adresse de base donn´e par tab, form´ de nbr objets chacun ayant la taille indiqu´e, un objet ´gal ` e e e e a celui ayant ptr pour adresse. Pour cela, elle utilise la fonction de comparaison donn´e par comp, qui est e d´finie comme pour qsort, voir ci-dessus. e int abs(int x), long labs(long x) Valeur absolue, avec un argument int (resp. long)74 . 8.4.3 Traitement de chaˆ ınes : string.h

char *strcpy(char *destin, const char *source) Copie la chaˆ source ` l’adresse destin. Rend destin. ıne a char *strcat(char *destin, const char *source) Copie la chaˆ source ` la suite de la chaˆ destin. Rend destin. ıne a ıne int strcmp(const char *a, const char *b) Compare les chaˆ ınes a et b pour l’ordre lexicographique (c’est-`-dire l’ordre par lequel on range les mots a dans un dictionnaire) et rend une valeur n´gative, nulle ou positive selon que a est, respectivement, e inf´rieur, ´gal ou sup´rieur ` b. e e e a size t strlen(const char *s) Rend le nombre de caract`res de la chaˆ s. Il s’agit du nombre de caract`res utiles : le caract`re ’\0’ e ıne e e qui se trouve ` la fin de toutes les chaˆ a ınes n’est pas compt´. Ainsi, strlen("ABC") vaut 3. e void *memcpy(char *destin, const char *source, size t nombre) Copie la zone m´moire d’adresse source de de taille nombre dans la zone de mˆme taille et d’adresse e e destin . Ces deux zones ne doivent pas se rencontrer. void *memmove(char *destin, const char *source, size t nombre) Copie la zone m´moire d’adresse source de de taille nombre dans la zone de mˆme taille et d’adresse e e destin . Fonctionne correctement mˆme si ces deux zones se rencontrent ou se chevauchent. e
74 La

fonction correspondante pour les r´els s’appelle fabs (cf. section 8.4.5). e

120

c H. Garreta, 1988-2006

´ ´ 8 AUTRES ELEMENTS DU LANGAGE C

8.4

La biblioth`que standard e

8.4.4

Classification des caract`res : ctype.h e

Les ´l´ments de cette biblioth`que peuvent ˆtre implant´s soit par des fonctions, soit par des macros. Les ee e e e pr´dicats rendent, lorsqu’ils sont vrais, une valeur non nulle qui n’est pas forc´ment ´gale ` 1 : e e e a int islower(int c) ⇔ c est une lettre minuscule. int isupper(int c) ⇔ c est une lettre majuscule. int isalpha(int c) ⇔ c est une lettre. int isdigit(int c) ⇔ c est un chiffre d´cimal. e int isalnum(int c) ⇔ c est une lettre ou un chiffre. int isspace(int c) ⇔ c est un caract`re d’espacement : ’ ’, ’\t’, ’\n’, ’\r’ ou ’\f’. e int iscntrl(int c) ⇔ c est un caract`re de contrˆle (c’est-`-dire un caract`re dont le code ASCII est e o a e compris entre 0 et 31). int isprint(int c) ⇔ c est un caract`re imprimable, c’est-`-dire qu’il n’est pas un caract`re de contrˆle. e a e o int isgraph(int c) ⇔ c est un caract`re imprimable autre qu’un caract`re d’espacement. e e int ispunct(int c) ⇔ c est une ponctuation, c’est-`-dire un caract`re imprimable qui n’est ni un caract`re a e e d’espacement, ni une lettre ni un chiffre. int tolower(int c), int toupper(int c) si c est une lettre majuscule (resp. minuscule) rend la lettre minuscule (resp. majuscule) correspondante, sinon rend le caract`re c lui-mˆme. e e 8.4.5 Fonctions math´matiques : math.h e

double sin(double x) rend la valeur de sin x. double cos(double x) rend la valeur de cos x. double tan(double x) rend la valeur de tan x. double asin(double x) rend la valeur de arcsin x, dans − π , π . On doit avoir x ∈ [−1, 1]. 2 2 double acos(double x) rend la valeur de arccos x, dans [0, π]. On doit avoir x ∈ [−1, 1]. double atan(double x) rend la valeur de arctan x, dans − π , π . 2 2
v double atan2(double y, double x) rend la limite de la valeur de arctan u dans − π , π lorsque u → x+ 2 2 y et v → y. Pour x = 0 c’est la mˆme chose que arctan x e

double sinh(double x) rend la valeur du sinus hyperbolique de x, soit sh x = double cosh(double x) rend la valeur du cosinus hyperbolique de x, ch x = double tanh(double x) rend la valeur de la tangente hyperbolique de x, th double exp(double x) rend la valeur de l’exponentielle des, ex .

ex −e−x 2

ex +e−x 2 x = chx shx

e e double log(double x) rend la valeur du logarithme n´p´rien de x, log x. On doit avoir x > 0. double log10(double x) rend la valeur du logarithme d´cimal de x, log10 x. On doit avoir x > 0. e double pow(double x, double y) rend la valeur de xy . Il se produit une erreur si x = 0 et y = 0 ou si x < 0 et y n’est pas entier. √ double sqrt(double x) rend la valeur de x. On doit avoir x ≥ 0. double ceil(double x) rend la valeur du plus petit entier sup´rieur ou ´gal ` x, transform´ en double. e e a e double floor(double x) rend la valeur du plus grand entier inf´rieur ou ´gal ` x, transform´ en double. e e a e double fabs(double x) la valeur absolue de x. 8.4.6 Limites propres ` l’impl´mentation : limits.h, float.h a e

Ces fichiers en-tˆte d´finissent les tailles et les domaines de variation pour les types num´riques. On y trouve : e e e CHAR BIT nombre de bits par caract`re. e CHAR MAX, CHAR MIN valeurs extrˆmes d’un char. e SCHAR MAX, SCHAR MIN valeurs extrˆmes d’un signed char. e UCHAR MAX valeur maximum d’un unsigned char.
c H. Garreta, 1988-2006

121

8.4 La biblioth`que standard e

8

´ ´ AUTRES ELEMENTS DU LANGAGE C

SHRT MAX, SHRT MIN valeurs extrˆmes d’un short. e USHRT MAX valeur maximum d’un unsigned short. INT MAX, INT MIN valeurs extrˆmes d’un int. e UINT MAX valeur maximum d’un unsigned int. LONG MAX, LONG MIN valeurs extrˆmes d’un long. e ULONG MAX valeur maximum d’un unsigned long. Le fichier float.h d´finit : e FLT DIG pr´cision (nombre de chiffres d´cimaux de la mantisse). e e FLT EPSILON plus petit nombre e tel que 1.0 + e = 1.0. FLT MANT DIG nombre de chiffres de la mantisse. FLT MAX plus grand nombre repr´sentable. e FLT MAX 10 EXP plus grand n tel que 10n soit repr´sentable. e FLT MAX EXP plus grand exposant n tel que FLT RADIXn − 1 soit repr´sentable. e FLT MIN plus petit nombre positif repr´sentable (sous forme normalis´e). e e FLT MIN 10 EXP plus petit exposant n tel que 10n soit repr´sentable (sous forme normalis´e). e e FLT MIN EXP plus petit exposant n tel que FLT RADIXn soit repr´sentable (sous forme normalis´e). e e FLT RADIX base de la repr´sentation exponentielle. e FLT ROUNDS type de l’arrondi pour l’addition. Ces fichiers d´finissent ´galement les constantes analogues pour les double (noms en  DBL ...  ` la place e e a de  FLT ... ) et les long double (noms en  LDBL ... ).

122

c H. Garreta, 1988-2006

Index
() (op´rateur), 19 e * (op´rateur), 23 e *= (op´rateur), 32 e ++ (op´rateur), 22 e += (op´rateur), 32 e , (op´rateur), 33 e - (op´rateur), 23 e -= (op´rateur), 32 e ->(op´rateur), 21 e - - (op´rateur), 22 e . (op´rateur), 21 e /= (op´rateur), 32 e = (op´rateur), 31 e == (op´rateur), 28 e ? : (op´rateur), 31 e [ ] (op´rateur), 20 e %= (op´rateur), 32 e & (op´rateur), 24, 29 e &= (op´rateur), 32 e && (op´rateur), 30 e ^(op´rateur), 29 e ^= (op´rateur), 32 e ~(op´rateur), 22 e |(op´rateur), 29 e |= (op´rateur), 32 e ||(op´rateur), 30 e >(op´rateur), 28 e >= (op´rateur), 28 e >>(op´rateur), 28, 32 e <(op´rateur), 28 e <= (op´rateur), 28 e <<(op´rateur), 28 e <<= (op´rateur), 32 e abort, 119 abs, 120 acc`s ` un champ (op´rateur), 21 e a e acc`s relatif, 98 e acos, 121 adresse (op´rateur), 24 e adresse d’un objet, 24, 64 adresse d’une fonction, 77 affectation (op´rateur), 31 e appel de fonction, 19, 45, 47 argc, 112 argument formel, 12 arguments des fonctions (passage), 48 arguments en nombre variable, 50 arguments par adresse, 49 argv, 112 arithm´tique des adresses, 66 e arithm´tiques (op´rateurs), 27 e e asin, 121 assert, 117 assert.h, 117 atan, 121 atan2, 121 atof, 118 atoi, 118 atol, 118 automatique (variable), 13 bits (champs de bits), 56 bloc (instruction), 36, 37 break, 36, 42 bsearch, 120 calloc, 119 caract`re, 7 e case, 36, 41 cast (op´rateur), 25, 62 e ceil, 121 chaˆ de caract`res, 7, 53 ıne e chaˆ de caract`res (initialisation), 54 ıne e champs de bits, 56 char, 10 CHAR BIT, 121 CHAR MAX, 121 CHAR MIN, 121 close, 102 commentaire, 6 comparaison (op´rateur), 28 e compl´ment ` 1 (op´rateur), 22 e a e conditionnelle (compilation), 106 conjonction (op´rateur), 30 e conjonction bit-`-bit (op´rateur), 29 a e connecteurs logiques (op´rateurs), 30 e const, 15, 60 continue, 36, 42 conversion de type (op´rateur), 25, 62 e conversions arithm´tiques usuelles, 34 e cos, 121 cosh, 121 creat, 102 ctype.h, 121 d´calage de bits (op´rateur), 28 e e d´clarateur complexe, 58 e default, 36, 41 define, 105 disjonction (op´rateur), 30 e disjonction bit-`-bit (op´rateur), 29 a e do, 36, 39 dur´e de vie (d’une variable), 13 e effet de bord, 18 else, 38, 107 en-tˆte (fichier), 109 e endif, 107 enum´ration, 57 e etiquette, 38 exit, 119 EXIT FAILURE, 119 EXIT SUCCESS, 119 exp, 121 expression conditionnelle (op´rateur), 31 e extern, 16

INDEX

INDEX

externe (identificateur), 16 F, f (suffixe d’une constante), 7 fabs, 121 fclose, 87 feof, 87 ferror, 87 fflush, 86 fgetc, 88 fgetpos, 98 fgets, 89 fichier binaire, 85 fichier de texte, 85 FILE, 86 float.h, 121, 122 floor, 121 flots, 85 flottante (constante), 7 FLT DIG, 122 FLT EPSILON, 122 FLT MANT DIG, 122 FLT MAX, 122 FLT MAX 10 EXP, 122 FLT MAX EXP, 122 FLT MIN, 122 FLT MIN 10 EXP, 122 FLT MIN EXP, 122 FLT RADIX, 122 FLT ROUNDS, 122 fonction formelle, 78 fopen, 86 for, 36, 40 fprintf, 97 fputc, 90 fputs, 90 fread, 97 free, 119 fscanf, 97 fseek, 98 fsetpos, 98 fwrite, 97 getc, 89 getchar, 89 getenv, 120 gets, 89 globale (variable), 12 goto, 36, 38 hexad´cimale (´criture d’un nombre), 7 e e identificateur, 6 if, 36, 38, 107 ifdef, 107 ifndef, 107 include, 104 indexation (op´rateur), 20, 66 e indirection (op´rateur), 23 e initialisation d’un tableau, 52 initialisation d’une chaˆ de caract`res, 54 ıne e initialisation d’une structure, 56 initialisation d’une variable, 13 124

INT MAX, 122 INT MIN, 122 isalnum, 121 isalpha, 121 iscntrl, 121 isdigit, 121 isgraph, 121 islower, 121 isprint, 121 ispunct, 121 isspace, 121 isupper, 121 jmp buf, 114 L, l (suffixe d’une constante), 7 labs, 120 limits.h, 121 locale (variable), 12 log, 121 log10, 121 logiques (op´rateurs), 30 e LONG MAX, 122 LONG MIN, 122 longjmp, 114 lseek, 103 lvalue, 18 macros, 105 main, 112 malloc, 119 math.h, 121 memcpy, 120 memmove, 120 moins unaire (op´rateur), 23 e mot-cl´, 6 e n´gation (op´rateur), 22 e e NDEBUG, 117 nombre entier, 7, 9 nombre flottant, 7, 11 NULL, 66 O RDONLY, 102 O RDWR, 102 O WRONLY, 102 octale (´criture d’un nombre), 7 e op´rateur, 6 e open, 102 ordre d’´valuation des expressions, 34 e ou exclusif bit-`-bit (op´rateur), 29 a e passage des arguments des fonctions, 48 pointeur, 64 post-decr´mentation (op´rateur), 22 e e post-incr´mentation (op´rateur), 22 e e pow, 121 pr´-decr´mentation (op´rateur), 22 e e e pr´-incr´mentation (op´rateur), 22 e e e pr´processeur, 104 e printf, 90, 97 priorit´ des op´rateurs, 19 e e
c H. Garreta, 1988-2006

INDEX

INDEX

priv´ (dentificateur), 15 e prototype d’une fonction, 44 public (dentificateur), 15 putc, 90 putchar, 90 puts, 90 qsort, 78, 120 rand, 118 read, 102 realloc, 119 register, 14 return, 36, 43 rewind, 98 rvalue, 18 s´quence d’´chappement, 7 e e scanf, 93, 97 SCHAR MAX, 121 SCHAR MIN, 121 SEEK CUR, 98 SEEK END, 98 SEEK SET, 98 setjmp, 114 setjmp.h, 114 setvbuf, 87 SHRT MAX, 122 SHRT MIN, 122 signal, 115 signal.h, 115 sin, 121 sinh, 121 sizeof, 24 sprintf, 97 sqrt, 121 srand, 118 sscanf, 97 static, 14 statique (variable), 14 stderr, 88 stdin, 88 stdio.h, 86 stdlib.h, 118 stdout, 88 strcat, 120 strcmp, 120 strcpy, 120 string.h, 120 strlen, 120 struct, 54 structure (d´claration), 54 e structure (initialisation), 56 structure (signification d’une variable structure), 55 structures r´cursives, 81, 83 e switch, 36, 41 system, 119 tableau tableau tableau tableau (d´claration), 52 e (initialisation), 52 (signification d’une variable tableau), 52 [dynamique] multidimensionnel, 69

tableau de chaˆ ınes de caract`res, 72 e tableau de fonctions, 79 tableau dynamique, 68 taille d’un objet (op´rateur), 24 e tampon (d’entr´e ou de sortie), 85 e tan, 121 tanh, 121 tmpfile, 87 tolower, 121 typ´ ´num´r´, 57 ee e e type ´num´r´, 11 e e e typedef, 61 types, 9 types d´sincarn´s, 62 e e U, u (suffixe d’une constante), 7 UCHAR MAX, 121 UINT MAX, 122 ULONG MAX, 122 ungetc, 90 union, 56 USHRT MAX, 122 variable, 11 virgule (op´rateur), 33 e void, 45 void *, 65 volatile, 15, 60 while, 36, 39 write, 102

c H. Garreta, 1988-2006

125