You are on page 1of 3

1.

Introduction

Coder du texte

Nous avons tous un jour reçu un courriel bizarre ou lu une page web telle que celle-ci :
Elle leva les yeux, mais tout était noir au-dessus de sa tête. Devant
elle s’étendait un autre couloir où elle vit le Lapin Blanc en train
de courir à toute vitesse.
Nous allons essayer de comprendre pourquoi on comprend à peu près ce texte mais pas complètement...

2. Un premier codage

Pour représenter des caractères, il suffit d'attribuer un nombres à
chacun d'eux.
Le code ASCII (American Standard Code for Information
Interchange), par exemple, se base sur un tableau contenant les
caractères les plus utilisés en langue anglaise : les
lettres de l’alphabet en majuscule, en minuscule , les dix chiffres
arabes, des signes de ponctuation , quelques symboles et certains
caractères spéciaux invisibles.

Remarque
Les créateurs de ce code limitèrent le nombre de ses caractères à 128, c’est-à-dire 2 7 , pour qu’ils puissent être
codés avec seulement 7 bits. Les ordinateurs utilisaient des cases mémoires de un octet, mais ils réservaient
toujours le 8e bit pour le contrôle de parité (c’est une sécurité pour éviter les erreurs, qui étaient très fréquentes
dans les premières mémoires électroniques).
Exercice 2.1
Trouver le texte représenté en ASCII binaire par la suite de bits
0111010001110010011011110111000000100000011001100110111101110010011101000000110100001010

Exercice 2.2
Quelle est la taille (en octets) de la phrase : Bravo ! Tu as tout compris. (attention, il faut compter les espaces,
et signes de ponctuation…) ?
Vérifier en tapant cette phrase avec un éditeur de texte quelconque comme le bloc-notes de Windows.
Écrire la même chose dans un logiciel de traitement de texte (comme LibreOffice Writer ou Microsoft Word)
Quelle est la taille du fichier? Quelle peut en être l’explication ?
Exercice 2.3
Peut-on coder en binaire la phrase « Es-tu là ?» à l’aide de la table ASCII ? Justifier.

3. cette norme est utilisée par de nombreux systèmes d’exploitation.. Elle a donné lieu à quelques extensions et adaptations. On a donc trouvé une astuce: l'UTF-8. si on prend un texte en français. . Les mémoires devenant plus fiables. Ce standard se développe de plus en plus. thaï. le 8ième bit a pu être utilisé pour coder plus de caractères. arméniens. Autrement dit. Seuls quelques rares caractères nécessitent l'Unicode. la grande majorité des caractères utilisent seulement le code ASCII. la ligature œ n’y figure pas). UTF-8 Généralement en Unicode.. Cette norme ISO 8859–1 permet de coder 191 caractères de l’alphabet latin qui avaient à l’époque été jugés essentiels dans l’écriture. Exercice 4. il utilise des codes de valeur bien plus grandes. et dès qu'on a besoin d'un caractère appartenant à l'Unicode. C’est source de grande confusion pour les développeurs de programmes informatiques car un même caractère peut être codé différemment suivant la norme utilisée.1 Télécharger le fichier web. Même si l’Unicode est bien conçu. mais omet quelques caractères fort utiles (ainsi. Les langages Java.. D'ailleurs l'UTF-8 a été adopté comme norme pour l'encodage des fichiers XML. 4. La plupart des systèmes d'exploitation (Windows.) supportent déjà l'Unicode. Un peu d'ordre : Unicode et UTF-8 Unicode Au lieu d'utiliser seulement les codes 0 à 127. hébreux. un caractères prend 2 octets. hiragana. il reste assez peu utilisé par rapport à l'ASCII.1 Combien de caractère peut-on coder en plus en utilisant le 8ième bit ? La norme ISO 8859–1 appelée aussi Latin-1 ou Europe occidentale est la première partie d’une norme plus complète appelée ISO 8859 (qui comprend 16 parties) et qui permet de coder tous les caractères des langues européennes. le caractère suivant est en Unicode". katakana. De plus. Linux. De nouveaux codes sont régulièrement attribués pour de nouveaux caractères: caractères latins (accentués ou non). La plupart des navigateurs récents supportent également l'UTF-8 et le détectent automatiquement dans les pages HTML. cyrillics. L'UTF-8 rassemble le meilleur de deux mondes: l'efficacité de l'ASCII et l'étendue de l'Unicode.. L'alphabet Chinois Kanji comporte à lui seul 6879 caractères. le moindre texte prend deux fois plus de place qu'en ASCII. grecs. MacOS X. Il va donc falloir étendre la table ASCII pour pouvoir coder les nouveaux caractères. Exercice 3. Dans les pays occidentaux.html. on utilise un caractère spécial signalant "attention. Un texte en UTF-8 est simple: il est partout en ASCII. dont Windows-12527 (appelée ANSI) et ISO 8859-158 (qui prend en compte le symbole € créé après la norme ISO 8859-1).Net (C#) et Python supportent déjà nativement l’Unicode. dont Linux et Windows. Quel est l'encodage utilisé pour coder le texte ? . Encore un codage Vous avez remarqué : Il n'y a aucun caractère accentué ! Les américains nous ont oublié. Le code UNICODE permet de représenter tous les caractères spécifiques aux différentes langues.

des images…) et une feuille de style css (titres. Les pages HTML sont de simples fichiers textes pouvant être lus directement à l'aide d'un éditeur de texte. On peut jouer sur la police de caractères – Times. etc. fichier css. grâce au symbole retour chariot. Quelle est la couleur du fond du titre h1 ? Mini-projet Ce travail doit être réalisé par groupes de 2 ou 3 élèves. L'ensemble des documents utilisés (page html. –. Réaliser une page de présentation de l’option ISN comprenant des liens hypertextes internes (ancres) et externes à la page (programmes. Il permet la création de documents structurés. sur leur forme – romain.…). on peut souhaiter lui donner une forme spéciale. Il facilite notamment la création d'hyperliens (liens vers une autre page web ou une autre partie de la même page web). Du texte enrichi : le html Quand on écrit un texte. comment insérer une image et comment créer un lien vers une page. polices. HTML en abrégé. leur graisse – maigre. plus jolie. Or.1 En regardant le code source de la page web. . la mise en forme est définie dans le fichier au format CSS. sur la taille des caractères – 11 points. La plupart des balises ont une partie ouvrante <mabalise> et une partie fermante </mabalise>. une modification dans la feuille de styles sera répercutée dans toutes les pages web appelant cette feuille. italique. Les balises HTML sont toutes délimitées par les caractères < et >.2 Dans ce texte.fr L'évaluation de votre travail prendra en compte la validité W3C de la page web. Les traitements de texte sont les logiciels qui permettent ces mises en pages plus élaborées.html téléchargée précédemment. –. comment indique t-on à la page que l'on veut utiliser une feuille de style ? Télécharger la. 12 points. par exemple. etc. l'insertion d'images et beaucoup d'autres choses. modalités d’examen. images. Exercice 5. Ces balises sont interprétées par le navigateur internet qui produit à l'affichage la page web avec sa mise en forme. qui est utilisé en particulier pour écrire des pages web est appelé le format HTML. gras. font de page. etc. L'Hypertext Markup Language. les seules caractéristiques que l’on puisse exprimer avec un code comme l’ASCII. Cliquer <a href="http://grosse-arnaque. L’un de ces formats enrichis. • Pour modifier un style. vers quel site web pointe le lien ? Comment ce texte s’affiche-t-il dans un navigateur ? Votre compte bancaire présente une anomalie. expliquer comment mettre de texte en gras. en italique. Le contenu est fourni par le fichier au format HTML . –. Une page HTML peut théoriquement être affichée sous tout système d'exploitation et tout navigateur avec le même aspect final. Plusieurs avantages à cette technique : • La même mise en forme peut être automatiquement appliquée à plusieurs pages HTML : une même feuille de styles peut être appelée par autant de page HTML que souhaité. Feuille de style L'utilisation de feuilles de style au format CSS repose sur l'idée de séparation du contenu et de la mise en forme. sont la casse d’une lettre – minuscule ou majuscule – et le découpage en paragraphes.5. …) sera rassemblé dans un fichier compressé et envoyé par mail: ameistermann@ac-montpellier. plus lisible. Cette page est destinée à être consultée par les élèves de 1èreS pour les informer quant à leur choix de spécialité en terminale. Tous les enrichissements sont symbolisés par un système de balisage à l'intérieur du texte. On peut aussi souhaiter découper un texte en chapitres et mettre en valeur les titres des chapitres. etc. Exercice 5. est un langage de description destiné à représenter des pages web. l'utilisation de textes enrichis.com">ici</a> pour avoir de l'aide. etc.3 En regardant le code source de la page web2. Ceci a amené à enrichir les formats existants. liens.html. Courier. couleurs. Exercice 5.