You are on page 1of 4

SECONDE SNT 3

CHAPITRE 01 – Les données structurées Cours 3 - Qu'est-ce qu'une donnée structurée ?

Problématique : Comment peut-on organiser les données numériques brutes pour les
exploiter (par des tables de données et des formats de lecture et d'enregistrement) et
comment peut-on les stocker (en particulier aujourd'hui dans le cloud).

Un professeur demande à ses élèves de différentes classes de faire des devoirs à la Définition :Une donnée est une
maison. Il les récupère, les corrige et les note. Il se retrouve avec plein de valeur (ou une information) se
«données» : des classes, des noms (ou prénoms ), des notes. Ces «données», il va rapportant à un objet .
chercher à les «exploiter» (faire des tableaux de notes pour une classe, regrouper les
informations concernant un seul élève, faire des moyennes par élève ou par Définition :Une donnée est
classe...). Avant, il avait un cahier (de notes) qui organisait déjà ces données avec structurée est une donnée
une table par classe mais maintenant il est possible de «traiter» ces données compréhensible par une
numériquement. Mais il va falloir les «structurer» pour les rendre lisibles et machine numérique (un
exploitables par une «machine» ( un ordi et des programmes de traitement de ordinateur le plus souvent). Elle
données). Les entreprises , les administrations disposent de masses colossales de s'exprime dans différents
données. Pensez simplement au lycée qui a collecté cette année (et tous les jours en formats d'écriture et
fait) une grande quantité de données sur ses élèves et son personnel. d'enregistrement(.csv...)
Voici une liste de données sur des élèves et qui concerne les résultats aux deux devoirs du trimestre 1
Paul, seconde 5, 10 au devoir 1, 8 au devoir 2, Sofia, seconde 5, 14 au devoir 1, 14 au devoir 2, Antoine, seconde
7, 17 au devoir 1, 18 au devoir 2, Léa, seconde 7, 20 au devoir 1, 18 au devoir 2
 Ajoutez (et imaginez) deux séries de données pour deux autres élèves .

Vous disposez maintenant d'une liste de 24 données brutes (= non-structurées)


Point 1 – Les tables de La manière la plus simple de représenter les données brutes, c’est de faire un
données tableau ( on dira une table de données) . Le faire réaliser par un programme
serait bien mais pour cela il faut «structurer» les données c'est à dire les écrire
d'une certaine manière (selon un «format») qu'il va pouvoir lire.
Voici un exemple simple de table de donnée Voici un langage ou format qui permet à certains logiciels (un
«tableur» ici) de construire ce type de tableau avec les données.
Prénom ;Nom ;Age
Antoine ;Ledoux ;15
Pauline ;Darcis ;16
karim ;Chanhoun ;15
Sarah ; Goldberg ;14
Ce format d'écriture s'appelle le format CSV (Comma-Separated
Values). Il sépare les données par des points virgules.

Il y a un vocabulaire pour décrire les éléments d'une table de données

Un tableau ou table de données décrit une collection de données. La première ligne décrit les propriétés des éléments
de la table. Ce sont les descripteurs de la table (on dit aussi les champs). Les lignes suivantes sont appelées les objets
de la table et elles contiennent pour chaque case les données ( ou valeurs) .

 Dans la liste d’élèves et de notes du début, combien il y a  Dans la table en dessus, combien il y a
- de descripteurs ? (lesquels) - de descripteurs ?(lesquels)
- d'objets ? - d'objets ?

-de données ? -de données ?


Point 2 – Les formats des données structurées
Un format (de données ou de fichier de Les données peuvent être de nature très différentes : des textes, des
données) est une manière de représenter sons , des images, des vidéos…..il y a donc beaucoup de formats voire
ou d'écrire les données dans un fichier. de catégories de formats. Le format retenu par l’auteur d'un fichier se
Ces données seront ainsi lisibles par un représente par une extension de type « . sigle » qui suit le nom du
logiciel. fichier comme par exemple « monfichier.txt ». Vous en connaissez
sûrement un certain nombre...
Vous avez des données brutes sur 6 élèves, vous allez les structurer sous format CSV. Format de données
exploitables par les tableurs usuels (Excel ou Calc de libre office )
Pour écrire les données au format  Combien vous faut-il de descripteurs ?
CSV on écrit les noms des Donnez des noms à ces descripteurs
descripteurs sur une 1ère ligne -
(séparés par des virgules ou des -
points virgules) puis sur les -
lignes suivantes sont placés pour -
chaque objet, les valeurs ou  Écrire -ci-dessous- le script des données sous le format Csv
données dans l'ordre des (Utilisez le copier-coller sur ce qui est déjà écrit plus haut et utilisez des points
descripteurs. Les valeurs sont virgules pour séparer )
séparées par des virgules
(syntaxe anglo-saxonne) ou des
points virgules (syntaxe
française).

Vous avez écrit en CSV mais vous êtes dans un fichier de traitement de texte. Il faut donc réécrire votre
production CSV et l'enregistrer, toute seule, dans un fichier de ce format (avec cette extension : «.csv» )
 Donc vous allez - Ouvrir l'application «bloc note» (un petit logiciel de traitement de texte qui doit être
dans les «accessoires» de Windows )
- Copiez-collez votre script (et éventuellement corrigez-le )
- Enregistrez-le sous le nom «resultats.csv» et n'oubliez pas d'écrire explicitement
l'extension.csv. car Bloc Note va vous proposer d'office un format d'enregistrement de
type .txt car c'est un traitement de texte et il suppose donc a priori que c'est ce format
que vous voulez.
- Ouvrez maintenant ce fichier avec un tableur (Calc de préférence ou Excel) et
regardez ce qui se passe ….
Vous avez produit des données structurées mais aussi commencé à «traiter» ces données structurées en faisant
apparaître une table de données. Dans une autre activité, on va faire des « opérations » sur une table (avec un
tableur): trier les descripteurs ou les objets, faire des opérations sur les données, des calculs ou des graphes si elles
sont des chiffres...
Cours sur les formats
Doc 1 – Quelques formats de données plus ou Doc 2 – Un cas particulier : les formats libres ou
moins connus ... ouverts (qui favorisent l'interopérabilité des fichiers)

PDF ( de l’entreprise Adobe) et .doc (de Microsoft) ne


sont pas des formats libres. On ne peut pas les lire avec
tous les types de logiciels de traitement de données (ici
des traitements de texte). Par contre CSV est un format
libre ou ouvert .

 Quels sont les formats de fichiers que vous


connaissez ? De quels genres sont les données qu’ils
décrivent ? (texte, son,vidéos…)
Décrivons un peu la forme des formats de tables de données (CSV, JSON , XML)
Pour mémoriser les tables dans un ordinateur ou bien pour directement proposer des données pour les faire
apparaître sous forme de tables (avec un tableur), on les écrit avec différents formats dont le rôle est de préciser
comment sont organisées les différentes lignes (= objets de la table) et colonnes (= descripteurs de la table ).
Plusieurs formats sont couramment utilisés
Le format CSV (Comma Separated Values) dans lequel
chaque ligne contient des valeurs séparées par des symboles
de ponctuations soit des virgules soit des points virgules. La
première ligne contenant les noms des descripteurs (ou
« champs »)

Le format JSON (JavaScript Object Notation)est format de


données présentées en paire descripteur/valeur (exemple :
prénom et Antoine).
Les descripteurs et les valeurs sont séparés par deux points
et chaque paire est séparée de la suivante par une virgule.
Chaque objet décrit (= ligne du tableau ) est présentée
comme une liste de paires descripteur/valeur le tout entre des
parenthèse .

Le format XML (Extensible Markup Language) qui lui


contient des jeux de balises (=markup) qui décrivent les
valeurs des descripteurs.

Nous n'utiliserons surtout le format CSV. Et il faut faire attention au fait que la virgule est le séparateur standard pour
les données anglo-saxonnes, mais pas pour les données aux normes françaises puisque, en français, la virgule est le
séparateur des chiffres décimaux ( = "nombres à virgule"). C’est pourquoi on utilise un autre séparateur : le point-
virgule (;). Dans certains cas, le fait d'avoir comme séparateur une virgule ou un point-virgule peut engendrer quelques
problèmes. Il faut donc être vigilant sur le type de séparateur utilisé. Un tableur tel que "Calc" (de Libre Office) est
capable de lire sans défaut les fichiers au format CSV mais d'autres tableurs (comme Excel) gèrent moins bien le
séparateur CSV "point-virgule".

Exercice(1) sur les formats


On a enregistré les données d’un répertoire
téléphonique au format JSON
 Quels sont les descripteurs du répertoire
téléphonique ?

 Quelles sont les différentes valeurs du


descripteur « nom » ?

 Écrire en format CSV les données précédentes


Exercice(2) : L'open data («données ouvertes») correspond à une volonté d'ouvrir les données jugées d'intérêt
public afin d'encourager leur réutilisation par tout un chacun. Cela permet d'encourager la transparence
démocratique, de bénéficier de services au quotidien ou de prendre des décisions plus éclairées. L'État français
rend publique les données qu'il a développé dans le cadre de ses missions et qu'il juge non sensibles à l'adresse
suivante : https://www.data.gouv.fr.

1. Aller sur ce site des données publiques de l'État français et dans le moteur de recherche tapez le mot
secours afin d'obtenir la dernière table de données sur les "Interventions réalisées par les services
d'incendie et de secours".
2. Télécharger le fichier le plus récent (au format CSV)
3. Ouvrir ce fichier avec Calc de LibreOffice.
Une fenêtre de prévisualisation s'ouvre si l'extrait de tableau – en bas- n'est pas lisible , changez le jeu de
caractères en passant à "Latin 3 (ISO-8859-3)". (premier menu déroulant). Vérifier si les séparateurs
( virgule et point virgule) sont cochés . Si vous les décochez vous pouvez voir l'effet sur la lecture des
données.
Vous devez voir apparaître au final dans Calc, quelque chose de proche de cela :

 Vous pouvez compter les descripteurs (colonnes), Autre exemple pour ceux qui aime plutôt le football..
les objets (lignes) et les données de cette collection.
https://www.data.gouv.fr/fr/datasets/histoire-de-
lequipe-de-france-de-football/#

Nous utiliserons plus loin ce fichier. Il peut donc être


utile de l'enregistrer dans le dossier chapitre 1. Pareil
pour le suivant.

Exercice complémentaire : le stockage des données (dans le cloud)


Voir manuel pp22-23 Définir ce type de stockage de données puis à partir de recherches (en
ligne) composez une synthèse sur un des thèmes suivants
– l’évolution des usages du cloud
– le cloud gaming
– les enjeux écologiques du cloud
– la sécurité des données sur le cloud
– ...

You might also like