You are on page 1of 7

SECTION M.R.I.M. - L.P.

CHATEAU-BLANC 45120 CHALETTE SUR LOING

LES SYSTMES DE FICHIERS

Table des matires :


Supports physiques (mdia)
Les fs supports par MS-Windows
Principe de la table d'allocation Ex. de FAT12
Les fs supports par Linux
Performance, fiabilit
Les outils de maintenance
Annexes

Auteur : Christophe VARDON professeur STI, formateur IUFM-TICE - 2005-2006

LES SYSTMES DE FICHIERS


Les systmes de fichiers sont des entits virtuelles qui permettent l'enregistrement, la lecture ou la
suppression des fichiers sur un support de donnes.
Un systme de fichier (fs) se distingue par :

son support physique (mdia)


sa mthode d'accs
accs squentiel
accs alatoire

Supports physiques (mdia)


Ils sont extrmement divers : bande magntique (DAT....), disque magntique rigide (disque dur), disque
optique (CD-ROM, DVD, ...), mmoires semi-conducteur (cls USB, cartes SD, etc...)
Accs squentiel
Ex : bande magntique.
Les fichiers sont enregistrs (et lus..) les uns la suite des autres; pour retrouver un fichier, il faut parcourir la
bande depuis le dbut.
Adapt aux sauvegardes journalires (backup), aux gros fichiers.
Accs alatoire
Ex : disque dur
On peut accder immdiatement et indpendamment toutes les parties du disques, donc n'importe quel
fichier, quelque soit sa position sur le disque.
L'adressage peut tre intrinsque (cas d'accs direct un matriel lectronique : sous UNIX, tout est fichiers , y
compris les ports I/O...). Dans tous les autres cas, une table d'indexation de ce genre est nccessaire :

Table d'indexage
Nom de fichier

Position sur le disque

Fichier n1

137

Fichier n2

1045

....

...

Remarques : pour que cela soit possible, la structure physique du mdia doit permettre un 'dcoupage' en n
secteurs de la totalit de sa surface d'enregistrement, que l'on pourra donc numroter. Pour cela, certains
mdium nccessitent un formatage dit de bas niveau .
Comment les fs sont grs
Les systmes de fichiers sont grs par le (noyau du) systme d'exploitation.

Les fs supports par MS-Windows


FAT12 (disquettes 3''1/2), FAT16, FAT32, NTFS

Systme d'exploitation
Dos
Windows 95
Windows 95 OSR2
Windows 98
Windows NT4
Windows 2000/XP

Systme de fichiers supports


FAT12, FAT16
FAT12, FAT16
FAT12, FAT16, FAT32
FAT12, FAT16, FAT32
FAT12, NTFS (version 4)
FAT12, FAT16, FAT32, NTFS (versions 4 et 5)

Principe de la table d'allocation Ex. de FAT12


On cre une table d'indexage au dbut du mdia
nom du fichier n1 -> 345
nom du fichier n1 -> 2037
.....
le chiffre indique la position du fichier sur la disquette
le systme FAT12 utilise des nombres de 12 bits pour dsigner la position du fichier; on a donc au maximum
2^12= 4096 positions indexes, c'est--dire au maximum 4096 fichiers sur ce mdia; la taille de "l'unit
d'allocation" ou "cluster" sera de : taille du mdia/ 4096
Exemple :
Soit une disquette de 1.44 Mo, la taille de l'untit d'allocation sera de (1.44x1048576)/4096 =

368 octets min.

On ne peut bien entendu pas mettre 2 fichiers diffrents dans la mme UA, car on ne pourrait pas savoir ou fini
l'un et ou commence l'autre !
Si donc, j'crit un fichier de 30 octets sur la disquette, je vais devoir lui rserver une UA, c'est--dire 368 octets;
il y aura donc 368-30 = 338 octets de perdus !
Pour avoir le moins d'espace perdu, il faut avoir les UA les plus petites possibles, donc utiliser plus de bits pour
coder la position (index) du fichier; par exemple, la FAT16 utilise 16 bits, soit 2^16=65500 index possibles.
Sur une disquette, en FAT16, la taille de l'UA serait de (1.44x1048576)/65500 = 16 octets! notre fichier de 30
octets utiliserait 2 UA; l'espace perdu ne serait plus que de 32-30 = 2 octets!
En systme FAT32, on a 2^32, soit plus de 4 milliards d'index possibles, ce qui est suffisant pour avoir des UA
de taille raisonnable mme avec de gros disques durs. Exemple : Soit un disque de 100Go, la taille minimum
thorique de l'UA en FAT32 serait de (100x1073741824)/2^32 = 0,25 octets... Il est donc inutile d'utiliser tous
les 32 bits! En ralit, on utilise que 28 bits, et les 4 bits restant ont une autre utilisation.
On peut modifier la taille des UA du disque dur l'aide d'un logiciel comme Partition Magic, par exemple.
Remarque : une description plus exhaustive des systmes FAT16/32 est disponible en annexe

Les fs supports par Linux


- par dfaut, la plupart des noyaux supportent Ext2, Ext3, Swap, FAT32, intgrs la compilation.
- optionnel : on peut charger des pilotes de fs la demande , dclars dans le noyau en tant que modules.
- FUSE : ce systme innovant permet l'utilisateur final de charger un pilote de fs comme un simple logiciel;
cette techologie permettra d'inclure virtuellement tout type d'appareillage lectronique dans l'arborescence
classique, vitant le dveloppement de soft d'exploitation spcifique (ex : instrumentation, domotique, etc...)
- limitations sur NTFS : pour le moment NTFS est accessible de manire fiable en lecture (pas en criture)

Systmes de fichiers supports par Linux


Linux Natif
Microsoft Windows
MacOS
OS/2
SGI IRIX
FreeBSD, OpenBSD
Sun Solaris
IBM AIX
Autres

Ext2, Ext3, ReiserFS, Linux Swap


FAT12, FAT16, FAT32, NTFS
HFS (Hierarchical File System), MFS (Macintosh File System)
HPFS (High Performance File System)
XFS
UFS (Unix File System)
UFS (Unix File System)
JFS (Journaled File System)
De nombreux systmes...

Performance, fiabilit
On prend en compte :
la rapidit d'accs aux fichiers
le nombre de fichiers ouverts simultanment
la tolrance aux pannes
Diffrents types de pannes

Panne matrielle
exemple : choc de la tte de lecture contre le disque lors d'une panne lectrique; usure, temprature
excessive... avec pour rsultat une surface de disque partiellement abime. Il est alors possible de
fonctionner en dclarant les secteurs dfectueux ( condition qu'ils ne soient pas placs en dbut de
disque...).

Problme logiciel
de formatage ou de partionnement.

Les causes de dfaillance


Panne d'alimentation lectrique
Anomalies dans certains logiciels qui accdent au matriel (bas niveau; ex : mulateurs de lecteur cd-rom)
Incompatibilit entre 2 logiciels de redimentionnement de partitions (problme de frontire )
Panne du controleur IDE
etc...

Les outils de maintenance


Faire une recherche sur Internet pour dterminer les caractristiques des outils de rcupration suivants :
EasyRecovery
GetDataBack
Testdisk
Encase5

Pour chacun vous indiquerez :


nom de le l'diteur
type de licence
prix
fonctionnalits
avis des utilisateurs

Pourquoi des fichiers perdus ?


Les pertes de fichiers se produisent quand un fichier a t supprim volontairement ou involontairement de
la FAT (mettre la corbeille ne fait que le marquer) : si, de plus, un autre fichier a t enregistr et r-occupe
un ou plusieurs des cluster de cet ancien fichier, il y a erreur de chanage. Les erreurs de chanage des
fichiers se produisent souvent aussi quand lordinateur est ramorc alors quil tait en train denregistrer des
fichiers.
Les erreurs de chanage sont de deux sortes :

Le groupes perdus dsigne un chanage indispensable, qui est perdu parce qu'un maillon manque
(chaine brise )
Le rfrences croiss dsigne un chanage erron, qui renvoie vers des fragments appartenant
un autre fichier (chaines emmles ).

Rcupration de fichiers perdus :


Des logiciels utilisent des algorithmes complexes pour tenter de retrouver les liens entre les clusters en lisant
la totalit du disque et ainsi reconstituer le fichier. Cette opration de rcupration est trs longue et n'est
jamais fiable 100%.
Fichiers irrcuprables :
Dans les cas suivants : 1) Si de nombreuses oprations ont t faites depuis le suppression du fichier et que
beaucoup de clusters sont crass. 2) Si Un logiciel de suppression spcialis a cras chaque cluster du
fichier. Cela est ventuellement fait plusieurs fois afin de supprimer toute persistance magntique, mais il
peut subister des informations de bord de pistes induites par une micro-oscillation de la tte de lecturecriture. 3) Le contenu du disque complet peut auusi tre effac par dgausseur produisant un champ
magntique gal 5 fois sa coercivit.
Fragments : on parle de fragment quand le contenu du cluster relatif l'ancien fichier n'a t que
partiellement cras.
Aspects juridiques : La destruction volontaire de donnes appartenant un tiers est condamn en France
par larticle 323-3 du code pnal

ANNEXE 1 : File Allocation Table 12/16/32 FAT12, FAT16 et FAT32


Principe
La Table dAllocation de Fichiers est une liste de valeurs numriques permettant de dcrire lallocation des
clusters dune partition un fichier de donnes. La table dallocation est en fait un tableau dont chaque cellule
correspond un cluster. Chaque cellule contient un chiffre qui permet de savoir si le cluster quelle reprsente
est utilis par un fichier, et, le cas chant, indique lemplacement du prochain cluster que le fichier occupe, le
fichier pouvant tre fragment. On obtient donc une chane FAT, cest--dire une liste chaine de rfrences
pointant vers les diffrents clusters successifs, jusquau cluster de fin de fichier. Chaque entre de la FAT a
une longueur de 16 ou 32 bits (selon quil sagit dune FAT16 ou dune FAT32).
La FAT rfrence le nom du fichier, sa taille, ses attributs, sa place dans larborescence du disque et ladresse
de la premire unit dallocation qui le compose.
Valeurs de clusters spcifiques : les clusters peuvent avoir trois tats principaux (disponible, rserv ou
dfectueux); la valeur 0000 indique que le cluster nest pas utilis, FFF7 permet de marquer le cluster comme
dfectueux, et les valeurs comprises entre FFF8 et FFFF spcifient que le cluster contient la fin dun fichier.
Taille des clusters, taille des fichiers, et taille totale du disque.
Dans la FAT16, 16 bits sont utiliss pour l'adressage des clusters, soit 2^16 = 65536 clusters max.
La taille maximum du disque avec des clusters de 32 ko est donc de 32x1024x65536 = 2 Go. La taille
maximale d'un fichier est de 2 Go.
Dans la FAT32, 28 bits sont utiliss pour l'adressage des clusters, soit 2^28 = 268435456 clusters max.
Ceci devrait permettre l'utilisation de disques de plusieurs centaines de Go, mais le systme est
brid 32 Go cause des caractristiques physiques du matriel (BIOS+ standard ATA-2). La taille
maximale d'un fichier est de 4 Go.
Scurit problmes spcifiques
Chaque partition contient deux copies de la FAT, stockes de manire contigu sur le disque, afin de pouvoir la
reconstituer en cas de corruption.
Les erreurs de chanage des fichiers se produisent souvent quand lordinateur est ramorc alors quil tait en
train denregistrer des fichiers.
Les erreurs de chanage sont de deux sortes :

Le groupes perdus dsigne un chanage indispensable, qui nest plus rfrenc dans la FAT (chaine
brise )
Le rfrences croiss dsigne un chanage erron, qui renvoie vers des fragments appartenant un
autre fichier (chaines emmles ).

Le systme consomme peu de ressources systme; il est rput provoquer une fragmentation importante des
fichiers.
Historique
FAT 12:
1976: fut pour la premire fois utilise sur les disquettes 180 Ko. Les noms de fichiers comportent au maximum
8 caractres, et les extensions de fichiers 3 caractres.

ANNEXE 2 : Master File Table NTFS

Ce systme de fichiers 32 bits a pour la premire fois t introduit en 1994 par Windows NT 4.0 (NTFS v4.0) et
plus tard par Windows 2000 (NTFS v5.0)
Le systme de fichiers NTFS (New Technology File System) utilise un systme bas sur une structure appele
table de fichiers matre , ou MFT (Master File Table), permettant de contenir des informations dtailles sur
les fichiers. Les changements par rapport la FAT32 sont :
il est sensible la casse, cest--dire quil diffrencie les caractres majuscules et minuscules.
laccs aux fichiers sur une partition NTFS est plus rapide
La limite thorique de la taille dune partition est de 17 milliards de To, mais en pratique 2To (matriel)
il permet de dfinir des attributs de scurit pour chaque fichier (gestion des droits) :
(R= Read) lecture; (W= Write) criture;
(X= Execute) excution;(D= Delete) suppression ;
(P= Permission) droits;(O= Ownership) appartenance;
(C= Compressed) compress
Support des quotas disque
L'organisation de la MFT est la suivante :

Un Small File record est crit entirement dans le MFT; il contient les informations suivantes :

Standart information
File name
Security descriptor
Data or index