Professional Documents
Culture Documents
: un décalogue
Au début des années 1970, deux linguistes – les signataires de ces lignes – furent
nommés au CNRS et affectés au Centre d’analyse des Manuscrits Modernes », équipe
qui a précédé l’actuel « Institut des Textes et Manuscrits Modernes ». Qu’est-ce qui a pu
motiver cette décision institutionnelle ? C’était l’époque glorieuse de la linguistique
science pilote pour les sciences humaines ; on était encore dans le sillage des deux
Colloques de Cluny sur « Linguistique et Littérature » (1968 et 1970). Fidèles à cette
logique, les littéraires qui avaient commencé à s’intéresser aux manuscrits souhaitaient,
tout simplement, que les linguistes leur fournissent une méthode d’approche scientifique
pour le traitement des brouillons d’écrivains. Comment avons-nous répondu à ce défi ?
Les difficultés étaient de plusieurs ordres, toutes liées à la matière verbale spécifique de
ces « avant-textes »1 qui nous étaient proposés pour analyse.
En plus, on ne pouvait pas ne pas prendre en considération l’instance de celui qui est à
la source d’un texte littéraire : l’écrivain, l’auteur, le locuteur, le sujet parlant, le sujet
écrivant, … Comment fallait-il définir cette instance, notamment à un moment
historique où des théoriciens comme Foucault et Barthes avaient proclamé la mort de
l’auteur ? Parallèlement à cette déconstruction du concept d’auteur et à la
complexification de la notion de sujet (sujet grammatical, sujet parlant, sujet de
l’inconscient, sujet de l’énonciation), il fallait également prendre position par rapport à
des notions strictement linguistiques comme « locuteur » et « énonciateur ».
Comme nous l’avons noté plus haut, la grammaire générative laisse hors de son champ
les phénomènes de la performance, en particulier celui du locuteur réel. À son tour, la
pragmatique, même si elle prétend s’intéresser au discours, nous semblait postuler
également un concept de locuteur inapproprié à ce que nous voulions appréhender dans
les manuscrits d’écrivain. En effet, en s’appuyant sur la symétrie locuteur-récepteur
telle que l’avaient formalisée les ingénieurs des télécommunications, la pragmatique
construisait elle aussi un concept de locuteur idéal. En fait, le cadre chomskyen tout
comme le cadre pragmatique poursuivaient une conception idéaliste du sujet ; tout se
passait comme si la découverte par la psychanalyse d’un sujet clivé, qui « n’est plus
maître en sa demeure », se trouvait proprement refoulée par les sciences du langage.
Quant à la notion d’énonciateur, elle laissait ouverte la question du rapport entre le sujet
parlant de la théorie linguistique et celui de la psychanalyse. Comme elle était
revendiquée, ou simplement employée, par des tenants de théories différentes (Irigaray,
Kristeva, Todorov, Ducrot, Benveniste, Culioli), sa mise en oeuvre par nous pour les
manuscrits supposait une clarification et une explicitation préalable de nos choix
théoriques.
Last but not least, ne trouvant aucun terme susceptible de désigner clairement celui qui
écrit, nous avons décidé d’adopter empiriquement le terme de « scripteur », qui pouvait
au moins faire couple avec « locuteur », réservé à l’oral.
Quelle est en effet cette réalité spécifique du brouillon ? C’est un document écrit de
nature hétérogène, souvent lacunaire, inachevé et couvert de ratures et de réécritures
dont la caractéristique principale est d’être partie intégrante d’une chaîne de production
textuelle qu’on appelle aussi « genèse de l’œuvre ». Dans un texte paru en 1982, nous
avons déjà souligné l’importance de la nature processuelle de nos corpus : « Les
manuscrits sollicitent l’intérêt du linguiste d’une façon particulière : plus que toute autre
réalisation linguistique ils soulèvent immédiatement la question de la production des
énoncés »5. Celle-ci peut être appréhendée, tel a été le pari des « généticiens », à travers
l’analyse de l’avant-texte. L’essentiel d’un brouillon est de présenter une matière
verbale dynamique, mouvante, toujours soumise à de nouveaux changements, jusqu’au
moment où le scripteur décide de mettre fin à ses réécritures.
B.-N. Grunig a souligné dans un article sur « Structures et processus »6la nouveauté de
cette approche, les questions théoriques qu’elle soulève et le fait que « la recherche dans
le domaine si intéressant de la production manque cruellement de données empiriques »
(p. 44) Et elle ajoute que les brouillons traités par les linguistes de l’ITEM constituent
une trace précieuse du processus passé.
Sur un plan plus général, les théories de l’énonciation fournissaient un apport d’un autre
ordre, plus méthodologique : en suggérant que les énoncés ont une histoire qui s’inscrit
dans une temporalité, en posant qu’ils sont produits dans des conditions particulières par
des êtres parlants dont certaines propriétés au moins peuvent être modélisées, elles
permettaient d’isoler la radicale différence entre la production écrite et la production
orale (voir plus loin).
6. Manuscrits et psycholinguistique
C’est à peu près à la même époque que naît une « linguistique des brouillons » et
qu’apparaissent en psycholinguistique les premiers « modèles » de la production écrite :
l’article fondateur de R. Hayes et L. Flower date de 19809.
Le modèle proposé par ces deux chercheurs constitue le point de départ d’une série de
travaux expérimentaux à travers lesquels une approche psycholinguistique de la
production écrite s’affirme et s’affine au cours des deux dernières décennies du XXe
siècle10. Mais les premières versions de ces modèles et les dispositifs expérimentaux
destinés à les valider restaient très en deçà de l’extrême complexité des processus
attestés dans la production littéraire ; c’est seulement au tout début des années 2000
qu’une véritable convergence entre les deux approches devient possible11.
7. La spécificité de l’écrit
Pour l’analyse des manuscrits, il fallait rapidement accepter que la matérialité de l’écrit
constituait une donnée centrale, et ce pour deux raisons fondamentales.
D’abord, du point de vue de la communication, la production verbale écrite est régie par
des règles spécifiques qui la distinguent radicalement de l’échange oral. Du fait de la
non co-présence physique du scripteur et de son lecteur au moment de la production,
l’écriture n’est pas soumise, comme le discours oral, à la pression du hic et nunc. Le
message n’est pas transmis instantanément au fur et à mesure de sa production, sa
réception est différée, et les deux phases acquièrent une certaine autonomie. Cette mise
en suspens du temps offre au scripteur une possibilité inédite à l’oral, celle de revenir en
arrière et de reprendre l’énoncé avant de le mettre en circulation. D’où les corrections
de tous ordres, biffures, ratures, remplacements, additions, déplacements…, qui sont
comme la signature des documents de genèse.
De cet affranchissement par rapport au temps qui passe, il résulte une conséquence
majeure : dans la production écrite, il n’y a pas coïncidence entre la successivité du
temps de l’écriture et la linéarité de la chaîne signifiante produite.
En second lieu, en même temps que cette caractéristique liée au temps, les manuscrits
font apparaître avec force une autre contrainte liée à la nature même du medium. Dans
sa réalité physique, le manuscrit impose de renoncer à la simplicité du modèle
saussurien qui ne voit dans l’écrit qu’un simple transcodage de l’oral. A l’époque où
nous nous sommes confrontés aux brouillons, la linguistique restait massivement dans
la dépendance de ce modèle. Les critiques formulées par Vacek et l’école de Prague
dans les années 20 étaient presque oubliées, et c’est dans les marges de la linguistique
que se développait une réflexion sur la spécificité de l’écrit, chez certains spécialistes de
l’orthographe, comme N. Catach12 et J. Anis13, et, de manière beaucoup plus massive,
en anthropologie, avec les travaux déterminants de J. Goody14.
Ce courant de réhabilitation de l’écrit nous était très précieux, car il nous aidait à voir et
à faire voir les brouillons dans leur originalité irréductible. Mais il était loin de nous
donner des outils tout faits pour appréhender la richesse graphique des manuscrits. Et
c’est par tâtonnements successifs que nous avons démêlé, dans les manuscrits, la
substance graphique de la substance proprement linguistique.
Parmi les données dont nous devions rendre compte, trois méritent une mention
particulière, en raison de l’exploitation intensive qui en est faite par les écrivains au
cours du processus de création : celles qui sont liées au fait que le support de l’écrit
(dans les conditions normales de l’écriture littéraire) est une surface plane à deux
dimensions15 ; celles qui, dans la page, relèvent d’une perception visuelle sans être
réductibles à un codage graphématique ; enfin celles qui relèvent davantage d’une
dimension proprement esthétique, comme les dessins, ou de simples griffonnages.
Par données visuelles, on désigne tout ce qui est susceptible de « faire signe » dans la
page manuscrite en supplément des signes alphabétiques : les traits de biffure, les
becquets, les marques d’insertion, les traits entourant des zones particulières de la page,
mais aussi la couleur de l’encre et la nature de l’instrument utilisé, jusqu’à des données
plus difficiles à appréhender, comme les variations dans le rythme de l’écriture, dans le
ductus ou dans le calibre, pour ne pas parler des éléments qui acquièrent le statut de
signes en étant très éloignés des signes linguistiques et n’ayant même qu’un rapport
indirect avec l’écrit, comme la nature du papier, la présence éventuelle d’un filigrane,
les caractéristiques physiques du dossier, etc.
Enfin – même si ces données ne sont pas attestées chez tous les écrivains – il faut
pouvoir rendre compte de données qui relèvent plutôt des arts visuels, depuis les
simples griffonnages qu’on rencontre çà et là chez Flaubert jusqu’aux dessins de Victor
Hugo ou de Günter Grass.
Les outils
C’est ainsi que nous avons « volé » au structuralisme des termes comme
« substitution », « variante » et « paradigme », tout en leur donnant en partie de
nouvelles définitions. Si l’on part du fait que l’une des propriétés du brouillon est que
telle unité se trouve biffée et remplacée par telle autre, on voit sans mal l’utilité de la
notion de « substitution ». Mais contrairement à la substitution structuraliste, qui est
symétrique et indépendante du temps, les changements dans l’écriture sont
nécessairement orientés et ordonnés dans le temps. Le scripteur écrit d’abord « x », puis
le remplace par « y ». Il est trivial de rappeler que s’il avait d’abord écrit « y », puis
l’avait remplacé par « x », nous serions face à une substitution différente. C’est donc ce
que nous avons appelé « substitution orientée ». Par ailleurs, comme les réécritures se
présentent sous quatre configurations – remplacer, ajouter, supprimer, déplacer -, la
notion de substitution permettait de traiter ces quatre types de réécritures comme quatre
sous-classes de substitutions, à condition cependant d’introduire une autre notion
linguistique : la variable ø. Ainsi, on pouvait représenter
On voit bien ainsi comment une seule notion empruntée à la linguistique et adaptée à la
génétique peut avoir un pouvoir explicatif considérable.
Dans la famille de la variante, nous avons par ailleurs introduit avec profit le couple
« texte variant vs. texte non variant », ce qui permettait de définir, telles des isotopies,
ce qui restait inchangé tout au long de la genèse.
Conformément aux données du manuscrit, nous avons défini une autre propriété de la
variante propre aux brouillons. Si elle intervient immédiatement, au fil de la plume,
donc sur la même ligne que ce qui est déjà écrit, nous avons posé qu’il s’agit d’une «
variante d’écriture ». Si elle n’intervient pas immédiatement – et c’est repérable grâce à
des critères de position, soit dans l’espace interlinéaire, soit dans la marge, soit sur
d’autres feuillets –, nous l’avons identifiée comme étant une « variante de lecture »,
autrement dit, un phénomène qui suppose que le scripteur s’est arrêté à un moment
donné pour se relire et procéder ensuite à certains changements19.
D’autres outils qui ont servi à élaborer la méthode génétique sont dus aux théories de
l’énonciation. Ainsi beaucoup de nos analyses de manuscrits sont redevables aux
travaux de Benveniste, notamment à l’article « L’appareil formel de l’énonciation »20
dont il convient de citer cette brève phrase, visionnaire en son temps : « Il faudrait aussi
distinguer l’énonciation parlée de l’énonciation écrite. Celle-ci se meut sur deux plans :
l’écrivain s’énonce en écrivant et, à l’intérieur de son écriture, il fait des individus
s’énoncer »21. Les travaux de Culioli, nous l’avons dit, nous ont permis d’adapter à nos
besoins des notions comme « opération », « paraphrase », « ambiguïté »,
« reformulation », sans lesquels aujourd’hui aucune description de phénomènes
d’écriture et de réécriture ne semble possible.
En informatique d’abord. On l’a vu, celle-ci a été associée dès l’origine à la mise en
œuvre des méthodes et des outils de traitement linguistique que nous avons développés.
Le corpus de questions-réponses à l’aide duquel nous avons élaboré la notion de double
locution a été constitué en exploitant un enregistrement numérique de textes de Heine.
Et le dictionnaire des substitutions a constitué une des pièces maîtresses du travail
effectué par l’un d’entre nous sur les manuscrits de Lutezia 27. Dans les années 1990,
l’émergence du concept d’hypertexte nous a entraînés vers l’exploration d’autres pistes
de recherche, moins étroitement linguistiques et plus ouvertes sur des confrontations
avec la philologie, à travers le renouvellement de l’édition critique induit par le
développement des nouvelles technologies.
Sans aborder ce point ici, signalons qu’un des défis associés à ce déplacement vers
l’édition électronique est celui de la représentation de la page manuscrite. Quels sont les
paramètres pertinents pour la décrire et la coder d’une manière qui soit à la fois fidèle à
son foisonnement sémiotique et compatible avec les technologies de l’information ?
Comment « mettre en scène » la substance graphique de la page manuscrite dans une
interface efficace avec l’utilisateur, qu’il soit éditeur ou généticien28.
Plus récemment, un travail mené conjointement par les linguistes de l’ITEM et Jean-
Gabriel Ganascia a donné lieu à la réalisation du logiciel MEDITE29, qui permet de
comparer automatiquement deux textes proches l’un de l’autre mais variants30. Le
traitement informatique met en œuvre les quatre opérations – additions, suppressions,
remplacements, déplacements – que nous avions identifiées dans les dossiers de genèse
en les subsumant sous le concept de substitution. Il apporte donc une validation
empirique supplémentaire à cette notion, en montrant son caractère opératoire pour des
corpus dans lesquels on ne dispose pas de brouillons, mais seulement de versions
successives – non raturées – d’un même texte.
La même ouverture est manifeste dans les coopérations qui ont été engagées avec les
recherches en didactique de l’écriture. Elles ont été initiées par la thèse fondatrice de
Claudine Fabre qui, depuis la fin les années 1980, a appliqué les méthodes et les outils
de la génétique linguistique à des brouillons d’élèves des classes primaires32. Elles se
poursuivent avec les travaux de Claire Doquet-Lacoste, qui a été amenée à confronter
les outils que nous avions mis au point pour rendre compte des brouillons manuscrits
avec les données fournies par des enregistrements en temps réel des processus d’écriture
sur ordinateur.
Ces confrontations pluridisciplinaires mettent le doigt sur des questions
épistémologiques fondamentales qui étaient déjà, en creux, contenues dans le choix
initial de soumettre des corpus littéraires à un traitement linguistique : à la question de
la spécificité de l’écriture littéraire est nécessairement associée la question
complémentaire de l’unicité des processus de production écrite. Si l’approche
linguistique de la genèse littéraire a quelque pertinence, c’est certainement parce que,
par-delà leur littérarité affirmée, les brouillons relèvent d’abord de la « mise en
fonctionnement de la langue » en tant qu’il s’agit d’un processus universel.
scripteur a tapé la lettre a, que, quelques millisecondes plus tard, à l’instant t , il a tapé la
1
lettre suivante, qu’il a fait une pause de plusieurs secondes au milieu du mot, ou entre
deux syntagmes, ou à la fin de la phrase, etc.38 Le traitement de texte fait perdre au
scripteur – et au linguiste généticien qui voudra l’observer – la richesse et la
polyvalence de la trace graphique. Mais il apporte au chercheur un foisonnement de
données, une précision dans l’enregistrement des traces, qui sont sans équivalent dans le
monde de l’écriture manuscrite.
Le changement d’échelle qui en résulte pose à nouveaux frais les questions auxquelles
nous avons été confrontés au début de notre travail. Comment structurer cette masse
d’informations pour les transformer en données analysables ? Quelles sont les unités de
traitement pertinentes ? Comment seront-elles définies ? Quelle sera l’interaction des
paramètres linguistiques (mots, morphèmes, syntagmes, phrases, …), des paramètres
temporels (comment faire une typologie pertinente des pauses) et des paramètres
topographiques (à quoi correspond un déplacement du curseur dans le texte déjà écrit) ?
Si les actions élémentaires (ajouter, supprimer, remplacer, déplacer) semblent bien ne
pas être affectées, qu’en est-il des opérations que l’observateur construit à partir
d’elles ? Quels sont les effets de la puissance renforcée de l’instrument d’observation ?
Peut-on considérer qu’il nous rapproche de ce que seraient les mécanismes cognitifs
« réels » qui interviennent dans le processus de production écrite ?
Notes
1 Rappelons qu’« avant-texte » désigne l’ensemble des documents écrits qui portent
témoignage de l’élaboration progressive du texte.
4 Pour une synthèse (envisagée davantage du point de vue de la lecture), cf. par
exemple Rand J. Spiro, Bertram C. Bruce, William F. Brewer (eds), Theoretical Issues
in Reading Compréhension.Perspectives from Cognitive Psychology, Linguistics,
Artificial Intelligence, and Education. Hillsdale, N.J., Lawrence Erlbaum Associates,
1980.
10 Pour une synthèse, cf. M. Fayol, op. cit., en particulier les chapitres de Denis
Alamargot et Lucile Chanquoy et celui de Thierry Olive.
11 Cette convergence s’est concrétisée en 2002 avec la création par le CNRS d’un
réseau (GDR)« Approches pluridisciplinaires de la production verbale écrite » dirigé par
Denis Alamargot. Voir plus loin.
12 Cf. par exemple Nina Catach (ed), Pour une théorie de la langue écrite. Paris,
CNRS-Editions, 1988.
13 Cf. par exemple Jacques Anis (ed), Langue française n° 59. Le signifiant graphique.
Paris, Larousse, 1983.
15 Le problème est entre temps devenu plus complexe avec l’écriture à l’ordinateur.
17 Pour une présentation synthétique, cf. par exemple le chapitre 6 dans Almuth
Grésillon, Jean-Louis Lebrave, Catherine Viollet, Proust à la lettre. Les intermittences
de l’écriture. Tusson, du Lérot, 1990.
19 Cf. Almuth Grésillon et Jean-Louis Lebrave, art. cit. (note 5), p. 137, ou Jean-Louis
Lebrave, « Le locuteur : la course au trésor ». Cahier Heine n° 3. Paris, 1984, p. 74-75.
21 Ibid., p. 18.
23 Ibid., p. 18.
24 La gestion de cette contrainte a joué un rôle déterminant dans les traitement
informatiques élaborés pour structurer les données manuscrites. Cf. Jean-Louis Lebrave,
Le traitement automatique des brouillons. Numéro spécial de Programmation et
sciences humaines, Paris, 1984.
25 Cf. Almuth Grésillon, « Langage de l’ébauche : parole intérieure extériorisée ».
Langages n° 147, « Processus d’écriture et marques linguistiques », 2002, 19-38
30 Il est intéressant de relever que les algorithmes utilisés pour ces comparaisons (les
informaticiens parlent d’alignement unilingue) sont ceux qui ont été développés en
génétique biologique pour réaliser le séquençage du génome.
31 Irène Fenoglio anime une équipe à l’ITEM qui se consacre à l’exploration des
manuscrits de Benveniste.
32 Cf. Claudine Fabre, Les brouillons d’écolier. Grenoble, Editions L’Atelier du texte,
1990, etClaudine Fabre, Réécrire à l'école et au collège . Thiron, ESF Éditeur, 2002.
33 Ce réseau vient de s’élargir à l’ensemble des chercheurs européens travaillant sur les
processus de production écrite avec la création du réseau européen « The European
Research Network on Learning to Write Effectively » (ERN-LWE).
34 Louis Hay, « Die dritte Dimension der Literatur ». Poetica, Amsterdam, vol. 16,
1984, cahier 3-4, p. 307-323.
35 Cf. Denis Alamargot et Jean-Louis Lebrave (sous presse), « A mutual contribution
by cognitive psychology and genetic criticism to the study of professional writers ».
European Psychologist, 2009, Volume 14, Issue 1.
37 A Lund, Sven Strömqvist et son équipe ont mis au point le logiciel Scriptlog ; cf.
Sven Strömqvist, « Une approche expérimentale du processus d’écriture :
l’enregistrement de la frappe au clavier ». Genesis n° 27, 2006, p. 45-58. A Anvers,
l’équipe de Luuk Van Waes a développé le logiciel Inputlog, qui fonctionne en arrière-
plan du logiciel commercial Word ; cf. Marielle Leijten et Luuk Van Waes, « Inputlog:
A logging tool for the research of writing Enfin, à Poitiers, Denis Alamargot et David
Chesnet ont mis au point le logiciel Eye and Pen, qui enregistre l’écriture manuscrite à
partir d’une tablette graphique ; cf. G. Caporossi, D. Alamargot & D. Chesnet, « Using
the computer to study the dynamics of handwriting processes ». Lecture Notes in
Computer Science, 3245, 2004, p. 242-254. Scriptlog et Eye and Pen offrent en outre la
possibilité d’enregistrer les mouvements oculaires du scripteur pendant qu’il écrit.
38 Sans même parler de l’enregistrement des mouvements oculaires, moins
« écologique » puisqu’il suppose que le sujet accepte de porter un casque sur la tête et
se prête de bonne grâce à une procédure expérimentale qui reste contraignante.
Notice bibliographique
Le français moderne, numéro spécial : « Tendances actuelles de la linguistique
française » Paris, CILF, 2008. 37-49 (p. )