You are on page 1of 14

Le corpus en analyse de discours : perspective historique

Jacques Guilhaumou

Rsums
Cet article prsente les diverses manires de constituer un corpus en analyse du discours, et plus particulirement dans le domaine de lanalyse du discours du ct de lhistoire. Il adopte une perspective historique, en prenant comme point de dpart la configuration initiale des annes 1970. Cependant, il sagit aussi daccorder une importance particulire la formation de corpus rflexifs , tant du ct de la lexicomtrie que de larchive et du matriau denqute. La notion de rflexivit du discours apparat alors au centre de toute interrogation sur la constitution des nouveaux corpus.

Entres d'index
Mots-cls :
corpus, analyse de discours, pistmologie, histoire, rflexivit Haut de page

Plan
Introduction 1. La premire configuration de lanalyse de discours : les annes 1970 1.1. La configuration de dpart, une configuration mthodologique 1.2. Dune configuration socio-linguistique au changement de terrain 2. La dmarche configurationnelle au premier plan 3. Les nouvelles conditions du retour au corpus Conclusion : les nouveaux corpus Haut de page

Texte intgral Introduction


1Le problme de la constitution du corpus occupe une place centrale dans lanalyse de discours en ses dbuts, cest--dire la fin des annes 1970, et tout particulirement dans le champ de lanalyse de discours comme objet de lhistoire mis en place par les travaux pionniers de Rgine Robin (1973) et du Centre de lexicologie politique de lENS de SaintCloud. 2Au dpart, nous prsentons donc les principes communs, en matire de corpus, aux premiers chercheurs dans le but de cerner les diffrentes configurations qui dlimitent lapport et les limites de la dmarche inaugurale en analyse de discours au cours des annes 1970. 3Puis nous restreignons notre rflexion lanalyse de discours du ct de lhistoire dans la mesure o elle introduit, au dbut des annes 1980 et en rupture avec le corpus construit, la

notion de corpus naturel , cest--dire densemble des noncs attests dans larchive selon une logique propre de type configurationnel. Ainsi le tournant interprtatif de lanalyse de discours rvoque le corpus clos, remet en cause la confrontation entre le corpus et le horscorpus, refuse enfin la prsentation rfrentielle des conditions de production, au profit dune description de la rflexivit du discours partir dun travail configurationnel sur les noncs darchive, situ la croise des travaux de Michel Foucault et de ceux des ethnomthodologues. Il nest plus question que de ltude de moments de corpus caractriss lintrieur de vastes trajets thmatiques o sentremlent des volutions conceptuelles, des mergences de sujets dnonciation et des vnements discursifs. 4Le dbut des annes 1990 est alors marqu par lmergence dune jeune gnration dhistoriens du discours qui sinterdisent toute instrumentalisation du corpus, et sengagent rsolument dans une approche des noncs darchive qui relve dune histoire langagire des concepts situe dsormais au centre de dbats entre chercheurs de nombreux pays (Guilhaumou, 2000). Le renouvellement de labord du corpus devient alors un dfi pour les jeunes historiens lexicomtres qui tentent un nouveau croisement, tant du ct de la linguistique que de lhistoire, entre lanalyse de fonctionnements linguistiques et la description de la rflexivit des noncs. Prcisons demble que la proprit de rflexivit du discours relve du fait que la langue a cette capacit spcifique de sanalyser elle-mme, cest--dire en utilisant ses propres termes. Le discours est ainsi porteur de ses propres ressources interprtatives, tout en ntant pas dconnect de la ralit (Guilhaumou, 2001b). La constitution de trs grand corpus sattache la description de la rflexivit des noncs au sein de ce quon appelle aujourdhui la linguistique de corpus.

1. La premire configuration de lanalyse de discours : les annes 1970


5Le corpus, dans sa dfinition classique, dsigne un ensemble dtermin de textes sur lesquels on applique une mthode dfinie (Jean Dubois, 1969). Aspect demble dterminant de la pratique de lanalyste de discours, son ancrage initial dans le discours politique induit une configuration spcifique.

1.1. La configuration de dpart, une configuration mthodologique


6La configuration de dpart a pour origine la traduction dans Langages 13 (1969), linitiative de Jean Dubois, dun texte du linguiste amricain Harris de 1952, Discours analysis sous le titre Analyse de discours . Elle sest immdiatement illustre sous la dsignation danalyse dnoncs. Pierre Kuentz (1977) montre alors que lanalyse de discours prside la constitution du corpus des phrases sur lesquelles se construit la thorie grammaticale . Il dsigne ainsi les navets du linguiste de la langue qui croit pouvoir produire des exemples en extrayant des phrases du discours. En refusant de sinterroger sur cette opration dextraction, le linguiste de la langue suppose un identit langue / discours : il neutralise leffet discursif. On voit comment lanalyse de discours sinterroge, ds le dbut, sur la matrialit de la langue au sein mme de la discursivit des noncs. 7Cependant une question symtrique se pose : dans quelle mesure la faon dont le linguiste de la langue constitue son corpus de phrases oriente-t-elle la constitution du corpus en analyse de dnoncs ?

8Evoquons rapidement les tapes de lopration initiale de lanalyse de discours. On puise dans ce que Jean Dubois appelait luniversel du discours , donc dans la totalit des noncs dune poque, dun locuteur, dun groupe social. Dcoupage arbitraire partir dintrts, de thmes, de jugements de savoir. Dans un second temps, au sein du genre discours politique alors promu par les vnements de mai 1968, on ne retenait finalement que lensemble des phrases contenant, en quelque position syntaxique que ce soit, tel ou tel mot pivot. Cest la dernire phase qui produit rellement le corpus : lapplication des rgles dquivalence grammaticale proposes par Harris permet dobtenir un ensemble paradigmatique de phrases transformes, la srie des prdicats des mots-pivots. 9Ainsi dans le travail conjoint de la linguiste Denise Maldidier et de lhistorienne Rgine Robin (1974), sur les Remontrances parlementaires face aux Edits de Turgot de 1776, le corpus des phrases rgularises autour des mots-pivots libert et rglement est reproduit intgralement. La slection des termes repose ici explicitement sur un savoir historique pralable : il est suppos dvidence que cest autour des notions de libert et de rglement que se joue alors lopposition entre noblesse et bourgeoisie dans la conjoncture de la tentative rformatrice, voue lchec, de Turgot. 10Cependant, ce type danalyse sest avre trs utile dans la qute dun ventuel sens cach . Souhaitant apprhender la notion de fodalit la fin du 18me sicle, Rgine Robin (1975) sest intresse son usage suppos dans les cahiers de la noblesse de 1789. Or, il apparat demble que les expressions de droits fodaux et fodalit, prsentes dans les cahiers de la bourgeoisie, sont absentes des cahiers de la noblesse, alors quy sont prsents avec insistance les droits inhrents aux proprits de la noblesse . Cest donc partir de ltude des noncs autour du mot-pivot proprit que sexplicite la volont des nobles de maintenir les droits seigneuriaux . Nous obtenons en effet, aprs rgularisation des noncs, les trois phrases de base suivantes :

1- Toute proprit doit tre sacre 2- Des (ces) proprits doivent tre respectes 3- Les X (de la noblesse) doivent tre respects

11La classe des X comprend certes les droits attachs aux terres , mais aussi les droits attachs aux fiefs et les droits attachs aux hautes, moyennes et basses justice , cest-dire la quasi-totalit des droits fodaux qualifis de droits appartenant aux proprits de la noblesse . 12Lanalyse de discours, dans sa configuration inaugurale, mettait donc ici en vidence une stratgie de masquage, par le fait de lutilisation dun mot du lexique bourgeois pour lgitimer le maintien des droits seigneuriaux dAncien Rgime. Cette dmarche repose alors sur un double pari :

le pari sur la reprsentativit : le corpus final est cens reprsenter une ralit discursive. Dans les exemples voqus ci-dessus, les corpus autour des mots pivots libert et rglement, proprit et droits fodaux rsument, pour les premiers, laffrontement entre Turgot et les parlementaires en 1776, et, pour les seconds, lopposition entre noblesse et bourgeoisie en 1789. le pari sur la systmaticit : on recherche une homognit dans le temps et dans lespace, par exemple en tudiant, avec Jean-Baptiste Marcellesi (1971), les textes du Congrs de Tours de 1920, cest--dire des textes produits dans une mme situation

de communication . Cette homognisation a pour corollaire une dmarche comparative, par exemple la prise en compte de textes de locuteurs diffrents au sein mme du Congrs. Elle produit une systmaticit, un effet de cohrence. 13La circularit de la dmarche est alors vidente : si lanalyse de discours emprunte alors son modle de systmaticit la linguistique structurale, la linguistique elle-mme, par ses jugements de grammaticalit, ritre des jugements idologiques qui servent dinstance de jugement lanalyse de discours. Ainsi en est-il de lapplication du modle historiographique de lidologie sans-culotte (Albert Soboul), dabord au champ smantique, puis aux phrases grammaticalement transformes autour des mots-pivots peuple et sans-culotte dans la presse pamphltaire de lt 1793 (Guilhaumou, 1974, 1975). 14Lanalyse dun corpus, certes issu dun choix socio-historique explicite, neutralise donc son extrieur discursif, le hors-corpus, en le fixant dans un jugement de savoir, tout en constituant des entits discursives stables telles que le discours noble vs le discours bourgeois, le discours jacobin vs le discours sans-culotte. Le niveau interprtatif du corpus se situe alors exclusivement dans la recherche dun positionnement adquat du discours politique.

1.2. Dune configuration socio-linguistique au changement de terrain


15De fait, la dmarche inaugurale de lanalyse de discours savre trs rapidement prendre la forme dune approche sociolinguistique en ce sens quelle associe un modle linguistique, essentiellement lanalyse dnonc, un modle sociologique, dfini travers la notion de conditions de production, autre dsignation du contexte dans lequel on puise les lments du corpus tudi. Tout est ici affaire de correspondances, de co-variance entre des structures linguis-tiques et des modles sociaux. Cest ainsi que la recherche inaugurale de Rgine Robin (1970) sur une ville la fin de lAncien Rgime, Semur-en-Auxois, comporte dune part une analyse des structures sociales dun bailliage bourguignon la veille de la Rvolution franaise, et dautre part une analyse du contenu des Cahiers de dolances de la bourgeoisie et de la paysannerie partir dun certain nombre de mots-pivots, selon une approche linguistique combinant analyse dnonc et tude du vocabulaire socio-politique. Il en est de mme de ltude de J.-B. Marcellesi (1976) sur les Congrs socialistes et commu-nistes de 1924 et 1925. Jean-Pierre Faye (1972) sy associe en introduisant une approche discursive des effets de rcit, et surtout des topologies narratives. 16Lactivit langagire apparat alors immdiatement sociale. A lisomorphisme langue / discours succde une unit dialectique entre le linguistique et lextra-linguistique, un isomorphisme entre le discours et les pratiques sociales. Le choix des mots-pivots, donc du corpus dnoncs, prsuppose une dfinition du discours politique en terme dacceptabilit sociale. 17Ainsi, Jean-Baptiste Marcellesi, aprs avoir dfini le discours politique comme un discours tenu pour lhgmonie par un intellectuel collectif , sous linfluence de Gramsci, fait porter son analyse des Congrs sur les noncs contenant les termes Parti et Congrs. Il montre comment le P.C.F. sindividualise par rapport aux socialistes, se constituant ainsi comme nouvel intellectuel collectif, en vitant lquivalence Parti / Congrs. Le Parti est ce qui fait, limage de sa lutte contre lhgmonie capitaliste.

18De mme Jean-Pierre Faye dfinit le discours politique dextrme-droite allemande comme un discours tatique visant rendre crdible lidologie nazie au sein des idologies nationalistes de lentre-deux-guerres. Cependant il introduit une dimension pragmatique et stratgique dans lapproche du discours politique qui permet de dsigner leffet de rcit lencontre de lisomorphisme langue / discours. En effet, dans premier temps, Jean-Pierre Faye constitue le corpus des noncs qui dsignent le noyau rgulateur du champ idologique de lextrme droite allemande de lAllemagne de Weimar partir de la formule de lEtat total et de lantithse de la Rvolution conservatrice. Alors souvre la possibilit de jeux dinversion complexes autour de laxe smantique Vlkisch-Bndisch : de Louvrier cest le conservateur lnonc dHitler en 1936 Je suis le rvolutionnaire le plus conservateur du monde , une conception raciste, antismite et anti-internationaliste du monde est mise en acte au sein mme du langage. 19Cest alors la frappe narrative ou leffet de rcit qui donne consistance au totalitarisme nazi au sein de la circulation des langages dans le champ discursif de lextrme droite allemande de lentre-deux-guerres. Le fait discursif devient alors vnement, action narre. Le discours nest pas uniquement ce qui nonce laction rapporte, mais il est aussi ce qui produit laction, il est laction ; il est fondamentalement acte de langage. 20Le travail de Jean-Pierre Faye annonce ainsi un changement de terrain , prsentement une ouverture vers les rcits idologiques qui rompt avec toute dfinition implicite, donc non rflchie, du discours politique. 21Cependant le changement de terrain est alors essentiellement perceptible, dans lanalyse de discours des annes 1970, partir de la sortie interprtative du corpus vers une rflexion thorique dinspiration marxiste sur le discours politique comme pratique relativement autonome. Dans la ligne des rflexions de Michel Foucault dans Larchologie du savoir (1969) et du renouveau de la pense marxiste linitiative de Louis Althusser (1965), Rgine Robin et Michel Pcheux sefforcent plus dapprocher les pratiques discursives dans leur historicit et leur spcificit que de constituer, de manire phmre, une thorie du discours articule sur une thorie des idologies. Le discours politique nest pas dfini a priori, ses caractristiques sont lies au moment actuel, au plus loin de toute dmarche taxinomique.

1 Nous navons pas la place de dvelopper cette relation fondamentale au marxisme, dont nous rsumons(...)

22Deux concepts, tels quils sont formuls par Michel Pcheux (1975), deviennent centraux : ceux de formation discursive et dinterdiscours. Ltude des formations discursives permet alors de dterminer ce qui peut et doit tre dit dans une conjoncture donne. Le risque tait l, nous lavons dj soulign, de classer les diverses formations discursives dune formation sociale, lexemple de lopposition noblesse / bourgeoisie sous lAncien Rgime. Le concept dinterdiscours introduit alors une approche plus dialectique, dans la mesure o il permet de dire que toute formation discursive dissimule, dans la transparence du sens propre la linarit du texte, une dpendance lgard dun tout complexe dominante selon la formule du philosophe marxiste Louis Althusser (1965), ensemble qui nest autre que linterdiscours, cet espace discursif et idologique o se dploient les formations discursives en fonction de rapports de domination, de subordination et de contradiction. Cette conceptualisation forte rencontre alors le souci de lhistorien du discours dinscrire durablement son interrogation du ct de la tradition marxiste1. L o dominait au dpart une approche taxinomique, isolant des lments simples (discours bourgeois / discours fodal ;

discours jacobin / discours sans-culotte) dans le corps complexe des discours, il devenait question en fin de compte, dans le jeu de linterdiscours et de lintradiscours, dintrication de stratgies discursives, daffrontements et dalliances langagiers. 23En fin de compte, le changement de terrain , svrement jug aprs-coup, ne visait pas linstallation du discursif dans un systme conceptuel fig et externe, mais au contraire poussait le chercheur un perptuel travail de remaniement des concepts sur une base discursive. Dans cette ultime mtamorphose de la configuration de dpart, la question de la constitution du corpus rendait obligatoire ltude des conditions de production du discours, en liaison avec lhistoire des formations sociales. Quant la notion de conditions de production, elle dsignait alors moins la ralit stable de la situation de communication quun travail sur les effets de conjoncture, de leffet-sujet leffet-appareil en passant par leffet majeur de lvnement. 24Cependant lanalyse du discours comme objet de lhistoire narrivait pas sortir, dans cette configuration, dun triple cueil. En premier lieu, elle introduisait une coupure nette entre le corpus choisi, vrai dire fort restreint au terme de la procdure danalyse, et le hors-corpus dfini de faon rfrentielle et idologique par la notion de conditions de production. En second lieu, le choix des mots-pivots reposait sur le jugement de savoir de lhistorien, pris luimme dans le champ des dbats historiographiques, et non dans les termes du moment actuel. Enfin, elle constituait, sur des bases idologiques et historiographiques, des entits discursives spares telles que le discours noble, le discours bourgeois, le discours jacobin, le discours sans-culotte, etc.

2. La dmarche configurationnelle au premier plan


25La lexicomtrie est mise en place au cours des annes 1970 avec ltude pionnire des tracts de mai 1968 (Tournier et alii, 1975) : ses avances sont perceptibles travers la premire formule de la revue Mots jusqu la fin des annes 1980. En quantifiant les faits langagiers, elle ouvre la voie une linguistique de corpus qui dfinit le corpus comme une collection de donnes langagires slectionnes et organises selon des critres linguistiques explicites pour servir dchantillon du langage (Habert, Nazarenko & Salem, 1997 : 11), rsolvant ainsi en partie les problmes des linguistes face au corpus. Le linguiste finit en effet par concentrer son attention sur lenrichissement des corpus, via les banques de donnes, laccroissement de leur taille et lamlioration des accs aux corpus. 26Mais lhistorien du discours a dabord fait appel la lexicomtrie pour dmler, en premire approche, lintrication des phnomnes nonciatifs et rhtoriques qui constituent la surface discursive dun texte, par contraste avec les noncs qui le structurent smantiquement autour de mots-pivots tudis en analyse harissienne. L encore, la procdure danalyse portait au dpart sur un corpus rduit, non plus un corpus dnoncs, mais le tableau lexical double entre des formes du corpus, recenses automatiquement, qui sont ventiles sur la base de leurs frquences absolue et relative dans les diverses parties du discours. 27Le passage par larchive, si spcifique de la dmarche de lhistorien du discours pendant les annes 1980 mais sur lequel nous serons fort succinct dans la mesure o elle a fait lobjet dun ouvrage-bilan (Guilhaumou, Maldidier & Robin, 1994), devait permettre denrichir lapproche lexicomtrique de lhistorien du discours. Certes lanalyse de corpus, laide doutils linguistiques adquats, demeure plus que jamais dactualit. Cependant il ne sagit plus de construire demble un corpus sur la base dun jugement de savoir, au titre de la

dsignation pralable de conditions de production, mais il convient de dcrire dabord des configurations darchives significatives la fois dun thme, dun sujet, dun concept, et en fin de compte dun vnement. Il est alors toujours temps disoler en leur sein un moment de corpus , cest--dire un ensemble dnoncs sur des critres lexicaux, syntaxiques ou nonciatifs et de constituer ainsi un sous-corpus susceptible dune approche linguistique fine. 28Lapport de la dmarche lexicomtrique sen trouve singulirement modifi. Nous prendrons lexemple dun corpus chronologique denviron 150 000 occurrences, le Pre Duchesne dHbert en 1793-1794, que nous avons tudi (1986a) en collaboration troite avec le linguiste lexicomtre Andr Salem (1986). Il ne sagit plus seulement, partir de lanalyse du tableau lexical de rpartition des formes, de dcrire une volution du vocabulaire sur la base automatise de regroupements quasi-smantiques de termes. La dmarche la fois descriptive et interprtative consiste plutt articuler des indices quantitatifs de fonctionnement discursif, introduisant des lments contrastifs dans le corpus, des descriptions locales en prise sur des noncs hors-corpus. 29Prenons lexemple de la mise lordre du jour de la Terreur en 1793, mot dordre dont nous avons retrac par ailleurs le cheminement (1981), en nous posant la question suivante : quelle place discursive occupe cet vnement discursif dans la narration duchnienne ? 30Le rseau dnoncs portant la thmatique de la terreur sorganise alors en deux temps au sein du Pre Duchesne dHbert. Au moment de la mise en place du mot dordre de terreur, pendant le mois daot 1793, lusage rpt de la figure de laristocrate travers les multiformes tous les aristocrates, aux aristocrates, les aristocrates lgitime de lextrieur lexistence mme de la terreur. Puis linversion de lusage de lexpression populaire perdre le got du pain qui, dabord applique aux amis de la Rpublique, concerne ensuite ses ennemis, ritre le processus de retournement de la terreur, exerc initialement par les ennemis, contre ces mmes ennemis. Dans un second temps, une fois la mise lordre du jour de la terreur lgitime par la Convention Nationale, le Pre Duchesne use systmatiquement de la multiforme tous les ennemis, indice de lmergence dune systmatique de terreur dans le discours duchesnien. 31En fin de compte, une telle description locale dorigine lexicomtrique permet de situer les enjeux stratgiques lintrieur mme de la description textuelle, et non dans larticulation dune surface discursive une formation discursive dtermine par ses conditions de production, comme cela tait le cas au dbut de lanalyse de discours, lorsquil sagissait dtablir un lien entre les effets populaires dans le Pre Duchesne et son contenu jacobin (Guilhaumou, 1974). 32De la dmarche configurationnelle de lhistorien du discours qui se met en place dans les annes 1980, nous avons dcrit les principales entres, configuration / archive, trajet thmatique et vnement discursif, sous forme dun second bilan, dans le rcent Dictionnaire danalyse de discours (Chareaudeau & Maingueneau, 2001). Dans la mesure o cette dmarche tend remplacer la dmarche usuelle de construction du corpus par une approche en corpus naturel des noncs darchive, il est difficile dy trouver une quelconque centralit de la question du corpus. 33Larchive est ici dfinie comme le jeu de rgles qui dterminent dans une culture lapparition et la disparition des noncs, leur rmanence et leur effacement, leur existence paradoxale dvnements et de choses (Foucault, 1994, I : 708). Elle est alors associe un

geste de lecture de facture hermneutique, donc foncirement anti-constructiviste, cest--dire bas sur les capacits rflexives, donc interprtatives, des acteurs naturels de lhistoire. Elle sinscrit ainsi dans lactivit ordinaire des gens ordinaires, lencontre de toute prsance des acteurs jugs lgitimes. Dsormais, lnonc rare ne prend sens quau terme dun travail configurationnel sur un ensemble dnoncs attests, disperss et rguliers, donc nous renvoie larticulation de la description et de la rflexion au sein dun acte configurant centr sur une intrigue, bien souvent concentre dans un vnement discursif. Il se situe au plus loin du dcoupage, par le linguiste, de la linarit du discours en expressions, propositions et phrases. 34Paradoxe apparent, la dmarche rvoquant la primaut de la construction du corpus permet lhistorien et au linguiste de se rencontrer au mieux sur le terrain de la matrialit de la langue au sein de la discursivit de larchive. Ainsi peut-on valuer lexemplarit de notre tude, mene avec Denise Maldidier, des modalits discursives de la rcurrence de lexpression du pain et X (Guilhaumou & Maldidier, 1986) au sein du trajet thmatique des subsistances, dcrit par ailleurs dans toute son amplitude (Guilhaumou, 2001a). Il en est de mme du moment de corpus constitu des noncs autour de Marat est mort / Marat nest pas mort dans la description configurationnelle de lvnement Mort de Marat (Guilhaumou, 1986b et 1987). 35Les ouvertures problmatiques des historiens du discours dans les annes 1980 ont t rendues possibles par la neutralisation progressive de toute dmarche analogique de type sociolinguistique et la constitution de lanalyse de discours comme discipline interprtative part entire (Guilhaumou, 1993). Mais il a fallu dabord rcuser la notion de conditions de production, et son corollaire, la situation de communication, en situant les ressources interprtatives des textes en leur sein. Puis lhistoire du discours sest libre en partie des modlisations smantiques a priori dans la manire dagencer les phrases de base de lanalyse dnoncs et/ou dorganiser les listes de termes issus des analyses lexicomtriques de tableaux lexicaux. Enfin il est devenu possible de ne plus instrumentaliser la linguistique en sen servant comme dun simple outil, pour ensuite lexclure du moment interprtatif. Il sagit donc bien l dun tournant langagier de facture fortement hermneutique, qui sintgre dans ce quil est convenu dappeler le tournant interprtatif : lacte dinterprter est mis au centre de la constitution linguistique du monde et se concrtise dans lhistoricit des discours par une vaste gamme pragmatique dactes de langage. Il sagit bien alors dattester de lexistence de lvnement discursif, den dclarer la signification atteste par rapport ce qui est dit dans un moment donn au sein dune configuration dnoncs. A partir de la lecture darchives, lintrt justifi des analystes de discours pour lvnement de communication (Chareaudeau, 1997), chelle commune de notre socit mdiatique, est dplac vers des vnements o la mise en vidence de lattitude rflexive des acteurs, cest--dire de leur capacit lautodtermination, permet dinsister plus sur leur libert de sujet smancipant que sur leur ralit dtre social dtermin. 36Que devient alors la question initiale de la constitution du corpus hors du champ restreint du questionnement linguistique sur lenrichissement des corpus, en particulier par le biais des corpus annots (Habert, Nazarenko & Salem, 1997), auquel lhistorien peut tre sensible ? Sans aucun doute elle parat quelque peu marginalise la lecture des travaux rcents de jeunes historiens du discours engags du ct de lhistoire langagire des concepts. 37De fait, lhistorien du discours tend de plus en plus, au cours des annes 1980, considrer lanalyse de discours comme une ethno-mthode. Il sagit dabord dadopter la posture

dindiffrence ethnomthodologique qui refuse dinduire de la position sociale les pratiques discursives dun individu, ou dun groupe. Puis la frontire entre texte et contexte sestompe dans la mesure o les individus utilisent le langage naturel comme contexte, ressource, thme, donnant ainsi un sens leur action par la seule rflexivit du discours. Ethno se rfre ici conjointement la culture, aux croyances locales dun membre de la socit au-del de son appartenance une groupe dtermin et la connaissance dont dispose ce membre de cette culture dont il est la fois lacteur, le protagoniste, lauteur et le spectateur (Widmer, 1986 ; Coulon, 1987). La perspective ethnomthodologique permet galement daborder les ordres de grandeur qui hirarchisent lidologie sociale, donc les relations dordre entre les individus au sein des institutions, daprs ce dont les gens sont capables (Boltanski, 1990 ; Thvenot & Boltanski, 1991). 38Lanalyse de discours tend ainsi prendre un tournant anthropologique o les problmes de lintersubjectivit et de laltrit sont au centre des proccupations des jeunes historiens du discours. Ltude de Sophie Wahnich (1997) sur la thmatique de ltranger pendant la Rvolution franaise savre tout fait significative de ce tournant. 39Sans entrer dans les rsultats de ltude de trajets thmatiques trs intriqus, constatons dabord que ce travail discursif sur lespace interlocutif du discours dassemble pendant la Rvolution franaise montre la capacit produire des rsultats historiques dun travail configurationnel sur les noncs darchive. Son apport central au tournant anthropologique tient une recherche en cours (2002) sur la thmatisation des motions au sein mme des discours argumentatifs politiques de la Rvolution franaise. La rflexivit langagire du thme des motions devient ainsi un objet de recherche part entire au sein dune conomie motive de lvnement qui peut prendre, dans certains cas, la forme dune conomie linguistique. Ainsi en est-il lorsque les Montagnards, en lan II, dnoncent lusage fortement motif par les Anglais de syntagmes figs (les soldats de Robespierre, les hordes conventionnels), de structures syntaxiques (Robespierre a fait ordonner , les hordes conventionnels ont fait ...) lencontre de lappropriation historique et mmorielle des vnements rvolutionnaires (Wahnich, 1999). Nous pouvons terminer ce point par un autre exemple particulirement significatif de la mise lcart de la question de la construction du corpus dans lanalyse configurationnelle des noncs darchive : lorsque Sophie Wahnich montre que lacte de demande constitutif de la radicalit rvolutionnaire ds 1789 devient luimme un acte motif, qui plus est que la demande motive de terreur est prsente ds 1792 et prcde donc la mise lordre du jour de la terreur pendant lt 1793, elle contourne le corpus des noncs darchive, aussi vaste soit-il, de lvnementialit particulirement dense de lt 1793, pour aller au plus profond de la rationalit pratique des motions.

3. Les nouvelles conditions du retour au corpus


40A vrai dire, tant chez lhistorien que chez le linguiste, la construction du corpus, selon une procdure explicite et sur la base dune validation empirique, tait perue comme une donne scientifique permettant dlargir la continuit du social vers les phnomnes langagiers. Dsormais, le choix dune chelle dobservation, et plus spcifiquement la dtermination dun observatoire des discours selon le point de vue adopt prime dans lopration de construction du corpus. 41Nous lavons constat au moment o nous avons pu confronter, de concert avec dautres linguistes, diverses dmarches en analyse de discours qui ont pour trait commun de sintresser des corpus historiques dune part, et de prendre en compte la matrialit du

langage et des formes de la langue dautre part (Branca-Rosoff, Collinot, Guilhaumou & Mazire, 1995). 42Au terme de cette confrontation, il est apparu au moins trois modalits diffrentes dobservatoire linguistique, dont dpend lopration mme de construction du corpus. 43Il est tout dabord question dun observatoire des discours o se confrontent en permanence la matrialit des formes linguistiques et les valeurs de linstitution sociale fortement mobilises dans lopration de construction du corpus. Ici lobservateur-linguiste porte toute son attention sur les ressources interprtatives des discours en les interprtant pas la mdiation des formes linguistiques, et plus largement des formes de lcriture. Cest ainsi que Sonia Branca et Nathalie Schneider (1994) ont constitu un corpus des manires de dire formes socialement rgles mais soumises des dplacements, en particulier sur laxe oral / crit des peu-lettrs provenaux pendant la Rvolution franaise partir de discours publics manuscrits. Cet observatoire des discours accorde une place importante la lexicologie sociale sur la base dune approche du mot comme notion htrogne (Branca (d.), 1998). De ce fait, la lexicologie peut tout aussi bien sintresser la valeur dusage dun mot dans un vaste corpus ouvert comme Frantex, enrichi de lectures complmentaires, lexemple de ltude du mot classe par Marie-France Piguet (1996) que sen tenir une premire analyse exhaustive dun corpus bien dlimit, pour lenrichir ensuite sur la base de nouvelles sources. Ainsi la saisie vif de lusage des mots rsulte dune clture en profondeur du corpus, par la rencontre avec larchive, et propos de laquelle le mieux est ... de ne pas clore (Eluerd, 2000 : 101). 44En second lieu, larrive rcente de lanalyste du discours dans le champ de lhistoire de la linguistique (Auroux, 1989-1999) fait apparatre un observateur-historien soucieux de dcrire, dans la connexion empirique entre la ralit et le discours un moment historique donn, les capacits rflexives de sujets de la langue explicitement dots doutils et de conscience linguistiques, par exemple les grammairiens-philosophes du 18me sicle (Guilhaumou 2001b et 2002). Le travail darchives permet non seulement de fournir un matriau empirique indit, mais aussi de cerner la langue empirique en tant quelle est compose dtats et de sujets cognitifs fixant le possible en langue. Il ne sagit donc pas de dcrire de simples manifestations de conscience linguistique au sein de lvnement discursif, mais plus avant de reprer dans lespace-temps de la communication humaine les sujets et les objets, par exemple le quelquun qui parle et le quelque chose qui existe comme sujet politique de la langue franaise au 18me sicle, au sein dune vnementialit originaire vide dune signification premire mais qui juge de lappartenance de chacun une communaut de langage. Cet observatoire, constitu dans la connexion empirique entre un matriau archiviste et une langue archtypique, ne peut sautoriser, vrai dire, daucune autre opration de construction de corpus que de lexistence externe dobjets linguistiques. Sur cette base cognitive, toutes sortes de connexions sont possibles, y compris dans lespace fortement subjectif et rflexif de lvnement discursif, processus qui continue sexpliquer pour une part par la capacit rflexive des acteurs agissant en son sein. 45La rflexivit gnralise des discours, propre la dmarche hermneutique en histoire du discours des annes en 1980, est actuellement fortement nuance par une interrogation sur un rfrent toujours intersubjectivement ngociable, tant alors entendu que la forme langagire de laccord humain, de lintentionnalit collective importe beaucoup plus que la signification du contenu des reprsentations. Dans cette perspective, le corpus est soit une modalit de structuration du savoir en analyse de discours minemment transitoire donc qui peut

disparatre, soit un nouvel objet technique analogue au mode dexistence matriel de la langue. Le dbat sur le corpus peut alors reprendre, nous le verrons, si lon part de la remarque suivante, vrai dire trs matrielle : la langue a lair assez diffrente quand on examine un grand morceau dun coup (cit par Habert, Nazarenko & Salem, 1997 : 217). 46Cependant, il convient dabord de dlimiter un troisime observatoire possible, lobservatoire de la langue constitu partir de lhtrognit mme du discours. Cet observatoire est toujours pris dans la tension dune instrumentation confronte en permanence avec les avances de la linguistique au sein de moments de corpus o se manifeste la matrialit de la langue dans la discursivit de larchive. Cependant, le processus de construction du corpus est alors motiv par lassociation de lexigence formaliste un geste de lecture effectu au sein dunivers discursifs non stabiliss logiquement. Il relve de la constitution de machines paradoxales qui interdisent toute construction du corpus par tapes et ordre fixe. Une fois acquis, sans connotation intentionaliste, que cest de lintrieur du champ discursif, dans limmense circulation des noncs, que la question du corpus est dsormais pose, linteraction de moments de lanalyse linguistique et de lanalyse discursive relve de la production en spirales de reconfigurations de corpus (Pcheux, 1990). Ce troisime observatoire peut stendre aux objets linguistiques eux-mmes, par exemple les dictionnaires (Collinot & Mazire, 1997), en vue de mettre en vidence des fonctionnements aveugles des discours dans la mise en collocation des mots entre eux et dans les perturbations apportes par le recours aux citations. 47Dans tous les cas voqus ci-dessus, lexigence initiale dun corpus stable, homogne et clos a t abandonne. Pour le jeune historien du discours Marc Deleplace, cet abandon, justifi par la ncessaire ouverture au large ventail des publications imprimes et des sources manuscrites, permet de passer du discours comme simple objet de lhistoire au discours constitu comme objet social en lui-mme (Deleplace, 1996). Ainsi rejoint-il la rflexion de lhistorien allemand Reinhart Koselleck (1997) sur la connexion empirique entre ralit et discours dans la ncessaire distinction entre les faits sociaux et les faits de langage. Mais il lui importe tout autant dassurer la cohrence du corpus utilis de manire garantir la permutation des nonciateurs. Et de citer Antoine Prost, un de ses ans historiens les plus intresss par lanalyse de discours : Nous avons vu que ce corpus devait prsenter trois caractres : tre contrastif, pour permettre des comparaisons ; tre diachronique, cest--dire schelonner dans le temps, pour permettre de reprer continuits et tournants ; enfin tre constitu, sinon de textes dorganisation, du moins de textes significatifs, assignables des situations de communication dtermines (1988 : 280). Caractres que nous retrouvons donc dans le vaste travail de Marc Deleplace sur le concept danarchie de Mably Proudhon (2001). 48En fin de compte, lanalyse de discours du ct de lhistoire en France souvre sur une histoire linguistique des usages conceptuels en tant que partie intgrante de lhistoire langagire des concepts (Guilhaumou, 2000). Elle garde ainsi sa spcificit tout en sintgrant au sein dun cadre europen plus large dans la mesure o elle introduit, dans la dsignation commune dhistoire des concepts, deux notions centrales dans les travaux franais : lune, lusage, associe une longue tradition danalyse lexicologique de lusage des mots en discours (Eluerd, 2000), lautre, la linguistique, issue dun champ de la linguistique en France o chaque volution majeure ncessite un repositionnement par rapport la rfrence relativement stable au mtier dhistorien. La rcente publication collective du laboratoire de lexicologie politique de Saint-Cloud, sous la responsabilit de Pierre Fiala (1999), amorce une telle volution. En son sein, nous notons en particulier la prsence de lhistorienne de la

Rvolution franaise, Raymonde Monnier, lune des responsables par ailleurs du rseau europen History of concepts dont les rcents travaux (1999a et b) marquent une volution sensible vers lanalyse de discours. 49Nous avons vu que lanalyse de discours a considrablement progress par la prise en compte de la rflexivit du discours. Plutt que de prciser les enjeux dune telle catgorisation sur une base rflexive, dans la mesure o nous lavons dj fait dans la postface relative aux historiens et au tournant hermneutique de notre ouvrage de synthse sur les porte-parole pendant la Rvolution franaise (1998), nous prfrons montrer en quoi limpact de cette volution sur la lexicomtrie ouvre une perspective novatrice en matire de construction de corpus. 50Au-del de lapport de la lexicomtrie au travail du linguiste sur des matriaux historiques, relatifs en particulier la Rvolution franaise (Moreau-Steuckardt, 2000), nous retiendrons comme particulirement significatif de cette volution le rcent travail de Damon Mayaffre (2000), qui nous entrane sur les rives du discours politique franais de lentre-deux-guerres. Dans la mesure o ce jeune chercheur prcise ici mme loriginalit de sa dmarche en matire de construction de corpus, nous nous contentons de souligner les apports qui nous semblent essentiels de sa premire recherche, lui laissant ainsi le soin den systmatiser les ouvertures nouvelles. 51La premire originalit de ce travail rside dans la constitution d'un vaste corpus denviron 1 500 000 occurrences rparties de manire peu prs quivalentes entre les discours de quatre dirigeants politiques des annes 30, Thorez, Blum, Flandin et Tardieu, sur une dizaine dannes, justifiant ainsi une tude la fois contrastive, synchronique et diachronique. La lexicomtrie, avec sa bote outils (les listes de frquences et de rpartition des formes par sous-corpus, l'analyse factorielle des correspondances valeur globalisante, les noncs rpts, etc.), est mise contribution tout au long de ce travail. Mais ce quil importe avant tout de souligner, cest quil sagit dune exprimentation tout fait novatrice en matire de trs grand corpus : il est avant tout question ici du corpus discursif lui-mme comme objet dhistoire lhorizon dun genre discursif spcifique. 52Ainsi les critres usuels de constitution de corpus (homognit, contrastivit et diachronicit) sont respects, mais ils naboutissent pas lchantillonnage habituel. Le choix se veut quasi-exhaustif dans le champ discursif tudi, le discours parlementaire de quatre dirigeants politiques, sur la base dun travail darchivage et de numrisation systmatique. Cest donc le corpus lui-mme, plus exactement sa description partir de critres quantitatifs, qui constitue sa propre norme interprtative. 53Qui plus est, lanalyse de discours sur des corpus de faible envergure devait faire appel en permanence des donnes contextuelles pour valider linterprtation historique. Mais ici la taille mme du corpus rend possible, dans de nombreux cas, la prsence du contexte dans le texte lui-mme. Cette question de la rflexivit du corpus, donc de la disponibilit, dans le corpus lui-mme, dune grande partie des ressources ncessaires pour interprter les discours politiques tudis marque un bond qualitatif par rapport aux tudes lexicomtriques antrieures. Nous percevons tout particuli-rement lintrt de cette dmarche au moment de linter-prtation historique des rsultats, l o les textes lappui du dbat sur des questions historiographiques prcises sont le plus souvent des textes du corpus qui font en quelque sorte rseau. L stablit un lien fructueux avec la manire dont les historiens des concepts reposent

actuellement la question du contexte partir de la prise en compte du lien entre les croyances au sein de rseaux interconnects (Guilhaumou, 2001c). 54Au systme citationnel usuel constitu sur la base dune lecture ordinaire dun hors-corpus dfinissant la situation de communication se substitue donc une mise en configuration construite lintrieur mme de lespace du corpus. Le temps du corpus limit, chantillonn, clos est dsormais bien rvolu chez les historiens du discours. Et dans le mme temps, la spcificit de la dmarche franaise en analyse de discours, acquise ds son origine et qui est de faire appel des outils linguistiques danalyse au sens large, demeure avec les modifications inhrentes lenrichissement de loutillage mthodologique de lanalyse de discours.

Conclusion : les nouveaux corpus


55Lanalyse de discours naccordait en ses dbuts aucune place particulire la question des genres discursifs, dautant plus que la notion de genre tait gnralement rapporte une catgorie idologique pr-construite. Cependant il est ais de constater que les nouveaux historiens du discours voluent majoritairement, en matire de corpus historiques, dans un genre politique fortement lgitim, le discours parlementaire. 56A ce titre, il importe dsormais dexpliciter, dans la ligne des travaux de Pierre Achard (1995) et de Sonia Branca (1999), la dynamique des genres dans la constitution de nouveaux corpus. 57Ainsi Pierre Achard sintresse la manire dont tout chercheur peut homogniser des discours, donc les constituer en corpus, sur la base de lorganisation interne de leur nonciation. Il sagit alors, pour le sociologue du langage, de prendre en compte conjointement lnonciation telle que le dveloppement interne du discours la dploie et les actions sociales dont le discours est le support (Achard, 1995 : 87). Le registre discursif dsigne alors la modalit ainsi mise en oeuvre de construction sociale du sens laquelle sassocie ncessairement un genre discursif reprable par des lments linguistiques internes. La langue comme objet social, dans la ligne des travaux de Rene Balibar sur le colinguisme (Branca-Rosoff & Wionet, 1998), est un exemple particulirement intressant de registre discursif. 58Dans cette voie, il est galement possible denvisager, sur le versant de lvnement linguistique, la formation de nouveaux corpus par une attention particulire la restructuration des formes langagires plus ou moins stabilises que constituent les genres (Branca-Rosoff, 1999 : 125). Il ne sagit pas de reprer la formation dun nouveau genre par une simple accumulation de faits linguistiques, mais de mettre en valeur la monte progressive de formes, leur visibilit, par un dplacement de normes autorises dans un contexte de rupture. Ainsi en est-il de lcriture des peu-lettrs pendant la Rvolution franaise (Branca-Rosoff & Schneider, 1994) qui peut faire corpus par la manire dont les chercheures valorisent sa dimension rflexive, sa crativit au sein mme de lvnement rvolutionnaire 59Nous constatons donc que laspect rflexif du discours prend une importance toujours plus grande dans la procdure de formation de nouveaux corpus. Il sagit en effet dassocier dans un corpus issu de lactivit langagire de locuteurs prcis non seulement des acteurs stratgiques et des acteurs mergents, des experts et des militants ordinaires, des protagonistes

et des spectateurs, mais aussi les chercheurs en sciences sociales eux-mmes. Nous entrons ainsi dans un processus de co-construction des corpus o la question de larticulation du discours et du mtadiscours constitue une dynamique interne la formation de nouveaux corpus. 60De plus en plus, le chercheur est confront, dans le matriau denqute et/ou le matriau darchive, des configurations de sens indites qui contribuent valoriser des sujets mergents, cest--dire pris, selon la formule de Michel Pcheux (1990), dans la dlocalisation tendancielle du sujet dnonciation . Il est alors interpell par des formes nouvelles de subjectivation et par des objets notionnels indits. Nous lavons constat dans notre recherche conjointe avec des sociologues et des ethnologues (Mesini, Pelen & Guilhaumou, 2003) sur les acteurs mergents, dits exclus dans le champ de la lutte contre lexclusion. Lhistorien linguiste tend ici singulariser, dans les rcits de vie des dits exclus, un trajet narratif o lautonomie interprtative des ressources du sujet dnonciation, lenqut, est trs forte au point que les arguments avancs sont co-construits part gale entre lenquteur et lenqut. Le corpus analys consiste alors dans un trajet nonciatif o ltude de fonctionnements linguistiques met en vidence une reconnaissance rciproque de lenquteur et de lenqut, un co-partage des ressources entre co-auteurs, traduisant ainsi la violence exerce par la socit sur les dits exclus en une certaine forme de rconciliation discursive, sans pour autant occulter les formes de rsistance et de conflit. En effet, le chercheur est confront lui-mme sa propre responsabilit en matire de qute dautonomie. De fait lirruption de la parole du dit exclu est si forte quelle fait clater conjointement la notion de sujet social dpendant et celle de chercheur-expert matrisant son mtadiscours. Ainsi, interpell par une recherche dautonomie, lenquteur ne se contente pas de se laisser guider par les convictions de lenqut. Prenant sa part de responsabilit dans lmergence dune dimension universalisante de lexpression authentique de lindividu empirique, il participe aux moments forts producteurs darguments dans le cours du trajet narratif. Son point de vue fait donc partie intgrante du corpus analys, et ne ncessite donc pas la construction dun observatoire spar. 61La rflexivit du discours, thme dsormais majeur de lanalyse de discours, a ouvert la voie au corpus rflexif non seulement sous la forme du trs grand corpus o texte et contexte se retrouvent dans un mme espace construit, mais aussi sous la forme de corpus coconstruits lintrieur desquels le point de vue du chercheur est lune des donnes majeures de la construction de ces corpus. Double dfi que la lexicomtrie semble actuellement apte relever. Nous lavons montr propos des travaux rcents de Damon Mayaffre sur les trs grands corpus . Il en est de mme, en matire dencodage du corpus, lorsque Serge Heiden (1999) prvoit une solution dextensibilit du format dencodage mis en uvre dans lannotation du corpus, non seulement sur la base de lvolution future des logiciels danalyse, mais aussi en fonction de la variation du point de vue du chercheur.