You are on page 1of 31

Corpus

8 | 2009
Corpus de textes, textes en corpus

Dis-moi quel est ton corpus, je te dirai quelle est ta


problmatique

Patrick Charaudeau

diteur
Bases ; corpus et langage - UMR 6039

dition lectronique dition imprime


URL : http://corpus.revues.org/1674 Date de publication : 15 novembre 2009
ISSN : 1765-3126 Pagination : 37-66
ISSN : 1638-9808

Rfrence lectronique
Patrick Charaudeau, Dis-moi quel est ton corpus, je te dirai quelle est ta problmatique , Corpus [En
ligne], 8 | 2009, mis en ligne le 01 juillet 2010, consult le 30 septembre 2016. URL : http://
corpus.revues.org/1674

Ce document est un fac-simil de l'dition imprime.

Tous droits rservs


Dis-moi quel est ton corpus, je te dirai quelle est ta
problmatique

Patrick CHARAUDEAU
Universit de Paris 13, CAD

Les problmes que pose la notion de corpus sont relativement


bien connus pour avoir t longuement discuts dans le champ
des sciences du langage1, mais ils n'ont toujours pas donn lieu
un consensus qui aurait permis de s'en remettre une
dfinition faisant autorit et laquelle on se rfrerait chaque
fois que l'on aurait justifier un corpus d'analyse. Cela est peut-
tre le symptme de ce que le corpus n'existe pas en soi, mais
dpend comme en tmoigne l'article corpus du
Dictionnaire d'analyse du discours2 du positionnement
thorique partir duquel on l'envisage.
S'agissant du langage, on connat les problmes dont je
ne cite que les principaux :
- le problme qui concerne le recueil des donnes,
recueil qui dpend du choix de la matrialit langagire (paroles
orales, paroles crites), du choix du support qui vhicule ces
paroles en relation avec une situation de communication (pour
l'crit : lettres, rapports, journaux, tracts, circulaires, affiches,
etc. ; pour l'oral : radio, tlvision, runions diverses, meetings,
conversations du quotidien, etc.). Ce sont autant d'aspects qui
ont des incidences sur la manire de recueillir des donnes :
exploration du terrain, procds d'enregistrement libres ou
contraints, au su ou l'insu des acteurs de parole, etc. ;
- le problme qui concerne l'importance du matriel
recueilli et de sa valeur de reprsentativit ; le corpus peut-il
tre considr exhaustif et clos, ou partiel et ouvert, et,

1 Voir la Revue Corpus dite par l'universit de Nice-Sophia Antipolis,


particulirement les numros 1 (2000) et 4 (2005).
2 Charaudeau P. et Maingueneau D. (2002), Dictionnaire d'analyse du
discours, Paris : Seuil.
Corpus n8 Corpus de textes, textes en corpus
(2009), 37-66
P. CHARAUDEAU

consquemment, peut-il tre considr comme un objet en soi


ou un simple outil (Mayaffre 2005). On sait que l'hypothse de
l'exhaustivit vieux rve de l'attitude positiviste n'est plus
tenue, et ce malgr le dveloppement rcent de la dnomme
linguistique de corpus initie dans le monde anglo-britannique3,
et prolonge en France par quelques auteurs avec une certaine
prudence4, car le langage est en perptuelle production. Il peut
se faire cependant que la clture du corpus soit revendique,
titre exprimental, par certains analystes5. Si le corpus est
considr comme partiel se pose alors le problme de sa valeur
comme chantillon, et de la possibilit de le faire varier en
sous-corpus. Quant considrer si le corpus est un objet en soi
ou un instrument, cela renvoie la question du contexte que
nous analyserons plus loin ;
- le problme qui concerne, l'intrieur du matriau
langagier, les catgories qui vont faire l'objet de l'analyse :
grammaticales (connecteurs, pronoms, verbes, etc.), lexicales
(par champs ou de faon alatoire), syntaxiques (selon divers
types de construction) ; mais aussi les variables externes la
production des actes langagiers, telles que les types de
locuteurs, les dispositifs de communication, de mme que les
variables concernant le temps (l'historicit) et l'espace (les
cultures) ;
- le problme enfin qui concerne l'outil de traitement
des donnes : dpouillements manuels, traitement informatique
l'aide de logiciels ad hoc, constitution d'chantillons partir
de bases de donnes (voir ci-dessous).
Dans tous ces cas, se pose la question de la pertinence
de ces choix en relation avec les prsupposs thoriques, et de
l'ventuelle circularit qui peut s'instaurer entre ceux-ci et le
corpus.

3 Voir particulirement Williams G. (2005).


4 Voir Habert B. et alii (1997) et Mayaffre D. (2005).
5 Dans l'article Lexicomtrie du Dictionnaire d'analyse du discours,
op.cit., M. Tournier crit : la lexicomtrie n'est pas une thorie mais
une mthodologie d'tude du discours, qui se veut exhaustive,
systmatique et automatise ; et plus loin : [Le corpus d'tude] Il est
ferm, au moins le temps d'une exprience, car on ne peut compter que
sur des ensembles stabiliss .

38
Dis-moi quel est ton corpus, je te dirai quelle est ta problmatique

Je voudrais montrer dans cet article de quelle faon la


construction d'un corpus, en analyse de discours, dpend d'un
positionnement thorique li un objectif d'analyse, ce que
j'appelle une problmatique. On envisagera trois types de
corpus selon qu'ils se rfrent une problmatique dite
cognitive, communicative ou reprsentationnelle. Puis on
montrera comment un corpus de textes se construit dans un jeu
de dconstruction et de reconstruction selon des critres
d'ouverture ou de clture (intertexte et hypertexte), de contraste
(interne et externe) et de pertinence quantitative et/ou
qualitative. On terminera par le renvoi un exemple d'analyse
pratiqu par le Centre d'Analyse du Discours propos du
discours d'information tlvis, afin de montrer comment on
peut tirer parti de certaines de ces options, et comment elles
peuvent se combiner.
Mais auparavant, il est ncessaire de circonscrire la
spcificit de l'analyse du discours au sein des sciences du
langage, car on ne peut traiter la question des corpus de
discours sans s'interroger sur certaines notions souvent
employes dans ce domaine.

1. De quelques distinctions indispensables pour former des


corpus de discours
Dans les sciences humaines et sociales, certaines disciplines
privilgient des tudes de terrain avec des procdures suivant une
dmarche descriptivo-empirique (sociologie, anthropologie),
d'autres privilgient des procdures d'exprimentation
(psychologie sociale), d'autres des analyses partir d'archives ou
en construisant des corpus avec des procdures plus ou moins
systmatiques de recueil et traitement du matriel smiologique
runi (histoire, sciences du langage).
Les sciences du langage font donc partie des disciplines
de corpus : rassemblement de donnes linguistiques (sous
forme de textes crits ou oraux, de documents divers,
d'observations empiriques raisonnes ou d'enqutes
provoques) que l'on constitue en objet d'analyse. Ds lors se
pose la question de savoir quelle est la nature de ces donnes.
On ne peut donc traiter de la question du corpus si l'on n'est pas au

39
P. CHARAUDEAU

clair (c'est--dire si on ne prend pas position) sur certaines notions


qui sont au cur des sciences du langage, dont j'envisagerai ici les
distinctions qui me paraissent les plus fondamentales :
langue / discours, texte / discours, texte / contexte.
1.1 Langue / discours
Vieille lune diront certains. Et pourtant, malgr Saussure lui-
mme dclarant que la langue n'est cre qu'en vue du discours,
de nombreuses dfinitions de la notion de discours ont eu cours
depuis les annes soixante-dix qui ne facilitent pas la clart de
son opposition langue. Renvoyons Maingueneau qui, en
19766 puis 19967, en rpertorie les dfinitions, et rappelons que
certaines de ces dfinitions font du discours un prolongement de
la langue, opposant l'unit de phrase une unit
transphrastique (Harris 1969), d'autres intgrent des
catgories de discours dans la langue8, d'autres encore opposent
discours nonc en rapportant cette notion aux conditions de
production dun texte9 ; d'autres enfin qui font de ce terme de
discours un usage que Maingueneau qualifie de
paralinguistique dans la mesure o il sintgre dans une
rflexion qui participe de plusieurs disciplines telles que
lhistoire, la philosophie, la smiologie, voire la psychanalyse10.
Ici n'est pas le lieu de discuter ces dfinitions. Il s'agit
seulement de bien marquer la diffrence entre langue et
discours dans ce qu'elle implique du point de vue de l'analyse et
de la constitution de son objet. Ces deux notions signalent deux
lieux de structuration du langage.
1) La langue, comme lieu de conformation entre des
formes et du sens s'organisant en systmes, c'est--dire en
rseaux de relations entre des units minimales selon des rgles

6 Initiation aux mthodes de lanalyse du discours, Paris, Hachette-


Universit, 1976.
7 Les termes cls de l'analyse du discours, Paris, Seuil, coll. Mmo, 1996.
8 Comme O. Ducrot qui relie cette notion son composant rhtorique
mais l'intrieur de la langue, jusqu' dire que l'argumentation est dans
la langue .
9 Voir sa mise en application dans le numro 81 de la revue Langages, mars
1986, Analyse de discours, nouveaux parcours, Paris, Larousse, 1986.
10 A travers les crits de Michel Foucault, Julia Kristeva et Jacques Derrida.

40
Dis-moi quel est ton corpus, je te dirai quelle est ta problmatique

de combinaisons syntagmatiques et paradigmatiques, systmes


dont on pourra dire qu'ils tmoignent de catgories de pense
prenant position sur des visions du monde11. Les units prises
en compte sont des units phonologiques, morphologiques,
smantiques, d'ordre grammatical ou lexical, et les corpus sont
constitus d'un ensemble de co-occurrences par ressemblances
de forme ou de sens.
2) Le discours, comme lieu, la fois, de structuration
des usages en fonction des conditions de production dans
lesquels ces usages se manifestent, tmoignant des
comportements langagiers des sujets parlants, et de
catgorisation de sens qui tmoigne des systmes de
connaissance et de croyance auxquels adhrent les individus ou
groupes sociaux. Ici, on n'est plus dans une combinaison
d'units, seraient-elles transphrastiques, car si l'on est dans un
au-del de la phrase, le sens de discours rsulte d'une
multiplicit de facteurs d'ordre contextuel (voir ci-dessous) qui
font que le sens n'est reprable dans aucune des units qui
composent une production discursive quelconque, et ne peut
tre infr que par le jeu des combinaisons de tous ces facteurs.
Pour reprendre un mot de Roland Barthes, le sens s'attache aux
formes de faon diffracte 12. Un corpus de discours ne peut
tre constitu que par un ensemble de productions langagires
en situation d'usage.
De l, la constitution de deux linguistiques, l'une que
l'on appellera linguistique de la langue oriente vers la
description des systmes intrinsques chaque langue, corpus
plus ou moins clos, et qui prsuppose l'existence d'un sujet
oprateur de catgories cognitivo-linguistiques ; l'autre que
l'on appellera linguistique du discours oriente vers la
description des usages et des significations sociales, corpus,

11 Voir la tradition de l'analyse linguistique franaise depuis A. Martinet en


passant par G. Guillaume, B. Pottier, R. Martin, A. Culioli.
12 Roland Barthes par roland barthes, Paris, Le Seuil 1975. Je me permets de
renvoyer galement le lecteur aux ides de texte toil et texte
bris que R. Barthes dveloppe dans S / Z, Paris, Seuil, 1970.

41
P. CHARAUDEAU

par dfinition ouvert, et qui prsuppose un sujet oprateur de


catgories sociodiscursives et porteur d'imaginaire social13.
Prenons un exemple pour illustrer cette diffrence. Un
nonc comme J'ai trente ans pourra faire l'objet d'une
analyse linguistique de langue lorsque, insr dans un corpus
d'noncs similaires conformes au schme :
< Pr. x Vb. x quant. x Sb. >
on en dterminera l'actant (celui qui parle) auquel est attribu
(avoir) une certaine proprit (ans), laquelle est quantifie
(trente), le tout dans un acte d'nonciation qui dit que cette
assertion doit tre rapporte au sujet parlant lui-mme (Je) dans
une modalisation locutive affirmative ; de plus, en observant
un certain paradigme lexical, on dira que ce ans dsigne un
certain segment du temps qui renvoie l'ge de la vie. Mais
globalement, J'ai trente ans ne signifiera ici rien d'autre que
/ j'ai trente ans /.
Si l'on considre maintenant cet nonc dans son
contexte de production, savoir un sportif rpliquant la
rflexion d'un ami qui s'tonne de le voir quitter la comptition :
J'ai trente ans , alors cet nonc signifie entre autres choses :
/ Je suis trop vieux /. Mais s'il s'agissait d'une personne qui,
venant d'tre licencie d'une entreprise, rpond un ami lui
suggrant que c'est peut-tre parce qu'il a pass l'ge, alors le
J'ai trente ans signifie : / Mais je suis encore jeune ! /. Ces
sens dpendent videmment de la suite des mots contenus dans
l'nonc, mais ils ont t obtenus par opration d'infrence
partir de la connaissance que l'interlocuteur peut avoir de
l'identit de celui qui lui parle (sportif / employ) et de l'univers
de sens dont il est chaque fois question (sport / entreprise),
autant d'lments inclus dans un corpus mmoriel de discours.
Reste que le sens de discours, s'il est infr, l'est partir
de formes dont la combinaison constitue un texte. Il s'agit donc
de savoir si texte et discours sont une seule et mme chose.

13 Je ne peux discuter ici la notion d'imaginaire pour laquelle je renvoie


provisoirement le lecteur ce que j'en dis dans mon Le discours
politique. Les masques du pouvoir, Paris, Vuibert, 2005, et dans Tiers
o es-tu ? , in La voix cache du Tiers. Des non-dits du discours, Paris,
L'Harmattan, 2004.

42
Dis-moi quel est ton corpus, je te dirai quelle est ta problmatique

1.2 Texte / discours


tant donn le nombre d'crits qui existent sur ces notions,
voire sur cette distinction qui n'est pas toujours opre, on ne
pourra s'tendre longuement. Seulement faire un constat et
prendre position, car cela est ncessaire pour dterminer un
corpus de discours.
Le constat : rarement sont opposs de faon nette texte
et discours. Au point que des ouvrages se rclamant de
l' analyse textuelle emploient souvent le terme analyse de
discours et inversement. Conscient de la chose, Jean-Michel
Adam propose de distinguer texte et discours comme les deux
faces complmentaires d'un objet commun pris en charge par la
linguistique textuelle 14, prcisant que celle-ci privilgie
l'organisation du cotexte selon des critres de cohsion, alors
que l'analyse du discours s'occupe davantage du contexte selon
des critres de cohrence. Cette distinction pointe bien que
l'objet texte se dfinit par l'organisation de sa configuration en
rapport avec ce qui l'entoure et que le discours concerne
davantage l'organisation smantique, mme si le premier est
aussi porteur de sens et le second se repre travers des formes.
Mais cette distinction ne me semble pas assez nette pour
distinguer ensuite corpus de textes et corpus de discours.
D'autant que si l'on fait intervenir la srie des notions proposes
par G. Genette : paratexte, mtatexte, pitexte, intertexte et
hypertexte, quoi on peut ajouter la notion d'interdiscours
introduite par l'cole franaise d'analyse du discours des annes
soixante-dix / quatre-vingt15, on ne voit pas toujours bien o se
trouve le frontire entre ces deux notions.
La prise de position. Je ne pense pas avoir un point de
vue trs diffrent de celui de Jean-Michel Adam, sauf
considrer que le rapport de complmentarit entre analyse de
texte et analyse de discours n'est pas de symtrie. Ce ne sont pas
les deux faces d'une mme pice, parce qu'il y a des discours

14 Voir l'article Texte du Dictionnaire d'analyse du discours, op. cit.


15 Voir Pcheux M. Les Vrits de La Palice. Linguistique, smantique,
philosophie, Paris, Maspero, 1975 ; et Courtine J.-J. Quelques
problmes thoriques et mthodologiques en analyse du discours. A
propos du discours communiste adress aux chrtiens , Langages 62,
1981.

43
P. CHARAUDEAU

dans un mme texte, et un mme discours dans plusieurs textes.


Le discours nest pas le texte mais il est port par des textes. Le
discours est un parcours de signifiance qui se trouve inscrit dans
un texte, et qui dpend de ses conditions de production et des
locuteurs qui le produisent et l'interprte. Un mme texte est
donc porteur de divers discours et un mme discours peut
irriguer des textes diffrents. Du discours traverse des textes
diffrents, et un mme texte peut tre porteur de discours
diffrents. Pour comprendre le slogan publicitaire : Obernai,
la premire grand bire avec un tiers de calories en moins , je
suis amen mobiliser une srie de discours qui ne sont pas dits
explicitement dans ce slogan, mais qui s'y trouvent
implicitement, savoir : / je dois avoir des connaissances en
dittique / > / cette bire ne fait pas grossir / > / la minceur est
valorise dans ma socit / > / les femmes peuvent boire cette
bire, traditionnellement rserve aux hommes /. Cela
n'empche pas que par ailleurs les discours sur la dittique, la
minceur et sa valeur culturelle puissent se trouver configurs
dans d'autres types de texte des plus savants aux plus vulgariss.
Comme le discours a besoin de configuration textuelle
pour signifier, cela veut dire que cette signifiance, un moment
donn, a t texte. Il se produit alors un phnomne trange de
va-et-vient entre diffrents textes se faisant cho, au terme
duquel se construit une signifiance abstraite qui se trouve dans
diffrents textes sans tre uniquement l'un d'entre eux. Pour
prendre un exemple simple, le discours du pch originel et
l'imaginaire de culpabilit et de rdemption dont il est porteur
s'est construit en Occident du fait de l' chosation entre
divers textes (Bible, vangiles, crits des thologiens,
commentaires de philosophes, prdications de l'glise, jusqu'
des textes publicitaires, des magazines people, des films, etc.).
Ainsi se dposent des discours dans la mmoire collective.
1.3 Texte / contexte
A considrer le discours comme un lieu de signifiance abstrait
se configurant diversement dans des textes, on retrouve les
notions de d'intertextualit de Genette et de dialogisme de
Bakhtine. Partant de cette dernire notion qui a donn lieu

44
Dis-moi quel est ton corpus, je te dirai quelle est ta problmatique

diverses interprtations16, je dirai que ce jeu d'chos peut


s'oprer entre des textes mais aussi entre des discours. Dans le
premier cas, on aura affaire, au sens strict du terme, une
intertextualit qui se manifeste dans divers types de citation
- ce que Jacqueline Authier-Revuz nomme l'htrognit
montre 17 : il y a du texte dans du texte, mme partiel,
mme dform. Dans le second cas, on aura affaire une
interdiscursivit, un jeu de renvois entre des discours qui ont
eu un support textuel mais dont on n'a pas mmoris la
configuration 18. Cela nous explique qu'un corpus ne peut tre
que de textes et non point de discours, moins de dcider que
les textes runis le sont au nom d'un certain discours. Mais
n'anticipons pas, je reviendrai l-dessus. Nous voil, en tout cas,
arriv la notion de contexte.
Depuis, les premiers travaux en linguistique de la
langue, la notion de contexte s'est considrablement tendue
avec des dnominations variables. En rsum, on parlera : de
contexte strictement linguistique, lorsqu'il s'agit de se rfrer
l'environnement verbal qui se trouve avant et/ou aprs une unit
dtermine ; de contexte textuel, lorsqu'il est constitu de textes
produits par une mme source (par exemple, les divers crits
d'un mme auteur) ; de contexte paratextuel (Genette), lorsqu'il
est constitu de textes ou fragments de textes se trouvant en
coprsence dans un mme espace scriptural (les titres, sous-
titres, chapeaux, lgendes d'une page de journal) ; de contexte
mtatextuel (Genette), lorsqu'il est constitu de textes qui se
commentent les uns les autres ; de contexte hypertextuel
(Genette), lorsqu'il est constitu de textes qui se citent, se
renvoient les uns aux autres, se reprennent et se transforment,
comme sont les pastiches et parodies ; enfin, de contexte
intertextuel et interdiscursif (au sens o je viens de dfinir ces

16 Voir l'article Dialogisme du Dictionnaire d'analyse du discours, op. cit.


17 Authier-Revuz J. (1982), Htrognit montre et htrognit
constitutive : lments pour une approche de l'autre dans le discours ,
DRLAV 26 : 91-151.
18 Parce que, pour reprendre ce que dit D. Maingueneau : Tout discours
() a pour proprit constitutive d'tre en relation multiforme avec
d'autres discours , voir l'article Interdiscours dans le Dictionnaire
d'analyse du discours, op. cit.

45
P. CHARAUDEAU

notions), lorsque sont convoqus des textes et discours pour


justifier les interprtations du sujet interprtant (ou analysant).
Autrement dit, dans cet largissement progressif de la notion de
contexte, apparat une prise de conscience progressive, non
seulement du rapport entre texte et tout l'environnement textuel
qui peut s'y rapporter, mais aussi entre le texte et un hors-
texte (parfois appel cotexte), c'est--dire des donnes
prsentes dans les conditions de production de l'acte de langage.
Ce que je voudrais souligner ici, c'est un aspect, qui est
rarement pris en compte par les diffrents courants d'analyse du
discours, et qui me permet d'introduire la notion de contexte
situationnel. L'aspect qui concerne, dans les conditions de
production, non seulement les prsupposs de positionnement
interdiscursif (prsupposs idologiques pour certains), mais
aussi le conditionnement de la situation de communication elle-
mme : la nature de l'identit des partenaires de l'acte de
langage, la finalit de la situation, les dispositifs et les
circonstances matrielles de celle-ci. Cet ensemble constitue ce
que j'appelle un contrat de communication, lequel contraint le
sujet parlant en lui donnant les instructions discursives qu'il
devra suivre pour procder son acte d'nonciation19. Certes les
ethnographes et ethnomthodologues de la communication
interactionnelle nous ont habitu prendre ces variables en
considration pour analyser les conversations, mais elles ne sont
pas suffisamment prises en compte dans l'analyse du discours20.
C'est que l'analyse du discours a surtout travaill sur l'hypothse
que la force du langage se trouve davantage dans ce que disent
les mots que dans ce qu'ils transmettent. Et donc on s'est
longtemps pench sur ce que dit le langage sans s'interroger sur
le pouvoir du langage comme effet d'influence. Autrement dit,
pour reprendre une observation de Roland Barthes, on pense
toujours que le signe signifie et on oublie qu'il signifie
21. Or le phnomne de signifiance rsulte des deux : le
langage signifie en mme temps quil transmet ; cest dans

19 Charaudeau P. (2004).
20 Et pourtant, de mon point de vue, l'analyse conversationnelle fait partie de
l'analyse du discours.
21 Roland Barthes par roland barthes, op. cit.

46
Dis-moi quel est ton corpus, je te dirai quelle est ta problmatique

lacte mme de transmission quil signifie avec leffet quil


produit sur lautre, cest--dire son interprtation. Ne pas se
poser la question des effets, cest amputer lacte de langage de
sa signification phnomnale, savoir qu'il est le rsultat d'une
co-construction. On ne peut saisir le sens d'une expression
comme prfrence nationale que si on la considre dans son
contexte situationnel, lequel nous dira qui l'emploie (Jean-Marie
Le Pen), l'adresse de qui (citoyens-lecteurs), dans quel
dispositif communicationnel (campagne lectorale), avec quelle
finalit (sduire), et, videmment, en le rapportant une
certaine tradition historique franaise (interdiscours).
Le problme qui se pose alors est celui de l'articulation
entre, d'une part ce quoi renvoient les discours du point de vue
des valeurs, et d'autre part les effets quils sont susceptibles de
produire. Par exemple, le pouvoir d'influence des mots du
discours politique n'est pas seulement dans la force du projet
d'idalit sociale dont ils sont porteurs, mais aussi, et de plus en
plus, dans leur cho aux systmes d'attente des citoyens (effet
de miroir), lesquels sont davantage sensibles au charisme des
personnalits politiques, l'motion que celles-ci suscitent,
quaux ides.
Le contexte situationnel doit donc tre pris en compte
l'gal des autres pour former des corpus. videmment, aucun
corpus ne peut prendre en compte la totalit des ces contextes,
mais c'est de la prise en considration de cette multiplicit
contextuelle que l'on pourra construire des corpus de faon
raisonne.

2. Spcificits du corpus en analyse du discours


A considrer ces diffrentes distinctions : le discours comme
signifiance / le texte comme configuration ; le contexte sous ses
trois aspects (paratextuel, interdiscursif et situationnel)22, on est

22 C'est que, au bout du compte, on peut attribuer contexte une fonction


englobante se composant du contexte paratextuel, qui prend en compte
tout ce qui est coprsent dans un mme espace textuel, du contexte
interdiscursif, qui prend en compte tout texte (y compris les
mtatextuels) et discours se rfrant un mme univers de discours, et
du contexte situationnel qui prend en compte les conditions

47
P. CHARAUDEAU

conduit justifier le fait quun corpus de discours soit toujours


une construction rsultant de divers types de regroupement :
corpus selon le paratexte (de mots, dnoncs, de modes
dnonciation), corpus selon l'interdiscours (savoirs de
connaissance, savoirs de croyance), corpus selon la situation
(locuteurs, finalit et dispositif). Ces regroupements se font en
fonction de la problmatique d'analyse et de la mise en
contraste choisies.
2.1 Corpus et problmatique d'analyse
On n'utilisera pas le terme problmatique avec le sens qu'il a
dans l'usage courant, comme dans l'expression C'est
problmatique pour signifier qu'une question est difficile
expliquer, voire sans solution, ou qu'une affirmation est
incertaine, douteuse ou parfois suspecte. Une problmatique
(emploi substantif) est un ensemble cohrent de propositions
hypothtiques (ou de postulats) qui, l'intrieur d'un champ
d'tude, dterminent la fois un objet, un point de vue d'analyse
et un questionnement par opposition d'autres questionnements
possibles. On ne confondra donc pas problmatique et thorie
qui se diffrencient en ce que cette dernire a un corps de
concepts et de catgories plus ou moins modlis
s'accompagnant d'un cadre mthodologique.
En observant les tudes qui se rclament de prs ou de
loin du discours, et en les interrogeant selon le type d'objet
qu'elles analysent et la conception qu'elles se font du sujet qui
en est l'ordonnateur, on peut reprer trois grandes
problmatiques qu'on appellera cognitive, communicative et
reprsentative, chacune dterminant un type de corpus.
2.1.1 Une problmatique dite cognitive et catgorisante :
Lobjet dtude est considr comme un ensemble de
mcanismes discursifs dont il sagit soit de reprer lexistence et
le mode dagencement lintrieur dune production discursive
quelconque (texte ou noncs alatoires), soit de dcrire le
comment de leur fonctionnement, et particulirement leur mode
de production. Dans le premier cas, on tudie, par exemple, les

nonciatives, quitte oprer, pour autant que de besoin, des distinctions


au sein de chacun d'eux.

48
Dis-moi quel est ton corpus, je te dirai quelle est ta problmatique

jeux de cohrence et cohsion dans un texte, ou certains mots


du discours (connecteurs, modalits). On trouve le second cas
dans les travaux de certains psycho-cognitivistes du langage qui
cherchent dcrire des parcours d'organisation discursive
down ou up de ralisation des schmes, scripts et
scnarios. Dans ces deux cas, il en sort des catgories
instrumentales danalyse qui servent reprer ou produire des
configurations discursives.
Le sujet concern par la dtermination dun tel objet
sera appel cognitif dans la mesure o nest pris en compte chez
celui-ci que son aptitude produire ou reprer des oprations
darticulation discursive : relations anaphoriques ou
cataphoriques, connexions coordonnes ou subordonnes,
relations de cohrence et de cohsion, de progression et de non
contradiction, etc., sans aucune prise en compte de sa nature
sociale.
Dans une telle problmatique, le corpus n'a pas besoin
dtre finalis en fonction dune situation de communication
particulire. De ce point de vue, il peut tre dit alatoire, et
seulement contraint par les contextes linguistiques dans lesquels
apparaissent ces mcanismes. On a affaire un corpus de co-
occurrents par catgories d'opration linguistico-discursive.
Appartiennent cette problmatique, des travaux dans
la ligne des thories de la prsupposition23 et du sens des mots
du discours24, des topo et de l'orientation argumentative25 et de
la pragmatique (les connecteurs, les embrayeurs et les actes de
parole)26, ainsi que les travaux en grammaire de texte qui traite
des problmes de cohrence et cohsion textuelles27.

23 Ducrot O., Dire et ne pas dire, Paris, Hermann, 1991.


24 Ducrot O. et alii, Les mots du discours, Paris, Minuit, 1980.
25 AnscombreJ.-C. et Ducrot O., L'argumentation dans la langue, Bruxelles,
Mardaga, 1983.
26 On pourra, sur ces questions, consulter le Dictionnaire encyclopdique de
Pragmatique de J. Moeschler et A. Reboul, Paris, Seuil, 1994.
27 Charolles M. (1995) Cohrence, cohsion et pertinence du discours ,
Travaux de linguistique 29 : 125-151 ; et l'on pourra se rfrer aux
travaux de Van Dijk T.A. et Kintsch W., particulirement : Strategies of
discourse comprhension, New York, Academic Press, 1983.

49
P. CHARAUDEAU

2.1.2 Une problmatique dite communicative et descriptive


Lobjet dtude est ici empirique, ou plus exactement il est
dtermin partir de lobservation (plus ou moins nave) des
manifestations du monde phnomnal. Par exemple, nous
pouvons observer que les comportements des individus dans
leurs actes dchange social ont une certaine rcurrence ce qui
permet de faire lhypothse quils sont soumis des conditions
de ralisation et quils obissent des rgles ; cest cela qui
autorise les constituer en objet danalyse. Ds lors, lobjet
dtude issu de cette empirie peut tre structur en types
idaux (au sens durkhemien) de communication partir, et
lintrieur, desquels sont dcrites les caractristiques discursives
qui sattachent chacun deux (identit des locuteurs, finalit,
dispositif). Une telle dmarche aboutit, entre autres choses,
ltablissement de diverses typologies dites de discours, de
textes, de genres, ou de situations communicatives, mais qui
supposent toutes une thorisation de ces types idaux de
communication. Cette problmatique peut tre appele
descriptive du fait quelle vise dcrire des types de situation
communicative.
Le sujet, ici, est li cette empirie des changes
communicatifs, mais il est lui aussi construit et thoris en
fonction de la faon dont on construit et thorise ces changes.
Le sujet est donc un sujet de communication qui se dfinit par
son identit psychologique et sociale, par un comportement qui
est finalis la fois par les contraintes quil subit sil veut
sinsrer dans lchange (de ce point de vue il est un on , un
sujet de la norme contractuelle), et par ses propres intentions vis
vis de lautre (de ce point de vue il est un je , un sujet
s'individuant).
Le corpus se ressent de cette vision empirique de lobjet
dtude. Il est gnralement constitu de textes (productions
langagires en situation) qui sont regroups en fonction de leur
appartenance tel ou tel type de situation. Par exemple, textes
publicitaires, textes journalistiques, textes de manuels scolaires,
textes administratifs, textes de programmes politiques, et divers
textes conversationnels (changes tlphoniques, demandes de
renseignements, interviews, entretiens, dbats, etc.). Ce type de

50
Dis-moi quel est ton corpus, je te dirai quelle est ta problmatique

regroupement permet ensuite de procder des comparaisons


autour dun mme contexte paratextuel et situationnel.
Appartiennent cette problmatique, des travaux autour
de la description des genres du discours et des objets
empiriques catgoriss en situation de communication28
2.1.3 Une problmatique dite reprsentationnelle et
interprtative
Lobjet dtude de cette problmatique est dfini travers des
hypothses de reprsentations socio-discursives dont on
suppose quelles sont dominantes un moment donn de
lhistoire dune socit (elles sont donc socio-historiques), et
quelles caractrisent tel ou tel groupe social. En cela elles sont
interprtatives, puisquil faut bien avoir, au dpart, une
hypothse sur ce que sont les positionnements sociaux en
relation avec les pratiques discursives et les types de
sujets qui sy attachent. La difficult de cette problmatique
rside justement dans le fait quil faut faire ces hypothses et
que pour ce faire on doit sappuyer sur des manifestations
discursives extrmement diverses, non toujours explicites, voire
diffuses et mme floues, ce qui est un problme pour la
constitution du corpus.
Le sujet, dans cette perspective, fait lui aussi problme
et a t souvent discut. Du fait quil est lorigine des
pratiques discursives qui construisent les reprsentations, il peut
tre considr comme un sujet passif ou actif. De l, deux
positions :
- lune, radicale, qui ne confre ce sujet dautre
existence que celle dune illusion 29, car il serait
compltement surdtermin par ce que Pcheux appelle le
pr-construit des formes discursives . Le sujet ne

28 Branca-Rossof S. (1997), Les lettres de rclamation adresses au service


de la redevance , Langage et socit 81 ; et Charaudeau P. (2001),
Vises discursives, genres situationnels et construction textuelle , in
Analyse des discours. Types et genres, Toulouse : d. Universitaires du
Sud.
29 Pcheux dit se situer dans un champ socio-historique o se construisent
les sens, dans lobscurit invitable des illusions du sujet , in Mise au
point et perspectives propos de lAnalyse Automatique du Discours ,
Langages 37, 1975.

51
P. CHARAUDEAU

sappartient pas, il est parl par un ailleurs30 qui sera appel


tantt idologie (Althusser), tantt inconscient (Authier-Revuz)
en se diluant dans la conscience du groupe social. Dans un cas
comme dans lautre, le sujet nest pas une je mais un a
(idologique ou inconscient) qui parle travers le sujet parlant,
et ce nest pas un hasard si les tenants de cette position ont
toujours opr un paralllisme entre idologie et inconscient.
- Lautre position est moins globalisante. Elle ne nie pas
le jeu de la surdtermination du sujet, mais au lieu den faire
une illusion, elle en fait quelque chose de positif. Il existe dans
toute socit des discours de doxa (lieux commun, strotypes,
savoirs partags). Ceux-ci circulent et se rpartissent de faon
non alatoire dans les diffrents groupes sociaux. Tout sujet est
donc porteur, pour une part, de certains de ces discours, et du
mme coup cet appariement rvle son positionnement social.
On peut donc dire que, dune certaine manire, ce sujet est
responsable de ses reprsentations, ce qui ne veut pas dire
qu'il en soit conscient. Font cho cette position que nous
qualifierons de sociologique, les travaux de certains sociologues
franais qui s'inscrivent dans une sociologie constructiviste31,
ainsi que ceux qui travaillent analyser les reprsentations de
lespace public dans les mdias32.
Le corpus varie selon lune ou lautre position. Dans la
premire, le corpus est constitu dun ensemble de textes-
archives qui sont slectionns pour leur valeur emblmatique de
discours dominant, le plus souvent lis une institution sociale :
dictionnaires, encyclopdies, productions discursives de
groupes constitus (cahiers de dolances, partis politiques,
syndicats) et toutes productions ayant valeur de discours
fondateur33.

30 Voir l'effet Munchausen dcrit par Michel Pcheux dans Les Vrits de
La Palice, op. cit.
31 Voir ce propos Choses dites de Pierre Bourdieu.
32 Qur L. (1995).
33 Voir, ce que Dominique Maingueneau et Frdric Cossutta appellent des
textes constituants (religieux, scientifiques, philosophiques,
littraires, juridiques, etc.) dans L'analyse des discours constituants ,
Langages 117, mars 1995.

52
Dis-moi quel est ton corpus, je te dirai quelle est ta problmatique

Dans la deuxime position, le corpus est constitu dun


ensemble de ce que l'on appellera des signes-symptmes qui
reprsentent de faon emblmatique des systmes de valeurs.
Ces signes peuvent tre des mots ( racisme , immigration ,
solidarit etc.)34 ou des formules diverses ( purification
ethnique )35 rvlatrices de manires de dire ; ce peut tre
galement des signes iconiques (des mises en scne dimages)
qui permettent dtudier par exemple les reprsentations de la
femme 36 dans les publicits ou de la violence la
tlvision37.
Le corpus est ici d'ordre interdiscursif, mais il pourrait
inclure d'autres composantes dans la mesure o l'on peut faire
lhypothse que les divers lments d'une situation de
communication (identits, finalit, dispositifs) tmoignent
galement des valeurs et des idologies. Par exemple, si lon
compare la faon dont la presse concevait son rubriquage et ses
genres dcriture il y a 50 ans et maintenant, on peut voir que la
faon d'envisager son rle dans la symbolique dmocratique a
chang. Ce qui nous renvoie la problmatique prcdente.
2.2 La mise en contraste : un jeu de
dconstruction / reconstruction
Suivant l'hypothse saussurienne qui dit que le sens nat de la
diffrence, le sens de discours ne peut tre saisi que dans ce qui
fait contraste, du fait de la mise en regard de diverses squences
discursives. Ainsi les corpus doivent-ils tre construits selon
certaines variables permettant de les comparer, des variables
externes ou internes.
Les variables externes permettent de mettre en regard
des ensembles textuels ou discursifs appartenant des poques
diffrentes (variable temporelle) : par exemple, la presse du
XIXme sicle compare celle daujourdhui. Ou bien, ces
ensembles peuvent appartenir des espaces diffrents (variable

34 Boyer H. (1983) ; et voir Sans distinction de race, le numro 33 de la


revue Mots, Presse de la Fondation nationale des Sciences politiques,
Paris, dcembre 1992.
35 Krieg-Planke A. (2009).
36 Soulages J.-C. (2003).
37 Boyer H. et Lochard G. (1998).

53
P. CHARAUDEAU

spatiale et culturelle) : par exemple, la publicit franaise


compare la publicit brsilienne. Ou encore ils peuvent
appartenir des dispositifs situationnels diffrents (variable de
genre) : par exemple, le discours politique et le discours
publicitaire afin de savoir si les stratgies de persuasion sont les
mmes. Ces corpus contrasts permettent de trancher dans les
discussions qui opposent divers points de vue : celui qui dfend
la prennit des discours ( c'est toujours la mme chose
travers le temps et l'espace )38, oppos celui qui dfend tout
prix le changement des discours ( ce n'est jamais pareil selon
les poques)39 ; ou encore le point de vue qui globalise divers
genres discursifs : tout a (discours politique, discours
publicitaire), cest de la propagande , oppos celui qui les
distingue. Ressemblances et diffrences entre les
caractristiques de divers corpus permettent de prendre acte des
changements ou de la prennit des discours, de leur gnralit
ou de leur spcificit quant au contexte de production ou quant
au genre.
Mais il y a aussi des variables dites internes dans la
mesure o elles se situent l'intrieur d'un mme champ de
discours. Elles correspondent aux composantes situationnelles
qui structurent un domaine de pratiques sociales. Le champ
politique, par exemple, se compose de divers domaines
dactivit : ceux du gouvernement, des parlements, des partis,
des Conseils (constitutionnel, dtat, conomique et social), etc.
La parole n'y circule pas de la mme faon, les normes
contractuelles ne sont pas les mmes, les stratgies discursives
ne s'y dploient pas de la mme manire, partant, le sens des
mots varient selon ces situations. Sans compter le fait que le
discours politique nest pas le mme non plus selon que les
acteurs se trouvent en situation de conqute du pouvoir
(campagnes lectorales) ou dexercice du pouvoir, la premire
conduisant produire des discours de promesse qui sont de

38 Par exemple, comme on l'a entendu propos de la dernire campagne


lectorale : les campagnes se ressemblent toutes, les discours
lectoraux ne changent pas quelle que soit lpoque .
39 Par exemple, comme on l'a galement entendu au cours de la mme
campagne lectorale : Cette campagne n'est pas comme les autres ;
On n'a jamais aussi peu parl des questions de fond .

54
Dis-moi quel est ton corpus, je te dirai quelle est ta problmatique

lordre du souhaitable, la seconde des discours de justification


qui sont de lordre du possible. Il conviendra alors de construire
l'intrieur d'un vaste corpus politique des sous-corpus
contextes situationnels divers.
Il est galement une autre faon doprer des contrastes
variables internes. Cest celle qui consiste procder des
rapprochements entre textes traitant de mmes notions. C'est le
travail que l'on est conduit faire lorsque, analysant des
dclarations d'acteurs politiques, on cherche comprendre le
sens attribu des mots comme autorit , galit ,
devoir et droit . Il est alors ncessaire d'avoir recours
des crits philosophiques traitant de la rpublique ou de la
dmocratie40.
Cette varit de corpus selon les diverses
problmatiques auxquelles ils se rattachent et selon un jeu de
dconstruction / construction aboutissant des sous-corpus,
nous renvoie deux questions qui sont largement discutes en
analyse du discours : la question de l'ouverture / clture du
corpus ; la question de son traitement quantitatif / qualitatif.
2.3 Une question heuristique : l'ouverture / clture du corpus
En rsumant les considrations prcdentes, on dira qu'un
corpus dpend du traitement que l'on a dcid de lui appliquer
(sous influence d'une problmatique et d'un certain jeu de
construction contraste). On pourra dire qu'il s'agit l d'une
circularit peu dmonstrative, mais comment faire autrement ?
On n'ira pas jusqu' dire que C'est finalement le corpus qui
fait la thorie 41, car ce serait nier le double mouvement
dductivo-inductif de la recherche en sciences humaines et
sociales, mais on dira : Dis-moi quel est ton corpus, je te dirai
quelle est ta problmatique / dis-moi quelle est ta
problmatique, je te dirai quel est ton corpus .
Le corpus participe ainsi d'une dmarche heuristique, en
ce que celle-ci propose un certain cheminement intellectuel

40 C'est ce quoi je me suis employ dans l'analyse de la dernire campagne


lectorale : Entre populisme et peopolisme. Comment Sarkozy a gagn,
Paris, Vuibert, 2008.
41 Dalbera.J.-Ph. (2002), Le corpus entre donnes, analyse et thorie ,
Corpus 1 : 99.

55
P. CHARAUDEAU

partir d'hypothses de base pour dcouvrir des faits et des


ides 42, c'est--dire pour interprter. Or, interprter est une
opration dlicate qui ne peut se faire qu'aprs coup, mme
lorsque dans une dmarche plus exprimentale on fait des
hypothses pralables. Interprter consiste en une opration de
mise en relation des faits observs avec d'autres faits pour en
tirer, par infrence, des hypothses de sens. Mais il est une autre
activit interprtative, celle qui consiste mettre en relation les
rsultats d'une analyse descriptive avec ceux d'autres analyses :
ceux d'autres corpus connexes (confrontation des articles de
diffrents journaux pour en interprter les ressemblances et
diffrences) ; ceux de corpus de textes d'un mme domaine
mais de situations diffrentes (confrontation des crits
journalistiques de diffrentes poques) ; ceux, enfin, des
analyses proposes par d'autres disciplines sur le mme
domaine discursif (philosophie, histoire, sociologie,
psychologie sociale), sur, par exemple, le domaine politique.
Dans les sciences humaines et sociales la dmarche est
double : empirico-descriptive et hypothtico-dductive .
Lune ne va pas sans lautre : la premire est davantage
dpendante doutils mthodologiques, la seconde de concepts
fondateurs et de catgories explicatives. La premire se droule
selon un mouvement centripte, la seconde selon un
mouvement centrifuge, ce qui explique que les corpus qui
s'inscrivent dans ces mouvements tendent, tantt se fermer sur
eux-mmes, tantt s'ouvrir.
Cest pourquoi un corpus nest jamais quun prtexte,
au sens de ce quil est un point de dpart indispensable pour une
analyse du discours, les textes devant tre confronts en
permanence d'autres textes et d'autres corpus. Car les
significations sociales se rpartissent dans une large
combinatoire des mots en rapport avec leurs diffrents
contextes. C'est galement pourquoi aucun corpus nest jamais
dfinitivement ferm, sa clture ne pouvant tre que le fait
d'une dcision provisoire des fins opratoires. Ce sont les

42 Voir le Dictionnaire de philosophie (entre Heuristique ), de Christian


Godin, Paris, Fayard, 2004.

56
Dis-moi quel est ton corpus, je te dirai quelle est ta problmatique

paramtres de contrastivit (externe et interne) du corpus


qui par le jeu des ressemblances / diffrences font sens.
Comment faire, ds lors, entre la conception d'un
corpus compltement ferm sur lui-mme, mais dont on sait
qu'il a besoin de se confronter d'autres corpus pour signifier,
et la conception d'un corpus dclar ouvert, mais dont il faut
chercher matriser les horizons sous peine de ne pouvoir le
rendre opratoire ?
Je procde pour ma part selon la mthode de l'escargot :
partir d'un premier corpus noyau dtermin selon des paramtres
de temps, d'espace, de genres, de dispositifs, de locuteurs, de
thmes, etc., et ce en fonction des objectifs d'analyse que l'on se
propose ; puis tendre progressivement ce corpus en le
confrontant d'autres, autant que de besoin, en fonction des
questions qui surgissent au fur et mesure des analyses.
J'en donnerai pour exemple l'tude des discours d'une
campagne lectorale. D'abord, on construit le corpus des
dclarations du candidat X dont on fait l'analyse selon
diffrentes catgories. Puis on peut confronter ces rsultats aux
corpus des dclarations des candidats concurrents pour en
reprer les diffrences et les jeux de renvois des uns aux autres,
une sorte de jeu de miroir, comme le dit D. Mayaffre qu'il
dsigne par l'expression corpus rflexifs 43. On peut aussi
comparer ces rsultats aux corpus des candidats du mme parti
des lections antrieures pour reprer en quoi ce candidat suit la
mme doctrine que ses prdcesseurs ou s'en diffrencie, et l'on
peut mme largir encore la comparaison en y intgrant le
corpus des dclarations et crits qui concernent l'idologie
d'appartenance du candidat afin de mesurer les degrs de
filiation politique ; et l'on peut faire ce mme travail de
confrontation pour chacun des autres candidats. On peut aussi
comparer les prestations d'un mme candidat selon les
situations de communication dans lesquelles il se trouve
(meeting, interviews journalistiques, dclarations tlvise,
dbats, etc.), afin de vrifier si ses stratgies de persuasion sont
les mmes ou diffrentes dans chacun de ces cas.

43 Voir : Les corpus rflexifs : entre architextualit et hypertextualit ,


Corpus 1 : 51-69.

57
P. CHARAUDEAU

Tout corpus renvoyant d'autres corpus dans un


enchanement de contextes situationnels, paratextuels et
interdiscursifs, se construit progressivement sous forme de ce
que G. Genette appelle une architextualit, notion reprise par
les tenants d'un traitement informatis des textes44. Un jeu de
rflexivit entre les corpus dont on voit qu'il ne peut tre
qu'ouvert, car c'est la dcouverte progressive des questions qui
se posent lors des analyses issues de ces confrontations qui
renvoie d'autres textes et donc d'autres corpus.
2.4 La question du traitement quantitatif / qualitatif du corpus
Je partage donc le point de vue de ceux qui disent que le corpus
n'est pas l'outil de la recherche mais l'objet de la recherche45, du
moins l'objet que l'on a construit en corpus en fonction de
prsupposs thoriques et mthodologiques. Se pose alors la
question du mode de traitement du corpus, corrlativement la
question de la pertinence d'une analyse quantitative au regard de
l'analyse qualitative.
De ma pratique de sujet analysant et de la mthode
d'analyse que nous avons prouve dans les travaux du Centre
d'analyse du discours46 sur des corpus mdiatiques, j'en tire qu'il
faut distinguer ce qui est de l'ordre du recueil des donnes, du
relev des rcurrences, du reprage des conditions de
communication.
Le recueil des donnes relve d'une logique
documentaire. L'objectif est de recueillir, dcrire et classer les
objets du monde et les phnomnes sociaux, selon des critres
de forme, sans hypothses particulires orientant la recherche
dans une direction ou une autre, et ce avec un idal
d'exhaustivit. Cela produits classements archivistiques divers,
catalogues et bases de donnes.
La dmarche est ici empirico-inductive , s'appuyant
sur une mthodologie techniciste : les marqueurs de description
et les catgories de classement sont penss simultanment avec
les caractristiques de l'outil technologique (la performance de

44 Ibid.
45 Voir l'introduction de Damon Mayaffre au numro 4 de Corpus (2005) : 10.
46 Avec Claude Chabrol, Guy Lochard et Jean-Claude Soulages.

58
Dis-moi quel est ton corpus, je te dirai quelle est ta problmatique

l'outil peut influer en retour sur les marqueurs et les catgories),


ainsi que les modes de reprsentation de ces classements
(arbres, nuages statistiques, tableaux corrlations diverses) et
d'extractions des donnes pour fournir l'utilisateur les moyens
de les consulter47. C'est une mthode descriptiviste . Un tel
catalogage est indispensable toute recherche sur corpus, mais
il ne faudrait pas faire passer ce stade de recueil d'un matriel
d'analyse pour l'analyse elle-mme, car il se situe en amont de
l'analyse.
C'est en utilisant la base de donnes de l'Inathque sur
la tlvision, la radio et le Web (en constitution) que l'quipe du
CAD a procd ses analyses48.
Le relev des rcurrences implique que la recherche
soit oriente. Ici, contrairement au cas prcdent, les donnes
sont corrles des variables externes qui sont en rapport de
pertinence avec un objectif d'analyse, et les rcurrences sont
releves et classes dans un certain ordre en fonction de ces
variables. Par exemple, un ordre de rcurrence de mots et
expressions corrl un type de locuteur dans une situation
donne (un candidat dans une campagne lectorale), ou un
ordre de rcurrence thmatique corrl un certain support,
comme par exemple le relev des thmes traits par un journal
propos d'un certain vnement et compar ceux relevs dans
d'autres journaux. On peut videmment multiplier les variables,
et l'on obtiendra un panorama des rsultats statistiques
d'occurrences corrles diverses variables externes.
Ici, on peut dire que, contrairement au cas prcdent, on
a affaire une analyse quantitative fournissant de prcieux
renseignements pour d'autres analyses postrieures, d'autant que
le dveloppement d'outils techniques de plus en plus
performants (logiciels et numrisation) permettent l'heure
actuelle de procder rapidement de tels relevs.

47 Voir, par exemple, l' Hyperbase de l'Inathque de France.


48 Voir : La tlvision et la guerre. Dformation ou construction de la
ralit ? Le conflit en Bosnie (1990-1994), in Charaudeau P. (dir.)
(2001) ; et La mdiatisation de la science. Clonage, OGM,
manipulations gntiques, in Charaudeau P. (dir.) (2008).

59
P. CHARAUDEAU

C'est dans ce genre d'analyse quantitative que


s'inscrivent nombre de chercheurs en se rclamant, chacun sa
faon, d'une linguistique de corpus de grands corpus faudrait-
il dire, car il n'y a aucune linguistique qui ne soit de corpus. Ces
travaux livrent des rsultats prcieux, parfois indispensables
pour fonder plus objectivement certaines analyses smantiques.
Mais pour qui s'intresse, non seulement au sens des mots mais
leur effet social en situation de communication (les mots
comme facteur d'influence sociale), on ne peut s'empcher de
faire les remarques suivantes.
- L'importance et l'impact d'un mot (c'est--dire l'effet
de sens) ne sont pas ncessairement lis sa rcurrence :
l'expression fracture sociale employe par Jacques Chirac
lors de la campagne prsidentielle de 1995, les mots karcher
et racaille employs par Nicolas Sarkozy, ne furent
employs qu'une seule fois par leurs auteurs, et l'effet qu'ils ont
produit tient videmment au sens qu'ils avaient dans leur
contexte situationnel et interdiscursif, mais aussi au fait qu'ils
ont t relays par les mdias, donc par d'autres corpus.
L'impact des mots n'obit pas ncessairement un critre
quantitatif. L'important est qu'ils s'inscrivent dans un certain
rseau discursif et qu'ils fassent cho un systme d'attente plus
ou moins conscient.
- Le sens des mots, on le sait, est pluriel. Non seulement
du fait de leur polysmie, mais aussi parce qu'ils acquirent
selon les contextes linguistique, paratextuel et interdiscursif ce
que l'on pourrait appeler une polydiscursivit . Et cela est
bien difficile mesurer quantitativement. J'en donnerai un
exemple : rcemment, l'occasion de la dernire campagne
lectorale, des relevs lexicomtriques49 ont mis en vidence la
propension des deux principaux candidats, Nicolas Sarkozy et
Sgolne Royal, employer le pronom de premire personne,
Je. Cela a confort les commentateurs qui ont conclu la
grande personnalisation de cette campagne. On fera remarquer,

49 Voir entre autres relevs ceux de l'Equipe PSYchologie de la


COMmunication , LERASS / IUT Information & Communication de
l'universit de Toulouse, dirige par Pierre-Olivier Dupuy et Pascal
Marchand (consultables en ligne).

60
Dis-moi quel est ton corpus, je te dirai quelle est ta problmatique

tout d'abord, que pour pouvoir juger de cette personnalisation, il


faudrait comparer ces relevs avec ceux des campagnes
prcdentes. Or, si l'on se reporte la campagne de 1988, on
peut observer galement un emploi important du pronom Je, de
la part de certains candidats50. Cela est bien naturel dans la
mesure o un jeu d'alternance Je / Nous est inscrit dans le
contrat communicationnelle du discours de campagne
lectorale : le candidat se prsente la fois comme le porteur de
la souverainet populaire (Nous), et comme un leader diffrent
des autres (Je).
Mais surtout, si l'on tudie l'emploi de ces je, non
seulement dans leur contexte linguistique, mais en rapport avec
l'environnement propre chaque dclaration politique
(paratextuel) et avec l'ensemble des discours auxquels il est fait
rfrence (interdiscours), on peroit deux choses. D'une part,
que les Je de Nicolas Sarkozy et Sgolne Royal obissent un
mme souci de se dmarquer de l'appareil de leur parti ; ce sont
l des je de diffrenciation. Mais d'autre part, on observe une
diffrence entre les deux : les Je (plus exactement les Je veux)
de Nicolas Sarkozy construisent la figure d'un chef puissant et
fort, prenant en charge toutes les responsabilits et les
dcisions, s'instituant en homme d'action avec ardeur guerrire ;
alors que les Je de Sgolne Royal construisent la figure d'une
femme combattante anime d'une conviction profonde,
tmoignant d'une attitude de protection et d'coute, de sincrit
des sentiments, d'une ardeur faite davantage de courage, de
tnacit que de dsir de puissance51 ; ce sont l des je
d'appropriation.
De ce point de vue, les analyses quantitatives, sans tre
rcuses, ne peuvent fournir les rsultats que les analyses
qualitatives, soucieuses de prendre en compte des rseaux
d'interdiscursivit, pourront livrer. Il faudra mme se garder
(tant donn l'engouement actuel pour ces analyses du nombre)

50 Voir : Groupe Saint-Cloud, Les prsidentielles. Regards sur les discours


tlviss, Paris, Ina-Nathan, 1995.
51 Je rsume ici, de faon quelque peu cavalire, l'tude que j'ai faite de cette
campagne, et laquelle je me permets de renvoyer le lecteur : Entre
populisme et peopolisme. Comment Sarkozy a gagn, op. cit.

61
P. CHARAUDEAU

de rifier les premires, car cela aboutirait la neutralisation


des secondes, ce qui rduirait considrablement le pouvoir
explicatif de l'analyse du discours.
Rappelons que la logique de la recherche repose sur une
dmarche empirico-dductive de va-et-vient entre, d'un
ct, dtermination des objectifs d'analyse et des hypothses
signifiantes, et de l'autre, les mthodes d'observation des objets
et de recueils de donnes selon une instrumentation qui doit
pouvoir rendre compte des objectifs et des hypothses
pralablement tablis. C'est dans un va-et-vient entre ces deux
ples que s'laborent concepts, instruments d'analyse et
interprtation des rsultats.

Conclusion
Il me reste renvoyer le lecteur aux tudes entreprises pas le
Centre d'analyse du discours, pour illustrer cette dmarche
d'articulation entre analyse quantitative et analyse qualitative
que je rsume ici en quelques mots52.
S'agissant de la faon dont la tlvision rend compte
d'vnements sociaux (une guerre, une controverse sociale),
doivent tre relevs, dans un premier temps, les sujets diffuss
sur la question traite ; pour ce faire, on se plonge dans la base
de donnes de l'Inathque dont un extrait les sujets la question
et dont on constitue une sous-base (cela correspond la
phase de relev des donnes). Puis on procde un dcryptage
systmatique du matriel runi, en fonction dun certain nombre
de paramtres externes renvoyant la situation d'nonciation et
la thmatique.
Ainsi, a-t-on pu tablir pour chacune de nos tudes :
- pour le dispositif nonciatif :
le type d'mission (Journal tlvis, reportage,
interviews, dbats, etc.) qui permet de dterminer
l'importance accorde par chaque chane au mode de
traitement discursif (description, rcit, commentaire,
argumentation) ;

52 Voir : La tlvision et la guerre. Dformation ou construction de la


ralit ? Le conflit en Bosnie (1990-1994), op. cit. ; La mdiatisation de
la science. Clonage, OGM, manipulations gntiques, op. cit.

62
Dis-moi quel est ton corpus, je te dirai quelle est ta problmatique

l'identit des acteurs impliqus (politique, scientifique,


journaliste spcialis, envoy spcial, institution,
citoyen, etc.) qui permet de reprer la lgitimit et
l'autorit des prises de parole ;
- pour la thmatique :
le capital thmatique (en nombre de sujets et en dure
d'apparition) que chaque chane consacre
l'vnement-thme. Cela fournit une donne objective
quant l'importance donne l'vnement par chaque
chane comparativement sa concurrente ;
la hirarchisation thmatique (en heure moyenne)
relative au moment d'apparition de l'vnement-thme
dans chaque dition de JT (dbut, milieu, fin), donne
objective quant la stratgie de traitement l'intrieur
de la programmation (le conducteur ) de chaque
chane.
la distribution des domaines scniques53, comme variable
de contenu, pour dterminer l'importance respective des
univers de rfrence convoqus dans le traitement de
l'vnement (scnes civile, humanitaire, diplomatique,
etc. pour la guerre en Bosnie ; scnes scientifique,
politique, thique, etc. pour la controverse sur le
clonage), qui tmoignent de l'orientation dramatisante ou
argumentative que propose chaque chane.
Cette phase quantitative permet d'une part de constituer des
indices reposant sur des rsultats statistiques, indices qui sont
susceptibles de jouer le rle de symptme, et sur lesquels on
fera porter les analyses qualitatives ultrieures54 ; elle permet,
d'autre part, de constituer un corpus-chantillon, cest--dire un
ensemble de fragments de texte qui peut tre considr comme
reprsentatif au regard des catgories qui serviront l'analyser
de faon qualitative : la parole des acteurs, les caractristiques
du dispositif, le traitement de la thmatique. Ainsi peut-on

53 Pour la dfinition de domaine scnique , voir les tudes elles-mmes


(note 49).
54 Voir la justification de cette dmarche in Charaudeau P., Lochard G.,
Soulages J.-C. (1996), La construction thmatique du conflit en ex-
Yougoslavie , Mots 47.

63
P. CHARAUDEAU

chapper la critique qui est faite parfois l'chantillonnage,


savoir que ce n'est qu'une partie qui prtend reprsenter un tout.
Notre chantillon n'est pas la partie d'un tout (comme serait un
chantillon de mots reprsentatifs d'un tout textuel) ; il est
constitu de catgories dont chacune joue le rle d'un point
focal sur lequel faire porter l'analyse qualitative (les locuteurs,
les genres, les thmes).
Ainsi l'tude quantitative fait-elle sens en soi, mais un
sens provisoire devant tre confirm, corrig, voire contredit, et
en tout cas tendu et approfondi par l'analyse qualitative.

Rfrences bibliographiques
Anscombre J.-C. et Ducrot O. (1983). L'argumentation dans la
langue. Bruxelles : Mardaga.
Authier-Revuz J. (1982). Htrognit montre et
htrognit constitutive : lments pour une approche de
l'autre dans le discours , DRLAV 26 : 91-151.
Barthes R. (1975). Roland Barthes par roland barthes. Paris :
Seuil, coll. crivains de toujours .
Barthes R. (1970). S / Z. Paris : Seuil.
Bourdieu P. (1987). Choses dites. Paris : Minuit.
Boyer H. (1983). Solidarit. Fortune politique, drive
lexicale , Mots 7.
Boyer H. (2002). Sociolinguistique : faire corpus de
toute(s) voix ? , Mots 69 : 97-101.
Boyer H. et Lochard G. (1998). Scnes de tlvision en
banlieue. Paris : Ina-L'Harmattan.
Branca-Rossof S. (1997). Les lettres de rclamation adresses
au service de la redevance , Langage et socit 81.
Charaudeau P. (dir.) (2001). La tlvision et la guerre.
Dformation ou construction de la ralit ? Le conflit en
Bosnie (1990-1994). Bruxelles : Ina-De Boeck.
Charaudeau P. (2001). Vises discursives, genres
situationnels et construction textuelle , in Analyse des
discours. Types et genres. Toulouse : d. universitaires du
Sud, 45-73.

64
Dis-moi quel est ton corpus, je te dirai quelle est ta problmatique

Charaudeau P. (2004). Le contrat de communication dans une


perspective langagire : contraintes psychosociales et
contraintes discursives , in Bromberg M. et Trognon A
(dir.) Psychologie sociale et communication. Paris :
Dunod.
Charaudeau P. (2005). Le discours politique. Les masques du
pouvoir. Paris : Vuibert.
Charaudeau P. (dir.) (2008). La mdiatisation de la science.
Clonage, OGM, manipulations gntiques, Bruxelles : Ina-
De Boeck.
Charaudeau P. (2008). Entre populisme et peopolisme.
Comment Sarkozy a gagn. Paris : Vuibert.
Charaudeau P., Lochard G., Soulages J.-C. (1996). La
construction thmatique du conflit en ex-Yougoslavie ,
Mots 47 : 89-107.
Charaudeau P. et Maingueneau D. (2002). Dictionnaire
d'analyse du discours. Paris : Seuil.
Charolles M. (1995). Cohrence, cohsion et pertinence du
discours , Travaux de linguistique 29 : 125-151.
Courtine J.-J. (1981). Quelques problmes thoriques et
mthodologiques en analyse du discours. A propos du
discours communiste adress aux chrtiens , Langages
62 : 9-128.
Dalbera.J.-Ph. (2002). Le corpus entre donnes, analyse et
thorie , Corpus 1 : 89-101.
Ducrot O. et alii (1980). Les mots du discours. Paris : Minuit.
Ducrot O. (1991). Dire et ne pas dire. Paris : Hermann.
Godin C. (2004). Dictionnaire de philosophie. Paris : Fayard.
Groupe Saint-Cloud (1995). Les prsidentielles. Regards sur les
discours tlviss. Paris : Ina-Nathan.
Habert B. et alii (1997). Les linguistiques de corpus. Paris :
Colin.
Harris Z.S. (1969). Analyse du discours , trad. fr. in
Langages, 13 : 8-45 (1re d. 1952, Discourse analysis ,
Language 28 : 1-30).

65
P. CHARAUDEAU

Krieg-Planke A. (2009). La notion de formule en analyse du


discours. Cadre thorique et mthodologique. Besanon :
Presses Universitaires de Franche-Comt.
Maingueneau D. (1976). Initiation aux mthodes de lanalyse
du discours. Paris : Hachette-Universit.
Maingueneau D. (1996). Les termes cls de l'analyse du
discours. Paris : Seuil, coll. Mmo ,.
Maingueneau D. et Cossutta F. (1995). L'analyse des discours
constituants , Langages 117 : 112-125.
Mayaffre D. (2002). Les corpus rflexifs : entre
architextualit et hypertextualit , Corpus 1 : 51-69.
Mayaffre D. (2005). Les corpus politiques : objet, mthode et
contenu , Corpus 4 : 5-19.
Moeschler J. et Reboul A. (1994). Dictionnaire encyclopdique
de Pragmatique.Paris : euil.
Pcheux M. (1975). Les Vrits de La Palice. Linguistique,
smantique, philosophie. Paris : Maspero.
Pcheux M. (1975). Mise au point et perspectives propos de
lAnalyse Automatique du Discours , Langages 37 : 7-80.
Qur L. (1995). L'espace public comme forme et comme
vnement , in Isaac J. (dir.) Recherches, Paris.
Soulages J.-C. (2003). Identits discursives et imaginaires
figuratifs , in Houdebine A.-M. (dir.) L'imaginaire
linguistique. Paris : LHarmattan, 103-109.
Tournier M. (2002). Article Lexicomtrie , in Dictionnaire
d'analyse du discours. Paris : Seuil.
van Dijk T.A. et Kintsch W. (1983). Strategies of discourse
comprehension. New York : Academic Press.
Williams G. (d.) (2005). La linguistique de corpus. Rennes :
Presses Universitaires de Rennes.

66