You are on page 1of 75

Michel Pcheux Catherine Fuchs

Mises au point et perspectives propos de l'analyse automatique du discours


In: Langages, 9e anne, n37, 1975. pp. 7-80.

Citer ce document / Cite this document : Pcheux Michel, Fuchs Catherine. Mises au point et perspectives propos de l'analyse automatique du discours. In: Langages, 9e anne, n37, 1975. pp. 7-80. doi : 10.3406/lgge.1975.2612 http://www.persee.fr/web/revues/home/prescript/article/lgge_0458-726X_1975_num_9_37_2612

I M. PGHEUX CNRS, Laboratoire Associ n 59, Paris VII. G. FUCHS CNRS, Paris VII, Dpartement de Recherches Linguistiques. h

Mises

au

point

et

perspectives l'analyse discours

propos

de

automatique

du

Introduction. Premire partie : Formation sociale, langue, discours. 1. Formation sociale, idologie, discours. 2. La linguistique comme thorie des mcanismes syntaxiques et des processus d'nonciation. 3. Langue, idologie, discours. Deuxime partie : L'analyse automatique du discours : critiques et perspectives NOUVELLES. 1. Construction du corpus en fonction de ses conditions de production dominantes. 2. L'analyse linguistique. 2.1. Les objectifs d'une analyse linguistique du discours. 2.2. Critique de la phase d'analyse linguistique. 2.3. Perspectives d'avenir. 3. L'analyse du processus discursif. 3.1. Aspects principaux de la dsyntagmatisation discursive. 3 . 2. Critique de la procdure actuelle. 3.3. Vers une transformation des entres. Conclusion. Introduction L' analyse automatique du discours (que nous dsignerons en abrg par : AAD) a donn lieu, depuis quelques annes, un certain nombre de publications, tant au niveau thorique qu' celui des applications expri mentales 1. Les remarques, interprtations, critiques, voire dformations

1. Voir bibliographie II, 1 et 2.

qu'elles ont suscites ces deux niveaux x nous ont sembl ncessiter une mise au point d'ensemble visant lever certaines ambiguts, rectifier certaines erreurs, constater certaines difficults non rsolues et indiquer simultanment les bases d'une formulation nouvelle de la question, la lumire des dveloppements plus rcents, souvent non publis, de la rflexion sur le rapport entre linguistique et thorie du discours, d'o la prsence indispensable d'un linguiste dans le bilan que nous entreprenons. Pour viter toute quivoque risquant de mler le ncessaire travail critique propre un champ thorique et les tentatives de retour en arrire visant abandonner ce champ, nous commencerons par prsenter, dans une premire partie, le cadre pistmologique gnral de l'entreprise. Il rside selon nous, dans l'articulation de trois rgions de connaissances scientifiques: 1) le matrialisme historique comme thorie des formations sociales et de leurs transformations, y compris la thorie des idologies, 2) la linguistique comme thorie la fois des mcanismes syntaxiques et des processus d'nonciation, 3) la thorie du discours comme thorie de la dtermination historique des processus smantiques. Ajoutons que ces trois rgions sont d'une certaine manire traverses et articules par la rfrence qu'il conviendra d'expliciter une thorie de la subjectivit (de nature psychanalytique). Ceci nous conduira reformuler comme une des questions centrales celle de la lecture, de l'effet lecteur comme constitutif de la subjectivit et caractris par le fait que les conditions d'existence de cet effet doivent, pour que celui-ci se ralise, tre dissimules au sujet lui-mme. Nous essaie rons sur ce point de faire la part de ce qui relve spcifiquement du domaine du linguistique dans cet oubli, par rapport aux rgions non- ou pr-lin guistiques. La deuxime partie sera consacre la discussion des diffrents aspects critiqus, dans leur dtail, ce qui ne peut se faire que dans le cadre thorique gnral de la premire partie, en indiquant, toutes les fois que ce sera pos sible, les moyens de rformer localement tel ou tel aspect dpass (tout en restant dans le cadre de la problmatique initiale), et en essayant par ailleurs, dans la mesure du possible, de prparer les conditions d'une trans formation radicale du problme dans ses termes mmes, c'est--dire les conditions d'une rvolution dont chacun prouve la ncessit, mais dont il est aujourd'hui impossible de prvoir la forme : s'il est vrai que l'on (ne) dtruit (que) ce que l'on remplace (l'AAD visant elle-mme dtruire de ce point de vue l' analyse de contenu ), la responsabilit thorique impose que l'on prpare d'abord le terrain sur lequel pourra s'effectuer le dplacement-remplacement que nous voquons ici par la mtaphore

1. Voir bibliographie II, 3.

du mot rvolution . En particulier cela suppose que soit combl pris au niveau des procdures pratiques de traitement des textes port au niveau atteint dans les discussions portant sur le rapport trois rgions que nous mentionnions plus haut, et avant tout rattrap l'cart qui spare Vanalyse du discours de la thorie du

le retard par rap entre les que soit discours.

Premire partie FORMATION SOCIALE, LANGUE, DISCOURS 1. Formation sociale, idologie, discours. Le point d'organisation de cette premire partie est constitu par le rapport entre les trois rgions que nous avons dsignes antrieurement et qui sont rappeles dans le titre gnral de la premire partie. Notons tout de suite que, dans les conditions actuelles du travail universitaire, tout concourt rendre trs difficile l'articulation thorique entre ces rgions. Outre le fait que cette entreprise d'articulation peut apparatre certains comme tant d'un got thorique douteux, il reste que, avec la meilleure volont thorique et politique du monde, il est difficile de lever les obstacles organisationnels et pistmologiques lis la balkanisation des connais sances et surtout au refoulement-travestissement universitaire du matrialisme historique. L'exprience commence nous apprendre qu'il est trs difficile d'viter des traductions spontanes faisant que le matria lisme historique devient la sociologie , la thorie du discours se rservant l' aspect social du langage , etc. Mme pour des chercheurs marxistes, il arrive souvent que, capables d'une critique lucide de leur discipline d'origine, ils restent aveugles certains aspects acadmiques-idalistes des disciplines voisines, au point qu'ils croient pouvoir y trouver directement des instruments utiles pour leur propre pratique, y compris pour leur pratique critique. La formulation que nous proposons ici de cette articulation n'chappe videmment pas au risque que nous signalons, puisque ce risque est coexistensif aux conditions de la pratique universitaire actuelle. En reprenant l'tat le plus rcent de cette formulation x, nous poserons d'abord que la rgion du matrialisme historique qui nous concerne ici est celle de la superstructure idologique dans son lien avec le mode de production domi nant la formation sociale considre. Les travaux marxistes rcents * montrent qu'il est insuffisant de considrer la superstructure idologique

1. C. Haroche, P. Henry, M. Pcheux, 1971. 2. Cf. en particulier l'article de L. Athusser, Idologie et Appareils idologiques d'Etat (1970).

comme l'expression de la base conomique , comme si l'idologie tait constitue par la sphre des ides au-dessus du monde des choses, des faits conomiques, etc. En d'autres termes, la rgion de l'idologie doit tre caractrise par une matrialit spcifique articule sur la matrialit conomique : plus particulirement, le fonctionnement de l'instance idolo gique doit tre conu comme dtermin en dernire instance par l'in stance conomique dans la mesure o il apparat comme une des conditions (non conomiques) de la reproduction de la base conomique, plus spcif iquement des rapports de production inhrents cette base conomique *. La modalit particulire du fonctionnement de l'instance idologique quant la reproduction des rapports de production consiste dans ce qu'on a pu appeler Y interpellation ou l'assujettissement du sujet comme sujet idologique de telle sorte que chacun soit conduit sans s'en apercevoir et en ayant l'impression d'exercer sa libre volont, prendre sa place dans l'une ou dans l'autre des deux classes sociales antagonistes du mode de production (ou dans telle catgorie, couche ou fraction de classe relie l'une d'entre elles) 2. Cette reproduction continuelle des rapports de classe (conomique, mais aussi, on vient de le voir, non conomique) est assure matriellement par l'existence de ralits complexes qui ont t dsignes par Althusser sous le nom d' appareils idologiques d'Etat , et qui se caractrisent par le fait qu'elles mettent en jeu des pratiques associes des places ou des rapports de places qui renvoient aux rapports de classes sans pourtant les dcalquer exactement. A un moment historique donn, les rapports de classes (la lutte de classes) se caractrisent par l'affrontement, l'intrieur mme de ces appareils, de positions politiques et idologiques qui ne sont pas le fait d'individus, mais qui s'organisent en formations entretenant entre elles des rapports d'antagonisme, d'alliance ou de domi nation. On parlera de formation idologique pour caractriser un lment (tel aspect de la lutte dans les appareils) susceptible d'intervenir comme une force confronte d'autres forces dans la conjoncture idologique caractristique d'une formation sociale en un moment donn ; chaque formation idologique constitue ainsi un ensemble complexe d'attitudes et 1. Les rapports de production ne sont nullement figs dans une rptition ter nelle comme le prtend la sociologie fonctionnaliste : en ralit, et dans la mesure o les rapports de production correspondent des rapports de classe, il faut parler de reproduction-transformation des rapports de production. Ce n'est pas ici le lieu de dve lopper davantage ce point essentiel du matrialisme historique. 2. L'idologie bourgeoise, comme forme la plus compltement dveloppe nous instruit non seulement sur le fonctionnement de l'instance idologique en gnral, mais aussi sur les formes historiques qui l'ont prcdes. Toutefois, on ne doit pas projeter les formes bourgeoises d'interpellation sur les formes antrieures : il n'est pas vident, par exemple, que l'interpellation consiste toujours reporter sur le sujet lui-mme sa dtermination. L'autonomie du sujet comme reprsentation du rapport imaginaire est en fait troitement lie l'apparition et l'extension de l'idologie juridico-poli tique bourgeoise. Dans les formations sociales domines par d'autres modes de product ion, le sujet peut se reprsenter sa propre dtermination comme s'imposant lui sous la forme d'une contrainte ou d'une volont trangre, sans pour autant que le rapport ainsi reprsent cesse d'tre imaginaire. 10

de reprsentations * qui ne sont ni individuelles ni universelles mais se rapportent plus ou moins directement des positions de classes en conflit les unes piar rapport aux autres 2 . Nous sommes ainsi amens nous poser la question du rapport entre idologie et discours. Compte tenu de ce qui prcde, on voit clairement qu'il est impossible d'identifier idologie et discours (ce serait une conception idaliste de l'idologie comme sphre des ides ei des discours), mais que l'on doit concevoir le discursif comme un des aspects matriels de ce que nous avons appel la matrialit idolo gique. Autrement dit, Yespce discursive appartient selon nous au genre idologique, ce qui revient dire que les formations idologiques dont nous venons de parler comportent ncessairement 3 comme une de leurs compos antes une ou plusieurs formations discursives inter-relies qui dterminent ce qui peut et doit tre dit (articul soiis la forme d'une harangue, d'un sermon, d'un pamphlet, d'un expos, d'un programme, etc.) partir d'une position donne dans une conjoncture 4 , autrement dit dans un certain rapport de places intrieur un appareil idologique et inscrit dans un rapport de classes. Nous dirons ds lors que toute formation discursive relve de conditions de production 5 spcifiques, identifiables partir de ce que nous venons de dsigner. Donc l'idologie interpelle les individus en sujets : eette loi consti tutive de Y Idologie ne se ralise jamais en gnral , mais toujours travers un ensemble complexe dtermin de formations idologiques qui, l'intrieur de cet ensemble, jouent chaque phase historique de la lutte des classes un rle ncessairement ingal dans la reproduction et la trans formation des rapports de production, et cela en raison la fois de leurs

1. Nous ne nous dissimulons pas qu'en utilisant des termes comme attitudes et reprsentations emprunts au vocabulaire de. la sociologie, nous laissons planer une quivoque ; les pratiques au sens marxiste ne sont pas des comportements sociaux ou des reprsentations sociales . 2. C. Haroche, P. Henry, M. Pcheux, 1971, p. 102. 3. Cette ncessit renvoie la spcificit du langage inhrent l'homme comme animal idologique. 4. C. Haroche, P. Henry, M. Pcheux, 1971, p. 102. 5. Prcisons que le terme de production peut ici entraner certaines ambiguts. Pour les viter, nous distinguerons le sens conomique de ce terme, de son sens pistmologique (production de connaissances), de son usage psycho-linguistique (production du message), et enfin de la signification qu'il reoit dans l'expression : < production d'un effet . C'est avant tout dans ce dernier sens qu'il faut ici entendre ce terme. Nous ver rons cependant plus loin que les mcanismes de ralisation du discours produit par le sujet sont galement en cause. Par ailleurs l'usage de ce terme revt nos yeux une fonction polmique l'gard de l'emploi ritr du terme de circulation voire de * cration pour caractriser des processus de signification. Ajoutons enfin que la matrialit verbale (phonique ou graphique) est un des pr supposs de la production conomique, la fois comme condition infrastructurelle de commerce (et de faon gnrale du contrat), et comme condition de mise en uvre sociale des forces productives (transmission du mode d'emploi des moyens de travail et ducation de la force de travail). La signification de l'expression conditions de production sera prcise plus loin, p. 15, p. 23 et p. 24 sqq. 11

caractristiques rgionales (le Droit, la Morale, la Connaissance, Dieu, etc..) et de leurs caractristiques de classe. A ce double titre, des formations discursives interviennent dans ces formations idologiques titre de composantes. Prenons un exemple : la formation idologique rel igieuse constitue, dans le mode de production fodal, la forme de V idologie dominante ; elle ralise l'interpellation des individus en sujets travers l'Appareil Idologique d'Etat religieux, spcialis dans les rapports de Dieu avec les hommes, sujets de Dieu, dans la forme spcifique des cr monies (offices, baptmes, mariages et enterrements, etc.) qui, sous la figure de la religion, interviennent en ralit dans les rapports juridiques et dans la production conomique, donc l'intrieur mme des rapports de production fodaux. Dans la ralisation de ces rapports idologiques de classes, diverses formations discursives, combines sous des formes chaque fois spcifiques, interviennent titre de composantes ; par exemple, et en tant qu'hypothse historique vrifier : d'un ct le prche campagnard, reproduit par le Bas-Clerg l'intrieur de la paysannerie, de l'autre le sermon du Haut-Clerg pour les Grands de la noblesse, donc deux forma tions discursives dont la premire se trouve subordonne la seconde, de sorte qu'il y est question la fois des mmes choses (la pauvret, la mort, la soumission, etc..) mais sous des formes diffrentes (ex. : la sou mission du peuple aux Grands/la soumission des Grands Dieu), et aussi de choses diffrentes (ex. : le travail de la terre/la destine des Grands). Soulignons enfin qu'une formation discursive existe historiquement l'intrieur de rapports de classes donns ; elle peut fournir des lments s'intgrant dans de nouvelles formations discursives, se constituant l'intrieur de nouveaux rapports idologiques mettant en jeu de nouvelles formations idologiques. Par exemple, on peut avancer (ceci serait gal ement l'objet d'une vrification historique) que les formations discursives voques ci-dessus, disparues en tant que telles, ont fourni des ingrdients qui ont t retourns dans diffrentes formes historiques de l'athisme bourgeois et rappropris, sous la forme de nouvelles formations discur sives(intgrant par exemple certains discours parlementaires de la Rvol ution de 1789), la domination idologique de la classe bourgeoise. Une difficult que les thoriciens marxistes connaissent bien surgit ici : la difficult caractriser les frontires relles des objets rels qui correspondent aux concepts introduits (p. ex. ici formation idologique, formation discursive, conditions de production). Cette difficult n'est pas l'effet d'un malencontreux hasard, mais rsulte de la contradiction existant entre la nature de ces concepts et l'usage spontanment fixiste et classificatoire que l'on ne peut pas ne pas essayer de leur faire jouer, sous la forme de questions en apparence invitables du genre : combien y a-t-il de fo rmations idologiques dans une formation sociale, combien chacune peut-elle contenir de formations discursives, etc. ? . En fait, et prcisment compte tenu du caractre dialectique des ralits ici dsignes, une semblable dis crtisation est radicalement impossible, sauf inscrire dans la dtermination 12

mme de chacun de ces objets la possibilit de se transformer en un autre, c'est--dire prcisment de dnoncer leur caractre discret comme une illusion. Le point de l'extriorit relative d'une formation idologique par rapport une formation discursive se traduit l'intrieur mme de cette formation discursive : elle dsigne l'effet ncessaire, dans une formation discursive donne, d'lments idologiques non discursifs (reprsentations, images lies des pratiques, etc.). Mieux, elle entrane l'intrieur mme du discursif un dcalage qui reflte cette extriorit. Il s'agit du dcalage entre une formation discursive et une autre, la premire servant en quelque sorte de matire premire reprsentationnelle la seconde, comme si la discursivit de cette matire premire s'vanouissait aux yeux du sujet parlant 1. Il s'agit l de ce que nous caractriserons comme l'oubli n 1 2, invitablement inhrent la pratique subjective lie au langage. Mais simultanment, et ceci constitue une autre forme de ce mme oubli, le processus par lequel une squence discursive concrte est produite ou reconnue comme ayant un sens pour un sujet s'efface lui-mme aux yeux du sujet. Nous voulons dire que, selon nous, la production du sens est strictement indissociable de la relation de paraphrase 8 entre des squences telles que la famille paraphrastique de ces squences constitue ce qu'on pourrait appeler la matrice du sens. Cela revient dire que c'est partir de la relation intrieure cette famille que se constitue l'effet de sens ainsi que la relation un rfrent qu'implique cet effet 4. Si l'on nous suit, on comprend ds lors que l'vidence de la lecture subjective selon laquelle un texte est biunivoquement associ son sens (aux ambiguts syntaxiques et/ou smantiques prs) est une illusion constitutive de l'effet-sujet l'gard du langage, et contribuant dans ce domaine spcifique produire l'effet d'assujettissement que nous mentionnions plus haut : en ralit, nous

1. Cf. P. Henry (1971, 1974). 2. Le terme d'oubli ne renvoie pas ici un trouble individuel de la mmorisation. Il dsigne paradoxalement ce qui n'a jamais t su et qui pourtant touche au plus prs le sujet parlant , dans l'trange familiarit qu'il entretient avec les causes qui le dterminent... en toute ignorance de cause. 3. Nous ne posons donc pas au dpart une identit de sens entre les membres de la famille paraphrastique, nous supposons au contraire que c'est dans cette relation que sens et identit de sens peuvent se dfinir, voir plus loin p. 61 et 70-72. 4. Donnons tout de suite un exemple de ce que nous entendons ici du point de vue discursif par famille paraphrastique , travers la prsentation d'un domaine smantique obtenu dans une tude rcente effectue avec l'AAD : quitable I \ [ biens * >uste ' \ des Rpartition j meilleure On verra plus loin que ls relations que nous reprsentons ici par des accolades sont interprter comme des relations symtriques (traits verticaux) ou des relations non symtriques (flches). Cf. p. 61. Remarquons du mme coup que la paraphrase discursive ne doit pas tre confondue avec ce que certains linguistes appellent para phrase (par exemple la transformation passive). On y reviendra p. 71-73. 13

posons que le sens d'une squence n'est matriellement concevable que dans la mesure o on conoit cette squence comme appartenant ncessairement telle formation discursive et/ou telle autre (ce qui explique au passage qu'elle puisse avoir plusieurs sens) x. C'est cette appartenance ncessaire de toute squence une formation discursive pour que cette squence soit doue de sens qui se trouve refoule pour (ou par ?) le sujet et recouverte pour ce dernier par l'illusion d'tre la source du sens, sous la forme de la re-saisie par le sujet d'un sens pr-existant universel (ceci explique en particulier le couple ternel individualit/uni versalit caractristique de l'illusion discursive du sujet). On remarquera au passage que cette hermneutique spontane caractrisant l'effet sub jectif par rapport au langage se redouble, sans changer fondamentalement de nature, dans les elaborations thoriques inhrentes la conception chomskienne et post-chomskienne de la smantique (recours invitable une smantique universelle mise en mouvement dans une logique des prdicats, ce qui revient proprement supposer le problme rsolu en annulant la distance entre processus discursif et formulation logique). Ces prcisions permettent de comprendre pourquoi le dispositif AAD, dans la mesure o il se conforme aux conceptions de la thorie du discours que nous venons d'noncer, exclut fondamentalement l'ide mme de l'analyse smantique d'un texte. Sur ce point il convient de noter la dis tinction, sur laquelle nous reviendrons, entre analyse linguistique d'une squence discursive et traitement automatique d'un ensemble d'objets obtenu au moyen de cette analyse, ce qui semble avoir partiellement chapp S. Fisher et E. Veron 2 dans la mesure o ils semblent s'tonner que malgr cet avertissement (l'impossibilit que nous venons de rappeler) Pcheux. . . a essay son systme d'analyse sur un seul texte l'expres sion systme d'analyse est ici le lieu d'un jeu de mots tlescopant analyse linguistique et analyse discursive. Dans cette mesure, et condition d'entendre par processus discursif les relations de paraphrase intrieures ce que nous avons appel la matrice du sens inhrente la formation discursive, nous dirons que la procdure AAD constitue l'bauche d'une analyse non subjective des effets de sens traversant l'illusion de l'effet-sujet (production/lecture) et remontant par une sorte d'archologie rgle vers le processus discursif. Dans son tat actuel, la procdure fournit ce qu'on peut appeler des traces du processus discursif que l'on se donne pour objet d'tude. Gomme nous le montrerons plus loin,

1. Nous soulignons bien que cette conception ne s'identifie pas celle des lec tures plurielles qui suggrent l'ide d'un foisonnement infini des significations, chaque sujet y manifestant sa singularit. Ce serait, selon nous, perdre de vue la matrialit du discursif et c'est, semble-t-il, ce que fait A. Trognon lorsqu'il crit : Ce que le discours dit, c'est ce que nous en crivons dans la problmatique que nous nous sommes dfinie. Trognon, 1972, p. 28. 2. S. Fisher, E. Veron, 1973, pp. 162-181. 14

la difficult rsoudre ici rside dans le fait que la famille de paraphrases (ou plutt les diffrentes familles paraphrastiques ou domaines smantiques) ne correspond pas directement une proposition logique (ou un systme de propositions logiques). Ce n'est pas dans notre esprit l'effet d'une ina dquation accidentelle et que l'on pourrait rduire en procdant plus fin ement ; il s'agit de la distance dj mentionne entre proposition logique et processus discursif, distance qui est prcisment imaginairement annule la fois par la philosophie spontane de la logique formelle et par l'ida lisme positiviste en linguistique. Comme nous venons de le voir, les processus discursifs tels qu'ils sont ici conus ne sauraient avoir leur origine dans le sujet. Nanmoins ils se ralisent ncessairement dans ce mme sujet ; cette apparente contradiction renvoie en ralit la question mme de la constitution du sujet et ce que nous avons appel son assujettissement. Sur ce point, certains claircissements s'imposent par rapport aux formulations ambigus que le texte de 1969 fournissait, concernant les conditions de production notamment : cette ambigut rsidait dans le fait que le terme conditions de production dsignait la fois l'effet des rapports de place dans lesquels se trouve inscrit le sujet et, simultanment, la situation au sens concret et empirique du terme, c'est--dire l'environnement matriel et institutionnel, les rles plus ou moins consciemment mis en jeu, etc. A la limite, les conditions de production dans ce dernier sens dtermineraient la situation vcue par le sujet au sens de variable subjective (attitudes , reprsentations , etc.) inhrente une situation exprimentale. Nous pouvons maintenant prciser que la premire dfinition s'oppose la seconde comme le rel l'imaginaire et que ce qui faisait dfaut dans le texte de 1969 c'tait prcisment une thorie de cet imaginaire repr par rapport au rel. Faute de ce reprage il tait invitable (et c'est ce qui s'est effectivement produit) que les rapports de place soient confondus avec le jeu en miroir de rles intrieurs une institution x, le terme d'appareil introduit ci-dessus tant lui-mme ind ment confondu avec la notion d'institution. En d'autres termes, ce qui manquait et ce qui manque encore en partie, c'est une thorie non subjective de la constitution du sujet dans sa situation concrte d'nonciateur 2. Le fait qu'il s'agisse fondamentalement d'une illusion n'empche pas la nces-

1. Les expressions par lesquelles nous tentions de caractriser les rapports entre formations imaginaires (Pcheux, 1969, pp. 19-21), du type : Ia(A), Ia(B), etc., laissent largement ouverte la possibilit d'une interprtation interpersonnelle du systme des conditions de production : on trouve les rpercussions de cette ambigut dans plusieurs travaux, dont par exemple M. J. Borel (1970). Par ailleurs, l'ide avan ce par A. Trognon (1972, p. 164) selon laquelle l'AAD se donnerait pour fonction de distribuer les lments du discours ou units textuelles en fonction de ces diff rentes expressions (Ia(A), etc.) nous reste trangre. Enfin nous serons d'accord avec L. Guespin pour reconnatre que la multiplication des mcanismes ne rgle pas fondamentalement la question. 2. On verra plus loin les consquences de cette difficult l'gard de la constitution du corpus. 15

site de cette illusion et impose comme tche au moins d'en dcrire la struc ture (sous la forme d'une bauche descriptive des processus d'nonciation) et peut-tre aussi d'articuler la description de cette illusion ce que nous avons ici appel l'oubli n 1.

2. La linguistique comme thorie des mcanismes taxiques et des processus d'nonciation.

syn

Ainsi qu'il a t dit ci-dessus, le dispositif AAD vise mettre en vi dence les traces des processus discursifs 1. Le point de dpart de l'AAD tant des corpus discursifs 2, il est normal que le dispositif comporte une phase d'analyse linguistique, puisque les textes appartenant aux corpus sont videmment en langue naturelle et que les dveloppements des tra itements automatiques de textes ont montr l'impossibilit de s'en tenir une tude statistique (cf. processus marko viens) de la linarit. Mais le choix de telle ou telle pratique d'analyse linguistique suppose au pralable une dfinition de la nature et du rle que l'on attribue la langue. Quel rapport en effet existe-t-il, du point de vue de la thorie du discours, entre les processus discursifs et la langue ? La perspective d'en semble est la suivante : les processus discursifs tant la source de la pro duction des effets de sens, la langue constitue le lieu matriel o se ralisent ces effets de sens. Cette matrialit spcifique de la langue renvoie l'ide de fonctionnement (au sens saussurien), par opposition fonction . La caractrisation de cette matrialit constitue tout le problme de la linguistique. Comme on le verra plus loin, il est insuffisant de concevoir la langue comme la donne d'un lexique et de systmes phonologiques, mor phologiques et syntaxiques (cette difficult est accentue dans l'article de T. A. Informations (Haroche-Pcheux, 1972) o l'on parle de stock lexical ). Nanmoins, on peut dj utiliser cette formulation insuffisante en disant que, dans ces conditions, la tche du linguiste consisterait caractriser et rendre opratoirement manipulables ce lexique et ces systmes de rgles, en se gardant bien d'y faire intervenir des considrations smantiques incontrles, puisque ce serait justement retomber dans l'effet subjectif de la lecture.

1. Soulignons ds maintenant que les termes de discours, processus discursif, formation discursive, texte (ou squence) ne sont aucunement interchangeables : leur dfinition va tre prcise ci-aprs. 2. On entend par corpus discursif un ensemble de textes de longueur variable (ou squences discursives), renvoyant des conditions de production considres comme stables, c'est--dire un ensemble d'images textuelles relies un texte virtuel (i. e. au processus discursif qui domine et engendre les diffrentes squences discursives appartenant au corpus). On reprendra cette question propos de la construction des corpus (cf. p. 23). 16

Or, prcisment, l'analyse non subjective des effets de sens que l'AAD s'assigne comme objectif passe, on vient de le voir, par une phase d'analyse linguistique, dont nous allons montrer que le statut reste trs problmatique. En effet, la question tourne autour du rle de la smantique dans V analyse linguistique. Dans la perspective qui a t dfinie plus haut, il ne saurait tre question de placer au dpart de l'analyse linguistique ce qui doit ju stement apparatre comme le rsultat de la confrontation d'objets drivant prcisment de cette analyse. Autrement dit, l'analyse linguistique laquelle l'AAD fait appel doit tre essentiellement de nature morpho-syntaxique, et ce titre permettre la d-linarisation spcifiquement linguistique des textes, lie aux phnomnes de hirarchies, embotements, dterminations... Il ne saurait donc tre question d'introduire une conception du monde reposant sur une smantique universelle et a priori, puisque cela reviendrait inclure dans le fonctionnement mme de la langue les processus discursifs historiquement dtermins que l'on ne peut pas poser comme co-extensifs la langue, sauf identifier idologie et langue 1. Ceci tant dit, il reste que les conditions de cette analyse morpho syntaxique sont actuellement peu clairement dfinies et que le recours un smantisme implicite n'en est pas exclu. Tout se passe comme si l'analyse morpho-syntaxique mettait ncessairement en jeu des lments que l'on a l'habitude d'appeler smantiques. Gomme il sera montr dans la suite, la prsentation initiale de l'AAD a systmatiquement nglig cet aspect 2. Ceci s'explique la fois par le caractre consciemment prcaire des solu tions linguistiques proposes et par l'urgence thorique de la lutte contre une conception idaliste de la langue, conue comme vision-perception du monde, et la limite comme origine de ce dernier. Prsente sous sa forme extrme, la position linguistique inhrente l'AAD reviendrait considrer que syntaxe et smantique constituent deux niveaux autonomes et bien dfinis et que lexique et grammaire sont galement deux domaines disjoints. Or, il n'en est visiblement pas ainsi. D'ailleurs la phase linguistique de l'AAD dans son tat actuel illustre bien les difficults lies une telle exigence : loin d'viter toute contamination de l'analyse linguistique par la smantique, les rgles syntaxiques appliques

1. Le fait que le discours soit au point d'articulation des processus idologiques et des phnomnes linguistiques ne doit pas aboutir la confusion par laquelle la langue serait assimile une superstructure idologique : cette prcaution, qui constitue un des points de dpart thoriques de l'AAD, a pu apparatre certains comme une inter diction (une normalisation !) cantonnant le linguiste dans des tches subalternes (le sens interdit au linguiste 1!1). On verra plus loin que, tout au contraire, cette distinction entre langue et idologie conduit une reformulation fconde de la problmatique li nguistique travers la prise en compte des processus d'nonciation. 2. Le cas de l'analyse syntaxique des relatives constitue un exemple privilgi de la rintroduction subreptice de considrations smantiques. Cet aspect, dj abord dans C. Fuchs, J. Milner et P. Le Goffic (1974) est repris dans le prsent recueil par les textes de P. Henry et de A. Grsillon. 17 LANGAGES N 37 2

introduisent subrepticement des recours incontrls au sens. Est-ce dire que cette smantique, laquelle l'analyse syntaxique ne peut pas ne pas faire appel, c'est prcisment ce qui a t dsign plus haut sous le nom de smantique discursive ? S'il en tait ainsi, cela reviendrait dire que l'autonomie thorique de la linguistique est trs exactement nulle puisqu'on ne retrouverait la fin que ce qu'on avait mis au dbut. Nous ne pensons pas qu'il en soit ainsi. Cette situation nous parat en fait lie l'hritage philosophique que vhiculent ncessairement les catgories grammaticales, mme sous leur aspect le plus neutre, le plus moderne, le plus technique. Ce qui fait actuellement dfaut, c'est une thorie du fonctionnement matriel de la langue dans son rapport elle-mme, c'est--dire d'une systmaticit qui ne s'oppose pas du non-systmatique (la langue/la parole), mais qui s'articule sur des processus. Sil'on convient d'appeler smantique formelle x la thorie de ce fonctionnement matriel de la langue, on peut dire que ce qui manque l'analyse linguistique, c'est prcisment une telle smantique formelle, dont on voit bien qu'elle ne concide nullement avec la smant ique discursive voque plus haut. L'expression smantique formelle , emprunte A. Culioli, que nous dfinirons plus loin comme le niveau ultime de l'analyse linguistique, atteindrait, en ce sens, le lieu spcifique de la langue qui correspond la construction de l'effet-sujet. Si notre hypo thse est juste, cela signifie du mme coup que l'AAD qui se veut traverser l'effet-sujet doit reprer o elle le traverse dans la langue ; ne pas repro duire cet effet dans la pratique d'une analyse objective est un souci lgi time, en oublier l'existence dans l'objet d'tude est par contre une erreur. Ceci nous conduit ncessairement la question de Ynonciation, et il n'est pas inutile de fournir ce propos quelques prcisions, tant donn la manire dont l'idalisme occupe aujourd'hui cette question, avec les diffrents obstacles qui en rsultent. Si l'on dfinit renonciation comme le rapport toujours ncessairement prsent du sujet nonciateur son nonc, alors apparat clairement, au niveau mme de la langue, une nouvelle forme de l'illusion selon laquelle le sujet se trouve la source du sens ou s'identifie la source du sens : le discours du sujet s'organise par rfrence (directe, diffre), ou absence de rfrence la situation d'nonciation (le moi-ici-maintenant du locuteur), qu'il prouve subjectivement comme autant d'origines sur des axes de reprages (axe des personnes, des temps, des localisations). Toute activit de langage ncessite la stabilit de ces points d'ancrage pour le sujet ; si cette stabilit vient manquer, il y a atteinte la structure mme du sujet et l'activit de langage. Nous parlions d'obstacles : il s'agit la fois de l'illusion empiriste subjective qui se reproduit dans la thorie linguistique et de l'illusion for maliste qui fait de renonciation un simple systme d'oprations. Commen-

1. Cf. plus loin, p. 50. 18

tant les notions de sujet nonciateur et de situation d'nonciation, P. Fiala et C. Ridoux crivent : ... encore faut-il ne pas les rduire un simple support d'oprations formelles, mais tenter chaque fois d'en dgager le contenu rel pour viter les piges toujours prsents du formalisme (Fiala et Ridoux, 1973, p. 44). Dans un texte antrieur, M. Hirsbrunner et P. Fiala notaient ce propos, en commentant les propositions de Benven iste: En fait, smiotique et smantique apparaissent comme la transpoposition linguistique des catgories philosophiques de la puissance et de l'acte... L encore la mdiation est opre l'aide d'une notion ambigu, renonciation, dfinie formellement (...) mais justifie philosophiquement : renonciation est cette mise en fonctionnement de la langue par un acte individuel d'utilisation . Nous nous trouvons confronts ici la difficult essentielle de la dmarche saussurienne, celle qui constitue, selon nous, le blocage principal de toute thorie saussurienne du discours. Certes, la langue conue seulement comme systme de signes est dpasse, mais c'est au prix de l'introduction au sein mme de la thorie linguistique des deux notions qu'elle avait tent de rejeter, en se constituant comme science, le sujet et son rapport au monde social. Or et c'est l le paradoxe ces deux notions, si elles viennent remplir une place dans l'appareil concept uel, n'ont en fait aucun statut thorique prcis. En opposant la libert du sujet individuel la ncessit du systme de la langue, en posant la langue comme mdiation du sujet au monde, et le sujet comme s'appropriant le monde par l'intermdiaire de la langue, et la langue par l'inte rmdiaire de l'appareil de renonciation, Benveniste ne fait que transposer en termes linguistiques des notions philosophiques qui, loin d'tre neutres, appartiennent directement au courant idaliste (Hirsbrunner et Fiala, 1972, pp. 26-27). Nous tenterons de montrer ci-dessous comment nous proposons de sortir la problmatique de renonciation de ce cercle de l'ida lisme. La difficult actuelle des thories de renonciation rside dans le fait que ces thories refltent le plus souvent l'illusion ncessaire 1 constitutrice du sujet, c'est--dire qu'elles se contentent de reproduire au niveau tho rique cette illusion du sujet, travers l'ide d'un sujet nonciateur porteur de choix, intentions, dcisions, etc. dans la tradition de Bally, Jakobson, Benveniste (la parole n'est pas loin !) 2. La rfrence introduite ci-dessus au fonctionnement matriel des

1. Le terme d' illusion ncessaire a t introduit pour la premire fois par P. le Goffic (Cf. ouvrage collectif sur les relatives, par C. Fuchs, J. Milner et P. le Goffic, 1974). 2. Cette conception de renonciation revient en fait mettre le sujet psycholo gique idaliste la base de la linguistique. C'est ce que constate R. Robin en disant : t La linguistique du discours n'a pas russi oprer le dcentrement du sujet du discours car elle n'a pas russi intgrer sa thorie du sujet ni le sujet idologique du matria lisme historique ni le sujet psychanalytique (Robin, 1973, p. 81). 19

mcanismes syntaxiques par rapport eux-mmes nous permet de prciser ce que nous entendons par nonciation de la manire suivante. Nous dirons que les processus d' nonciation consistent en une srie de dterminations successives par lesquelles l'nonc se constitue peu peu, et qui ont pour caractristique de poser le dit et donc de rejeter le non-dit . L'nonciation revient donc poser des frontires entre ce qui est slectionn et prcis peu peu (ce par quoi se constitue l' univers de discours ) et ce qui est rejet. Ainsi se trouve donc dessin en creux le champ de tout de qu'il aurait t possible au sujet de dire (mais qu'il n'a pas dit) ou de tout ce quoi s'oppose ce que le sujet a dit . Cette zone du rejet peut tre plus ou moins proche de la conscience et il arrive que des questions de l'interlocuteur visant par exemple faire prciser au sujet ce qu'il voulait dire lui fassent reformuler les frontires et r-investiguer cette zone x. Nous proposons d'appeler cet effet d'occultation partielle oubli n 2 et d'y voir la source de l'impression de ralit de la pense pour le sujet ( je sais ce que je dis , je sais de quoi je parle ). Il dcoule de ce qui prcde que l'tude des marques lies renonciation doit constituer un point central de la phase d'analyse linguistique de l'AAD, et qu'elle induit des modifications importantes dans la conception de la langue. Tout d'abord le lexique ne peut tre considr comme un stock d'units lexicales , simple liste de morphmes sans connexion avec la syn taxe, mais au contraire comme un ensemble structur d'lments articuls sur la syntaxe. Deuximement, la syntaxe ne constitue plus le domaine neutre de rgles purement formelles, mais le mode d'organisation (propre une langue donne) des traces des reprages nonciatifs. Les constructions syntaxiques ont donc de ce point de vue une signification qu'il s'agit de dgager. Il est, dans cette perspective, intressant de prciser le lien entre les deux oublis que nous avons qualifis respectivement de n 1 et n 2 : quel rapport existe-t-il entre la famille de squences paraphrastiques constitu tives des effets de sens, et le non-dit , qui sont tous les deux mis hors jeu ?

3. Langue, idologie, discours. Considrons ce que nous avons dsign respectivement sous le nom d' oubli n 1 et d' oubli n 2. On voit que ces deux oublis diffrent profondment l'un de l'autre. On constate en effet que le sujet peut pntrer consciemment dans la zone n 2 et qu'il le fait en ralit con stamment par un retour sur soi de son discours, une anticipation de son effet et la prise en compte du dcalage qu'y introduit le discours d'un

1. Cf. la notion d' anti-paraphrase introduite par S. Fisher et E. Vehon (1973). 20

autre 1. Dans la mesure o le sujet se reprend pour s'expliciter lui-mme ce qu'il dit, pour approfondir ce qu'il pense et le formuler plus adquate ment, on peut dire que cette zone n 2, qui est celle des processus dnonc iation, se caractrise par un fonctionnement de type prconscient/consc ient. Par opposition, l'oubli n 1, dont la zone est inaccessible au sujet, apparat prcisment pour cette raison, comme constitutif de la subjectivit dans le langage. A ce titre on peut avancer que ce refoulement (portant la fois sur le processus discursif lui-mme et sur Tinter-discours 2 auquel il s'articule par des rapports de contradiction, d'asservissement ou d'empi tement) est de nature inconsciente, au sens o l'idologie est constitutivement inconsciente d'elle-mme (et non pas seulement distraite propos d'ellemme, s'chappant incessamment elle-mme, . . . ) 3. Cette opposition entre les deux types d'oubli n'est pas sans rapport avec l'opposition dj mentionne entre la situation empirique concrte dans laquelle se trouve le sujet, marque par le caractre de l'identification imaginaire o l'autre est un autre moi ( autre avec un petit a), et le processus d'interpellation-assujettissement du sujet, se rfrant ce que J. Lacan dsigne mtaphoriquement par l' Autre avec un grand A ; en ce sens, le monologue est un cas particulier du dialogue et de l'interpella tion. En d'autres termes, nous posons que le rapport entre les deux oublis n 1 et n 2 renvoie au rapport entre la condition d'existence (non-subject ive) de l'illusion subjective d'une part et les formes subjectives de sa ralisation d'autre part *. En utilisant ici la terminologie freudienne qui distingue le pr-conscientconscient d'une part, l'inconscient d'autre part, nous ne prtendons null ement rgler la question du rapport entre idologie, inconscient et discursivit : nous voulons seulement marquer le fait qu'une formation discursive est constitue-borde par ce qui lui est extrieur, donc par ce qui y est strictement informulable puisqu'il la dtermine, et souligner en mme temps que cette extriorit constitutive ne saurait en aucun cas tre confondue avec Vespace subjectif de renonciation, espace imaginaire qui assure au sujet parlant ses dplacements V intrieur du reformulable, de sorte qu'il fait incessamment retour sur ce qu'il formule, et s'y reconnat dans le rapport rflexif ou prconscient aux mots, qui nous les fait apparatre

1. Cette zone n 2 est le domaine de ce qu'on appelle parfois les stratgies dis cursives , comportant en particulier l'interrogation rhtorique, la reformulation tendanc ieuseet l'usage manipulatoire de l'ambigut. Cf. sur ce point C. Haroche (1974). 2. Nous entendons par l l' extrieur spcifique d'un processus discursif donn (Cf. AAD 1969, p. 111), c'est--dire les processus qui interviennent dans la constitution et l'organisation de ce dernier. 3. Voir en particulier C. Haroche et M. Pcheux, 1972 (b), pp. 67 83. 4. Sur ce point, et en particulier sur la distinction loi inconsciente/rgle prcons ciente-consciente, cf. Th. Herbert (1968), Voir la discussion de R. Robin (1973, p. 100). 21

comme l'expression des choses , selon la formulation de M. Safouan dans De la structure en psychanalyse (1968), p. 282. Le terme de prconscient renvoie, comme on le sait, la premire topique freudienne, et disparat comme tel dans la deuxime. Or, c'est en grande partie dans le cadre de cette seconde topique que s'est effectue la rlaboration lacanienne du freudisme, laquelle nous faisons ici rfrence. Nous reviendrons dans une autre tude sur cette incohrence thorique, pour l'expliquer, la tra vailler et la rduire. Cette ingalit entre les deux oublis correspond une relation de dominance que l'on peut caractriser en disant que l'inassert prcde et domine l'assert 1. En outre, il ne faut pas perdre de vue que le refoulement qui caractrise l'oubli n 1 rgle en fin de compte le rapport entre dit et non-dit dans l'ou bli n 2, o se structure la squence discursive. Ceci doit tre compris au sens o, pour Lacan tout discours est occultation de l'inconscient . Pour conclure cette prsentation gnrale, nous dirons qu'il y a deux erreurs complmentaires viter propos du terme discours , tel qu'il fonctionne dans l'expression thorie du discours . La premire consiste confondre discours et parole (au sens saussurien) : le discours serait alors la ralisation en actes verbaux de la libert subjective chappant au systme (de la langue). Contre cette interprtation nous raffirmons que la thorie du discours et les procdures qu'elle engage ne sauraient s'identi fier avec une linguistique de la parole . La deuxime erreur s'oppose la premire en ce qu'elle tord dans l'autre sens la signification du terme discours, en y voyant un supplment social de l'nonc, donc un lment particulier du systme de la langue, que la linguistique classique aurait nglig. Dans cette perspective, le niveau du discours s'intgrerait la langue, par exemple sous la forme d'une comptence de type particulier, dont les proprits varieraient en fonction de la position sociale, ce qui reviendrait l'ide qu'il existe des langues, en prenant au pied de la lettre l'expression politiquement juste, mais linguistiquement discutable selon laquelle patrons et ouvriers ne parlent pas la mme langue . Face ces deux dformations de la ralit dsigne par le terme dis cours , nous pensons utile d'introduire la distinction entre base (linguis tique) et processus (discursif) se dveloppant sur cette base 2, distinction qui selon nous peut seule autoriser la prise en considration des rapports de contradiction, antagonisme, alliance, absorption, . . . entre des forma tions discursives appartenant des formations idologiques diffrentes, sans pour autant impliquer l'existence mythique d'une pluralit de langues appartenant ces diffrentes formations.

1. Cf. Culioli, Fuchs, Pcheux (1970). 2. Les processus d'nonciation constituent ce qui, l'intrieur mme de la t base linguistique autorise que des processus se dveloppent par rapport elle. 22

Deuxime partie L'ANALYSE AUTOMATIQUE DU DISCOURS : CRITIQUES ET PERSPECTIVES NOUVELLES

1. Construction du corpus en fonction de ses conditions de production dominantes. L'introduction et les dveloppements qui prcdent indiquent cla irement que les conditions de production d'un discours ne sont pas des sortes de filtres ou de freins qui viendraient inflchir le libre fonctionnement du langage, au sens o, par exemple, la rsistance de l'air intervient sur la trajectoire d'un mobile dont la cinmatique prvoit le dplacement thorique, c'est--dire ce que serait ce dplacement si le mobile tait rduit un point, et se dplaait dans le vide. En d'autres termes, il n'y a pas d'espace thorique socialement vide dans lequel se dvelopperaient les lois d'une smantique gnrale (par exemple des lois de la communicat ion ), et dans lequel on r-introduirait, titre de paramtres correctifs des contraintes supplmentaires, de nature sociale. En fait, tout ce que nous avons introduit plus haut vise expliciter les raisons pour lesquelles le discursif ne peut tre conu que comme un processus social dont la sp cificit rside dans le type de matrialit de sa base, savoir la matrialit linguistique. Ds lors, l'expression conditions de production d'un discours ncess ite d'tre explicite dans son dtail, pour viter des erreurs d'interprtation que l'ambigut de certaines formulations a pu entraner. Remarquons tout d'abord que le terme mme de discours peut renvoyer ce que nous avons appel plus haut un processus discursif \ mais aussi une squence verbale orale ou crite de dimension variable, en gnral suprieure celle de la phrase. Cette dernire ralit, en raison de son caractre immdiate ment concret a t dsigne (Pcheux, 1969) par l'expression surface discursive qui a cependant le double dfaut de laisser entendre que les squences sont traites au niveau de leurs formes de surface , au sens chomskien du terme, et de dsigner sous une forme trop raccourcie, ce qui est en fait la surface linguistique d'un discours. Cette erreur sur le sens de surface discursive nous conduit souligner la ncessaire distinction entre les deux types de d-syntagmatisation inhrents, selon nous, au domaine du linguistique d'une part et celui du discursif d'autre part : la d-syn tagmatisation linguistique (ou encore : d-superficialisation) renvoie l'existence matrielle de la langue, caractrise par la structure non-linaire des mcanismes syntaxiques et plus profondment par tout ce sur quoi

1. Par exemple quand on parle du discours d'une science . 23

s'exerce l' oubli n 2 ; la d-syntagmatisation discursive, quant elle, ne peut commencer effectuer cette remonte au-del de l' oubli n 1 qu'en prenant appui sur l'opration linguistique que nous venons de ment ionner. Ces remarques nous permettent de proposer les distinctions termi nologiques suivantes : Surface linguistique sera entendu au sens de squence orale ou crite de dimension variable, en gnral suprieure la phrase. Il s'agit l d'un discours concret, c'est--dire de l'objet empirique affect par les oublis 1 et 2, dans la mesure mme o il est le lieu de leur ralisation, sous la forme cohrente et subjectivement vcue comme ncessaire d'une double illusion. Objet discursif sera entendu comme le rsultat de la transformation de la surface linguistique d'un discours concret en un objet thorique, c'est--dire en un objet linguistiquement dsuperficialis, produit par une analyse linguistique visant annuler l'illusion n 2. Processus discursif sera entendu comme le rsultat de la mise en rapports rgle d'objets discursifs correspondant des surfaces linguistiques relevant elles-mmes de conditions de production stables et homognes. Cet accs au processus discursif est obtenu par une d-syntagmatisation portant sur la zone d'illusion-oubli n 1. Soulignons cependant que la remonte complte en de de cet oubli suppose non seulement la mise en vidence de la formation discursive sous-jacente ( matrice du sens dont la procdure AAD actuelle permet de reprer certaines traces), mais aussi la saisie des rapports de dcalage entre cette formation discursive et Tinter-discours qui la dtermine (ce point n'a pas encore reu aujourd'hui de solution oprationnelle ). Nous rsumerons schma suivant : les remarques terminologiques ci-dessus par le

LANGUE analyse des mcanis mes syntaxiques et Surface li des fonctionnements nonciatifs nguistique objet dis y d'un dis cursif cours appar = d-superficialisation (graphe tenant au linguistique, visant connexe) corpus annuler l'effet de l'oubli n 2 (pr conscient-conscient au niveau de l'imagi naire)

DISCOURS analyse d'un corpus d'objets discursifs fonc tionnant comme auto dictionnaire processus >. discursif = d-syntagmatisation discursive, rompant la connexit propre chaque objet discursif et commenant annul er l'effet de l'oubli n 1

Nous pouvons maintenant reprendre l'examen de l'expression condi tions de production d'un discours dont nous disions qu'elle peut prsenter certaines ambiguts : il apparat en effet, la lumire de ce qui prcde, que l'on peut entendre par l soit les dterminations qui caractrisent un 24

processus discursif, soit les caractristiques multiples d'une situation concrte conduisant la production , au sens linguistique ou psycho-linguistique de ce terme, de la surface linguistique d'un discours empirique concret. Bien entendu, cette ambigut est la mme que celle qui a dj t signa le plus haut propos de l'opposition institution/appareil : dans les deux cas, ce qui est en jeu, c'est la ncessit de reconnatre le dcalage entre le registre de l'imaginaire, dont l'existence n'est pas annulable sous pr texte qu'il s'agit de l'imaginaire, et l'extrieur qui le dtermine. Dans cette mesure, il apparat qu'il nous manque radicalement une thorie de la situation concrte en tant que formation idologique o le vcu est inform, constitu par la structure de l'Idologie, c'est--dire devient cette structure dans la forme de l'interpellation reue, pour reprendre une formulation de L. Althusser. Cette thorie de la situation concrte , c'est--dire une mise en rapport thorique des dterminations leur effet imaginaire, est en dfinitive le point partir duquel les oprations de construction du corpus pourraient trouver leur vritable statut. Cette articulation faisant actuellement encore dfaut x, la pratique de construction des corpus (et des plans de traitement combinant plusieurs corpus) en subit invitablement l'effet, sous la forme d'une tentation empiriste visant l'impossible articulation d'une psychologie exprimentale et du Matrialisme Historique. Disons cependant que, sous les deux formes que nous allons examiner ci-dessous (traitement exprimental, traitement d'archives), le lien entre l'imaginaire et l'extrieur qui le dtermine passe par le concept de dominance : on dira qu'un corpus est constitu par une srie de surfaces linguistiques (discours concrets) ou d'objets discursifs (ce qui suppose un mode d'intervention diffrent de la pratique linguistique dans la dfinition du corpus, nous y reviendrons), ces surfaces tant domines par des conditions de production stables et homognes. Cela signifie que l'on suppose que tout discours concret est en fait un complexe de processus renvoyant des conditions diffrentes. Dterminer la construction du corpus par la rfrence cette dominance revient donc dfalquer comme des lments trangers au processus tudi les lments individuels qui peuvent apparatre dans tel discours concret et non dans tel autre, les deux tant domins par les mmes conditions. Cela n'exclut bien entendu nullement que l'on se donne pour objet d'tude des diffrences, mais ces diffrences seront toujours considres comme des diffrences entre corpus, rsultant de diffrences entre conditions de product ion, et jamais comme des diffrences individuelles. Prcisons les deux formes de traitement que nous mentionnions plus haut, savoir le traitement exprimental et le traitement d'archives. Il s'agit de deux procdures diffrentes visant toutes les deux construire 1. Prcisons que la thorie de cette articulation ncessite une laboration sur un plan gnral et ne saurait se confondre avec les conditions et les rsultats de telle ou telle analyse discursive particulire ; cette remarque afin d'viter ici l'ide d'un cercle vicieux. 25

un corpus, ou un systme de corpus, qui puisse tre soumis l'analyse AAD. Soulignons bien que, dans les deux cas, les principes thoriques et les consi drations pratiques qui guident cette phase sont strictement extrieurs aux principes et aux caractristiques techniques du dispositif AAD lui-mme. En d'autres termes, la responsabilit thorique qui prside la construction du corpus (ou systme de corpus) n'a en principe rien de commun avec la responsabilit qui est spcifiquement celle de la procdure AAD, savoir la responsabilit de raliser une lecture non-subjective ; il faut toutefois ajouter immdiatement que, bien entendu, les responsabilits prises au niveau extra-discursif (les diffrentes hypothses sociologiques, histo riques, etc.) qui prsident la construction du corpus ne sont pas sans effet sur les rsultats que produira l'analyse AAD. Mieux, on peut dire que ces rsultats reflteront ces hypothses au niveau des effets discursifs reprs, ce qui ne veut pas dire que les rsultats soient le pur et simple reflet transparent des hypothses extra-discursives servant la construction. Sans cette distinction entre ces deux responsabilits, on est fatalement conduit l'ide d'une circularit par laquelle l'AAD court le risque de retrouver comme rsultat de l'analyse le contenu mme introduit et orga nis par cette catgorisation , comme le souponnent M. Borillo et J. Virbel dans un article rcent (1973, p. 1) dont nous discuterons plus loin les remarques critiques de nature linguistique et/ou documentaire. En pr tendant que en fait, la dmarche qui mne au choix du terme circons tance revient exactement celle que Gayot et Pcheux rcusent tout d'abord (art. cit., p. 12), Borillo et Virbel mettent le doigt sur une diff icult tout fait relle, tout en commettant en mme temps une subreption logique ; expliquons-nous : en disant que ces auteurs commettent une subreption logique, nous voulons dire que faute de reconnatre la ncessit de la distinction entre les deux types de responsabilit que nous voquions plus haut, ils nous attribuent eux-mmes cette confusion, et en tirent des consquences qui, pour cette raison, sont au moins partiellement inva lides : ne pas distinguer, en effet, entre les dterminations extra-discursives (et extra-linguistiques a fortiori) d'une part et la catgorisation (pour reprendre leur formulation) que la procdure AAD prtend produire comme un rsultat sans en prsupposer l'existence dans le systme de lecture inhrent cette procdure, c'est finalement superposer le niveau linguis tique, le niveau discursif et le niveau idologique-culturel (cf. hypothse implicite de type Sapir-Whorf) et les identifier comme le lieu o s'effectue la mme catgorisation , une premire fois sans le dire au niveau du choix des lments constituant le corpus, une deuxime fois au niveau des rsultats obtenus par AAD, qui ne seraient en ralit que le reflet trans parent x de la premire catgorisation . C'est finalement la non-rducti1. Cette transparence est dmentie dans la pratique par l'alternance des comment aires en prsence d'un mme ensemble de rsultats AAD. Cette alternance fonctionne selon le principe : Vous dites que vous obtenez ce rsultat, prouvez-le / Ce rsultat que vous obtenez est vident . 26

bilit du discursif au linguistique ou l'idologique dont il faut ici rappeler l'importance, sauf retomber dans les apories d'une thorie idaliste de l'idologie. Cette perspective, qu'il faut bien appeler rgressive dans la mesure o elle vise en dfinitive poser l'impossibilit de l'objectif que nous nous sommes fix ( reconnaissez enfin qu'il est impossible d'viter une catgorisation a priori, qu'on ne peut pas viter le recours la sub jectivit , etc.) ne doit pas empcher de discerner ce qui, dans les critiques sur lesquelles cette rgression se fonde, constitue une mise en cause justifie nous permettant d'aller plus loin dans la direction que nous avons rappele ci-dessus. Une fois pos que la matrialit de l'idologie ne s'identifie nullement la matrialit discursive (dans la mesure o cette dernire en est un lment particulier, ce qui implique, en ce qui nous concerne, que les conditions de construction d'un corpus ne sauraient tre intra-discursives exclusive ment), il est possible de prendre en considration les critiques que BorilloVirbel ont formules sur ce point. Disons que la principale consiste souligner le caractre passablement immotiv du principe de construction retenu dans l'article concern, savoir la slection, dans un ouvrage donn, des phrases contenant un certain mot-ple , en l'occurrence, le mot circonstances . Le reproche est double : d'une part, on voit mal, d'un point de vue mthodologique, comment le dtail de justifications de nature extrmement varie (art. cit., p. 10) a conduit retenir le terme circonstances et pas autre chose, d'autre part, la dcision de retenir les phrases (squences spares par deux points) contenant le terme retenu constitue un deuxime aspect arbitraire contribuant galement incriminer la procdure choisie. Reprenons successivement ces deux points : En ce qui concerne la premire critique, elle semble assez largement justifie. Il ne suffit pas en effet, pour y rpondre, de souligner le caractre non mthodologique mais directement thorique (en l'occurrence la thorie matrialiste-historique) de la procdure qui a conduit retenir le terme circonstances . En fait, une analyse concrte de la situation concrte * aurait d aboutir un systme de points sensibles en rapport entre eux et susceptible de se projeter mthodologiquement dans un plan de traitement reliant plusieurs corpus en vue de l'interrogation de leurs diffrences. Autre ment dit, il nous semble possible et ncessaire actuellement de ne pas s'en tenir l'analyse d'un corpus construit arbitrairement partir d'un mot-

1. L'analyse concrte d'une situation concrte suppose, selon nous, que la matr ialit discursive dans une formation idologique soit conue comme une articulation de processus. Rappelons sur ce point la remarque de P. Fiala et C. Ridoux (1973, p. 45) : Le texte nous dirions quant nous : le discours * n'est pas un ensemble d'noncs porteurs d'une, voire de plusieurs significations. C'est d'abord un processus qui se dveloppe sous de multiples formes dans des situations sociales donnes. 27

ple, en ayant systmatiquement recours l'analyse des diffrences internes qu'un plan de traitement peut mettre en vidence. Ceci suppose, au niveau mthodologique, l'existence d'un moyen permettant d'associer n corpus en un seul pour tudier les diffrences qui se trouvent ainsi induites ; ce moyen, actuellement ralis dans le programme par la procdure dite de compactage (cf. p. 62), n'tait pas disponible l'poque o le travail voqu a t ralis. De fait, l'volution de notre conception du traitement a t dans ce sens : en dfinitive, l'accs au processus discursif propre un corpus nous parat en grande partie trouver sa garantie dans l'tude de sa spcificit l'intrieur d'un systme d'hypothses ralises sous la forme d'un complexe de corpus, trait l'aide de la procdure de compactage voque l'instant. Finalement, il s'agit la fois d'tudier la productivit de telle hypothse et d'en dduire les caractristiques du processus discursif tudi. Ajoutons, toujours sur ce premier point, que rien n'interdit de penser que des procdures pralables de dfrichage statistique (par exemple des tudes de co-occurrences comme celles que propose l'quipe de lexico logiede l'ENS de St-Cloud 1) pourraient prsenter un intrt pour le reprage initial du champ des hypothses ; par ailleurs, on peut envisager un contrle statistique a priori de l'homognit de chaque corpus soumis l'analyse, ou des rgles de clture d'un corpus 2. La deuxime critique porte sur le caractre relativement arbitraire de la procdure de segmentation, fonde sur le critre de la phrase. Disons tout de suite que ce reproche, tout fait justifi, dsigne une difficult trs grave dont il est impossible de dire aujourd'hui comment elle sera rsolue. Quelles sont les limites empiriques d'un discours l'intrieur d'une squence complexe donne ? Les combinaisons de processus corres pondent-elles des juxtapositions dans la linarit de la squence, ou non ? Tout ce qu'on peut dire, c'est que toute notion littraire renvoyant l'unit intrieure de l' uvre , du texte, du paragraphe, etc. est nulle et non avenue, compte tenu des prsupposs thoriques que nous avons rappels plus haut. Le principe d'une liaison expressive entre l'unit organique de la forme et l'unit intentionnelle du fond contenu, projet ou sens est un mythe littraire (ncessaire la forme classique de l' explication de textes ) qui reproduit l'illusion subjective commente plus haut. On ne peut que constater que cette question, souleve galement par Genevive ProvostChauveau (1970 p. 135), renvoie aux limites mmes de la linguistique de la phrase, sur quoi nous reviendrons plus loin, et dsigne le vide urgent combler d'une thorie de V inter -phrase. L'tude critique que nous venons d'effectuer n'est pas sans consquences l'gard des deux procdures de construction de corpus que nous avions commenc par distinguer : si, en effet, on considre d'une part la voie exprimentale dans laquelle une mise en scne reproduit (avec un coef1. Geffroy et al. (1973). 2. Cf. ci-dessus, p. 24-25 et ci-dessous, pp. 56-57 et 68. 28

cient variable d'imaginaire) une situation concrte quant tel ou tel des effets qui la caractrisent x et d'autre part la voie archiviste 2 , on constate que le problme de la segmentation du discours ne se pose pas (ou est plus facilement soluble) dans le cas de la voie exprimentale , et que par ailleurs l'ide qu'il est prfrable de traiter un systme d'hypothses ralis en complexe de corpus revient considrer le champ d'archiv comme un dispositif quasi exprimental. Pour ces diffrentes raisons, nous avancerons l'opinion que la forme-archive est considrer comme une forme drive, abtardie de la procdure de traitement qui, dans sa vise, est de nature exprimentale ; ce point mritait d'tre soulign, tant donn un certain nombre d'interprtations non directivistes auxquelles certaines formulations de AAD 1969 avaient donn lieu. Il convient toutefois d'ajouter aussitt que cette indication d'orienta-

1. Dans des rapports de places inscrits l'intrieur des rapports de classes. 2. La procdure AAD a t applique (dans la perspective archiviste ) par l'hi storien G. Gayot pour trois tudes indpendantes portant sur des textes du xvme sicle. Voici les remarques qu'il nous a transmises sur ce point : Dans les trois cas, les processus discursifs que nous avons reprs correspondaient ce qu'une lecture informe des textes suggrait l'historien. Mais deux faits mritent attention. 1) On sait que, dans la forme de traitement dite archives , le corpus est constitu par les squences extraites d'un ensemble donn et contenant le terme choisi en raison du rle dterminant que je lui attribue hypothtiquement en tant qu'historien. Or, malgr le soin apport mon choix, il est arriv que les rsultats soient pauvres , en ce sens que les mcanismes discursifs mis en uvre dans le contexte du terme choisi ne fournissent rien de plus que ce que fournissait un long apprentissage de la lecture des textes soumis l'analyse (cf. Histoire et Linguistique, A. Colin, 1973, p. 242). Je crois qu'en fait il en sera toujours ainsi avec des corpus centrs sur un terme dont la puissance est telle, dans les conditions discursives considres, qu'il cre le vide autour de lui et ne convoque, outre le processus principal qu'il contient, que des processus drivs directement subordonns. Ainsi se trouve exprimentalement mise en cause l'vidence qui voudrait que l'importance indiscutable d'un mot pour ceux qui l'ont utilis, une poque donne, soit ncessairement productive du point de vue des processus discursifs qui lui sont lis. 2) Les deux autres tudes par contre (Gayot-Pcheux, Annales 1971, (3-4) pp. 681704 et Gayot, paratre) nous ont montr que la forme dominante de slection-combi naison des mots lie l'emploi du terme choisi laissait la place au fonctionnement de processus discursifs secondaires relativement autonomes qui, la simple lecture, pouvaient tre perus comme principaux (Exemples : les enchanements sur le thme du progrs gnral ralis par les masses chez Saint-Martin ; les enchanements sur le thme de la fraternit et de l'galit des hommes chez les francs-maons au xvme sicle). L'AAD a en fait montr que ces mcanismes secondaires taient repris, intgrs et comme dig rs dans l'organisation gnrale du discours rgie chez Saint-Martin par la confiance accorde la seule lite des lus de Dieu et, chez les francs-maons, par le service rendu par la fraternit maonnique l'ordre tabli, l'ordre traditionnel et non pas l'ordre venir . Ainsi l'AAD permet l'historien, partir d'une collection d'noncs donns, de recomposer et de distinguer les rgles principales et annexes qui les produisent Cette distinction est capitale pour chapper aux piges tendus, au long de la lecture, par les processus discursifs secondaires qui projettent une zone d'ombre autour du processus dominant. En ce qui nous concerne, le bnfice que nous en avons retir porte avant tout sur la mise en vidence du pige que constitue l'idologie singulire conservatrice ou contre-rvolutionnaire sous-tendue par le discours maonnique ou martiniste au xvine sicle, idologie qui a pu tromper et trompe encore certains zla teurs du progrs. 29

tion ne rsout en elle-mme aucun problme de fond quant la nature d'une exprimentation matrialiste dans le domaine qui nous concerne. Conten tons-nous de souligner que la pratique socio-historique qui sert de rfrence invitable en ce point est en fait profondment ambigu : cette pratique est trs exactement instable en ce sens qu'elle peut basculer d'un ct ou de l'autre, sans garde-fou, c'est--dire du ct du matrialisme historique ou du ct de la psychologie sociale, avec, vrai dire, une probabilit tout fait ingale entre les deux issues, si l'on n'y prend garde : nous voulons dire que, sans autre garde-fou que la mthode exprimentale , on tombe presque invitablement dans la psychologie sociale des situations, et dans l'idalisme qui en est corrlatif.

2. L'analyse linguistique. 2.1. Les objectifs d'une analyse linguistique du discours. On parle parfois d'une linguistique du discours pour dsigner en fait un type d'approche du langage susceptible d'chapper au moins par tiellement certains effets des restrictions thoriques d'une linguistique traditionnelle dont le dfaut principal serait de concevoir son objet dans le cadre de ce que la grammaire classique (et avant tout la grammaire latine) a appel la phrase . Gela signifie la fois une fixation sur la struc ture de l'nonc et une sorte de ccit l'gard de ce qu'on appelle actuell ement nonciation ; simultanment se trouve place au centre des di scussions la question de l'interphrase, sur laquelle nous reviendrons. En effet, la prise en considration de la ralit du discours, l'espce de dcentrement qu'elle introduit dans la linguistique elle-mme est, on va le voir, dcisif pour toute notre entreprise. Nanmoins, ce serait une erreur de considrer que l'analyse du discours telle que nous la concevons est tout simplement l'exercice de cette nouvelle linguistique dbarrasse des prjugs de la linguistique traditionnelle . Cela reviendrait dire, en effet, que le changement par rapport celle-ci rside essentiellement dans une autre faon d'aborder son objet, dans de nouvelles ncessits imposes la recherche, etc. Tout cela qui par ailleurs est parfaitement exact ne touche cependant pas encore l'objectif que nous assignons une analyse linguistique du discours. Disons que cela en constitue une des conditions ncessaires de ralisation : il reste prciser quelles sont les autres, et surtout comment elles s'articulent entre elles. Pour aller directement au point principal, il nous semble utile de souligner que les linguistes (en tant que purs linguistes ) envisagent le plus souvent comme rsultat de leur pratique un discours thorique pouvant avoir la forme d'une thorie gnrale ou d'une monographie, mais qui de toute faon concerne un objet linguistique plus ou moins spcifique sous la modalit de sa description, de V expos de son fonctionnement, de la thorie des mcanismes qui 30

le constituent. Face cette pratique du linguiste, celle de l'analyse du discours se caractrise par deux particularits : la premire c'est que cette pratique met ncessairement en jeu une procdure algorithmique x, ce qui suppose une diffrence essentielle sur la forme du rsultat produit (Remarque : il s'agit bien ici de l'analyse du discours et non de la thorie du discours qu'elle prsuppose). En ce sens, l'analyse du discours se rapproche, on va le voir, de ce qu'on appelle parfois linguistique applique , dans la mesure o, empiriquement, on observe dans les deux cas le recours l'ordinateur . Mais cette premire caractristique reste en elle-mme tout fait insuffi sante, et il faut immdiatement ajouter une deuxime spcificit de l'analyse du discours, savoir que l'objet propos duquel elle produit son rsul tat n'est pas un objet linguistique mais un objet socio-historique o le linguistique intervient comme prsuppos 2. Et c'est cette relation d'appli cation8 qui, selon nous, dtermine cet effet de sparation-clivage entre pratique linguistique et analyse du discours : du point de vue de l'analyse du discours, la pratique linguistique apparat comme une premire phase absolument indispensable (il ne saurait y avoir d'analyse sans une thorie et une pratique linguistiques), mais insuffisante comme telle, dans la mesure o elle existe en vue d'une deuxime phase, propos de laquelle s'opre un changement de terrain : l'application n'est pas une application de la linguistique sur elle-mme (c'est--dire une application interne, l'intrieur d'une thorie donne, comme dans le cas de l'informatique linguistique qui sert de relais la linguistique dans une procdure visant raliser tel ou tel mcanisme expos au niveau du discours thorique de la linguis tique, par exemple un algorithme de gnration de formes syntaxiques, ou une procdure de classification automatique des traits syntacticosmantiques d'une liste de verbes, etc.), mais une application de la thorie linguistique sur un champ extrieur. Dans ces conditions, il est comprh ensible que celui que nous avons appel le pur linguiste ait une raction un peu agace comparable celle de l'artisan qui le contenu de

1. Algorithme : suite rgle d'oprations ralisable en un temps fini par un cal produisant un rsultat dtermin partir d'un point de dpart donn. 2. C'est pourquoi il nous semble qu'il y a parfois abus de langage lorsqu'on utilise le terme linguistique du discours pour dsigner en fait une linguistique des textes (voire d'un texte) sous le prtexte qu'elle dpasse le cadre d'analyse de la phrase, ce qu'on recouvre par ailleurs souvent sous l'expression linguistique de la parole ; nous avons indiqu plus haut les raisons de notre rticence cet gard. 3. En employant le terme d' application , nous risquons d'introduire une ambig ut sur laquelle il convient de s'expliquer en distinguant application technique et application thorique. L'application technique consiste utiliser une thorie et un appareillage comme l'instrument pour la production d'un effet, objet ou rsultat dans la pratique (la thorie des semi-conducteurs s'applique techniquement la fabrication des transistors). L'application thorique consiste en l'intervention d'une discipline thorique dans une autre (application des mathmatiques dans la physique) ou en l'application d'une discipline elle-mme. Soulignons que dans le cas de l'informatique linguistique, il n'est malheureusement pas toujours facile de distinguer entre les applications tech niques et les applications thoriques. culateur, 31

son travail chappe ; il ne peut pas ne pas prouver comme des exigences trop fortes les contraintes imposes par ce champ extrieur . Dans cette mesure, l'analyse du discours, laquelle se relient thoriquement par une dpendance de fondation la documentation et la traduction automatiques, rencontre de la part de la linguistique pure les mmes rticences et les mmes difficults que celles-ci : le point commun est constitu par l'exigence d'une grammaire de reconnaissance susceptible de rpondre la fois aux exigences thoriques internes de la linguistique et aux ncessits de ce que nous avons appel le champ extrieur : En ce qui nous concerne, nous dirons que la grammaire de reconnais sance ncessaire l'analyse du discours doit rpondre deux requisits : a) cette grammaire doit pouvoir produire algorithmiquement une repr sentation de ce qui a t dsign plus haut sous le nom de surface linguistique, cette reprsentation produite algorithmiquement constituant ce que nous avons appel l'objet discursif correspondant ; b) que cette reprsentation (l'objet discursif produit) soit susceptible de permettre un calcul effectuable sur le rapport entre diffrents objets discursifs ainsi pro duits, ce calcul ayant pour but de restituer la trace des processus smant iques-discursifs caractristiques du corpus tudi. Il est bien clair que, dans les conditions actuelles de dveloppement de la thorie linguistique, la solution d'un tel problme se heurte de multiples difficults. Certes il existe depuis quelques annes des grammaires capables de reconnatre (en vue de la documentation ou de la traduction) des textes spcialiss en langue anglaise, russe ou franaise, mais elles tombent sous le coup des critiques (le plus souvent parfaitement justifies) de la linguis tiquepure et la solution que nous avons propose n'y chappe pas davan tage qu'une autre. Considrons les deux cas que nous venons d'voquer, o une grammaire de reconnaissance est en jeu, savoir la traduction d'une part, la documentation ou comparaison de textes d'autre part ; on peut leur faire respectivement correspondre les deux schmas suivants dont a l'vidence garantit la stabilit : A. Traduction. Dx o Dx et Dy reprsentent deux versions du mme texte, dans les langues x et y, et o Mxy dsigne la reprsentation profonde sous-jacente commune Dx et Dy. B. Documentation et comparaison de textes. Dx Dy 32 * Sx f R(Sx/Sy)

o Dx et Dy reprsentent deux squences mettre en rapport, Sx et Sy les descriptions que l'analyse linguistique en fournit respectivement, et R (Sx/Sy) le rsultat de la mise en rapport effectue par le dispositif compar ateur ou documentaire. En dpit des apparences graphiques, nous soute nons que le deuxime schma est plus lmentaire que le premier, et qu' vrai dire il lui prexiste logiquement : en effet, le terme de reprsentation profonde , qui apparat dans le schma traduction disparat dans le second schma ; il est remplac par le rapport entre deux structures Sx et Sy dont on ne prsuppose pas qu'elles constituent les reprsentations profondes respectives de Dx et Dy. Nous dirons pour notre compte que l'ide de faire correspondre une reprsentation profonde une surface li nguistique (ce qui est le cas du schma A) met en jeu des prsupposs psycho smantiques que la conception discursive de la signification remet prc isment radicalement en cause. Dans la perspective du schma A en effet, la conception de la relation entre syntaxe et smantique est celle d'une relation entirement intra-linguistique, puisque l'analyse reprsente par la flche horizontale (-*) conduit par tapes de la surface morpho-phonolog ique du texte sa structure smantique ou reprsentation profonde Mxy, suppose commune toutes les langues et constituant ainsi une sorte de pont logique ou pivot (cette structure logique tant forme d'arguments et de prdicats extraits de la langue logique universelle, c'est--dire de la structure de l'esprit humain ). Dans la perspective correspondant au deuxime schma au contraire, on voit que la reprsentation profonde (ou plutt ce qui s'y substitue, savoir le rapport R(Sx/Sy)) n'est pas conue comme l'aboutissement de l'analyse linguistique (->), mais comme le produit d'une opration spcifique s' effectuant sur le rsultat pralable de l'analyse linguistique, savoir Sx et Sy. Tout ceci pour bien mettre en vidence que lorsque nous parlons maintenant d' analyse linguistique , nous nous situons dans la deuxime perspective, o Sx ne dsigne pas une repr sentation profonde mais simplement le rsultat d'une dlinarisation morpho-syntaxique applique de manire ventuellement algorithmique la surface linguistique de dpart : autrement dit, l'analyse que nous dsignons comme linguistique , et qui constitue la deuxime phase de VAAD que nous commentons actuellement, a exclusivement pour but de produire ce qui a t dcrit plus haut sous le nom d'objet discursif, l'exclu sion de toute reprsentation profonde . Nous pouvons dsormais reformuler en les prcisant les deux exigences que nous avions dfinies plus haut : a) II est ncessaire que la grammaire de reconnaissance soit capable, partir d'une surface linguistique Dx donne, d'en produire une reprsen tation morpho-syntaxiquement cohrente Sx, c'est--dire une reprsenta tion linguistiquement dlinarise, restituant la non-linarit syntaxique faisant l'objet de ce que nous avons dsign par l'expression oubli n 2 . La cohrence de cette reprsentation, fonde sur l'autonomie relative des structures morpho-syntaxiques ( fonctionnement de la langue par rapport 33 LANGAGES N 37 3

elle-mme ) suppose qu'il soit possible sinon de reconstituer le texte de dpart, tant donn la reprsentation qu'en fournit la grammaire de reconnaissance, du moins de dcider, au vu d'une reprsentation Sx donne, celle laquelle elle correspond (i. e. dont elle est drive), parmi deux surfaces linguistiques dont la proximit est telle que l'tat actuel de la thorie linguistique permet malgr tout de les distinguer. b) II est d'autre part indispensable que la reprsentation Sx constitue une entre possible pour l'effectuation de la comparaison que nous avons reprsente par une flche verticale (cf. p. 32) sur le schma B. Disons tout de suite que cette deuxime condition, extrieure l'analyse li nguistique comme telle, est la source de grandes difficults qui se rsument en dfinitive dans le fait qu'il est, semble-t-il, trs malais de comparer des structures complexes entre elles, l'aide de procdures algorithmiques. On n'entreprendra pas de dcrire ici les diffrentes solutions qui sont actuellement utilises ou envisages ; mentionnons simplement, sans aucune prtention l'exhaustivit : Les analyseurs syntaxiques fonds sur les systmes-Q (Colmerauer, Vauquois) et les reprsentations de type pivot 2 (Equipe TAL de Grenoble) 1, qui semblent avoir pour commune proprit de raliser ou d'avoir t conus en vue de raliser de manire algorithmique les proc dures proposes jadis par Tesnire (Elments de syntaxe structurale, Klincksieck, 1959), en articulant des dpendances hirarchises en filiations sur un point initial constitu en gnral par le verbe. Les dispositifs d'analyse syntaxique inspirs directement des travaux de Harris (y compris les string grammars ), qui reposent sur l'extraction de schmas-noyaux (NV, NVN, NVPN, etc.) et sur la dis tinction entre chane centrale et adjonctions 2. Les grammaires des cas qui se dveloppent dans la ligne des travaux de Fillmore (voir notamment Slakta, 1974) sur une base gnrativetransformationnelle. Pour les raisons que nous avons exposes ci-dessus, nous ne retien drons pas dans cette enumeration la procdure d' analyse linguistique du discours de F. Bugniet 3, dans la mesure o la reprsentation qu'il fait correspondre la squence de dpart est davantage une liste de traits

1. Cette quipe, dirige par J. Rouault, pose comme un de ses objectifs la consti tution d'une GRF capable notamment d'automatiser (au moins partiellement) la phase d'analyse linguistique de l'AAD. 2. Il serait intressant de comparer systmatiquement le graphe de l'analyse AAD en noncs lmentaires et celui que peut produire l'analyseur syntaxique de M. Salkoff, qui applique au franais la mthode propose par S. Z. Harris dans String Analysis. Cf. Salkoff (1973). 3. F. Bugniet (1971-1972). 34

(susceptible d'une tude statistique) qu'une structure munie de caract ristiques formelles permettant un calcul algorithmique non trivial. La phase d' analyse linguistique que ncessite l'application de l'AAD a t dcrite de manire plus ou moins complte dans Pcheux, 1969 et surtout dans le Manuel (Haroche-Pcheux, 1972). Nous ne repren dronsdonc pas le dtail de la procdure d'analyse syntaxique propre cette phase, d'autant plus qu'un travail spcifiquement linguistique est en cours d'laboration sur ce point. Toutefois, il nous a paru ncessaire de rappeler brivement les carac tres principaux de la phase linguistique de l'AAD, qui s'apparente pour l'essentiel aux perspectives de S. Z. Harris. On pourrait rsumer en disant que la procdure (conue comme susceptible d'une application algorith mique) consiste produire, tant donn une squence linguistique de lon gueur variable, une reprsentation de cette squence sous la forme d'un graphe connexe, value et une seule racine dont les points sont constitus par des noncs lmentaires de dimension canonique et dont les arcs sont des relations connectant deux deux certains noncs, ces relations pouvant prendre diffrentes valeurs (de dtermination, comme dans le cas de la relative, de l'adjectivale ou du complment de nom ; de subordinationcoordination dans le cas des diffrents rapports temporels et/ou logiques qui peuvent affecter un couple d'noncs). Exemple :

Les noncs lmentaires sont ici dsigns par la suite des entiers naturels, et la valuation des arcs les reliant est marque par des lettres grecques.

etc.. Si l'on tente de caractriser la spcificit de cette procdure, il semble important d'insister sur deux aspects qui sont les suivants : a) la diff rence des arbres, arborescences ou graphes propres aux grammaires gn35

ratives-transformationnelles de Harris ou de Chomsky, les nuds (ou points) ne sont pas ici des catgories syntaxiques prterminales ou terminales (du type GN ou DET, etc.) ou des units lexicales, mais des sortes de relations-points, ou, si l'on veut, des sous-graphes rduits un point au niveau de la structure du graphe reprsentant l'ensemble de la squence. Cela revient dire qu'il y a deux systmes imbriqus l'un dans l'autre : le systme des noncs et celui des relations inter-noncs, de telle sorte que les objets du premier systme servent d'lments pour la construction des objets du second. Signalons que, dans le cadre des thories gnratives, la structure de ce sous-graphe * pourrait tre reprsente de la manire suivante :

DET avec : E : nonc lmentaire. SHN : schma-noyau, sur lequel s'exerce une srie de dterminations verbales, par l'intermdiaire de F. F : forme de l'nonc, contenant des indications morpho-syntaxiques sur la voix, le statut, le mode et le temps grammaticaux de l'nonc. SHN = GN1 + GV. GN1 : groupe nominal sujet, form d'un dterminant (ventuellement vide) et d'un substantif. GV : form d'une part du compos V + ADV (verbe + adverbe = VA) et d'autre part du groupe nominal objet GN2, ventuellement introduit par une prposition P (relevant alors avec lui du symbole GP).

1. Soulignons bien qu'il s'agit ici de la reprsentation adopte dans le texte de Pcheux, 1969 : on verra plus loin (cf. p. 45 sqq.) les modifications actuellement envi sages. 36

Ajoutons que DET2 peut lui aussi tre vide, spcialement dans le cas o GN2 est adjectival, et que l'on choisit conventionnellement de reprsen ter la prposition vide introduisant le complment d'objet direct par *, le vide devant 1' attribut par a 1 et la copule sous-entendue dans la dtermination adjectivale 2, etc., par E . On voit facilement que ces dispositions permettent de reconstruire les schmas-noyaux suivants : 1) 2) 3) 4) 5) 6) 7) 8) GN1 GN1 GN1 GN1 GN1 GN1 GN1 GN1 GV GV GV GV E E GV GV 0 * P a a P a P' 0 Pierre dort GN2 Pierre mange le steak GN2 Pierre s'appuie la fentre A Pierre semble stupfait A le chapeau est beau -> le beau chapeau GN2 le chapeau est Pierre -> le chapeau de Pierre GN2 Pierre est instituteur GN3 Pierre mange avec une fourchette

Nous pouvons dsormais prciser ce que nous entendions l'instant en parlant de Y imbrication de deux systmes. Soient en effet les phnomnes syntaxiques classiquement connus depuis les grammaires gnrativestransformationnelles sous le nom d' embotement ou d' imbrication (rcursivit) : dans la perspective de ces grammaires, l'embotement est reprsent comme une complexification du graphe de l'nonc (cf. p. 35), de sorte que, de proche en proche, V nonc est la matrice de la phrase comme une forme abstraite et dpouille est le squelette du corps achev. En d'autres termes, moins imags, on peut dire que V imbrication (et de faon plus gnrale la rcursivit) est la condition qui assure l'homognit tho rique et mthodologique entre l'nonc et toute formation plus complexe, de telle sorte que toutes les relations s'effectuent dans un mme systme, ce qui se marque par l'enchssement du graphe de l'nonc dterminant dans le graphe de l'nonc matrice. Dans le cas de la procdure que nous exposons, tout au contraire, la dcision de ne pas rintroduire d'nonc l'intrieur de l'nonc suppose que la question de la rcursivit soit rgle autrement ( savoir par le passage du premier systme, intra-nonc, au second systme, des relations entre noncs). C'est poser du mme coup qu'un nonc El peut en dterminer un autre E2 par une relation dissymtrique qui quivaut une imbrication de El dans E2, et plus gnralement qu'une portion de graphe organisant plusieurs noncs peut quivaloir un point

1. Ce point a t introduit depuis la publication du Manuel 1972. 2. La question de la dtermination adjectivale soulve des problmes analogues ceux que nous relevions propos des relatives, et au moins aussi difficiles rsoudre, car on rencontre non seulement la distinction entre adjectivation determinative et non determinative (la voiture noire/la neige blanche), mais aussi des oppositions d'un autre type comme : un simple soldat/un vrai dmocrate, ou encore : l'allure martiale de X/la cour martiale, etc. 37

du graphe gnral ; ceci constitue en fait le deuxime point caractristique que nous voudrions prsenter avec quelques dtails. b) Ce deuxime point concerne les rapports entre noncs comme rapports de dominance. Soit la phrase suivante : II me semble que l'Eglise reste dans les nuages et qu'elle oublie les difficults et les problmes de la vie. On voit qu'on peut en extraire les noncs suivants : 1) 2) 3) 4) 5) 6) II me semble S (= quelque chose), l'Eglise reste dans les nuages, l'Eglise oublie les difficults, les difficults (sont) de la vie, l'Eglise oublie les problmes, les problmes (sont) de la vie.

Si, en outre, on pose les connecteurs QUE, ET et DT (ce dernier connec teur servant la dtermination d'un nonc sur le N d'un autre nonc), il est clair qu'on peut reprsenter la squence initiale de la faon suivante : squence = 1 /A/ =2 /B/=/C/ /G/ =3 /D/ = 5 QUE ET ET DT DT /A/ /B/ /D/ 4 6

o l'on constate que des noncs sont mis en rapport avec des constructions d'noncs, indiques ici par des majuscules /A/, /B/, etc., s'imbriquant les unes dans les autres. Il est cependant possible de reprsenter ces dpendances par un schma ne comportant que des noncs et des relations entre noncs c'est--dire o les constructions intermdiaires /A/, /B/, etc., n'apparaissent plus comme telles, ce qui constitue, nos yeux, une condition indispensable de la phase 3 de traitement informatique, dont nous parlerons plus loin. Ce schma, de forme combinatoire , est le suivant : 3 QUE ET 5 DT _.. __. 4 ET + 6

On remarquera que l'criture parenthtique ci-dessous est strictement quivalente : 1 38 QUE (2 ET ((3 DT 4) ET (5 DT 6)))

Nous reprendrons lors du commentaire de la phase 3 la question de savoir si une procdure algorithmique de comparaison pourrait s'effectuer sur des reprsentations de ce type ; contentons-nous pour l'instant d'expos er le systme de transformations par lequel on passe de la reprsentation ci-dessus un graphe d'noncs relis par des relations binaires, comme il a t annonc plus haut. Soient les deux conditions suivantes :

9 M SS S 8

On voit que si on les applique le schma devient : 1 QUE 3 ET Jet PT Une constatation s'impose alors, savoir que le caractre distributif du QUE l'gard des noncs de la construction /A/ a disparu ; il est donc ncessaire de rtablir les liens existant entre 1 et 3 d'une part, 1 et 5 d'autre part. (Rappelons que ces liens rtablis ainsi portent le nom de saturations ). On aboutit de cette manire au graphe satur suivant : DT 4

DT Les donnes d'entre de la phase 3 sont donc en dfinitive : a) la liste des noncs lmentaires, chacun tant, comme il a t 1. Cf. Haroche-Pcheux, 1972, p. 40 39

dit, une suite de 8 catgories morpho-syntaxiques munies de leur valeur respective, soit : DET1 1) 2) 3) 4) 5) 6) 0000 0000 0000 0040 1 0000 0040 x 0 L R R R R Ni S SEMBLER EGLISE RESTER EGLISE OUBLIER DIFFICULT E EGLISE OUBLIER PROBLME E ADV 0 0 0 0 0 0 A DANS DE * DE DET2 0 LS LS L LS L N2 EGO NUAGE DIFFICULT VIE PROBLME VIE

d'une part et b) la liste des relations binaires d'autre part 2 1 3 5 QUE 2 QUE 3 ET QUE 5 DT DT

Remarque : on aura not, dans la colonne DET1, la prsence de la forme R , qui signifie la reprise d'une dtermination prcdente. 2.2. Critique de la phase d'analyse linguistique de VAAD. Ayant rappel ce qu'taient, selon nous, les objectifs de la phase d'ana lyselinguistique du discours et la manire globale dont, pour l'instant, nous tentions de les raliser, nous pouvons dsormais exposer les diffrentes critiques formules sur ce point, sans craindre de confondre une critique justifie, de notre propre point de vue (critique dont il peut tre vital pour l'analyse du discours de tenir compte dans sa thorie et dans sa pratique), et une critique qui camoufle en ralit une rgression thorique en de de la thorie du discours. Cette question se pose videmment surtout en ce qui concerne les critiques d'ordre gnral, visant l'ensemble de la procdure d'analyse ; c'est, aussi bien, par ce type de critique que nous commencerons et plus prcisment par la question de la manipulation implicite du texte, avec des considrations smantiques dissimules ; ce point apparat indpendamment, sous des formes assez voisines, chez diffrents commentateurs, en particulier chez A. Trognon, S. Fisher, E. Veron et Borillo-Virbel. Nous disti nguerons ici deux niveaux de critique, en montrant pourquoi l'un nous semble recevable, et l'autre non : le premier niveau de critique consiste souligner que dans l'analyse dite morpho-syntaxique telle qu'elle a t prsente interviennent invitablement des considrations que l'on 1. L'introduction d'une nouvelle valeur de mode correspondant l'inassert li au rtablissement de E a t effectue depuis la publication du Manuel (Haroche, Pcheux, 1972). 40

appelle d'habitude smantiques , et que ces considrations restant implic ites, il y a de grandes chances pour que toute l'analyse s'en trouve affecte, sous la forme d'incohrences dissimulant des phnomnes ou au contraire produisant des artefacts qui auront leurs fcheuses consquences dans les phases ultrieures de traitement AAD. Disons clairement que nous reconnaissons cette critique comme parfaitement justifie : elle concerne bien notre problmatique, et en un point vital qui a t nonc prcdemment comme la premire condition remplir par une grammaire de reconnais sance : si, en effet, interviennent dans l'analyse des oprations smantiques non dfinies (Fisher-Veron, 1973, p. 167) la cohrence et la stabilit des rsultats s'en trouvent du mme coup atteintes de sorte que la reproductibilit de la reprsentation associe une squence donne n'est pas assu re,ce qui, par voie de consquence, met en cause la condition de bi-univocit exprime par la premire condition. En ce sens, nous sommes absolument d'accord avec la critique de Fisher-Veron : si la mthode (d'analyse linguistique) empche de reprer certaines proprits, celles-ci ne seront jamais rcupres (art. cit., p. 167), autrement dit, un simple codage stnographique de la surface, filtrant ce qui est important retenir et ce qui peut tre laiss de ct ne saurait satisfaire la premire condition : et il faut reconnatre qu'en effet, certaines questions de thorie linguistique non rsolues affectent l'analyse, et cela non pas priphriquement, mais au principe mme de la procdure, comme nous le montrerons dans un instant. Nous nous estimons, dans ces conditions, d'autant plus fonds cri tiquer la critique qui nous est faite un deuxime niveau, qui est celui du rapport entre la smantique et la linguistique et que nous avons dj rencontr ci-dessus propos de la double catgorisation (dans la terminologie de Borillo-Virbel). Lorsque, leur tour, S. Fisher et E. Veron disqual ifient notre perspective par le fait qu'elle est toujours associe la pr tendue diffrence entre syntaxe et smantique (1973, p. 167 nous soulignons) ils font comme si c'tait un acquis rcent et dcisif de la linguistique contem poraine d'avoir rinscrit la smantique dans le champ de la linguistique, au point d'en faire une ralit intra-linguistique. Sur ce point x, nous ne pouvons videmment pas accepter les critiques qui nous sont faites ; nous ne pouvons que renvoyer ce qui a dj t dit ici mme, p. 13-14. Revenons donc ce que nous avons appel le premier niveau de critique , qui nous parat entirement justifi, de notre propre point de vue, avec l'intention de dterminer de quoi il s'agit pour ventuellement dfinir les principes permettant de remdier aux difficults reconnues. Certes, nous serons d'accord avec G. Provost-Chauveau pour reconnatre l'ht-

1. Qui conduit logiquement les commentateurs nous accuser d'effectuer un vri table tour de passe-passe (Cf. A. Trognon, 1971) entre les donnes et les rsultats, dans la mesure o leur position leur interdit de distinguer entre la smantique li nguistique qui intervient implicitement dans l'analyse syntaxique et les processus smantiques-discursifs dont la trace est repre par la phase 3 du traitement AAD. 41

rognit des rfrences linguistiques qui traduit l'absence d'une rflexion thorique globale sur les phnomnes syntaxiques. Comme nous le rappel ions en commenant, nous sommes alls au plus press, avec les moyens dont nous disposions, et en sachant bien que les solutions linguistiques que nous proposions taient autant de provocations adresses aux purs linguistes pour qu'ils en effectuent une critique transformatrice. Nous soulignons toutefois que cette htrognit thorique, gnratrice d'incoh rences et d'artefacts, faisant que toutes les solutions n'ont pas le mme ge thorique , ne doit pas tre confondue avec l'invitable combinaison de caractristiques morphologiques et syntaxiques pas plus qu'avec la coexis tence, dans la reprsentation, de termes lexicaux et de mta-termes tels que *, S, X, E, etc.. (il faudrait, en effet, ignorer que la langue est sa propre mta-langue pour s'en tonner ! Disons donc une fois pour toutes que les critiques portant sur l'apparition d'un verbe (E) non attest en surface, tout autant que les lectures htives qui mettent sur le mme plan des op rations de lemmatisation (voire de rduction orthographique) et des trans formations syntaxiques ne nous semblent pas recevables). Il va de soi, par ailleurs, que le dispositif d'analyse syntaxique est encore pour longtemps en volution (ce qui veut dire que sa ralisation sous la forme d'un automate serait probablement du type apprentis sage ), de sorte que certaines incohrences locales sont progressivement limines : cet gard, nous donnerons comme exemple la confusion entre les connecteurs parce que et puisque qui est releve indpendamment par Borillo-Virbel et par Fisher-Veron propos d'un texte paru en 1971, et qui disparat dans le nouvel tat de la liste des connecteurs, publie dans Haroche-Pcheux, 1972 1. Cependant, nous sommes loin de penser est renforce 1. L'impression par l'exemple d'une critique d'application un peu dehtive, l'analyse o linguistique l'accidentel AAD se mle que l'essentiel, proposent S. Fisher et E. Veron dans l'article dj cit. Ayant choisi comme squence analy ser le texte publicitaire ci-dessous assez particulier quant sa forme rhtorique : Baranne est une crme, C'est parce que Baranne est une crme Que Baranne pntre le cuir si profondment C'est parce que Baranne pntre le cuir si profondment Que Baranne nourrit le cuir. Tous les cuirs. dont nous nous serions, quant nous, bien gard de prtendre effectuer l'analyse, les auteurs excutent son propos (et dans tous les sens du terme) la mthode de Pcheux , c'est--dire qu'ils la dforment en l'appliquant pour en faire la critique. Que les auteurs ne se soient pas soucis de respecter les conventions ayant trait l'enregistrement des verbes ( l'infinitif) et des substantifs (au singulier), qu'ils ignorent par ailleurs la distinction entre absence de prposition (0) et la place vide de la prposi tion devant le SN2 (*) n'a, bien entendu, que peu d'effet sur leur dmonstration. Par contre, le fait qu'ils aient oubli de reconstruire l'ordre canonique l'intrieur de la squence (cf. Manuel , p. 17) les conduit proposer avec dsinvolture des solu tions dont nous leur laissons l'entire responsabilit, en particulier l'trange nonc 0000 0 C est 0 0 0 0 Avec toutes les prcautions dues la particularit de ce texte, indiquons ci-dessous quoi aurait conduit l'application de la procdure dcrite dans le Manuel 72, et en tenant compte de la distinction entre * et a (cf. ici-mme, p. 36) intervenue aprs la publication du Manuel . Le rtablissement de l' ordre canonique aurait conduit la reformulation su ivante : Baranne est une crme. Baranne pntre le cuir si profondment parce que 42

que cette htrognit se rsorbera ainsi progressivement, par une sorte de rformisme grignotant patiemment le champ des problmes rests en suspens ; nous pensons au contraire que les difficults que nous rencon trons (et que rencontrent tous les projets d'analyse syntaxique) constituent Baranne est une crme. Baranne nourrit le cuir, Baranne Baranne pntre le cuir si profondment. Les noncs lmentaires seraient alors les suivants 1 0000 0 Baranne tre 2 0000 Baranne pntrer profondment 3 0000 Baranne tre 4 0000 0 Baranne nourrir 5 0000 0 Baranne nourrir 6 0000 0 Baranne pntrer profondment runis par le graphe ci-dessous : nourrit tous les cuirs parce que : 0 0 0 0 a * a U crme L cuir U crme L cuir TLS cuir L cuir

parce que

parce que

Remarques : a) Le si de si profondment n'a pas pu tre pris en considration. b) Le problme du c'est... que et de la permutation que reprsente cette cons truction par rapport l'ordre canonique pourrait tre trait soit par une marque intranonc affectant la forme F, soit par une rflexion de certaines relations du graphe, ce qui aurait en mme temps pour effet de supprimer la rptition du contenu des non cs 2 et 4 par les noncs 3 et 6. Pour cette deuxime possibilit, nous nous contentons de suggrer le graphe suivant :

parce que

Rien ne prouve que, dans les conditions normales d'utilisation de l'AAD (suppo sant entre autres l'existence d'un corpus de squences discursives), les erreurs que nous venons de signaler seraient restes sans consquence. De toute manire le fait qu'une partie des critiques gnrales que les auteurs adressent la procdure syntaxique propose reste valable ne les dispensait pas, selon nous, d'appliquer cette analyse consciencieusement. 43

un bloc tenace et consistant fond en grande partie sur ce que l'on peut appeler la domination thorique de la phrase. A cet gard il ne suffit pas simplement d'un acte de bonne volont thorique accdant une approche sans prjugs (Fisher-Veron, p. 169), mais d'une transformation de l'objet mme de la linguistique : dans le texte de 1969, la ncessit d'une tude srieuse de V inter-phrase tait plutt voque que rellement engage (cf. AAD 69 p. 44 sqq). Le dveloppement actuel des recherches linguis tiques, et le lien qui s'tablit progressivement entre l'inter-phrase et la paraphrase dans le cadre des linguistiques du texte qui se font jour permettent de penser que la linguistique est aujourd'hui sur la voie de la solution ce problme, qui, comme nous l'avons dit, en commande un grand nombre d'autres. A cet aspect se rattache galement la difficile ques tion des anaphores, qui met ncessairement en jeu des phnomnes syntactico-smantiques complexes combinant le reprage des liaisons entre pro noms et substantifs, la prise en compte de glissements et d'oppositions lexicales, la construction de l'image d'une proposition (reprsente par S ), etc.. Or les exemples d'anaphorisation donns dans le Manuel de 1972 ne constituent qu'un cas relativement privilgi du phnomne, en raison de leur simplicit : il est assez facile de montrer des cas d'anaphor isation qui posent des problmes difficilement solubles de rtablissement automatique. Citons par exemple : un substantif anaphoris par un nouveau terme lexical, une proposition entire anaphorise par un nouveau terme lexical, l'anaphorisation par apposition (ex : le meurtrier, Jean Dupont ), l'anaphorisation vide , mais supporte par une opration de dtermination supplmentaire, comme dans les tudiants taient runis. Certains . . . / ceux qui . . . / Les uns ... x . Sans sous-estimer l'importance des difficults qui viennent d'tre mentionnes, nous pensons cependant que nous n'avons pas encore atteint, avec elles, le point central qui entrane sa suite toutes les autres difficul ts : or ce point central, dans lequel s'exerce la domination thorique de la phrase , n'est autre, selon nous, que le prsuppos thorique qui relie phrase, proposition et nonc. C'est, juste titre nous semble-t-il, sur ce point que les critiques ont t les plus nombreuses et les plus pertinentes : elles consistent, dans leur principe, souligner que cette phase de l'analyse syntaxique concide trs exactement avec celle d'une analyse logique traditionnelle, comme l'indique d'ailleurs explicitement la partie corre spondante du Manuel : elle repose de fait sur l'ide d'une organisation la fois hirarchise (principale/subordonne) et squentielle (coordination) de la phrase en propositions. Cette conception qui prend appui sur la notion d'un tissu form de nuds constituant autant de grains d'nonciation aboutit, dans la pratique, des cas de conscience de l'analyste, lis au 1. Cf. en particulier : M. Gross (1973). 44

caractre arbitraire du dcoupage, oscillant entre le dsir de reprsenter fidlement la ralit linguistique et la ncessit de coups de pouce qui peuvent aboutir des noncs lmentaires innonables, inassertables, voire tout simplement ininterprtables. Signalons pour mmoire le cas classique des prdicats plus de deux arguments obligatoires, qui attend encore une solution satisfaisante. Cette domination thorique de la phrase ne reste videmment pas sans consquences au niveau mme des constituants de V nonc : nous retien drons les cas de ADV, P, DET et F, sans d'ailleurs vouloir signifier par l que les autres catgories morpho-syntaxiques ne posent pas de pro blmes ! ADV : cette catgorie est explicitement prsente comme provi soire ; il est clair en effet qu'on ne saurait attribuer aux adverbes un mode de traitement unique : il semble ncessaire de distinguer entre les adverbes qui fonctionnent comme des qualificateurs de marque d'arrt et ceux qui s'appliquent un nonc dans son ensemble ou encore au prdicat ou un adjectif. Cette simple considration impose, pour un traitement correct de l'adverbe, de mettre en rapport son fonctionnement d'une part avec les connecteurs, et d'autre part avec les modalits 1. Par ailleurs, il faudra videmment tenir compte du double statut morphologique de l'adverbe, qui renvoie la fois une classe ferme et une drivation adjectivale par l'intermdiaire du suffixe ment . P : la solution actuellement adopte consiste traiter diffremment le complment prpositionnel obligatoire li au fonctionnement syntaxique du verbe et le complment circonstantiel, dans le cas o la construction syntaxique autoriserait sa suppression (Manuel p. 34). Une telle position ne va pas, dans la pratique, sans quelque difficult, la frontire entre les deux types de complments prpositionnels n'tant pas toujours bien tranche, et l'chappatoire consistant enregistrer les deux constructions dans les cas d'ambigut ne rsout pas fondamentalement la difficult 2. DET : dans l'tat actuel de la procdure, il s'agit en trs grande partie d'un codage de surface, qui laisse compltement l'cart la question cruciale de la rfrence dans le discours. Il est signaler qu'une tentative visant prcisment dpasser ce stade a fait l'objet d'un article publi en 1970 (C. Fuchs, et M. Pcheux in : Considrations thoriques propos du traitement formel du langage. Documents de linguistique quantitative n 7, Dunod) dont nous parlerons plus loin. Les difficults d'application pratique des solutions proposes dans cet article ont tenu, entre autres,

1. Cf. le problme des compositions du type c'est certainement dj un peu trop chaud . 2. Il conviendra galement de pouvoir traiter le cas o une mme prposition en surface peut renvoyer des interprtations smantiques diffrentes ; cf. par exemple la polysmie de la prposition de : il vient de Paris le chapeau de Pierre . 45

aux problmes lis la construction, partir de la squence analyse, de l'objet d'arrive appel lexis . F : de nombreuses critiques ont t galement adresses la cat gorie de Forme dans la mesure o elle regroupe des lments morpholog iques, syntaxiques et smantiques trs disparates. Par ailleurs, le lien qui apparat de plus en plus vident avec le systme des dterminants n'est pas pris en considration ; enfin, toutes les formes sont un niveau homogne par rapport au systme des noncs, ce qui exclut toute hirarchi sation et toute imbrication ou composition de celles-ci, dans une perspective qui tiendrait compte des relations de profondeur structurale * entre les noncs. La domination thorique de la phrase (et de la thorie implicite de l'nonc qu'elle sous-tend) a enfin des consquences non ngligeables sur les rapports inter-noncs : sur ce point, la distinction tablie entre les connecteurs de dtermination (de type delta ) et les connecteurs de coord ination-subordination (de type phi ) semble devoir tre remise en cause, dans la mesure o des transformations permettent de passer d'un connecteur l'autre, en particulier par l'intermdiaire de la prposition. Il en rsulte une htrognit de niveau qui traduit le fait que les 8 recouvrent sans les diffrencier des relations syntaxiques relativement diffrencies au niveau des <p . Inversement des relations sont poses dans les 8 qui ne sont pas considres dans les connexions verbales 2. 2.3. Perspectives d'avenir. Les critiques qui viennent d'tre formules renvoyent en creux une conception de la pratique linguistique qui serait dbarrasse de ce que nous avons appel la philosophie spontane de la grammaire, c'est--dire de ce qu'il est convenu d'appeler la grammaire traditionnelle par oppos ition un tat de modernit scientifique suppos ralis dans les recherches linguistiques actuelles. Nous pensons qu' bien des gards la modernit linguistique, avant tout caractrise par la rfrence au formalisme mathmatique, ne s'est dbarrasse qu'en apparence de cette dpendance l'gard de la tradition . La rfrence de Chomsky la linguistique de Port-Royal est ce sujet parfaitement clairante. Autrement dit, il n'y a pas selon nous de gram maire traditionnelle , parce que nous sommes encore dans cette tradition.

1. La profondeur structurale renvoie au problme des diffrences de niveau entre les noncs, traduites par le parenthsage (op. cit., p. 40). On envisage plus loin (op. cit., p. 78) le moyen de tenir compte directement de ces phnomnes dans la procdure de comparaison. Cf. galement les tentatives de diffrenciation des composantes de F dans la comparaison des noncs (Del Vigna et Dupraz, 1974). 2. Mentionnons enfin le problme non-rsolu pos par les relatives du type : t l'cole est l'endroit o les enfants apprennent la lecture , l'homme dont j'ai rencontr le fils , la maison sur le toit de laquelle les cigognes ont fait leur nid . 46

Cependant, il nous parat possible de formuler un certain nombre de dpasse ments thoriques susceptibles de mettre en perspective les critiques que nous venons de relever et d'baucher des directions nouvelles capables de dbou cher sur une nouvelle conception de la grammaire de reconnaissance du franais. Bien entendu, il ne s'agit pas ici de proposer directement des solu tions opratoirement utilisables. Nanmoins, nous pensons que les remarques thoriques qui vont suivre sont de nature faciliter le passage d'un reprage des marques morpho-syntaxiques un niveau de reprsentation qui tout la fois permette une articulation avec les processus d'nonciation et regroupe en un mme formalisme cohrent l'ensemble des phnomnes analyss, en se librant du caractre monographique et parcellaire des tentatives de description-thorisation de phnomnes locaux. Nous articulerons nos propositions de dpassement thorique autour de deux points principaux : 1) une reconfiguration de l'nonc lmentaire distinguant schma morpho-syntaxique et schma d'nonc. 2) la dfinition des principes d'un calcul portant partir du schma morpho-syntaxique sur le schma d'nonc, avec la possibilit d'interprter les rsultats de ce dernier calcul en termes de processus nonciatifs lis l'oubli n 2. 1) Reconfiguration de V nonc lmentaire x tel qu'il est utilis dans l'tat actuel de l'A AD. Indiquons pour commencer deux liminations qui paraissent s'imposer. La premire limination porte sur la case prposition (cette catgorie pouvant, sur la base de critres de fonctionnements syn taxiques, soit tre intgre au verbe, soit constituer elle-mme le nouveau verbe d'un nouvel nonc lmentaire, soit encore l'quivalent d'un connec teur inter-noncs). Donnons des exemples illustrant chacune des trois possibilits : a) La prposition intgre au verbe correspondrait au cas que l'on appelle traditionnellement complment fortement rgi . Exemple : Elle pense lui elle va Paris . Ces deux exemples ne doivent pas susciter l'ide qu'il s'agit uniquement de verbes n'introduisant pas de complment direct. Soit en effet le cas de la phrase : elle donne un livre Pierre , le complment Pierre sera trait de la mme faon que lui et Paris dans les exemples ci-dessus, ceci prs que la prsence de deux complments oblige dupliquer le schma d'o : schma 1 : elle donner livre, schma 2 : elle donner Pierre. Cette duplication pose un problme thorique par les artefacts qu'elle risque d'induire si on ne distingue pas, comme nous proposons de le faire plus loin, schma morpho-syntaxique et schma d'nonc 1. Nous entendons ici par nonc lmentaire le bloc des huit cases morphosyntaxiques : F, dl, NI, V, ADV, P, d2, N2 prsent plus haut. 47

b) La prposition devenant le verbe d'un nouveau schma correspon drait au cas que l'on appelle traditionnellement complment circonstanc iel . Exemple : Elle viendra trois heures , ce qu'on pourrait reprsenter l'aide de deux schmas : schma 1 : Elle venir ei 0 trois heures en avec 0 dsignant l'absence de complment fortement rgi schma 2 : schma 1 o ioc est un mta-verbe introduisant un reprage de localisation, l'occurrence temporelle.

Cette reprsentation aurait l'avantage de tenir compte du lien avec la nominalisation du schma 1 sous la forme : Sa venue aura lieu trois heures . c) La prposition transforme en un connecteur inter-nonc corres pondrait au cas particulier du chevauchement entre prposition et conjonc tion d au fait que la prposition introduit en ralit un substantif nominalisant une proposition. Exemple : II s'est habill cause de sa venue correspondant : II s'est habill parce qu'elle est venue . Cette prsentation ne doit pas faire oublier que l'absence de prposi tion ne dsigne pas ncessairement un complment d'objet direct. Il faut une analyse contextuelle fine pour retrouver le circonstanciel dans : il boit le matin ou mme dans il aime la nuit (ambigu). D'autre part les rfrences la terminologie classique sous la forme d'expressions comme : complment fortement rgi , complment ci rconstanciel , prposition-conjonction , ne doivent pas masquer le fait qu'elles sont inutilisables comme telles. Ce que nous proposons en ralit, c'est de dfinir les trois fonctionnements syntaxiques dont nous venons de donner des exemples partir, d'une part d'une tude des types de verbes (dans la perspective des recherches de M. Gross , 1968) et d'autre part d'une thorie des rangs de complments (cf. l'laboration thorique propose par A. Culioli, propos des pronoms du franais, Culioli, 1968, p. 116 1).

1. On trouve dans ce passage l'esquisse d'une thorie syntaxique des rangs de complments du verbe, fonde sur des tests de paraphrasage syntaxique. En franais, le systme des complments du verbe se prsenterait schmatiquement de la manire suivante (la paraphrase tant tablie sur la base de la troisime personne du singulier) : est complment de rang zro, tout groupe susceptible d'tre paraphras par il , est complment de rang 1, tout groupe paraphrasable par : le, la , est complment de rang 2, tout groupe paraphrasable par : lui , est complment de rang 3, tout groupe paraphrasable par : y (au sens d'une localisation, avec ou sans mouvement, ex. : j'y vais , j'y reste ; ou d'un substitut de proposition, ex. : j'y pense ), est complment de rang 4, tout groupe paraphrasable par en (ex. : j'en viens , il l'en frappe ). A ces cinq rangs de complments, s'ajoutent des emplois que l'on peut qualifier de mixtes , intermdiaires entre deux rangs : ex. : y combinant les valeurs de 1 et de 2 dans l'emploi familier j'y donne = je le lui donne . 48

Une tude combinant ces deux perspectives est actuellement en cours dans l'quipe TAL (Traitement automatique des langues, C. N. R. S.) de Grenoble. La seconde limination concerne les deux cases dterminants (il existe en effet des raisons thoriques de traiter les dterminants comme des traces de reprage nonciatifs au mme titre que par exemple les aspects ou les modalits). Par ailleurs, on a dj soulign plus haut le caractre insatisfaisant de la case adverbe . Nous supposerons ici que les problmes qui lui sont lis ont t rsolus et que cette case a elle aussi disparu comme telle. On voit ds lors que, en conservant la terminologie de dpart, la reconfiguration aboutit rduire l'nonc lmentaire une suite de trois lments NI, V et N2 (avec N2 facultatif) et lui associer un groupe F, Dl, D2. D'o la reprsentation : (F dl d2) + (NI V N2) dans laquelle NI V N2 constitue le schma morpho-syntaxique et F dl d2 le relev des formes morpho-syntaxiques dterminant ce schma (quant la voix, le statut, le mode et le temps pour le verbe, et quant aux dterminants pour les substantifs) x. Considrons maintenant les trois objets NI, V, N2. Leur dnomination (N et V) renvoie clairement une catgorisation morpho-syntaxique, c'est--dire des classes d'objets auxquelles sont associs biunivoquement des paradigmes de variations morphologiques (tels que dsinences de conjugaisons ou affixes de nombre) et des fonctions syntaxiques (sujet, verbe, objet) ; or, si le recours une telle catgorisation est indispensable dans la premire tape de la reconnaissance, elle ne se justifie plus au niveau d'une reprsentation visant rendre compte des phnomnes d'nonciation. On peut mme dire que cette catgorisation trahit ici, par sa persistance thoriquement injustifie, l'effet de ce que nous avons appel plus haut la philosophie spontane de la grammaire ; elle repose en effet sur l'ide d'une construction hirarchise allant de la phrase la proposition, et de la proposition aux fonctions syntaxiques. Or les notions de phrase et de proposition , qui se rfrent en fait des considrations smantiques non formules, ne sont pas autrement justifies que par une description de leurs constituants : la phrase se dcompose en ... , la proposition se dcompose en ... . Prenons plus prcisment la notion de proposition ; les fonctions syntaxiques qui la caractrisent sont : le verbe (centre de la proposition), le sujet (constituant en gnral obligatoire), le ou les compl ments) (constituant(s) plus ou moins facultatif (s)). Cette catgorisation syntaxique semble double d'une catgorisation morphologique telle que sujet et complments correspondent la catgorie nom . Or ceci revient

assez1. qu'il en prcisment On exclut peut la remarquer voix, ce traite que A. que Martinet directement le groupe dsigne comme F dl par d2, fonction le que terme nous du de isolons prdicat modalit ainsi, . , correspond ceci prs 49 LANGAGES N 37 . 4

jouer d'une part sur le double statut du verbe (fonction syntaxique et catgorie morphologique) et d'autre part sur le fait que, dans la plupart des langues indo-europennes, c'est ce mme lment verbe qui joue le rle smantiquement privilgi de centre de la proposition. Mais, si l'on considre d'autres langues (comme par exemple certaines langues africaines), on s'aperoit qu'il existe des propositions nominales et des propositions adjectivales c'est--dire que la correspondance entre catgorie morphol ogique, fonction syntaxique et rle smantique ne joue plus ; le rle smant ique de centre, garant de la bonne formation de la proposition, et de sa possibilit d'tre asserte, revient en effet un lment parfois qualifi de prdicatif ; autrement dit, l'organisation morpho-syntaxique de la proposition, propre une langue donne, est distincte du phnomne de la proposition proprement dit, en tant que constitution d'une unit pouvant tre asserte de faon indpendante. Plus prcisment, le schma morpho syntaxique NI (sujet) V (verbe) N2 (objet) ne constitue qu'un cas parti culier parmi l'ensemble des modes de ralisation de la proposition. S'il en est ainsi, et si l'on admet que ce que nous avons appel phnomne de la proposition en tant qu'unit indpendante nonable relve des pro cessus d'nonciation, alors il est clair qu'une grammaire de reconnaissance d'une langue (le franais en ce qui nous concerne) doit se donner deux niveaux distincts d'analyse : le niveau morpho-syntaxique o est carac tris le mode d'organisation propre la langue considre et un niveau qui dtermine l'unit minimale d'nonciation ainsi que les oprations d'nonciation qu'elle supporte. Compte tenu des remarques qui prcdent, nous n'emploierons pas le terme profond pour dsigner ce niveau, en raison du cortge de mtaphores que ce terme vhicule. Nous parlerons, ainsi que nous l'avons dj annonc (cf. p. 18) de niveau smantiqueformel en reprenant les termes de A. Culioli qui parle de smantique formelle . Dans cette expression, le terme smantique rappelle qu'il s'agit d'un niveau qui n'est plus celui des catgories morpho-syntaxiques, et o les units se dfinissent comme supports des oprations d'nonciation ; le terme formelle , quant lui, indique d'une part que ce niveau peut tre atteint par des procdures formelles en remontant partir de la sur face, et d'autre part que les oprations d'nonciation en jeu prsentent un caractre de systmaticit qui les rend elles aussi passibles d'un tra itement formel. Prcisons bien encore une fois qu'il ne s'agit pas de smant ique au sens gnratif-transformationnel du terme et donc pas d'une composante interprtative de la syntaxe, mais d'un effet rsultant de la combinaison de la syntaxe elle-mme (syntaxe x syntaxe) sous la forme de couplages entre des fonctionnements syntaxiques ce qu'on pourrait appeler l'effet d'hyper-syntaxe , qui est pour nous strictement identique l'effet smantique-formel. Ainsi la notion de proposition se trouve clater en : schma morpho syntaxique d'une part et d'autre part en ce que nous appellerons schma50

d'nonc x, qui se situe au niveau de l'hyper-syntaxe (ou niveau smantiqueformel) que nous venons d'voquer. Prcisons prsent que nous caractrisons le schma d'nonc comme une relation oriente (case centrale du schma, note R), mettant en rapport un domaine de dpart ou source de la relation (case de gauche note D) et un domaine d'arrive ou cible de la relation (case de droite note A). Soulignons bien que les places du schma ne correspondent pas des catgories morpho-syntaxiques (substantif, verbe, substantif), ni des fonctions syntaxiques (sujet, verbe, objet) 2. Bien entendu l'objectif d'une grammaire de reconnaissance du franais impose que les chemine ments d'un niveau l'autre soient rgls par une procdure effective. 2) Dfinition des principes d'un calcul. Une fois dfini le schma d'nonc (DRA) que nous avons driv (et non pas dcalqu) du schma morpho-syntaxique (NI V N2) aprs avoir rgl comme on l'a vu le cas de ADV et P il reste dfinir ce qui porte sur le schma d'nonc DRA, c'est--dire le correspondant pour DRA de ce que reprsente le contenu de la liste F dl et d2 par rapport NI V N2. Nous passons ainsi de la description de listes un calcul. Dans l'tat actuel des recherches, il n'est videmment pas possible de prciser dans le dtail l'enchanement des tapes par lesquelles on passera d'une catgorisation morpho-syntaxique de dpart (p. ex. : article dfini singulier, pass compos, . . . ) des formules de calcul portant sur le schma d'nonc. Nous pensons seulement indiquer de quelle manire il nous semble possible de reprsenter un calcul dcrivant la syntaxe de ces oprations par rapport au schma d'nonc. Le schma d'nonc, tel que nous l'avons prsent, est comparable la notion de lexis dveloppe par A. Culioli 3. On trouvera une prsentation dtaille de cette notion dans : Culioli, Fuchs, Pcheux (1970), pp. 19-25. Disons simplement ici que cette notion dsigne la donne d'un triplet orient o deux prdicats unaires (ex : tregaron , tre-pomme ) sont mis en relation par l'intermdiaire d'un prdicat binaire (ex : manger ). En associant des units de surface

1. Nous prfrons cette expression celle, plus frquente, de schma prdicatif , en raison des connotations logicistes de cette dernire. 2. On peut fournir des exemples dans lesquels l'lment occupant la place centrale peut aussi bien correspondre ce qui, en surface, se ralise par une prposition, qu' un verbe ou encore un substantif rsultant d'une nominalisation. 3. Nous sommes conscients du fait que, ce faisant, nous prenons une certaine position l'intrieur de la philosophie du langage, ce que d'ailleurs nul ne peut viter. Les recherches de A. Culioli se rfrent implicitement ou explicitement aux positions de Guillaume et de Benveniste, et nous avons fourni plus haut les justifications thoriques de nos rserves. Il reste que la mise en cause, par A. Culioli, du logicisme qui cohabite souvent avec les thses gnratrices-transformationnelles voir ce sujet les dveloppements rcents de la smantique generative est thoriquement lourde de consquences, comme d'ailleurs la reconnaissance de l'inconscient analy tique, ce qui n'est pas si frquent parmi les linguistes. 51

(comme par exemple les auxiliaires ou les modaux) des mta-oprateurs *, il devrait tre possible d'tablir des formules ayant pour effet d'associer chacun des termes du schma d'nonc des valeurs de variables 2, (tant donn que les termes ont, l'intrieur de ce schma, un statut de variables) 3. Ces valeurs de variables correspondent des valeurs d'oprations comme par exemple celles qui peuvent s'associer aux oprations d'aspect, de modal its,de thmatisation, . . . Les dterminants et les personnes font galement partie de ces oprations 4. Nous prenons ainsi en compte le travail effectu dans le domaine de la reprsentation formelle de ces oprations sur la base des thses de A. Gulioli, depuis la publication de Analyse automatique du dis cours (1969) o le terme de lexis tait simplement mentionn (p. 85), dans une perspective de dveloppement critique qu'amorait l'Annexe de G. Fuchs : Etude des marques de dtermination dans F (ibidem pp. 128-134). Le terme de lexis se retrouve galement dans une prsentation de 1970 ( Lexis et Mta-lexis , in Culioli, Fuchs, Pcheux (1970), o nous tentions comme nous l'avons dit plus haut de proposer un mode de traitement du problme des dterminants dans la perspective d'une thorie de la lexis. Gela constituait dj un essai pour passer des huit cases de l'nonc lmentaire aux trois places de la lexis. Nous y introduisions la notion de mtalexis (schma trois places un prdicat et deux argu ments c'est--dire formellement comparable la lexis mais ayant pour particularit d'avoir deux places sur trois instancies l'aide de mtatermes : en premier argument le sujet nonciateur not Z et en prdi cat la dsignation d'une opration de dtermination portant sur un terme lexical assign en place de deuxime argument). Ceci visait introduire explicitement dans la reprsentation le sujet nonciateur comme support de l'opration de dtermination et sortir les dterminants de l'nonc de manire ce qu'ils portent sur cet nonc. La lexis reprsentant l'nonc de surface comportant le terme lexical dtermin tait relie par le connec teur S (cf. op. cit., pp. 35-36) la mta-lexis dsignant l'opration de dtermination. Cette tentative qui visait donc en fait rsoudre la fois deux difficiles problmes, tait criticable bien des gards : Premirement, au niveau thorique o elle se plaait, la reprsen1. Ces mta-oprateurs constituent autant de traces de reprages nonciatifs, c'est--dire de relations qualifies entre le schma d'nonc et le sujet nonciateur au moment de son nonciation. 2. Il nous semble important de souligner que les valeurs de variables que nous introduisons ainsi ne s'inscrivent pas dans une logique binaire (0/1), mais dans un sys tme en rseau ( quatre valeurs : 0/l/*/<o) dont un des exemples peut tre trouv dans le schma de came prsent par A. Culioli, 1968, p. 115). 3. On trouvera des exemples de tels calculs dans C. Fuchs et J. Rouault (1972 et 1973). 4. Sur les problmes d'aspect et de voix, voir A. Culioli, 1971. 52

tation propose n'tait pas explicative, en ce sens qu'elle consistait en un simple codage des units de surface (articles possessifs, indfinis . . . ) l'aide d'un nom d'opration (comme : extraction , flchage , parcours ), et non pas en une caractrisation formelle de l'enchanement des tapes que constitue en fait l'opration que supporte l'unit lexicale (par ex. : partir d'une notion, dfinie en comprhension, laquelle on associe une classe, passer en extension, effectuer le prlvement quantifi ou non d'une sous-classe,...). Ceci revient dire que du point de vue formel, il n'existait ni oprateurs ni calcul. Pour cela il aurait fallu mener une analyse linguistique beaucoup plus fine tablissant quelles valeurs de dtermination sont possibles ou impossibles en fonction la fois du contexte (ex : prsence de relatives ou d'adjectifs, nature des dterminations sur le verbe...) et des types de substantifs 1. De plus, cette reprsentation avait le dfaut de court-circuiter les deux tapes que nous prsentons ici sous le nom respectivement de calcul sur le schma d'nonc et de processus nonciatif qui, comme nous le verrons, concerne le reprage de l'nonc par rapport au sujet nonciateur, la situation... Deuximement, sur le plan pratique, et compte tenu du caractre partiel de cette tude (les dterminations du verbe n'taient pas reprsent es) ce mode de reprsentation n'a pas pu tre repris ultrieurement, ni intgr comme tel dans une grammaire de reconnaissance, faute de pouvoir tablir les rgles permettant de passer de la surface ce type de reprsent ation. Dans la perspective qui est actuellement la ntre, nous pensons que deux possibilits se prsentent la suite du calcul des valeurs de variables que nous avons prsent plus haut : 1) intgrer, dans les reprsentations soumises la phase 3 du traitement AAD, les rsultats de ce calcul, sans les interprter auparavant d'une manire ou d'une autre. 2) considrer les valeurs de variables ainsi calcules comme des traces d'oprations d'nonciation et reprsenter, dans les donnes d'entre de la phase 3, ces oprations d'nonciation sous la forme d'un systme de rep rages du schma d'nonc par rapport au moi-ici-maintenant de l'nonciateur, intervenant explicitement comme origines des reprages, comme points d'ancrage de l'nonc. Nous ne sommes pas, l'heure actuelle, en mesure de trancher entre

1. On a signal plus haut le caractre inadquat d'une conception du lexique indpendant des fonctionnements syntaxiques. Sans aborder ici l'examen des condi tions permettant de rsoudre ce problme, nous remarquerons au passage que l'effet du lexique ne s'puise pas travers l'analyse morphologique de l' unit lexicale , mais que le lexique s'articule sur le niveau syntaxique (dans la mesure en perticulier o l'on peut tablir des classes lexicales classes de verbes, d'adjectifs, de substant ifs, ... sur la base de fonctionnements syntaxiques), ce qui a des retentissements au niveau que nous avons caractris comme smantique-formel . 53

ces deux possibilits. D'ailleurs, le fait d'aller plus ou moins loin dans la voie que nous indiquons dpendra largement du type d'objectif qui pourra, dans cette nouvelle perspective, tre assign une analyse AAD. Il se peut que la deuxime possibilit prsente un intrt spcialement l'gard de la problmatique des oublis introduite plus haut. Nous rcapitulerons les niveaux d'analyse proposs par le tableau suivant : Niveau morpho syntaxique Niveau smantiqueformel (F dl d2) groupe modalisateur + (NI V N2) schma morpho-syntaxique

(traces de rep(D R A) *" schma d'nonc rages nonciatifs) i. e. : application des traces de reprages nonciatifs au schma d'nonc, l'aide de mta-oprateurs permettant de calculer les valeurs de variables associes D, R et A. (D R A ) repr par rapport au moi-ici maintenant i.e.: processus nonciatifs.

Niveau nonciatif

Enfin, nous ne pouvons pas dvelopper ici les perspectives qu'im pliquent les critiques formules plus haut concernant la domination tho rique de la phrase ; nous nous limiterons dsigner quelques aspects. Tout d'abord, il semble ncessaire, on l'a dj mentionn, de dvelopper l'tude des couplages de fonctionnements reliant le systme des dtermi nants, celui des prpositions et celui de ce qu'on appelle classiquement les conjonctions entre eux d'une part, et d'autre part avec le systme des marques de modalits, aspects, thmatisation qui sont le plus souvent vhicules en franais par le systme verbal. Mais le propre de cette tude parat tre en mme temps que le carac tre systmatique et ferm de son objet s'articule ncessairement sur un autre type de classification, portant sur la liste ouverte des verbes en tant qu'units lexicales, et dbouchant sur une typologie fonde sur les rangs de complments . Ce travail doit selon nous prendre appui sur les rsultats obtenus dans ce domaine par M. Gross (1968) et ses collaborateurs, et c'est, aussi bien, la direction suivie actuellement dans le domaine linguis tique, en particulier par l'quipe TAL de Grenoble. Le propre de cette tentative est, notre avis, de ne pas limiter son investigation au cadre de la proposition sous prtexte qu'elle contient un verbe un mode personnel, mais de dterminer et d'tudier (exp rimentalement pourrait-on dire) pour chaque complexe syntaxique cons titu d'un lexeme verbal et des diffrents systmes numrs plus haut la zone textuelle dans laquelle se manifestent les rpercussions de ce complexe syntaxique, c'est--dire : la portion de squence qui est lie ce complexe par des possibilits de reformulation et de paraphrase syntaxique, portion de squence que l'on dsignera sous le nom de centre syntaxique ; et on voit clairement qu'il n'y a aucune raison, ce niveau, pour que cette zone 54

concide ncessairement avec les marques que l'analyse logique (c' est-dire en fait grammaticale) utilise pour dcouper les propositions . Mais c'est dire du mme coup que, dans cette perspective, les phnomnes de paraphrase sont par nature relis ceux de ce qu'on appelle l'interphrase (avec non seulement les questions d'anaphore dj signales, y compris les diffrentes formes de nominalisation, mais aussi toute la ques tion des attaques de phrases ). Nous pensons que le point dsign ici constitue ainsi un point fonda mental d'articulation entre linguistique et thorie du discours 1, dans l'exacte mesure o les rapports paradigmatiques de substitution paraphrastique s'articulent, se combinent et s'changent ncessairement avec les rapports syntagmatiques inhrents la squence linguistique-textuelle. Cette direction nous parat actuellement le seul moyen d'avancer dans l'claircissement de la question, difficilement soluble au seul niveau li nguistique-grammatical, de l'autonomisation des noncs. En effet, sauf convoquer l'appareil logico-philosophique du jugement pour fonder cette autonomie de l'nonc tout en lui donnant l'apparence d'un critre pure ment linguistique , on voit mal comment on peut dsormais mconnatre que le degr d'autonomie d'un nonc par rapport son contexte ne se rsorbe pas entirement dans un pur effet de langue mais s'articule nces sairement sur la discursivit. 3) L'analyse du processus discursif. La troisime phase concerne, ainsi que nous l'avons indiqu plus haut, l'ensemble des oprations de dsyntagmatisation discursive, la dlina risation linguistique ayant t effectue auparavant c'est--dire par les oprations de la phase 2. Nous commencerons par rappeler les aspects principaux de cette phase, sous la forme o elle s'excute actuellement dans le programme de calcul qui la ralise 2. Nous signalerons ensuite les diffrentes critiques qui ont t formules l'gard de cette procdure, en suggrant diverses poss ibilits susceptibles d'y remdier au moins partiellement. Nous poserons enfin la question plus gnrale du rapport entre les phases 2 et 3, pour examiner si les deux conditions que nous avons poses prcdemment (cf. p. 34) trouvent leur ralisation dans des dispositions la fois ncessaires et suffisantes, et quelles solutions nouvelles s'offrent nous dans le cas d'une rponse ngative cette question. 3.1. Aspects principaux de la procdure de dsyntagmatisation discursive, dite phase 3 . Nous considrons que la phase 1 ayant dtermin les conditions de production du (ou, de prfrence on l'a vu, des) corpus, et les ayant mat1. C'est--dire, dans la prsente terminologie, l'articulation et l'inter-dtermination entre les phases 2 et 3. Cf. ci-dessous, p. 79-80. 2. Cf. Bibliographie, II, 4. 55

riellement raliss sous la forme d'une famille de surfaces linguistiques , et la phase 2 ayant son tour fait correspondre chacune de ces squences linguistiques sa reprsentation dsuper finalise, nous sommes en prsence de n corpus susceptibles de constituer des entres de la phase 3, dans la mesure o chacun de ces corpus est compos de deux listes, savoir la liste des noncs lmentaires (EN) et la liste des relations binaires (RB) x correspondant l'ensemble des graphes constituant le corpus. En laissant de ct toutes les prcautions prendre pour que les donnes EN et RB ne contiennent pas d'erreur 2 (traitement de normalisation purement mcanographique des donnes, renumrotation des n d'noncs par exemple), nous nous contenterons d'exposer les deux parties fondamentales de ce traitement, savoir : une comparaison des structures graphes introduites en donnes par un balayage point par point , destin munir chacun de ces points de comparaison d'une caractristique mathmatique exprimant le rsultat de la comparaison, une procdure de reconstruction de sous-structures, partir de l'information obtenue dans la premire partie du traitement. Dcrivons successivement ces deux sous-phases : a) La premire consiste effectuer une comparaison systmatique point par point, en prenant la relation binaire comme unit de comparaison ; il est souligner que ce balayage peut en fait prendre plusieurs formes, en fonction des conditions pralables que l'on introduit : outre le cas, en effet, o toutes les relations binaires du corpus sont compares entre elles, il est apparu intressant de restreindre la comparaison de deux manires qui peuvent d'ailleurs s'associer. La premire restriction consiste n'effec tuer la comparaison que d'un discours Vautre, ce qui constitue en fait la dcision oppose celle de Harris qui, on le sait, a dfini la procdure d'analyse de discours en rfrence un seul texte, c'est--dire en rfrence un fonctionnement intra-textuel ; en procdant de la sorte, Harris se rgle sur l'hypothse implicite selon laquelle un texte se rpte, reproduit syntagmatiquement des structures qui peuvent tre superposes par l'opration d'analyse, revenant les paradigmatiser. Ceci explique pourquoi Harris accorde une importance mthodologiquement privilgie aux textes de propagande ou de publicit, et, en gnral, aux formes strotypes de la discursivit : cela correspond la ncessit, dans sa perspective, que le texte soit son propre dictionnaire, alors que, dans la perspective que nous

1. La liste des RB est en fait la liste des arcs du graphe, munis de leur valuation qui est un connecteur. Le graphe ayant pour sommets les noncs lmentaires, il dfinit une relation binaire sur l'ensemble des noncs. Par abus de langage, on a appel relations binaires un couple d'noncs lmentaires en relation, et muni du connec teur qui lui est attach. 2. Un programme prliminaire de dtection d'erreurs dans les donnes a t ralis par J. Lon dans le cadre du Service Calcul Sciences Humaines CNRS. 56

dcrivons actuellement (et dont la filiation, vidente, avec les recherches de Harris a t plusieurs fois souligne), c'est le corpus qui joue ce rle d'auto-dictionnaire : et c'est en effet dans le passage de l'intra- l'interrptitivit que la dsubjectivisation de la discursivit, prpare par le travail de Harris, trouve ses vritables conditions de ralisation. Le sens mthodologique de la restriction que nous exposons ici est donc de permettre d'tudier l'effet de la diffrence entre une comparaison inter-discours dans laquelle un discours n'est compar lui-mme qu'indirectement, c'est--dire dans la mesure o deux sous-squences lui appartenant se trouvent rappro ches par l'intermdiaire d'une autre sous-squence appartenant un autre discours, et une comparaison dans laquelle ce rapprochement entre les deux sous-squences considres est opr directement. On peut d'ailleurs rechercher les conditions auxquelles doit rpondre un corpus pour que le choix de l'une ou l'autre des deux options signales n'ait aucune influence sur les rsultats : c'est, semble-t-il, dans cette direction que s'orientent en partie les travaux de M. Dupraz et C. Del Vigna (1974) ; cette recherche devrait permettre de prciser certains aspects formels caractrisant l'autonomie d'un processus discursif, par diffrence entre son inter- et son intra-rptitivit x. La deuxime restriction que nous avons mentionne l'gard de la procdure de comparaison point par point entre relations binaires concerne la nature des connecteurs des deux relations considres : il est actuellement possible, soit d'effectuer toutes les comparaisons entre RB (dans les limites de la premire restriction, videmment) soit de restreindre cette comparaison aux couples de RB prsentant un connecteur identique : cette dernire option, qui correspond aux dispositions dcrites dans AAD 69 (construction des psi-classes ) et qui tait obligatoire dans la version initiale du programme FORTRAN (Paris) et dans sa version ALGOL W (Gre noble), a fait l'objet de critiques dans la mesure o le traitement particulier des connecteurs les excluait en fait de la procdure de comparaison, puisque la distance entre deux connecteurs ne pouvait tre considre que comme nulle dans le cas de l'identit pure et simple des connecteurs, ou trop grande a priori pour conserver un intrt quelconque la comparaison entre les deux RB, qui n'tait pas effectue dans le cas de connecteurs diffrents. Nous pouvons maintenant rappeler brivement en quoi consiste la comparaison point par point . Plaons-nous dans les conditions o les deux ordres de restriction sur le balayage ne jouent pas : on voit facilement que si la liste des RB contient n relations binaires, il y aura n(n l)/2 compar aisons, en tenant compte du fait qu'on ne compare pas une RB elle-mme (ce qui n'exclut pas videmment de comparer deux RB identiques entre elles !), et d'autre part que le rsultat de la comparaison C(RBi/RBj) est

1. Cette procdure pourrait s'appliquer l'tude des conditions de clture d'un corpus, en considrant qu'il est toujours possible d'obtenir cette clture en dupliquant le corpus. 57

identique celui de G(RBj/RBi). Notons que chacun de ces points de comparaison aura la forme Em Ep Ki Kj En Eq

Rappelons enfin que la proximit caractrisant un point de comparaison se calcule actuellement de la manire suivante : Soient les deux noncs gauches (Em/Ep) d'une part, et les deux non cs droits d'autre part (En/Eq) : chacun de ces deux couples d'noncs peut tre associ un vecteur boolen exprimant par une succession de 0 et de 1 le rsultat de la comparaison colonne par colonne des contenus littraux des deux noncs du couple avec 1 pour l'identit et 0 pour la diffrence. A ces deux vecteurs s'ajoute, dans le cas le plus gnral, une valeur 1 ou 0 exprimant l'identit ou la non-identit entre Ki et Kj. Chacun des deux vecteurs noncs est multipli par un vecteur affectant un certain poids (positif ou nul) l'identit des contenus pour chaque catgorie, et de mme pour le vecteur-connecteur un lment. La somme arithmtique des valeurs pondres ainsi calcules exprime la proximit entre les deux RB constituant le point de comparaison. Le rapport entre proximit et distance s'exprime par la relation suivante : d(RBi/RBj) = Max p(RBi/RBj) o d dsigne la distance , Max la valeur prise par la somme dans le cas o les vecteurs ne contiennent que des 1, et p la somme arithmtique calcule comme il est indiqu plus haut. On peut montrer que l'application ainsi dfinie possde toutes les proprits mathmatiques d'une distance sauf une ; la proprit que cette application ne vrifie pas pourrait s'noncer ainsi : si la distance entre deux objets est nulle, alors ces deux objets sont gaux . Par abus de langage, nous continuerons cependant parler de distance . A l'issue de cette premire phase du traitement informatique, nous avons muni les n(n l)/2 points de comparaison d'une valeur arithmtique. La procdure actuelle (on indiquera plus loin des possibilits de modifica tions sur ce point) consiste comparer cette valeur arithmtique, caract ristique du point de comparaison , une valeur introduite en donnes (au mme titre que le systme de pondrations prcdemment mentionn) et effectuer la partition de l'ensemble des points de comparaison en deux sous-ensembles, dont l'un contient tous les points de comparaison munis d'une valeur arithmtique suprieure ou gale la valeur introduite en don nes. Dans la terminologie du programme Fortran, cet ensemble constitue le tableau des quadruplets ( = vecteurs de 4 noncs), et le tableau des chanes de longueur 1 dans celle du programme labor Grenoble en Algol W. b) Construction des domaines smantiques . La deuxime phase du traitement informatique que nous dcrivons 58

ici consiste en une procdure de reconstruction de sous-structures carac tristiques du corpus analys. Indiquons tout de suite que cette procdure repose, dans son principe, sur l'ide de combiner les relations syntagmatiques et les relations paradigmatiques implicitement contenues dans le tableau des quadruplets dfini ci-dessus. Nous suivrons dans notre description la voie qui a t suivie par le programme FORTRAN (Paris), tout en rappelant que le programme labor par le groupe de recherches de Grenoble aboutit aux mmes rsultats par un autre cheminement x. Pour la clart de l'exposition, nous commencerons par rappeler d'une part les types d'objets avec lesquels s'opre la reconstruction, et d'autre part les lois qui y prsident. Il importe tout d'abord de souligner que la procdure utilise suppose la mise en jeu de trois types d'objets, savoir les quadruplets, les chanes et les domaines. Nous prciserons dans un instant les moyens par lesquels chaque type d'objet est construit partir du type d'objet qui lui prexiste ; il importe toutefois, avant tout, de bien mettre en vidence le caractre constructiviste de ces moyens : les objets de rang suprieur aux quadrup lets (i. e. Chanes et domaines ) sont en effet dfinis par la manire dont ils sont construits. Par ailleurs, et ceci constitue une autre loi qui prside cette construction, les objets de rang n sur lesquels les lois de construction d'objets n + 1 sont restes sans effet deviennent eux-mmes des objets de rang n + 1. En d'autres termes les quadruplets rsiduels deviennent des chanes l'issue du traitement des quadruplets, et de la mme faon, les chanes rsiduelles deviennent des domaines l'issue de la formation des domaines. Prcisons ds lors ce que recouvrent ces trois niveaux d'objets : Les quadruplets ont t dfinis ci-dessus, au cours de la premire phase sur laquelle nous ne revenons pas. Les chanes correspondent la phase syntagmatique de la recons truction : leur procdure de formation est la suivante. Soit le tableau des quadruplets , chacun d'eux comportant deux noncs gauches et deux noncs droits . On dira que deux quadruplets amorcent la formation d'une chane si les deux noncs de gauche de l'un sont identiques (portent les mmes numros d'ordre dans la liste des noncs) aux deux noncs de droite de l'autre. Exemple : Em K En + En K' Es -^ Em Ep K En K' Es

Ep Et quadruplet I

Et Ev quadruplet 2

Et Ev amorce de chane

1. La diffrence entre les deux programmes rside essentiellement dans Y ordre selon lequel ils effectuent les oprations : disons simplement que le programme ALGOL W suit plus littralement le texte AAD 1969, en particulier concernant la notion de <];-classes *> et de manire plus gnrale traite tous les rapports paradigmatiques avant d'aborder les enchanements syntagmatiques inter-noncs, ce qui n'est pas le cas dans la version parisienne. 59

On gnre ainsi un tableau des chanes partir du tableau des quadruplets. Rappelons encore une fois que les quadruplets rsiduels rests clibataires sont intgrs, l'issue de cette opration, l'ensemble des chanes (au titre de chanes de longueur 1 dans la terminologie du pr ogramme ralis Grenoble). Les domaines correspondent la phase paradigmatique de la recons truction : la rgle de leur formation suppose la dfinition intermdiaire de la squence comme demi-chane : ainsi, dans la chane ci-dessus, on distinguera les deux squences Em, En, Es d'une part et Ep, Et, Ev d'autre part. Cette dfinition intermdiaire tant rappele, on dira que deux chanes appartiennent un mme domaine si elles ont une squence en commun. En appliquant cette rgle, on voit que l'on peut rapprocher dans un mme domaine des squences qui n'avaient pas directement form de quadruplet. On dira alors que ce rapprochement s'effectue par transitivit, en se souvenant bien que cette transitivit est impose par la rgle de formation des domaines, et nullement constate comme une proprit dmontrable de V objet-domaine. Enfin, il va videmment de soi que, comme prcdemment, les chanes qui ne se sont pas associes une autre chane pour former un domaine sont intgres au tableau des domaines , l'issue de cette tape du traitement. De cette manire, il n'est pas rare qu'un quadruplet (objet de rang 1) rest syntagmatiquement et paradigmatiquement isol devienne une chane de longueur 1 c'est--dire un objet de rang 2, puis un domaine form de deux squences, autrement dit, un objet de rang 3. c) Mentionnons un dernier aspect de la procdure actuelle, avant de revenir sur le rsultat central de celle-ci, savoir la reprsentation du pro cessus discursif par ces domaines smantiques dont nous venons d'expos er le mode de gnration : il s'agit de la constitution d'un tableau des relations entre domaines dont nous rappellerons seulement les deux types d'information qu'il fournit, qu'on pourrait dsigner respectivement comme des relations paradigmatiques dfinissant des relations d'intersection et d'inclusion entre domaines, et des relations syntagmatiques caractrisant les cheminements propres au processus discursif du corpus. Disons simple mentque les premires relations conduisent la construction de regroupe ments de domaines (ou hyper-domaines ), cependant que les secondes permettent de tracer le graphe du processus discursif, graphe connexe non value dont les nuds sont constitus par des domaines ou des hyperdomaines. Reprenons donc la question que nous venons de laisser en suspens, c'est--dire la question des domaines en tant qu'lments de base par lesquels est obtenue une reprsentation du processus discursif : on constate que sous la forme actuelle des rsultats, les domaines smantiques se prsentent comme des regroupements de n sous-squences extraites de discours du corpus, travers la dlinarisation syntaxique qu'en a fourni la deuxime phase. Ces n objets sont par construction dans un rapport de substi60

tution dont la procdure que nous venons de dcrire ne prcise pas davantage la nature. Nous avions pens au dbut (Pcheux, 1969) que ces substitutions taient ncessairement des indices d'quivalence, en d'autres termes que les n squences d'un domaine constituaient n formes smantiques quival entesd'une mme proposition, au sens logique du terme x. Ds la publication du Manuel, nous avons attir l'attention sur le fait que les relations de substitution auxquelles on aboutissait ainsi ne semblaient pas pouvoir se ramener la simple quivalence ; c'est alors que nous avons t amens distinguer deux types fondamentaux de substitution, savoir : 1) Les substitutions symtriques telles que, tant donn deux substituables (morphmes, syntagmes ou noncs) A etB, le chemin condui sant de A B est identique celui qui conduit de B A, ce qui suppose une quivalence A = B de type dictionnaire ou un effet contextuel quivalent. Dans ce premier cas, A est contextuellement synonyme de B, ou bien il en est une mtaphore adquate (et rciproquement pour B l'gard de A), dans le cas o cette quivalence est produite dans le processus lui-mme, sans tre referable un effet de type dictionnaire. 2) Les substitutions orientes , c'est--dire telles que le chemin de A B n'est pas identique au chemin de B A. Dans ce dernier cas, les substituables ne sont pas quivalents, mais l'on peut passer de l'un l'autre, dduire l'un de l'autre. En d'autres termes, A et B sont dans une relation qu'on peut qualifier, son niveau le plus gnral, de mtonymique. L'exis tencede ce rapport non symtrique de dductibilit entre A et B renvoie selon nous (cf. Haroche-Pcheux, 1972, pp. 47-49) la possibilit d'une syntagmatisation A + R + B (ou B -f- R' + A), o R (et R') renvoient l'existence d'une relation syntaxique entre les deux lments A et B. Ainsi, tant donn le rsultat brut suivant (ibid. p. 47) : A = une catastrophe se produit B = les personnes vitent r ouverture de la porte

nous faisons Vhypothse d'une syntagmatisation implicite entre A et B, du type : c'est parce que une catastrophe se produit ds X que les personnes vitent X , dont on doit supposer selon nous qu'elle est formule quelque part (pas ncessairement dans le corpus tudi), ce qui conduit poser la question de ce qui, dans l' extrieur spcifique d'un corpus donn, inter vient sur les substitutions qui s'y produisent, pour les orienter 2. Le rsultat est alors conventionnellement reprsent ainsi : l'ouverture de la porte. 1. Cf. Pcheux 1969, pp. 35-38. 2. Dans l'article dj cit, S. Fisher et E. Veron font allusion cet exemple. A ce propos, ils critiquent la reprsentation ci-dessus comme laissant de ct l'apparition en surface de l'expression : c'est parce que... que trouve dans la phrase . (art. cit., p. 166). En somme, les auteurs ont distraitement pris cette connexion syntaxique hypothtique pour une phrase du corpus analys, si bien qu'ils critiquent la segmentation syntaxique de cette phrase en deux lments, segmentation qui n'a jamais eu lieu, et pour cause 1 61

Tous ces points seront repris et dvelopps dans un travail actuellement en cours de rdaction portant sur le rapport entre smantique et processus discursif 1. Nous terminerons ce commentaire de la procdure actuelle de dsyntagmatisation discursive en rappelant la signification de plusieurs options plus ou moins rcemment introduites : la procdure dite de compactage , qui permet de soumettre l'analyse le corpus (A + B) aprs avoir effectu l'analyse distincte de A d'une part et de B d'autre part, et donc d'tudier systmatiquement les diffrences entre les deux corpus, et en particulier de dterminer les domaines qui appartiennent spcifiquement A d'une part et B d'autre part, ceux qui rsultent de l'agglomration de domaines de A et de B, ceux enfin qui sont produits par le compactage A + B ; la distinction entre les deux modalits de comparaison des RB (inter-discours seulement ou inter- et intra-discours) ouvre, semble-t-il, la voie des recherches importantes pour la caractrisation de la rpti tivit, de la strotypie d'un corpus, en tudiant dans quelle mesure il se reproduit partiellement lui-mme. Il n'est pas exclu que cette problmat ique ait un lien avec le discours de Vautre l'intrieur mme du discours du locuteur ; l'intgration des connecteurs dans le calcul de la distance entre deux relations binaires lve, nous l'avons dit, une difficult souvent signale. Il reste que le rapport entre les diffrents types de connecteurs n'a pas encore t tudi du point de vue de leur substituabilit ; une telle tude aurait ventuellement des effets en retour sur cette mesure, en permettant d'associer une valeur chaque couple de connecteurs se trouvant en co-occurrence. Gela supposerait une table cartsienne des connecteurs, intgrant les valeurs pour chaque couple, les relations de compatibilit et de permutabilit (telles que Ea Ri Eb ->- Eb Rj Ea). 3 . 2. Critique de la procdure actuelle, sur la base des entres EN-RB. Nous reprendrons pour l'expos de ces critiques le mme plan que celui que nous avons suivi dans le prcdent paragraphe, en mentionnant d'abord que, de manire gnrale, c'est le caractre relativement arbitraire des procdures effectues qui a t le plus souvent critiqu. Dans leur rcent article dj cit, Borillo et Virbel remarquent que nombre d'oprations sont considres comme naturelles alors qu'on pourrait les reprer l'intrieur d'une famille d'oprations, ce qui obligerait motiver le choix de telle ou telle opration. A. Trognon formule pour sa part la nature thorique de la dviation qu'il critique en parlant d'un mixte d'empirisme et de formalisme.

1. M. Pchkux, 1975. 62

Disons clairement que le principe de ces critiques nous parait plein ement valide, dans la mesure mme o le travail de modlisation math matique, permettant de reprer les points de choix dans la procdure, et de les motiver, n'a pas encore t effectu 1. Examinons maintenant successivement les deux tapes de la procdure que nous avons expose du point de vue des critiques qu'elles suscitent, en mentionnant, chaque fois que cela sera possible, la direction dans laquelle nous suggrons d'aller pour les viter. Le problme de la valeur affecte la comparaison entre deux RB. Nous relverons trois remarques d'importance variable qui ont t formules sur ce point. La premire constatation consiste remarquer que la dfinition mme des points de comparaison , prsente comme naturelle, est en fait assez arbitraire : il serait faux, en effet, de penser que cette procdure, sous prtexte qu'elle s'effectue point par point, envisage toutes les comparaisons possibles. Il n'en est rien, ainsi qu'on peut aisment s'en rendre compte par le cas de l'incise d'un nonc dans une squence, au sens que nous venons de donner ce terme au paragraphe 3. Soit en effet le quadruplet : Ea Em K Eb En

Si l'on admet que les distances calcules sur ces composants conduisent une valeur arithmtique suprieure au seuil, on voit que les squences Ea K Eb et Em K En seront dans un mme domaine. Supposons main tenant que, la place de la squence Em K En, on ait la squence Em K' Ep K" En : on voit que Y interpolation de V nonc Ep empche la comparaison que nous avons pose au dbut comme conduisant un rsultat positif. Il apparat pratiquement assez difficile de pallier cet inconvnient, si l'on ne pose pas en mme temps des heuristiques permettant de limiter le champ d'extension de cette procdure consistant sauter des noncs dans la squence, et donc ne plus se contenter de comparer des relations binaires entre elles. La deuxime remarque critique est d'une plus grande porte immd iate : elle consiste relever le caractre la fois empirique et arbitraire de la distance (quelle que soit par ailleurs sa zone d'application) : il s'agit du systme de pondration (le pattern dans la terminologie des pr ogrammes raliss) par lequel on multiplie le vecteur boolen obtenu l'issue de la comparaison colonne par colonne de deux noncs. On peut dire qu'il s'agit l d'un double arbitraire, dans la mesure o ni linguistiquement, ni mathmatiquement (d'un point de vue statistique) la signification du

1. Un travail sur ce point est actuellement en cours (cf. introduction, p. 4). 63

principe de cette pondration, et encore moins la signification des diff rences de poids entre les catgories du vecteur-nonc, n'a t clairement dfinie. La question se pose en particulier de savoir si l'identit ou la nonidentit entre deux contenus doit revtir la mme signification, quels que soient ces contenus 1 : il ne s'agit pas, bien entendu de revenir sur le principe mme de l'AAD, qui, on le sait, interdit la constitution a priori de classes de morphmes, de syntagmes ou d'noncs, mais de s'interroger d'un point de vue linguistique sur la diffrence de fonctionnement, cet gard, de ce qu'on appelle habituellement les classes fermes , par oppos ition aux classes ouvertes : dans le compte-rendu qu'elle fait dans La Pense (n 161, juin 70) de l'AAD 69, G. Provost-Chauveau commente cet aspect de la procdure en disant, propos de la valeur attr ibue chaque catgorie : la dtermination approximative de cette valeur fait appel (actuellement) aux notions de probabilit : ainsi Di qui est choisi dans un ensemble restreint de termes (articles, dmonstratifs...) a la valeur 2, tandis que Ni o le choix des lexemes s'effectue dans un ensemble beaucoup plus vaste a la valeur 5. En disant cela, G. ProvostChauveau dpassait notre pense telle que celle-ci s'exprimait dans AAD 69, o il n'tait aucunement mention de probabilits, mais elle la dpassait dans la direction qu'il nous semble aujourd'hui utile de prendre, condition de lever certaines ambiguts. Nous soumettons ainsi la discussion l'ide suivante : plutt que de traiter de manire homogne chaque co-occurrence quelle que soit la catgorie morpho-syntaxique o elle apparat, ne conviendrait-il pas de distinguer deux traitements fo ndamentalement diffrents de la co-occurrence, en fonction du caractre ferm ou ouvert de la catgorie o cette co-occurrence apparat ? On pourrait, assez facilement semble-t-il, envisager pour l'ensemble des catgories DET (1 et 2), F, P et CONNECTEUR un traitement del co-occurrence dans lequel tout couple d'lments (y compris, bien entendu, le couple d'lments identiques) serait muni a priori d'une valeur intgrer dans le calcul gnral de la distance. Quant aux classes ouvertes (essentiellement N, V et ADJ), on peut envisager soit de maintenir la procdure actuelle, soit d'instaurer un systme apprentissage dans lequel les substitutions dj repres seraient r-injec tes dans les donnes sous la forme d'un mta-terme prenant la place des deux substituables. Ainsi se constituerait progressivement un auto dictionnaire enregistrant des quivalences de niveau n en vue d'en reprer d'autres au niveau n + 1. (On remarquera que cette suggestion, se rapproche beaucoup de la procdure harrissienne.) Ajoutons qu'il serait par ailleurs possible de combiner cette procdure avec la dtermination a priori de mots-cls ( partir de mesures statistiques pralables) affectant la valeur accorde leur co-occurrence. 1. Cf. les phnomnes d'homonymie, comme le cas de comprendre (contenir # saisir par la pense), rcemment mentionn dans le commentaire de rsultats AAD (Michel Morin, 1973, p. III, 12). 64

La troisime remarque dont nous avons rendre compte porte sur l'utilisation qui est faite de la mesure de distance ainsi calcule : nous avons montr prcdemment que cette tape revenait en dfinitive asso cier une valeur numrique chacun des n(n -l)/2 points de comparaison. Or la question se pose de savoir si cette distribution des valeurs affectant les points de comparaison ne prsente pas un intrt au-del de la simple opration de dichotomisation laquelle son utilit se rduit actuellement. On sait en effet que la procdure s'effectue ici par tout ou rien : un point de comparaison est, ou non, enregistr dans le tableau des quadruplets . Ainsi est perdue une srie d'informations qui permettraient de distribuer les quadruplets raliss en fonction de la valeur de la borne P alpha (note PAL dans la terminologie des programmes raliss). Il n'est pas interdit de penser que l'tude d'une telle distribution, pour chaque corpus, pourrait fournir d'intressantes informations son sujet, y compris, peuttre une estimation de la valeur optimum de la borne P alpha pour le corpus considr. Notons par ailleurs que cette distribution permettrait de srier les substitutions selon qu'elles affectent un morphme (une seule catgorie comporte un 0), un syntagme ou un nonc. Ceci pourrait prsenter un grand intrt pour la ralisation de l'algorithme du contexte maximum , dont il sera fait mention plus loin. Ajoutons enfin, pour clore provisoirement cette question de la dfinition de la distance entre deux objets (nous nous plaons toujours dans le cas o il s'agit de relations binaires), que l'on peut bien entendu envisager d'autres types de mesure que la moyenne arithm tique actuellement utilise. A signaler d'autre part les travaux de Lerman 1 sur ces problmes, et l'ensemble des mthodes de classification automatique, qui font toutes appel une mesure de distance. Ce sera un des aspects de la modlisation mathmatique dont nous parlions tout l'heure que de situer les exigences spcifiques de l'analyse AAD l'intrieur de la famille des solutions formellement possibles. Le problme de la construction des domaines. La question nos yeux centrale a t aborde de manire indpen dante par G. Provost-Chauveau et par A. Trognon. Elle concerne la rfrence la smantique qui est implique par l'expression de domaines smantiques . G. Provost-Chauveau pose la question de savoir s'il est justifi ou non de poser que les substitutions ne changent pas le sens ce qui n'est pas sans dsigner le lien entre notre problmatique et celle de la paraphrase dans le cadre d'une thorie transformationnelle ; A. Trognon, quant lui, met en question l'affirmation de AAD 69 selon laquelle deux squences appartenant un mme domaine ont une interprtation smant iqueidentique . Sans avoir l'exprience des rsultats, dans lesquels nous avons effectivement constat des rapprochements incongrus et des artefacts

1. I. Lerman (1970). 65 LANGAGES N 37 5

dus au caractre formel (formaliste) de notre procdure, A. Trognon avait en son temps pressenti la difficult. Faut-il aller jusqu' dire que les rapports mis en jeu ne concernent que la proximit phrastique, l'exclusion de tout effet de sens ? Nous pensons en fait aujourd'hui que la question est plus complexe, dans la mesure o il convient de discerner les purs arte facts syntaxiques qui seraient en principe liminables par une correction de l'analyse syntaxique et/ou une modification du systme de pondration qui a fourni la co-occurrence contenant cet artefact, et les phnomnes smantiques de substitution, lesquels ainsi que nous avons dj eu l'occa sion de le dire, ne se rduisent pas, en tout tat de cause, une identit de l'interprtation smantique : nous avons en effet distingu deux types de fonctionnements qui mritent, notre sens, tout autant l'un que l'autre d'tre qualifis de smantiques, savoir la relation de substitution-qui valence d'une part, qui renvoie la stabilit logique d'un systme formel mta-linguistique, et la substitution-oriente d'autre part, qui, si l'on nous a bien compris, constituerait la condition de possibilit d'une quivalence ultrieure, ou si l'on veut, une quivalence l'tat naissant . Cela revien drait dire que l'quivalence rsulte de la disparition, oubli ou effacement d'une orientation, ce qui ferait de la paraphrase logique (sauvegardant le sens) un cas particulier du fonctionnement des effets de sens. En d'autres termes encore, nous dirons que toute mtonymie (lie une orientation syntagmatique) tend se dgrader en synonymie, par effacement de la syntagmatisation, ce qui n'exclut videmment pas que des synonymies (ou des mtaphores) soient nouveau sutures par de nouvelles relations syntagmatiques. Nous considrons dans ces conditions que la difficult principale vient non pas de la ncessit de justifier ici l'usage du terme de smantique, mais du fait que ces deux types de relations ne sont pas dans l'tat actuel de la procdure produits par un algorithme automatisable, ainsi qu'on le voit clairement sur les deux schmas ci-contre : Indiquons toutefois que la ralisation d'un tel algorithme implique deux conditions : tout d'abord, il est ncessaire que les zones de substitution soient identifies par une procdure automatique, ce qui n'est actuellement pas le cas, d'autre part, l'orientation doit tre dfinie par le reprage de syntagmatisations, attestes dans d'autres domaines appartenant aux rsultats, ou dans le corpus des donnes, ou mme dans l' inter-discours du corpus ou du systme de corpus tudi. Nous n'en dirons pas davantage sur cette dernire condition, faute d'lments permettant d'aborder ce problme. Nous donnerons par contre quelques prcisions sur la premire condition nonce : Soit en effet un domaine smantique tel que le programme actuel est capable de le calculer : on peut le considrer comme une liste de squences 66

Exemple de domaines calculs par le programme, avec leur inter Ex. 1 Impressions de sortie : 674 0000 R REPARTITION E PLUS a 0 EQUITABLE 91 675 0000 R REPARTIT 921 0000 R REPARTITION E 0 a 0 MEILLEUR 91 922 0000 R REPARTIT 921 0000 R REPARTITION E 0 970 0000 R REPARTITION E 0 a 0 MEILLEUR a 0 JUSTE 91 923 0000 R REPARTIT 91 971 0000 R REPARTIT

R Ex. 2 Impressions de sortie : 479 00000 x AUGMENTER 481 00000 EPANOUISSEMENT E 0 LS 0 a 0 POSSIBILITE 92 480 0000 R INTELLECTUEL

723 0000R GOUVERNEMENT OFFRIR 0 TTLS POSSIBILITE 92 724 0000 R 725 0000R CROISSANCE E 0 a 0 INTELLECTUEL Interprtation : Le gouvernement offre X augmenter les toutes le

de mme longueur, supposes prsenter entre elles des rapports de substi tution ; la premire opration effectuer est de reconstituer ces zones de substitution (ou, mieux, d'viter la perte d'information qui se produit au moment de la dichotomisation de l'ensemble des quadruplets pos sibles ). Pour cela, il semble utile de dfinir le contexte maximum d'un domaine comme l'ensemble des n lments appartenant au moins deux squences d'un mme domaine et placs dans la mme position, tel que n soit maximum pour le domaine considr. Le complmentaire de ce contexte maximum, c'est, pour le domaine considr, une zone de commut ationcontenant au minimum deux lments. L'algorithme envisag consiste, dans le cas o le contexte maximum est unique, remplacer par un mta-terme indici la zone de commutation, considrer les squences (au moins deux) comme une seule, et reffectuer l'algorithme. Dans le cas o plusieurs contextes maxima apparatraient simultanment, on conviendra d'effectuer l'union des rsultats successiv ement obtenus ainsi dtermins. Il va de soi que, comme nous l'indiquions plus haut, l'information produite lors du calcul des distances dont l'ensemble des points de comparaison est muni contribuerait sans doute largement la ralisation pratique de cet algorithme, qui fournirait ainsi les questions pertinentes servant de base la recherche des relations de syntagmatisation, qui constitue ce que nous avons appel ici la deuxime condition 1. les autres remarques concernant la construction des domaines portent en gnral soit sur la validit statistique des rsultats obtenus, soit sur leur prsentation. Pour ce qui est de la validit statistique des rsultats obtenus sous la forme de domaines et de relations entre domaines, nous nous contenterons de rappeler que le principe de l'AAD est, pris en lui-mme, extrieur toute considration statistique. Cela n'exclut cependant pas que soient effectues certaines investigations statistiques, dont nous mentionnerons rapidement les plus utiles. 1) Sur les donnes sous leur forme EN, RB calcul de la frquence relative des items lexicaux dans chaque catgorie morphosyntaxique des noncs, y compris la forme de l'nonc . reprage des couples Nx X N2 sur une matrice d'incidence. analyse de la structure du graphe : frquence relative des connect eurs, des relations de saturation, longueur moyenne et complexit des squences latrales et de la squence centrale. Cette investigation devrait, selon nous, tre effectue dans la double perspective de la dfinition des proprits statistiques communes tout corpus et de proprits diffrentielles entre corpus.

1. Soulignons par ailleurs le rapport vident entre l'algorithme du contexte max imum et la procdure dite de r-injection voque p. 64. 68

D'autre part, il apparatrait opportun d'examiner les rapprochements ventuels entre ces rsultats et ceux qui peuvent tre effectus sur un corpus de discours dans leur tat naturel . 2) Sur les rsultats obtenus par le traitement AAD. En rapportant les rsultats au nombre d'noncs, de relations et de discours nous proposons d'tudier : la distribution des valeurs de distance paradigmatique, en fonction de la borne Pa et du pattern, la densit (rapport du nombre de quadruplets retenus sur le nombre de quadruplets possibles), le nombre de quadruplets, chanes et domaines, la structure des domaines (nombre de discours intervenant dans leur constitution, discours facultatifs , i. e. n'intervenant dans aucun domaine) et la structure des dpendances entre domaines. 3) Signalons enfin que la confrontation de caractristiques d'un corpus (sous sa forme naturelle et comme ensemble d'objets discursifs) avec les caractristiques des rsultats obtenus par le traitement peut conduire la construction d'une procdure d'valuation pralable permettant de prdire si un traitement AAD est ou non applicable un corpus donn. En ce qui concerne, enfin, la prsentation des rsultats, il semble que la principale critique porte sur le tableau des relations entre les domaines qui ncessite un travail manuel ultrieur assez aisment automatisable, puisqu'il consiste regrouper les domaines lis entre eux par des intersections ou des inclusions en hyper-domaines , et reconstituer le graphe reprsentant les chemi nements entre domaines et hyperdomaines appartenant au corpus. Il est noter que l'une des consquences thoriques de la constitution des hyperdomaines serait de permettre le regroupement de squences de longueur ingale, ce qui pourrait ventuellement conduire renouveler la problmat ique de la substitution. 3.3. Vers une transformation des entres de la phase 3. A l'issue de cet examen, il nous parat souhaitable de revenir un instant sur la question gnrale du rapport entre la phase 2 et la phase 3 : rappelons que ce rapport s'articule autour d'une double exigence, savoir (cf. p. 33-34) que la reprsentation de la surface linguistique doit 1) restituer la non-linarit des structures syntaxiques, et d'une manire gnrale prsenter les garanties de stabilit et de cohrence que nous avons exposes antrieurement, 2) autoriser par sa structure 1' effectuation d'un calcul de comparaisonreconstruction du type de celui que nous venons de considrer dans la phase 3. Or il semble que la reprsentation actuellement utilise, et que nous dsignerons par reprsentation EN-RB , prsente le grave dfaut de ne 69

pas respecter pleinement la premire condition tout en se chargeant d'exi gences qui ne sont en fait pas imposes par la deuxime condition : en d'autres termes, il ne semble pas que cette 2e condition impose la transfo rmationde la forme combinatoire (cf. p. 39) du graphe en sa forme ENRB ; par contre, il semble bien que, comme le remarque M. Dupraz (1974), la reprsentation actuellement entre en donnes pour la phase 3 ne garde pas la trace des rapports de hirarchie structurale entre les noncs, ce qui pourrait en effet expliquer l'apparition d'un certain type d'artefact caractris par l'htrognit du niveau structural des noncs constituant les squences d'un domaine. Dans cette perspective, deux solutions tales dans le temps nous paraissent envisageables : relativement court terme, il semble possible de tenter d'amliorer la reprsentation EN-RB de manire ce que les connecteurs intgrent les relations de parenthsage existant entre les noncs. A plus long terme, l'objectif serait de transformer la phase 3 de manire permettre le traitement des graphes (sous leur forme combinatoire), ce qui serait en fait le prlude des changements plus radicaux encore, dans la mesure o il s'agirait de comparer entre elles des structures conte nant des lexis . Conclusion Dans son compte-rendu dj cit, G. Provost-Chauveu relve juste titre qu'une des conditions pour que notre entreprise ait un sens est qu'il soit possible, dans un contexte donn, d'oprer certaines substi tutions entre deux termes x et y sans changer l'interprtation smantique de l'nonc (art. cit., pp. 136-137). Nous partirons de cette remarque pour aborder les problmes tho riques que soulve actuellement la phase dite d'interprtation des rsul tats dans laquelle, comme nous avons dj eu l'occasion de le signaler, les diffrents types de substitution existant entre les squences d'un mme domaine sont reconstruits par l'analyste. Pour dsigner toute la porte de ce problme, autour duquel se joue en fait la validit et les possibilits de dveloppement thorique ultrieur de l'analyse du discours dans cette voie, nous reviendrons un instant sur le prsuppos qui tait le ntre lors de la rdaction de AAD 69, afin de liquider pour nous mmes et, pensonsnous, aussi pour le lecteur, une illusion concernant la structure des processus smantiques. L'ide centrale du texte que nous voquons tait, sur ce point, que les substitutions ne changent pas le sens , condition d'assurer une identit minimum de contexte. En ce sens, nous* pensions aller jusqu'au bout des possibilits ouvertes par le travail de Harris, en fournissant une interprtation plus stricte des classes d'quivalence qu'il introduit dans sa procdure d'analyse, et propos desquelles il reste trangement vague : Les rsultats formels obtenus par ce genre d'analyse font plus que dfinir 70

la distribution des classes, la structure des segments ou mme la distribution des types de segments. Ils peuvent aussi rvler des particularits l'intrieur de la structure, par rapport au reste de la structure. Ils peuvent montrer en quoi certaines structures ressemblent d'autres, et en quoi elles en diffrent. Ils peuvent conduire de nombreuses conclusions concernant le texte. Tout ceci cependant est encore distinct de V interprtation des rsultats (ici c'est Harris qui souligne), qui doit tenir compte du sens des morphmes et poser la question de savoir ce que l'auteur voulait faire quand il a crit ce texte. Cette interprtation est bien entendu tout fait distincte des rsul tatsformels, bien qu'elle puisse les suivre troitement dans les voies qu'ils ouvrent. (Harris, 1969, pp. 43-44. Sauf indication contraire, c'est nous qui soulignons.) Or nous avions pens que, l'identit du contexte tant assure non seulement par la construction du matriel dans la mesure o celle-ci impos ait une rptition du texte sous la forme d'un corpus homogne quant ses conditions de production, mais galement par les dispositions internes de comparaison entre les lments du corpus, nous pouvions lever la rticence que manifeste ici Harris, rticence qui s'accompagne videmment d'un abandon une sorte de smantique intuitive du sujet parlant et de ses intentions (ce que l'auteur voulait faire...) que nous critiquions et que nous continuons critiquer radicalement. En parlant de rticence, nous voulons dire que tout conduit, selon-nous, Harris poser que les rsultats for mels qu'il obtient constituent en vrit tout ce qu'une analyse non-subj ectiveest capable de fournir, sous rserves d'ventuelles rlaboration s tout aussi formelles que les prcdentes. Et, de fait, nous continuons penser que, entre ce que D. Leeman (1973) appelle une smantique forte qui serait l'tude des relations entre les noncs et la ralit extra linguistique d'une part, et une smantique faible caractrise par le fait qu'elle renvoie une quivalence entre les noncs, sans que l'on se pose la question de savoir ce que signifient ces deux noncs la solution correcte est rechercher dans la deuxime direction. Si l'on ajoute enfin que, comme le remarque galement D. Leeman, la paraphrase est un concept fondamental de la smantique faible (p. 85, loc. cit.), on peut dire que la rticence de Harris consiste dans le fait qu'il hsite relier directement paraphrase, substituabilit et synonymie. Ce lien, quant nous, nous semblait devoir tre invitablement pos pour aller jusqu'au bout des intuitions linguistiques et logiques de Harris, caractrises avant tout par le refus de toute analyse extra-linguistique du sens : ce lien nous a en fait conduit en 1969 l'ide de V invariant propositionnel sousjacent une famille paraphr astique, dans une perspective qui, pour des motifs thoriques fort loigns des siens, recoupe celle de Paul Gochet, (1972). Notre objectif 1 tait bien, en effet, d'atteindre, par la procdure 1. Dans cette mesure, la perspective que nous avons tent de dvelopper est, certains gards, voisine de celle de I. A. Mel'Cuk, en particulier sur la question de la paraphrase et du rapport entre sens et texte, dans Zolkovskij-Mel'Cuk (1971). 71

d'analyse propose, ces nexus smantiques qui constituent le contenu commun un ensemble de propositions et qu'on peut encore appeler pro position de base 1. Dans cette perspective, que nous pensons ncessaire d'exposer avec quelque dtail, ne serait-ce que parce qu'il n'est pas actuellement possible de dterminer si elle n'a pas, dans certaines limites, sa validit, l'aboutiss ement de l'analyse serait ds lors un graphe connexe non-valu dont les nuds seraient constitus par des propositions de base : partir de ce moment, on serait en fait ramen un problme de logique formelle, qui pourrait tre formul comme suit : tant donn un graphe reliant entre elles des propositions de base , l'ensemble tant associ un corpus dis cursif dtermin, dfinir les rgles permettant 1) de construire, partir d'un lexique de prdicats et d'arguments, l'ensemble des propositions de base, et elles seules, 2) de construire le graphe reliant entre elles les propositions de base ainsi dfinies. Un tel systme de rgles constituerait en ralit ce qu'on pourrait bon droit appeler le processus de production du discours correspondant au corpus analys. Sans abandonner compltement cette perspective (nous verrons tout l'heure pourquoi, cf. p. 77), il nous parat ncessaire de faire deux remarques : la premire rside dans une simple constatation, dont le caractre de gnralit ne peut, comme tel, tre garanti : il s'agit du fait, dj signal, que les domaines smantiques effectivement obtenus par la procdure AAD ne se rduisent pas une famille d'noncs inter-paraphrasables par une seule et mme proposition de base, de sorte que nous avons t amens distinguer deux types de relations de substitution (cf. ici mme p. 61). La deuxime remarque prend appui sur la premire, et tente d'en saisir les causes partir de la distinction entre smantiques forte et faible , en mettant en vidence le fait que, prenant son dpart dans une smantique faible , notre perspective tentait en ralit de reconstituer, partir de ce point, les lments d'une smantique forte : on remarquera en effet que l'ide d'une correspondance entre un invariant (la proposition de base) et une srie de variations le reprsentant est homologue la distinction entre structure profonde et structure de surface , ces deux distinctions se fondant d'ailleurs sur une troisime qui les englobe, savoir la distinction

1. Soit par exemple le domaine smantique suivant : donner assurer un minimum vital l'Etat assure On peut, dans ce cas particulier, lui faire correspondre la proposition : R (A, B) avec R = donner, assurer, ... A = X, l'Etat, ... B = minimum vital, ... 72

entre information objective , dnotation, domaine auquel s'appliquent les valeurs de vrit etc.. d'une part, et caractre subjectif du message, connotations, domaine de l' expression d'autre part. (On remarquera au passage que cette distinction permet galement d'assurer la thorie rhtorique de l' cart la norme , qui devient, dans une smantique faible , l'cart par rapport l'invariant.) A l'encontre de ce que nous avions pourtant pos ds le dbut, savoir que la mtaphore est premire et cons titutive, et non pas seconde et drive, une telle perspective, abandonne elle-mme, aboutit ncessairement relguer le fonctionnement de la mtaphore dans la catgorie des phnomnes de surface qui accompagnent le sens, ce qui prsuppose que celui-ci est dj constitu 1. A la limite, la question se pose de savoir si une telle smantique faible , mene jusqu'au bout dans cette perspective, est encore discernable d'une smantique forte : le systme d'oppositions que nous venons de rappeler suppose en effet fondamentalement que le sens existe comme un objet, de sorte que la stabilit de l'objet (objet rel ou objet-rfrent) est premire, et que les proces sus sont concevoir comme des objets mis en mouvement, dplacs travers la reprsentation qui en est donne. Que si, tout au contraire, on accepte la thse matrialiste selon laquelle les objets ne sont pas des invariants premiers, mais des points de stabi lisation de processus, on voit alors que la perspective se modifie nota blement, en particulier en ce qui concerne le principe selon lequel les substitutions ne changent pas le sens . Pas plus que le principe correspon dant appliqu aux transformations ( les transformations ne changent pas le sens ), il apparat que ce principe ne peut tre valablement pos dans Vuniversel : son exercice suppose en fait un champ plus vaste dans lequel rien ne garantit a priori que les substitutions et les transformations ne changent pas le sens. Ceci nous conduit videmment prciser nouveau ce qu'il convient d'entendre par paraphrase , en reliant ce concept celui de substitution et de synonymie d'une part, et celui de transformation (linguistique) d'autre part. Dans le travail dj cit, D. Leeman retrace l'volution des conceptions de Harris et la rsume ainsi : on a donc dans un premier temps un ensemble non-ordonn de transformations dfinies en termes de co-occurrences et toutes paraphrastiques, sans que le terme de paraphrase

1. La question de la mtaphore et de l'effet mtaphorique (cf. Pcheux, 1969, p. 29) est notre sens dcisive : en disant que la mtaphore est premire et non drive, nous ne voulons pas renverser le rapport entre sens propre (noyau de sens, dnotation, fondement de la proposition logique) et sens figur (priphrie du sens, manire de parler, connotation et ressort du style ), en laissant entendre que tout sens est figur et priphrique, ce qu'invite croire la perspective des lectures plurielles . Il s'agit au contraire de liquider le couple noyau/priphrie lui-mme, en considrant la mta phore comme le transport entre deux signifiants, constitutif de leur sens, et l'orientation ingalisante de ce rapport comme la condition d'apparition de ce qui, dans chaque cas, pourra fonctionner comme < sens propre > ou comme sens figur . 73

n'apparaisse... (dans un deuxime temps) on aboutit deux types d'op rateurs, ayant chacun des caractristiques descriptibles dans la grammaire : les oprateurs incrmentiels et les oprateurs paraphrastiques (Leeman, 1973, p. 42). La caractristique des transformations paraphrastiques, c'est qu'elles ne dterminent en gnral aucun changement de sens sur leur oprande, (qu') elles n'apportent pas d'information supplmentaire sur leur oprande (ibid. p. 43). Le second type de transformations se caractrise au contraire par ce qu'elles apportent une certaine information de sorte qu'elles peuvent pour cette raison tre interprtes comme tant predicatives (ibid. p. 51). Nous pensons que cette distinction correspond, dans une formulation qui n'est pas cependant dpourvue d'ambigut, la distinction introduite plus haut entre substitution-quivalence et substitution oriente . Si nous parlons d'ambigut propos de la formulation de Harris, c'est parce qu'elle n'est pas sans rappeler les prsupposs de la smantique forte , la distinction entre objectif et subjectif en particulier, et ses cons quences linguistiques sous la forme de la distinction langue/parole ; c'est-dire comme on le sait, la distinction entre un systme et des actes qui, tout la fois, lui prexistent, le constituent et se perdent en lui . On jugera de la pertinence de ce rapprochement la lumire du texte ci-dessous : La diffrence entre le systme incrmentiel et le systme de T para phrastiques est en gros comparable celle entre les activits directes de la vie et l'appareil institutionnel qui les canalise. Comme les institutions sociales, la structure du systme de T facilite, inflchit et ptrifie les activits entrant dans l'usage du systme /I/, et ce systme est inflexible, conventionnel et en partie historiquement accidentel... (Z. S. Harris, ibid., p. 68). Dans ces conditions, dira-t-on, il ne semble pas que l'acquis soit apprciable, puisque la nouvelle distinction nous reconduit aux prsupposs auxquels nous voulions chapper. Nous nous proposons de montrer qu'en fait cette distinction ouvre la voie une conception nouvelle plus conforme aux requisits thoriques que nous avons formuls, mais la condition de di stinguer non pas deux, mais trois types de transformations, tel que le troisime type soit susceptible de s'absorber dans les deux autres, certaines conditions que nous allons prciser. Nous distinguerons donc pour notre part trois types de transformations (ou relations entre couples de squences) : 1) Les transformations units lexicales constantes. La recherche linguistique actuelle repose pour une grande part sur l'hypothse de telles transformations (Par exemple : Les Romains ont dcid de dtruire Car thage - La destruction de Carthage a t dcide par les Romains ). Il s'agit de ce qu'on pourrait appeler des transformations syntaxiques pures, des transformations-substitutions qui ne changeraient en principe pas le sens dans la mesure o elles constitueraient des conversions d'une 74

squence de phonmes en une autre. Nous conservons cette dsignation, au moins titre de cas-limite, en restant circonspects sur le fond de cette hypothse, (qui repose en dfinitive sur un prsuppos logiciste par l'inte rmdiaire de l'opposition comptence/performance ncessairement lie cette conception) quant sa compatibilit avec une conception de renonc iation telle que celle qui a t esquisse plus haut. 2) Les transformations-substitutions qui changent le sens , dans la mesure o il est impossible de considrer les substituables comme quiva lents: il s'agit des substitutions que nous avons appeles orientes , c'est--dire avec changement lexical et mettant en jeu une relation de syntagmatisation entre les commutables. Elles correspondent aux trans formations incrmentielles de Harris. 3) Enfin, et c'est nos yeux ce qui constitue le point dcisif, nous proposons d'introduire un troisime type de relation, savoir la substitution non-oriente avec changements lexicaux. Il s'agit de la relation de synony mie, dont D. Leeman souligne qu'elle est une relation d'quivalence entre phrases, diffrente de la relation transformationnelle : la constatation de la similitude smantique est immdiate et non empirique ; autrement dit, on n'a pas trouv le moyen linguistique de driver la synonymie d'une opration linguistique (loc. cit. p. 49). Nous avancerons l'hypothse que les difficults souleves par l'analyse linguistique de la synonymie proviennent du fait que celle-ci est pense en rfrence la premire catgorie de trans formations (celle des paraphrases syntaxiques ), comme une quivalence attnue, et non pas en rfrence la deuxime catgorie, parce qu'elle semble antithtique de la notion mme de synonymie. C'est pourtant dans cette perspective, qui conoit la synonymie comme un effacement de Vorientation (et non pas comme une extension lexicale de l'quivalence syntaxique) qu'il nous parat fcond d'orienter les recherches. Si nous revenons dsormais aux problmes concrets soulevs par l'interprtation des domaines smantiques produits par l'analyse AAD, nous pouvons dire, la lueur de ce qui prcde, que le problme le plus urgent est celui des critres permettant de reprer les orientations entre commutables : on sait que le principe de ce reprage consiste dans la recherche de constructions reliant les commutables par une syntagmat isation en quelque sorte perpendiculaire l'axe des squences en commut ation; il est d'ailleurs noter que ces constructions peuvent recouvrir aussi bien des enchanements temporels de type narratif que des relations logiques, telle que la dductibilit. Il reste que la ralisation concrte de ce reprage se heurte l'obstacle des frontires du corpus : rien ne prouve, et toutes les recherches sur la prsupposition semblent bien prouver le contraire, que le type d'information que nous cherchons ainsi reprer soit discursivement homogne la zone dans laquelle s'tablissent les commut ations. Cette question nous reconduit ainsi un problme thorique, qui est celui du rapport d'un processus discursif avec l'inter-discours , 75

c'est--dire l'ensemble des autres processus qui interviennent sur lui pour le constituer (en lui fournissant ses prconstruits x) et pour l'orienter (en jouant par rapport lui le rle de discours transverse, ou, comme nous disions l'instant, perpendiculaire). Cette question renvoie directement, on le voit, la problmatique des deux oublis que nous avions prsente en commenant ce travail : on voit en effet que ce que nous avons dsign comme oubli n 2 , analogiquement rfr au PCS-CS, et qui concerne le point d'articulation de la linguistique et de la thorie du discours, correspond avant tout au fonctionnement des paraphrases syntaxiques et des synonymies linguistiquement natur elles , c'est--dire dont l'orientation a t l'objet d'un effacement. Tout le systme de l'auto-paraphrase qui conduit tout discours s'expliciter en sparant ce qui pourrait tre dit de ce qui est consciemment rejet, c'est--dire, en grande partie, la prsence de l'autre, avec un a, dans le discours du locuteur renvoie donc aux transformations-substitutions de type 1) et 3). Quant la relation de type 2), il n'est pas exclu qu'elle renvoie en partie, elle aussi, l' oubli n 2 , dans l'exacte mesure o le locuteur lui-mme est capable de convoquer les processus discursifs permettant d'orienter les substitutions. En dfinitive donc, ce que nous avons appel l' oubli n 1 se caractriserait par V inaccessibilit pour le locuteur-sujet des processus constituant les discours transverses et les prconstruits de son propre discours, autrement dit, ce que dsigne l'expression dj introduite (cf. p. 21) de discours de l'Autre (avec un A) 2. Dans ces conditions, on 1. Sur ces points voir le travail de P. Henry (1974) et Pcheux (1975). 2. Les actes du sujet parlant , dans une situation et en prsence d' inter locuteurs donns c'est--dire l'illusion subjective que certaines thories de renonc iation prennent, on l'a vu, pour argent comptant sont donc en ralit l'effet de rap ports entre processus discursifs. En particulier, le fait que telle squence (phonique ou graphique) matriellement spcifie et non pas telle autre soit chaque instant filtre , slectionne , n'est nullement le rsultat d'un choix du locuteur, mais traduit l'intervention, dans une formation discursive donne (avec ses fonctionnements paraphrastiques propres), d'autres formations qui ingalisent les uns par rapport aux autres les lments entrant en jeu dans ces fonctionnements, et donc les ordonnent de telle sorte que l'un d'entre eux reoive chaque instant le privilge d'apparatre comme le mot, l'expression etc.. justes . Dans le domaine de ce qu'il est convenu d'appeler la littrature, ce privilge prend la forme de l'vidente impossibilit de paraphraser le texte gnial (c'est--dire on ne pouvait pas le dire autrement ). Ce point, que nous ne pouvons ici qu'esquisser, nous semble de nature renverser la problmatique du sens propre conu comme un lien naturel entre le langage et la pense , et, par voie de consquence, remettre en cause les thories littraires du style conu comme cart : ce qu'on dsigne habituellement comme le caractre unique de la squence littraire (l'irremplaabilit des mots, expressions et tournures), o l'on croit souvent discerner la volont, plus ou moins gniale dans son unicit, d'un cart tenu (c'est-dire prolong, comme on parle d'une note tenue) serait, dans ces conditions, le produit surdtermin du rapport contradictoire et ingal entre des formations discursives : la matrialit phonologique et morpho-syntaxique de la squence (le Signifiant) serait ds lors dtermine comme unique parmi les multiplicits paraphrastiques qui en sup portent le sens , de la mme manire que l'existence d'un jeu de mots impose dans sa littralit telle formulation (et non telle ou telle paraphrase logiquement quivalente) pour que le compromis entre deux formations discursives soit maintenu, c'est--dire pour que soit ralis ce que nous dsignons ici comme une surdtermination. 76

peut aisment faire l'hypothse que les domaines smantiques actuellement identifis par la procdure AAD ne sont pas homognes eu gard la distinc tion entre les deux oublis ; la question reste par ailleurs ouverte de savoir si cette mixit n'est pas redouble par une autre htrognit, due la non-dissociation de processus combins. Toutefois, en l'tat actuel des sorties, la comparaison dans un plan de traitement de rsultats issus de corpus diffrents devrait ne pas tre effectue de la mme manire selon que la diffrence entre les corpus relve de manire dominante soit de la zone d'oubli n 1, soit au contraire de la zone d'oubli n 2. Finalement, la question des critres permettant de reprer l'autonomie d'un processus, et les frontires de cette autonomie, reste elle aussi nonrsolue : tant que cette question n'aura pas trouv sa solution, l'incertitude subsistera sur le rapport possible entre substitutions orientes et combinaison de processus ; nous n'abandonnons en effet pas l'ide selon laquelle l'orien tation serait concevoir comme l'effet de l'articulation entre processus diffrents, avec des rapports d'effacement, de subordination et d'asser vissement : dans cette dernire hypothse, l'autonomie d'un processus se marquerait bien, en dfinitive, par l'existence de familles inter-paraphrastiques o toute orientation est efface et la nature des rsultats actuellement obtenus proviendrait du fait que nous ne sommes pas encore parvenus isoler un processus ; dans ces conditions, on pourrait penser obtenir ce rsultat en augmentant, peut-tre assez considrablement, la dimension du corpus (qui serait actuellement en dessous de la masse critique ), et en levant la borne P alpha, qui fixe la proximit minimum retenue entre les squences compares. Nous reviendrons pour terminer sur le problme du rapport entre smantique et syntaxe, qui est en ralit le fond mme de tout le dbat critique dont nous avons retrac les axes principaux : il semble que l'on puisse actuellement formuler trois hypothses sur cette question. A) N'appartient la linguistique que le domaine des faits de syntaxe (en prolongement de la phonologie et de la morphologie), qui renvoie des fonctionnements calculables ; la smantique au contraire relve du domaine subjectif du sens. Cette hypothse repose l'origine sur un postulat d'indpendance de la syntaxe par rapport la smantique, elle s'inscrit dans la ligne du structuralisme qui vise caractriser un systme de formes. Cette solution a t adopte la fois par le behaviourisme et par les thori ciens du distributionnalisme et du fonctionnalisme. C'est galement le point de vue qui fut adopt initialement par Chomsky dans Structures syntaxiques. B) La smantique appartient tout entire au champ de la linguistique. Cette seconde hypothse est, paradoxalement, hritire de la premire. L'tude de la smantique apparat comme prolongement naturel des faits 77

de syntaxe, elle vise les expliquer (les mthodes distributionnalistes ayant montr leurs limites). C'est l, entre autres, la position de Chomsky dans Aspects, o la composante smantique vient interprter la syntaxe. Il est remarquer que l'intgration de la smantique dans ce modle du langage se fait partir d'un postulat en grande partie implicite selon lequel le sens est un fait de langue ; du point de vue mthodologique, la procdure d'ana lyse smantique des units est comparable celle utilise par la phonologie (dcomposition en traits, cf. Katz et Fodor). Cette solution repose sur une thorie qui est la fois une thorie de la connaissance et une psychologie du sujet humain une construction du monde rfr un sujet neutre et idal. Malgr le ton polmique qu'a revtu la discussion entre Chomsky et les tenants de la smantique generative, ce second courant s'apparente lui aussi l'hypothse B) prsente ici : en dernier ressort, tout ce qui est smantique relve d'une tude linguistique, mme si, contrairement Chomsky, la smantique n'est pas dissocie de la syntaxe (cf. les struc tures sous-jacentes logico-smantico-syntaxiques ) et si certains des phnomnes smantiques (par exemple les prsupposs ) sont traits dans le cadre d'une thorie des mondes qui vise faire clater l'unicit du sujet. Pourtant ces sujets sont encore des sujets neutres, sources du sens, et non rfrs des dterminations objectives ; c'est pourquoi la smantique generative peut tre considre comme un pas de plus dans la voie de la confusion entre idologie, discours et langage. C) Seule une partie des faits smantiques relve d'une tude linguistique. Cette troisime hypothse peut donner naissance deux types de solutions mutuellement exclusives (le terme d' nonciation auquel elles se rfrent toutes deux pouvant de ce point de vue prter confusion) : Cl) La solution de Benveniste qui, l'intrieur du processus de signification, distingue le sens et la rfrence (ou dsignation ). L'interprtation la plus immdiate de cette distinction consiste y voir une opposition entre une smantique linguistique et une smantique extra linguistique. Tel semble tre le cas, tant que l'on en reste l'tude de la langue conue comme systme structur et hirarchis de signes : le sens d'une unit est le fait qu'elle a un sens (...) ce qui quivaut l'identifier par sa capacit remplir une fonction propositionnelle (Problmes, p. 127) ; ceci relve d'une analyse linguistique. Au contraire, la rfrence du signe renvoie au monde des objets gnraux ou particuliers, pris dans l'exprience ou forgs par la communaut linguistique {ibidem, p. 128). Mais, pour Benveniste, la langue n'est pas seulement un systme de signes, c'est aussi un instrument de communication, dont l'expression est le discours (ibidem, p. 130). Systme de signes et discours constituent deux univers diffrents, bien qu'ils embrassent la mme ralit, et ils donnent lieu deux linguistiques diffrentes (ibidem, p. 130). L'articula tion de ces deux linguistiques s'opre au niveau de la phrase, et l, l'tude 78

de la rfrence se trouve rintroduite dans le champ de la linguistique ; en effet, le sens de la phrase (sa fonction de prdicat) se dcrit en analysant les relations entre les signes qui la composent, la rfrence de la phrase (c.--d. des situations concrtes eempiriques (ibidem, p. 128) relve de la linguistique discursive (thorie de renonciation). Cette deuxime direc tion ouvre la voie l'ide de discours-parole en tant que lieu de la cration individuelle : ainsi les modalits de phrase traduisent pour Benveniste trois fonctions interhumaines caractristiques du discours, chacune correspondant une attitude du locuteur , savoir transmettre un lment de connaissance, demander une information, intimer un ordre (ibidem, p. 130). La caractristique de cette solution rside, selon nous, en ce qu'elle ne peut chapper la dualit idologique joignant systme (de signes) et crativit (individuelle) : le discours n'y est pas autre chose qu'un nouvel avatar de la parole . C2) La solution selon laquelle la frontire entre le linguistique et le non-linguistique se situe l'intrieur des phnomnes smantiques, prci sment l o s'opposent une smantique formelle et une smantique dis cursive. Nous retrouvons bien l' nonciation , mais dfinie cette fois comme la thorie de l'illusion subjective de la parole (thorie du corps verbal ), et non comme sa rptition. Tout ce qui prcde montre l'v idence que nous avons constamment tent de nous placer dans ce cadre (hypothse C2), ce qui ne signifie pas, bien entendu, que les diffrents aspects de la procdure AAD ne puissent pas, prcisment, faire l'objet de critiques de ce point de vue. Sans doute peut-on constater que des phnomnes comme la nominalisation, le vidage des DET ou du SN, le prconstruit , etc.. sont d'ores et dj identifis au niveau des rsultats *, il reste cependant que

1. Nous donnons ci-dessous quelques exemples tirs de l'tude sur S. Mansholt ( paratre) de phnomnes linguistiques reprables dans les rsultats actuellement obtenus par l'AAD. PRCONSTRUITS : minimum vital dveloppement culturel rpartition des biens panouissement des hommes MODALITS il faudra... /l'action de l'tat devra... INSTANCIATION VIDAGE donner X assurer un minimum vital l'tat assure recul du bien-tre de chacun l'individu (suite de la note page suivante). 79

toutes les critiques que nous avons rappeles ou formules l'gard des modalits actuelles de l'analyse morpho-syntaxique restent valables et appellent de profonds changements. Nous voudrions, sur ce point, poser pour finir la question mme du rapport entre les phases 2 ( linguistique ) et 3 (comparative-discursive) ; ne peut-on concevoir que, au lieu de se juxtaposer squentiellement, ces deux phases se co-dterminent, de sorte qu'il y aurait un effet en retour de la phase 3 sur la phase d'analyse syntaxique ; rien n'interdit de penser la ralisation d'une lecture plusieurs niveaux qui, partant d'un systme morpho-syntaxique minimum, rintgre rait ensuite progressivement les informations smantiques repres la suite de cette premire lecture et de ses effets au niveau de la phase 2. On peut penser, en particulier, que les rsultats intermdiaires obtenus concernant les relations de synonymie, de paraphrase syntaxique et de syntagmatisation entre commutables puissent tre r-investis dans une analyse morpho-syntaxique de niveau plus lev, spcialement sur la dtermination des phnomnes d'inter-phrase, lis la fois l'identification des centres syntaxiques (cf. p. 54), et celle des relations de syntagmat isation. C'est dans cette direction que nous comptons, long terme, engager les recherches concernant l'articulation entre linguistique et thorie du discours. DTERMINANTS On espre une / la stabilisation Les Etats/l'tat NOM INAL ISATIONS l'humanit connat un risque de nous manquons pnurie restriction limitation rpartition problme manque de matires premires biens

de biens de consommation

80