You are on page 1of 43

Collge de France Chaire Internationale

Vers une linguistique Sens-Texte


LEON INAUGURALE par M. Igor Mel'c]uk Professeur Monsieur l'Administrateur, Mesdames et Messieurs les Professeurs, Chers amis, J'aimerais d'abord remercier tous les collgues auxquels je dois ce moment tellement prcieux pour moi : vous parler de mon travail plutt de mon amour, de l'amour de ma vie, c'est-dire de la linguistique, laquelle j'ai consacr quarante ans de mon existence. Hlas, ces collgues sont trop nombreux pour que je puisse les nommer un un. Qu'il me soit donc permis de mentionner tout d'abord les deux idoles de ma jeunesse, les deux gants de la linguistique franaise : mile Benveniste et Lucien Tesnire, dont l'uvre linguistique m'a profondment marqu. Ensuite, j'indiquerai Yves Gentilhomme : son amiti m'a servi d'appui pendant toutes ces annes. Et last but not least, je m'adresserai mes deux collgues du Collge de France, MM. Claude Hagge et Jean-Marie Zemb, grce auxquels je suis ici. Quant aux autres, mes matres en linguistique (A.Reformatskij et A.Xolodovic], avant tout) ainsi que mes compagnons de randonnes travers la jungle de la Langue (A.Zholkovsky, Ju.Apresjan, L.Iordanskaja, N.Pertsov, A.Clas, A.Polgure, ...), qu'ils reoivent ici l'expression de ma gratitude la plus chaleureuse. Et maintenant, au travail ! Je procderai en cinq tapes. 1) Tout d'abord, la mthodologie qui se trouve au cur de mon approche de l'tude des langues naturelles sera expose. Cette mthodologie consiste en la construction de MODLES FONCTIONNELS des langues. L'ide sous-jacente en est trs simple : La langue est considre comme un mcanisme, ou un systme de rgles, qui permet au locuteur de faire deux choses : 1) PARLER, c'est--dire, (tre capable de) faire correspondre un sens qu'il veut exprimer tous les textes de sa langue qui, d'aprs lui, peuvent vhiculer ce sens et choisir celui qui passe le mieux dans les circonstances concrtes d'un acte langagier donn ; 2) COMPRENDRE LA PAROLE, c'est--dire, (tre capable de) faire correspondre un texte qu'il peroit tous les sens que, d'aprs lui, ce texte peut vhiculer et choisir celui qui passe le mieux dans les circonstances concrtes d'un acte langagier donn. Notre tche en tant que linguistes est donc de construire, pour la langue tudie L , un systme de rgles quelque chose comme un programme informatique qui dfinisse les mmes correspondances entre sens et textes que celles qu'tablissent les locuteurs. De tels systmes de rgles

2 forment ce que nous appellerons des modles Sens-Texte, ou MST. Je parlerai donc d'abord de la modlisation Sens-Texte en linguistique. 2) Dans un deuxime temps, j'esquisserai un MODLE SENS-TEXTE PARTICULIER, sur lequel je travaille depuis plus de 30 ans. Je donnerai des exemples de reprsentations linguistiques d'noncs tous les niveaux considrs, ainsi que des exemples de rgles pour chacune des composantes du modle. 3) Aprs cela, j'examinerai quelques LIENS entre PHNOMNES SMANTIQUES HYPOTHTIQUES et PHNOMNES COOCCURRENCIELS OBSERVABLES (en franais), pour tayer ainsi la modlisation propose. En particulier, je m'arrterai sur le concept de fonction lexicale : un formalisme labor en vue de la description systmatique de la combinatoire lexicale. 4) Ensuite, je caractriserai une branche de la linguistique qui dcoule naturellement de la modlisation fonctionnelle des langues la LINGUISTIQUE SENS-TEXTE. J'indiquerai les grandes lignes de recherche existant dans ce cadre, ainsi que certains des rsultats obtenus ; ce faisant, je dvelopperai tout particulirement la question du mtalangage de la linguistique. 5) Pour finir, je parlerai brivement de la place que la linguistique Sens-Texte est appele prendre dans la vie de la socit humaine. Mon expos se divisera donc en cinq sections. 1. La modlisation fonctionnelle comme principe central en recherche linguistique 1.1. Les modles dans la science Le concept de modle joue un rle crucial dans toutes les sciences. Les chercheurs qui, pour une raison ou une autre, ne sont pas en mesure d'observer la structure interne de l'objet ou du phnomne P qu'ils tudient ont habituellement recours des modles : ils construisent des modles de P qu'ils tudient ensuite. De mme, lorsque P est trop compliqu ou que les donnes son sujet sont trop riches ou incohrentes, on construit un modle approximatif de P , qui permet d'en faire une tude approfondie. Et cela aussi bien en cosmogonie qu'en gophysique, en biologie molculaire qu'en chimie, en neurologie ou en sociologie. En exagrant un peu, je pourrais dire que la science, c'est la construction de modles. Dans toutes les situations o une observation directe des faits est impossible, on est contraint de construire un modle de ces faits ce qui est le cas depuis Galile. Il n'y a pas de savant qui ne pense continuellement par modles mme s'il ne l'avoue ni aux autres ni lui-mme (Auger 1965: 4). La linguistique est dans la mme situation que toute autre science de la nature. En effet, la langue, qui est un systme de rgles fort complexes, encodes on ne sait comment dans le cerveau des locuteurs, est inaccessible l'observation directe des linguistes purs1 : nous ne pouvons ouvrir les crnes, ni les pntrer avec des lectrodes pour observer la langue telle qu'elle est stocke dans le cerveau. Nous n'avons pour solution que de recourir des modles des langues. La linguistique moderne est donc une science qui doit se donner comme tche principale la construction de modles de langues particulires et de la Langue humaine en gnral ; mme si c'est rarement dit explicitement, c'est ce qui se fait. N.Chomsky, avec sa thorie gnrative-transformationnelle, a, vers la fin des annes 50, solidement implant la modlisation en science du langage. On ne manque pas non plus de thorisation de la notion mme de modles linguistiques ; on trouvait dj dans Nagel et al. 1962

3 quelques articles qui en discutaient de faon trs prcise. Citons aussi J.Molino (1985: 29) : La morphologie comme les autres domaines linguistiques et comme le langage en gnral ne peut tre dcrite que par des modles. On est donc en droit de considrer comme acquis en linguistique l'usage extensif de modles. La question se pose de savoir quel type de modles la linguistique doit de prfrence utiliser. J'essayerai d'baucher ici une rponse possible. 1.2. Les modles fonctionnels Dbarrassons-nous tout d'abord de l'ambigut du mot modle . Considrons les expressions suivantes : un modle dont on peint un portrait un modle d'avion (en papier) le modle d'atome de Bohr-Rutherford. Elles ont en commun de faire rfrence un mme tat de choses : deux entits, X et Y (le portrait reprsentant quelqu'un, un jouet en papier ressemblant un avion, les quations dcrivant l'atome), dont l'une, X, est intentionnellement cre par l'Homme de 2 faon possder certaines caractristiques de l'autre, Y . Il s'agit donc d'une relation binaire antisymtrique (tre un modle de ...), qui appelle trois remarques : Premirement, dans un modle dont on peint un portrait, on appelle modle l'entit donne, alors que la reprsentation de cette entit cre par l'homme s'appelle portrait ; dans un modle d'avion ou le modle d'atome de Bohr-Rutherford, la relation est converse : l'entit donne, l'avion/ l'atome, n'a pas de nom spcial, alors que la reprsentation de cette entit s'appelle modle3. Je retiendrai seulement les emplois du deuxime type, rservant donc le terme de modle une ENTIT CRE dans le but de reprsenter l'entit tudie. Deuximement, l'expression un modle d'avion dsigne un objet physique, alors que le modle d'atome de Bohr-Rutherford n'est pas un objet physique, mais un systme d'expressions symboliques (= d'quations). Le terme modle ne sera utilis dans la suite de mon expos que dans ce dernier sens, pour dsigner un SYSTME ABSTRAIT D'EXPRESSIONS SYMBOLIQUES. Troisimement, un modle d'avion ressemble un avion, mme si ce modle ne peut pas voler : c'est un modle structural. Le modle d'atome de Bohr-Rutherford, par contre, ne ressemble en rien un atome ; en toute logique, il ne peut mme pas y prtendre : c'est un modle FONCTIONNEL. Il est appel reprsenter le comportement, ou le fonctionnement, de l'atome (d'o son nom de modle fonctionnel). Je peux maintenant fixer le sens dans lequel j'utiliserai dornavant le terme modle : Modle fonctionnel X est un modle (fonctionnel) de Y : X est un systme d'expressions symboliques cr par le chercheur dans le but de reprsenter le fonctionnement de l'entit donne Y qu'il tudie. Dans ce qui suit, il ne sera question que des modles fonctionnels conformes la dfinition ci-dessus4. Bien entendu, un modle fonctionnel n'est pertinent que si c'est le FONCTIONNEMENT de l'objet modlis qui nous intresse, comme c'en est le cas pour la langue. Les modles fonctionnels sont donc particulirement adapts l'tude linguistique. Avant d'aller plus loin, signalons deux proprits importantes des modles fonctionnels :

4 1) Un modle fonctionnel permet de modliser une BOTE NOIRE, c'est--dire un objet manifestant un certain comportement observable, mais qu'on ne peut ouvrir pour en observer et tudier la structure interne. 2) Un modle fonctionnel ne garantit pas la vrit de la description obtenue, mais une simple APPROXIMATION de la vrit : avec un modle fonctionnel, en n'observant que les effets, nous en dduisons les causes ; or on sait que le mme effet peut avoir une infinit de causes. Une chose est sre : plus nous tudions l'objet modlis c'est--dire plus nous recensons et prenons en charge de ses comportements , plus nous nous approchons de la ralit. Cependant, le linguiste qui accepte de travailler avec des modles fonctionnels doit se rappeler constamment qu'un seul contreexemple bien choisi suffit compromettre le modle qu'il propose (= dmontrer son inadquation) ; un modle fonctionnel est donc facilement falsifiable (au sens de Popper) et, pour cette raison, il peut tre considr comme un instrument scientifique de valeur. Par contre, rien ne peut prouver la validit d'un modle fonctionnel. Son caractre hypothtique lui est inhrent ; c'est une ralit que le linguiste doit humblement accepter. 1.3. Le modle Sens-Texte : un modle fonctionnel global de la langue C'est dans le sens de la dfinition ci-dessus que j'ai amorc, il y a trente ans, avec quelques collgues de Moscou (principalement, Alexandre Zholkovsky et Jurij Apresjan), l'laboration d'un modle fonctionnel global de la langue naturelle : le Modle Sens-Texte [= MST] (Z}olkovskij & Mel'c]uk 1967, Mel'c]uk 1973, 1974, 1981, 1988, 1992a). Je commencerai par baucher la thorie linguistique sous-jacente au MST, c'est--dire la Thorie Sens-Texte. Pour faciliter l'expos, les abbrviations suivantes seront utilises : DEC : Dictionnaire Explicatif -Phon : phonique et Combinatoire R: reprsentation FL : fonction lexicale S: structure -Morph : morphologique -S : de surface MST : Modle Sens-Texte -Sm : smantique -P : profond -Synt : syntaxique De plus, L rfrera une lexie donne, et L, une langue donne. La premire mention d'un terme technique sera imprime en italique gras. La thorie Sens-Texte est base sur trois postulats, de nature plutt htrogne. Le premier vise l'OBJET DE L'TUDE de la thorie ; il exprime ma conception gnrale de ce qui est la langue. Le deuxime vise le RSULTAT ESCOMPT DE L'TUDE ; il exprime ma conception de ce que devrait tre la recherche et la description linguistique. Quant au troisime, il vise le LIEN entre LA LANGUE et SA DESCRIPTION ; il expose certains traits fondamentaux de la langue qu'il est essentiel de reflter directement dans la description. Postulat 1 : La langue comme correspondance Sens-Texte La langue est un systme fini de rgles qui spcifie une CORRESPONDANCE multi-multivoque entre l'ensemble infini dnombrable de sens et un ensemble infini dnombrable de textes.

5 Posons que les sens apparaissent, dans un MST, sous forme d'objets symboliques formels appels Reprsentations Smantiques [= RSm], et les textes sous forme d'objets symboliques formels appels Reprsentations Phoniques [= RPhon]. Alors le Postulat 1 peut s'crire comme suit : (1) {RSmi} langue;<==>; {RPhonj} | 0 < i, j Le Postulat 1 prsuppose le CARACTRE DISCRET de nos reprsentations et, par consquent, de notre modle. Je n'ai aucun argument pour justifier le choix que j'ai fait de ce type de modles linguistiques. Comme on le sait, les scientifiques cherchent, de plus en plus, construire des modles linguistiques continus, ou analogiques ; je pense cependant qu'il est essentiel de continuer l'laboration de modles discrets, sans pour autant leur donner un caractre exclusif. Il semble que leur potentiel cognitif soit loin d'tre puis et qu'au moins leur utilit pratique par exemple, dans l'enseignement des langues et dans le traitement automatique des textes justifie l'approche discrte. Prcisons que la RPhon est crite en utilisant une transcription phontique quelconque ; ce type de transcription est trop connu pour tre discut ici. La RSm, quant elle, est crite en utilisant une transcription smantique ; cette transcription est spcifique chaque langue et doit encore tre elabore ; j'en dirai quelques mots plus loin. L'ensemble des RSmi bien formes peut tre spcifi par une grammaire formelle, de sorte que cet ensemble peut servir d'entre un modle formel. Postulat 2 : Les modles Sens-Texte comme outil de description des langues La correspondance (1) doit tre dcrite par un DISPOSITIF LOGIQUE, qui constitue un modle fonctionnel de la langue de type Sens-Texte ; il doit tre labor et prsent dans la direction Sens => Texte. Un modle Sens-Texte reoit, l'entre, des RSmi et produit des RPhonj la sortie ; il doit le faire d'une faon qui soit la plus proche possible de celle des locuteurs, c'est--dire que le modle doit reproduire au mieux la correspondance entre le sens qu'un locuteur veut exprimer et le texte qui, d'aprs lui, vhicule ce sens. D'un point de vue formel, le passage Sens => Texte et le passage Texte => Sens sont quivalents. Mais du point de vue de l'laboration du modle par des linguistes et de sa prsentation, ce n'est pas du tout le cas.En consquence, un MST sera organis PARTIR DU SENS VERS LE
TEXTE

(ce qu'indique bien son appellation), c'est--dire dans le sens de la synthse , ou de la production de la parole plutt que dans le sens oppos, celui de l'analyse, ou de la comprhension de la parole. Autrement dit, le MST suit le parcours onomasiologique, modlisant avant tout l'activit langagire du LOCUTEUR, considre comme plus linguistique que celle du destinataire. Construire un texte pour un sens donn prsuppose essentiellement l'exercice de connaissances purement linguistiques, alors que l'extraction du sens d'un texte donn exige, dans une bien plus grande proportion, une connaissance du monde assez pousse et des capacits logiques. On peut citer beaucoup d'exemples confirmant le fait que la langue elle-mme donne une priorit absolue au locuteur : par exemple, on parle de locuteurs natifs, pas de *destinataires natifs ;

6 l'expression parler franais est idiomatique (franais utilis en tant qu'adverbe sans article; cf. *lire franais), alors que l'expression comprendre le franais est libre ; la langue est gocentrique en ce sens que beaucoup de signes linguistiques encodent le point de vue de (moi) (= de celui qui parle), comme par exemple les dictiques ; toutes les langues ont un verbe spcial pour le sens (produire, partir du sens, du texte acoustique dans une langue) : parler, mais aucune n'a de verbe spcial pour exprimer le sens inverse (extraire du sens partir du texte acoustique d'une langue) : on dit comprendre , ce qui s'applique n'importe quelle comprhension. Je ne vais cependant pas justifier cette vision de la langue et, en consquence, de la linguistique : je la postule. Postulat 3 : La phrase et le mot comme units de base de la description linguistique Dans la description de la correspondance (1), deux NIVEAUX INTERMDIAIRES de reprsentation des noncs sont ncessaires pour mettre en lumire les faits linguistiques pertinents : la reprsentation SYNTAXIQUE [= RSynt], qui correspond aux rgularits spcifiques la PHRASE, et la reprsentation MORPHOLOGIQUE [= RMorph], qui correspond aux rgularits spcifiques au MOT. La phrase et le mot (plus prcisment mot-forme au sens de Mel'c]uk 1993-97, v. 1: 187 ssq.) sont, respectivement, l'unit maximale et l'unit minimale de la parole, units autonomes et universelles ; les lois de la langue se limitent la phrase, et les signes plus petits que le mot ne sont pas perus par les locuteurs. C'est dans le cadre de la phrase qu'on doit s'occuper de l'ordre des mots, de l'accord et du rgime, de la structuration communicative, de la cooccurrence lexicale restreinte, etc., alors que dans le mot, on fait face la flexion et la drivation, ainsi qu'aux alternances phonmiques. C'est pour capter ces caractristiques de la phrase et du mot que le MST postule les deux niveaux intermdiaires entre sens et textes. L'introduction de ces niveaux le niveau syntaxique et le niveau morphologique semble d'autant plus justifie qu'elle correspond une tradition respecte pratiquement par toutes les coles de pense linguistiques. Il rsulte des postulats 1-3 qu'un MST est un dispositif logique, ou un ensemble de rgles, ayant la structure suivante : (2)

STRUCTURE GNRALE D'UN MODLE SENS-TEXTE

{RSmi} \a(smantique;<==> ; ) {RSyntk} \a(syntaxe;<==> ; ){RMorphl} morphologie + ; phonologie ; < = = > ; ; {RPhonj} Les noms des composantes majeures, ou modules, du MST sont imprims en gras. Un MST possde trois particularits importantes. 1) Un MST est purement QUATIF, ou TRADUCTIF ; la diffrence de beaucoup de ses contemporains, ce n'est pas un modle gnratif. Il ne gnre rien (comprenant le terme gnrer au sens strictement mathmatique, c'est--dire, (spcifier un ensemble de ...), ce que font les grammaires gnratives) ; mais il fait correspondre chaque RSm toutes les RPhon qui peuvent l'exprimer dans une langue donne ; c'est pourquoi il est qualifi d'quatif. Plus prcisment, un MST met en rapport des reprsentations linguistiques des niveaux adjacents : il prend une reprsentation du niveau n tout comme on prend une recette de cuisine pour faire un gteau ou un plan pour construire une

7 maison et il lui associe toutes les reprsentations correspondantes du niveau n+1, qui sont ainsi produites sous le contrle de la reprsentation de dpart, sans que celle-ci soit modifie ; de plus, il fait la slection de la meilleure reprsentation du niveau n +1. Un MST n'est donc pas un modle transformationnel non plus, puisque les reprsentations manipules ne subissent pas de changement. Un MST essaie de se comporter comme un locuteur, qui ne passe son temps ni gnrer des ensembles des phrases grammaticalement correctes ou distinguer entre les phrases correctes et incorrectes, ni transformer des structures abstraites ; un locuteur parle, c'est--dire qu'il exprime, au moyen de textes, les sens qu'il veut communiquer. Un MST doit faire la mme chose : traduire un sens donn en un texte qui l'exprime (voil pourquoi ce modle est qualifi de traductif). 2) Un MST est bas sur le PARAPHRASAGE, c'est--dire sur la synonymie des noncs. En effet, la comptence linguistique du locuteur consiste, avant tout, en sa capacit de produire, pour un sens de dpart (), tous les textes qui peuvent l'exprimer (= toutes les paraphrases possibles) et de choisir le ou les textes les mieux adapts une situation ou un contexte donns. 3) Un MST est GLOBAL ET INTGRAL : il tend prsenter la langue comme un tout indivisible plutt qu' dcrire juste un fragment isol de celle-ci (comme, par exemple, sa smantique ou sa morphologie). Toutes les composantes du MST son lexique et toutes les parties de sa grammaire doivent tre bien accordes, puisqu'elles sont destines collaborer troitement au cours du processus de synthse des textes. Voil donc les grandes lignes selon lesquelles doivent se construire les modles linguistiques de type Sens-Texte. 2. bauche d'un modle Sens-Texte particulier Pour illustrer mon propos, je vais maintenant prsenter un MST particulier celui qui fait l'objet de mes recherches depuis 30 ans. Je commencerai par introduire la distinction des sousniveaux profonds et de surface au sein des niveaux de la reprsentation linguistique, pour donner ensuite des exemples des reprsentations pertinentes tous les niveaux ; aprs quoi nous verrons des exemples des rgles de chaque composante du modle. De cette faon, j'illustrerai les tapes qui conduisent, en partant d'un sens donn, c'est--dire d'une entre possible pour un MST du franais, un des textes correspondants, c'est--dire une des sorties possibles du mme MST. tant donn le caractre de mon expos, je limite mes rfrences aux travaux raliss dans le cadre du MST. 2.1. Sous-niveaux profond et de surface Tous les niveaux de reprsentation linguistique des noncs, sauf le niveau smantique, sont subdiviss en un sous-niveau profond [= -P] et un sous-niveau de surface [= -S]. Le sous-niveau profond est orient vers le sens : sa tche est d'exprimer explicitement toutes les distinctions smantiques pertinentes son niveau. Le sous-niveau de surface est orient vers le texte : sa tche est d'exprimer explicitement toutes les distinctions formelles pertinentes son niveau. (Je ne peux pas m'tendre davantage sur les diffrences entre sous-niveau profond et sous-niveau de surface, si importantes soient-elles ; je ferai quelques remarques ce propos dans mes illustrations.) Du fait de l'introduction de la dichotomie profond vs de surface, nous obtenons un ensemble de sept reprsentations linguistiques pour un nonc donn, de sorte que la structure dtaille du MST particulier dont il est question ici peut s'crire de la faon suivante :

8 (3)

STRUCTURE DTAILLE DU MODLE SENS-TEXTE CONSIDR

{RSm i} \a(smantique;<==> ; ){RSyntPk1}\a(syntaxe profonde;<====> ; ){RSyntSk2}\a(syntaxe de surface;<====> ; ){RMorphP } l1 \a(morphologie


profonde;

<====> ; ){RMorphSl2} \a(morphologie de surface; <====> ; ){RPhonP j1} phonologie; <==> ; {RPhonS j2}

[La RPhonP est une reprsentation PHONMIQUE : elle reflte les distinctions phoniques charge smantique ; une RPhonS est une reprsentation PHONTIQUE : elle reflte les distinctions phoniques pertinentes pour la production des sons rels.] La figure ci-dessous prsente l'agencement des toutes les composantes du modle SensTexte vis--vis des niveaux de reprsentation des noncs sous une forme lgrement diffrente qu'en (3) : la verticale, c'est--dire, partir du niveau le plus bas, ou le plus profond le niveau smantique et en remontant vers le niveau le plus haut, ou le plus superficiel le niveau phontique : NIVEAUX DE REPRSENTATION LINGUISTIQUE RPhonS [= TEXTES] Phonologie RPhonP
PARLER = SYNTHSE

COMPOSANTES DU MODLE SENS-TEXTE


COMPRENDRE LA PAROLE = ANALYSE

Morphologie de surfac RMorphS Morphologie profond RMorphP Syntaxe de surfac RSyntS Syntaxe profonde RSyntP Smantique RSm [= SENS]

Comme on le voit, le MST est constitu de six composantes, qui mise de ct la distinction des sous-niveaux profond et de surface correspondent aux divisions reconnues de la linguistique moderne (la smantique, la syntaxe, la morphologie et la phonologie). Soulignons que le nom de chaque composante est dtermin par sa reprsentation de dpart : ainsi, la SMANTIQUE part d'une reprsentation SMANTIQUE RSm pour construire toutes les RSyntPk1 qui vhiculent le mme sens (c'est--dire le sens exprim par cette RSm) ; la SYNTAXE PROFONDE part d'une reprsentation

9
SYNTAXIQUE PROFONDE RSyntP et fournit toutes les RSyntSk2 qui peuvent raliser cette RSyntP de

dpart ; et ainsi de suite. 2.2. Reprsentations linguistiques dans le Modle Sens-Texte Chaque reprsentation utilise par le MST est constitue de plusieurs objets formels appels structures. Ainsi, une RSm comprend trois structures : Une structure smantique, qui reflte le sens propositionnel, ou objectif, de l'nonc reprsent ; elle constitue le noyau de la RSm, ou sa structure de base, les deux autres structures lui tant superposes et la prcisant. Une structure smantico-communicative, qui reflte le sens communicatif, ou subjectif, de l'nonc. C'est, de faon mtaphorique, l'itinraire que le locuteur suit travers la structure smantique lorsqu'il la balaie en la ralisant. La structure smantico-communicative exprime les oppositions comme thme vs rhme, donn vs nouveau, emphatis vs neutre, etc. Une structure rhtorique, qui reflte les intentions artistiques du locuteur (l'ironie, le pathtique, les niveaux du langage diffrents, etc.). De plus, une RSm est munie d'un ancrage rfrentiel : ses nuds se voient associer des numros identifiant les rfrents extralinguistiques des units smantiques. Comme on le sait, le statut rfrentiel/non rfrentiel des units smantiques peut avoir des rpercussions sur les formes linguistiques qui les expriment (Je cherche un collgue qui SAIT programmer [l'existence d'un tel collgue est prsuppos] vs Je cherche un collgue qui SACHE programmer [l'existence d'un tel collgue n'est pas prsuppos]). Les reprsentations des autres niveaux sont organises de faon similaire, chacune comportant plusieurs structures, de sorte que le tableau vritable est assez compliqu. Pour simplifier, je n'indiquerai qu'une seule structure pour chaque reprsentation : la structure de base. Ainsi, la RSm est rduite la structure smantique SSm, les RSyntP et RSyntS aux structures syntaxiques profonde et de surface SSyntP et SSyntS, etc. Commenons par la RSm. Le noyau d'une RSm sa structure de base est, comme je viens de le dire, la structure smantique SSm d'une famille de phrases (quasi) synonymes, et c'est cette structure qui est reprsente ci-dessous. C'est un graphe connexe orient et tiquet (= un rseau) dont les NUDS sont tiquets par des noms d'units smantiques de la langue L ( sens dsambiguss des lexies de L). En l'occurrence, ce sont les acceptions des lexies franaises munies de numros lexicographiques identificateurs (emprunts, dans mes exemples, au Petit Robert). Les units smantiques sont subdivises en prdicats et noms (au sens du calcul des prdicats). Les ARCS du graphe sont donc tiquets par des numros distinctifs spcifiant les arguments du prdicat en cause.

10 (4)

Une structure smantique


(tempsB.1)
1 2 1 2

(certain I.A.3 )

(Orwell ) (maintenant 1)
1 2

(causer 1 )
2 2

(meilleur 2)

(tempsB.1 )
2 1

(engag3)

( tousB.1)
2 1 1 1

(devenir1)

(tempsB.1)

([la] politique 3)

(uvre5)

[Le soulignement de certain en haut du diagramme marque le nud communicativement dominant ; cette indication fait partie de la structure smantico-communicative, qui n'est pas reprsente en tant que telle dans mon expos.] Ce rseau peut tre lu littralement ainsi : (Orwell est certain que (le fait) qu'il est engag dans la politique cause que ses uvres deviennent meilleures). La SSm de (4) est crite dans un langage smantique (= la transcription smantique, mentionne ci-dessus). La syntaxe de ce langage est celle des rseaux, qui servent de support formel des expressions de type de formules du calcul des prdicats, les arcs indiquant des relations prdiP cat-argument. Le sous-rseau x
1 2

reprsente donc une prdication du type P(x,y). y

Le lexique de ce langage est le lexique franais dsambigus. De ce fait, la SSm du MST n'est pas universelle : elle reprsente des sens franais, tout en utilisant des moyens smantiques franais. La SSm (4) peut tre exprime par un nombre lev de phrases du franais. titre d'exemple, considrons la phrase (5) : (5) Orwell n'a pas de doute quant l'effet positif de son engagement politique sur la qualit de ses uvres. Pour obtenir cette phrase, la composante smantique du MST construit d'abord en se basant sur la RSm dont la SSm (4) fait partie une RSyntP, que je prsenterai en (6) par une seule de ses structures, savoir son noyau, la SSyntP. La structure syntaxique profonde SSyntP (d'une phrase) est un arbre de dpendance, dont les NUDS sont tiquets par des lexmes pleins : aucune servitude grammaticale, tels que les rgimes, n'est reprsente, et les pronominalisations ne sont pas effectues ; sont galement absents les marqueurs analytiques des valeurs flexionnelles. (Les lexmes doivent tre identifis par leur numros lexicographiques ; si je ne les indique pas, c'est pour ne pas surcharger la prsentation.)

11 Les indices affects aux lexmes reprsentent les valeurs flexionnelles charge smantique, c'est--dire qui ont une source immdiate dans la RSm ; ces indices sont calculs par les rgles 2 smantiques flexionnelles : cf. R dans 2.3, p. 00. Les A R C S de l'arbre SyntP (= branches) reprsentent des relations syntaxiques universelles les six relations actancielles (I, II, III, ...) ; la relation ATTR(ibutive), qui couvre tous les cas de modification ; la relation COORD(inative), qui reprsente toute sorte de coordination ; et la relation APPEND(itive) pour les lments de la phrase qui se trouvent dans un rapport vague avec son sommet (interjections, formes d'adresse, adverbes de phrase). Cet arbre n'est pas linairement ordonn (en ce sens que l'ordonnancement de ses nuds impos par une prsentation graphique n'a aucune pertinence) : l'ordre des mots est un moyen d'expression de la structure syntaxique, il ne peut donc pas en faire partie ; il n'apparat comme tel que dans la structure morphologique profonde de la phrase, donc un niveau plus prs du texte (voir (8)). (6)

Structure syntaxique profonde de la phrase (5)


Oper1 ind, prs
ATTR I II

NE ... PAS

ORWELL
II

DOUTE indt, sg

Pos 2 ENGAGEMENT df, sg


I

ATTR I

EFFETdf, sg
II

II

QUALIT df, sg
I

ORWELL

POLITIQUE df, sg
I

UVRE df, pl

ORWELL [Les symboles Oper 1 et Pos 2 dsignent des fonctions lexicales particulires ; ce sont des lments introduits afin de reprsenter la cooccurrence lexicale restreinte (plus prcisment, les collocations ; voir plus loin, 3.2 ). Les flches bidirectionnelles en pointill marquent la corfrence ; ces indications font partie de la structure anaphorique, qui est, comme je l'ai dit, une des composantes de la RSyntP, mais qui, pour la raison d'conomie d'espace, n'est pas reprsente en tant que telle dans mes exemples.]

12 On reconnatra immdiatement, dans le formalisme propos, une laboration pousse des stemmas du grand Lucien Tesnire (1959) ; c'est effectivement lui que le MST doit ses structures relationnelles de dpendance (plutt que les structures linaires de constituants et leurs drives, plus connues dans la linguistique amricaine). (7) PAS

Structure syntaxique de surface de la phrase (5)


ind, prs restrictive restrictive subjectale objectale directe

AVOIR

NE

ORWELL

DE
prpositionnell

DOUTE sg
compltive

QUANT
phrasologique prpositionnell

POSITIF

modificative compltive

dterminative

LE

EFFETsg
compltive

DE
prpositionnell

SUR
prpositionnell

ENGAGEMENTsg
dterminative

QUALIT sg
modificative

LE
dterminative

compltive

SON

DE POLITIQUE
prpositionnell

dterminative

SON

UVRE pl

[Les flches bidirectionnelles en pointill marquent, tout comme dans la SSyntP, les relations de corfrence, mais cette fois-ci, celles entre pronoms ou adjectifs pronominaux et leurs antcdents.]

13 La composante syntaxique profonde du MST prend la reprsentation syntaxique profonde laquelle la SSyntP (6) appartient comme point de dpart, et elle en drive toutes les reprsentations syntaxiques de surface RSyntS possibles, parmi lesquelles on trouve celle de la phrase (5) ; je la ferai apparatre en (7), p. 00, galement sous la forme de sa structure de base : la SSyntS. Une structure syntaxique de surface est aussi un arbre de dpendance non ordonn. Mais ici, les NUDS sont tiquets de TOUS les lexmes de la phrase, y compris tous les mots-outils et tous les lments pronominaux ; on notera, entre autres, la prsence des articles, qui, dans la structure SSyntP, sont encods par les indices flexionnels de lexmes pleins (les articles franais tant en principe des units smantiques). Les ARCS de l'arbre SyntS (= branches) reprsentent des constructions syntaxiques particulires de la langue L, dans ce cas du franais. Nanmoins, les caractristiques flexionnelles des lexmes associs aux nuds de la SSyntS restent incompltes : tout comme dans la SSyntP, ne sont reprsentes que celles qui portent une charge smantique ; les autres rsultants de l'accord ou du rgime n'apparaissent que plus prs du texte, dans la RMorphP de la phrase, o elles sont introduites par les rgles de la syntaxe de surface. La composante syntaxique de surface du MST prend la reprsentation syntaxique de surface dont la SSyntS fait partie comme point de dpart, et elle en drive toutes les reprsentations morphologiques profondes RMorphP possibles, dont celle de la phrase (5) ; voir en (8) sa structure de base : la structure morphologique profonde SMorphP5. C'est une suite (= ensemble linairement ordonn, ou chane) des reprsentations morphologiques profondes de tous les mots-formes qui constituent la phrase synthtise. Une RMorphP d'un mot-forme est le nom du lexme auquel ce mot-forme appartient, muni de toutes les valeurs flexionnelles pertinentes, y compris ceux qui sont dtermines par les rgles d'accord et de rgime : par exemple, 3, sg auprs de AVOIR ou sg, masc auprs de LE, POSITIF, SON et POLITIQUE. (8)

Structure morphologique profonde de la phrase (5)

ORWELL NE AVOIRind, prs, 3, sg PAS DE DOUTEsg QUANT LEsg, masc EFFETsg POSITIFsg, masc DE SONsg, masc ENGAGEMENTsg POLITIQUEsg, masc SUR LEsg, fm QUALITsg DE SONpl, fm UVREpl

La composante morphologique profonde du MST prend la RMorphP comme entre pour en driver les RMorphS correspondantes, dont celle de la phrase (5) ; on en voit en (9) la structure de base, la structure morphologique de surface SMorphS. C'est une chane des reprsentations morphologiques de surface c'est--dire morphmiques des mots-formes de la phrase (5). Dans la SMorphS, chaque mot-forme est reprsent comme l'ensemble des morphmes qui le constituent ; les morphmes, qui sont des ensembles de morphes, sont entours d'accolades.

14 (9) Structure morphologique de surface de la phrase (5) {ORWELL} {QUANT} {NE} {} {AVOIR},{IND.PRS},{3SG} {PAS} {DE} {DOUTE}, {SG} {DE}

{LE},{SG.MASC}

{EFFET},{SG}

{POSITIF},{SG.MASC}

{SON},{SG.MASC} {LE},{SG.FM}

{ENGAGEMENT},{SG} {DE}

{POLITIQUE},{SG.MASC} {SON},{PL.FM}

{SUR}

{QUALIT},{SG}

{UVRE},{PL}

La morphologie du franais tant plutt pauvre, on ne voit pas, dans mes illustrations, l'utilit de la distinction entre SMorphP et SMorphS ; on a l'impression d'avoir affaire un simple changement de notation. Ce n'est cependant pas le cas pour les langues morphologie plus riche, o trs souvent la distribution des grammmes significations flexionnelles entre morphmes ne se fait pas de faon univoque6. La SMorphP vise les grammmes, alors que la SMorphS a pour tche de prsenter explicitement les morphmes, c'est--dire les ensembles de signes qui vhiculent ces grammmes. partir de la reprsentation RMorphS dont la SMorphS (9) est la structure de base, la composante morphologique de surface du modle Sens-Texte construit toutes les reprsentations phonmiques RPhonP possibles, y compris celle de la phrase (5). La composante phonologique du modle fait correspondre cette RPhonP une reprsentation phontique RPhonS, le plafond du modle : la correspondance entre la RPhonS et les vritables sons, tablie par le module phontique, se situe en dehors du MST. Je ne citerai pas ici les reprsentations PhonP et PhonS, la phonologie tant peu pertinente pour mon expos. La mme SSm (4) peut bien entendu tre ralise par d'autres phrases (plus ou moins) synonymes de (5) : (10) a. Que s'engager politiquement apporte une contribution positive ses uvres ne soulve pas de doute chez Orwell. b. Orwell est certain que son engagement politique influence positivement son uvre, en en amliorant la qualit. c. tre politiquement engag permet Orwell d'lever le niveau de ses uvres il en est convaincu. d. Orwell n'a aucun doute : son engagement politique rend ses uvres meilleures. e. Orwell ne doute pas que son engagement politique rende ses uvres meilleures. f . L'engagement politique amliore beaucoup ses uvres : Orwell en est tout fait convaincu. On sait qu'une phrase de complexit modre peut admettre des dizaines de millions de paraphrases (cf., par exemple, Mel'c]uk 1992a: 26-27 ou Mel'c]uk 1993-1997: vol. 1, 44, 76-77) ; inutile d'en numrer ici un plus grand nombre. Les exemples (10) suffisent pour dmontrer la richesse et la souplesse synonymiques de la langue, que le MST se doit de reflter. Ainsi, la SSm

15 (4) reprsente le sens d'une FAMILLE de phrases plus ou moins synonymes, autrement dit de paraphrases. Le paraphrasage est la fois le fondement du MST et son terrain d'essai : le modle doit assurer toutes les paraphrases pour un sens donn et seulement les paraphrases acceptes par les locuteurs natifs. 2.3. Composantes du Modle Sens-Texte Comme je viens de le dire, un MST prend, l'entre, une RSm et produit, la sortie, les phrases correspondantes en transcription phontique, en passant par des reprsentations intermdiaires. Ce modle est fonctionnel dans deux sens diffrents du terme fonctionnel : d'une part, il modlise le FONCTIONNEMENT de la langue (car les locuteurs ne font que cela : traduire des sens en textes et vice versa) ; d'autre part, il est lui-mme organis comme une FONCTION (au sens mathmatique du mot) une fonction qui fait correspondre un sens (= son argument) l'ensemble de tous les textes synonymes qui l'expriment (= sa valeur). C'est au moyen de dispositifs de ce type que la description des langues naturelles peut (et, comme je le crois, devrait) tre effectue. Prsentons, tour de rle, les six composantes majeures, ou modules, du modle SensTexte complet, tel que je le conois prsent. Une composante de ce MST est un ensemble de rgles qui assurent la correspondance entre les reprsentations de deux niveaux adjacents : par exemple, la smantique assure la correspondance entre RSm et RSyntP, et ainsi de suite. Je ne citerai pour chaque composante qu'une ou deux rgles, choisies de faon illustrer le passage entre les reprsentations de la phrase (5) indiques cidessus ; le lecteur pourra suivre ainsi, au moins en partie, la construction de la phrase (5) partir du sens (4), comme elle est effectue par le MST. Smantique Rgle smantique lexmique R1 (causer 1 )
1 2 2

(Z) EFFETI.1
I II III

(X)
1

(devenir1)
1

(agirI.4)

L((X))

L((Y))

L((Z))

(Y) [La notation L(()) veut dire (la lexie L qui exprime le sens ()).] La rgle R1 stipule que le sens (X, agissant sur Y, cause que Y devient Z) peut tre exprim (entre autres, bien sr) par le lexme EFFETI.1 : l'effet Z de X sur Y. Elle permet d'obtenir, partir de la SSm (4), un fragment de l'arbre SyntP (6) : le nud tiquet EFFETI.1 , avec les branchements correspondants. Soulignons que cette description du sens du lexme franais EFFETI.1 est approximative : en ralit, la RSm de cette lexie doit la distinguer de tous ses quasisynonymes, comme CONSQUENCE, RSULTAT, IMPACT, etc.

16 Une rgle smantique lexmique n'est pas autre chose que la partie centrale de l'article de dictionnaire du lexme en question. Le nombre de rgles de ce type (et par consquent d'articles de dictionnaire) dans une langue comme le franais est d' peu prs un million. Leur ensemble constitue un dictionnaire formalis d'un type nouveau : le Dictionnaire explicatif et combinatoire [= DEC ; voir Mel'c]uk et al. 1984-1997), qui joue un rle trs important dans le MST. Rgle smantique flexionnelle R (tempsB.1)
1 2
2

L((X))prs

L((X)) = Verbe

(X)

(maintenant 1)

[La barre verticale spare la partie conditions ; les conditions sont spcifies par des formules boolennes qui portent a priori sur les deux parties de la rgle.] La rgle R2 stipule que le sens (le temps de X est maintenant), c'est--dire que X a lieu au moment du discours, peut tre exprim par le grammme (prsent), attach au lexme qui ralise le sens (X), si ce lexme est un verbe. Cette rgle contribue, elle aussi, l'arbre (6) : elle ajoute l'indice prs au sommet de l'arbre (qui est tiquet du symbole de la FL Oper1). En morphologie, cet indice permettra la production de la forme du prsent du verbe fini : voir la rgle R7. Les rgles de ce type dcrivent le smantisme des grammmes de la langue (= smantique morphologique). Leur nombre, dans une langue donne L , est de quelques centaines (en fonction de la richesse morphologique de L). Il existe d'autres types de rgles smantiques dont je ne parlerai pas ici : entre autres, les rgles smantiques dcrivant le sens des phrasmes et des constructions syntaxiques7, ainsi que les rgles qui concernent la structure communicative de la phrase. Une rgle d'un tout autre type doit, par exemple, veiller ce que la phrase ait un sommet verbal (par exemple, le nud dominant de la SSm (4) (certain) peut tre ralis, au niveau SyntP, par l'adjectif CERTAIN comme en (10b) ; en franais, un adjectif ne peut pas tre le sommet syntaxique d'une phrase complte ; la rgle en question introduit alors la copule TRE).

17 Syntaxe profonde 3 Rgle syntaxique profonde R X (II[PRP])

compltive (II[PRP]) Z

II

PRP

prpositionnelle Y (N) Y (N) [L'indice entre parenthses reprsente le syntactique de la lexie L associe au nud en question, c'est--dire l'ensemble de donnes sur la combinatoire de L.] C'est une rgle de rgime, qui introduit, dans la SSyntS, la prposition demande par telle ou telle lexie. L'expression X(II[PRP]) signifie (l'actant SyntP II de la lexie X doit tre introduit par la prposition PRP) ; les indications de ce type font partie de ce qu'on appelle le schma de rgime dans un article de dictionnaire (d'un DEC). Le schma de rgime de la lexie L est un tableau qui spcifie la forme de l'expression dans la phrase des actants de L, c'est--dire des lments essentiels qui peuvent dpendre de L syntaxiquement et qui sont prvus par sa dfinition (cf. les variables X, Y, Z, ..., qu'on a vues dans nos exemples de reprsentations smantiques ; voir Mel'c ]uk et al. 1995: 119, 221). Ainsi, en franais on aide qqn ., mais en allemand qqn. (jemandem helfen) ; en franais, on attend qqn., en anglais pour qqn. (wait for somebody), et en allemand ou en polonais sur qqn. (auf jemanden warten; czekac; na kogos;) ; et ainsi de suite. Ce sont toutes les informations pertinentes pour ce type de phnomne qui sont prsentes dans le schma de rgime de L. Les rgles de la syntaxe (profonde et de surface) s'adressent au schma de rgime de la lexie traite pour dterminer la prposition (ou la conjonction, ou le cas, etc.) ncessaire ; c'est cela que fait la rgle R3. Elle produit, dans l'arbre syntaxique de surface (7), les deux sousarbres comprenant des prpositions rgies qui marquent l'actant syntaxique profond II de la lexie rgissante : doute [= X] kquant l [= Z(PRP)] l'effet [= Y] et effet [= X] sur [= Z(PRP)] la qualit [= Y]. D'autres rgles de la syntaxe profonde s'appliquent la ralisation de configurations syntaxiques profondes, qui sont universelles, par les constructions syntaxiques de surface, qui, elles, sont typiquement franaises. En voici un exemple :

18 Rgle syntaxique profonde R4 X (V, II[N])

X ATTR Z NE(ng)

objectale directe (V, II[N]) restrictive W DE prpositionnelle

II

Z NE(ng)

Y (N) Y (N) La rgle SyntP R4 introduit (dans la SSyntS) la prposition DE devant un objet direct d'un verbe qui reoit la ngation (Je NE mange pas de viande) ; elle fait juste cela dans l'arbre SyntS de (7). De plus, une partie de rgles SyntP calculent les valeurs des FL qui apparaissent dans la SSyntP, en consultant des articles de dictionnaire des lexies en question ; ainsi, la configuration Oper II;-; ; DOUTE, qu'on voit dans l'arbre (6), est remplace par la configuration AVOIRII;_-1

; ; )DOUTE

dans l'arbre (7). Le nombre de rgles SyntP est de l'ordre de quelques centaines (plus quelques dizaines de schmas de rgles). Syntaxe de surface Rgle syntaxique de surface R5 X (PRP) X + ...+ Y

prpositionnelle

~ ~ ... = Z ,Z ,Z (DT) (ADJ-antpos) (ADJ-numr)

Y (N) [Les trois points entre les lments dans la partie droite d'une rgle SyntS indiquent la possibilit de sparation linaire par certains mots-formes : selon R5, seuls des dterminants ainsi que des adjectifs antposs et des numraux avec leur dpendants peuvent apparatre entre la prposition X et le nom Y. Le tilde au-dessus d'un nud Z Z+ signifie (Z et ses dpendants), par exemple, d'[= X] PEU PRS TROIS CENTS [= Z+] tonnes [= Y].] Cette rgle est une rgle typique de l'ordre des mots : elle positionne la prposition devant le nom qui en dpend, ne permettant entre les deux qu des lments spcifis dans la partie conditions. La rgle R5 tablit la position linaire de cinq prpositions en (8) : DE DOUTE, kQUANT l [l'] EFFET, DE [son] ENGAGEMENT, SUR [la] QUALIT et DE [ses] UVRES.

19 Rgle syntaxique de surface R6 X (N, g)n Yg, n + ...+ X

dterminative

,~ ... = ~ Z Z (ADJ-antpos) (ADJ-numr)

Y (DT) Cette rgle assure l'accord du dterminant Y en genre g et en nombre n avec le nom dtermin X (l'accord tant en gnral du domaine de la syntaxe de surface), ainsi que le positionnement linaire du dterminant devant le nom. La rgle R6 produit , par exemple, les valeurs flexionnelles pl, fm pour le lexme pronominal SON en (8) (avant-dernier lment) et place ce lexme gauche de UVRE. Les rgles R 5-6 n'illustrent qu'un seul type de rgles syntaxiques de surface : les rgles dites locales, dont l'oprande est juste une seule branche de l'arbre syntaxique de surface (pour une liste assez complte de rgles syntaxiques de surface locales pour l'anglais, voir Mel'c]uk & Pertsov 1987 ; les rgles SyntS pour le sujet et les complments d'objet de la langue aloutore sont donnes dans Mel'c]uk & Savvina 1978). Mais la syntaxe de surface comprend galement un autre type de rgles les rgles globales, qui traitent des configurations de nuds beaucoup plus complexes et/ou prennent en charge les donnes contenues dans la structure communicative de la phrase. Ce sont ces rgles qui, entre autres, rendent compte de proprits de l'ordre des mots telle que la projectivit (la langue vite, de faon gnrale, les ordonnancements non projectifs de mots-formes du type

ou , o deux arcs de dpendance se croisent ou o un arc en recouvre un autre qui sort d'un lment gouverneur ; cf. Iordanskaja 1963). Je ne peux cependant pas envisager ici les rgles SyntS globales avec plus de dtails (voir Mel'c]uk 1967a et 1995a). Le nombre total de rgles syntaxiques de surface est peu prs d'un millier. Morphologie Morphologie profonde Rgles morphologiques profondes R 7 ind, prs <> {IND.PRS} 8 R 3, sg <> {3SG} 9 R pl <> {PL} Ce sont des rgles dites catgorielles : grosso modo, elles regroupent les lments de catgories flexionnelles, c'est--dire des grammmes, sous des morphmes, ensembles de signes linguistiques segmentaux lmentaires, c'est--dire morphes. Autrement dit, une rgle catgorielle

20 indique qu'un tel ensemble de grammmes est exprim par un seul signe de la langue spcifier, pour autant, quel signe concret le fait). Morphologie de surface Rgles morphologiques de surface R 1 0 {IND.PRS} R 1 1 {3SG}

(sans

<> -0 <> -e | verbe du groupe I, ... <> -t | verbe du groupe II ou III, ... 12 R {PL} <> -s | nom ordinaire <> -x | nom du type pl-x 13 R {T(-re)}, {IND.PRS}, {3SG} <> est Ici nous voyons la slection par des rgles dites morphmiques des morphes spcifiques appartenant aux morphmes calculs l'tape prcdente ; cette slection se fait selon les conditions morphologiques, que je n'ai esquisses qu'approximativement. La rgle R13 illustre un cas de figure spcial : la ralisation d'un ensemble de morphmes par un seul signe indivisible, appel mgamorphe ; c'est un cas de suppltion. Les rgles R 7-13 permettent d'obtenir, entre autres, les mots-formes affect e , est et uvres, apparaissant dans la phrase (5). La composante morphologique de surface comprend galement les rgles morphonologiques : ce sont les rgles qui effectuent des changements phonologiques dans les mots-formes synthtiss. Une rgle morphonologique est dite profonde, si elle est contrainte par des conditions morphologiques, et de surface autrement (ses conditions d'application ne rfrent qu'au contexte phonologique). Rgle morphonologique profonde R1 4 e 1) verbe du II groupe ; 2) soit ____ { /V/;/j/}, soit [le verbe est au subj ou l'ind, prs, 3pl] Cette rgle effectue l'insertion de /s/ la fin du radical (indique par +) dans les verbes du IIe groupe soit devant une voyelle ou un yod, soit au subjonctif ou la 3e personne pluriel du prsent de l'indicatif : par exemple, grossi ss + ions [devant le yod] ou [que je] grossi ss e [au subjonctif]. (Le symbole v dsigne la chane vide.) Rgle morphonologique de surface R1 5 /i/ => /j/ | ___/V/ La rgle R dvocalise tout /i/ devant une voyelle : par exemple, dans tudie ~ tudions, o l'on a /etdi/ ~ /etdj/.
15

/v/ + => /s/ +

Le nombre total de rgles morphologiques et morphonologiques des quatre types illustrs prcdemment varie, selon la langue, de quelques dizaines quelques centaines. (Pour tous les dtails concernant la description de la morphologie, on peut consulter Mel'c]uk 1993-1997.)

21 Dans cet expos, je ne prsenterai pas de rgles de la composante phonologique. En rsum, je peux dire que la caractristique la plus gnrale et la plus saillante du MST en question est son caractre STRATIFICATIONNEL et MODULAIRE (ces deux proprits tant les deux ctes d'une mme mdaille). Le principe directeur, qui prvaut dans tous les conflits thoriques, est de sparer le plus possible la reprsentation et la manipulation des phnomnes linguistiques qui, du point de vue de l'intuition du chercheur, sont de nature diffrente. Par exemple, chercher construire une reprsentation unifie de la phrase qui exprime SIMULTANMENT les liens hirarchiques, anaphoriques et linaires entre les lments lexicaux, ce que certains linguistes veulent faire tout prix, est un tabou absolu pour le MST. Son mot du jour est distinguer et sparer ; chaque aspect identifiable d'un fait dcrire reoit une reprsentation autonome, pour tablir ensuite des rgles de correspondance entre ces diverses reprsentations. 3. La modlisation de deux phnomnes linguistiques particuliers : les choix lexicaux et la cooccurrence lexicale Aprs avoir esquiss le MST dans sa globalit, j'aimerais aborder deux problmes linguistiques particuliers tendant montrer les avantages pratiques qu'offre la dmarche Sens-Texte dans l'tude des langues. Le premier relve de la smantique lexicale ( le sens des mots) et le second, de la cooccurrence lexicale restreinte ( la combinatoire des mots). Comme on le sait, depuis Saussure, Hjelmslev et Jakobson, l'activit langagire se droule selon deux axes : l'axe PARADIGMATIQUE, ou vertical, o le locuteur fait des choix partir des units qui s'opposent et s'excluent (Soit X, soit Y lequel choisir ?) ; et l'axe SYNTAGMATIQUE, ou horizontal, o le locuteur combine des units dj slectionnes (X et Y peut-on les mettre ensemble ?). Autrement dit, il s'agit des CHOIX LEXICAUX et de la COOCCURRENCE LEXICALE. 3.1. Modlisation des choix lexicaux paradigmatiques Les noncs Orwell est certain que P et Orwell ne doute pas que P sont synonymes : 1) ils peuvent tre substitus l'un l'autre ; 2) leurs ngations sont quasi synonymes (sans l'tre parfaitement, voir plus loin) : Orwell n'est pas certain que P Orwell doute que P ; 3) ils sont tous les deux non factifs, c'est--dire qu'aucun ne prsuppose la vrit de P : chacun peut tre suivi de ... mais en fait P n'a pas lieu ; etc. Qu'est-ce que le locuteur a dans son cerveau propos des lexies CERTAIN et DOUTER/AVOIR DES DOUTES qui lui permet de les manipuler comme il le fait ? Nous ne pouvons pas le savoir ; cependant, nous pouvons en proposer un modle fonctionnel. En suivant A.Zholkovsky, A.Bogusawski et A.Wierzbicka8, nous avanons l'hypothse que le sens de ces lexmes s'exprime partir de sens plus simples, c'est--dire que ce sens est DCOMPOSABLE . Considrons la srie suivante de combinaisons de propositions et d'quations smantiques (le dise # indiquant une continuation inacceptable) : (11) a. Je crois que Pierre est venu, mais je n'en suis pas certain. b. Je suis certain que Pierre est venu, mais #je ne le crois pas. c. Je crois que Pierre est venu, mais #j'en doute. d. Je suis certain que Pierre est venu = Je ne doute pas que Pierre est venu. e. Je ne suis pas certain que Pierre est venu Je doute que Pierre soit venu.

22 Pour que le locuteur (ou un programme informatique) puisse produire les expressions en (11), en tablissant leur acceptabilit ainsi que leur synonymie, il suffit de reprsenter le sens des lexies en question comme suit : (12) a. X est certain que P : (Ayant la croyance P a lieu, | X n'est pas dispos admettre que P n'a pas lieu). : (N'ayant pas la croyance P a lieu, | 9 X est dispos admettre que P n'a pas lieu) . [La partie d'une dfinition lexicographique gauche de la barre verticale | est un prsuppos.] Avec ces dfinitions, nous obtenons, pour les phrases (11), les dcompositions smantiques suivantes (les contradictions apparaissent releves en gras) : (13) a. (Je crois que Pierre est venu, mais [tout] en ayant la croyance Pierre est venu, | je suis dispos admettre que Pierre n'est pas venu). b . ( Ayant la croyance Pierre est venu, | je ne suis pas dispos admettre que Pierre n'est pas venu, mais #je ne crois pas que [= je n'ai pas la croyance] Pierre est venu) . c . ( Je crois que Pierre est venu , mais # n'ayant pas la croyance Pierre est venu, | je suis dispos admettre que Pierre n'est pas venu). d. (Ayant la croyance Pierre est venu, | je ne suis pas dispos admettre que Pierre n'est pas ven = (Ayant la croyance Pierre est venu [ce qui rsulte de la ngation de la composante correspon10 dante ], | je ne suis pas dispos admettre que Pierre n'est pas venu). e. (Ayant la croyance Pierre est venu, | je suis dispos admettre que Pierre n'est pas venu). (N'ayant pas la croyance Pierre est venu, | je suis dispos admettre que Pierre n'est pas venu). En (11e), on a l'impression que la phrase avec je doute exprime un degr plus lev d'incertitude que sa contrepartie ; cette intuition est reflte dans les dcompositions de (13e). En effet, dans les deux phrases, je suis dispos admettre que Pierre n'est pas venu ; cependant, dans la premire, j'ai quand mme la croyance Pierre est venu, qui constitue le prsuppos de la phrase, alors que dans la deuxime, je ne l'ai pas. On voit donc que, si nous adoptons les dcompositions smantiques proposes pour les lexies CERTAIN et DOUTER, nous pouvons dcrire les faits observs de faon formelle, rgulire et cohrente. La dmarche Sens-Texte nous permet donc de postuler les rgles (12a-b), qui sont des lments constitutifs de la composante smantique (= du module smantique) du MST du franais. Plus prcisment, ce sont des rgles smantiques lexmiques (comme la rgle R1, p. 00) articles ou parties d'articles de dictionnaire qui composent le Dictionnaire explicatif et combinatoire, ou DEC, dont il a dj t question. Les rgles (12a-b) reprsentent en fait les dfinitions lexicographiques des lexies cites. Ce sont des DCOMPOSITIONS SMANTIQUES, ou des formules molculaires du sens, tablies selon des rgles et des critres qui sont prsents dans Mel'c]uk et al. 1995: 78 ssq. b. X doute que P

23 A part la dfinition du smantisme de la lexie vedette L, un article du DEC comporte d'autres donnes lexicographiques importantes, en particulier la description des proprits combinatoires de L, que nous allons maintenant examiner. 3.2. Modlisation des choix lexicaux syntagmatiques : les fonctions lexicales La combinatoire lexicale restreinte constitue un lment fort problmatique pour toute description dictionnairique et, par ricochet, pour la linguistique thorique. Le caractre capricieux et imprvisible de la cooccurrence lexicale est notoire. On dit plonger dans le dsespoir, mais mettre en rage *mettre en dsespoir, *plonger dans la rage. On peut tre gravement ou grivement bless, mais seulement gravement malade *grivement malade (le fameux exemple de Bally) ; de plus, on a de grands blesss, alors qu'une blessure est grave, pas *grande. On est trs fatigu, mais bien repos *trs repos [comme dans *Je suis trs repos], fabuleusement riche, mais bien connu *bien riche, *fabuleusement connu ; et ainsi de suite. En franais, on fait un pas, en espagnol, on le donne (= dar un paso), et en anglais, on le prend (= take a step). La pluie est forte en franais, mais lourde (= heavy rain) en anglais. On fait un rve en franais, mais on l'a en anglais (= have a dream) ; vous donnez un cours en franais, mais vous l'enseignez (= teach a course) en anglais et vous le lisez (= c]itat kurs) en russe (mme si vous ne le lisez pas !). Toutes ces bizarreries d'usage sont connues depuis longtemps : ce sont des collocations des expressions phrasologiques d'un certain type, qu'on ne peut pas prvoir et que la linguistique ne savait pas prsenter de faon logique et facilement calculable. Or l'approche Sens-Texte propose un modle fonctionnel de ce phnomne : les fonctions lexicales. Le concept de fonction lexicale repose sur l'hypothse que les cas de cooccurrence lexicale restreinte du type ci-dessus se rencontrent, le plus souvent, avec un nombre fort rduit de sens spcifiques trs abstraits et gnraux. Le sens (intense/intensment, trs) en est un exemple typique : son expression n'est pas libre, la diffrence de n'importe quel sens normal, mais dpend de la lexie auprs de laquelle ce sens est exprim. Cf. : (intensment)(dormir) = profondment, comme une souche, comme un loir, poings ferms, ... (intensment)(blessA) = gravement, grivement (intense)(blessN) = grand | antpos (intense)(pluie) (intense)(froidN) = forte < torrentielle, diluvienne ; battante = de canard, de chien, de loup, de tous les diables, du diable, sibrien

(intensment)(nier) = catgoriquement Le sens d'intensification s'exprime au voisinage d'une lexie x par une ou plusieurs lexie(s) y, et ceci de faon irrgulire, mais toujours en fonction de x. Par consquent, l'expression de ce sens peut tre dcrite par une fonction (au sens mathmatique du terme) f qui associe, tout x pour lequel ce sens peut tre exprim, tous les y possibles : f(x) = y. La lexie x pour laquelle on cherche le(s) cooccurrent(s) exprimant ce sens est l'argument de f, et l'ensemble des cooccurrents est sa valeur. Si on donne au sens en question le nom Magn (du lat. magnus (grand)), on peut utiliser la notation fonctionnelle bien connue : Magn(dormir) = profondment, comme une souche, comme un loir, poings ferms, ... Magn(blessA) = gravement, grivement etc.

24 Les fonctions comme Magn sont appeles des fonctions lexicales [= FL], puisque leurs arguments et leurs valeurs sont exclusivement des lexies. Deux faits importants sont noter : d'une part, les FL du type illustr ci-dessus les FL standard sont PEU NOMBREUSES (une soixantaine peu prs) et, d'autre part, elles sont UNI11 VERSELLES : elles existent dans toutes les langues et suffisent (presque ) dcrire, de faon systmatique et formelle, l'ensemble des collocations. Sans entrer dans les dtails, je me limiterai trois groupes d'exemples de FL (le lecteur intress pourra consulter Mel'c]uk 1993c, 1996 ou Mel'c]uk et al. 1995: 125 ssq., ainsi que les volumes publis du DEC du franais). 1. Bon (bon, tel que le locuteur l'approuve) [louange standard consacre par la langue] : Bon(conseil) = prcieux AntiBon(victoire) = la Pyrrhus Bon(temps) = beau AntiBon(temps) = de chien Bon(choix) = heureux AntiBon(choix) = malheureux Bon(se porter) = comme un charme AntiBon(rsultat) = piteux 2 . Oper , Func et Labor sont trois types syntaxiquement diffrents de ce qu'on appelle les verbes supports : Oper (suprmatie) 1 Oper (remarque) 1 Oper (mfait) 1 Oper (danger) 2 Oper (applaudissements) 2 comprend [N] Oper (conseil)
3

= dtenir [ART ~] = faire [ART ~] = perptrer [ART ~] = courir [ART ~]

Func (runion) 0 Func (aide) 1 Func (responsabilit) 1 Func (danger) 2 = recueillir [ART ~] Func (interdiction)
2

= est en cours = vient [de N] = incombe [ N] = menace [N] Func (liste)


2

= recevoir [ART ~] Labor (liste) 12 Labor (note) 12 Labor (location) 12 Labor (location)
32

= frappe [N]

= mettre [N sur ART ~] = prendre [N en ~] = donner [N en ~] = prendre [N en ~]

3. Loc est une prposition de localisation standard spatiale ou temporelle : Locin/ad(gare) = en [[~] | un train, [ART Locin(personnel) = kau seinl [de ART ~] ~] | des personnes Locin/ad(ville) = en [~] Locin/ad(campagne) = [la ~] Loctemp;in(rgime) = sous [le ~] Loctemp;in(priode) = pendant [ART ~] Loctemp;in(Antiquit) = dans [l'~] Loctemp;ab(Antiquit) = depuis [l'~] Au moyen des FL, le linguiste modlise les choix lexicaux syntagmatiques faits spontanment par le locuteur. Le MST d'une langue donne inclut un dictionnaire (mentionn en 2.3, R1, p. 00) : le DEC. Un article du DEC comprend, en plus de la dfinition de la lexie vedette L et de son schma de rgime, dont il a dj t question (R3, p. 00), une liste de FL de L avec leurs valeurs de sorte que le DEC couvre toutes les collocations de L12. On ne peut pas prouver de faon rigoureuse que les FL existent telles quelles dans le cerveau des locuteurs ; mais la systmaticit et la cohrence de la description qu'elles assurent constituent un argument de poids [= Magn (argument) !] en leur faveur. C'est d'autant plus vrai que la dcomposition smantique et les FL d'une mme lexie entretiennent des liens trs troits, ce qui renforce

25 encore notre conviction d'avoir correctement trait aussi bien la dcomposition smantique que les fonctions lexicales. On notera une ressemblance frappante entre la corrlation structure smantique de la lexie ~ ses FL et la corrlation observe entre la structure molculaire d'une substance (= sa formule structurale) et ses proprits chimiques et physiques, entre autres sa combinabilit avec d'autres substances. En fait, les formules structurales de certains corps chimiques ont t tablies comme des modles fonctionnels de ractions dans lesquelles ces corps taient impliqus. Autrement dit, une FL donne de la lexie L, c'est--dire f(L), il doit correspondre une composante smantique particulire () dans la dfinition lexicographique de L ; le sens de la valeur de cette FL, (f(L)), porte sur (). Cette correspondance permet d'tayer les dcisions prises par le linguiste concernant le sens et la cooccurrence de L. 3.3. Corrlations entre la modlisation paradigmatique et syntagmatique des comportements lexicaux Pour illustrer les liens structuraux qui existent entre nos hypothses smantiques et cooccurrencielles, considrons les deux exemples suivants. Exemple 1 (14) a. Je suis *trs *fort certain que Pierre est venu ~ Je suis absolument tout fait certain que Pierre est venu. vs b. Je doute fort que Pierre soit venu ~ Je doute *absolument *tout fait que Pierre soit venu. Pourquoi CERTAIN [ (sr)] et DOUTER ont-ils des proprits combinatoires opposes vis--vis des intensificateurs (= les valeurs de la FL Magn) ? En utilisant les dcompositions (12ab), il est facile de le dcouvrir. La composante smantique centrale de CERTAIN est (ne pas [tre dispos ...]), et on ne peut intensifier un tat ni (ne pas tre), puisqu'un tat ni n'est pas en principe graduel ; trs ou fort sont donc inacceptables ici. On peut, par contre, renforcer la ngation dans la mesure o le locuteur veut insister sur cette composante smantique : absolument ou tout fait sont par consquent tout naturels auprs de CERTAIN. Avec DOUTER, la composante centrale est (tre dispos [ ...]), et cet tat prsuppose un degr : on est ncessairement plus ou moins dispos ; d'o l'acceptabilit des intensificateurs trs et fort. Dans ce cas, le choix de deux types diffrents de valeurs de la FL Magn est smantiquement justifi. Notons de plus qu'on peut tre (PEU dispos) et qu'en consquence on peut dire, pour exprimer ce sens, Je doute peu ou J'ai peu de doutes, ce qui prouve que (dispos) est une meilleure composante smantique pour (douter/doute) que, par exemple, (prt ) : on ne peut pas tre *(peu prt). Notre hypothse sur la structure smantique des lexies CERTAIN et DOUTER se trouve ainsi confirme. Exemple 2 Le nom APPLAUDISSEMENT est dfini dans le Petit Robert comme (battement des mains en signe d'approbation, d'admiration ou d'enthousiasme). Au premier abord, cette dfinition ne soulve pas d'objection. Cependant, on dit des applaudissements nourris/clairsems, c'est--dire qu'on peut prciser le degr des applaudissements alors que rien dans la dfinition cite n'admet la graduation. Ainsi, la cooccurrence avec NOURRI et CLAIRSEM nous impose la prsence, dans la dfinition lexicographique de APPLAUDISSEMENT, de la composante (avec une

26 force et une frquence donnes) : et c'est cette composante qui accepte l'intensification. Aussitt qu'on introduit cette composante, on dcouvre que la dfinition en cause a un autre dfaut : elle n'indique pas que la force et la frquence des battements sont proportionnelles au degr d'approbation, d'admiration ou d'enthousiasme ; il faut donc ajouter la composante correspondante, ce qui donne (battement des mains en signe d'approbation, d'admiration ou d'enthousiasme, avec une force et une frquence donnes, proportionnelles au degr d'approbation, d'admiration ou d'enthousiasme). Comme on le voit, la cooccurrence lexicale restreinte d'une lexie L est lie au smantisme de L en ce sens que la prsence de telle composante smantique dans la dfinition de L 1) dtermine l'existence de telle FL f(L) et 2) justifie, jusqu' un certain point et dans certains cas, certains lments de la valeur de f(L) comme, par exemple, pour CERTAIN vs DOUTER (mme si en rgle gnrale, les lments de la valeur d'une FL f(L) sont, bien entendu, imprvisibles). Puisque la cooccurrence lexicale restreinte est observable, elle nous permet de mieux dcouvrir le smantisme des lexies, qui, lui, n'est pas directement observable. 3.4. Universalit des modles Sens-Texte Les MST tels que prsents ci-dessus sont universels : les techniques descriptives et les formalismes proposs s'appliquent toutes les langues de la mme faon. Je pourrais citer en exemple le cas de la cooccurrence lexicale restreinte. L'appareil de fonctions lexicales permet de dcrire la cooccurrence lexicale de n'importe quelle langue avec des moyens identiques, en facilitant ainsi la comparaison des langues (et, en particulier, la traduction rciproque). Voici quelques valeurs des FL Magn ( intensificateur) et Oper 1 (un des verbes supports) pour plusieurs langues de structure trs diffrente : allemand, russe, hongrois, arabe et chinois ; les mots-cls (= arguments des FL en question) sont smantiquement quivalents (sauf dans le cas du sens (excuses) [comme dans prsenter ses excuses], pour lequel l'allemand et le hongrois n'ont pas d'expression nominale, et dans celui du sens (rsistance), dont l'expression nominale n'existe pas en chinois). Allemand Magn(Regen (pluie)) Magn(Argument (argument)) = starker (fort), Platz- (clatant) = gewichtiges ( de poids ) , schlagendes ( frappant ) , unschlagbares ( imbattable ) , unwiderlegbares (irrfutable) = tosender (mugissant) = [ART ~ ] machen (faire) acc = [ber ART ~ ] erzielen (obtenir) acc = [N ART ~ ] leisten (livrer) dat acc = [Nacc um ~ ] bitten (prier)
acc

Magn(Applaus (applaudissements)) Oper (Reise (voyage)) 1 Oper1(bereinkunft (accord)) Oper1(Widerstand (rsistance)) Oper1(Entschuldigung (pardon))

Russe Magn(doz]d (pluie)) = silnyj (fort), prolivnoj (d'averse) Magn(dovod (argument)) = veskij (de poids), ubeditelnyj (convaincant) Magn(aplodismenty (applaudissements)) = burnye (temptueux), gromovye (de tonnerre)

27 Oper1(putes]estvie (voyage)) Oper1(soglas]enie (accord)) Oper1(soprotivlenie (rsistance)) Oper1(izvinenija (excuses)) Hongrois Magn(eso (pluie)) Magn(rv (argument)) Magn(taps (applaudissements)) Oper1(utazs (voyage)) Oper1(megegyezs (accord)) Oper1(ellenlls (rsistance)) Oper1(bocznat (pardon)) Arabe Magn(mat>ar (pluie)) Magn(h>uzza (argument)) Magn(tas>fi\q (applaudissements)) Oper (safar (voyage)) 1 Oper1(?ittifa\q (accord)) Oper1(muqa\wamat (rsistance)) Oper1(?i!iara\t (excuses)) = sovers]it (accomplir) [~e] = pridti [k ~ju] (venir ) = okazat [un verbe vide] ( manifester) [N ~e] dat = prinesti (apporter) [N (svoi) ~ja]
dat

= zuhog (torrentiel) = komoly (srieux) = viharos (tourbillonnant), vas- (de fer) = [~t] tenni (faire) = [~re] jutni (arriver ) = [~t] kifejteni (dvelopper), tanustani (dmontrer) = [Nabl~ot] krni (demander) = azi\r (abondant), qawijj (fort) = da\mia (frappant), qawijja (fort) = h>arr (chaud) = qa\ma [bi ~] (se lever , partir en) = tawas>s>ala [?ila ~] (arriver , obtenir) = qa\ma [bi ~] (se lever , partir en) = qaddama [ART ~] (avancer [trans.])

Chinois Magn(yu] (pluie)) = d (grand) Magn(lnj (argument)) = yo]ul-de (de force) Magn(zha]ngshe\ng (applaudissements)) = lidng (de tonnerre) | postpos Oper1(l}t (voyage)) Oper1(xiy (accord)) Oper1(qin (excuses)) = tshang [~] (marcher sur) = dchng [~] (arriver ) = do [yige (une) ~] (dire)

Ces exemples montrent quel point les valeurs d'une mme FL, pour des lexies smantiquement quivalentes, varient d'une langue autre : la pluie est forte en allemand, en russe et en arabe, mais elle est grande en chinois ; les applaudissements sont de fer en hongrois, mugissants en allemand et temptueux en russe (nourris en franais !) ; et ainsi de suite. Cependant les FL en garantissent une description homogne et systmatique dans le dictionnaire de chaque langue. Bien plus, grce l'universalit des FL, on peut noter facilement et de faon compacte les correspondances INTERlinguistiques entre des valeurs de FL, ce qu'il est presque impossible de faire par un autre moyen. En effet, comment indiquer, dans un dictionnaire anglais-franais, que, dans des contextes particuliers, [to] develop peut se traduire par prendre ou [to] wean par dtourner ? Et

28 pourtant, [to] develop a habit se traduit par prendre une habitude, et [to] wean from a habit par dtourner d'une habitude. Si on fait appel aux FL, ces correspondances s'expriment explicitement et systmatiquement en mettant les valeurs des FL pertinentes dans les articles de dictionnaire du lexme anglais HABIT et du lexme franais HABITUDE. Le tableau suivant illustre ce point : angl. HABIT <> fr. HABITUDE IncepOper [to] acquire, develop, form [ART ~], contracter, prendre [ART ~] 1 get [into ART ~], take [to ART ~] FinOper [to] drop [ART ~], get out, get rid abandonner, perdre [ART ~] 1 [of ART ~] LiquOper [to] break [N of ART ~], wean [N] dtacher, dtourner [N de ART ~] 1 away [from ART ~] Liqu Oper [to] break off, kick, shake off, throw se dbarrasser, se dfaire [de ART ~], 1 1 off [ART ~] renoncer [ ART ~], rompre [avec ART ~] CausFunc [to] instill [ART ~ in(to) N] inculquer [ART ~ N]
1

En spcifiant de faon indpendante les valeurs des FL pour chaque lexie de chaque langue, nous obtenons automatiquement par l'intermdiaire des FL des quivalences intra- ou interlinguistiques. Cet aspect de l'utilisation des FL, soulign ds le moment de leur invention (voir la note 12, p. 00), ouvre une perspective nouvelle sur l'laboration de dictionnaires bilingues, surtout dans le domaine du traitement automatique du langage (Iordanskaja & Mel'c]uk 1997) ; mais ce sujet est trop pointu pour que je m'y tende. Le caractre universaliste des modles du type Sens-Texte se manifeste galement dans d'autres domaines. Ainsi, les structures de dpendance utilises en syntaxe permettent de dcrire de faon homogne toutes les constructions trouves dans les langues les plus exotiques ; les techniques proposes en morphologie (la sparation des rgles catgorielles, morphmiques et morphonologiques ; le concept universel de procd morphologique ; ...) semblent couvrir tous les phnomnes que prsente la littrature ce sujet. Cependant, faute de place, je me contenterai du seul exemple de FL, analys ci-dessus. 4. La linguistique Sens-Texte Je suis maintenant en mesure d'baucher les contours du domaine spcifique de la linguistique dont je m'occupe : la linguistique Sens-Texte. Les tches que les linguistes doivent affronter aujourd'hui sont normes. Afin de les simplifier et d'homogniser les mthodes et les formalismes utiliss, je pense qu'il est bon, autant que faire se peut, de restreindre le champ d'tude. En consquence, les quatre axes suivants ne sont pas considrs pour le moment dans le cadre Sens-Texte : l'axe temporel, c'est--dire la diachronie ; l'axe spatial, c'est--dire tout ce qui a trait au dveloppement gographique des langues (la dialectologie et les recherches apparentes) ; l'axe social, c'est--dire la sociolinguistique ; l'axe psychologique/neurologique, c'est--dire la psycholinguistique, y compris l'apprentissage des langues et le dveloppement du langage chez l'enfant, le lien entre la langue et l'art verbal, etc.,

29 ainsi que la neurologie moderne, qui fait des progrs considrables dans l'tude des bases crbrales du langage. Cependant, ces axes de recherche sont absolument vitaux pour la linguistique en gnral et pour la linguistique Sens-Texte, en particulier. Je suis convaincu que la vrification ultime de la pertinence des modles Sens-Texte ne peut venir que des tudes menes dans ces directions, surtout dans celles de la psycholinguistique et de la neurolinguistique. Ce que je propose n'est donc qu'une tactique, mais une tactique d'importance : pour avancer de faon sensible dans la comprhension de la langue en tant que telle, il faut faire aujourd'hui abstraction de bon nombre de ses aspects et de ses facettes, mme incontournables en principe. Pour laborer des modles simplifis, mais bien formaliss, comme je veux le faire, il faut, dans un premier temps, restreindre le champ couvert (sans toutefois trop le restreindre, pour ne pas perdre d'lments pertinents). La linguistique Sens-Texte se rserve donc trois objectifs majeurs. 1. (a) laborer des descriptions formelles et prcises de langues naturelles qui puissent servir de base fiable et commode la construction des modles Sens-Texte pour les langues correspondantes ; (b) laborer en parallle la thorie de ces descriptions la thorie Sens-Texte , en dterminant les moyens ncessaires la description linguistique. C'est la linguistique Sens-Texte thorique. 2. (a) laborer les MST les plus complets possibles pour diffrentes langues ; (b) laborer en parallle la thorie de ces modles, en gnralisant les observations faites sur les dispositifs particuliers qui assurent le passage sens langagiers => textes langagiers. C'est la linguistique Sens-Texte exprimentale. 3. laborer les interfaces avec deux autres disciplines voisines : D'une part, nous avons un domaine d'tudes qui doit s'occuper du passage ralit extralinguistique => sens langagier et pour lequel nous n'avons pas encore de nom. Je pense que ce passage doit se faire travers une reprsentation du monde tel qu'il est peru par le locuteur et qu'on pourrait parler ici de Reprsentation conceptuelle ; le domaine en question peut alors tre appel la CONCEPTIQUE. D'autre part, il s'agit de la PHONTIQUE, responsable du passage textes langagiers (= transcription phontique) => sons langagiers. Je vais me concentrer, dans cette section, exclusivement sur le premier objectif (le deuxime est bauch dans ce qui prcde, et le troisime n'est pas encore suffisamment au point). Mise en garde importante : tant donn la place dont je dispose, je ne peux proposer que des caractristiques incompltes et approximatives ; je suis galement oblig d'utiliser, sans explication, des concepts spciaux hautement techniques, en esprant que les exemples et le contexte suffiront les rendre intelligibles. 4.1. Les objectifs et les aboutissements de la linguistique Sens-Texte La linguistique Sens-Texte comporte quatre divisions, galement reconnues par les autres courants de la linguistique moderne, qui dcoulent de la structure du MST, prsente dans ce qui prcde : la smantique ;

30

la syntaxe ; la morphologie ; la phonologie.


Je vais caractriser brivement chacune de ces divisions, en indiquant certaines des lignes directrices de recherche, ainsi que certains des problmes et des solutions que nous en proposons, dans le cadre de l'approche Sens-Texte. S MANTIQUE La smantique linguistique Sens-Texte ne vise pas autre chose qu'un ensemble de rgles assurant les correspondances entre les RSm et les RSyntP des phrases. Les rgles les plus importantes sont les rgles smantiques lexmiques, dont on en a vu dj un exemple : R 1 , p. 00. Une rgle smantique lexmique tablit la correspondance entre le sens dcompos d'un lexme et ce lexme ; par exemple : (15) (Y) ASSASSINER1 ( l'encontre de) (tuerI.A.1)
1 2 1 1 2 I II

(loiI.1 ) (individu )
1

(individu )
2

(X)

L((X))

L((Y))

(vouloirI.A.1)

[Le soulignement dans la partie gauche de la rgle de l'lment (tuer) l'identifie comme lment communicativement dominant, ou gnrique, du sens reprsent ; (assassiner) est donc un cas particulier de (tuer) (sans cette indication, le rseau dans la partie gauche de (15) pourrait tre interprt comme (X veut tuer Y l'encontre de la loi), ce qui ne correspond pas ASSASSINER1) ; cf. la remarque aprs la RSm (4), p. 00. Comme je l'ai dj dit, les numros lexicaux identificateurs sont pris, ici et dans les autres exemples, dans le Petit Robert.] Le lexme en cause ici est ASSASSINER1 ; son sens est (l'individu X, voulant tuer l'individu Y, tue Y, ceci allant l'encontre de la loi) (on ne peut pas *assassiner par ngligence par hasard, ce qui justifie la composante (voulant tuer Y) ; on ne peut ni *assassiner un animal, ni *assassiner un ministre, ainsi que ni un animal, ni un ministre ne peut assassiner non plus : on a donc besoin de la contrainte smantique (individu) sur X et Y ; tuer un soldat ennemi la guerre ne s'appelle pas assassiner, de sorte que la composante ( l'encontre de la loi) est aussi ncessaire). La partie droite de la rgle prcise les rles syntaxiques profonds que doivent remplir auprs du verbe ASSASSINER 1 les dsignations de l'assassin X et de la victime Y ; ce sont les actants SyntP d'ASSASSINER1 : X est l'actant SyntP I, et Y l'actant SyntP II. Les sens lexicaux peuvent tre plus compliqus ; c'est le cas, par exemple, du lexme franais VOLER2 I.1 ( prendre contre le gr de qqn.). Citons la rgle smantique lexmique correspondante :

31 (16) (non)
1

(objetI.2 (physique)) (prendreI.1)


2 1 1 1 2 1

(contreI.B.1)
1 2

(appartenir1)

(tre)

2 VOLER I.1 I II III

(intention 2)

1 2

(X)
1

(Y)

2 3

(rendreI.1)
2 1

L((X))

L((Y))

L((Z))

(non) (volontI.1)
1

(Z)

(avoirI.1)

La RSm de VOLER2 I.1 peut se lire comme (X prend, contre la volont de Z, l'objet physique Y qu'a Z, sans intention de rendre Y Z) (X vole Y Z, comme dans Le voisin lui a vol une poule). Je ne peux pas prsenter ici les autres types de rgles smantiques : celles qui concernent les phrasmes (en particulier, les fonctions lexicales), les grammmes et les drivatmes, les constructions syntaxiques de toutes sortes et les prosodies) ; disons seulement que cette faon de faire la DCOMPOSITION SMANTIQUE s'applique toutes les classes d'units linguistiques, quelle que soit leur nature. L'tude systmatique de la structure atomique du sens langagier a t entame Moscou tout au dbut des annes 60, au Laboratoire de Traduction Automatique, fond et dirig par V.Rosenzweig : voir Z}olkovskij et al. 1961, Z}olkovskij 1964 et MPiPL 1964. Cette tude, qui a t ensuite mise de l'avant par A.Wierzbicka dans ses nombreux ouvrages partir du dbut des annes 70 (voir, par exemple, son dernier livre Wierzbicka 1996) et dveloppe dans l'uvre importante d'Apresjan (1992, 1995), a chang la smantique linguistique tout autant que la dcouverte de la structure atomique de la matire a chang la physique. Suite cela, la smantique Sens-Texte se consacre avant tout la dcomposition smantique du lexique de la langue tudie. Cette dcomposition est effectue selon des rgles et des critres rigoureux, qui interdisent, entre autres, les cercles vicieux dans les dfinitions lexicographiques. En procdant de cette faon, nous tomberons invitablement sur des primitives smantiques, c'est--dire les sens langagiers indcomposables l'intrieur de la langue. Un inventaire hypothtique universel de ces atomes smantiques est propos dans l'uvre de Wierzbicka. (Dans le cadre du MST, cependant, l'existence des primitives smantiques UNIVERSELLES n'est pas postule. On s'attend la dcouverte des primitives smantiques dans chaque langue tudie, aprs quoi on pourra se poser la question de leur universalit.) Mais l'analyse smantique des lexies ne peut se faire de faon isole, sans rfrence la syntaxe et la cooccurrence lexicale (aussi bien libre que restreinte) de chaque lexie vedette. La tche

32 du smanticien Sens-Texte revient donc laborer des descriptions lexicales multifacettes ( dfinition lexicographique + schma de rgime + fonctions lexicales), c'est--dire des articles du DEC, le dictionnaire dj mentionn plusieurs reprises. De cette faon, la lexicologie, ainsi que la lexicographie, sa contrepartie applique, se trouve au cur des recherches smantiques Sens-Texte. Dans cette perspective, l'importance du lexique est telle qu'on pourrait, sans trop exagrer, qualifier l'approche Sens-Texte de lexicocentrique. Les deux DEC (partiels), l'un du russe (Mel'c]uk & Zholkovsky 1984), l'autre du franais (Mel'c]uk et al. 1982-1997), sont les rsultats tangibles de nos efforts dans cette voie. De plus, un rcent ouvrage (Mel'c]uk et al. 1995) traite des caractristiques gnrales de l'laboration d'un DEC. Le travail lexicographique, si crucial soit-il, n'puise pas, bien entendu, la smantique SensTexte. Voici cinq autres tches smantiques prioritaires qui se posent dans le cadre Sens-Texte : Une laboration plus pousse des rseaux smantiques. Avant tout, on doit explorer le problme des primitives smantiques (Mel'c]uk 1989), ainsi que celui des lments smantiques aux importantes proprits particulires qu'on appelle tiquettes smantiques (par exemple, (action), (acte), (tat), (vnement), (proprit), (individu), (substance), etc. : ces lments influent beaucoup sur la structure des dfinitions lexicographiques o ils apparaissent, ainsi que sur la cooccurrence lexicale libre des lexies concernes ; une partie des tiquettes smantiques pourraient bien tre des primitives). La structuration interne de la reprsentation smantique (Polgure 1992), qui concerne la distinction entre lments poss et prsupposs, ainsi que les contraintes smantiques (comme, par exemple, (individu) en (15)), les sens flexionnels, etc. Le rapport entre la RSm et une reprsentation plus profonde du monde extralinguistique : la Reprsentation conceptuelle (voir p. 00). Les structures communicative et rhtorique au sein de la RSm ; un livre sur ce sujet est en prparation (Mel'c]uk 1997b). L'aspect procdural du passage entre RSm et RSyntP ; des rsultats intressant ce domaine se trouvent dans Iordanskaja & Polgure 1988 et Polgure 1990. Il existe, bien sr, nombre d'autres sujets smantiques, envisags par la linguistique SensTexte, tout aussi fascinants et tout aussi pineux. S YNTAXE La SYNTAXE PROFONDE prsente quatre problmes majeurs pour un syntacticien SensTexte : Le raffinement de l'inventaire des relations SyntP, c'est--dire, par exemple, l'exploration 1) de la distinction entre relation attributive restrictive et relation attributive descriptive, 2) de la nature de la relation entre un verbe de dicours et le discours direct qu'il introduit (par exemple, [Mon Dieu !, ] soupira-t-elle ) et 3) de l'opposition relations SyntP vs lexmes marqueurs des constructions, etc.

L'tude approfondie de la nature des actants SyntP : dfinition et typologie. L'tude de la correspondance entre actants Sm et actants SyntP : entre autres, le problme de la
voix grammaticale en tant que catgorie flexionnelle (voir Mel'c]uk 1993a). L'tude de pronominalisations de toute sorte.

33 La SYNTAXE DE SURFACE presente divers problmes que nous regroupons en six points, dont trois premiers concernent la reprsentation SyntS et les deux derniers, le passage entre RSyntS et RMorphP : Le raffinement de l'inventaire des relations SyntS. L'tude approfondie de la nature des actants SyntS : dfinition et typologie. La correspondance entre actants SyntP et actants SyntS ; parmi les problmes thoriques spcifiques lis cette correspondance, signalons le problme bien connu de l'opposition construction nominative vs la construction ergative (Mel'c]uk 1992b). La morphologisation de la SSyntS, c'est--dire le calcul des toutes les valeurs morphologiques dtermines par la syntaxe de la phrase : accord et rgime (Mel'c]uk 1993b). La linarisation de la SSyntS : l'ordre des mots (en russe : Mel'c]uk 1995 ; pour l'ordonnancement des clitiques en franais, voir Iordanskaja 1982). Une description assez dtaille de la syntaxe de surface de l'anglais (en termes d'arbres de dpendance) est prsente dans Mel'c]uk & Pertsov 1987. M ORPHOLOGIE La MORPHOLOGIE PROFONDE prsente tout un bouquet de problmes linguistiques intressants, dont les suivants : L'analyse et la dfinition du concept de catgorie flexionnelle (Mel'c]uk 1991). La distinction entre flexion et drivation ; ce propos, voir une esquisse d'une thorie de la drivation dans Mel'c]uk 1990. La dfinition des catgories flexionnelles ; par exemple, une dfinition du concept de catgorie de cas grammatical est propose dans Mel'c]uk 1986a. L'inventaire des grammmes d'une langue donne L. La distribution des grammmes tablis par morphmes ; voir, par exemple, le traitement d'un cas particulier le dualisateur et le pluralisateur indpendants dans la langue aloutore dans Mel'c]uk 1986b. L'inventaire des drivatmes de L. La MORPHOLOGIE DE SURFACE calcule, partir d'une chane morphmique qui reprsente un mot-forme, la chane de phonmes correspondante munie, si tel est le cas, de configurations de prosodmes. Les problmes correspondants peuvent tre regroups sous deux rubriques gnrales : L'inventaire et la description des alternances de L. La dtermination de la position de l'accent de force dans les langues qui connaissent l'accent ambulant : accent qui change de position en fonction de facteurs morphologiques ; pour un exemple de modlisation du comportement de l'accent de ce type (hbreu moderne), voir Mel'c]uk & Podolsky 1996. Pour les descriptions quasi exhaustives des fragments ferms de la morphologie de trois langues typologiquement trs diffrentes, le lecteur peut consulter Mel'c]uk 1967a (la conjugaison en espagnol), 1968 (la dclinaison en hongrois) et Mel'c]uk & Aroga Bessong 1983 (la conjugaison en bafia, langue semi-bantoue du Cameroun).

34 PHONOLOGIE La PHONOLOGIE assure la correspondance entre les phonmes/les prosodmes, d'une part, et les phones/les prosodies (= symboles reprsentant les sons et les prosodies de la parole), d'autre part. Son intrt rside, avant tout, dans l'tablissement d'un inventaire de phonmes/de prosodmes de L tel qu'il permette une expression commode et en mme temps lgante de tous les phnomnes morphologiques pertinents. Autrement dit, les problmes phonologiques se rsolvent, dans la linguistique Sens-Texte, dans le cadre de la production de mots-formes. Ainsi, en espagnol, pour assurer le bon fonctionnement d'un modle de la conjugaison, on a besoin de trois sries de phonmes apparents : les voyelles /i/ et /u/, les glides /j/ et /w/, et les consonnes /j[/ et /w[/ (pido, pudo ~ pie, puede ~ hierba, huele) ; voir Mel'c]uk 1965. (La raison principale est l'existetnce des paires de verbes du type cambiar /kambjr/ (changer) ~ enviar /embjr/ (envoyer) : le premier a, la 1re personne du singulier (au prsent de l'indicatif) la forme cambio /kmbjo/ */kambo/, et le second, envo /embo/ */mbjo/ ; pour les produire correctement, le radical du premier verbe doit tre /kambj/, avec un glide, alors que celui du second a une voyelle : /embi/.) Le survol rapide effectu ci-dessus suffit, me semble-t-il, donner au lecteur une ide sinon trs profonde, du moins assez structure du champ d'tude dans l'approche Sens-Texte, de ses cibles et de quelques-uns de ses aboutissements. Passons maintenant au deuxime volet de la discussion : l'laboration d'un mtalangage linguistique unifi. 4.2. L'appareil conceptuel de la linguistique La linguistique est la seule science actuelle dont l'objet concide avec le discours qu'elle tient sur lui, a crit C.Hagge (1986 : 81) ; on ne peut le dire mieux. Le problme est que les linguistes se servent des langues naturelles pour parler des langues naturelles. Il en dcoule invitablement que la construction d'un appareil conceptuel assez formalis et d'une terminologie correspondante a dans la linguistique une importance beaucoup plus grande que dans les autres sciences, o l'objet et l'instrument ne concident pas. C'est d'en avoir pris conscience qui m'a amen, il y a plus de 30 ans dj, me lancer dans l'laboration d'un mtalangage linguistique, bas sur un systme conceptuel suffisamment formel pour assurer une vision gnrale, cohrente et homogne de la linguistique. On peut comparer ma dmarche celle du groupe mondialement connu des mathmaticiens franais qui, vers la fin des annes trente, sous le nom d'emprunt de Nicolas Bourbaki, avaient cherch crer une vision et un mtalangage unifis pour l'ensemble des mathmatiques modernes (au sujet de l'uvre de Bourbaki, voir Halmos 1957 et Queneau 1978). Mon travail s'est fortement inspir des rsultats bourbakistes (encore une autre French connection !). J'ai notamment propos, pour la morphologie linguistique, un systme dductif de concepts (Mel'c]uk 1993-1997). partir d'un nombre limit de concepts non dfinis (emprunts, d'une part, la logique et aux mathmatiques et, d'autre part, aux autres domaines de la linguistique la smantique, la syntaxe et la phonologie), je propose des dfinitions rigoureuses pour des concepts comme signe (linguistique), reprsentabilit de signes par d'autres signes, ..., mot-forme, lexme, racine vs affixe , catgorie flexionnelle et grammme , cas grammatical, voix , ..., morphe vs morphme, suppltion, rduplication1/2, alternance, apophonie, ... et des dizaines d'autres.

35 Je pense qu'il est utile de prsenter ici un exemple concret qui dmontre mon avis de faon trs claire quel point une bonne terminologie sous-tendue par un systme conceptuel bien form peut tre importante en linguistique thorique et descriptive. Depuis des dcennies on crit que, dans les langues nilotiques du sud (le massa, le turkana, le teso, etc.), le cas nominatif et le cas accusatif ont des proprits si exotiques que ces langues s'opposeraient toutes les autres langues de la Terre. Ouvrons une grammaire (excellente d'ailleurs) du massa (Tucker and Mpayeei 1955) ; nous y apprenons que : l'accusatif est la forme de citation ; le nominatif se forme partir de l'accusatif (par un changement tonal) ; le nominatif, mais non l'accusatif, est rgi par des prpositions ; l'accusatif s'utilise pour marquer le thme antpos au verbe ; la forme d'adresse est l'accusatif, sauf si elle est introduite par une particule spciale, qui la met au nominatif ; les adjectifs et les numraux, en tant que complments de la copule (tre), sont l'accusatif ; le nominatif marque (mis part le sujet syntaxique), les complments d'objet indirects et obliques. On ne trouve nulle part ailleurs un pareil faisceau de proprits extravagantes pour ces deux cas, les plus importants dans les grammaires descriptives et dans la thorie linguistique. Ce traitement des cas massa, adopt pour toutes les langues de la famille nilotique, soulve de srieux problmes pour ce qui est de la description de la voix passive : le sujet du passif est dit tre l'accusatif, alors que le complment d'agent (qui existe dans certains parlers du massa) apparat au nominatif. Se fondant sur les analyses disponibles l'poque, E. Keenan (1976: 326-328) a mme propos toute une nouvelle thorie des voix. Or il s'agit tout simplement d'un quiproquo d une dnomination fautive : les africanistes ont appel nominatif la forme du nom qui sert de sujet syntaxique tous les verbes, et accusatif, la forme qui remplit le rle d'objet direct ; c'est--dire qu'on a bel et bien suivi la grammaire... latine ! Pourtant, rien ne justifie d'appeler les cas grammaticaux d'aprs les fonctions syntaxiques qu'ils signalent : si on identifie le cas et la fonction syntaxique, il n'est plus besoin de deux concepts distincts. La dualit cas ~ fonction syntaxique est importante justement parce que la fonction syntaxique et les cas qui la marquent sont logiquement indpendants. Je propose que le nominatif soit TOUJOURS (= dans n'importe quelle langue) dfini comme tant le cas de nomination des objets conformment l'tymologie du mot nominatif . Si nous l'admettons et, en consquence, inversons les noms des cas dans les grammaires des langues nilotiques, tout se met en place : le premier cas du massa n'est pas un accusatif mais un nominatif, alors que ce qu'on appelle maintenant le nominatif est un oblique ; le nominatif est alors la forme de citation (par dfinition) et la forme de base partir de laquelle l'oblique est form par des apophonies tonales. Le cas qui suit une prposition est bien l'oblique, comme on s'y attend, et le complment d'agent au passif est aussi l'oblique, ce qui est aussi tout a fait naturel. Les langues nilotiques sont donc, du point de vue de leur systme casuel, comme toutes les autres langue du monde. Elles possdent quand mme un trait spcifique : leur sujet syntaxique est toujours l'oblique, et l'objet direct, au nominatif. Autrement dit, ces langues prsentent avec n'importe quel verbe, y compris la copule

36 une construction ergative de la phrase (Mel'c]uk 1997a). Mais la construction ergative est largement rpandue et n'a rien d'exotique. Il est inutile de multiplier des exemples : il est clair qu'en linguistique, une terminologie prcise, s'appuyant sur un systme de concepts rigoureux, est absolument vitale, faute de quoi de nombreuses discussions dgnrent en dialogues de sourds et la comprhension mutuelle entre linguistes devient impossible. Je crois qu'un dveloppement harmonieux de la thorie linguistique, ainsi que des progrs sensibles des modles fonctionnels des langues sont impossibles sans un mtalangage linguistique unifi. La thorie Sens-Texte met donc la tche d'laboration d'un systme conceptuel et d'une terminologie correspondante au premier plan de la recherche en linguistique. 5. L'apport possible de la linguistique Sens-Texte pour la socit humaine Dans sa leon inaugurale au Collge de France, C.Hagge (1988 : 29-31) a parl de trois domaines o la linguistique s'avre utile l'humanit : l'histoire des civilisations, la planification linguistique (usage normatif, orthographe, nologismes, terminologies, ...) et l'tude de l'Homme. Le premier sort tout fait du champ Sens-Texte ; mais pour le deuxime et le troisime, la linguistique Sens-Texte a bien des choses en rserve. En effet, un modle fonctionnel d'une langue L prsente tout d'abord une UTILIT PRATIQUE au moins dans : 1) le traitement automatique de la langue naturelle, TALN (y compris la traduction automatique, la gnration de textes, les systmes d'interrogation de bases de donnes en langue naturelle, etc.) ; 2) l'apprentissage des langues (trangres et maternelles) ; et 3) la cration d'ouvrages de rfrence aussi bien dictionnaires de collocations, de rgime, de synonymes, que grammaires de consultation, manuels, etc. Grce leur caractre formalis et surtout leur point de vue spcifique Comment exprimer telle pense dans telle langue ? les MST offrent des moyens commodes pour atteindre ces objectifs. En mme temps, les MST des langues me paraissent prsenter un INTRT THORIQUE encore plus important. En effet, jusqu'aujourd'hui, l'volution scientifique a surtout port sur la matrise de l'nergie et de la matire. Nous avons fondamentalement augment nos forces physiques (de la machine vapeur la bombe H) et considrablement renforc nos organes de locomotion (la navette spatiale, sans parler des T.G.V., etc.), ainsi que nos organes de perception (le microscope lectronique, le spectromtre, le radiotlescope, etc.). Nous avons pntr dans l'atome et dans les profondeurs de l'espace ; nous avons appris des choses importantes sur l'apparition de notre univers et sur la structure de nos gnes. Mais nous n'avons pas fait de progrs comparables dans le domaine du traitement de l'information par le cerveau humain. Nous connaissons trop peu de choses sur le fonctionnement informatique de notre raison, et pourtant le renforcement de cet organe, c'est-dire la cration d'outils puissants capables de suppler certaines fonctions essentielles de la raison, est, mon avis, la tche la plus pressante de la science moderne. Face au problme crucial du 21e sicle le manque de ressources naturelles sur la Terre pour une population qui s'accrot nous avons un besoin aigu d'un SUPERCERVEAU , c'est--dire de machines capables de penser une chelle que l'Homme seul ne saurait atteindre. Il nous faut des modles, et de bons modles, de la pense humaine. La communaut scientifique l'a bien compris et, selon toute probabilit, la plupart

37 des savants sont d'accord avec ce programme. Les rnombreuses recherches en Intelligence Artificielle travers le monde dont le but est de modliser tous les aspects du comportement intelligent, en sont une bonne preuve. Cependant, on oublie trop souvent que, pour avoir accs la pense humaine, la langue est la seule cl fiable. J'insiste : 1) Le meilleur moyen d'accs la comprhension du fonctionnement de la pense est la comprhension du fonctionnement de la langue. 2) Le meilleur moyen d'accs la comprhension du fonctionnement de la langue est un modle Sens-Texte, c'est--dire un modle qui permette de relier la pense inobservable du locuteur la seule chose qui est aujourd'hui observable pour nous le texte que celui-ci produit. On ne pourra jamais comprendre comment notre cerveau traite les informations sans savoir comment la langue y fonctionne. De nos jours, les modles fonctionnels de la langue acquirent donc une importance toute particulire : ils peuvent contribuer de faon essentielle la comprhension que nous avons de nous-mmes et, plus prcisment, de notre pense. J'ose penser que le modle SensTexte aura l un rle jouer. Remerciements Le texte de cet expos a t lu, critiqu et comment par M.Alonso Ramos, L.Iordanskaja, S.Kahane, J.Lvy, J.Milic;evic; et A.Polgure. Je les remercie de tout mon cur pour leur aide, qui m'a permis d'amliorer grandement la formulation de mes ides. Notes Des neurologues peuvent en principe tenter de telles observations directes, et certains progrs ont effectivement t dj faits dans cette voie ; nanmoins, dans cet expos, je ne veux considrer que les approches strictement linguistiques.
1

Je laisse de ct les autres sens du nom MODLE, qu'on voit, par exemple, dans les noncs suivants : Harpagon est le modle de l'avare ; des garons modles ; des modles nus ; Renaud modle 1991 ; etc. Des relations converses de ce type sont assez frquentes dans le lexique des langues naturelles. Ainsi, on dit en franais louer dans le sens (prendre en location) et (donner en location) ; de faon similaire, le terme hte s'applique celui qui reoit quelqu'un et celui qu'on reoit.
4 3

Chao 1962 offre une liste d' peu prs 40 interprtations donnes en linguistique au terme modle. Il est donc tout fait justifi de chercher viter les confusions possibles !

L'autre structure faisant partie de la RMorphP d'une phrase est la structure morphologique prosodique, qui reflte la division de la phrase en syntagmes phontiques, c'est--dire en vrais constituants.

Pour ne pas encombrer l'expos, j'indiquerai, dans cette note, trois cas typiques de dcalages importants entre la SMorphP et la SMorphS d'un mot-forme :

38

Expression cumulative/agglutinative de grammmes :


russe DOM (maison)pl, gn vs turc EV (maison)pl, gn l'lment thmatique) : espagnol TOCAR (toucher)ind, imparf, 3, pl <> {TOC-}, {L.THM}, {IND.IMPF}, {3PL} <> {DOM-}, {PL.GN} <> {EV-}, {PL}, {GN} (dom + ov ) (ev + ler+ in )

Prsence des morphmes vides, exigs par le type flexionnel du lexme (en l'occurrence,

(toc+a+ba+n) Expression double de certains grammmes : hbreu moderne LEJLA (nuit)pl, 1sg nuits)) L'existence de nombreux signes morphologiques non segmentaux (apophonies, rduplications, conversions) complique encore la correspondance entre SMorphP et SMorphS.
7

<> {LEJL}, {PL}, {PL}, {1SG}

(lejl + ot + a + j ( m e s

Les constructions syntaxiques ayant un sens propre ne sont pas trs rpandues en franais, mais quand mme elles y existent. Ainsi, la construction PRONOMinterr____Vinf (Qui pouser ?, qui m'adresser ? ou O aller ?) exprime le sens ( pourrais-je ou devrais-je). propos des constructions syntaxiques porteuses de sens, voir Mel'c]uk 1987.

Je ne peux faire ici le point sur la thorie smantique sous-jacente l'approche Sens-Texte ; je me limite donc la mention des noms des principaux chercheurs qui ont lanc la smantique nouvelle au dbut des annes 60.
9

Les deux dfinitions ont t simplifies pour fins d'illustration ; pour une discussion dtaille du comportement de la ngation avec les sens du type prsent en (12), ainsi que les dfinitions du verbe DOUTER, de l'adjectif SR et de quelques lexies similaires, voir Iordanskaja 1986.

La ngation est ici phrasologise : une ngation normale n'affecte pas les prsupposs, alors que dans ne pas douter ne pas avoir de doute le prsuppos de (douter avoir des doutes) (n'ayant pas la croyance P a lieu) se trouve dans le champ de la ngation. Cette proprit de la ngation (indique dans Iordanskaja 1986: 355-356) doit tre explicitement spcifie dans l'article de dictionnaire de DOUTER/DOUTE.
11

10

Cette rserve est ncessaire pour deux raisons : D'une part, beaucoup de collocations ncessitent, pour leur description, des FL non standard, qui sont en nombre est lev et s'appliquent chacune trs peu de lexies : par exemple, (sans ajout de produit laitier)(caf) = noir ou (sans ajout de produit laitier ou de fruit)(th) = nature. Les FL non standard ne sont pas universelles non plus : leur jeu est spcifique chaque langue et doit tre tabli de faon empirique.

39

D'autre part, certaines collocations sont dcrites par le schma de rgime plutt que par des FL :
par exemple, les collocations assurance MALADIE (cf. angl. HEALTH insurance (assurance sant)) ou condamner MORT/ PERPTUIT, etc., o les expressions en petites capitales correspondent aux actants smantiques de la lexie vedette L et, en tant que tels, doivent tre spcifies comme rgime de L. J'ai dcouvert les fonctions lexicales au dbut des annes 60, lors de ma participation une expdition gologique dans la zone montagneuse semi-dsertique du sud du Kazakhstan, avec l'intention de les utiliser dans la Traduction Automatique. Quand j'ai eu l'ide de ce qui est devenu plus tard (avec la collaboration prcieuse de A.Zholkovsky : Z}olkovskij & Mel'c]uk 1967) les FL Magn et Oper , j'tais en train de chercher une mthode simple permettant d'viter les milliers de
1 12

tests fastidieux alors ncessaires pour que l'ordinateur trouve les quivalents russes dtermins par le contexte lexical des lexmes anglais comme HEAVY, IMPORTANT, EXTENSIVE, HIGH, etc. d'une part, et [to] DO, [to] MAKE, [to] GIVE, [to] GET, etc., de l'autre. Il suffit de prendre quelques exemples au hasard pour mesurer l'tendue de ce problme, d'ailleurs bien connu des traducteurs : HEAVY [rain], litt. (pluie lourde), correspond en russe SILNYJ [doz]d] (pluie forte), alors que HEAVY [losses] (pertes lourdes) est rendu par TJAZ}LYE [poteri], galement ( pertes l o u r d e s ) , s'il s'agit des pertes en personnel la guerre, et par SEREZNYE/ZNAC }ITELNYE [poteri ] (pertes srieuses /considrables ) au cas de pertes financires ; alors que HEAVY [prison terms ] ( lourdes peines de prison) se traduit par DLITELNYE [sroki zakljuc]enija], litt. (peines de longue dure), et ainsi de suite; GIVE [a talk] (donner une confrence) se traduit par C}ITAT [doklad] (lire une confrence), mais GIVE [a look], litt. (donner un regard), par BROSIT [vzgljad] (jeter un regard). Les FL permettent d'tablir les correspondances interlinguistiques entre cooccurrents contextuels de faon directe et logique. Cette vise des FL est explicitement formule dans l'article Z}olkovskij & Melc]uk 1967, mentionn cidessus ; voir son application dans Danlos 1994. Rfrences Apresjan, Ju. 1992. Lexical Semantics. User's Guide to Contemporary Russian Vocabulary. Ann Arbor (MI), Karoma. 633 pp. Apresjan, Ju. 1995. Izbrannye trudy. Tom II. Integralnoe opisanie jazyka i sistemnaja leksikografija [uvres choisises. Vol. II. Description intgrale de la langue et la lexicographie systmatique]. Moskva, Jazyki russkoj kultury. 767 pp. Auger, P. 1965. Les modles dans la science. Diogne, n 52, 3-15. Chao, Yuen Ren. 1962. Models in Linguistics and Models in General. In : Nagel et al. (eds) 1962: 558-566. Danlos, L. 1994. Coder des informations monolingues sur les noms pour viter des rgles bilingues sensibles au contexte. Langage, n 116, 95-110. Hagge, C. 1986. Homme des paroles. Paris, Fayard. 406 pp. Hagge, C. 1988. Leon inaugurale. Paris, Collge de France. 32 pp. Halmos, P. 1957. Nicolas Bourbaki. Scientific American, n 5, 88-99.

40 Iordanskaja, L. 1963. O nekotoryx svojstvax pravilnoj sintaksic]eskoj struktury (na materiale russkogo jazyka [Quelques proprits de la structure syntaxique bien-forme ( base du russe)]. Voprosy jazykoznanija, n 4, 102-112. Iordanskaja, L. 1982. Le placement linaire des clitiques pronominaux non-sujets en franais contemporain. Lingvistic Investigationes, 6: 1, 145-188. Iordanskaja, L. 1986. Proprits smantiques des verbes promoteurs de la ngation en franais. Lingvistic Investigationes, 10: 2, 345-380. Iordanskaja, L., I.Mel'c]uk. 1997. Le corps humain en russe et en franais : Vers un Dictionnaire explicatif et combinatoire bilingue. In : Hommage Yves Gentilhomme [= Cahiers de lexicologie, 70: 1]. Iordanskaja, L., A.Polgure. 1988. Semantic Processing for Text Generation. In : Proceedings of the First International Computer Science Conference '88, 19-21 December 1988, Hong Kong, 310-318. Keenan, E. 1976. Towards a Universal Definition of Subject. In : Ch.Li (ed.), Subject and Topic, New York, etc. : Academic Press, 303-333. Mel'c ]uk, I. 1965. O fonologic]eskoj traktovke "poluglasnyx" v ispanskom jazyke [Traitement phonologique des semivoyelles espagnoles]. Voprosy jazykoznanija , n 4, 92-109. [Traduction anglaise: Linguistics, 1973, n 109, 35-60.] Mel'c]uk, I. 1968. Model sklonenija vengerskix sus]c]estvitelnyx [Un modle de dclinaison des noms en hongrois]. In: S. S}aumjan, rd., Problemy strukturnoj lingvistiki 1967, Moskva, Nauka, 1968, 344-373. Mel'c]uk, I. 1967a. Ordre des mots en synthse automatique des textes russes. T.A.Informations, 8: 2, 65-84. Mel'c]uk, I. 1967b. Model sprjazenija v ispanskom jazyke [Un modle de conjugaison en espagnol]. Masinnyj perevod i prikladnaja lingvistika, Institut des Langues Etrangres de Moscou, v. 10, 21-53. [Traduction anglaise: V.Ju. Rozencvejg (ed.), Essays on Lexical Semantics , I, 1974, Stockholm: SCRIPTOR, 43-94 ; une version rcente amliore : Voz y Letra, 1993, 4: 1, 985.] Mel'c]uk, I. 1968. Model sklonenija vengerskix sus]c]estvitelnyx [Un modle de dclinaison des noms en hongrois]. In: S. S}aumjan (rd.), Problemy strukturnoj lingvistiki 1967, Moskva, Nauka, 1968, 344-373. Mel'c]uk, I. 1973. Towards a Linguistic "Meaning<> Text" Model. In : F.Kiefer (ed.), Trends in Soviet Theoretical Linguistics, Dordrecht, Reidel, 33-57. Mel'c ]uk, I. 1974. Opyt teorii lingvistic]eskix modelej "Smysl <> Tekst". Semantika, Sintaksis [Esquisse d'une thorie des modles linguistiques du type "Sens <>Texte". La smantique, la syntaxe]. Moskva, Nauka. 314 pp. Mel'c]uk, I. 1981. Meaning-Text Models: A Recent Trend in Soviet Linguistics. Annual Review of Anthropology, v. 10, 27-62. Mel'c]uk, I. 1986a. Toward a Definition of Case. In : R.Brecht and J.Levine (eds), Case in Slavic, Columbus (OH), Slavica, 35-85.

41 Mel'c]uk, I. 1986b. The Dualizer and Pluralizers in the Alutor Verb. In : B.Elson (ed.), Language in Global Perspective. Papers in Honor of the 50th Anniversary of the Summer Institute of Linguistics (1935-1985), 1986, Dallas (TX), SIL, 421-438. Mel'c]uk, I. 1987. Un affixe drivationnel et un phrasme syntaxique du russe moderne. Essai de description formelle. Revue des tudes slaves, 59: 3, 631648. [Rimprim dans Mel'c]uk, I., The Russian Language in the Meaning-Text Perspective, Moskva/Wien, Wiener Slawistischer Almanach/Jazyki russkoj kultury.] Mel'c]uk, I. 1988. Dependency Syntax : Theory and Practice. Albany (NY), The SUNY Press. 428 pp. Mel'c]uk, I. 1989. Semantic Primitives from the Viewpoint of the Meaning-Text Linguistic Theory. Cuaderni di semantica, 10: 1, 65-102. Mel'c]uk, I. 1990. Slovoobrazovanie v lingvistic]eskix modeljax tipa "Smysl<>Tekst" (predvaritelnye zamec]anija) [La drivation dans les modles linguistiques du type Sens-Texte (remarques prliminaires)]. In : Z.Saloni (red.), Metody formalne w opisie jezykw sowian;skich, Biaystok, Wydawnictwo Filii UW w Biaymstoku, 47-74. Mel'c]uk, I. 1991. Toward a Universal Calculus of Inflectional Categories: On Roman Jakobsons Trail. In : L.Waugh and S.Rudy (eds), New Vistas in Grammar: Invariance and Variation, Amsterdam/Philadelphia, Benjamins, 85-109. Mel'c]uk, I. 1992a. Paraphrase et lexique : la thorie Sens-Texte et le Dictionnaire explicatif et combinatoire. In : Mel'c]uk et al. 1992: 9-58. Mel'c]uk, I. 1992b. Towards a Logical Analysis of the Notion 'Ergative Construction'. Studies in Language, 16: 1, 91-138. Mel'c]uk, I. 1993a. The Inflectional Category of Voice: Towards a More Rigorous Definition. In : B.Comrie and M.Polinsky (eds), Causativity and Transitivity, Amsterdam/Philadelphia, Benjamins, 1-46. Mel'c]uk, I. 1993b. Agreement, Government, Congruence. Linguistic Investigationes, 17: 2, 307373. Mel'c]uk, I. 1993c. La phrasologie et son rle dans l'enseignement/apprentissage d'une langue trangre. tudes de Linguistique Applique, vol. 92, 82-113. Mel'c ]uk, I. 1993-97. Cours de morphologie gnrale. Vol. 1-4. Montral/Paris, Presses de l'Universit de Montral/ditions du C.N.R.S. Vol. 1 (1993) : 412 pp. ; vol. 2 (1994) : 456 pp. ; vol. 3 (1996) : 326 pp. ; vol. 4 (1997). Mel'c]uk, I. 1995. Porjadok slov v russkoj fraze [L'ordre des mots dans la phrase russe]. In : Mel'c]uk, I., The Russian Language in the Meaning-Text Perspective, Moskva/Wien, Wiener Slawistischer Almanach/Jazyki russkoj kultury, 273-321. Mel'c]uk, I. 1996. Lexical Functions: A Tool for the Description of Lexical Relations in the Lexicon. In : L.Wanner (ed.), Lexical Functions in Lexicography and Natural Language Processing, Amsterdam/Philadelphia, Benjamins, 1996, 37-102. Mel'c]uk, I. 1997a. Grammatical Cases, Basic Verbal Construction, and Voice in Maasai: Towards a Better Analysis of the Concepts. In : W.Dressler et al. (eds), Towards Progress in Morphology, Amsterdam/ Philadelphia, Benjamins.

42 Mel'c]uk, I. 1997b. Communicative Organization of Sentences in Natural Language [manuscrit]. Mel'c]uk, I. (avec N.Arbatchewsky-Jumarie, L.Elnitsky, I.Iordanskaja, et A.Lessard ; rd. A.Clas). 1984. Dictionnaire explicatif et combinatoire du franais contemporain : Recherches lexicosmantiques I. Montral, PUM. 172 pp. Mel'c]uk, I. (avec N.Arbatchewsky-Jumarie, L.Dagenais, L.Elnitsky, L.Iordanskaja, M.-M.Lefebvre, et S.Mantha ; rd. A. Clas). 1988. Dictionnaire explicatif et combinatoire du franais contemporain. Recherches lexico-smantiques II. Montral, PUM. 332 pp. Mel'c]uk, I. (avec N.Arbatchewsky-Jumarie, L.Iordanskaja, et S.Mantha ; rd. A.Clas). 1992. Dictionnaire explicatif et combinatoire du franais contemporain. Recherches lexico-smantiques III. Montral, PUM. 323 pp. Mel'c]uk, I., D.Aroga Bessong. 1983. Un modle formel de la conjugaison bafia ( l'indicatif). Bulletin of the School of Oriental and African Studies, 46: 3, 477-528. Mel'c]uk, I., A.Clas, A.Polgure. 1995. Introduction la lexicologie explicative et combinatoire. Louvain-la-Neuve, Duculot. 256 pp. Mel'c]uk, I., N.Pertsov. 1987. Surface Syntax of English. A Formal Model Within the Meaning-Text Framework. Amsterdam/Philadelphia, Benjamins. 526 pp. Mel'c ]uk, I., B.Podolsky. 1996. Stress in Modern Hebrew Nominal Inflection. Theoretical Linguistics, 22 : 1-2, 155-194. Mel'c]uk, I., E.Savvina. 1978. Toward a Formal Model of Alutor Surface Syntax: Predicative and Completive Constructions, Linguistics, Special Issue, 5-39. [Rimprim dans Mel'c]uk 1988.] Mel'c]uk, I., A.Zholkovsky. 1984. Explanatory Combinatorial Dictionary of Modern Russian. Wiener Slawistischer Almanach, Wien. 992 pp. Molino, J. 1985. O en est la morphologie? Langages, 78, 5-40. MPiPL. 1964. Mas]innyj perevod i prikladnaja lingvistika [Traduction automatique et linguistique applique]. Vol. 8. Moskva, Institut inostrannyx jazykov im. M. Toreza. Nagel, E., P.Suppes, A.Tarski (eds). 1962. Logic, Methodology and Philosophy of Science. Stanford, CA: Stanford University Press. Polgure, A. 1990. Structuration et mise en jeu procdurale d'un modle linguistique dclaratif dans un cadre de gnration de texte. Montral, Univ. de Montral, Dp. de linguistique et traduction [thse de doctorat]. 313 pp. Polgure, A. 1992. Remarques sur les rseaux smantiques Sens <> Texte. In : A.Clas (rd.), Le mot, les mots, les bons mots, Montral, PUM, 109-148. Queneau, R. 1978. Bords: mathmaticiens, prcurseurs, encyclopdistes. Paris, Hermann. Tesnire, L. 1959. lments de syntaxe structurale. Paris, Klincksieck. Tucker, A. , J.T. ole Mpaayei. 1955. A Maasai Grammar with Vocabulary. London, Longmans, Green and C. Wierzbicka, A. 1996. Semantics. Primes and Universals. OxfordNew York, Oxford University Press. 500 pp. Z }olkovskij, A. 1964. Predislovie [Prface]. MPiPL 1964, 3-16. [Traduction anglaise: V.Ju. Rozencvejg (ed.), Essays on Lexical Semantics , I, 1974, Stockholm: SCRIPTOR, 00-00.]

43 Z}olkovskij, A., N.Leonteva, Ju.Martemjanov. 1961. O principialnom ispolzovanii smysla pri mas ]innom perevode [Sur l'utilisation essentielle du sens en traduction automatique]. In : Mas ]innyj perevod, 2, Moskva, Institut toc]noj mexaniki i vyc]islitelnoj texniki AN SSSR. [Traduction anglaise: V.Ju. Rozencvejg (ed.), Essays on Lexical Semantics , I, 1974, Stockholm: SCRIPTOR, 00-00.] Z}olkovskij, A., I.Mel'c]uk. 1967. O semantic]eskom sinteze [Sur la synthse smantique]. Problemy kibernetiki, v. 19, 177-238. [Traduction franaise: T.A.Informations, 1970, n 2, 1-85.]

You might also like