You are on page 1of 205

Anexa 1

Calculul cu predicate de ordinul I


1.1 Denirea FOPC
Denit iile din aceasta anexa prezint a formal un model de logica, construit pe baza
not iunilor din [11] si [12], unde sunt realizate aplicat ii ale calculului cu predicate n
domeniul lingvisticii respectiv teoria mult imilor. Pentru informat ii suplimentare se
mai pot utiliza de exemplu [3], [10].
Orice teorie axiomatica se dezvolta n cadrul unui sistem formal constituit din
urmatoarele grupe de elemente: simboluri primitive (obiecte indivizibile indiferent
de aspectul extern sau de modul de specicare), formule (construct ii sintactice pe
baza simbolurilor primitive si a unor reguli precise), axiome (formule alese dupa
anumite criterii si cu un anumit grad de specicare) si reguli de inferent a (care
permit deducerea de noi formule pornind de la axiome).
Calculul cu predicate de ordinul I (FOPC - First Order Predicate Calculus) este
un caz particular al calculului propozit ional. El foloseste drept categorii sintactice
Term (Termeni), Pred (Predicate) si Form (Formule).
Simbolurile primitive din FOPC sunt:
Simboluri logice:
Conectori: (negat ie), (disjunct ie), & (conjunct ie), (implicat ie),
(echivalent a).
Cuanticatori: (cuanticatorul existent ial), (cuanticatorul univer-
sal).
Simboluri auxiliare:

(

.
Constante: valori primitive (eventual indexate) peste un alfabet xat. De
exemplu: a, beta, c
2
, . . .
Variabile: elemente neprecizate, notate cu litere mici (eventual indexate) de
la sfarsitul alfabetului (x, y, z
5
, . . .).
Vom nota cu C, V mult imea constantelor respectiv a variabilelor. Acestea sunt
mult imi (teoretic) innite si disjuncte. Prin denit ie, Term = V C.
195
196 ANEXA 1. CALCULUL CU PREDICATE DE ORDINUL I
Un aspect fundamental - din punct de vedere al aplicat iilor - l constituie sta-
bilirea domeniului L al obiectelor de studiu, domeniu din care vor lua valori varia-
bilele; acesta poarta de obicei numele de univers al discursului. Evident, C L.
Tot aici vor denite si mult imile de valori ale predicatelor.
Predicatele sunt aplicat ii : Term L. Vom nota cu Pred k mult imea predi-
catelor de aritate k(k 1). Astfel, (apartenent a), = (egalitatea) sunt aplicat ii
din Pred 2 n teoria mult imilor; n lingvistica putem exemplica cu
merge, mananca Pred 1, saruta, iubeste, arata Pred 2, . . .
Vom nota cu Pred clasa tuturor predicatelor, indiferent de aritate.
Se deneste inductiv clasa Form, astfel:
Term Form;
Daca P Pred n, T
1
, . . . , T
n
Term, atunci P(T
1
, . . . , T
n
) Form;
Daca P, Q Form atunci
P, (P Q), (P&Q), (P Q), ((P Q) Form;
Daca P Form, x V , atunci
x P Form, x P Form;
Orice formula se obt ine prin aplicarea de un num ar nit de ori a regulilor
precedente.
Observat ii:
1. Uneori se pot introduce predicate noi pentru scrierea simplicata a formulelor.
Astfel, (x = y) poate scrisa x = y prin introducerea unui nou predicat binar
=. Sau, n lingvistica, este cazul antonimelor.
2. Atunci cand este posibil, parantezele sunt eliminate. Aceasta se poate reali-
za n funct ie de prioritatea conectorilor si cuanticatorilor. Daca (x) este
prioritatea lui x, atunci
() = () = () > (&) > () > () = ().
1.2 Axiomele FOPC
1.
A (B A)
(A B) ((A (B C)) (A C))
2.
A (B A&B)
A&B A
A&B B
3.
A A B
B A B
(A C) ((B C) (A B C))
1.3. REGULILE DE INFERENT

A ALE FOPC 197
4.
(A B) ((A B) A)
A A
5.
(A B) ((B A) (A B))
(A B) (A B)
(A B) (B A)
6. x(A(x)) A(a)
7. A(a) x(A(x))
Primele cinci axiome sunt valabile pentru orice calcul propozit ional, iar ultimele
doua sunt specice FOPC.
Aceste axiome sunt de fapt scheme de axiome, n sensul ca ecare caz particular
de alegere a formulelor conduce la o axioma. De fapt, dupa cum se observa din
modul de scriere, orice axioma este o formula (un element din Form).
1.3 Regulile de inferent a ale FOPC
1. Modus Ponens:
A, A B
B
2. Universalizarea consequentului:
C A(x)
C x(A(x))
unde C nu cont ine variabila x.
3. Universalizarea antecedentului:
A(x) C
x(A(x)) C
unde C nu cont ine variabila x.
Daca regula Modus Ponens este adevarat a n orice calcul propozit ional, ultimele
doua reguli de inferent a sunt specice FOPC.
Dupa cum se vede, o regula de inferent a este un procedeu de deduct ie a unei
formule din alta formula.
Teoremele (propozit iile, lemele) sunt deduse din axiome folosind regulile de infe-
rent a.

In acest context, se numeste demonstrat ie a unei formule P Form orice
secvent a nita

1
,
2
, . . . ,
n

i
Form
denita astfel:

n
= P

i
(1 i n) este o axioma sau se obt ine din
1
, . . . ,
i1
prin folosirea unei
reguli de inferent a.
198 ANEXA 1. CALCULUL CU PREDICATE DE ORDINUL I

In aceste condit ii, formula P este demonstrabila.


O axioma este independenta de celelalte axiome daca ea nu poate dedusa din
ele.
Sistemul se numeste independent daca ecare axioma este independenta de cele-
lalte.
Daca pentru orice formul a P a sistemului, ori P ori P este demonstrabila,
atunci sistemul este numit complet; altfel, este incomplet.
Sistemul este consistent daca nu exista formule P astfel nc at atat P cat si P
sa e demonstrabile.
1.3. REGULILE DE INFERENT

A ALE FOPC 199
Cuprins
1. Studiul limbajului 5
1.1. Ce este un limbaj ? 5
1.2. Aplicat ii ale nt elegerii limbajului natural 6
1.3. Sisteme de evaluare a nt elegerii limbajului 9
1.4. Nivele ale analizei limbajului 12
1.5. Reprezent ari si nt elegeri 14
1.5.1. Sintax a; Structura de reprezentare a propozit iilor 14
1.5.2. Forma logica 16
1.5.3. Reprezentarea nt elesului natural 17
1.6. Libertatea limbajului 17
2. Elemente de lingvistica. Sintaxa limbii 19
2.1. Cuvinte 19
2.2. Elementele expresiilor - substantiv simple 21
2.3. Expresii - verb si propozit ii simple 24
2.4. Complemente directe 25
2.5. Expresii - substantiv complete 26
2.6. Expresii - adjectiv 27
2.7. Expresii - adverb 28
3. Not iuni de morfologie 29
3.1. Structura morfologica a cuvintelor 29
3.2. Prelucrarea morfologica a cuvintelor 30
3.3. Morfologia pe doua nivele 32
3.3.1. Reguli morfologice pe doua nivele 33
3.3.2. Gramatica morfologica pe doua nivele 36
3.4. Morfologia paradigmatica 38
3.4.1. Organizarea terminat iilor 40
3.4.2. Dict ionarul 42
4. Gramatici si analizori sintactici 43
4.1. Gramatici si structuri lingvistice 43
4.2. Semnicat ia unei gramatici bune 45
4.3. Algoritm de analiza sintactica top - down 46
4.4. Algoritm de analiza sintactica bottom - up 49
200 ANEXA 1. CALCULUL CU PREDICATE DE ORDINUL I
5. Alte modele gramaticale 53
5.1. Ret ele de tranzit ie 53
5.2. Analiza sintactic a top - down folosind RTN 54
5.3. Utilizarea automatelor nite n prelucrarea morfologica 56
5.4. Gramatici si programare logica 57
5.5. Denirea formala a unui Speller Checker 59
6. Gramatici pe arbori 63
6.1. Granatici lexicalizate 63
6.2. Lexicalizarea cfg - urilor 65
6.3. Gramatici TAG 68
7. Extensii ale cfg - urilor 73
7.1. Sisteme de caracteristici si gramatici augmentate 73
7.2. Cateva sisteme de caracteristici 76
7.2.1. Caracteristici de numar si persoana 76
7.2.2. Caracteristici ale verbelor 76
7.2.3. Caracteristici binare 78
7.2.4. Valoarea eroare pentru caracteristici 79
7.3. Analiza morfologica si lexiconul 79
8. Utilizarea caracteristicilor n analiza 83
8.1. Generarea gramaticilor cu caracteristici 83
8.2. Analiza sintactica folosind caracteristici 86
8.3. Ret ele de tranzit ie augmentate 89
8.4. Gramatici de unicare 91
9. Semantici si logica formala 97
9.1. Despre FOPC 99
9.2. Sensurile cuvintelor si ambiguitatea 102
9.3. Limbajul formelor logice de baza 104
9.4. Codicarea ambiguitat ii n forma logica 108
10. Modele si structuri semantice 111
10.1. Verbe si stari n forma logica 111
10.2. Rolurile tematice 113
10.3. Exprimarea orala si propozit ii derivate 119
1.3. REGULILE DE INFERENT

A ALE FOPC 201
11. Semantic a si teoria modelelor 121
11.1. Teoria modelelor n semantic a 121
11.1.1. Denirea relat iilor semantice pentru propozit ii 123
11.1.2. Operatori modali si semantici ale universurilor
posibile 124
11.2. Un model teoretic de semantica 125
11.2.1. Logica folosita ca un model de gandire 126
11.2.2. Relat ia dintre logica si semantica 127
11.2.3. O semantica pentru FOPC 128
11.3. Semantici pentru cuanticatori 130
12. Reprezentarea universului cunoasterii 131
12.1. Reprezentarea cunostint elor 131
12.1.1. Tipuri de inferent a 132
12.1.2. Tehnici de inferent a 134
12.2. O reprezentare bazata pe FOPC 136
12.3. Cadrul ca reprezentare a informat iei 138
12.3.1. Sloturi cu restrict ii 140
12.4. Folosirea mult imilor n denirea cuanticatorilor 141
13. Rat ionament si cunoastere 143
13.1. Verbele n reprezentarea cunoasterii 143
13.1.1. Codicarea timpului 145
13.2. Deduct ia automata 147
13.3. Semantici procedurale si chestionare 150
13.3.1. LUNAR - Un sistem de chestionare bazata pe
o baza de date limbaj natural 154
14. Contextul local al discursului 155
14.1. Componentele contextului local al discursului 155
14.1.1. Entit at i de generare a discursului 157
14.1.2. NP nedenite peste domeniul cuanticatorilor
universali 158
14.2. Un model de referire bazat pe liste istorice 159
14.3. Pronume si centralizare (Focus) 160
14.4. Descrieri nite 164
14.4.1. Citirea existent iala si referint a indirecta 166
14.4.2. Referint e la obiecte neevocate prin NP 168
202 ANEXA 1. CALCULUL CU PREDICATE DE ORDINUL I
15. Propozit ii eliptice si anaphora 169
15.1. Referint e denite bazate pe mult imi 169
15.1.1. Referirea la elementele unei mult imi 170
15.1.2. Cuanticatori universali pentru mult imi 171
15.2. Expresii eliptice 172
15.2.1. Restrict ii sintactice referitoare la expresiile eliptice 173
15.2.2. Un algoritm bazat pe sintaxa 174
15.2.3. Preferint e semantice 176
15.3. Anaphora de suprafat a 177
16. Agent conversat ional 179
16.1. Ce este un agent conversat ional 179
16.1.1. Limbajul ca activitate multi - agent 180
16.2. Reprezentarea cunostint elor 182
16.2.1. Despre cunostint ele altora 184
16.3. Dorint e, Intent ii si Planuri 185
16.4. Actele de vorbire ca acte comunicative 187
16.5. Actul comunicativ si recunoasterea intent iilor 189
16.6. Recunoasterea actelor ilocut ionare 190
16.7. Nivele de planicare a discursului 192
Anexa 1 195
Bibliograe 199
Bibliograe
[1] Allen, J. - Natural Language Understanding, The Benjamin/Cummings Publ.
Co. Inc, 1995
[2] Atanasiu, A - Bazele Informaticii; suport de curs pentru anul II seral; Tipograa
Universitatii, 1987;
[3] Atanasiu, A. - Modele matematice n scrierea compilatoarelor; Ed. Olimp, 1996.
[4] Craciun, Dragos- Analizor morfologic pentru limba romana, Lucrare de licent a,
1997
[5] Holan, T, Kubon, V, Platek, M - An implementation of Syntactic Analysis of
Czech, Proceedings of Fourth International Workshop on Parsing Technologies,
Prague and Karlovy Vary, sept. 20-24, 1995, pp. 126-135.
[6] Joshi, A.K., Levi, L.S., Takahashi, M. - Tree Adjunct Grammars, J. Comput.
Syst. Sci. 10(1), 1975.
[7] Joshi, A.K. - How much context-senzitivity is necessary for Characterizing
Structural description - Tree Adjoining Grammars; n Natural Language Pro-
cessing - Theoretical Computational and Psychological Perspectives, Cam-
bridge University Press, 1985.
[8] Joshi, A.K. - The relevance of Tree Adjoining Grammar to generation; n Nat-
ural Language Generation, Martinus Nijho Publishers, Dordrecht, 1987
[9] Schabes, Y. - Mathematical and Computational aspects of Lexicalized Gram-
mars; Eight European Summer School in Logic, Language and Information,
Praga, 12-23 August 1996
[10] Partee, B., Meulen, A., Wall, R. - Mathematical Methods in Linguistics, Kluwer
Academic Publishers, 1990
[11] Partee, B., Borsev, V.B. - Fundamentele semanticii formale, Prelegeri seminarul
Mathesus, Praga martie 1998
[12] T iplea, F.L. - Introducere n teoria mult imilor - Editura Universitat ii Al. I.
Cuza, Iasi, 1998
[13] Gramatica Limbii Romane, Editura Academiei, 1966
203
Prelegerea 1
Studiul limbajului
1.1 Ce este un limbaj ?
Limbajul este unul din aspectele fundamentale ale comportamentului uman, element
crucial al viet ii.

In forma scrisa el serveste ca nregistrare pe termen lung, util
transmiterii cunostint elor de la o generat ie la alta.

In forma vorbit a, el este una din
coordonatele primare ale relat iei dintre oameni.
Din punct de vedere stiint ic, limbajul poate studiat de diverse discipline (vezi
Tabelul 1.1); ecare din ele deneste propriul ei set de probleme si are modul ei
propriu de adresare.
Lingvistica de exemplu, studiaza structura limbajului brut, punandntrebari
de genul De ce anumite combinat ii de cuvinte formeaza propozit ii iar altele nu,
De ce o propozit ie poate avea nt eles iar altele nu, etc.
Psiholingvistii pe de alta parte, studiaza procesele producerii si nt elegerii
limbii naturale, luand n considerare ntrebari cum ar Cum identica oa-
menii structura corecta a unei propozit ii, sau Cand se decide nt elesul corect
al cuvintelor.
Filozoi si ndreapta atent ia asupra modului n care cuvintele ajung sa sem-
nice obiecte - si cum sunt identicate obiectele prin cuvinte. De asemenea ei
studiaza ce nseamn a sa ai certitudini, scopuri si intent ii si cum se leaga de
limbaj aceste capacitat i cognitive.
Scopul lingvisticii matematice este de a dezvolta o teorie computat ionala
a limbajului, folosind elemente ale informaticii (algoritmi, structuri de date,
etc). Binent eles, n construct ia unui model computat ional trebuie folosit n
mod ecient ceea ce se stie deja de la celelalte discipline.
Deci se pot desprinde doua motivat ii pentru dezvoltarea modelelor computa-
t ionale:
1. Motivat ia stiint ica are rolul de a obt ine o nt elegere mai buna asupra
modului cum lucreaza limbajul. Se stie ca nici una din celelalte discipline
tradit ionale nu dispune de echipament sucient de dezvoltat pentru a trata
5
6 PRELEGEREA 1. STUDIUL LIMBAJULUI
aceasta problema n totalitate. Chiar daca se va proceda la o combinare a tu-
turor ipotezelor dezvoltate, o teorie completa ar mult prea complexa pentru
a putea studiata cu metodele tradit ionale.

In schimb, aceste teorii com-
plexe pot modelate algoritmic, programate si apoi testate pe calculator.

In
funct ie de performant ele oferite de acest mod de simulare, se pot trage diverse
concluzii.
Modelele computat ionale pot oferi idei deosebit de utile referitoare la com-
portamentul lingvistic (si deci uman) n viitor, idei care pot explorate de
psiholingvisti. Continuand acest proces, se poate eventual obt ine o mai buna
nt elegere asupra modului cum act ioneaza limbajul uman. Acest proiect ocupa
multe eforturi unite ale lingvistilor, psiholingvistilor, lozolor si informati-
cienilor, creind o noua zona de cercetare interdisciplinara, numit a de obicei
cognitive science.
2. Motivat ia practica (sau tehnologica) enunt a ideea ca, datorita capaci-
tat ilor sale, utilizarea limbajului natural va revolut iona modul de folosire al
calculatoarelor. Deoarece majoritatea cunostint elor umane sunt pastrate sub
forma lingvistica, computerele care vor putea nt elege limbajul natural vor
putea avea acces la toata aceasta informat ie.

In plus, o interfat a de limbaj na-
tural cu calculatoarele va putea sa le faca pe acestea accesibile tuturor. Astfel
de sisteme vor considerabil mai exibile si mai inteligente decat este posibil
cu tehnologia curenta. Practic, nu este important daca modelul folosit reecta
modul uman de nt elegere al limbajului. Important este daca el funct ioneaz a.

In general, n dezvoltarea unei teorii a prelucrarii limbajului natural se abordeaza


elemente din ambele motivat ii. Aceasta, datorita pe de-o parte ideii ca un limbaj
natural este atat de complex nc at o modelare ad-hoc, far a o specicare teoretica
precisa nu va ecient a. Deci scopul tehnologic nu poate realizat far a o baza
teoretica sosticata la nivelul celor dezvoltate de lingvisti, psiholingvisti si lozo.
Pe de-alta parte, starea actuala a cunostint elor despre prelucrarea limbajului natural
este abia la nceput, astfel nc at orice ncercare de a construi un model cognitiv
coerent nu este fezabila.
Suntem nca n faza n care ncerc am orice model practic care pare ca merge.
1.2 Aplicat ii ale nt elegerii limbajului natural
O modalitate de a face o introducere n prezentarea studiilor relative la limbajul
natural este de a trece n revista diverse aplicat ii la care lucreaza sau au lucrat
cercetatorii din domeniu. Aceste aplicat ii se pot mp art i n doua clase mari:
1. Aplicat ii bazate pe text;
2. Aplicat ii bazate pe dialog.
Aplicat iile bazate pe text se refera la prelucrarea textului scris (cart i, reviste,
rapoarte, mesaje e-mail etc). Toate sunt tehnici referitoare la probleme de citire.
Cercetarile limbajului natural bazate pe text conduc la aplicat ii cum ar :
1.2. APLICAT II ALE

INT ELEGERII LIMBAJULUI NATURAL 7
Tabelul 1.1:
Disciplina Probleme specice Metode folosite
Lingvistica Cum formeaza cuvintele
fraze si armat ii ? Intuit ii despre forma corecta
Care sunt restrict iile nt elesu- si semnicat ie; modele
rilor unei armat ii ? matematice asupra structurii.
Psiho-lingvistica Cum identica oamenii Tehnici experimentale bazate
structura frazei ? pe masurarea performant elor
Cum sunt identicate umane;
nt elesurile cuvintelor ? analiza statistica a
Cand are loc procesul observat iilor.
de nt elegere ?
Filosoe Ce este nt elesul si cum este Argumentat ii ale limbajului
el asociat cuvintelor si natural bazate pe intuit ie
propozit iilor ? si exemple;
Cum identica cuvintele modele matematice (logica,
obiectele din spat iul teoria modelelor).
nconjurator ?
Lingvistica Cum este identicata Algoritmi, structuri de date
computat ionala structura propozit iilor ? si modele formale ale
(matematica) Cum se pot modela rat iona- rat ionamentului;
mentul si cunoasterea ? tehnici de inteligent a
Cum poate folosit limbajul articiala.
pentru a realiza aceste
obiective ?
Aarea documentelor pe o anumit a tema dintr-o baza de date de texte (de
exemplu, aarea cart ilor semnicative dintr-o biblioteca);
Extragerea informat iei utile din mesaje sau articole dintr-un anumit domeniu
(de exemplu, construct ia unei baze de date despre toate tranzact iile de aur
anunt ate n stirile unei zile);
Translatarea documentelor dintr-o limba n alta (de exemplu, reperele unei
marci de masin a, n mai multe limbi diferite);
Rezumate ale textelor ntr-un anumit domeniu (de exemplu, realizarea unui
sumar de 3 pagini dintr-un raport guvernamental de 1000 pagini).
Nu toate modelele care realizeaza aceste obiective folosesc tehnici de nt elegere a
limbajului natural (n sensul care va dezvoltat n curs). Sa ne referim de pilda la
determinarea articolelor dintr-un anumit domeniu dintr-o baza mare de date. Exista
n aceasta direct ie mult i algoritmi care clasica documentele dupa prezent a n text
a anumitor cuvinte cheie. Se pot gasi articole dintr-un domeniu cautand articolele
care cont in cuvintele cheie asociate domeniului respectiv. Articolele de drept de
exemplu, pot cont ine cuvinte cum ar apel, curte, recurs, nfat isare, n timp ce
8 PRELEGEREA 1. STUDIUL LIMBAJULUI
articolele despre comert pot cont ine cuvinte specice cum ar : tranzact ie, piat a,
marfa, pret . Un astfel de algoritm poate gasi articole din orice domeniu care are
predenit un set de cuvinte cheie.
Articolele stiint ice din ultima vreme apar n revistele de specialitate nsot ite de
astfel de cuvinte cheie, n scopul unei ranari a cautarii pe domenii.
Evident, nu se poate spune ca acesti algoritmi conduc la nt elegerea textului;
sunt simple tehnici de cautare a unor cuvinte n text. Desi conduc la aplicat ii utile,
ele sunt inerent limitate.
Astfel, nu putem extinde cautarea la texte al caror subiect este exprimat printr-
un rezumat, cum ar de exemplu:
Sa se gaseasca toate problemele aparute ntre 1980 1985 a caror rezolvare s-a
redus la problema celor patru culori.
Pot exista astfel de probleme care sa nu folosit cuvintele cheie respective, care
sa nu e de matematica, etc.
Pentru a putea face fat a unor asemenea cerint e extinse, sistemul folosit trebuie
sa e capabil sa extraga sucient de multa informat ie din ecare articol din baza de
date, pentru a putea decide daca acel articol satisface sau nu cerint ele de cautare;
deci trebuie sa construim o reprezentare a informat iei din articol si apoi sa folosim
aceasta reprezentare n scopuri de cautare. Aceasta exprima o cerint a majora a unui
sistem de nt elegere: el trebuie sa calculeze o anumita reprezentare a informat iei, pe
care sa o foloseasca ulterior n algorimi de inferent a.
Sa consideram alt exemplu. Anumite sisteme automate de translatare au fost
construite pe ideea compararii unor structuri-tip (pattern): o secvent a de cuvinte
dintr-un limbaj este asociata unei secvent e de cuvinte din alt limbaj. Translatarea
este realizata prin gasirea celui mai bun set de structuri-tip care corespunde intr arii.
Aceasta tehnica (folosita mai ales n traduceri automate de texte dedicate) poate
produce rezultate rezonabile n anumite situat ii, dar poate conduce si la translatari
complet gresite n cazul unor construct ii cunt eles apropiat, pe care nu este abilitata
sa le poata nt elege.
Alt i algoritmi lucreaza n doi pasi: produc nt ai o reprezentare a nt elesului eca-
rei propozit ii ntr-un limbaj, iar apoi determina o propozit ie n alt limbaj, cu acelasi
nt eles. Rezultatul nal are o corectitudine mai mare, armat ie bazata pe o analiza
semantic a care foloseste tehnici computat ionale de nt elegere a limbajului natural.
Un domeniu foarte atractiv pentru cercetarile bazate pe text este acela de nt ele-
gere a povestirii. Aici, sistemul prelucreaza o povestire, dupa care trebuie sa raspun-
da lantreb ari relative la ea. Aceasta este similara testelor folosite n scoli referitoare
la nt elegerea citirii.
Aplicat iile bazate pe dialog folosesc comunicarea om - masin a. Ca baza normala
de lucru se utilizeaza limbajul vorbit, dar se poate folosi ca interfat a si tastatura.
Exemple de aplicat ii practice:
Sisteme de raspuns la ntrebari (limbajul natural foloseste la interogarea unei
baze de date);
1.3. SISTEME DE EVALUARE A

INT ELEGERII LIMBAJULUI 9
Serviciu telefonic automat (pentru a realiza de exemplu anumite operat ii ban-
care sau a cere anumite obiecte dintr-un catalog);
Sisteme de seminarizare (masina converseaza cu elevul pe baza unei anumite
lect ii);
Sisteme de cooperare n rezolvarea unor probleme (de exemplu algoritmi care
ajuta la planicarea curselor aviatice; sau n arhitectura, la simularea proiec-
telor).
De obicei aceste probleme sunt tratate prin sistemele bazate pe dialog ntr-un
mod complet diferit fat a de tratarea n sistemele bazate pe text. Limbajul folosit
este altul, iar sistemul cere o participare activa pentru a ment ine un dialog natural,
usor de urmarit. Dialogul reclama atat folosirea de cunostint e pentru a verica daca
lucrurile sunt nt elese, cat si abilitate n recunoasterea si generarea de subdialoguri
pentru claricarea anumitor concepte. Dar chiar si cu aceste diferent e, algoritmii
de baza sunt fundamental aceiasi.
Este important sa separam problemele de recunoastere a vorbirii de cele de
nt elegere a limbajului. Un sistem de recunoastere a vorbirii nu foloseste nici un
element de nt elegere a limbajului. El este utilizat numai pentru identicarea cu-
vintelor rostite cu o anumit a claritate ntr-o limba xata, nu si pentru nt elegerea
mesajului pe care l cont in acestea. Pentru a un sistem de nt elegere a limbaju-
lui, un sistem de recunoastere a vocii trebuie completat la intrare cu un sistem de
nt elegere a limbajului natural, ceea ce conduce n nal la ceea ce numim sistem de
nt elegere a limbajului vorbit.
1.3 Sisteme de evaluare a nt elegerii limbajului
Dupa cum s-a vazut, ceea ce conteaza ca nt elegere poate varia de la o aplicat ie la
alta. Se poate pune atunci ntrebarea:
De unde stim cand este bun sistemul ?
O modalitate imediata de evaluare consta n rularea programului si compararea
rezultatelor cu ceea ce ne astept am sa obt inem. Este ceea ce se numeste black box
evaluation - deoarece apreciem performant ele sistemului fara sa cercetam modul
n care acesta ajunge la ele. Folosit a ca metoda nala de evaluare, ea poate
considerata ca ind cel mai bun test de validare; n schimb nu se poate folosi n
etapele de nceput ale cercetarii, pentru ca aici rezultatele pot duce la aprecieri
gresite.

In general tehnicile care produc rezultate bune pe termen scurt nu vor
obt ine aceleasi performant e pe termen lung.
O alta metoda de evaluare consta n identicarea diverselor subcomponente ale
sistemului si testarea lor separata. Aceasta strategie poarta numele de glass box
evaluation, deoarece permite observarea structurii interne a sistemului. Dicultatea
acestui mod de evaluare consta n faptul ca sunt necesare anumite coerent e (sau
consensuri) ntre pachetele de teste. Relat iile care asigura asemenea consensuri stau
la baza unor teorii noi relative la prelucrarea limbajului natural.
10 PRELEGEREA 1. STUDIUL LIMBAJULUI

In ciuda acestor dicultat i, evaluarea are o important a cruciala. Se stie ca un


num ar mic de teste aplicate unui anumit sistem nu conduce la o concluzie clara. Daca
utilizatorul nu lucreaza direct cu sistemul ci prin intermediul mai multor interfet e,
rezultatele pot afectate ntr-un procent care nu se poate neglija.
Un alt pericol este acela ca utilizatorii acordan mod reex mai mult a inteligent a
programului, decat este acesta abilitat. Sa exemplicam aceasta armat ie.
La mijlocul anilor

60, MIT a dezvoltat un program numit ELIZA, care a
devenit unul din cele mai populare programe de inteligent a articiala din toate
timpurile. ELIZA nu a pretins niciodata ca se bazeaza pe o teorie a nt elegerii
limbajului, dar serveste ca un excelent exemplu n aceasta direct ie. Sistemul joaca
rolul unui medic psiholog si, pentru a obt ine cele mai bune rezultate, utilizatorul va
juca rolul unui pacient.

In Tabelul 1.2 dam exemplul unui dialog posibil ntre cei
doi parteneri.
Tabelul 1.2:
Utilizator ELIZA
Tot i oamenii sunt nefericit i. De ce ?
Totdeauna cand au o problema,
deranjeazape alt ii. Pot i sa dai un exemplu ?
Da, ieri a venit la mine un prieten. Un prieten a venit ieri la tine.
Spunea ca sufar de stres de mai mult
timp.

Imi pare rau sa aud ca suferi de stres.
Si este adevarat, sufar de stres. Crezi ca venind aici vei ajutat ?
Am nevoie de ajutor; asta este sigur. Ce nt elegi prin ajutor ?
Poate sa nvat sa u mai apropiat de
ai mei. Spune-mi mai multe despre familia ta.
Mama are grija de mine. Cine mai are grija de tine n familie ?
Tata. Tata.

Intr-un fel, semeni cu tatal meu. Ce asemanare vezi ?


Sa vedem cum lucreaza ELIZA.
Exista o baza de date formata din cuvinte cheie. Pentru ecare cuvant cheie,
sistemul stocheaz a un num ar ntreg (prioritate), o structura - tip pe care o va ntalni
la intrare si o specicare a iesirii. Algoritmul este urmatorul:
Fiind data o propozit ie , se cauta un cuvant cheie n , a carui structura - tip
corespunde cu . Daca n sunt mai multe cuvinte cheie, se alege cel care are cea
mai mare prioritate. Se folosesc specicat iile de iesire pentru a da raspunsul.
Daca n nu sunt cuvinte cheie, se genereaza o propozit ie de continuare, cum
ar
Spune-mi mai multe despre . . . sau
Continua.

In Tabelul 1.3 este un fragment dintr-o baza de date a cuvintelor cheie. O


structura -tip consta din cuvinte si variabile. Prexul ? din fat a unei litere indica o
variabil a, care poate nlocuita cu orice secvent a de cuvinte. De exemplu, structura-
1.3. SISTEME DE EVALUARE A

INT ELEGERII LIMBAJULUI 11
tip
?X este ?Y
va coincide cu propozit ia
Cine este persoana care a venit ieri ?
Aici variabila ?X este nlocuita cu Cine iar ?Y cu persoana care a venit ieri
?. Specicat iile de iesire pot folosi aceleasi variabile. ELIZA insereaza valorile
variabilelor date de structura de intrare n cea de iesire, dupa ce a facut eventual
mici modicari de pronume (a nlocuit eu cu tu, mine cu tine etc). Deci, daca pentru
structura - tip de mai sus, specicat ia de iesire este
Cunosti ?Y ?
atunci pentru intrarea
Cine este persoana care a venit ieri ?
se va genera raspunsul
Cunosti persoana care a venit ieri ?
Tabelul 1.3:
Cuvant Prioritate Structura-tip Iesire
Nefericit 10 ?X De ce ?

In ce fel ?
este 3 ?X este ?Y Cunosti ?Y ?
totdeauna 5 ?X Pot i sa dai un exemplu ?
Cand ?

Intr-adevar, totdeauna ?
ce 2 ?X De ce ntrebi ?
Te intereseaza ?
Daca pentru o structura -tip sunt mai multe iesiri posibile, ELIZA selecteaza
cate una distincta pentru ecare aparit ie, n scopul de a preveni repetit ia. Primele
doua raspunsuri ale ELIZEI din Tabelul 1.2 sunt generate pe baza acestei baze de
date.
Dupa cum se vede din descrierea algoritmului ELIZA, programul nu nt elege
conversat ia la care participa. Practic, el este o colect ie de siretlicuri.
De ce totusi a avut ELIZA un succes atat de mare ? Pot mai multe raspunsuri
posibile. Cel mai probabil este acela ca, atunci cand oamenii aud sau citesc o
secvent a de cuvinte pe care o nt eleg ca o propozit ie, ei atribuie nt elesul respectiv
acelei propozit ii si considera automat ca el apart ine celui care a produs-o (chiar
daca este o masin a). Deci ELIZA apare ca inteligent a pentru ca interlocutorii ei si
folosesc propria lor inteligent a pentru a da un sens propozit iilor.
Iluzia de inteligent a este sust inut a si de o alta caracteristica. Sistemul nu are
nevoie de nici un cuvant inteligent, pentru ca el nu face armat ii, nu argumenteaz a
si nu raspunde la ntreb ari. Pur si simplu, el pune o serie de ntrebari, ceea ce,
nafara situat iei pacient - doctor, ar o discut ie inacceptabila. ELIZA ocoleste
toate ntreb arile raspunz and cu alte ntreb ari, cum ar n ultima instant a
12 PRELEGEREA 1. STUDIUL LIMBAJULUI
De ce ntrebi ?.
Nu exista nici o posibilitate n a face programul sa spuna ceva concret despre
orice.
Chiar si n aceste situat ii restrictive, este relativ usor sa demonstram ca progra-
mul nu nt elege. El produce uneori raspunsuri complet aiurea. De exemplu, pentru
ELIZA pe baza caruia s-a dat exemplul din Tabelul 1.2, armat ia
Repetit ia este mama nt elepciunii.
va genera (datorita cuvantului cheie mama) iesirea
Spune-mi mai multe despre familia ta.
De asemenea, cu cat conversat ia progreseaza, devine evident ca ELIZA nu ret ine
nimic din cont inutul discut iei; ea va ncepe sa puna ntrebari care sunt far a sens n
lumina discut iei anterioare.
Sa presupunem ca vi se cere ca n sase luni sa construit i un program de limbaj
natural pentru o anumit a aplicat ie. Daca vet i ncepe construct ia unui model general
al nt elegerii limbajului, el sigur nu va gata n intervalul de timp considerat si va
obt ine rezultate dezastruoase la teste. Un sistem tip ELIZA care sa produca un
comportament de tipul celui de sus, poate scris n mai put in de o jumatate de
an; si cu sigurant a ca el va trece cu succes multe teste. Deci, daca luam ca unic
criteriu performant a pe termen scurt, un program tip ELIZA va preferat; acesta
este totusi inacceptabil pentru scopul nal al proiectului.
Pentru a elimina aceasta posibilitate, va trebui sau sa acceptam anumite ipoteze
teoretice despre arhitectura sistemelor limbajului natural si sa dezvolt am teste de
evaluare specice diferitelor componente, sau sa ignoram rezultatele slabe ale testelor
de evaluare pan a cand sistemul ajunge la un nivel rezonabil de ridicat de performan-
t a.
1.4 Nivele ale analizei limbajului
Un program de limbaj natural trebuie sa se bazeze pe cunostint e considerabile despre
structura limbajului nsusi, inclusiv ce sunt cuvintele, cum se combin a ele pentru
a forma propozit ii, ce nt eles au cuvintele, cum contribuie nt elesul lor la nt elesul
propozit iei s.a.m.d. Totusi aspectul lingvistic al problemei, desi necesar, nu este si
sucient; intervine si un studiu al comportamentului uman - cunostint e generale des-
pre lumea nconjur atoare, precum si abilitat i de rat ionament. De exemplu, pentru a
raspunde la ntrebari si a participa la o conversat ie, o persoana trebuie sa cunoasca
nu numai structura limbajului folosit, dar sa se bazeze si pe o cultura personala.
Nivelurile de cunostint e relevante pentru nt elegerea limbajului natural pot
clasicate n felul urmator:
1. Nivelul fonetic si fonologic; se refera la modul de exprimare al cuvintelor
prin sunete (modul de legatur a si de realizare cuvant - sunet). Astfel de
cunostint e sunt cruciale n sistemele bazate pe voce.
2. Nivelul morfologic; se refera la modul de construct ie al cuvintelor din o serie
de elemente de baza numite morfeme. Un morfem este unitatea structurala de
baza din limbaj care are asociat un nt eles (De exemplu, nt elesul cuvantului
1.4. NIVELE ALE ANALIZEI LIMBAJULUI 13
prietenos este derivat din nt elesul substantivului prieten si a suxului os, care
transforma un substantiv ntr-un adjectiv).
3. Nivelul sintactic; trateaza modul de combinare al cuvintelor pentru a forma
propozit ii corecte, determina rolul structural al ecarui cuvant n propozit ie
precum si relat ia propozit iilor ntr-o fraza.
4. Nivelul semantic; se refera la semnicat ia cuvintelor, modul de combinare al
acestor semnicat ii pentru a forma semnicat ia unei propozit ii. Este studiul
unui nt eles independent de context: o propozit ie tratata far a nici o legatur a
cu contextul n care a fost utilizata.
5. Nivelul pragmatic; trateaza folosirea propozit iilor n diverse situat ii, modul
n care inuent eaz a contextul interpretarea unei propozit ii.
6. Nivelul discursului; se ocupa de modul n care propozit iile anterioare afec-
teaza interpretarea propozit iilor care urmeaza. Un aspect important se refera
la interpretarea pronumelor si la aspectul temporal al informat iei vehiculate.
7. Nivelul cunoasterii universului; include cunostint e generale despre struc-
tura lumii la care face referire utilizatorul pentru ca, de exemplu, sa faca fat a
conversat iei. Sunt incluse toate informat iile pe care trebuie sa le aiba un uti-
lizator despre partenerii sai de discut ie.
Evident, aceasta este o clasicare destul de imprecisa, care nu acopera chiar
toate preocuparile referitoare la lingvistica. Orice eveniment particular poate include
aspecte din mai multe nivele, si un algoritm va trebui sa trateze simultan nivele
diferite.
Exemplul 1.1 Sa ncercam sa arata m prin exemple diferent ele dintre sintaxa,
semantic a si pragmatica. Fie urmatoarele propozit ii:
1. Broastele sunt int e.
2. Broastele verzi au nasuri mari.
3. Ideile verzi au nasuri mari.
4. Mari ideile verzi are nasuri.
Prima propozit ie poate considerata corecta sintactic, semantic si pragmatic. Fie-
care din celelalte armat ii violeaza nsa unul sau mai multe din aceste concepte.
Propozit ia 2 este corecta sintactic si semantic dar nu si pragmatic. Cunostint ele
noastre despre broaste ar respinge valoarea ei de adevar.
Cu propozit ia 3 este mai rau. Ea este corecta sintactic dar este gresita semantic
si pragmatic. Daca propozit ia 2 poate lansata ntr-o discut ie si combatuta eventual
cu argumente, propozit ia 3 nu poate nici macar enunt ata ntr-o conversat ie coe-
renta. Ea nu se poate nici arma si nici nega. Un program care sa o nege pragmatic,
ar trebui sa demonstreze ca ideile nu pot verzi sau - daca sunt - n mod sigur nu
au nasul mare.
14 PRELEGEREA 1. STUDIUL LIMBAJULUI
Propozit ia 4 nu este corecta din nici unul din cele trei puncte de vedere (sintactic,
semantic, pragmatic). Ea este de fapt neinteligibila; nu are o structura pe baza careia
sa putem decide ce este gresit.
Este interesant ca se pot gasi exemple n care o propozit ie, sa e gresit a sintactic
desi este corecta pragmatic. Daca te ntreaba cineva unde mergi si raspunzi
Eu merg facultate.
desi este gresita sintactic, ea are un nt eles pragmatic corect si - eventual, este
chiar si semantic corecta.
1.5 Reprezentari si nt elegeri
O component a cruciala ant elegerii foloseste calculul reprezentarii nt elesului propo-
zit iilor si textelor. Chiar si far a o denire a not iunii de reprezentare, aceasta
armat ie este neclara. De exemplu, de ce nu se foloseste propozit ia nsasi ca o
reprezentare a nt elesului ei ? Un motiv este acela exista multe cuvinte cu nt elesuri
multiple, pe care le numim sensuri. Cuvantul port de exemplu are un sens de sub-
stantiv (loc unde acosteaza navele) si sens de verb (a purta, persoana 1 singular,
prezent). Astfel de ambiguit at i ar crea multiple dicultat i sistemului. Pentru oa-
meni, rezolvarea lor este foarte simpla, reiesind din context; de multe ori oamenii
nu observa ambiguitat ile decat daca li se atrage atent ia, pentru amuzament. Sunt
celebre versurile lui Eminescu
Sa -t i e somnul lin sau
Cobori n jos luceafar bland
carora li se pot gasi astfel de ambiguit at i n exprimare.
Dar daca o persoana nu pare sa ia n considerare toate sensurile unui cuvant,
acest lucru nu este posibil n cazul unui program care trebuie sa le trateze explicit.
Pentru a reprezentant elesul, este necesar un limbaj mai precis. Acesta este oferit
de Limbaje formale, de Logica si de Matematica. O reprezentare utila a limbajului
satisface urmatoarele doua proprietat i:
Este precisa si neambigua. Ea va permite exprimarea oricarei citiri a unei
propozit ii ca o formul a distincta.
Reprezentarea trebuie sa pastreze structura intuitiva a propozit iilor limbaju-
lui natural pe care l modeleaza. De exemplu, propozit iile cu structuri simi-
lare trebuie sa aiba reprezent ari similar structurate; sau - nt elesurile a doua
propozit ii care sunt parafraze una alteia, trebuie sa e foarte apropiate.
1.5.1 Sintaxa; Structura de reprezentare a propozit iilor
Structura sintactic a a unei propozit ii indica modul n care sunt legate ntre ele cuvin-
tele propozit iei. Ea arata cum sunt grupate cuvintele, cum anumite cuvinte modica
altele si care cuvinte sunt de important a central a n fraza.

In plus, sintaxa poate
identica tipurile de relat ii care exista ntre fraze si poate ret ine diverse informat ii
despre structura propozit iei, care vor necesare n prelucrarea ulterioara .
1.5. REPREZENT

ARI SI

INT ELEGERI 15
Exemplul 1.2 Sa consideram urmatoarele doua propozit ii:
1. Ion i vinde lui Maria cartea.
2. Cartea este vanduta Mariei de catre Ion.
Propozit iile au anumite similitudini structurale: ambele folosesc substantivele
Ion, Maria, carte; ambele descriu o act iune de vanzare. Din alte puncte de vedere,
propozit iile sunt semnicativ deosebite. Chiar daca ambele au aceeasi valoare de
adevar, la ntrebarea
Ce face Ion pentru Maria ?
nu poate folosit ca raspuns propozit ia 2, ci numai 1.
Propozit ia 2 poate folosita ca o continuare a unei propozit ii de tipul Desi este
rupta. . ., ca n cele ce urmeaza:
3. (*) Desi este rupta, Ion i vinde lui Maria cartea.
4. Desi este rupta, cartea este vanduta Mariei de catre Ion.

In continuare se va folosi notat ia (*) pentru orice exemplu de propozit ie incorecta


sau problematic corecta.
Multe alte proprietat i pot relevate considerand propozit ii gresit formulate. Pro-
pozit ia 5 este gresita datorita dezacordului subiect- predicat. Propozit ia 6 este gresita
deoarece verbul pune solicita o informat ie suplimentara (ce pune ?).
5. (*) Ion sunt n colt .
6. (*) Ion pune pe masa.
Analiza gramaticala a unui text nu constituie scopul nal al unui model de
nt elegere a limbajului natural. De fapt, un bun sistem trebuie sa e capabil sa
nt eleaga, ori de cate ori poate, propozit iile prost formate. Astfel, ntre propozit ia 5
si
5. Ion este n colt .
nu se face nici o distinct ie.
Multe reprezentari sintactice ale unui limbaj folosesc modalitatea arborescent a
oferita de gramaticile independente de context. De exemplu, pentru propozit ia
Viat a curge ca apa
se pot da doua reprezentari sintactice distincte (n funct ie de gramatica care
genereaza aceste propozit ii):

H
H
Hj

@
@R

@
@R

H
H
Hj

H
H
Hj

@
@R
S S
A B
Viat a
A
Viat a
curge
ca
apa curge
B
ca
apa
16 PRELEGEREA 1. STUDIUL LIMBAJULUI
1.5.2 Forma logica
Structura unei propozit ii nu reecta si nt elesul ei. De exemplu, substantivul broasca
poate avea diverse nt elesuri, n funct ie de propozit ia n care este folosit. Ce
semnicat ie se poate da propozit iei
Emil are o broasca ?
Aceea ca Emil are o int a (broasca) sau un obiect pe care urmeaza sa-l monteze la
us a (broasca). Propozit ia este corecta sintactic, semantic si pragmatic, dar ambigua
din punct de vedere al semnicat iei. Sa presupunem ca din discut ie reiese ca a fost
vorba de primul nt eles. Nici acuma semnicat ia nu este completa, putand vorba
de diverse specii de broaste.

Int elesul unei propozit ii depinde de situat ian care este folosita propozit ia respec-
tiva. Exista aici o relat ie ntre dependent a de context si independent a de context.
Faptul ca broasca se refera la un lucru sau o int a, este o informat ie legata de limba
roman a, independent de locul n care este folosit cuvantul. Pe de-alta parte subs-
tantivul broasca se refera la ceva ce are Emil, si depinde de contextul conversat iei.
Denit ia 1.1 Reprezentarea nt elesului independent de context al unei propozit ii se
numeste forma logica.
Forma logica codica sensuri diverse ale cuvintelor si identic a relat iile semantice
ntre cuvinte si fraze. Multe astfel de relat ii sunt regasite n relat iile semantice dintre
verb si substantivul asociat.
De exemplu, n propozit iile 1 si 2, act iunea descrisa este una de vanzare, unde Ion
este vanz atorul, cartea este obiectul n cauza, iar Maria este cumparatorul. Aceste
roluri sunt instant ieri ale unor obiecte semantice generale, sa le numim
AGENT, TEMA, POSESOR FINAL.
Odata determinate relat iile semantice, unele sensuri ale cuvintelor pot deveni
imposibile, si deci vor eliminate dintre posibilitat i.
Exemplul 1.3 Sa luam propozit ia:
Mama ta de-i vie, bine-ar sa vie pe la noi la vie.
Cuvantul vie este folosit aici de trei ori, de ecare data cu alta semnicat ie.
Determinarea interpretarii semantice se face nsa n mod unic, datorita legarii lui
de semnicat iile celorlaltor cuvinte. Astfel, prima utilizare este legata de cuvantul
mama si devine adjectiv; a doua aparit ie este n relat ie tot cu mama, dar prin
pozit ia sa i se asigura interpretarea semantica de verb.

In sfarsit, ind legat de
predicat, a treia aparit ie a cuvantului vie este complement de loc, cu semnicat ie
de substantiv.
Una din problemele cheie n interpretarea semantic a este aceea de a stabili ce
semnicat ii individuale ale cuvintelor se pot combina pentru a crea unnt eles coerent
al propozit iei. Prin exploatarea interconexiunilor dintre semnicat iile cuvintelor,
se poate reduce masiv numarul sensurilor pe care le poate avea ecare cuvant n
propozit ie.
1.6. LIBERTATEA LIMBAJULUI 17
1.5.3 Reprezentarea nt elesului nal
Reprezentarea nala ceruta este o reprezentare generala de cunostint e (KR) pe care
o foloseste sistemul pentru a reprezenta si rat iona asupra domeniului sau de aplicat ii.
Acesta este un limbaj n care sunt reprezentate toate cunostint ele specice bazate
pe aplicat ii. Scopul unei interpret ari contextuale este de a lua o reprezentare a
structurii unei propozit ii si forma sa logica, si de a o aplica ntr-o anumit a expresie
din KR, oferind-o sistemului sa o utilizeze n reprezentarea sa.
De obicei se foloseste ca limbaj de reprezentare nala calculul predicatelor de
ordinul I (FOPC).
Cursul va urmari trei nivele de reprezentare a limbajului natural: structura
sintactic a, forma logica si reprezentarea nt elesului nal. Fluxul de informat ie dat
de un mesaj trece prin urmatoarele etape de prelucrare. Aceasta structura vom
ncerca sa o urmarim. Nu vor mai dezvoltate elementele formale introduse si
studiate n anii anteriori (limbaje formale, translatori, logica, calcul propozit ional),
decat printr-o trecere sumara n revista n cadrul anexelor. Prelegerile vor completa
aceste cunostint e cu elemente specice studierii si analizei proprietat ilor limbajului
natural.
1.6 Libertatea limbajului
Cea ce face deosebit de dicil studiul unui limbaj este dinamica sa, faptul ca el se
modica destul de rapid n timp si spat iu. Un limbaj natural - spre deosebire de
unul articial - nu poate denit strict; de aceea se folosesc anumite convent ii sau
norme de prezentare. O parte din ele sunt:
Gramatica: n general regulile gramaticale (privind lexicul) se modica mult
mai greu n timp; de aceea ele pot folosite destul de ecient n caracterizarea
unei limbi.
Norme fonetice si morfologice. Sunt structurile de baza folosite n construct ia
cuvintelor unei limbi.
Regularitat i ale procesului de comunicat ie. Aici intr a convent ii ale actului de
vorbire, construct ii specice folosite n mod mecanic (de genul Ce mai faci ?,
How do you do etc).
Facem precizarea ns a ca aceste norme nu sunt obligatorii. Orice vorbitor se poate
departa de ele oricat de mult, atata timp cat este nt eles (exemplul tipic l constituie
argourile).
Aceasta libertate rezulta direct din natura interactiv a a limbajului. Astfel:
Vorbitorii vor act iona liber n funct ie de mediu, de variabilitatea situat iilor
sau de contextele verbale;
Posibilitatea repetit iilor face ca unele port iuni de limbaj sa e codicate, pres-
curtate. Exista tendint a de a nu repeta literar anumite pasaje.
18 PRELEGEREA 1. STUDIUL LIMBAJULUI
Aproape orice element de vorbire care poate eliminat, va avea n cele din
urma aceasta soarta. Aceasta este generata nu numai din necesitatea de a vorbi
mai repede, dar si din din acea de a nt elege mai usor semnicat ia mesajului.
Consecint e ale libertat ii limbajului:
Variabilitatea. Vorbitorul va alege si va crea colocat ii si chiar cuvinte noi;
alegerea individuala conduce la schimbarea sistemului. De fapt, n acest mod
s-a creat ecare cuvant din lexic.
Posibilitatea de dezvoltare. Reducerea repetata a morfemelor gramaticale este
legata de aparit ia unor funct ii ale cuvintelor; acest lucru funct ioneaz a cu
condit ia pastrarii unui anumit grad de redundant a a limbii.
Complexitatea limbilor naturale.
Universalitatea. Nevoia de claricare a unor nt elesuri noi face necesara dez-
voltarea limbii pe toate direct iile. De remarcat ca universalitatea este atat o
precondit ie dar si o consecint a a libertat ii limbajului. Ea conduce la imposi-
bilitatea denirii de reguli far a except ii.
Ceea ce face - n ultima instant a - necesar un studiu sistematic al limbajului natural
este observat ia ca
Omul nt elege mai mult decat poate spune dar vorbeste ca sa e nt eles.
Prelegerea 2
Elemente de lingvistica. Sintaxa
limbii
Nu se poate ncepe un studiu de lingvistica computat ional a far a a face o scurta
trecere n revista a structurii sintactice a limbajului natural. Vor tratate n prin-
cipal elemente de sintaxa ale limbii romane, far a a intra n detalii. O dezvoltare de
catre lingvisti a acestui capitol ar putea conduce la un studiu sistematic aprofundat
privind prelucrarea automata a limbii romane.
2.1 Cuvinte
La prima vedere, se pare ca unitatea de baza n structura unei limbi este cuvantul.
Totusi, acesta este departe de a elementul fundamental al studiului n lingvistica,
el ind rezultatul aplicarii unui set complex de alte elemente (considerate primitive).
Denit ia 2.1 Disciplina lingvistica numita morfologie se ocupa cu formarea cu-
vintelor din diverse componente de baza.
Exista doua moduri n care se formeaza cuvintele noi, moduri numite forme
inexionale si derivat ionale.
Formele inexionale utilizeaza o componenta numita radacina a cuvantului,
caruia de obicei i adauga unul sau mai multe suxe. Verbele constituie cel mai
bun exemplu n aceasta direct ie. Fiecare verb are o forma de baza, care este apoi
schimbat an funct ie de persoana si timpul propozit iei; se formeaza astfel conjugarile.
De exemplu, verbul a citi are o rad acina cit, pe baza careia se formeaza conjugarea
din Tabelul 2.1:
Toate elementele din Tabelul 2.1 sunt verbe si au acelasi nt eles.
Morfologia derivat ionala foloseste cuvinte pentru a construi alte cuvinte noi
complet diferite (privind nt elesul si/sau forma gramaticala). De exemplu, substan-
tivul prieten, prin adaugarea suxului -esc devine prietenesc, care este adjectiv; cu
suxul -os se transforma n prietenos si poate folosit ca adverb. O forma ceva mai
complicata este mprietenire. Limba romana ofera moduri deosebit de complicate
n construirea unor astfel de forme derivat ionale.
19
20 PRELEGEREA 2. ELEMENTE DE LINGVISTIC

A. SINTAXA LIMBII
Tabelul 2.1:
Timpul prezent Timpul perfect simplu
eu cit-esc eu cit-eam
tu cit-esti tu cit-eai
el cit-este el cit-ea
noi cit-im noi cit-eam
voi cit-it i voi cit-eat i
ei cit-esc ei cit-eau
Lingvistica clasica cuvintele n categorii diferite, n funct ie de utilizarea lor. Se
pot considera doua zone de interes care contribuie la aceasta mpart ire a cuvintelor.
Prima zona se refera la contribut ia cuvintelor nnt elesul frazei din care fac parte, iar
a doua zona este legata de structura sintactica particulara la care participa cuvintele.
De exemplu, orice limbaj natural cont ine doua clase fundamentale:
Clasa substantivelor, formata din acele cuvinte care se folosesc la identicarea
tipului de baza al unui obiect, concept sau loc;
Clasa adjectivele - acele cuvinte care atribuie diverse calitat i obiectelor, con-
ceptelor sau locurilor.
Astfel, verde este un adjectiv iar padure este un substantiv, dupa cum se vede si
din construct ia padure verde sau paduri verzi. Lucrurile nu sunt ns a asa de simple;
verde poate si substantiv, ca n propozit ia Acest verde este mai deschis decat altul;
de asemenea, si padure poate avea alt rol nafara de substantiv - n construct ia
luminisul padurii. Deci, nu exista o linie neta trasata ntre clase. Problema este
daca ele sunt comparabile sau nu. Aceasta armat ie este falsa si o putem observa
prin urmatorul exemplu. Sa consideram toate cuvintele care, completand propozit ia
Este asa de .., aceasta sa ram an a semantic corecta. Se poate spune: Este asa de
frumos, Este asa de cald, Este asa de bine,.. dar nu putem arma niciodata Este
asa de padure.
La fel, nu toate adjectivele pot folosite si ca substantive; aici exemplele care se
pot da sunt numeroase.
Fie V alfabetul limbii romane si V

monoidul liber generat de V cu operat ia
de concatenare. Vom nota cu ST V

clasa substantivelor limbii romane, iar cu
AJ V

clasa adjectivelor. Din observat iile de sus rezulta urmatoarele relat ii:
ST AJ = , ST AJ = ST, ST AJ = AJ.
Gramatica limbii a pus n evident a patru clase importante de cuvinte.

Inafara de
substantive si adjective, celelalte doua clase sunt: verbe (V ) si adverbe (AV ). Toate
propozit iile sunt construite folosind ca baza cuvinte din aceste clase. Mai sunt si
alte clase de cuvinte necesare n formarea propozit iilor, cum ar articole, pronume,
prepozit ii, particule, cuanticatori, conjunct ii, etc. Dar aceste ultime clase sunt
2.2. ELEMENTELE EXPRESIILOR-SUBSTANTIV SIMPLE 21
xe, n sensul ca sunt except ional de rare cazurile n care apar cuvinte noi care sa e
introduse aici.

In schimb, substantive, adjective, verbe si adverbe noi sunt introduse
n mod constant odata cu evolut ia limbii. De aceea, aceste clase sunt numite clase
deschise de cuvinte, n timp ce celelalte sunt clase nchise de cuvinte.
Orice cuvant din una din cele patru clase deschise de cuvinte poate folosit
pentru a forma baza unei expresii. Acest cuvant va numit liderul (header) expresiei
si va indica tipul de lucru, activitate sau calitate descris de expresie. Vom avea
astfel expresii-substantiv, expresii -adjectiv, expresii-verb si expresii-adverb, ecare
din ele caracterizand o clasa de not iuni (care pot obiecte, nsusiri, act iuni sau
proprietat i). De exemplu, cu expresiile-substantiv, cuvintele lider indica clasele
generale de obiecte descrise. Expresiile
Cabana
Cabana mica
Cabana mica din Bucegi
sunt toate expresii-substantiv care descriu un element din clasa cabanelor. Pri-
mul se refera la un element din clasa tuturor cabanelor, al doilea la un element din
clasa cabanelor mici, iar al treilea, la un element din clasa cabanelor mici situate n
munt ii Bucegi. Cuvantul cabana este lider n toate aceste expresii.
Uneori, o expresie este formata numai din lider (nisip poate considerat expresie-
substantiv, slab poate o expresie-adjectiv, ridicandu-se este expresie-verb, nfo-
metat este expresie-adverb). Cel mai adesea ns a, liderul cere n expresie cuvinte
adit ionale prin care sa clarice nt elesul dorit. De exemplu, verbul a pune nu poate
forma singur o expresie-verb, nt elesul sau neind complet. Propozit ia
(*) Ion pune.
este incompleta, ea solicitand continuarea cu o expresie-substantiv, urmata even-
tual de o expresie exprimand o localizare.
Denit ia 2.2 Expresia sau setul de expresii necesare pentru a completa nt elesul
unui lider se numeste complementul liderului.
Daca scriem
Ion pune mana pe carte
Ion este liderul, iar pune mana pe carte este complementul.

In Tabelul 2.2 sunt date exemple de lideri (subliniat i) din toate cele patru clase
majore, nsot ite de complement i.
2.2 Elementele expresiilor-substantiv simple
Expresiile-substantiv (NP) sunt folosite pentru a face referire la obiecte, locat ii,
concepte, evenimente etc. Cele mai simple astfel de expresii constau dintr-un singur
pronume: el, ea, ei, noi s.a.m.d. Pronumele se pot referi la obiecte zice, ca n
propozit ia
El este la usa.
la evenimente, ca n propozit ia:
Dupa ce am deschis usa, am regretat-o luni de zile.
sau la calitat i, ca n propozit ia:
22 PRELEGEREA 2. ELEMENTE DE LINGVISTIC

A. SINTAXA LIMBII
Tabelul 2.2:
Expresii-substantiv Expresii-verb
Presedintele companiei priveste la trecatori
Dorint a lui de a reusi credea ca lumea este rea
Diverse provocari ale echipei adverse a mancat o pizza
Expresii-adjectiv Expresii-adverb
usor de trecut nauntrul casei
fericit ca nu a luat premiu urgent s-a urcat n tren
lung ca o girafa intermitent priveste usa
Ne era foame, dar nu o aratam.
O alta forma de baza a expresiilor-substantiv consta dintr-un nume sau nume
propriu, cum ar Ionescu sau Galat i. Numele pot formate si din mai multe
cuvinte, ca n Drobeta Turnu Severin sau Evenimentul zilei.

Inafara acestor doua cazuri, liderul unei expresii-substantiv este un substantiv


comun. De obicei, substantivele se mpart n doua clase principale:
Substantive numarabile, care descriu obiecte specice sau mult imi de obi-
ecte;
Substantive amorfe - referitoare la cont inuturi (compozit ii).
Substantivele num arabile sunt numite astfel deoarece ele pot num arate. astfel, pot
un caine sau mai mult i caini, o carte sau mai multe cart i etc. Daca un substantiv
num arabil este folosit pentru a descrie o clasa de obiecte, el va putea folosit atat
la singular cat si la plural. Astfel, se poate spune
Cainii sunt prieteni ai omului,
dar si
Cainele este prieten al omului.
De obicei ns a, a doua varianta genereaza ambiguit at i, necesitand un suport
semantic mai puternic (trebuie sa stim ca nu se vorbeste despre un anumit caine);
de aceea vom considera ca ind corecta n specicarea claselor de obiecte, numai
forma plurala a substantivelor num arabile.
Substantivele amorfe nu pot num arate. Poate de exemplu ceva apa, ceva
carne, ceva nisip; daca ncercam sa introducem un contor, va trebui modicat
nt elesul substantivului. De exemplu, ceva apa se refera la o cantitate aproxima-
tiva de lichid; spunand ns a o apa, ne gandim la o anumit a zona geograca (un rau,
un lac etc). Prin considerat ii similare cu cele de sus, vom folosi pentru descrierea
unei clase, numai forma singulara a substantivelor amorfe. Astfel, ntre
Apa este necesara viet ii.
si
Apele sunt necesare viet ii.
2.2. ELEMENTELE EXPRESIILOR-SUBSTANTIV SIMPLE 23
vom alege doar pe prima ca ind corecta.

Inafara de lider, o expresie poate cont ine specicatori si calicatori. Forma


generala a unei expresii-substantiv este (cu unele except ii):
{< specicator >}{< calicator >} < lider >
(folosirea acoladelor indica caracterul opt ional al cont inutului lor).
Calicatorii descriu clasa de obiecte identicat a de lider, iar specicatorii pre-
cizeaza cate astfel de obiecte sunt sau n ce relat ie sunt obiectele descrise fat a de
vorbitor sau ascultator.
Specicatorii sunt format i din:
Numerale ordinale (cum ar primul, al doilea),
Numerale cardinale (unu, doi,. . .),
Articole.
Articolele pot mp art ite n urmatoarele clase:
Hotarat si nehotar at: un, o, -ul, -a,. . .;
Demonstrativ: acesta, aceasta, aceia,. . .;
Posesiv: al (a,ai,ale) lui (lor),. . .;
Cuanticator: niste, orice, mult, ambii, jumatate, cel mult, nimic,. . .;
Cuvinte folosite n ntrebari: Cine, ce.
O expresie-substantiv poate cont ine cel mult un articol, un numeral ordinal si
unul cardinal; poate sa aiba din toate trei, cum ar : primii doi admisi.
Calicatorii constau din adjective si substantive folosite ca atribute. Mai exact:
Adjectivele: sunt cuvinte care acorda anumite proprietat i obiectelor care nu
sunt denite prin proprietat i. De exemplu: vesel, lung, viclean;
Atributele substantivale: sunt substantive (numarabile sau amorfe) folosite
pentru a preciza alt substantiv; de exemplu: carte de bucate, calculator de
buzunar.
Gramatica asigura substantivelor diverse forme exionare numite declinari. O de-
clinare se face n raport cu num arul (singular, plural), persoana (nt aia, a doua, a
treia), gen (masculin, feminin, neutru) sau caz (pentru unele tipuri de articole, cum
sunt cele posesive).
24 PRELEGEREA 2. ELEMENTE DE LINGVISTIC

A. SINTAXA LIMBII
2.3 Expresii-verb si propozit ii simple

In vreme ce un NP este folosit pentru a face referire la un obiect, o propozit ie (S)


este construita pentru a arma, a ntreba sau a comanda ceva. Se poate arma
ca o propozit ie este corecta, se poate ntreba daca o propozit ie este corecta si se
poate cere sa se ndeplineasca ceea este descris ntr-o propozit ie. Felul n care este
folosita o propozit ie se numeste exprimare. Exista patru exprimari de baza ale unei
propozit ii, anume:
1. Exprimare enunt iativa; Exemplu: Pisica doarme.
2. Exprimare interogativa; Exemplu: Cine doarme ?
3. Exprimare imperativa; Exemplu: Ia pisica asta de aici !
4. Exprimare interogativa, cu raspuns da/nu; Exemplu: Doarme pisica ?
Ultima exprimare nu este specica gramaticii limbii romane. Totusi, n aceasta
lucrare, vom introduce anumite diferent e fat a de denit iile lingvistice, necesare n
prelucrarea matematica a textelor.
Denit ia 2.3 O propozit ie enunt iativa simpla este formata dintr-un NP - cu rol
de subiect - urmat de o expresie verbala (V P) folosita ca predicat.
O V P simpla este de forma
{< modificator adverb >} < verb > {< complemente >}
Verbul apare ntr-o forma data de asa numita conjugare a sa, denita n funct ie de
patru componente: mod, timp, persoana si numar. De exemplu, conjugarea verbului
a lucra la modul indicativ si timpul prezent este:
Persoana I singular: Eu lucrez.
Persoana II singular: Tu lucrezi.
Persoana III singular: El (Ea) lucreaza.
Persoana I plural: Noi lucram.
Persoana II plural: Voi lucrat i.
Persoana III plural: Ei (Ele) lucreaza.
Nu vom intra n detalii lingvistice referitoare la modul de formare al conjuga-
rilor; pentru limba roman a, ele sunt deosebit de dicile.

In funct ie de verbul din structura V P se pot deduce multe tipuri de complemente.


Astfel, multe verbe pot folosite far a nici un complement; ele sunt numite verbe
intranzitive. De exemplu, a rade (Sergiu rade), a alerga (Cainele alearga).
Alte verbe trebuie sa aiba drept complement expresii-substantiv; acestea sunt
verbele tranzitive, cum ar de exemplu a gasi (Pisica gaseste drumul catre casa), a
duce, a trage.
Cele doua clase de verbe sunt incomparabele; exista verbe care apart in unei
singure clase, si verbe care pot - n funct ie de context - atat tranzitive cat si
2.4. COMPLEMENTE DIRECTE 25
intranzitive. De exemplu, a canta poate tranzitiv sau intranzitiv, dar nt elesul
difera; astfel, se poate spune Radu canta dar si Radu canta o melodie cunoscuta.
Daca verbele intranzitive sunt caracteristice diatezei active, cu verbele tranzi-
tive se poate forma diateza pasiva, construita din verbul a si participiul trecut al
verbului.

In diateza pasiva, expresia-substantiv care este scrisa pe pozit ia comple-
mentului va juca rol de subiect. Exemple referitoare la aceasta trecere sunt date n
Tabelul 2.3.
Tabelul 2.3:
Diateza activa Diateza pasiva
George arunca mingea. Mingea este aruncata de George.
Profesorul l-a laudat. A fost laudat de profesor.
Voi vizita orasul. Orasul va vizitat de mine.
Cateva observat ii:
Elementele legate de verb (timp, mod, etc.) se pastreaza n trecerea de la o
diateza la alta.
Desi prima expresie-substantiv pare ca a trecut n forma pasiva pe pozit ia
complementului, ea a ramas din punct de vedere semantic subiectul.
Unele verbe permit doua expresii-substantiv pe post de complement. De exemplu:
Petru i va da Alinei o carte.
Radu a primit ntr-o ora informat iile cerute.

In aceasta situat ie, primul NP este numit NP direct, iar al doilea - NP indirect.

In general, astfel de propozit ii pot transformate n altele echivalente n care


expresia-substantiv indirecta este separata prin construct ii de tip prepozit ie. Astfel,
se poate spune:
Petru i va da o carte lui Alina.
Radu a primit ntr-o ora informat iile pe care le-a cerut.
2.4 Complemente directe
Multe verbe solicita sa e nsot ite de complemente (sa le numim clauze); acestea au
diverse forme, de la simple particule pan a la propozit ii complete (completive directe,
indirecte, etc). Uzual, ele sunt precedate de anumite particule, cum ar : ca (Aud
ca esti acasa). O astfel de clauza va identicat a prin expresia S[ca], indicand o
subclasa speciala a structurii S. Aceasta poate apare ca un complement direct al
verbului a sti, sub toate diatezele:
1. activa: (Eu stiu ca Petre a mancat pizza);
2. pasiva: (Eu stiu ca pizza a fost mancata de Petre);
26 PRELEGEREA 2. ELEMENTE DE LINGVISTIC

A. SINTAXA LIMBII
3. reexiva:(Eu stiu ca pizza se mananca calda).
Alt tip de clauze foloseste forma innitiva a verbelor: VP[inf] este un V P care
ncepe cu innitivul. Exemplul tipic este versul eminescian
Nu credeam sa nvat a muri vreodata.
S[inf] poate apare si prin folosirea particulei pentru, ca n
Ion s-a nchis n casa pentru a avea liniste.

In mod similar se pot deni diverse complemente directe semnalate si de alte


particule: ce, cine, unde, cate etc.
Exista verbe care - cu foarte rare except ii - nu pot folosite decat nsot ite
de expresii-complement; mult imea prepozit iilor folosite pentru introducerea acestor
complemente va notata PP.
Exemplul 2.1 Verbul a crede foloseste drept PP prepozit ia ca:
Eu cred ca vesnicia s-a nascut la sat.
a pune foloseste un complement format dintr-un NP precedat de un PP care
descrie o locat ie:
Ion pune cartea pe masa.
Ion pune cartea n raft.
Ion pune cartea langa celelalte.
Spunem ca a pune are un complement de forma NP+PP[loc].
Similar, a decide poate avea un complement de forma NP+PP[despre], a
lucra - NP+PP[la], s.a.m.d.

In Tabelul 2.4 sunt stranse cateva structuri de complemente utilizate n limba


roman a. Toate variantele ar nsuma peste 50 forme si nu am cunostint a de existent a
unei liste complete de astfel de structuri.
2.5 Expresii-substantiv complete
Folosirea unei expresii-substantiv formata numai dintr-un element - lider (asa cum a
fost introdus anterior) este incompleta. Ea poate avea forme mai complexe, n care
un NP poate cont ine propozit ii ntregi sau expresii-verb drept subcomponente.
Toate exemplele anterioare aveau lideri fara complemente; totusi, multe expresii-
substantiv solicita expres complemente cu anumite expresii- prepozit ie. De exemplu,
substantivul dragoste are un complement de forma PP[pentru], ca n dragostea ei
pentru Frant a; legatura poate avea un complement de forma PP[cu], ca n legatura
lor cu exteriorul, etc.
Multe substantive, cum ar dorint a, nerabdare, curiozitate . . . pot avea com-
pletare un V P la innitiv, ca n dorint a lui de a pleca, nerabdarea de a vedea ceva
nou, curiozitatea de a cerceta. Ele admit de fapt forma S[inf] drept complement.
Expresiile substantiv pot construite si pe clauze, asa cum au fost introduse n
paragraful precedent. De exemplu, o clauza ca (S[ca]) poate folosita ca subiect al
unei fraze, cum ar :
Ca George este nsurat, nu a mirat pe nimeni.
De asemenea pot folosite drept expresii-substantiv:
2.6. EXPRESII - ADJECTIV 27
Tabelul 2.4:
Verb Structura complementului Exemplu
a rade (intranzitiv) Radu rade.
a gasi NP (tranzitiv) Radu a gasit o cheie
a da NP + NP (bitranzitiv) Postasul a dat plicul destinatarului.
a da NP + PP[la] Postasul a dat scrisoarea la retururi.
a sta Completiva de loc Radu sta la t ar a.
a pune NP+ Completiva de loc Radu a pus haina n cuier.
a vorbi PP[cu] + PP[despre] Radu vorbeste cu Ion despre mine.
a ncerca V P[sa] Radu ncearc a sa vorbeasca.
a spune NP + V P[sa] Radu iaspus musarului sa intre.
a dori S[sa] Radu doreste ca totul sa e perfect.
a rade V P[ang] Radu rade plangand.
a chema NP + V P[ang] Radu chema cainele uierand.
a regreta S[ca] Radu regreta ca a pierdut trenul.
a spune NP + S[ca] Radu spune ului sa plece la scoala.
a parea ADJP Radu pare nefericit la serviciu.
a sti S[unde] Radu stie unde sunt frat ii lui.
1. Forme innitive ale expresiilor-verb: VP[inf], S[inf]. De exemplu:
A castiga o masina este o problema de sansa.
Pentru Andrei, a ajunge la timp este ceva neobisnuit.
2. Forme gerundive: VP[ang], S[ang]. Exemple:
Terminand treaba, am plecat acasa.
Aand ca Ion este plecat, nu l-am mai sunat.
2.6 Expresii - adjectiv
Dupa cum am vazut - cele mai simple expresii-adjectiv (ADJP) constau dintr-un sim-
plu cuvant cu rol de adjectiv. Sunt posibile nsa si expresii-adjectiv mai complexe,
adjectivele putand nsot ite de aceleasi forme complement tratate la expresiile-verb.
Astfel,
Se pot folosi expresii prepozit ionale specice: cu, la, ca n
Lui Ion i-a placut cu trenul.
Anca a fost suparata la plimbare.
Se pot folosi forme complement cum ar S[ca]:
Paul s-a suparat ca n-a putut intra la meci.
Sunt adjective care se pot construi din forme innitive sau conjunctive ale
verbelor (VP[inf], VP[conj]:
28 PRELEGEREA 2. ELEMENTE DE LINGVISTIC

A. SINTAXA LIMBII
Nu am nvat at a manui condeiul.
Anca doreste sa ajunga arhitect.
Astfel de construct ii complexe de expresii-adjectiv sunt specice pe pozit ii de com-
plement ale anumitor verbe (a , a parea) sau dupa liderul unei expresii substantiv.
2.7 Expresii-adverb
Expresiile-adverb pot apare n diverse pozit ii n propozit ii:
- pe prima pozit ie, ca n:
Pe urma Anca a deschis radioul.
- n expresii-verb:
Anca a deschis pe urma radioul.
- pe ultima pozit ie a propozit iei:
Anca a deschis radioul pe urma.
Exista binent eles restrict ii ale formelor de adverb care pot folosite n ecare
pozit ie, dar acestea sunt legate strans de structura interna a ecarei limbi.
Totusi, din cauza num arului mare de forme, n general este util ca expresiile-
adverb (ADVP) sa e considerate dupa funct ii, nu dupa forma sintactic a. Deci,
putem avea expresii-adverb temporale, de durata, de locat ie, grad, frecvent a, mod
etc, ecare n forma sa specica.
De exemplu, expresiile-adverb temporale se pot folosi ca particule adverbiale
(acum), expresii-substantiv (astazi, ieri), expresii-prepozit ionale (la pranz, n timpul
lmului) si clauze (cand ceasul a sunat de amiaza, nainte ca lupta sa nceapa).

In aceasta lucrare, adverbele vor apare adesea ca modicatori ai act iunilor sau
starilor descrise de propozit ie. De obicei, asemenea situat ii ridica problema dis-
tingerii ntre complementele verbului si aceste adverbe. O distinct ie uzuala este
aceea ca expresiile adverbiale sunt ntotdeauna opt ionale. Deci, prin eliminarea lor
se obt ine o propozit ie cu aproximativ acelasi nt eles. Sa consideram ca exemplu
propozit iile:
Ion taie picioarele la masa.
Ion mananca o prajitura la masa.
Expresia la masa este un complement n prima propozit ie (eliminarea ei duce la
o propozit ie horror, fara nt eles) si o expresie adverb n a doua (important este
ca Ion man anca o prajitur a, locul unde se petrece aceasta act iune ind o informat ie
suplimentar a).
Prelegerea 3
Not iuni de morfologie
3.1 Structura morfologica a cuvintelor
Regulile de formare ale cuvintelor - care pornesc de la o anumita structura a acestora
- difera de la o limb a la alta, atat prin numarul lor cat si prin complexitate. Aceste
reguli permit uneori ca pe baza unei rad acini sa se formeze un num ar impresionant
de cuvinte nrudite. Limbile aglutinate (germana, maghiara, nlandeza) folosesc
mult acest procedeu.

In limba nlandeza de exemplu, pornind de la rad acina unui
substantiv se pot forma prin procedee morfologice cateva mii de cuvinte valide si
interpretabile de catre un vorbitor nativ. Pentru verbe se pot genera uneori peste
10.000 de forme diferite ale aceluiasi cuvant. Fenomenul este similar - la o scara
mai redusa - si pentru limbile neaglutinate. De pilda, n limba rusa prin conjugarea
unui verb se pot obt ine n jur de o suta de forme, cifra aproximativ valabila si
pentru limba roman a (daca luamn considerare si formele compuse). Deci cuvintele
evident iaz a o anumit a structura ce furnizeaza o mare bogat ie informat ionala care
nu poate ignorata.

In structura unui cuvant se poate distinge o parte constant a si una variabila.


Statutul de parte constanta ntr-un cuvant nu este absolut, ci relativ la o anumit a
familie de derivat i morfologici.
Denit ia 3.1 ([5]) Orice cuvant este format dintr-o radacina la care se adauga
unul sau mai multe axe. Axele pot prexe, suxe si desinent e.
Radacina este elementul neanalizabil din punct de vedere morfologic, ind co-
mun a mai multor cuvinte cu sens nrudit (desi pot apart ine unor part i de vorbire
diferite).
Prexul este axul adaugat naintea radacinii.

In limba roman a prexele au
numai valoare lexicala, de elemente cu care se formeaza cuvinte noi.
Suxele sunt axe adaugate la sfarsitul rad acinii; ele sunt de doua feluri: suxe
lexicale (suxe cu valoare lexicala care conduc la formarea de cuvinte noi) si suxe
gramaticale (cu valoare gramaticala, care ajuta la formarea de forme exionare).
Daca o rad acina are mai multe suxe, primele care se scriu sunt suxele lexicale,
apoi cele gramaticale.
Rad acina mpreuna cu prexele si suxele formeaza tema. Spre deosebire de
rad acin a, tema este comuna numai formelor unuia si aceluiasi cuvant. De exemplu,
29
30 PRELEGEREA 3. NOT IUNI DE MORFOLOGIE
n familia cuvantului parte exista radacina part din care se pot crea o mult ime de
teme: partas-, mpart i, mpartas- etc, caracteristice ecarui cuvant.
Desinent ele sunt suxe gramaticale care se adauga dupa rad acina sau tema
pentru a arata:
num arul si cazul (la substantive);
genul, num arul si cazul (la adjective);
persoana si numarul (la verbe).
Spre deosebire de prexe si suxe care pot intra mai multe n compozit ia unui
cuvant, o forma gramaticala nu poate cont ine decat o singura desinent a.
3.2 Prelucrarea morfologica a cuvintelor
Dupa cum am specicat n prelegerea precedent a, lingvistica computat ional a cuprin-
de actualmente doua maniere diametral opuse privind abordarea problemelor legate
de structura cuvintelor; ele sunt paradigma procedurala cu formele sale deriva-
tiva si exionara, respectiv paradigma declarativa.
Pozit ia adoptata fat a de analiza cuvintelor determinan mare parte organizarea si
cont inutul dict ionarului, care este elementul central al prelucrarii la nivel morfologic.
Dict ionarul este recunoscut unanim ca ind o component a esent ial a a oricarui
sistem de prelucrare a limbajului natural.

In contrast cu limbajele de programare
care necesita dict ionare mici, cont inand elemente lexicale neambigue, limbajele na-
turale se sprijina pe volume lexicale incomparabil mai mari, elementele de dict ionar
ind rareori univoce din punct de vedere morfologic, sintactic si mai ales semantic.
Problemele apar chiar din momentul denirii cont inutului unui dict ionar; ele sunt
generate de diversitatea orientarilor teoretice si practice, de specicitatea ecarei
limbi naturale, de gradul de detaliu si profunzime la care se ajunge n prelucrarea
limbajului, de investit ia de munca si de resursele hard si soft aate la dispozit ie.
Denit ia 3.2 Conform paradigmei derivative, dict ionarul cuprinde doar radacinile
cuvintelor mpreuna cu toate axele caracteristice (lexicale si gramaticale).
Deci, n acest caz, cuvintele limbii sunt recunoscute sau generaten urma unui proces
derivativ.
Obiect ii:
Complexitatea mare a proceselor derivative, de regula nedeterministe, ceea ce
conduce n multe cazuri la probleme NP-complete.
Dicultatea specicarii algoritmice a unui set complet de reguli derivative
capabile sa acopere fenomenul dinamic al formarii cuvintelor si a prelevarii
radacinilor si axelor semnicative.
Existent a (n multe limbi) de false axe, ceea ce ngreuneaza procesul de re-
cunoastere a rad acinilor si chiar a temelor.
3.2. PRELUCRAREA MORFOLOGIC

A A CUVINTELOR 31
Din punct de vedere semantic, este greu de decis algoritmic formarea si mo-
dicarea semnicat iei cuvintelor formate derivativ. De exemplu, este greu de
derivat semnicat ia cuvantului mpartasanie plecand de la radacina -part-.
Folosind regulile de derivare se pot obt ine cuvinte inexistente n fondul lexical
al unei limbi.
Cu toate acestea, avantajul major al unei abordari derivative consta n posibilitatea
de reducere a dict ionarelor (de rad acini) la dimensiuni modeste, necesitand un efort
constructiv rezonabil. Pe de-alta parte, chiar unele obiect ii pot conduce la avantaje.
De exemplu, dinamica unei limbi solicita frecvent introducerea de cuvinte noi; aces-
tea se supun regulilor exionare si derivative deja existente, reguli care se modica
mult mai greu (n timp).
Denit ia 3.3 Un dict ionar construit conform paradigmei declarative va cont ine
(explicit sau nu) toate informat iile structurale ale cuvintelor unei limbi.
Deci, ntr-o abordare declarativa, un dict ionar nu va cont ine radacini sau teme, ci
cuvinte; de exemplu, odata cu cuvantul program, n dict ionar se vor gasi si programe,
programele, programul, programului, programelor etc. Informat iile contextuale legate
de forma exionara a unui cuvant sunt reprezentate explicit. Astfel, pentru intrarea
corespunzatoare cuvantului programelor, dict ionarul va cont ine explicit informat ii
de tipul:
forma-normala: program;
numarul: plural;
cazul: genitiv/dativ
articulare: enclitic
. . .
Aceasta este ideea de baza n construct ia corpusului unei limbi.
Procesul morfo - lexical se va reduce aici la simpla cautare a elementului curent n
dict ionar, eliminandu-se complet nedeterminismul ntalnit la abordarea procedurala.
Cuvintele nrudite sunt de obicei puse n corespondent a prin asa numitele reguli de
redondant a.
Doarece nu ne vom ocupa de aceasta maniera de construct ie, nu vom detalia mai
departe argumentele pro si contra utilizarii procedurii declarative.
Analiza morfo-lexicala consta din cateva subfaze specice, care apar explicit n
abordarile procedurale. Acestea sunt:
1. Primul obiectiv este prelucrarea individuala a cuvintelor, ceea ce nseamna
identicarea rad acinii sau temei, precum si a axelor modicatoare. Structura
rezultata este numit a de obicei atom morfologic.
32 PRELEGEREA 3. NOT IUNI DE MORFOLOGIE
2. Atomii morfologici sunt supusi unui proces reductiv, numit analiza perifras-
tica, care are rolul de a identica formele compuse ale verbelor, gradele de
comparat ie ale adjectivelor si adverbelor precum si mijloacele analitice de ex-
ionare (construct ii cu propozit ii, conjunct ii, articole). Ceea ce se obt ine este o
secvent a de structuri de date numite atomi morfo - lexicali.
3. Atomii morfo - lexicali sunt prelucrat i pentru a identica expresiile compuse
cu semnicat ie lexicala stabila (cum ar locut iunile si sintagmele); aceasta
prelucrare este numita analiza sintagmatica. Rezultatul nal este o lista de
atomi lexicali care constituie baza prelucrarilor ulterioare.
Structura atomilor morfologici, morfo - lexicali si lexicali depinde de mai mult i
factori care se inuent eaza reciproc, anume:
Teoria lingvistica (sintactic a, semantic a, pragmatica) pe care se cladeste sis-
temul de prelucrare al limbajului natural;
Situat ia conversat ionala si universul de discurs modelate;
Tipul aplicat iei proiectate.

In raport cu aceste condit ionari, structura si cont inutul dict ionarului pot varia
foarte mult. Un element de dict ionar poate cont ine, nafara radacinii, temei sau
cuvantului propriu-zis (dupa cum se foloseste paradigma procedurala respectiv de-
clarativa):
Un camp etimologic (mai ales la abordarile derivative);
Un camp fonologic, descriind structura proozodica (la dict ionarele destinate
limbajului vorbit sau la editoarele de texte, unde se foloseste de exemplu la
despart irea n silabe);
Un camp sintactic;
Un camp semantic, descriind semnicat iile lexicale asociate rad acinii, temei
sau cuvantului, relat iile de sinonimie, antonimie, polisemie.
Un camp pragmatic, sepcicand construct ii uzuale, interpret ari preferent iale
sau probabile, modicari ale semnicat iilor lexicale generale, etc.
3.3 Morfologia pe doua nivele
Cea mai cunoscuta teorie din zona paradigmei derivative este morfologia pe doua
nivele, prezentat a prima oara de Kimmo Koskenniemi n teza sa de doctorat din
1983. Ea s-a impus mai ales datorita fundament arii teoretice solide si usurint ei de
implementare.

In esent a, modelul lui Koskenniemi foloseste doua nivele n reprezentarea cuvin-


telor:
1. Nivelul de suprafat a, corespunzator aparit iei cuvintelor n text;
3.3. MORFOLOGIA PE DOU

A NIVELE 33
2. Nivelul lexical, corespunzator ortograerii cuvintelor n dict ionar.
Esent a teoriei consta n utilizarea unor reguli care ncearc a sa generalizeze fenome-
nele morfologice prin corelarea reprezent arii nivelului lexical cu reprezentarea de
suprafat a.
Denit ia 3.4 Fiind date doua alfabete nite nevide si , se numeste pereche -
simbolica un element (a, b) .

In notat ia consacrata, perechea simbolica (a, b) este reprezentat a de a : b n care


caracterul : este un metasimbol al modelului.
Se numeste secvent a de perechi simbolice o succesiune (posibil vida)
a
1
: b
1
, a
2
: b
2
, . . . , a
n
: b
n
de perechi simbolice.
O mult ime L ( )

se numeste limbaj de perechi simbolice peste si .


Fiind date alfabetele si si o secvent a S de perechi simbolice, o secvent a
< P
1
, . . . , P
n
> de perechi simbolice se numeste partit ie a lui S daca si numai daca
S = P
1
P
2
. . . P
n
.
Denit ia 3.5 O regula morfologica pe doua nivele peste alfabetele si este
un cuplu < P, C > unde P este o pereche simbolica iar C este o mult ime nevida
de perechi < LC, RC > unde LC si RC sunt expresii regulate peste numite
contexte stangi respectiv drepte.
O expresie context EC satisface la dreapta (stanga) o secvent a S de perchi simbolice
daca si numai daca exista o partit ie < P
1
, P
2
> a lui S astfel ncat P
2
(respectiv P
1
)
apart ine mult imii descrise de EC.
3.3.1 Reguli morfologice cu doua nivele
Exista doua tipuri de reguli morfologice de baza pe doua nivele; anume:
1. Regula de restrict ionare contextuala (RRC).
O regula RRC de forma
I : i b : b c : c
semnica faptul ca perechea simbolica I : i este legala (corecta) doar n con-
textul perechilor simbolice b : b si c : c care obligatoriu preced respectiv succed
perechea simbolica I : i.
Ca o observat ie, s-a folosit ca separator al celor doua componente < P, C >
din denit ia formala a unei reguli morfologice pe doua nivele.
2. Regula de restrict ionare a formei de suprafat a (RRS).
O regula RRS de forma
I : i b : b c : c
34 PRELEGEREA 3. NOT IUNI DE MORFOLOGIE
specica faptul ca ori de cate ori apar contextele respective (b : b la stanga si
c : c la dreapta) si se cunoaste simbolul din (I n formul a), atunci el este
obligatoriu asociat cu simbolul specicat din (i n formul a).
Ca o observat ie, s-a folosit ca separator al celor doua componente < P, C >
din denit ia formala a unei reguli morfologice pe doua nivele.

Inafara acestor doua reguli, se mai foloseste si un al treilea tip de regula care are ca
separator . O regula P Q este echivalent a cu pereche de reguli P C si
P C.
Sa coment am semnicat ia simbolurilor folosite n regulile morfologice cu doua
nivele:
Alfabetul se numeste alfabetul lexical si cont ine:
Coduri pentru literele alfabetului limbii naturale a carei morfologie se descrie;
Simbolul + pentru separarea morfemelor;
Metasimboluri (notate cu litere latine mari) pentru notarea submult imilor lui
. De exemplu, C poate deni mult imea consoanelor din , iar V - mult imea
vocalelor.
Alfabetul se numeste alfabetul de suprafat a si cont ine:
Literele si diacriticele ce pot apare n graa unui cuvant;
Metasimboluri pentru submult imi din ;
Simbolul vid .
Exemplul 3.1 Pentru ilustrarea notat iei folosite n modelul lui Koskenniemi, sa
consideram regula urmatoare:
e : {=: C
2
< +: V :=>}
{< C: C V : V > < +: e: e >}
{c: c < +: a: t : t >}

In aceasta regula, = , V , C , C
2
, V . Perechile sim-
bolice nchise ntre paranteze unghiulare reprezinta secvent e, iar perechile simbolice
cuprinse ntre acolade reprezinta alternative.
Deci perechea simbolica e : este legala numai daca apare n contextele listate
n partea dreapta a regulii, n pozit ia indicata de simbolul . Fiecare context are o
parte stanga si o parte dreapta, care sunt e perechi simbolice e expresii regulate
cu perechi simbolice.
Interpretarea regulii (vom explicita doar componenta a relat iei ) este
urmatoarea: transcrierea unui element lexical (morfem, lema, radacina) ntr-unul
de suprafat a se face prin nlocuirea simbolului lexical e cu caracterul de suprafat a
(deci se sterge litera e n procesul de generare a formei grafemice) daca apare una
din variantele urmatoare:
3.3. MORFOLOGIA PE DOU

A NIVELE 35
a. Simbolul lexical e este precedat n reprezentarea lexicala de un simbol din clasa
= care n transcrierea de suprafat a apart ine clasei C
2
si este urmat de un
delimitator morfemic (+) care se va sterge n reprezentarea de suprafat a; dupa
acest delimitator urmeaza un simbol lexical din clasa V care se rescrie n forma
de suprafat a printr-un simbol din clasa =;
b. Simbolul lexical e este precedat n reprezentarea lexicala de doua simboluri din
clasele C respectiv V , care se vor rescrie n simbolurile de suprafat a apart inand
acelorasi clase; el este urmat de un delimitator morfemic (care se va sterge)
si simbolul lexical e care ramane nemodicat n reprezentarea de suprafat a;
c. Simbolul lexical e este precedat n reprezentarea lexicala de simbolul c (scris
n reprezentarea de suprafat a); el este urmat de de secvent a lexicala formata
de delimitatorul morfemic, simbolul a (sters n reprezentarea de suprafat a) si
simbolul t (nemodicat n reprezentarea de suprafat a).
Vom mai da un exemplu - practic - de folosire a acestui model.
Exemplul 3.2 Regula de geminat ie consonantica (dublarea consoanei nale a unui
morfem) n limba engeza este:
+ : CG =: CGV : V
unde
CG {b, d, f, g, l, m, n, p, r, s, t}, V {a, e, i, u}.
Sa urmarim cum funct ioneaza aceasta regula, atat n generarea cat si analiza unui
cuvant:
Fie morfemul refer apart inand dict ionarului. Generarea gerunziului (sau tre-
cutului) presupune selectarea morfemului +ing (sau +ed) astfel ncat prin con-
catenare se obt ine sirul lexical refer+ing (sau refer+ed) deoarece delimitatorul
morfemic + apare n contextul cerut de regula precedenta: r CG, i(e) V, n
reprezentarea de suprafat a simbolul din CG substituind simbolul +. Se obt ine astfel
forma referring (sau reered).

In analiza cuvantului referring (sau referred), dupa separarea suxului ing


(respectiv ed), este necesara vericarea faptului ca n cuvantul analizat acest subsir
este chiar morfemul +ing (de exemplu, n cuvinte ca sting, king, el nu este un
morfem). Aceasta presupune ca n reprezentarea lexicala obt inuta prin partit ionarea
implicita a cuvantului analizat
< r: r e: e f : f e: e r: r >+: r < i : i n: n g: g >
simbolurile lexicale se reprezinta n morfeme existente n dict ionar. Deoarece re-
fer si +ing sunt morfeme lexicale, iar regula de geminare consonantica permite
rescrierea unui simbol de suprafat a din CG n +, analiza cuvantului referring ca
suma morfemelor refer respectiv +ing este corecta.
36 PRELEGEREA 3. NOT IUNI DE MORFOLOGIE
3.3.2 Gramatica morfologica pe doua nivele
Denit ia 3.6 Un set de reguli morfologice pe doua nivele permite contextual o
secvent a S de perechi simbolice daca si numai daca pentru ecare partit ie
< P
1
, a: b, P
2
>
a lui S este valabila una din urmatoarele armat ii:
Nu exista n R nici o regula de forma < a: b, C >;


In R exista cel mult o regula de aceasta forma, cu C cont inand o pereche de
contexte < LC, RC > astfel ncat P
1
LC, P
2
RC.
Denit ia 3.7 O regula morfologica pe doua nivele << a : b >, C > permite
coercitiv o secvent a S de perechi simbolice daca si numai daca pentru orice partit io-
nare posibila a lui S n < P
1
, a

: b

, P
2
> si pentru ecare element < LC, RC > C
cu P
1
LC, P
2
RC, daca a = a

atunci b = b

.
O gramatica morfologica cu doua nivele pentru alfabetele , se deneste for-
mal printr-o pereche < RRC, RRS > unde RRC este o mult ime de reguli de
restrict ionare contextual a peste si , iar RRS este o mult ime de reguli de restric-
t ionare a formelor de suprafat a peste si .
O pereche simbolica a : b este fezabila ntr-o gramatica cu doua nivele denita
peste alfabetele , daca si numai daca:
a = b si a , sau
a , si a : b apare ntr-o regula din gramatica.
O pereche a : b apare ntr-o regula << a

: b >, C > daca:


a = a

, b = b

sau
< LC, RC > C astfel ncat a : b LC RC.
Denit ia 3.8 Fiind data o gramatica morfologica cu doua nivele G =< RRC,
RRS >, o secvent a S de perechi simbolice este generata de G daca si numai daca:
1. Toate perechile simbolice din S sunt fezabile;
2. Orice regula din RRS permite coercitiv S;
3. Mult imea regulilor din RRC permite contextual S.
Observat ii:
1. Conform denit iei de mai sus, regulile din RRS formeaza o mult ime conjunc-
tiva de restrict ii care trebuiesc satisfacute simultan, n timp ce regulile din
RRC formeaza o mult ime disjunctiva de restrcit ii specicand toate contextele
legale posibile.
3.3. MORFOLOGIA PE DOU

A NIVELE 37
2. Din denit ia mult imilor RRC si RRS rezulta ca daca nici o regula nu se aplica
unei perechi simbolice, ea este acceptaa daca si numai daca este fezabila.
Denit ia 3.9 Fiind date = s
1
s
2
. . . s
n

, = I
1
I
2
. . . I
n

si o gramatica
morfologica cu doua nivele G, spunem ca este reprezentarea lexicala a lui
n G daca secvent a de perechi simbolice I
1
: s
1
I
2
: s
2
. . . I
n
: s
n
este generata de G.
Din denit ia de sus se observa restrict ia foarte puternica || = ||; ea poate
relaxata permit and ca I
i
{}, s
i
{}.
Procesul de prelucrare morfologica n morfologia pe doua nivele poate ab-
stractizat folosind doua not iuni suplimentare: sistemul de segmentare lexicala si
dict ionarul.
Denit ia 3.10 Un sistem de segmentare lexicala ntr-o morfologie cu doua nivele
este o structura (, , , L
x
, f, G) unde:
si sunt alfabetele lexical respectiv de suprafat a;
este un simbol special;
L
x
= {L
1
, . . . , L
n
} este o mult ime de mult imi de cuvinte din

numita lexicon,
ecare L
i
ind un sublexicon;
f :

2
L
este o funct ie denita astfel: w L
i
, f(w) = {L
i
1
, . . . , L
i
k
}
L
x
. f(w) se numeste mult imea de continuare valida a morfemului lexical w;
G este o gramatica morfologica cu doua nivele.
Cu aceasta denit ie, procesul de segmentare valid a a unui cuvant n elementele
sale lexicale constitutive se descrie natural astfel:
Denit ia 3.11 Fiind date cuvantul

si reprezentarea sa lexicala, este


segmentat n < I
1
, . . . , I
n
> daca:
I
1
. . . I
n
=

unde

este sirul din care s-au eliminat eventualele morfeme


nule;
L
i
astfel ncat I
i
L
i
, L
i
L
x
, 1 i n;
L
i+1
f(I
i
), 1 i n 1.
Pentru ca aceasta schem a sa e operat ionala, dict ionarul - n modelul lui Kosken-
niemi - este structurat n felul urmator: ecare intrare lexicala (corespunzatoare unui
morfem) cont ine - pe langa informat iile de natura morfologica si lexicala proprii mor-
femului respectiv - una sau mai multe clase de continuare. Acestea denesc tipurile
de morfeme care pot concatenate la dreapta cu morfemul curent n structura unui
cuvant valid. Morfemele nu sunt nregistratentr-un singur dict ionar, ci sunt grupate
n sublexicoane, eare din acestea corepunzand unei singure clase morfo-sintactice.

In general clasele de continuare induc pe mult imea lexicoanelor o structura


de graf orientat. Acest lucru se datoreaza faptului ca adesea unele clase morfo-
sintactice (sublexicoane) constituie clase de continuare pentru mai multe clase morfo-
sintactice.
38 PRELEGEREA 3. NOT IUNI DE MORFOLOGIE
Exemplul 3.3 Sa facem o analiza a cuvantului brazi. Printre regulile pe care le
poate folosi procesul de analiza se aa si regula
R
1
: d: z {V : V < +: i : i >}
Prin inserarea unui morfem nul se obt ine secvent a de suprafat a

brazi

, care este
prelucrata, conducand la secvent a de perechi simbolice:
< b: b r : r a: a d: z +: i : i >

In continuare se efectueaza separarea folosind ca referint a delimitatorul morfemic


+; se obt in astfel doua morfeme

brad

si

+i

, care indica faptul ca se analizeaza


un substantiv comun, genul masculin (primul morfem), nearticulat, plural (al doilea
morfem).
Evident, ar putea exista si alte reguli care se pot aplica, dar morfemele rezultate
nu ar valide (nu e regasesc n dict ionar).

In acest fel se elimina variantele incorecte
de translatare spre nivelul lexical.
Invers, la generarea cuvantului

cozi

se pleaca de la radacina

coad

(substantiv
comun, genul feminin) iar prin adaugarea morfemului

+ i

(nearticulat plural) se
obt ine secvent a

coad +i

. Aplicand acum regula:


R
2
: d: z {< o: o a: > < +: i : i >}
se obt ine urmatoarea secvent a de perechi simbolice:
< c: c o: o a: d: z +: i : i >
Aceasta va duce la sintetizarea secvent ei de suprafat a

cozi

, din care - prin elim-


inarea morfemelor nule - se obt ine forma exata

cozi

.
Se observa ca n acest caz se putea aplica si regula R
1
, ceea ce ar dus la gener-
area unui cuvant incorect; este o exemplicare a uneia din decient ele modelului.
3.4 Morfologia paradigmatica
Al doilea model morfologic procedural prezentat se nscrie n clasa morfologiilor ex-
ionare si a fost elaborat de Dr. Dan Tus de la Institutul de cercetari al Academiei
Romane. Marele sau avantaj consta n naturalet ea sa - posibilitatea de a dezvoltat
prin tehnici ale nv at arii.
Denit ia 3.12 Se numeste model morfologic (MM) structura
(C, SC, A, V, F
1
, F
2
, F
3
, P)
unde:
C = {c
1
, c
2
, . . . , c
i
} este o mult ime de categorii;
SC = {sc
1
, sc
2
, . . . ,
j
} este o mult ime de subcategorii ale categoriilor din C;
3.4. MORFOLOGIA PARADIGMATIC

A 39
A = {a
1
, a
2
, . . . , a
k
} este o mult ime de atribute ale subcategoriilor din SC (n
raport cu care fenomenul exionar este relevant);
V = {v
1
, v
2
, . . . , v
m
} este o mult ime de valori pe care le pot lua atributele din
A;
F
1
: C 2
SC
, F
2
: SC 2
A
, F
3
: A 2
V
sunt aplicat ii;
P CSC2
A
2
V
- numit spat iul paradigmatic exionar - are proprietatea
ca p
i
= (c
i
, sc
i
, A
i
, V
i
) P sunt adevarate armat iile:
1. c
i
C, sc
i
F
1
(c
i
);
2. A
i
= {a
i
1
, a
i
2
, . . . , a
i
k
} A, V
i
= {v
i
1
, v
i
2
, . . . , v
i
k
} V ;
3. M
i
= {m
i
1
, . . . , m
i
k
} F
2
(sc
i
) cu v
iq
F
3
(m
iq
), 1 q k.
Se numeste familie tematica (FT) asociata unui lexem Lx
i
mult imea sortata
lexicograc a tuturor cuvintelor obt inute prin exarea gramaticala a lexemului re-
spectiv: FT(Lx
i
) = {w
1
, w
2
, . . . , w
m
}.
Sa notam cu < X > un sir arbitrar de litere si cu < X >< Y > sirul de litere
obt inut prin concatenarea sirurilor < X > si < Y >.
Denit ia 3.13 O mult ime FT(Lx
i
) este regulata daca si numai daca exista un
subsir < R
q
> de lungime q numit radacina, comun tuturor cuvintelor din FT(Lx
i
)
astfel ncat:
1. k, < W > FT(Lx
i
) =< w
k
>=< R
q
>< t
k
>;
2. < R
q
> este cel mai lung subsir cu proprietatea anterioara;
3. q o limita inferioara (constanta ntreaga, dependenta de limba);
4. j, 2 j m 1, submult imile {w
1
, . . . , w
j
}, {w
j+1
, . . . , w
m
} au radacinile
< R
q
1
> respectiv < R
q
2
> unde < R
q
1
> este un subsir (nu neaparat propriu)
al lui < R
q
2
>.
Partea care ramane dintr-un cuvant din FT(Lx
i
) dupa ndep artarea rad acinii se
numeste terminat ie (vom folosi termenul de terminat ie atat pentru desinent e cat si
pentru suxe).
Denit ia 3.14 O familie tematica (FT) a unui lexem Lx
i
se numeste part ial
regulata daca exista o partit ie FT(Lx
i
) = {FT
1
(LX
i
), . . . , FT
k
(Lx
i
)} astfel ncat:

j=1
FT
j
(Lx
i
) = FT(Lx
i
);
m, n(m = n), FT
m
(Lx
i
) FT
n
(Lx
i
) = ;
j, FT
j
(Lx
i
) este regulata si |FT
j
(Lx
i
)| > 1.
Deci, o familie tematica part ial regulata este caracterizata de k radacini.
40 PRELEGEREA 3. NOT IUNI DE MORFOLOGIE
Denit ia 3.15 Mult imea terminat iilor obt inute dintr-o familie tematica (regulata
sau part ial regulata) se numeste familie paradigmatica FP.
Daca notam cu T reuniunea tuturor FP, se obt ine not iunea central a a modelului,
respectiv paradigma exionara Qn modul urmator:
Q = {(t
1
, p
1
), (t
2
, p
2
), . . . , (t
k
, p
k
)} 2
TP
;
FP
i
astfel ncat FP
i
= {t
1
, t
2
, . . . , t
k
}.
Pentru a simplica notat ia, vom folosi n continuare paranteze unghiulare numai
cand va necesar de evident iat (des)compunerea unei forme exate.
Fie FL mult imea obt inuta din reuniunea a k familii tematice, numita fond lexical:
FL =
k

j=1
FT(Lx
i
)
.
Vom numi dict ionar neinterpretat al fondului lexical FL mult imea
DN = {R
1
, R
2
, . . . , R
p
}
cu proprietatea ca oricare R
i
este o radacin a a unei familii tematice FT
j
din FL.
Aplicat ia I : FL 2
DNP
se numeste interpretarea fondului lexical FL n
modelul morfologic MM n cadrul caruia este denit P. Se observa ca interpretarea
unui cuvant poate sa nu e unica, fapt natural la nivelul analizei izolate a cuvantului.
Acest lucru se datoreaza ambiguitat ii (intriseci sau extrinseci) legate de omograe.
Interpretarea I abstractizeaza procesul de analiza morfologica.
Abstractizarea procesului invers, de generare a formelor exate, este reprezentat a
de aplicat ia G : DN P FL.
3.4.1 Organizarea terminat iilor
Conform denit iilor anterioare, un cuvant este privit - din punct de vedere structural
- ca o juxtapunere a unei part i xe (tema) si a unei part i variabile (terminat ia).

In
cadrul terminat iei nu se mai face distinct ie ntre suxe si desinent e. Un cuvant
poate coincide cu tema sa, caz n care spunem ca are terminat ie nula. Conceptul
de tema are un cont inut lexical, dar unui cuvant i pot corespunde mai multe teme,
cum sunt de exemplu verbele neregulate.
Terminat iile sunt organizate arborescent, ecare nod al arborelui ind etichetat
cu cate o litera care intr a n compozit ia unei terminat ii. Un drum care pleaca
de la rad acina arborelui (corespunzatoare terminat iei nule) la o frumza semnica
una sau mai multe terminat ii obt inute prin concatenarea literelor asociate nodurilor
parcurse. Exista posibilitatea (n limba roman a) ca un drumn arbore sa reprezinte
mai multe terminat ii, care se ncheie la diferite noduri ale drumului.
Denit ia 3.16 Se numeste nod terminal orice nod al arborelui de terminat ii cu
proprietatea ca prin concatenarea literelor asociate nodurilor parcurse pe drumul de
la radacina la nodul respectiv se obt ine o terminat ie valida.
3.4. MORFOLOGIA PARADIGMATIC

A 41
Tabelul 3.1: Arbore de terminat ii
a

c z
e

s
u

r
i

>
>
>
>
>
>
>.
`
`
`
`
`

-
`
`
`
`
`
`
`
`

-
`
`
`
`
`
`

-
`
`
`

Nivel 0
Nivel 1
Nivel 2
Nivel 3
Nivel 4

In Tabelul 3.1 este reprezentat un fragment al arborelui de terminat ii specice limbii


romane; nodurile terminale sunt notate cu simbolul .
Nodurile care apar pe nivelul 1 al arborelui sunt etichetate cu litere ce pot apare
pe ultima pozit ie a unei terminat ii. Literele care eticheteaz a nivelul 2 n arbore pot
apare ca penultime litere n terminat ii, dar numai daca sunt urmate de literele care
eticheteaz a nodurile de pe nivelul 1. Adancimea arborelui este egala cu lungimea
celei mai lungi terminat ii. Deci ilea, lea, ea, a, eia, uia, ia, ora, ua, iesc, esc, asc,
ez sunt terminat ii valide (citirea se face de la nodurile terminale spre radacin a).
Nodurile terminale au asociate informat ii referitoare la part ile de vorbire si
marcile morfologice carora le sunt caracteristice terminat iile denite de nodurile
respective. Astfel, nodului l de pe drumul ae l i, care deneste terminat ia
lea i sunt asociate informat iile substantiv feminin, articulat enclitic, cazul nomi-
nativ/acuzativ - cum este situat ia n cuvintele calea, pielea, si respectiv numeral
ordinal, masculin - ca n cuvintele doilea, zecelea.
Terminat ia ea, inclusa n lea este nsa si mai ambigu a:
Verb, prezent, conjunctiv, persoana 3, singular/plural;
Verb, imperfect, persoana 3, singular;
Verb, innitiv;
Substantiv, feminin, articulat enclitic, caz nominativ/acuzativ.
Exemple de cuvinte n care apare terminat ia ce poarta aceste informat ii ar : sa
stea, mergea, a cadea, cartea, etc. De remarcat ca pronumele personal ea nu poate
interpretat ca o terminat ie, deoarece tema ar nula lucru neacceptat conform
42 PRELEGEREA 3. NOT IUNI DE MORFOLOGIE
denit iilor anterioare. Cu cat se urca n arbore, gradul de nedeterminism creste;
astfel, terminat iilor a si le sunt asociate 33 respectiv 47 interpret ari.
3.4.2 Dict ionarul
Din punct de vedere logic, dict ionarul este o colect ie ordonata a mult imii de repre-
zentant i ai fondului lexical prelevat. Un reprezentant al unui element lexical este
o colect ie structurata de informat ii, numit a intrare lexicala. Intrarile lexicale sunt
deci ordonate logic dupa unul sau mai multe campuri - considerate chei - ale
structurii de reprezentare. Cea mai frecvent a cheie este cea corespunzatoare formei
cuvantului ret inut n dict ionar, caruia i se ataseaz a intrarea lexicala: rad acina, tema
sau cuvantul. Fiecare tema prezent a n dict ionar are atasate una sau mai multe des-
Tabelul 3.2: Structura unei intrari n dict ionar
< intrare lexicaa >::= < tema >
(< lexem >
< parte de vorbire >
< descriere morfologica >
(< descriere sintactica >
(< descriere semantico-pragmatica >)

)
+
crieri. O descriere consta dintr-un identicator unic n dict ionar, care corespunde
not iunii de lexem, un cod care identic a partea de vorbire asociata lexemului, o ca-
racterizare morfologica a lexemului, precum si una sau mai multe descrieri sintactice
si semantico-pragmatice asociate. Formal, o intrare lexicala este de forma data n
Tabelul 3.2.
Unei teme i pot corespunde mai multe lexeme. De exemplu, pentru tema munc
vor exista lexemele a munci (verb) si munca (substantiv).
Campurile <parte de vorbire> si <descriere morfologica> asociate unui lexem
sunt unice. Omografele vor diferent iate prin identicatori lexemici diferit i; de
exemplu, pentru tema duc care are asociate doua lexeme omografe (duce - a cara, a
transporta, si duce - rang nobiliar), distinct iantre lexeme se va face prin intermediul
unui indice numeric: duce1, duce2.
Doua sau mai multe teme distincte pot avea asociate acelasi lexem, situat ie cores-
punzatoare n dict ionar sinonimiei. De asemenea, polisemia este asigurata prin posi-
bilitatea de a avea mai multe descrieri semantico-pragmatice pentru acelasi lexem.
Informat iile din dict ionar corespunzt oare acestor campuri (sintactic si semantic) nu
sunt folosite n faza analizei morfo - lexicale, ci n fazele ulterioare.
Bibliograe
[1] Allen, J. - Natural Language Understanding, The Benjamin/Cummings Publ.
Co. Inc, 1995
[2] Atanasiu, A - Bazele Informaticii; suport de curs pentru anul II seral; Tipograa
Universitatii, 1987;
[3] Atanasiu, A. - Modele matematice n scrierea compilatoarelor; Ed. Olimp, 1996.
[4] Craciun, Dragos- Analizor morfologic pentru limba romana, Lucrare de licent a,
1997
[5] Gramatica Limbii Romane, Editura Academiei, 1966
[6] Joshi, A.K., Levi, L.S., Takahashi, M. - Tree Adjunct Grammars, J. Comput.
Syst. Sci. 10(1), 1975.
[7] Joshi, A.K. - How much context-senzitivity is necessary for Characterizing Struc-
tural description - Tree Adjoining Grammars; n Natural Language Processing
- Theoretical Computational and Psychological Perspectives, Cambridge Uni-
versity Press, 1985.
[8] Joshi, A.K. - The relevance of Tree Adjoining Grammar to generation; n Nat-
ural Language Generation, Martinus Nijho Publishers, Dordrecht, 1987
[9] Schabes, Y. - Mathematical and Computational aspects of Lexicalized Gram-
mars; Eight European Summer School in Logic, Language and Information,
Praga, 12-23 August 1996
43
Prelegerea 4
Gramatici si analizori sintactici
Pentru a formaliza studiul structurii sintactice a unei propozit ii, sunt necesare doua
not iuni noi: gramatica - o construct ie formala specica unei structuri lingvistice,
si tehnicile de analiza sintactica care determina corectitudinea unei propozit ii
n conformitate cu regulile gramaticii.
Vom face observat ia ca mare parte din elementele folosite n acest capitol sunt
cunoscute din cursurile anilor anteriori ([2], [3]). Vom ncerca de aceea sa punctam
numai diferent ele de prezentare a conceptelor, cu o apropiere de structura temei
actuale - lingvistica matematica.
4.1 Gramatici si structuri lingvistice
Unul din punctele majore de interes ale lingvisticii matematice consta n descrierea
modului de descompunere al unei propozit ii si explorarea structurilor sale corecte
din punct de vedere sintactic. Aparatul folosit n aceste explorari este de obicei
arborele de derivare.
Un astfel de arbore este reprezentat e sub forma uzuala (arborele asociat unei
derivari independente de context) sau prin operat ia de parantezare.
Exemplul 4.1 Sa consideram gramatica (independenta de context) cu product iile:
1. S NP VP 5. NUME Andrei
2. VP V NP 6. V a rupt
3. NP NUME 7. ART o
4. NP ART N 8. N musca
Product iile 5 8 (de tip < neterminal >< terminal>) se numesc product ii
lexicale.

In studiul care urmeaza, acest tip de reguli vor ignorate, deoarece nu
modica cu nimic fondul discut iei.
Semnicat ia neterminalelor (denita si n prelegerile anterioare) este:
S propozit ie NP expresie-substantiv V P expresie-verb
ART articol NUME substantiv propriu V verb
N substantiv comun
43
44 PRELEGEREA 4. GRAMATICI SI ANALIZORI SINTACTICI
Pentru propozit ia Andrei a rupt o musca se poate construi derivarea (stanga):
S = NP VP = NUME VP = Andrei VP = Andrei V NP
= Andrei a rupt NP = Andrei a rupt ART N
= Andrei a rupt o N = Andrei a rupt o musca.
Arborele de derivare corespunzator poate reprezentat n doua moduri:

)
H
H
Hj
?

H
H
Hj
? ?

H
H
Hj
? ?
S
NP VP
NUME V NP
Andrei
a rupt ART N
o
musca
Figura 4.1
sau, sub forma parantezata (parcurgerea inx a unui arbore oarecare):
(S (NP (NUME Andrei))
(VP (V a rupt)
(NP (ART o)
(N musca))))
Sa reamintim cateva elemente. Unei gramatici i se pot asocia doua modalitat i
de operare:
Modalitatea generativa: pentru construirea limbajului asociat se folosesc de-
rivarile;
Modalitatea de recunoastere: se cauta structura propozit iilor care pot
construite de regulile gramaticii.
Modalitat ile de recunoastere se mpart n:
1. Strategii top-down: se pleaca de la S si se cauta pe diverse cai sa se rescrie
simbolurile, pana se ajunge la propozit ia cautata (sau pan a au fost epuizate
toate variantele de construct ie - n caz ca se cauta structura unei propozit ii
incorecte din punct de vedere al gramaticii enunt ate);
2. Strategii bottom-up: se pleaca de la cuvintele propozit iei si prin procedee
de deplasare-reducere (caut and membrii drept i ai regulilor si nlocuindu-i cu
membrii stangi corespunzatori), se cauta construirea arborelui de jos n sus,
pana se ajunge la simbolul radacin a S.
4.2. SEMNIFICAT IA UNEI GRAMATICI BUNE 45
4.2 Semnicat ia unei gramatici bune
La construct ia gramaticii care sa caracterizeze un limbaj L peste un alfabet V ,
trebuiesc urmarite cateva obiective:
generalitate: ordinul de marime al lui card(L) (propozit iile pe care gramatica
le considera corecte);
selectivitate: ordinul de marime al lui card(V

L) (propozit iile pe care


gramatica le considera gresite sintactic);
nt elegere: simplitatea gramaticii nsesi.

In gramaticile cu reguli put ine (cum sunt cele folosite n exemple) sunt generate
doar un numar mic de tipuri de propozit ii; aici, o analiza structurala poate parea
far a rost; totusi, analizorii sintactici construit i pentru aceste gramatici sunt usor de
generalizat la limbaje mari, n timp ce alte module de lucru vor necesita modicari
majore.

In generalizarea limbajului prin extensia gramaticii trebuiesc avute n vedere


anumite proprietat i pe care sa le aiba noile propozit ii.

In particular se va urmari
modul n care propozit ia este mp art it a n componente numite constituient i. La
aceasta, un rol important l joaca intuit ia si experient a, care ajuta la construt ia
diverselor teste specice.
Sa detaliem put in aceasta armat ie.
Ori de cate ori se observa ca un grup de cuvinte formeaza un anumit constituient
, pasul urmator este de a construi noi propozit ii care sa utilizeze n legatur a cu
alte grupe de cuvinte clasicate ca apart inand aceluiasi tip de constituient i. Acest
test se bazeaza pe faptul ca n majoritatea cazurilor, numai constituient ii de acelasi
tip pot legat i.
Tabelul 4.1 ofera cateva exemple n acest sens.
Tabelul 4.1:
NP NP Eu am mancat o supa si o friptura.
V P V P Voi manca supa si voi renunt a la friptura.
S S Eu mananc supa si Andrei mananca friptura.
PP PP Am vazut aceeasi jucarie n vitrina si pe raft.
ADJP ADJP Am luat din frigider o friptura rece si arsa.
ADV P ADV P Rodica mergea pe drum ncet si cu foarte mare atent ie.
N N Eu am mancat o supa si o friptura.
V V Maria gaseste si scoate puloverul din dulap.
AUX AUX Paul poate si vrea sa treaca examenul acesta.
ADJ ADJ Podul trece peste o apa foarte rece si repede
(adica foarte rece si foarte repede).
Totusi, daca nu suntem atent i, aceste construct ii pot conduce si la propozit ii
incorecte gramatical, cum ar :
Eu am mancat o friptura ncet si bine prajita.
46 PRELEGEREA 4. GRAMATICI SI ANALIZORI SINTACTICI
Alte teste se construiesc inserand constituient ii propusi n alte propozit ii care
folosesc aceeasi categorie de constituient i.
4.3 Algoritm de analiza sintactica top-down
Un algoritm de analiza sintactic a poate construit foarte simplu ca o procedura
care ncearc a diverse modalitat i de combinare a formelor gramaticale, n scopul de
a ajunge la o combinat ie pe baza careia se poate construi un arbore de derivare
corespunzator structurii secvent ei de intrare.

In prima faza, nu vom interesat i de construct ia arborelui, ci doar de raspunsul


(DAsau NU) daca este posibila construct ia unui astfel de arbore (deci daca secvent a
de intrare poate generata sau nu de gramatica).
Algoritmii top-down de analiza sintactica lucreaza n maniera predictiva([3]):
pleaca de la simbolul de start S si ncearc a sa-l rescrie ntr-o secvent a de simboluri
terminale, consistenta cu secvent a de intrare.
Starea unui astfel de analizor la un anumit moment poate caracterizata de o
lista a simbolurilor rezultate n urma operat iilor de derivare pan a atunci; aceasta
stare o vom numi lista de simboluri. De exemplu, analizorul pleaca din starea init iala
S si, dupa aplicarea regulii S NP VP, lista de simboluri va (NP VP). Daca n
continuare se aplica product ia NP ART N, lista de simboluri va (ART N VP),
s.a.m.d.
Analizorul poate continua n acest mod pan a ajunge ntr-o stare formata numai
din terminale; n acest moment, el va testa daca aceasta stare coincide cu secvent a
de intrare.
O asemenea modalitate este nsa prea greoaie deoarece, n caz de eroare, necesita
ntoarceri care sporesc enorm complexitatea algoritmului.
Un algoritm mai bun (desi nu elimina ntoarcerile) este acela n care intrarea
este comparata cu secvent a de terminale obt inut a la ecare pas.

In plus, se poate
folosi aici o structura numita lexicon care stocheaz a ecient pentru ecare cuvant,
toate categoriile lexicale din care poate face parte.
Exemplul 4.2 Un lexicon simplu poate :
plange: V ;
caine: N;
Un: ART;
De asemenea, vom folosi gramatica independenta de context:
1. S NP VP 3. NP ART ADJ N 5. VP V NP
2. NP ART N 4. VP V
Daca se foloseste lexiconul de sus, gramatica determina un limbaj n mod neam-
biguu, chiar daca nu cont ine nici o product ie lexicala.
Cu aceste convent ii, o stare a unui analizor sintactic top-down este denita ca
o pereche (, k) unde este o lista de simboluri (ca mai sus) iar k este un numar
indicand pozit ia curent a n secvent a. Fiecare pozit ie reprezint a numarul cuvantului
care urmeaza n secvent a.
4.3. ALGORITM DE ANALIZ

A SINTACTIC

A TOP-DOWN 47
Exemplul 4.3 Sa consideram propozit ia:
1
Un
2
caine
3
plange
4
O stare tipica de analiza poate : ((N VP) 2).

In ea se indica faptul ca analizorul cauta un N urmat de un VP, pornind de


pe pozit ia 2. Noile stari sunt generate din cele vechi, n funct ie de primul simbol
(daca este simbol lexical sau nu). Daca acesta este un simbol lexical (cum ar
N) si urmatorul cuvant din secvent a de intrare poate apart ine acestei categorii lexi-
cale, starea se poate modica eliminand primul simbol si repozit ionand contorul.

In
propozit ia propusa pentru analiza, deoarece cuvantul caine apare n lexicon ca un
N, urmatoarea stare a analizorului va ((VP) 3), ceea ce nseamna ca trebuie gasit
un VP plecand de la pozit ia 3.
Daca primul simbol este un neterminal (cum ar VP), acesta este rescris
folosind o regula din gramatica. De exemplu, cu regula 4 din gramatica data n
exemplul 4.2, noua stare va ((V ) 3) iar cu regula 5 ((V NP) 3).
Un algoritm de analiza sintactica top-down bazat pe acest formalism si folosind o
tehnica backtracking (pentru a nu rata eventuale solut ii) este construit mai jos.
4.3.1 Algoritm de analiza sintactica top-down

In acest caz se construieste o lista de stari, numita lista de posibilitat i. Primul


element al listei este starea curent a, (sub forma denita anterior); celelalte elemente
sunt stari backup (de revenire), ecare indicand o alternativa aparut a pe parcursul
derivarii.
Exemplul 4.4 Lista de posibilitat i:
(((N) 2)((NUME) 1)((ADJ N) 1))
indica faptul ca avem starea curenta formata din lista de simboluri (N) din pozit ia
2, si doua backup-uri posibile, unul format din lista (NUME) din pozit ia 1, celalalt
din lista de simboluri (ADJ N), de asemenea din pozit ia 1.
Algoritmul pleaca din starea init ial a ((S) 1), far a stari backup. Pasii lui sunt:
1. Selecteaza starea curent a: Se scoate prima stare din lista de posibilitat i; sa o
numim C. Daca lista de posibilitat i este vida, secvent a de intrare este respinsa
(nu este conforma cu gramatica limbajului) si STOP.
2. Daca C are o lista de simboluri vida si pozit ia cuvantului este la sfarsitul
secvent ei, aceasta este acceptata ca ind corecta; STOP.
3.

In celelalte cazuri se genereaza urmatoarele stari posibile (care se pun la
nceputul listei de posibilitat i):
(a) Daca primul element al listei de simboluri din C este un simbol lexical, iar
urmatorul cuvant din secvent a poate n clasa acestui simbol, se creaza o
noua stare eliminand primul simbol din lista de simboluri si repozit ionand
contorul.
48 PRELEGEREA 4. GRAMATICI SI ANALIZORI SINTACTICI
(b) Daca primul simbol din lista de simboluri din C este un neterminal, se
genereaza o noua stare pentru ecare regula din gramatica care poate
rescrie acest neterminal.
Exemplul 4.5 Sa aplicam acest algoritm pentru gramatica de mai sus si pentru
secvent a de intrare
Un caine plange.
Vom avea urmatorii pasi:
Pas Stare curenta Stari backup Comentarii
1. ((S) 1) Pozit ia init iala
2. ((NP VP) 1) Se rescrie S cu regula 1
3. ((ART N VP) 1) Se rescrie NP cu regulile 2
((ART ADJ N VP) 1) si 3
4. ((N VP) 2) Se reduce ART cu Un
((ART ADJ N VP) 1)
5. ((VP) 3) Se reduce N cu caine
((ART ADJ N VP) 1)
6. ((V ) 3) Se rescrie VP cu regulile 4
((V NP) 3) si 5
((ART ADJ N VP) 1)
7. (() 4) Se reduce V cu plange
((V NP) 3)
((ART ADJ N VP) 1)
8. STOP Propozit ie corecta.
Exemplul 4.6 Sa consideram acelasi algoritm si secvent a de intrare
1
Un
2
batran
3
toc
4
scart ie
5
.
Pentru ea, lexiconul va :
un : ART
toc : N, V
batran : ADJ, N
scart ie : V
Apar aici ambiguitat i din cauza cuvintelor toc - care poate substantiv dar si
verb, n propozit ii ca
Eu toc frunza la caini.
si batran - care poate atat adjectiv cat si substantiv).
Algoritmul de analiza va parcurge pasii din Tabelul 4.2:
Este util de formalizat acest algoritm de analiza sintactic a top-down (n maniera
algoritmilor predictivi).
4.4. ALGORITM DE ANALIZ

A SINTACTIC

A BOTTOM-UP 49
Tabelul 4.2:
Pas Stare curenta Stari backup Comentarii
1. ((S) 1) Pozit ia init iala
2. ((NP VP) 1) Se rescrie S cu regula 1
3. ((ART N VP) 1) Se rescrie NP cu
((ART ADJ N VP) 1) regulile 2 si 3
4. ((N VP) 2) Se reduce ART cu Un
((ART ADJ N VP) 1)
5. ((VP) 3) Se reduce N cu
((ART ADJ N VP) 1) batran
6. ((V ) 3) Se rescrie VP cu
((V NP) 3) regulile 4 si 5
((ART ADJ N VP) 1)
7. ((), 4) Se reduce V cu toc
((V NP) 3)
((ART A|!DJ N VP) 1)
8. ((V NP) 3) Se alege primul backup
((ART ADJ N VP) 1)
9. ((NP) 4)
((ART ADJ N VP) 1)
10. ((ART N) 4) Esec; la 4 nu este ART
((ART ADJ N) 4)
((ART ADJ N VP) 1)
11. (ART ADJ N) 4) Din nou esec
12 ((ART ADJ N VP) 1) Se ia ultimul backup
13. ((ADJ N VP) 2) Se reduce ART cu Un
14. ((N VP) 3) Se reduce ADJ
cu batran
15. ((VP) 4) Se reduce N cu toc
16. ((V ) 4)
((V NP) 4)
17. (() 5) Secvent a corecta !
4.4 Algoritm de analiza sintactica bottom-up
Dupa cum se stie ([3]), algoritmii bottom-up difera de cei top-down prin modul de
folosire a product iilor. Operat ia de baza este aceea de a lua o secvent a de simboluri
si a o compara cu membrii drept i ai product iilor; daca exista o regula cu acest
membru drept, secvent a se nlocuieste cu membrul stang al product iei folosite, dupa
care procesul se reia.

Intr-un astfel de analizor, o stare este o lista de simboluri, init ial ind secvent a
de analizat. Starile succesoare pot generate explorand toate posibilitat ile astfel
ca:
1. Sa se rescrie un cuvant din secvent a prin toate categoriile sale lexicale posibile;
50 PRELEGEREA 4. GRAMATICI SI ANALIZORI SINTACTICI
2. Sa se nlocuiasca o secvent a de simboluri care formeaza membrul drept al unei
reguli, cu membrul ei stang.
Din pacate, o astfel de implementare conduce la un algoritm foarte inecient
ca timp; pentru a simplica problema, vom introduce o structura de date numit a
harta, n care se stocheaza rezultatele part iale ale procesului de identicare (pentru
a elimina repetarea lor).
Procesul de identicare are loc pe baza unui constituient numit cheie; de ecare
data se cauta identicarea pentru product iile al caror membru drept ncepe cu cheia,
sau au nceput cu o cheie anterioara si solicita o noua cheie pentru a completa
membrul drept al product iei sau a o extinde la una noua.

Inainte de a formaliza procedeul, sa luam un exemplu.


Exemplul 4.7 Fie gramatica de product ii:
1. S NP VP 3. NP ART N 5. VP AUX VP
2. NP ART ADJ N 4. NP ADJ N 6. VP V NP
Sa presupunem ca analizam o secvent a care ncepe cu un ART. Cu acest ART
drept cheie pot activate product iile 2 si 3 (sunt singurele care ncep cu un ART).
Pentru a semnala aceasta la analiza urmatoarei chei, trebuie observat ca regulile 2 si
3 pot continuate din punctul de dupa ART; vom marca acest fapt scriind product ia
cu un semn () pentru a marca de unde se continua analiza. Deci, vom nregistra:
2

. NP ART ADJ N
3

. NP ART N
Daca urmatoarea cheie de intrare este un ADJ, atunci poate ncepe regula 4 (ca
mai sus), iar regula 2

poate extinsa pana la:


2. NP ART ADJ N
Harta ment ine nregistrat i tot i constituient ii derivat i din secvent a, precum si
toate product iile folosite part ial n derivare; acestea sunt numite arcuri active. De
exemplu, dupa ce s-a depistat un ART init ial urmat de un ADJ, se ajunge la harta
urmatoare:
ART1 ADJ1
1 2 3
NP ART ADJ N
NP ART N
-
-
-
-
NP ADJ N
NP ART ADJ N
(4)
(2)
Figura 4.2
Interpretarea Figurii 4.2 este urmatoarea: exista pe harta doi constituient i com-
plet i: ART1 de la pozit ia 1 la pozit ia 2, si ADJ1 de la pozit ia 2 la pozit ia 3. Sunt 4
4.4. ALGORITM DE ANALIZ

A SINTACTIC

A BOTTOM-UP 51
arce active indicand constituient ii posibili; ele sunt indicate prin saget i si interpretate
astfel (de sus n jos):
Exista un NP posibil cu plecare din pozit ia 1, care necesita un ADJ ncepand
cu pozit ia 2.
Este posibil un NP care pleaca din pozit ia 1, si cere un N pe pozit ia 2.
Este posibil un NP care pleaca din pozit ia 2 si cere un N pe pozit ia 3.


In sfarsit, mai este posibil un NP care pleaca din pozit ia 1 cu un ART urmat
de un ADJ si cere un N ncepand cu pozit ia 3.
Operat iile de baza ale unui analizor bazat pe hart i folosesc o combinare ntre arce
active si constituient i complet i. Rezultatul este sau un constituient complet nou sau
un arc activ nou, extensie a arcului activ originar. Noii constituient i activi complet i
sunt depusi ntr-o lista numita agenda, pan a n momentul cand sunt adaugat i la
harta.
Procesul se poate exprima algoritmic astfel:
Algoritmul de extensie a arcelor:
Pentru a adauga un constituient C de la pozit ia p
1
la pozit ia p
2
:
1. Se insereaza C n harta de la p
1
la p
2
;
2. Pentru orice arc activ de forma X X
1
. . . C . . . X
n
de la p
0
la p
1
,
se adauga un arc activ nou X X
1
. . . C . . . X
n
de la p
0
la p
2
;
3. Pentru orice arc activ de forma X X
1
. . . X
n
C de la p
0
la p
1
, se
adauga n agenda un nou constituient de tipul X de la p
0
la p
2
.
Fiind dat acest algoritm, putem construi un algoritm de analiza bottom-up astfel:
Se efectueaza urmatorii pasi pan a se parcurge toata secvent a de intrare:
1. Daca agenda este vida, se cauta si se introduc n agenda toate inter-
pretarile pentru urmatorul cuvant de la intrare;
2. Se selecteaza un constituient C din agenda, de la pozit ia p
1
la pozit ia
p
2
;
3. Pentru ecare regula din gramatica de forma X CX
1
. . . X
n
se
traseaza un arc activ de forma X C X
1
. . . X
n
de la p
1
la p
2
;
4. Se adauga C la harta folosind algoritmul de extensie a arcelor.
52 PRELEGEREA 4. GRAMATICI SI ANALIZORI SINTACTICI
Exemplul 4.8 : Sa luam urmatoarea secvent a de intrare
O vie vie are rod.
Vom folosi pentru analizor gramatica de product ii:
1. S NP VP 3. NP ART ADJ N 5. VP V N
2. NP ART N 4. VP V
plus lexiconul:
O:ART
vie:N, ADJ, V
are:V
rod:N, V
Init ial agenda este vida; deci se citeste cuvantul O si se plaseaza n agenda
constituientul ART1. Deci:
Se introduce ART1 (O de la 1 la 2);
Se adauga arcul activ NP ART ADJ N de la 1 la 2;
Se adauga arcul activ NP ART N de la 1 la 2;
(ambele activitat i au fost generate de pasul 3 al algoritmului, pe baza product iilor
2 si 3 ale gramaticii).

In continuare analizorul se desfasoara dupa harta urmatoare:


-
-
-
-
-
-
-
-
-
O vie vie
are
rod
(ART) (N, ADJ, V ) (N, ADJ, V ) (V ) (N, V )
1 2 3 4 5
NPARTN
NPARTADJ N
VPV N
NPART ADJN
SNPVP
VPV N
SNPVP
SNPVP
VPV N
Bibliograe
[1] Allen, J. - Natural Language Understanding, The Benjamin/Cummings Publ.
Co. Inc, 1995
[2] Atanasiu, A - Bazele Informaticii; suport de curs pentru anul II seral; Tipograa
Universitatii, 1987;
[3] Atanasiu, A. - Modele matematice n scrierea compilatoarelor; Ed. Olimp, 1996.
[4] Craciun, Dragos- Analizor morfologic pentru limba romana, Lucrare de licent a,
1997
[5] Gramatica Limbii Romane, Editura Academiei, 1966
[6] Joshi, A.K., Levi, L.S., Takahashi, M. - Tree Adjunct Grammars, J. Comput.
Syst. Sci. 10(1), 1975.
[7] Joshi, A.K. - How much context-senzitivity is necessary for Characterizing Struc-
tural description - Tree Adjoining Grammars; n Natural Language Processing
- Theoretical Computational and Psychological Perspectives, Cambridge Uni-
versity Press, 1985.
[8] Joshi, A.K. - The relevance of Tree Adjoining Grammar to generation; n Nat-
ural Language Generation, Martinus Nijho Publishers, Dordrecht, 1987
[9] Schabes, Y. - Mathematical and Computational aspects of Lexicalized Gram-
mars; Eight European Summer School in Logic, Language and Information,
Praga, 12-23 August 1996
53
Prelegerea 5
Alte modele gramaticale
5.1 Ret ele de tranzit ie

In afara formalismului de reprezentare a structurii sintactice - folosind gramatici


independente de context, se mai poate utiliza (si aplica cu succes n analiza sintac-
tica) o alta reprezentare graca. Ea se numeste ret ea de tranzit ie si este o metoda
de recunoastere (spre deosebire de gramatici, care sunt metode generative).
Denit ia 5.1 O ret ea de tranzit ie este un graf orientat, cu arcele marcate, n care
exista un nod (stare) init ial si un set de noduri nale. Marcajul nodului init ial da
numele ret elei. Arcele sunt marcate cu categorii sintactice.
Exemplul 5.1 Fie ret eaua numita NP reprezentata prin graful din Figura 5.1
Ea caracterizeaza acelasi limbaj ca si gramatica de product ii:
NP = ART NP1, NP1 = ADJ NP1, NP1 = N
Modul de utilizare este urmatorul. Se pleaca din starea init iala; ind ntr-un nod
P, se traverseaza un arc care pleaca din P numai daca acel arc este marcat cu o
categorie sintactica care reprezinta cuvantul curent din secvent a de intrare. Dupa
parcurgerea unui arc, urmatorul cuvant din secvent a devine cuvant curent.
O fraza este corecta sintactic daca exista un drum de la nodul init ial la un nod nal
(din care iese un arc marcat cu pop) care poate parcurs de fraza.
Evident, ret elele de tranzit ie sunt echivalente cu AFD-urile (automatele nite
deterministe). Din acest motiv, ele nu pot acoperi toata clasa limbajelor indepen-
dente de context. Pentru a realiza aceasta, se extinde denit ia la ret ele recursive de
tranzit ie (RTN).
Figura 5.1:

- - -
?-
6
NP: NP NP1 NP2
art
adj
subst
pop
53
54 PRELEGEREA 5. ALTE MODELE GRAMATICALE
Denit ia 5.2 O ret ea recursiva de tranzit ie este o ret ea de tranzit ie n care mult i-
mea marcajelor arcelor se mbogat este si cu nume de ret ele de tranzit ie.
Exemplul 5.2 O ret ea RTN care accepta propozit ii simple din limba romana este:
Figura 5.2:

- - - -
S S S
1
S
2
S
3
NP verb NP
pop
Marcajele scrise cu litere mari se refera la ret ele. Arcul de la S la S
1
poate
traversat numai daca ret eaua NP din Figura 5.1 poate traversata pana la un arc
marcat pop.
Evident, o ret ea RTN poate cont ine arce marcate cu propriul ei nume (deci o
denit ie recursiva).

In practica, sistemele RTN ncorporeaza unele tipuri adit ionale
de arce, utile dar nu formal necesare. Aceste tipuri sunt (Tabelul 5.1):
Tabelul 5.1:
Tip de arc Semnicat ie
CAT Este traversat numai de un cuvant din categoria specicata
de marcaj
WRD Este traversat numai de un cuvant identic cu marcajul
PUSH Este un arc marcat cu numele unei ret ele
JUMP Este un arc care poate traversat far a nici o condit ie
POP Arc care semnaleaza sfarsitul ret elei
5.2 Analiza sintactica top-down folosind RTN
Algoritmul prezentat este similar celui pentru gramatici independente de context
([2]). Astfel, starea analizorului poate reprezentata sub forma unui triplet
(n c, p c, rev, s rev)
unde:
n c (nod curent) este nodul din ret ea, activ n momentul act iunii;
p c (pozit ie curenta) este un pointer la urmatorul cuvant de analizat din
secvent a de intrare;
rev (puncte de revenire) este o stiva cu nodurile din alte ret ele, unde se
revine daca n ret eaua curent a se parcurge un arc pop.
5.2. ANALIZ

A SINTACTIC

A TOP-DOWN FOLOSIND RTN 55


s rev (stare de revenire) cont ine o alta stare, construita atunci cand anali-
zorul a avut la dispozit ie mai multe variante de continuare.
Congurat ia init ial a este (S, 1, , ).
Sa presupunem ca la un moment dat analizorul se aa n starea curenta
(n c, p c, rev, s rev)
. Atunci el va parasi nodul curent n c si va traversa un arc n urmatoarele situat ii:
1. Daca urmatorul cuvant din secvent a de intrare (marcat de p c) apart ine ca-
tegoriei sintactice care marcheaza arcul, atunci
(a) pozit ioneaza p c la urmatorul cuvant de intrare;
(b) scrie nodul destinat ie al arcului n locul lui n c;
(c) daca s-a analizat un cuvant cu mai multe categorii sintactice si mai exista
alte arce posibile (corespunzatoare acelor categorii) care pleaca din n c,
se ignora n ret ea arcul prelucrat si se genereaza similar pe baza aceluiasi
algoritm o noua stare, care se introduce n s rev;
2. Daca arcul este marcat cu numele unei ret ele R atunci
(a) se introduce nodul destinat ie al arcului n rev;
(b) se ia nodul init ial al ret elei R drept nod curent;
3. Daca arcul este pop si stiva rev nu este vida, atunci se scoate nodul din topul
stivei si se trece drept n c;
4. Daca arcul este pop, rev este vida si nu mai sunt cuvinte n secvent a de intrare,
atunci Analiza este corecta.
5. Daca din n c nu exista nici un arc corespunzator categoriei sintactice a cuvan-
tului aat la p c, se cerceteaza s rev si:
(a) daca s rev = , Propozit ia nu este corecta., Stop.
(b) daca s rev = , se ia drept stare curent a starea din s rev.
Exemplul 5.3 Sa consideram limbajul caracterizat de ret eaua din Figura 5.3:
Numerele scrise pe arce indica ordinea de prioritate a arcelor atunci cand sunt
mai multe arce care pleaca dintr-un nod.
Folosind aceste ret ele, sa facem analiza sintactica a propozit iei
1
Un
2
caine
3
slab
4
latra
5
doi
6
copii
7
Lexiconul folosit este urmatorul:
un: ART(art), NUM(nr);
doi: NUM(nr);
caine: N(subst);
copil: N(subst);
56 PRELEGEREA 5. ALTE MODELE GRAMATICALE
Figura 5.3:

- -
-
? -
6
-
?-
6
-
- - -
?-
6
NP NP1 NP2
S S1 S2
NP
S
art
nr
subst
pron
adj
pop
1
2
3
1
2
NP verb
pop
NP
1
2
a latra: V(verb);
slab: ADJ(adj);
(am scris n paranteza notat iile folosite pentru arcele din ret ea).
(S, 1, , ) (NP, 1, S1, ) (NP1, 2, S1, ) (NP2, 3, S1, )
(S1, 3, , (NP1, 3, S1, )) (NP2, 3, S1, ) (NP2, 4, S1, )
(S1, 4, , (NP2, 4, S1, )) (S2, 5, , (NP2, 4, S1, ))
(NP, 5, S2, (NP2, 4, S1, )) (NP1, 6, S2, (NP2, 4, S1, ))
(NP2, 7, S2, (NP2, 4, S1, )) (S2, 7, , (NP2, 4, S1, ))
Analiza este corecta.
5.3 Utilizarea automatelor nite n prelucrarea
morfologica
Sa reluam ideea pe baza careia s-a denit morfologia paradigmatica.
Desi n exemplele simple si sistemele mici listarea tuturor cuvintelor din dict ionar
este relativ simpla, pentru sistemele cu vocabulare mari, reprezentarea lexiconului
reprezint a o problema dicila. Nu numai ca exista un mare num ar de cuvinte, dar -
dupa cum am vazut ntr-o prelegere anterioar a - ecare din ele, combinat cu axe,
produce o serie de alte cuvinte care au semnicat ii diferite. O modalitate des uzitata
de a rezolva problema consta n rearanjarea secvent ei de intrare ntr-o secvent a de
morfeme. Reamintim ca un cuvant poate format dintr-un singur morfem, dar
poate consta dintr-o rad acina la care se adauga diverse axe (prexe si/sau suxe).
De exemplu, la radacina cred se pot adauga diverse axe din mult imea {e,em,in,t a,
re, cios} formandu-se cuvinte cum ar
cred-e, cred-in-t a, cred-in-cios, n-cred-e-re, s.a.m.d.
O modalitate de ret inere ecient a a cuvintelor cu aceeasi radacin a este construirea
lor pe baza unor automate nite.
Sa luam de exemplu verbul a nvat a. Formele la care se prezinta el la indicativ
prezent {nvat , nvet i, nvat a, nvat am, nvat at i} reprezinta limbajul acceptat de
automatul nit din n Figura 5.4.
El pleaca de la morfemul vat , n care litera din mijloc se poate modica n a
sau e, n funct ie de declinare. Dupa cum se vede, au fost ret inute doar 14 caractere
5.4. GRAMATICI SI PROGRAMARE LOGIC

A 57
Figura 5.4:
j j j j j z j z
z
z
j j
j j
- - - - - - -

3
- -
Q
Q
Q
Q
Q
Qs
- -
6

n v
a
t
a
m
e
t
i
a
a
t
a
n loc de 32; informat iile suplimentare legate de structura automatului (arce, stari
nale, etc) sunt usor de ret inut prin forma de memorare a datelor (de exemplu, liste
nlant uite).
Automatul poate completat pentru a lega si celelalte forme exionare ale ver-
bului a nvat a, precum si cuvintele nrudite, cum ar substantivele care pleaca de
la nvat atura, adjective (nvat at), dar si forme cu alte prexe, cum este de exemplu
dezvat .

Intregul lexicon poate codicat astfel ca un automat nit (eventual cu -


misc ari) care cuprinde toate cuvintele corecte, si le transforma n secvent e de mor-
feme. Pot combinate familii de cuvinte cu axe comune (cum ar de exemplu
nvechit, nvat at, napoiat, nrudit, etc), dar si cu port iuni comune (untdelemn, can-
dela, sfredel..).
Dict ionarele limbilor naturale pot usor modelate n acest fel.

In funct ie de
lexicon si de abilitatea de combinare, se poate construi un automat nit cu num ar
minim de stari.
5.4 Gramatici si programare logica
O modalitate clara de implementare a algoritmilor de analiza sintactic a este folosirea
limbajului PROLOG.
Exemplul 5.4 Fie gramatica de product ii:
1. S = NP VP 3. NP = N 5. VP = V 7. VP = V PP
2. NP = ART N 4. PP = P NP 6. VP = V NP
Reprezentarea sa n PROLOG este data de Tabelul 5.2:
Sa presupunem ca secvent a de intrare este:
Andrei cumpara o carte.
Aceasta intrare este descrisa prin:
word(Andrei,1,2)
word(cumpara,2,3)
word(o,3,4)
word(carte,4,5)
Lexiconul este denit prin mult imea de predicate, astfel:
isart(o)
58 PRELEGEREA 5. ALTE MODELE GRAMATICALE
Tabelul 5.2:
1. s(P1, P3) : np(P1, P2), vp(P2, P3)
2. np(P1, P3) : art(P1, P2), n(P2, P3)
3. np(P1, P2) : nume(P1, P2)
4. pp(P1, P3) : p(P1, P2), np(P2, P3)
5. vp(P1, P2) : v(P1, P2)
6. vp(P1, P3) : v(P1, P2), np(P2, P3)
7. vp(P1, P3) : v(P1, P2), pp(P2, P3)
Tabelul 5.3:
Pas Stare curenta Stari backup Comentarii
1 s(1, 5)
2 np(1, P2) vp(P2, 5)
3 art(1, P2

) n(P2

, P2) nume(1, P2) vp(P2, 5) Esec; nu exista


vp(P2, 5) art pe pozit ia1
4 nume(1, P2) vp(P2, 5)
5 vp(2, 5) Se verica nume(1, 2)
6 v(2, 5) v(2, P2) np(P2, 5) Esec; nu exista
v(2, P2) pp(P2, 5) verb pe pozit iile 2 5.
7 v(2, P2) np(P2, 5) v(2, P2) pp(P2, 5)
8 np(3, 5) v(2, P2) pp(P2, 5) Se verica v(2, 3)
9 art(3, P2) n(P2, 5) nume(3, 5)
v(2, P2) pp(P2, 5)
10 n(4, 5) nume(3, 5) Se verica art(3, 4)
v(2, P2) pp(P2, 5)
11 Succes ! nume(3, 5) Se verica n(4, 5)
v(2, P2) pp(P2, 5)
isnume(Andrei)
isverb(cumpara)
issubst(carte)
Cuvintele ambigui (pentru care sunt denite mai multe categorii sintactice) vor
necesita asert iuni multiple - cate una pentru ecare categorie sintactica careia i
apart ine.
Pentru ecare categorie sintactica se deneste cate un predicat, care ia valoarea
Adevar daca si numai daca cuvantul dintre pozit iile specicate este din categoria
respectiva. Deci:
5.5. DEFINIREA FORMAL

A A UNUI SPELLER CHECKER 59


n(I,O) : - word(Word,I,O),issubst(Word)
art(I,O) : - word(Word,I,O),isart(Word)
v(I,O) : - word(Word,I,O),isverb(Word)
nume(I,O) : - word(Word,I,O),isnume(Word)
Algoritmul de analiza sintactica bottom-up este activat acum prin execut ia co-
menzii s(1, 5). Scriind ntr-o forma mai detaliata procedura de analiza, se parcurg
pasii listat i n Tabelul 5.3.
Se pot efectua diverse simplicari ale programelor PROLOG, care sa mareasca
ecient a analizorului (de remarcat ca n aceasta scriere, complexitatea algoritmului
este exponent ial a: C
n
- unde C este num arul de reguli iar n - lungimea secvent ei de
intrare).
5.5 Denirea formala a unui Speller Checker
Elementele fundamentale ale acestei sect iuni sunt prezentate pe larg n [5] si consti-
tuie baza de construct ie a unui controller gramatical pentru limba ceha; ele pot
transferate far a modicari si n cazul limbii romane.
Denit ia 5.3 O gramatica independenta de context ne-proiectiva(NCFDG) este
o structura (V
N
, V
T
, S, P) cu semnicat iile obisnuite, unde P cont ine reguli de re-
scriere de forma A
L
BC, A
R
BC, cu A V
N
, B, C V (V = V
N
V
T
).
Relat ia de derivare imediata este denita prin:
A = BC, daca A
L
BC P;
A = BC, daca A
R
BC P.
Relat ia de derivare =

este nchiderea reexiva si tranzitiva a relat iei =. Lim-


bajul L(G) generat de o gramatica G este denit n mod obisnuit.
Observat ie: Pentru = se obt ine derivarea obisnuita din gramaticile indepen-
dente de context.
Denit ia 5.4 Pentru un cuvant w = a
1
a
2
. . . a
n
V

T
, se deneste un arbore Tr
dominat de nodul X V astfel:
1. ecare nod din Tr este un triplet [A, i, j] unde A V, 1 i, j n. Numarul i
este indexul orizontal al nodului, iar j este indexul vertical.
2. Nodul [A, i, m] are descendent ii [B, j, p], [C, k, r], daca si numai daca:
j < k, m = p + 1, j = i, si A
L
BC P, sau
j < k, m = r + 1, k = i, si A
R
BC P.
3. Radacina este un nod de forma [X, i, m] pentru anumit i i, m {1, 2, . . . , n}.
4. Nodurile terminale sunt toate nodurile de forma [a
i
, i, 1], 1 i n.
60 PRELEGEREA 5. ALTE MODELE GRAMATICALE
Pentru simplicare, daca arborele este dominat de S, nu vom mai specica aceasta
n mod explicit.
Exemplul 5.5 Limbajul L = {w|w {a, b, c}

, N
a
(w) = N
b
(w) = N
c
(w)}
este generat de o gramatica NCFDG n care V
N
= {S, T}, V
T
= {a, b, c},
P = {S
L
aT|Ta|SS, T
L
bc|cb}.
De exemplu, w = aabbcc este generat prin
S =
L
SS =
L
aST =
L
aaTT =
L
aabTc =
L
aabbcc
care are arborele de derivare Tr reprezentat n Figura 5.5:
Figura 5.5:
[S, 1, 3]
[S, 1, 2] [S, 2, 2]
[T, 3, 2] [T, 4, 2]
[a, 1, 1] [a, 2, 1] [b, 3, 1] [b, 4, 1] [c, 5, 1] [c, 6, 1]
a a
b b
c c
?
Z
Z
Z
Z
Z
Z~
?
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
XXz
?
Z
Z
Z
Z
Z
Z~
?
P
P
P
P
P
P
P
P
P
P
Pq
?
P
P
P
P
P
P
P
P
P
P
Pq
Denit ia 5.5 Fie Tr arborele corespunzator cuvantului w = a
1
a
2
. . . a
n
V

T
n
gramatica NCFDG G. Arborele de dependent a Dep(Tr) = (, U) asociat lui Tr se
deneste astfel:
= {[a, i] | [a, i, 1] Tr},
U este format din toate arcele ([a, i], [b, j]) cu proprietatea ca [a, i, 1], [b, j, 1]
sunt noduri distincte n Tr, unde exista si un arc ([A, i, p], [B, j, r]), pentru anumit i
A, B, p, r.
Astfel, pentru arborele din Exemplul 5.5, arborele de dependent a este (pentru
usurin-t a, s-a marcat si neterminalul corespunzator nodului):
[a, S, 1]
[a, S, 2]
[b, T, 3] [b, T, 4]
[c, c, 5] [c, c, 6]

+
Z
Z
Z
Z
Z
Z~
Q
Q
Qs
5.5. DEFINIREA FORMAL

A A UNUI SPELLER CHECKER 61


Pentru aplicat ia la care ne referim n acest paragraf, trebuiesc construit i - pen-
tru un cuvant dat w = a
1
a
2
. . . a
n
- tot i arborii corespunzatori dintr-o gramatica
NCFDG G data. Algoritmii lucreaza cu liste D de itemi de forma
D
i
= [ simbol, pozit ie, acoperire, ls, rs, regula]
ecare item corepunzand derivarii unei anumite subsecvent e a lui w n gramatica
G. Semnicat iile elementelor lui D
i
sunt:
simbol reprezint a simbolul rad acin a al arborelui de derivare;
pozit ie este indexul orizontal;
acoperire este mult imea indicilor orizontali ai nodurilor sale terminale;
ls, rs sunt indicii itemilor D
ls
, D
rs
cont in and descendent ii stang respectiv drept
ai arborelui Tr;
regula este num arul regulii care a generat itemul.
Algoritmul va adauga la lista cat mai mult i itemi posibili.
Init ial lista D va cont ine itemii
[a
i
, i, {i}, 0, 0, 0], 1 i n.
Fie |D| numarul de elemente din D.
Derivarea este realizata comparand treptat toate perechile (D
i
, D
j
), i, j {1, 2,
. . . , |D|} si cercetand daca exista vre-o regula A
X
D
i
.simbolD
j
.simbol, (X
{R, L}); daca acest lucru este posibil, se creaza un nou item care mosteneste pozit ia
din D
i
sau D
j
(dupa cum regula a fost de tip L respectiv R). Noua acoperire este
reuniunea ambelor acoperiri anterioare.
Doi itemi pot genera alt item numai daca acoperirile lor sunt disjuncte.
Algoritmul 1 (Analiza):
for i := 1 to n do
D
i
:= [a
i
, i, {i}, 0, 0, 0];
Numar itemi := n;
i := 2
while i Numar itemi do
for j := 1 to i 1 do
if D
i
.acoperire D
j
.acoperire = then
for regula := 1 to Numar reguli do
begin
V erifica(D
i
, D
j
, regula)
V erifica(D
j
, D
i
, regula)
end;
Verica(D
x
, D
y
, r)
if r : A
L
D
x
.simbolD
y
.simbol then
D := D {[A, D
x
.pozit ie, D
x
.acoperire D
y
.acoperire, x, y, r]}
else if r : A
R
D
x
.simbolD
y
.simbol then
D := D {[A, D
y
.pozit ie, D
x
.acoperire D
y
.acoperire, x, y, r]}
62 PRELEGEREA 5. ALTE MODELE GRAMATICALE
Algoritmul 2 (Recunoastere):
Este identic cu Algoritmul 1, cu o condit ie suplimentar a n subalgoritmul
Verica: un item nou [a, b, c, i, j, k] se introduce n D numai daca
m, p, q, r [1, n], [a, m, c, p, q, r] D.
Pentru controlul corectitudinii gramaticale a limbajului se vor folosi de fapt doua
gramatici: una independent a de context, ale carei reguli (pozitive) vor genera
propozit ii corecte din limbaj. A doua gramatica - NCFDG - va cont ine reguli (numite
negative) care descriu construct iile gramaticale incorecte cunoscute, precum si alte
reguli generale referitoare la erori de lexic sau de sintax a. Aceasta gramatica include
ca submult ime stricta mult imea product iilor primei gramatici.
Aceste doua seturi de reguli pot aplicate de algoritmul de analiza anterior,
obt in andu-se trei rezultate posibile:
Propozit ia este recunoscuta de gramatica pozitiva: este corecta;
Propozit ia este recunoscuta folosind cel put in o regula negativa: cont ine cel
put in o greseala gramaticala;
Propozit ia nu este recunoscuta: erorile de sintaxa sunt prea mari si nu pot
oferi nici o solut ie de corectare.
Pentru a creste performant ele sistemului se pot introduce restrict ii suplimentare n
aplicarea regulilor negative; de exemplu se poate cere ca arborele Tr sa nu aiba doua
reguli negative aplicate consecutiv.
Algoritmul Grammar checker va lucra astfel: la nceput se va ncerca recunoas-
terea secvent ei de intrare cu gramatica independenta de context pozitiva (folosind
un algoritm de analiza oarecare - vezi [3]). Daca ea reuseste, secvent a este corecta;
daca nu, se reia procesul de analiza cu gramatica extinsa NCFDG, conform algorit-
mului 2 de sus. Daca analiza reuseste, eroarea de sintaxa este gasita si ea poate -
eventual - corectata. Daca nu, se reia Algoritmul 1 pentru a genera toate variantele
posibile si a le pune la dispozit ie utilizatorului pentru ca acesta sa aiba o imagine
de ansamblu a tuturor posibilitat ilor de eroare.
Bibliograe
[1] Allen, J. - Natural Language Understanding, The Benjamin/Cummings Publ.
Co. Inc, 1995
[2] Atanasiu, A - Bazele Informaticii; suport de curs pentru anul II seral; Tipograa
Universitatii, 1987;
[3] Atanasiu, A. - Modele matematice n scrierea compilatoarelor; Ed. Olimp, 1996.
[4] Craciun, Dragos- Analizor morfologic pentru limba romana, Lucrare de licent a,
1997
[5] Holan, T, Kubon, V, Platek, M - An implementation of Syntactic Analysis of
Czech, Proceedings of Fourth International Workshop on Parsing Technologies,
Prague and Karlovy Vary, sept. 20-24, 1995, pp. 126-135.
[6] Joshi, A.K., Levi, L.S., Takahashi, M. - Tree Adjunct Grammars, J. Comput.
Syst. Sci. 10(1), 1975.
[7] Joshi, A.K. - How much context-senzitivity is necessary for Characterizing
Structural description - Tree Adjoining Grammars; n Natural Language Pro-
cessing - Theoretical Computational and Psychological Perspectives, Cam-
bridge University Press, 1985.
[8] Joshi, A.K. - The relevance of Tree Adjoining Grammar to generation; n Nat-
ural Language Generation, Martinus Nijho Publishers, Dordrecht, 1987
[9] Schabes, Y. - Mathematical and Computational aspects of Lexicalized Gram-
mars; Eight European Summer School in Logic, Language and Information,
Praga, 12-23 August 1996
[10] Gramatica Limbii Romane, Editura Academiei, 1966
63
Prelegerea 6
Gramatici pe arbori
6.1 Gramatici lexicalizate
Multe teorii lingvistice actuale acorda o important a crescuta implementarilor le-
xicale n domenii de reprezentare considerate pana acum pur sintactice.

In parti-
cular, informat ia lexicala este incorporata n prelucrarea formalismelor gramaticale.
Pentru detalii se poate face apel la [9].

In aceasta prelegere vom deni numai
formal un model de reprezentare lexical/sintactic a structurilor gramaticale specice
unei limbi: acest model, numit Tree Adjoining Grammar este folosit pe scara tot
mai larga, cu aplicat ii diverse, de la structura lexicala pan a la analiza sintactic a si
semantic a a propozit iilor. Pentru o informare succint a, a se vedea [6], [7], [8], [9].
Denit ia 6.1 O gramatica lexicalizata este G = (S, A, , f, < o
1
, . . . , o
n
>) unde:
S (domeniul local de valabilitate) este format din o mult ime nita nevida de
elemente numite structuri;
A este o mult ime nita nevida de elemente numite termeni lexicali;
f : S A este o aplicat ie care asociaza ecarei structuri cate un termen
lexical; pentru S, f() este numit ancora structurii .
o
i
, 1 i n, n 1 sunt operat ii de compunere a structurilor.
Mult imea S se numeste lexicon. Structurile componente unui lexicon se numesc
structuri elementare. Structurile obt inute folosind operat ii de compunere ale
altor structuri se numesc structuri derivate.
Restrict ii ale denit iei:
Se vor considera doar structuri de marime nita.
Operat iile de combinare vor avea atat ca operanzi cat si ca rezultat un num ar
nit de structuri.
Operat iile nu vor putea copia, sterge sau rearanja (restructura) componentele
nemarginite ale argumentelor lor.
63
64 PRELEGEREA 6. GRAMATICI PE ARBORI
Vom deni categoria unui cuvant prin structura carel selecteaza. Ea nu este re-
dusa neaparat la o categorie singulara cum ar verb, substantiv, adjectiv, etc. Daca
o categorie are asociata o ancora, spunem ca ntreaga structura deneste categoria
ancorei.
O structura este lexicalizata dacan ea apare cel put in un termen lexical deschis.
Daca apar mai mult i termeni lexicali, atunci sau unul din ei este desemnat ca ancora,
sauntreaga mult ime de termeni lexicali locala structurii este desemnata ca o ancora
multi-componenta.
O gramatica compusa numai din structuri lexicalizate este evident lexicalizata.
Exemplul 6.1 De exemplu, urmatoarele structuri sunt lexicalizate, conform deni-
t iei:
NP
D N
om

+
Q
Q
Qs
?
S
NP
0 V P
V NP
1
ia

+
Q
Q
Qs

+
Z
Z
Z~
?
S
NP
0 V P
V NP
1
ia D N
o
cana

+
Q
Q
Qs

+
Z
Z
Z~
?

=
Q
Q
Qs
? ?
(
1
)
(
2
)
(
3
)
Din denit ie rezulta imediat unele proprietat i ale gramaticilor lexicalizate:
Lema 6.1 Gramaticile lexicalizate sunt nite ambigui.
Demonstrat ie: O gramatica este nit ambigu a daca nu exista nici un cuvant de
lungime nita pentru care se pot construi un num ar innit de analize.
Armat ia din lema este evidenta pentru propozit ii (secvent e) de lungime arbi-
trara nita. Mult imea structurilor ancorate de cuvintele acestor propozit ii consta
din structurile necesare pentru analiza lor; oricare alte structuri introduc termeni
lexicali care nu sunt n propozit ii.
Deoarece mult imea structurilor selectate este nita, acestea pot combinate
doar ntr-un num ar nit de moduri. 2
Pentru ca orice propozit ie de lungime nita este nit ambigu a, spat iul de lucru
necesar analizei sintactice este nit. Deci problema de recunoastere pentru gramati-
cile lexicalizate este decidabila.
Lema 6.2 Este decidabil daca o propozit ie este acceptata sau nu de o gramatica
lexicalizata.
O consecint a important a a acestei leme este aceea ca problema recunoasterii pen-
tru o unicare bazata pe gramatici lexicalizate este decidabila; pentru gramatici
nelexicalizate, ea este nedecidabila.
6.2. LEXICALIZAREA CFG 65
Principala ntrebare care apare acum este:
Pot lexicalizate gramaticile independente de context ?
Evident, nu orice cfg (gramatica independent a de context) este n forma lexicali-
zata. De exemplu, o regula de tipul S NP VP nu este lexicalizata deoarece nu
are n membrul drept nici un termen lexical.
Avand o gramatica G denita ntr-un anumit formalism, sa ncerc am sa gasim o
gramatica echivalenta G
lex
lexicalizata (nu neaparat n acelasi formalism).
Denit ia 6.2 Spunem ca un formalism F poate lexicalizat de un alt formalism
F

daca pentru orice gramatica nit ambigua G din F exista o gramatica lexicalizata
G

n F

cu proprietatea ca G si G

genereaza acelasi set de arbori (si deci acelasi


limbaj).
6.2 Lexicalizarea cfg
Dupa cum s-a vazut, o cfg lexicalizata are proprietatea ca orice product ie cont ine
un simbol terminal n membrul drept; o astfel de regula poate scrisa sub forma
unei structuri cu o ancora (corespunzatoare terminalului). Operat iile de combinare
sunt cele standard, rezultate din denit ia derivarii.
O idee de a pune gramaticile independente de context n forma lexicalizata ar
aducerea lor la Forma Normala Greibach. Reamintim, aceasta este o gramatica
n care regulile sunt de forma A a, ind o secvent a de lungime maxim 2
formata numai din simboluri neterminale (a se vedea [2]).
Totusi, aducerea unei gramatici la Forma Normala Greibach nu nseamna le-
xicalizarea ei pentru ca aceasta nu genereaza n general aceiasi arbori de derivare
cum sunt cei din gramatica originala. Deci aceasta metoda nu poate oferi solut ia la
cererea de lexicalizare.

In cele ce urmeaza vom lucra numai cu cfg de ambiguitate nita. Vom extinde
domeniul lor local de valabilitate pentru a permite ca termenii lexicali sa apara ca
elemente ale structurilor elementare, folosind o gramatica pe arbori cu substitut ia
ca operat ie de combinare.
Aceasta gramatica este formata dintr-un set de arbori care nu sunt condit ionat i
la adancimea 1 (cum sunt product iile unei gramatici independente de context), pe
care se deneste operat ia de substitut ie (n loc de derivare directa). Substitut iile pot
nlocui un nod neterminal aat pe frontiera unui arbore. Prin convent ie, nodurile
care se pot nlocui (substitui) sunt marcate cu . Dupa substituirea unui nod n,
acesta este nlocuit cu subarborele respectiv.
66 PRELEGEREA 6. GRAMATICI PE ARBORI
Denit ia 6.3 O gramatica de substitut ie pe arbori (TSG - Tree Substitution Gram-
mar) este o structura G = (V
N
, V
T
, I, S), unde:
1. V
T
este o mult ime nita nevida de simboluri terminale;
2. V
N
este o mult ime nita nevida de simboluri neterminale, V
T
V
N
= ;
3. S V
N
este un simbol special;
4. I este o mult ime nita nevida de arbori nit i ale caror noduri interioare sunt
marcate cu elemente din V
N
iar cele de pe frontiera sunt marcate cu elemente
din V
N
V
T
. Toate nodurile neterminale de pe frontiera sunt marcate pentru
substitut ie cu .
Spunem ca un arbore este derivat daca s-a obt inut dintr-un arbore init ial n care
s-au efectuat substitut ii cu arbori init iali sau derivat i. Un X-arbore este un arbore
a carui rad acina este marcata cu X.
Un arbore este complet daca frontiera lui este formata numai din noduri marcate
cu simboluri terminale.
Vom nota frontiera V
N
V
T
a unui X-arbore t
X
cu Fr(t
X
) = .
Fiind dat i doi arbori t
A
, t
B
, denim derivarea t
A
= t
B
astfel:
t
A
este un A-arbore, Fr(t
A
) = w;
Exista un B-arbore init ial t cu Fr(t) = uA v;
t
B
este un B arbore cu Fr(t
B
) = uwv obt inut din t prin nlocuirea nodului
marcat A cu t
A
.
Observat ie: t
A
poate arbore init ial sau derivat, iar t
B
este un arbore derivat.
Exemplul 6.2 Din arborii init iali
?

@
@R
?

@
@R

@
@R
?
?
?
D NP S NP
un D N NP
0
V P N
om V NP
1

oua
ia
(
un
) (
om
) (
ia
) (
oua
)
se obt ine arborele derivat

6
@
@R

H
H
Hj

@
@R
? ? ? ?
?
S
NP V P
D N V NP
un om
ia N
oua
6.2. LEXICALIZAREA CFG 67
Fie =

nchiderea reexiva si tranzitiva a relat iei =. Denim limbajul generat


de o TSG G
T
prin
L(G
T
) = {t|t este S arbore Fr(t) V

T
, t

I, t

t}
Spunem ca o cfg G este echivalent a cu o TSG G
T
daca:
Orice arbore de derivare din G este n L(G
T
);
t L(G
T
), L(G) cu Fr(t) = .
Exemplul 6.3 Gramatica denita prin arborii init iali

@
@R

@
@R
S S
a
A
S
b

@
@R
a
b
este echivalenta cu gramatica de product ii
S aA|ab, A Sb
care genereaza limbajul L(G) = {a
n
b
n
|n 1}.
Este usor de demonstrat ca mult imea limbajelor generate de gramaticile de substitu-
t ie pe arbori coincide cu L
2
(clasa limbajelor independente de context).
Sa revenim la problema lexicalizarii gramaticilor independente de context. Un
prim rezultat este:
Lema 6.3 Gramaticile independente de context nit ambigui nu pot lexicalizate
cu gramatici de substitut ie pe arbori.
Demonstrat ie: Sa presupunem prin absurd ca acest lucru este posibil si sa con-
sideram gramatica de product ii:
S SS, S a.
Fie G gramatica lexicalizata echivalenta si sa lua un arbore init ial arbitrar t. Din
denit ie, exista un nod n pe frontiera lui t marcat cu a. Pentru ca substitut iile pot
efectuate numai pe frontiera arborilor init iali (conform derivarilor in G), distant a
dintre n si rad acina lui t este constant a pentru orice arbore init ial. Deci, n orice
arbore derivat din G exista o ramur a de lungime xata de la radacin a la un nod
notat a, ramura ce nu mai poate extinsa. Dar n cfg denita mai sus se pot
construi arbori de derivare n care orice drum la un nod terminal are o lungime
oricat de mare. Contradict ie. 2
68 PRELEGEREA 6. GRAMATICI PE ARBORI
6.3 Gramatici TAG
Rezultatul prezentat anterior conduce la ideea de a mari puterea generativa a gra-
maticilor pe arbori prin introducerea unei operat ii noi, care sa insereze arbori n
arbori. Aceasta operat ie, numit a adjunct ie a fost denita n [6] si [7] si a condus
la o noua clasa de sisteme generative, TAG-urile.
Denit ia 6.4 O gramatica TAG (Tree Adjoining Grammar) este un quintuplu
(V
N
, V
T
, I, A, S), unde:
1. V
T
este o mult ime nita nevida de simboluri terminale;
2. V
N
este o mult ime nita nevida de simboluri neterminale, V
T
V
T
= ;
3. S V
N
este simbolul de start;
4. I este o mult ime nita nevida de arbori nit i numit i arbori init iali si caracteri-
zat i prin:
nodurile interioare sunt etichetate cu simboluri neterminale;
nodurile de pe frontiera sunt etichetate cu terminale sau neterminale;
simbolurile neterminale de pe frontiera sunt marcate pentru substitut ie cu
;
5. A este o mult ime nita nevida de arbori nit i numit i arbori auxiliari si caracte-
rizat i prin:
nodurile interioare sunt etichetate cu simboluri neterminale;
nodurile de pe frontiera sunt etichetate cu simboluri terminale sau neter-
minale; neterminalele sunt marcate pentru substitut ie cu nafara de un
singur nod numit picior, care este marcat cu asterisc ();
eticheta piciorului coincide cu eticheta nodului radacina al arborelui.

In gramaticile TAG lexicalizate, ecare arbore din I A are cel put in un simbol
terminal (ancora) pe frontiera.
Arborii din I A sunt numit i arbori elementari. Un X-arbore elementar este un
arbore din I A care are neterminalul X ca etichet a a radacinii.
Un arbore construit prin compunerea a doi arbori este numit arbore derivat.
Cand un nod este marcat pentru substitut ie, numai arborii derivat i din arborii
init iali pot substituit i n pozit ia lui.
Sa denim acum operat ia de adjunct ie. Fie un arbore (init ial, auxiliar sau
derivat) care are un nod n etichetat cu X si nemarcat (pentru substitut ie); con-
sideram un X-arbore auxiliar. Arborele rezultat prin adjunct ia lui la n
nodul n se construieste astfel:
1. Subarborele t al lui dominat de n este sters din , pastrandu-se o copie a
sa;
6.3. GRAMATICI TAG 69
2. Arborele este atasat nodului n;
3. Copia lui t este atasat a piciorului lui (inserat n ).
Exemplul 6.4 Un exemplu simplu de folosire a operat iei de ajunct ie este:

@
@ R

@
@R

@
@R

@
@R ?

@
@R
? ?

@
@R
?
S V P S
NP
0
V P V V P
NA
NP
0
V P
V NP
1
era V V P
NA
ars era V NP
1

ars
() () ()
Din considerente lingvistice apare necesitatea de a construi si o precizare a arbo-
rilor auxiliari care pot adjunct i unui nod dat (ceva similar dependent ei de context
n gramaticile Chomski). Aceasta se realizeaza prin restrict iile unei adjunct ii ([7],[8])
Fie G = (V
N
, V
T
, I, A, S) un TAG. Pentru orice nod al unui arbore elementar se
pot deni trei tipuri de restrict ii ale adjunct iilor:
1. Adjunct ie selectiva (SA(T)) - arborii care pot adjunctat i nodului sunt
din mult imea T A; adjunct ia nu este obligatorie.
2. Adjunct ie nula (NA) - nodul respectiv nu este implicat n nici o operat ie de
adjunct ie; restrict ia este echivalent a cu SA().
3. Adjunct ie obligatorie (OA(T)) - nodul trebuie sa e modicat cu o adjun-
ct ie folosind un arbore din T A. Pentru OA(A) se foloseste prescurtarea
OA.

In Exemplul 6.4, nodul V P din arborele are restrict ia NA, ceea ce nseamn a
ca la el nu se poate face nici o adjunct ie.
Daca nu se fac alte specicat ii, vom folosi n continuare gramatici TAG cu
substitut ii, adjunct ii si restrict ii pe adjunct ii.
Pentru un TAG G = (V
N
, V
T
, I, A, S), mult imea arborilor T(G) este mult imea
tuturor S-arborilor derivat i t cu Fr(t) V

T
. Acesti arbori sunt obt inut i plecand de
la arborii init iali.
Se mai poate deni si limbajul generat de un G ca ind
L(G) = {Fr(t)|t T(G)}.
70 PRELEGEREA 6. GRAMATICI PE ARBORI
Similar gramaticilor independente de context, se poate deni si aici arborele de
derivare; interpretarea sa este ns a put in diferita: un arbore de derivare este un
obiect care specica n mod unic construct ia arborelui derivat. Rad acina sa este S
(deci este un S-arbore), nodurile sale sunt radacini pentru arbori auxiliari (pentru
adjunct ie) sau init iali (pentru substitut ie), ordinea interpretarii derivarii n arbore
este arbitrara.
Exemplul 6.5 Gramatica de product ii
S SS, S a
care nu putea lexicalizata cu un TSG, poate lexicalizata folosind adjunct ia, astfel:
?

@
@R
?
S S
a
S

S
a
De remarcat ca a este ancora ambilor arbori (cel init ial si cel auxiliar).
Teorema 6.1 Daca G = (V
N
, V
T
, S, P) este o cfg nit ambigua cu L(G), atunci
exista o TAG lexicalizata G
lex
= (V
N
, V
T
, I, A, S) care genereaza acelasi limbaj si
arbori ca si G. Mai mult, G
lex
poate denita sa nu aiba noduri de sunstitut ie.
Demonstrat ie: Fie G = (V
N
, V
T
, S, P) o cfg nit ambigua cu L(G). Spunem ca
A V
N
este un simbol recursiv daca si numai daca , (V
N
V
T
)

, A =

A.
O product ie A este recursiva daca A este recursiv. Se pot da diversi algoritmi
pentru determinarea mult imilor simbolurilor (regulilor) recursive si nerecursive ([2]).
Partit ionam mult imea P a product iilor lui G n doua: mult imea R a regulilor
recursive si mult imea NR a regulilor nerecursive. Evident RNR = V
N
, RNR = .
Fie L(NR) = {w|S =

w} unde n derivari s-au folosit numai product ii din


NR. Evident, L(NR) este nita si L(NR). Fie I mult imea arborilor de derivare
denit i de L(NR). I este o mult ime nita si, toti arborii din I au pe frontiera cel
put in un simbol terminal, deoarece L(NR). I va mult imea arborilor init iali
din gramatica lexicalizata G
lex
.
Sa formam acum o baza de cicluri minime. Se pot folosi algoritmi clasici de
grafuri pentru a gasi o mult ime nita de cicluri de baza astfel nc at:
ele nu au subcicluri;
orice ciclu este o combinat ie de astfel de cicluri.
Fie {c
1
, . . . , c
k
} o baza de cicluri minime. Aplicam urmatorul algoritm pentru
construct ia mult imii arborilor auxiliari.
6.3. GRAMATICI TAG 71
1. A :=
2. pentru tot i c
i
, 1 i k
pentru toate nodurile n
j
din c
i
cu eticheta B
j
e B
j
=


j
B
j

j
(conform cu c
i
);
daca B
j
este eticheta unui nod dintr-un arbore din I A atunci
pentru toate derivarile
j
=

w
j
V

T
,
j
=

z
j
V

T
care folosesc numai reguli nerecursive,
se adauga la A arborii auxiliari corspunzatori derivarii
B
j
=


j
B
j

j
=

w
j
B
j
z
j
, unde nodul B
j
de pe frontiera
este picior.
Construct ia de mai sus asigura ca tot i arborii auxiliari au cel put in un termen
lexical pe frontiera (
j

j
trebuie sa duca ntr-o secvent a terminala, altfel se ajunge
la derivarea B
j
=

B
j
, imposibila pentru o gramatica nit ambigu a).
G
lex
astfel construita este lexicalizata si genereaza acelasi set de arbori ca si G.
Teorema este demonstrata. 2
Evident, construct ia de mai sus nu conduce la o gramatica optima din punct de
vedere al num arului de elemente din I A; dar nu acest lucru s-a avut n vedere.
O alta concluzie a demonstrat iei anterioare este aceea ca adjunct ia este sucienta
pentru lexicalizarea gramaticilor independente de context. Totusi, luand adjunct ia
ca baza, substitut ia este utila pentru a scadea gradul de complexitate al gramaticilor.
Sa dam un exemplu pentru a ilustra aceasta armat ie:
Exemplul 6.6 Fie gramatica de product ii
S NP VP, VP V NP NP, V v, NP n
i
; i [1, k].
unde S, NP, VP, V V
N
, n, v V
T
.

In aceasta gramatica se pot genera k


3
arbori de derivare de tipul (a) (i, j, m
[1, k]):

H
H
Hj
?

?
@
@R
? ? ?

H
H
Hj

?
@
@R
?
?
S S NP
NP V P NP V P
n
i
n
i
V NP NP V NP NP
v
n
j
n
m
v
(a) (b)
Deoarece gramatica nu are product ii recursive, nu vor derivari de forma A =

A. Deci, orice TAG care lexicalizeaza aceasta gramatica nu va avea arbori


auxiliari (deoarece la un astfel de arbore radacina si piciorul au acelasi neterminal
ca eticheta). Rezulta ca daca se foloseste numai adjunct ia, toate derivarile (k
3
)
72 PRELEGEREA 6. GRAMATICI PE ARBORI
reprezinta arbori init iali n gramatica lexicalizata. Daca se foloseste si substitut ia,
sunt sucient i k + 1 arbori init iali (vezi (b)).
Deci, rata de compactare este O(n
2
).

In general, pentru gramatici de acest tip, folosirea substitut iei ca o a doua operat ie
scade numarul de arbori init iali de la O(k
3
) la O(k).
Se poate arata ca o proprietate remarcabila, faptul ca mult imea gramaticilor
TAG este nchisa la operat ia de lexicalizare.
Teorema 6.2 Daca G este un TAG nit ambiguu ( L(G)) cu substitut ia si
adjunct ia ca operat ii, atunci exista un TAG lexicalizat G
lex
care genereaza acelasi
limbaj si aceiasi arbori ca G.
Demonstrat ie: Demonstrat ia este similara celei de la teorema anterioar a; de aceea o
vom schit a doar. Separam din nou partea recursiva a gramaticii de cea nerecursiva.
Partea recursiva formeaza arborii auxiliari din G
lex
; deoarece G este nit ambigu a,
tot i arborii auxiliari vor avea cel put in un simbol terminal pe frontiera. Product iile
nerecursive vor genera arborii init iali. Cum L(G), si acestia vor avea cel put in
un simbol terminal pe frontier a. 2
Pentru aplicarea TAG-urilor n construct ii lingvistice se poate folosi (n cazul
limbii engleze) [9].
Bibliograe
[1] Allen, J. - Natural Language Understanding, The Benjamin/Cummings Publ.
Co. Inc, 1995
[2] Atanasiu, A - Bazele Informaticii; suport de curs pentru anul II seral; Tipograa
Universitatii, 1987;
[3] Atanasiu, A. - Modele matematice n scrierea compilatoarelor; Ed. Olimp, 1996.
[4] Craciun, Dragos- Analizor morfologic pentru limba romana, Lucrare de licent a,
1997
[5] Holan, T, Kubon, V, Platek, M - An implementation of Syntactic Analysis of
Czech, Proceedings of Fourth International Workshop on Parsing Technologies,
Prague and Karlovy Vary, sept. 20-24, 1995, pp. 126-135.
[6] Joshi, A.K., Levi, L.S., Takahashi, M. - Tree Adjunct Grammars, J. Comput.
Syst. Sci. 10(1), 1975.
[7] Joshi, A.K. - How much context-senzitivity is necessary for Characterizing
Structural description - Tree Adjoining Grammars; n Natural Language Pro-
cessing - Theoretical Computational and Psychological Perspectives, Cam-
bridge University Press, 1985.
[8] Joshi, A.K. - The relevance of Tree Adjoining Grammar to generation; n Nat-
ural Language Generation, Martinus Nijho Publishers, Dordrecht, 1987
[9] Schabes, Y. - Mathematical and Computational aspects of Lexicalized Gram-
mars; Eight European Summer School in Logic, Language and Information,
Praga, 12-23 August 1996
[10] Gramatica Limbii Romane, Editura Academiei, 1966
73
Prelegerea 7
Extensii ale cfg-urilor
Dupa cum se stie, majoritatea analizorilor sintactici se bazeaza pe gramatici in-
dependente de context; acestea sunt ns a prea restrictive si nu pot cuprinde toata
bogat ia unui limbaj natural. De aceea vom face o extensie a acestor gramatici
asociindu-le un set de caracteristici.
7.1 Sisteme de caracteristici si gramatici augmen-
tate

In limbajele naturale exista not iunea de acordntre cuvinte n cadrul unei propozit ii.
De exemplu, construct ia NP: un creioane nu este corecta, deoarece articolul ne-
hotar at un este la singular, iar substantivul creioane este la plural. Spunem ca acest
NP nu satisface acordul de numar al limbii romane. Exista multe alte acorduri,
cum ar acordul subiect-predicat, acordul de gen pentru pronume, si altele. Pen-
tru a controla aceste fenomene de limb a, vom extinde formalismul gramatical prin
adaugarea de constituient i numit i caracteristici.
De exemplu, putem deni caracteristica NUM

AR care poate lua doua valori: s


(pentru singular) respectiv p (pentru plural); pe baza ei, o regula poate :
NP ART N doar daca NUM

AR1 este n acord cu NUM

AR2
Semnicat ia ei este: o expresie substantivala corecta este formata dintr-un articol
urmat de un substantiv, cu condit ia ca cele doua cuvinte sa e n acord relativ la
numar.
Aceasta product ie este echivalent a cu doua reguli independente de context care
vor folosi terminale distincte pentru codicarea formei singular si respectiv plural
ale expresiilor substantivale:
NP.
SING
ART.
SING
N.
SING
NP.
PLURAL
ART.
PLURAL
N.
PLURAL
Utilizarea unei astfel de construct ii ar conduce nsa la dublarea num arului de
product ii din gramatica. Si n mod similar, orice caracteristica noua ar multiplica
num arul product iilor n mod articial. Din acest punct de vedere, este preferabila
73
74 PRELEGEREA 7. EXTENSII ALE CFG-URILOR
maniera de denire formala a caracteristicilor (si deci dimensiunea gramaticii va
ram ane neschimbat a).
Pentru a realiza aceasta, se denesc constituient i numit i structuri caracteristice;
ei sunt de fapt aplicat ii part ial denite de la caracteristici la valori de caracteristici,
care denesc proprietat i relevante ale constituient ilor.
De exemplu, o structura caracteristica a unui constituient ART1 care reprezint a
o anumita utilizare a unui cuvant poate scrisa astfel:
ART1 : (CAT ART
ROOT
NUM

AR s)
Aceasta spune ca ART1 este un constituient din categoria ART care are ca
rad acin a cuvantul si este la numarul singular.
De obicei se foloseste o alta scriere, care se apropie de modul de reprezentare al
product iilor unei gramatici independente de context. Astfel, denit ia de mai sus are
forma:
ART1:(ART ROOT NUM

AR s)
Structurile caracteristice pot folosite ele nsele ca valori, ducand la formarea
de constituient i mai complexi.

Intr-o astfel de construct ie, ordinea de aparit ie a
substructurilor este numerotat a. Astfel, pentru regula
NP ART N
reprezentarea de exemplu a expresiei substantivale NP: un pui, poate :
NP1 : (NP NUM

AR s
1 (ART ROOT un
NUM

AR s)
2 (N ROOT pui
NUM

AR s))
Acelasi constituient se poate reprezenta sub forma arborescenta astfel:
Figura 7.1:
NP
ART N

s
s s
un pui
-

H
H
Hj
?
?
?
?
NUM

AR
1 2
ROOT ROOT
NUM

AR NUM

AR
Pentru a surprinde aceste caracteristici, vom folosi o augmentare a product iilor
gramaticii, n care neterminalele sunt valori de caracteristici.
De exemplu, pentru regula folosita anterior, product ia augmentata este:
(NP NUM

AR ?n) (ART NUM

AR ?n)(N NUM

AR ?n)
7.1. SISTEME DE CARACTERISTICI SI GRAMATICI AUGMENTATE 75
Semnicat ia ei este: un constituient NP consta din doi subconstituient i, primul ind
un ART iar al doilea un N, n care caracteristica NUM

AR este identic a la tot i trei.


Conform acestei reguli, constituientul NP1 dat mai sus este corect. Pe de-alta parte,
constituientul
(NP 1 (ART NUM

AR s)
2 (N NUM

AR s))
nu este corect, deoarece NP nu are denita caracteristica NUM

AR; la fel,
(NP NUM

AR s
1 (ART NUM

AR s)
2 (N NUM

AR p))
nu este corect deoarece caracteristica NUM

AR nu are aceeasi valoare peste tot.


Prin aceasta denit ie se pot rezolva si problemele de ambiguitate dintr-un cons-
tituient. De exemplu, cuvantul pui (considerat substantiv) este ambiguu deoarece
are aceeasi forma pentru singular si pentru plural. Deci, doua din valorile sale
din lexicon vor diferi numai prin valoarea caracteristicii NUM

AR. Putem simplica


aceasta denind o singura intrare care foloseste o variabil a drept valoare a acestei
caracteristici; deci:
(N ROOT pui NUM

AR ?n)
Aceasta nseamn a ca orice valoare a caracteristicii NUM

AR este corecta pentru


cuvantul pui.

In multe cazuri ns a, termenul de orice valoare trebuie nlocuit cu
acela de domeniu de valori; sunt introduse astfel variabile restrictive - variabile
care pot lua valori numai dintr-o mult ime specicata. De exemplu,
?n{s, p}
este o variabil a care poate lua numai valorile s sau p. Adesea, n astfel de denit ii,
numele variabilei devine inutil si poate eliminat. Astfel, putem scrie
(N ROOT pui NUM

AR ?n{s,p})
dar si - mai simplu
(N ROOT pui NUM

AR {s,p})
O problema teoretica care se pune este aceea daca puterea generativa a gramati-
cilor astfel augmentate nu depaseste cumva L
2
. Este clar ca - n cazul n care
mult imile de valori pentru restrict iile caracteristicilor sunt nite, se pot crea cate-
gorii de constituient i pentru toate combinat iile de caracteristici, ceea ce conduce tot
la o gramatica independent a de context. Pentru mult imi arbitrare de valori, puterea
generativa o egaleaza pe cea a masinilor Turing. Totusi, din punct de vedere prac-
tic, chiar daca o mult ime de valori nu este restrans a explicit, ea nu parcurge decat
o mult ime nita, deci se pot folosi algoritmii standard de analiza construit i pentru
gramaticile independente de context.
76 PRELEGEREA 7. EXTENSII ALE CFG-URILOR
7.2 Cateva sisteme de caracteristici
7.2.1 Caracteristici de numar si persoana
Aceste doua restrict ii - numite si acord numar - persoana - sunt foarte des folosite
n gramatica limbii romane. Locul unde ele sunt nt alnite cel mai frecvent este la
mbinarea subiect - predicat.
Deoarece - asa cum se stie din practica - ele sunt dependente unul de altul n
conjugari, este convenabil sa se creeze o caracteristica comun a AGR - cu sase valori
posibile (persoanele I,II,III singular si plural) codicate respectiv prin 1s, 2s, 3s, 1p,
2p, 3p.
De exemplu, cuvantul este poate corect numai pentru persoana a III-a singular;
deci caracteristica sa AGR este 3s. Pentru cuvantul scriu, caracteristica AGR este
o valoare din mult imea {1s, 3p}.
7.2.2 Caracteristici ale verbelor
Exista o caracteristica importanta a limbii - VFORM - legata de forma verbelor n
conjugare. Utilitatea ei apare mai ales la analiza part ilor auxiliare de propozit ie si la
stabilirea de restrict ii de mp art ire pe subdomenii pentru prexe a verbelor. Limba
roman a prezint a destule complicat ii; de aceea, pentru a surprinde anumite nuant e,
vom lucra cu urmatoarele valori ale caracteristicii VFORM:
Tabelul 7.1:
inf : innitiv: a , a lucra, a sti, a culege, . . .
ind : indicativ: , lucra, sti, culege, . . .
pres : indicativ prezent (sau prezentul simplu): sunt, lucrez, stiu, culeg, . . .
imp : indicativ trecut - imperfect: eram, lucram, stiam, culegeam, . . .
sim : indicativ trecut - perfectul simplu: fusei, lucrai, stiui, culesei, . . .
conj : conjunctiv: sa u, sa lucrez, sa stiu, sa culeg, . . .
prt : participiu: fost, lucrat, stiut, cules, . . .
ger : gerunziu: ind, lucrand, stiind, culegand, . . .
Pentru a putea realiza interact iunea dintre predicate si complementele lor, se
foloseste o alta caracteristica, SUBCAT.

In Tabelul 7.2 sunt prezentate cateva valori
ale acestei caracteristici pentru complemente formate din combinat ii NP V P.
Sa luam din acest tabel de exemplu valoarea np vp:conj; ea va utilizata pentru
a indica un complement format dintr-un NP urmat de un VP a carui valoare carac-
teristica VFORM este conj. Aceasta regula poate scrisa sub forma unei product ii
astfel:
(VP) (V SUBCAT np vp : conj)
(NP)
(VP VFORM conj)
Explicitand n cuvinte, o expresie verbala V P consta dintr-un V cu valoarea
SUBCAT np vp:conj, urmat de un NP, urmat de un V P cu valoarea VFORM
conj.
7.2. C

ATEVA SISTEME DE CARACTERISTICI 77


Tabelul 7.2:
Valoare Exemplu verb Exemplu propozit ie
none a rade Maria a ras.
np a gasi Maria a gasit o cheie.
np np a da Paula i da Danei notit ele.
vp : conj a vrea Ion vrea sa zboare.
np vp : conj a spune Radu i spune Anei sa plece.
vp : ger a plange Petre plange raz and.
Multe verbe sunt nsot ite de alte tipuri de complemente (de loc, de timp, etc).
Pentru acestea exista expresii prepozit ionale (n particular prepozit ii) specice. Ast-
fel, verbul a da poate primi un complement format dintr-un NP urmat de o PP
care foloseste prepozit ia pentru, ca n:
Andrei da bani pentru masina.
Alte verbe (a pune, a se duce) necesita expresii prepozit ionale care exprima un
loc, si folosesc prepozit ii cum ar din, de la, n, . . ..
O caracteristica care sa cuprinda expresiile prepozit ionale este PFORM. O PP
cu o valoare PFORM trebuie sa nceapa cu . Se pot face diverse clasicari ale
valorilor acestei caracteristici. Printre cele mai semnicative valori sunt:
Valori din familia PENTRU (prepozit ii de tipul pentru, ca sa, contra,. . .;
Valori din familia LOC: sunt prepozit ii care desemneaza un complement de
loc.
Valori din familia MOT, sunt folosite pentru anumite aspecte ale miscarii.
MOT este asociata verbelor de tipul a merge si cont ine prepozit ii cum ar la,
din, de-a lungul, printre,. . ..
Tabelul 7.3:
Valoare Exemplu prepozit ie Exemplu propozit ie
PENTRU pentru, contra L-am luat pentru totdeauna.
LOC n, pe, prin Am pus-o pe masa.
MOT spre, de la A luat-o spre gara.
Ultimele doua tipuri de valori par a nu distincte la prima vedere (de exemplu
la apart ine ambelor valori); ncerc and cu alte prepozit ii din acelasi set, distinct ia se
face imediat. De exemplu,
Petre pune hartia la cos
este o construct ie corecta, dar
78 PRELEGEREA 7. EXTENSII ALE CFG-URILOR
Petre pune hartia printre cos,
este gresit a. Deci, n acest caz, prepozit ia la apart ine valorii PFORM LOC.

In Tabelul 7.3 sunt date cateva exemple de valori ale caracteristicii PFORM.
Aceasta caracteristica poate folosita pentru a sistematiza formele de comple-
ment ale verbelor. Astfel, valoarea SUBCAT a unui verb cum ar a pune este
np pp:loc, iar o regula scrisa similar product iilor gramaticale va avea forma:
(VP) (V SUBCAT np pp : loc)
(NP)
(PP PFORM LOC)

In cazul propozit iilor dependente unele de altele, not iunea de completiva apare
n mod natural si va trebui sa construim o subcategorie pentru ea; o vom numi
caracteristica COMP, cu valori posibile ca, pentru, ca, pentru ca,. . . De exemplu,
verbul a spune poate solicita o completiva prin ca; deci, o valoare SUBCAT pentru
a spune va s:ca.
In Tabelul 7.4 sunt listate cateva valori SUBCAT suplimentare si exemple pentru
cateva verbe.
Tabelul 7.4:
Valoare Exemplu verb Exemplu propozit ie
np pp : lui a da Ion a dat un pix lui Marin.
pp : loc a Adrian este la scoala.
np pp : loc a pune Eugen a pus cutia n colt .
pp : mot a se duce Laura s-a dus la magazin.
np pp : mot a lua Ana a luat copilul la piat a.
adjp a Paul este fericit.
np adjp a t ine Sot ia t ine cina calda.
s:ca a crede Radu crede ca lumea e mica.
s:pentru ca a se ruga Ana se roaga pentru ca este crestina.
7.2.3 Caracteristici binare
Anumite caracteristici au proprietatea ca orice constituient poseda sau nu caracter-
istica respectiva (deci o decizie binara). Putem formaliza aceasta ca o caracteristica
cu mult imea valorilor {, +}.
De exemplu, caracteristica INV indica daca o propozit ie S este enunt iativ a sau
interogativ a. Deci, S - structura pentru propozit ia
Ion rade.
are o INV valoare , n timp ce S - structura pentru propozit ia
Ion rade ?
are valoarea INV +.
Adesea aceasta valoare este folosita ca prex, si se scrie + INV sau INV.
7.3. ANALIZA MORFOLOGIC

A SI LEXICONUL 79
7.2.4 Valoarea eroare pentru caracteristici

In multe ocazii este util sa alocam pentru caracteristici si o valoare de eroare. Ori
de cate ori un constituient este construit sa aiba o caracteristica iar valoarea acelei
caracteristici lipseste (nu este specicata), caracteristica va lua valoarea de eroare
.
Aceasta valoare este inserata automat la prima construire a constituientului.
7.3 Analiza morfologica si lexiconul

Inainte de a ne pune problema construirii unei gramatici, va trebui denit lexiconul


pe care se bazeaza limbajul generat de gramatica. Acest lexicon va cont ine (dupa
cum am vazut n exemplele anterioare) informat ii despre toate cuvintele diferite
care pot folosite, inclusiv valorile tuturor caracteristicilor. Daca un cuvant este
ambiguu, el trebuie descris prin mai multe pozit ii n lexicon, cate una pentru ecare
variant a.
Deoarece cuvintele au tendint a de a se supune unor tipuri morfologice regulate,
multe forme ale lor nu vor trebui introduse explicit n lexicon. Conjugarile mul-
tor verbe de exemplu, folosesc aceeasi forma la persoana a treia singular si plural,
formeaza innitivul cu prexul a si gerunziul cu suxul -ind sau -nd. Aceste ele-
mente reduc mult num arul de intr ari n lexicon.
Tabelul 7.5:
Indicativ prezent:
1. (V ROOT ?r SUBCAT ?s VFORM prez AGR 3s)
(V ROOT ?r SUBCAT ?s VFORM ind IRREGPRES)(+S)
2. (V ROOT ?r SUBCAT ?s VFORM prez AGR (1s 2s 1p 2p 3p))
(V ROOT ?r SUBCAT ?s VFORM ind IRREGPRES)
Indicativ trecut:
3. (V ROOT ?r SUBCAT ?s VFORM past AGR (1s 2s 1p 2p 3p))
(V ROOT ?r SUBCAT ?s VFORM ind IRREGPAST)(+ED)
Participiu:
4. (V ROOT ?r SUBCAT ?s VFORM pastprt)
(V ROOT ?r SUBCAT ?s VFORM ind ED PASTPRT)(+ED)
5. (V ROOT ?r SUBCAT ?s VFORM pastprt)
(V ROOT ?r SUBCAT ?s VFORM ind EN PASTPRT)(+EN)
Gerunziu:
6. (V ROOT ?r SUBCAT ?s VFORM ing)
(VROOT ?r SUBCAT ?s VFORM ind)(+ING)
Pluralul substantivelor:
7. (N ROOT ?r AGR 3p)
(N ROOT ?r AGR 3s IRREGPL)(+S)
80 PRELEGEREA 7. EXTENSII ALE CFG-URILOR
Tabelul 7.6:
a (CAT ART ROOT A1 AGR 3s)
be (CAT V ROOT BE1 VFORM ind IRREGPRES + IRREGPAST+
SUBCAT { adjp np})
cry (CAT V ROOT CRY 1 VFORM ind SUBCAT none)
dog (CAT N ROOT DOG1 AGR 3s)
fish (CAT N ROOT FISH1 AGR {3s 3p})
happy (CAT ADJ SUBCAT vp : inf)
he (CAT PRO ROOT HE1 AGR 3s)
is (CAT V ROOT BE1 VFORM prez SUBCAT { adjp np} AGR 3s)
Jack (CAT Nume AGR 3s)
man (CAT N ROOT MAN1 AGR 3s)
men (CAT N ROOT MAN1 AGR 3p)
saw (CAT N ROOT SAW1 AGR 3s)
saw (CAT V ROOT SAW2 VFORM ind SUBCAT np)
saw (CAT V ROOT SEE2 VFORM past SUBCAT np)
see (CAT V ROOT SEE1 VFORM ind SUBCAT np
IRREGPAST + EN PASTPRT+)
seed (CAT N ROOT SEED1 AGR 3s)
the (CAT ART ROOT THE1 AGR {3s 3p})
to (CAT TO)
want (V ROOT WANT1 VFORM ind SUBCAT { np vp : inf np vp : ger})
was (CAT V ROOT BE1 VFORM past AGR {1s 3s} SUBCAT { adjp np})
were (CAT V ROOT BE1 VFORM past AGR {2s 1p 2p 3p}
SUBCAT { adjp np})
Datorita numarului mare de variante prezentate de gramatica si lexiconul lim-
bii romane, n aceasta parte vom folosi exemple preluate din limba engleza, unde
regularitat ile lexiconului sunt mult mai pronunt ate.
Exemplul 7.1

In limba engleza, majoritatea verbelor formeaza persoana a treia
singular la indicativ prezent, prin adaugarea suxului -s la radacina (wants, likes,
shows,. . .). Scrierea unei reguli generale care realizeaza acest lucru se poate face
astfel:
(V ROOT ?r SUBCAT ?s VFORM prez AGR 3s)
(V ROOT ?r SUBCAT ?s VFORM ind)(+S)
unde +S este o noua categorie lexicala formata numai din suxul s.
Daca ne referim la verbul to want, aceasta regula, completata cu linia din
lexicon
want : (V ROOT want
SUBCAT { np vp : inf np vp : ger}
VFORM ind)
va produce urmatorul constituient pentru secvent a de intrare it want-s:
7.3. ANALIZA MORFOLOGIC

A SI LEXICONUL 81
want : (V ROOT want
SUBCAT { np vp : inf np vp : ger}
VFORM pres)
AGR 3s)
Exemplul 7.2 O alta regula va genera constituient ii pentru indicativ trecut per-
soanele I si II care, pentru limba engleza, au aproape totdeauna aceeasi forma cu
participiul.
(V ROOT ?r SUBCAT ?s VFORM prez AGR (1s 2s 1p 2p 3p))
(V ROOT ?r SUBCAT ?s VFORM ind)
Aceasta regula funct ioneaza numai pentru verbele regulate. Aplicata fara dis-
cernamant, ea poate conduce la forme gresite. De exemplu, verbul to be nu poate
folosi aceasta regula; propozit ia
We be at the store.
este gresita. Nu mai vorbim de limba romana, unde numarul verbelor neregulate
este semnicativ mai mare.
Pentru aceste situat ii - cum este cea din Exemplul 7.2 - se introduce o ca-
racteristica suplimentara care va identica verbele neregulate. Anume, vom avea
o caracteristica binara IRREG-PRES pentru verbele care au forme neregulate la
indicativ prezent.

In acest fel, regula de mai sus se scrie corect:
(V ROOT ?r SUBCAT ?s VFORM prez AGR (1s 2s 1p 2p 3p))
(V ROOT ?r SUBCAT ?s VFORM ind IRREGPRES)
Folosind valoarea de eroare pentru caracteristici, aceasta caracteristica va spe-
cicata numai n cazul verbelor neregulate. Similar se procedeaza n cazul realiza-
rii timpului trecut sub forma neregulata (pentru limba roman a - perfectul sim-
plu): caracteristica binara va IRREG-PAST; sau a participiului: EN-PASTPRT
pentru verbele care au terminat ia la participiu - en n loc de - ed (similar limbii
romane pentru unele verbe: a - fost, a scoate - scos). Toate aceste caracteristici
restrict ioneaz a aplicarea regulilor lexicale standard si toate formele neregulate sunt
adaugate explicit n lexicon.
In Tabelul 7.5 este denita o gramatica pentru cateva astfel de reguli, aplicate n
declinarea substantivelor si conjugarea verbelor din limba engleza (am folosit ns a
termenii din gramatica limbii romane - participiu, gerunziu).
Fiind dat un set mare de astfel de caracteristici, sarcina de a scrie elementele unui
lexicon devine foarte dicila. De aceea este necesara utilizarea de diverse mecanisme
care sa ajute la simplicarea denit iilor.
O prima tehnica - valoarea de eroare pentru caracteristici (care poate eventual
omisa) - a fost deja ment ionata.
O alta tehnica consta n denirea de pachete de caracteristici, notate cu cate un
simbol.

In Tabelul 7.6 este construit un mic lexicon. El cont ine trei intr ari pentru
cuvantul saw: ca substantiv (erastrau), verb regulat (a taia) si trecutul - forma
neregulata a verbului to see (a vedea).
82 PRELEGEREA 7. EXTENSII ALE CFG-URILOR
Cu acest lexicon si gramatica din Tabelul 7.5 se pot genera si alte cuvinte, cum
ar : been, being, cries, cried, dogs, saws (doua interpretari), sawed, sawing, seen,
seeing, seeds, wants, wanting, wanted.
Adesea un cuvant are mai multe interpret ari care folosesc diverse linii din lexicon
si diferite reguli lexicale ale gramaticii. Cuvantul saws de exemplu, transformat n
secvent a saw+s, poate pluralul unui substantiv (via product ia 7 si prima denit ie
pentru saw), sau indicativ prezent, persoana a treia singular a verbului saw (via
product ia 1 si a doua denit ie pentru saw). De remarcat ca product ia 1 nu se poate
aplica celei de-a treia denit ii, deoarece la aceasta VFORM nu este ind.
Prelegerea 8
Utilizarea caracteristicilor n
analiza
8.1 Generarea gramaticilor cu caracteristici
Vom construi aici o gramatica simpla bazata pe sistemele de caracteristici si lexiconul
(de limba engleza) dezvoltat n cursul trecut. Ea va accepta propozit ii cum ar :
The man cries. The men cry.
The man saw the dogs. He wants the dog.
He wants to be happy. He wants the man to see the dog.
He is happy to be a dog.
si va respinge propozit ii de forma:
() The men cries. () The man cry.
() The man saw to be happy. () He wants.
() He wants the man saw the dog.

Inainte de a dezvolta aceasta gramatica, vom face cateva convent ii suplimentare.


Deoarece este foarte dicil sa scriem regulile gramaticale nsot ite de toate ca-
racteristicile necesare, vom cauta sa exploatam anumite regularitat i n folosirea lor.
Astfel, multe valori de caracteristici sunt specice unei singuri caracteristici (de
exemplu, valoarea inf poate apare numai n caracteristica VFORM, iar np vp:inf
apart ine numai caracteristicii SUBCAT). De aceea, nu va nici o ambiguitate daca
eliminam numele caracteristicii n situat iile cand nu exista ambiguitat i.
Aceste valori unice vor listate folosind paranteze patrate. Deci, de exemplu
(VP SUBCAT inf)
va abreviata n
V P[inf].
De asemenea, pentru caracteristicile binare putem introduce o simplicare de nota-
t ie: daca B este o caracteristica binara, atunci constituientul (C B +) va notat
C[+B].
83
84 PRELEGEREA 8. UTILIZAREA CARACTERISTICILOR

IN ANALIZ

A
Anumite caracteristici trebuie sa verice restrict ia ca valoarea denita la nceput
sa coincida cu valoarea unui subconstituient; ele sunt numite caracteristici direc-
toare. De exemplu, n toate regulile VP, valorile caracteristicilor VFORM si AGR
au aceasta proprietate, ca n regula:
(VP VFORM ?v AGR ?a)
(V VFORM ?v AGR ?a SUBCAT np vp : inf)
(NP)
(VP VFORM inf)
Daca am putea scrie caracteristicile directoare separat de reguli, la cerere, sis-
temul le poate adauga automat. Astfel, daca VFORM si AGR sunt declarate ca-
racteristici directoare, regula de sus poate abreviata n:
VP (V SUBCAT np vp : inf) NP (VP VFORM inf)
Constituientul director al unei reguli a fost indicat prin o scriere ngrosata.
Combinand toate aceste prescurtari convenite, regula anterioar a va scrisa:
VP V [ np vp : inf] NP VP[inf]
In Tabelul 8.1 este denita o gramatica simpla. Exceptand product iile 1 si 2 care
trebuie sa asigure acordul de numar, toate celelalte restrict ii de caracteristici pot
folosi abrevierile denite anterior.
Tabelul 8.1:
1. S[inv] (NP AGR ?a) (VP [{prez past}] AGR ?a)
2. NP (ART AGR ?a) (N AGR ?a)
3. NP PRO
4. VP V [ none]
5. VP V [ np] NP
6. VP V [ vp : inf] VP[inf]
7. VP V [ np vp : inf] NP VP[inf]
8. VP V [ adjp] ADJP
9. VP[inf] TO VP[ind]
10. ADJP ADJ
11. ADJP ADJ[ vp : inf] VP[inf]
Caracteristici directoare pentru S,VP: VFORM,AGR
Caracteristici directoare pentru NP: AGR
Aceasta gramatica este o scriere prescurtata a gramaticii urmatoare:
8.1. GENERAREA GRAMATICILOR CU CARACTERISTICI 85
1. (S INV VFORM ?v{pres past} AGR ?a)
(NP AGR ?a) (VP VFORM ?v{pres past} AGR ?a)
2. (NP AGR ?a) (ART AGR ?a) (N AGR ?a)
3. (NP AGR ?a) (PRO AGR ?a)
4. (VP AGR ?a VFORM ?v) (V SUBCAT none AGR ?a VFORM ?v)
5. (VP AGR ?a VFORM ?v) (V SUBCAT np AGR ?a VFORM ?v) NP
6. (VP AGR ?a VFORM ?v)
(V SUBCAT vp : inf AGR ?a) (VP VFORM inf)
7. (VP AGR ?a VFORM ?v)
(V SUBCAT np vp : inf AGR ?a VFORM ?v) NP (VP VFORM inf)
8. (VP AGR ?a VFORM ?v)
(V SUBCAT adjp AGR ?a VFORM ?v) ADJP
9. (VP SUBCAT inf AGR ?a VFORM inf)
(TO AGR ?a VFORM inf ) (VP VFORM ind)
10. ADJP ADJ
11. ADJP ADJ (SUBCAT vp : inf) (VP VFORM inf)
Forma prescurtata este de asemenea foarte utila n reprezentarea arborilor de
analiza. De exemplu, n Figura 8.1 sunt reprezentat i arborii de analiza pentru doua
propozit ii date anterior ca exemplu; se arata astfel ca ele sunt construct ii corecte
din punct de vedere al gramaticii denite n Tabelul 8.1.
Figura 8.1:
S[3s]
NP[3s] V P[pres, 3s]
ART[3s] N[3s] V [pres, 3s, none]
the
man
cries



S[3s]
NP[3s] V P[pres, 3s]
PRO[3s] V [pres, 3s, vp : inf] V P[inf]
TO
V P[ind]
V [ind, adjp]
ADJP
He wants
to
be
happy
>
>
> >.
-
-
-
-
-
-
>
>
>.
.
.
.
.
.
.,
-
-
-
-
-
-

.
.
.
.
.
.,
-
-
-
-
-
--

.
.
.
.
.
.,


Sa vedem motivele pentru care propozit iile date ca exemple negative la nceputul
prelegerii, nu sunt acceptate de aceasta gramatica.
The men cries nu verica acordul de numar al regulii 1. Constituientul NP
pentru the men are valoarea AGR 3p n timp ce VP cries are valoarea AGR 3s; deci
86 PRELEGEREA 8. UTILIZAREA CARACTERISTICILOR

IN ANALIZ

A
regula 1 nu se poate aplica.
La fel, The man cry nu este acceptat deoarece the man are valoarea AGR 3s iar
VP cry are ca valoare AGR o variabila cu valori n domeniul {1s 2s 1p 2p 3p}.
Propozit ia The man saw to be happy nu este acceptata deoarece verbul saw are
valoarea SUBCAT np; deci numai regula 5 poate folosita pentru a construi un
VP. Dar regula 5 cere un complement NP, imposibil pentru secvent a to be happy.
Propozit ia He wants nu este acceptata deoarece verbul wants are valoarea SUB-
CAT din domeniul { np vp:inf np vp:inf}, deci pot folosite numai regulile 5, 6
sau 7 pentru a construi un V P. Toate aceste reguli cer ns a un complement nevid
de un tip oarecare.
Propozit ia He wants the man saw the dog nu este acceptata din motive similare:
din nou, wants face posibila aplicarea regulilor 5, 6 sau 7.5 si 6 nu se pot aplica, iar
7 cere un NP si un VP[inf ]. Construct ia the man da NP-ul cerut, dar saw the dog
nu este un VP[inf ]; n particular saw the man este un VP corect, dar restrict ia sa
VFORM va past, nu inf.
8.2 Analiza sintactica folosind caracteristici
Algoritmii de analiza dezvoltat i anterior pentru gramatici independente de con-
text pot extinsi la aceste clase noi de gramatici, prin generalizarea regulilor la
constituient i.
Reamintim, algoritmul bottom-up dadea posibilitatea extensiei arcelor active cu
constituient i noi. Astfel, un constituient X putea extinde un arc de forma C
C
1
. . . C
i
X . . . C
n
, producand un arc nou de forma C C
1
. . . C
i
X . . . C
n
.
O operat ie similara poate facut a n cazul gramaticilor cu caracteristici; aici
nsa analizorul trebuie ca - nainte de a face extensia cu X - sa instant ieze variabilele
din arcul originar.
Exemplul 8.1 Sa consideram regula:
1. (NP AGR ?a) (ART AGR ?a) (N AGR ?a)
Ea spune ca se poate deni un NP dintr-un ART si un N, daca toate cele trei
componente sunt n rezonant a pe caracteristica AGR. Nu exista nici o restrict ie
pentru alte caracteristici pe care le pot avea n plus NP,ART si N. Deci, daca con-
sideram constituient ii pentru aceasta regula, doar caracteristica AGR este cea care
conteaza; celelalte pot ignorate.
Fie de exemplu construct ia un pahar. Pentru nceput, va trebui sa consideram
extensia arcului 1 cu constituientul
2. (ART ROOT UN AGR 3s)
Pentru a face arcul 1 aplicabil, variabila ?a trebuie instant iata cu 3s, ceea ce
duce la:
3. (NP AGR 3s) (ART AGR 3s) (N AGR 3s)
Deoarece caracteristica din regula este si n constituientul 2, arcul poate extins:
4. (NP AGR 3s) (ART AGR 3s) (N AGR 3s)
Sa ncercam acum extensia acestui arc cu constituientul corespunzator cuvantului
pahar:
5. (N ROOT PAHAR1 AGR 3s)
8.2. ANALIZA SINTACTIC

A FOLOSIND CARACTERISTICI 87
Extensia este posibila pentru ca valoarea caracteristicii AGR este aceeasi. Deci:
6. (NP AGR 3s) (ART AGR 3s) (N AGR 3s)
Aceasta nseamna ca n nal analizorul a gasit un constituient de forma
(NP AGR 3s).
Algoritmul este urmatorul:
Fiind dat un arc A n care constituientul de dupa este NEXT, si un nou
constituient X utilizat pentru extensia arcului:
1. Se cauta o instant iere a variabilelor astfel nc at toate caracteristicile spe-
cicate n NEXT se aa n X;
2. Se creaza un nou arc A care este o copie a lui A, cu valorile variabilelor
determinate la pasul anterior;
3. Se actualizeaza A conform algoritmului de analiza sintactica similar.
Exemplul 8.2 Revenind la exemplul anterior, e A arcul 1 si X constituientul ART
dat de 2. Atunci NEXT va (ART AGR ?a).

In pasul (1) NEXT se identica cu X si deci ?a va nlocuit cu 3s.


La pasul (2) se face o copie a lui A, care este arcul 3.

In pasul (3) acest arc este actualizat conducand la arcul 4.


Cand sunt folosite mult imi de valori pentru variabile, cum ar ?a{3s 3p}, pro-
cesul de identicare decurge similar, cu observat ia ca valoarea data variabilei va
aleasa dintre cele listate.
Daca atat regula cat si constituientul cont in variabile, rezultatul este o variabil a
av and ca domeniu de valori intersect ia mult imilor de valori asociate regulii, respectiv
constituientului.
Exemplul 8.3 Sa consideram extensia arcului 1 cu constituientul
(ART ROOT un AGR ?v{3s 3p})
(corespunzator cuvantului un). Pentru aplicare, variabila ?a va trebui instant iata
cu ?v{3s 3p}, conducand la regula:
(NP AGR ?v{3s 3p}) (ART AGR ?v{3s 3p}) (N AGR ?v{3s 3p})
Acest arc poate extins cu (N ROOT pahar AGR 3s) deoarece ?v{3s 3p} poate primi
valoarea 3s; rezultatul obt inut este identic cu arcul 6.
De asemenea, aici caracteristicile subconstituient ilor sunt inserate automat de ana-
lizor la ecare extensie a arcului. Valorile folosite pentru subconstituient i sunt deja
cont inute n harta.
88 PRELEGEREA 8. UTILIZAREA CARACTERISTICILOR

IN ANALIZ

A
Exemplul 8.4 Sa presupunem ca harta cont ine deja doi constituient i ART1 si
N1 pentru cuvintele un respectiv pahar; constituientul adaugat n harta pentru
secvent a un pahar este:
(NP AGR 3s
1 ART1
2 N1)
unde
ART1 = (ART ROOT un AGR {3s 3p}), N1 = (N ROOT pahar AGR {3s}).
Caracteristica AGR a lui ART1 nu a fost schimbata; deci ea poate folosita si
de alte interpretari pentru care este posibila valoarea 3p. Orice algoritm de analiza
bottom-up construit anterior poate folosit lucrand cu o gramatica augmentata n
acest mod.
Figura 8.2:
S1 CAT S
AGR 3s
VFORM prez
INV
1 NP1
2 VP3
VP3 CAT VP
VFORM prez
AGR 3s
1 V 1
2 VP2
VP2 CAT VP
VFORM
inf
1 TO1
2 VP1
NP1 CAT NP VP1 CAT V P
AGR 3s VFORM ind
1 PRO1 1 V 2
PRO CAT PRO V 1 CAT V TO1 CAT TO V 2 CAT V
AGR 3s ROOT want ROOT cry
VFORM prez VFORM ind
AGR 3s SUBCAT
SUBCAT none
{ np, vp : inf,
np vp : inf}
He wants to cry
Exemplul 8.5 Figura 8.2 cont ine o harta nala obt inuta din analiza propozit iei
He wants to cry.
8.3. RET ELE DE TRANZIT IE AUGMENTATE 89
folosind gramatica din Tabelul 8.1 (pentru care s-a construit si derivarea din Figura
8.1).

In aceasta construct ie, constituientul NP1 a fost generat cu regula 3


3 (NP AGR ?a) (PRO AGR ?a)
Pentru a se identica cu constituientul PRO1, variabila ?a trebuie instant iata cu
3s; aceasta conduce la constituientul
NP1 : (CAT NP
AGR 3s
1 PRO1)
Constituientul VP1 se obt ine folosind regula 4, anume:
4 (VP AGR ?a VFORM ?v) (V SUBCAT none AGR ?a VFORM ?v)
Pentru a corespunde cu V 2, n membrul drept variabila ?v trebuie instant iata
cu ind; caracteristica AGR a lui V 2 nu este denita, asa ca se pune . Noul
constituient este
VP1 : (CAT VP
AGR
VFORM ind
1 V2)
8.3 Ret ele de tranzit ie augmentate
Caracteristicile pot adaugate si ret elelor de tranzit ie recursive, conducand la ret ele
de tranzit ie augmentate (ATN); n acest caz, caracteristicile poarta numele de
registri. Structurile de constituient i sunt create permit and ecarei ret ele sa aiba
un set de registri. De ecare data cand este activata o ret ea, se creaza un set nou de
registri. Odata cu traversarea ret elei, acesti registri capata valori prin act iuni aso-
ciate ecarui arc. La par asirea ret elei, registrii sunt aranjat i astfel nc at sa formeze
un constituient av and trecut drept CAT numele ret elei.
Exemplul 8.6 Sa luam ret eaua NP simpla din Figura 8.3:
Figura 8.3:



`
NP NP1 NP2
art subst
pop
nume
1 2
3
Arc Test Act iuni
1 none DET :=
AGR := AGR

2 AGR AGR

HEAD :=
AGR := AGR AGR

3 none NUME :=
AGR := AGR

90 PRELEGEREA 8. UTILIZAREA CARACTERISTICILOR



IN ANALIZ

A
Orice ATN foloseste un mecanism special pentru a extrage rezultatul n urma
traversarii unui arc. Cand se parcurge un arc - de exemplu arcul 1 - n prima
faza constituientul denit n cuvantul de intrare este salvat ntr-o variabila speciala
numita . Act iunea DET := asigneaza apoi acest constituient registrului DET. A
doua act iune a arcului, AGR := AGR

asigneaza registrului AGR al ret elei valoarea


registrului AGR din constituientul aat n .
Vericarea corespondent elor corecte este realizata prin teste.
Denit ia 8.1 Un test este un predicat asociat unei expresii, care ia valoarea ade-
var daca rezultatul evaluarii expresiei este o valoare nevida, si fals daca rezultatul
este mult imea vida sau nil.
Daca un test este incorect, arcul respectiv nu este traversat. Testul pentru arcul
2 din exemplu arata ca arcul respectiv poate traversat numai daca caracteristica
AGR a ret elei are intersect ia nenul a cu registrul AGR al noului cuvant (constitu-
ientul subst din ).

In cazul arcelor push, caracteristicile sunt tratate similar.


Exemplul 8.7 Constituientul construit prin traversarea ret elei NP este returnat ca
valoare ; Deci, n gramatica din Figura 8.4
Figura 8.4:


S S1 S2 S3
NP V NP
pop
4 5 6
Arc Test Act iuni
4 none SUBJ :=
5 AGR
SUBJ
AGR

MAIN V :=
AGR := AGR
SUBJ
AGR

6 none OBJ :=
AGR := AGR

act iunea arcului 4, SUBJ := va asigna registrului SUBJ constituientul ntors de


ret eaua NP. Testul arcului 5 este corect numai daca registrul AGR al constituientului
din registrul SUBJ are intersect ie nevida cu registrul AGR al noului constituient
(verb). Acest test asigura concordant a subiect-predicat.
Pe baza lexiconului din prelegerea anterioara, acest ATN accepta propozit iile:
The dog cried.
The dogs saw Jack.
Jack saw the dogs.
Exemplul 8.8 Sa detaliem una din aceste propozit ii, de exemplu The dog saw
Jack. Analiza ei pe baza celor doua ret ele denite mai sus este:
Intrare:
1
The
2
dog
3
saw
4
Jack 5
8.4. GRAMATICI DE UNIFICARE 91
A. Ret eaua S:
Pas Nod Pozit ie Arc traversat Set de registri
1 S 1 arc 4 corect SUBJ (NP DET the
(pentru apel recursiv HEAD dog
vezi analiza de jos) AGR 3s)
5 S1 3 arc 5 MAIN V saw
(verica 3s 3s) AGR 3s
6 S2 4 arc 6 OBJ (NP NUME Jack
(pentru apel recursiv AGR 3s)
vezi analiza de jos)
9 S3 5 arc

pop

corect scoate:
((S SUBJ (NP DET the
HEAD dog
AGR 3s)
MAIN V saw
AGR 3s
OBJ (NP NUME Jack
AGR 3s))
B. Primul apel al ret elei NP: (arc 4)
Pas Nod Pozit ie Arc traversat Set de registri
2 NP 1 1 DET the
AGR {3s 3p}
3 NP1 2 2(verica HEAD dog
{3s 3p} 3s)
4 NP2 pop ntoarce:
(NP DET the
HEAD dog
AGR 3s)
C. Al doilea apel al ret elei NP: (arc 6)
Pas Nod Pozit ie Arc traversat Set de registri
7 NP 4 3 NUME Jack
AGR 3s
8 NP2 pop ntoarce:
(NP NUME Jack
AGR 3s)
8.4 Gramatici de unicare
Dupa cum s-a vazut, caracteristicile sunt deosebit de utile n generalizarea not iunilor
de gramatica independent a de context si ret ea de tranzit ie. Rolul lor poate extins
astfel nc at sa elimine complet folosirea gramaticilor.

In acest fel, o gramatica poate
92 PRELEGEREA 8. UTILIZAREA CARACTERISTICILOR

IN ANALIZ

A
utilizata doar ca un set de restrict ii ntre diverse structuri de caracteristici. Astfel
de sisteme sunt cunoscute sub numele de gramatici de unicare.
Conceptul de baza ntr-o gramatica de unicare este acela de extensie ntre doua
structuri de caracteristici.
Denit ia 8.2 O structura de caracteristici F
1
extinde (sau este mai precisa de-
cat) F
2
daca orice valoare de caracteristica din F
1
este specicata n F
2
.
Exemplul 8.9 Structura (CAT V ROOT doarme) extinde structura (CAT V ). Pe
de-alta parte nici una din structurile
(CAT V ROOT doarme) si (CAT V VFORM prez)
nu este extensia celeilalte.
Denit ia 8.3 Doua structuri unica daca exista o structura de caracteristici care
este o extensie a ambelor.
Structura de caracteristici minimala cu aceasta proprietate se numeste cel mai
general unicator.
Exemplul 8.10 Cel mai general unicator al celor doua structuri din exemplul
anterior este
(CAT V ROOT doarme VFORM prez)

In schimb, structurile (CAT V AGR 3s) si (CAT V AGR 3p) nu se pot unica.
Acest neajuns se elimina daca putem aloca si seturi de valori de caracteris-
tici (de exemplu {3s 3p}). Atunci putem spune ca, de exemplu (AGR 3s) extinde
(AGR {3s 3p}).
Folosind aceste idei, se poate deni o gramatica numai n termeni de unicare. O
regula cum ar
S NP VP
(uzuala n gramaticile pentru limbaje naturale) poate exprimata ntr-o gramatica
de unicare astfel:
X
0
X
1
X
2
CAT
0
= S
CAT
1
= NP
CAT
2
= VP
AGR
0
= AGR
1
= AGR
2
VFORM
0
= VFORM
2
Aceasta spune ca un constituient X
0
poate construit dintr-o scevent a de doi
constituinet i X
1
si X
2
, daca CAT pentru X
0
este S, pentru X
1
este NP, iar pentru
X
2
este VP; n plus, trebuie ca valorile AGR ale celor trei constituient i sa e identice,
la fel ca si valorile VFORM pentru X
0
si X
2
.
Daca valoarea CAT este specicata totdeauna, regula poate scrisa mai concis
(folosind valorile CAT n scrierea product iei, iar indicele 0 este omis):
S NP VP AGR = AGR
1
= AGR
2
VFORM = VFORM
2

In acest fel este posibila rescrierea oricarei gramatici augmentate.


8.4. GRAMATICI DE UNIFICARE 93
Exemplul 8.11 Sa exemplicam armat ia de mai sus cu cateva reguli din grama-
tica denita n Tabelul 8.1:
1

. S NP VP AGR = AGR
1
= AGR
2
VFORM = VFORM
2
2

. NP ART N AGR = AGR


1
= AGR
2
8

. VP V ADJP SUBCAT
1
= adjp
VFORM = VFORM
1
AGR = AGR
1
10

. ADJP ADJ
Reprezentarea structurilor de caracteristici sub forma de DAG
Formalismul de unicare poate denit mai precis reprezentand structurile de
caracteristici sub forma de grafuri orientate aciclice - pe scurt dag (Directed Acyclic
Graphs). Fiecare constituient si valoare formeaza un nod, iar caracteristicile sunt
reprezentate prin arce marcate.
Atent ie ! A nu se face confuzie ntre dag si tag - Tree Adjoining Grammars,
introdusi anterior pentru modelari lexicale si sintactice.
Exemplul 8.12 Pentru constituient ii
N1 : (CAT N N2 : (CAT N
ROOT peste AGR 3s)
AGR {3s 3p})
se pot construi dag-urile:
N1 N2
N
peste {3s 3p}
N
{3s}

-
`
`
`
`
`
``

-
`
`
`
`
`
`
CAT
ROOT
AGR CAT AGR
Trecerea de la un mod de realizare la altul este evident a.
Unicarea a doua structuri de caracteristici este denita sub forma unui algoritm
de unicare a doua grafuri. Anume:
Algoritmul 8.1
Intrare: Doua dag-uri avand ca radacini nodurile N
i
respectiv N
j
.
Iesire: Un dag corespunzator unicarii celor doua dag-uri de la intrare.
Algoritm:
1. Daca N
i
coincide cu N
j
, atunci ntoarce N
i
; Stop.
2. Daca N
i
si N
j
sunt noduri terminale, se compara marcajele lor; daca intersec-
t ia acestora este nevida, se construieste un nou nod care are ca marcaj aceasta
intersect ie. Altfel, dag-urile nu se pot unica.
94 PRELEGEREA 8. UTILIZAREA CARACTERISTICILOR

IN ANALIZ

A
3. Daca N
i
si N
j
nu sunt noduri terminale, atunci se creaza un nod nou N.
Pentru ecare arc marcat cu F de la nodul N
i
la nodul NF
i
:
(a) Daca exista un arc marcat cu F de la nodul N
j
la NF
j
, atunci se unica
recursiv nodurile NF
i
cu NF
j
. Se construieste un arc marcat cu F de la
N la rezultatul acestei construct ii recursive.
(b) Daca din N
j
nu exista nici un arc marcat cu F, se construieste un arc
marcat cu F de la N la NF
i
.
(c) Pentru ecare arc marcat cu F de la N
j
la NF
j
ce nu are arc similar
care pleaca din N
i
, se creaza un arc nou marcat cu F de la N la NF
j
.
Exemplul 8.13 Aplicand acest algoritm nodurilor N1 si N2 date anterior, se ob-
t ine constituientul
N3 : (CAT N ROOT peste AGR 3s)
Se poate construi acum un algoritm de generare a constituient ilor folosind ecua-
t iile de unicare bazate pe dag-uri.
Algoritmul 8.2
Intrare:
Product ia X
0
X
1
. . . X
n
;
SC
1
, SC
2
, . . . , SC
n
- subconstituient ii corespunzatori lui X
1
, X
2
, . . . , X
n
;
Un set de ecuat ii caracteristice de forma F
i
= V , unde F
i
este caracteristica
F a subconstituientului i.
Iesire: Un dag care satisface toate ecuat iile caracteristice.
Algoritm:
1. Se genereaza un nod CC
0
ca radacina a noii structuri;
2. Pentru ecare i, 1 i n:
Se face o copie a dag-ului de radacina SC
i
si se noteaza cu CC
i
radacina
acestei copii;
Se traseaza un arc marcat cu i de la CC
0
la CC
i
.
3. Pentru ecare ecuat ie caracteristica de forma F
i
= V unde V este o valoare,
se urmareste legatura F de la nodul CC
i
la un nod N
i
si se unica N
i
cu V .
4. Pentru ecare ecuat ie caracteristica (de forma F
i
= G
j
):
(a) Daca exista o legatura F din CC
i
si o legatura G
j
din CC
j
, atunci:
i. se urmareste F pana la un nod N
i
si G pana la un nod N
j
;
ii. se unica N
i
cu N
j
folosind algoritmul anterior si se creaza astfel un
nod nou X;
iii. toate arcele care intrau n N
i
sau N
j
sunt aduse n X.
8.4. GRAMATICI DE UNIFICARE 95
(b) Daca nu exista nici o legatura F din CC
i
dar exista o legatura G de la
CC
j
la un nod N
j
, se creaza o legatura F de la CC
i
la N
j
;
(c) Daca nu exista nici o legatura G din CC
j
dar exista o legatura F de la
CC
i
la un nod N
i
, se creaza o legatura G de la CC
j
la N
i
.
Exemplul 8.14 Sa presupunem ca sunt denit i constituient ii
ART
1
: (CAT ART N1 : (CAT N
ROOT the ROOT sh
AGR {3s 3p}) AGR {3s 3p})
sau, n notat ie de dag-uri:
ART1
the
{3s 3p}
ART

ROOT
AGR
CAT
N1
fish {3s 3p}
N

ROOT
AGR
CAT
Un NP pentru expresia the sh poate acum construit folosind regula 2

.
Ecuat iile caracteristice sunt:
CAT
0
= NP
CAT
1
= ART
CAT
2
= N
AGR
0
= AGR
1
= AGR
2
Algoritmul va realiza constituientul reprezentat de dag-ul:
the ART
{3s 3p} fish
N
CC
1
CC
2
CC
0 NP

CAT
1
AGR
2
ROOT
CAT
AGR AGR
ROOT
CAT
96 PRELEGEREA 8. UTILIZAREA CARACTERISTICILOR

IN ANALIZ

A
Exemplul 8.15 Sa presupunem ca expresia verbala (V P) is happy este anal-
izata similar si reprezentata prin dag-ul (pentru simplicare nu au fost trasate arcele
CAT):
V P1
V 1
ADJP1
is
{3s}
ADJ1
happy

.
`
`
`
`
`
`
``

.
`
`
`
`
`
`
``

1 AGR 2
ROOT AGR 1
ROOT
Pe baza acestor analize si a regulii 1 din gramatica data n Tabelul 8.1, se poate
construi analiza propozit iei
The sh is happy:
the
fish {3s} is happy
ADJ1
ART1 N1 V 1 ADJP1
NP1 V P1
S1

.
`
`
`
`
`
`
``

.
`
`
`
`
`
`
`
`
`
`
`
`
`
`
`
`

`
`
`
`
`
`

`
`
`
`
`
`
`
`
`
`
`
`
`

`
`
`
`
`
`
`
`
`
`
`

1 AGR 2
1 2 AGR AGR 1 2
1 ROOT AGR AGR AGR
ROOT ROOT ROOT
Prelegerea 9
Semantici si logica formala
Denirea precisa a not iunilor de semantica si a nt elege este surprinzator de dicila,
pentru ca acesti termeni sunt folosit i de obicei cu diverse utilizari, adesea nrudite.
Astfel, exista ntrebuint ari ale verbului a nt elege care nu au nici o legatura cu
lingvistica. De exemplu:
Desi nu vorbeste, Clara nt elege limba spaniola.

Ii nt eleg durerea.
Ceea ce dorim sa folosim este mai apropiat de utilizarea acestui cuvant n
propozit ia
Prin singur se nt elege nensot it de nimeni altcineva.
Aceleasi probleme apar relativ la termenul a nsemna.

In general, n semantica se deneste nt elesul unui cuvant n termenii altor cu-


vinte.
Pentru a mari claritatea not iunilor, vom dezvolta un instrument mai precis, un
limbaj formal n care sa se poata specica nt elesul fara sa ne referim din nou la
limbajul nsusi. Dar chiar si asa, denirea not iunii de nt eles a unei propozit ii este
dicila. De exemplu, pe strada, cineva te poate ntreba Avet i un ceas ?. Potrivit
ntrebarii, se poate raspunde Da/Nu n funct ie de situat ia n care posezi sau nu un
astfel de obiect (acasa sau la man a). De fapt, scopul ntrebarii puse este acela de
a aa cat este ceasul. Deci, semnicat ia acestei chestionari poate , n funct ie de
context, aceea de a aa daca ai un ceas sau daca pot i spune cat este ceasul.
Ontrebare important a care se pune este aceea daca se poate deni nt elesul unei
propozit ii independent de contextul n care a fost ea formulata. Adica, exista un
nivel de reprezentare a cunostint elor n care propozit ia Avet i un ceas ? are un singur
nt eles dar poate folosita n diverse scopuri ? Raspunsul nu este deloc simplu,
dar, prin realizarea acestui deziderat vor apare o serie de avantaje n prelucrarea
limbajului natural.
Primul argument este modularitatea. Daca o astfel de diviziune poate facuta,
atunci putem studia nt elesul unei propozit ii n detaliu, far a a ne mai complica
cu tratarea modului ei de folosire. Daca o propozit ie nu are nici un nt eles inde-
pendent de context, atunci nu vom putea sa separam studiul limbajului de studiul
rat ionamentului general uman. Ceea ce, n afara de complicat iile deosebite aduse n
97
98 PRELEGEREA 9. SEMANTICI SI LOGIC

A FORMAL

A
prelucrarea limbajului, nu se ntampl a totdeauna n practica. De aceea vom folosi
termenul de nt eles pentru acest sens de tratare a propozit iilor - independent de
context; pentru aspectele dependente de context vom folosi termenul de utilizare.
Denit ia 9.1 Reprezentarea nt elesului independent de context este numita forma
logica. Operat ia de asociere unei propozit ii a formei sale logice este numita in-
terpretare semantica, iar procesul de asociere unei formei logice n limbajul de
reprezentare a cunostint elor (KR), se numeste interpretare contextuala.
Pentru moment vom folosi drept limbaj de reprezentare a cunostint elor calculul
predicatelor de ordinul I (First-Order Predicate Calculus: FOPC); denirea sa
formala, riguroasa, este data n Anexa 1.

In mod normal, forma logica nu face parte din limbajul de reprezentare a cunos-
tint elor. Aceasta conduce la problema de a stabili pozit ia sa n procesul de pre-
lucrare a limbajului natural. O idee folosita cu succes se bazeaza pe not iunea de
situat ie - care este denita ca ind o mult ime particulara de circumstant e ale lumii
nconjuratoare.
De exemplu, la intrarea ntr-o sala de clasa, suntem n situat ia cand exista
student i, un profesor, se fac anumite armat ii, se pun ntrebari etc., sunt impli-
cate si anumite obiecte, cum ar tabla, creta, scaune, s.a.m.d.
Denit ia 9.2 Se numeste situat ie o pereche ordonata S = (O, R) unde:
O este o mult ime nita de elemente numite obiecte, un obiect ind un cuplu
(x, y); orice doua obiecte din O difera cel put in prin y.
R este o mult ime nita de elemente numite relat ii, o relat ie ind de forma
(, y
1
, . . . , y
n
), (n 1) cu proprietatea ca pentru orice i(1 i n) exista un
obiect de forma (x, y
i
); este o relat ie de aritate n.
Exemplul 9.1 O situat ie foarte simpla poate urmatoarea:
S
1
= ({(MINGE, B0005), (COPIL, C86), (COPIL, C87)},
{(POSED

A, C86, B0005)}).
Exista deci trei obiecte - o minge si doi copii - codicate prin B0005, C86 respectiv
C87 si o relat ie binara - aceea ca mingea apart ine copilului C86.
Limbajul creaza tipuri speciale de situat ii bazate pe modul de utilizare a informa-
t iei. Deoarece acest mod de lucru va detaliat mai tarziu, vom prezenta pentru
nceput cateva elemente intuitive.

In orice conversat ie sau text, sa presupunem ca
exista o situat ie generata de discurs care nregistreaza informat ia pentru a o utiliza
n continuare. Orice noua armat ie este interpretat a n raport cu aceasta situat ie,
producand o situat ie noua care va include informat ia folosita.
Din acest punct de vedere, putem modela universul discursului sub forma unui
automat cu o innitate de stari - ecare stare ind o situat ie a discursului, iar forma
logica este funct ia de tranzit ie a automatului care aplica situat ia discursului n care
este facut a prezumt ia, ntr-o noua situat ie, rezultata din aceasta prezumt ie.
9.1. DESPRE FOPC 99
Exemplul 9.2 Sa presupunem ca situat ia prezentat a n Exemplul 9.1 a fost des-
cris a de o armat ie anterioara care cont inea mingea si carui baiat i apart ine ea.
Prezumt ia
Mingea este rosie.
creaza o noua situat ie, formata din cea anterioara, la care se adauga faptul ca
B0005 are proprietatea ROSU:
S
2
= ({(MINGE, B0005), (COPIL, C86), (COPIL, C87)},
{(POSED

A, C86, B0005), (ROSU, B0005)}.


Se poate da si o interpretare graca acestei situat ii, n felul urmator:
Analiza sintactica:
S
NP V P
N V ADJP
mingea este rosie

H
H
H
H
H
Hj
?

=
Z
Z
Z
Z
Z~
? ? ?
interpretare semantica
Forma logica: = (ASIGN (ROSU1 < b1 MINGE >)
Interpretare contextuala:
"!
#
"!
#
-
S
1
S
2

Situat ia init iala Situat ia actualizata


a discursului a discursului
Chiar daca cea mai mare parte a limbajului este dependent a de context, exista
totusi o structura semantica considerabila a limbajului care se comporta independent
de context si poate deci folosita n procesul de interpretare semantica, pentru a
produce forma logica. Cea mai mare parte din aceste cunostint e semantice constau
din tipul de informat ie care poate oferit de un dict ionar - proprietat ile semantice
de baza ale cuvintelor, ce sensuri diferite sunt posibile pentru ecare cuvant, ce
sensuri pot combinate pentru a forma o structura semantic a mai larga, etc.
9.1 Despre FOPC
Se poate considera ca logica s-a dezvoltat init ial ca o notat ie destinata surprinderii
proprietat ilor formale ale limbajului si rat ionamentului natural.

In consecint a, multe
100 PRELEGEREA 9. SEMANTICI SI LOGIC

A FORMAL

A
proprietat i structurale au corespondent n limbaj natural. De exemplu, se face deose-
birentre expresii care identic a obiecte si expresii care atribuie proprietat i obiectelor
si identica relat iile dintre obiecte. Expresiile substantivale corespund primului tip,
iar propozit iile si clauzele, celui de-al doilea.

In FOPC, aceeasi distinct ie se face
ntre termeni (care semnica obiecte ale universului) si propozit ii (care fac armat ii
despre obiectele universului).
Exista doua clase importante de termeni: constante si funct ii. Constantele sunt
similare practic numelor proprii din limbaj: Radu1, Radu2, C1, . . . Ele nu sem-
nica nimic prin simpla enunt are; proprietat ile lor apar numai din formulele care le
folosesc.
Apare totusi o diferent a majora ntre numele proprii din limbajul natural si
constantele din FOPC: n timp ce limbajul natural este ambiguu, ecare simbol din
FOPC are un singur nt eles. Numele Ion poate folosit n limbaj natural pentru a
face referint a la mai mult i oameni diferit i; acest lucru nu este posibil n logica, unde
este necesar cate un nume unic pentru ecare persoana.
Funct iile n FOPC corespund expresiilor substantivale care se refera la un obiect
n termenii anumitor proprietat i sau relat ii cu alte obiecte, cum ar tatal lui Ion
sau print ul Arabiei. Ele sunt scrise n FOPC ca expresii formate dintr-un nume de
funct ie (constanta) urmat de o lista de argumente (termeni), nchise ntre paranteze.
Numarul de argumente formeaza aritatea funct iei; de remarcat ca ea nu mai este o
constant a (ca n matematica). De exemplu, tatal lui Ion desemneaza o funct ie tata
si se scrie tata(Ion1). Dar aceeasi funct ie, n Tatal lui Ion si al Anei se va scrie prin
tata(Ion1,Ana1).
Propozit iile simple din FOPC (n care numele predicatului corespunde unei ex-
presii verbale formata numai din verb) constau dintr-un nume de predicat (cons-
tant a) si o lista de argumente (termeni) nchise ntre paranteze.
Exemplul 9.3 Pentru propozit ia
Ion si iubeste tatal.
se poate construi formula
Iubeste(Ion1,tata(Ion1)).
Propozit iile mai complexe sunt construite din cele simple folosind o serie de
operatori logici cu corespondent n limbaj natural. Aritatea acestor operatori este
xa, independent a de propozit iile n care sunt folosite.
Cel mai simplu operator logic este negat ia, scrisa . Astfel, propozit iei
Ion nu-si iubeste tatal.
i poate corespunde formula
Iubeste(Ion1,tata(Ion1)).
Practic, aproape tot i conectorii folosit i n limbajul natural corespund la diversi
operatori logici din FOPC. De exemplu:
si & (conjunct ie)
sau (sau concesiv)
(sau exclusiv)
daca atunci (implicat ie)
daca si numai daca (echivalent a)
9.1. DESPRE FOPC 101

In sfarsit, exista construct ii n FOPC care folosesc cuanticatori: (cuanti-


cator existent ial) si (cuanticator universal).
Exemplul 9.4 Urmatoarele propozit ii exemplica folosirea celor doua tipuri de
cuanticatori:
x. FAT

A(x)& IUBESTE(x, ION1)


Exista o fata care l iubeste pe Ion.
y.FAT

A(y) IUBESTE(y, ION1):


Toate fetele l iubesc pe Ion.
Deoarece operatorii logici pot legat i unii de alt ii, vor apare ambiguit at i n
formule, n funct ie de domeniul de act iune al ecarui operator. De exemplu, formula
P&Q
poate interpretat a ca ind conjuct ia a doua formule (P si Q) sau ca negat ia
formulei P&Q.

In limbajul natural, ei i corespunde o propozit ie de forma:


Nu merg si citesc ziarul.
n care nu este clar ce se neaga: doar prima propozit ie simpla - si atunci
semnicat ia este
Stau pe loc si citesc ziarul,
sau toata propozit ia, ceea ce ar duce la nt elesul:
Stau (si nu are important a ce fac) sau merg - dar atunci nu citesc nici un ziar.
Aceasta ambiguitate se elimina asociind operatorilor logici o lista de prioritat i
de domeniu; astfel, negat ia are totdeauna cel mai mic domeniu de act iune posibil,
iar disjunct ia - cel mai mare. Atunci, n exemplul de sus P&Q (P)&Q.
Aceste prioritat i funct ioneaz a binent eles n cazul cand nu s-au folosit paranteze
pentru delimitarea domeniilor de act iune ale operatorilor.
Odata cu cuanticatorii s-a introdus si convent ia de notat ie

.

(punct). El este
folosit n formule pentru a indica ca domeniul operatorului care l precede este extins
pan a la sfarsitul formulei. Aceasta convent ie usureaza scrierea, eliminand o serie de
paranteze.
Exemplul 9.5 Propozit iei:
Orice pasare are cuibul ei.
i se poate construi formula logica:
b.PAS

ARE(b) g.CUIB(g)&APARTINE(b, g)
Aceasta este echivalenta cu formula (n care nu s-a folosit convent ia cu punct):
b(PAS

ARE(b) g(CUIB(g)&APARTINE(b, g)))


102 PRELEGEREA 9. SEMANTICI SI LOGIC

A FORMAL

A
9.2 Sensurile cuvintelor si ambiguitatea
Pentru a dezvolta o teorie a semanticii si a interpret arii semantice, va nevoie sa
construim un model structural, asa cum s-a procedat si la sintax a. Acolo s-a denit
ntai not iunea de clasa sintactica de baza, apoi s-au dezvoltat caile prin care aceste
clase se pot combina pentru a forma structuri mai largi.

In semantic a problema
este ceva mai complicata, din cauza ambiguitat ii. De exemplu, n Micul dict ionar
enciclopedic, verbul a da are 32 denit ii (12 ca verb tranzitiv, 14 ca verb intranzitiv
si 6 ca verb tranzitiv sau intranzitiv, urmat de determinari locale). Uneori pentru
el se pot gasi sinonime, cum ar : a oferi, a restitui, a atribui, a renunt a, a se lovi,
a iesi (ecare din ele avand nsa sensuri usor diferite de verbul a da).
Daca ecare cuvant are unul sau mai multe sensuri, atunci va trebui denit un
univers al sensurilor deosebit de larg; pentru a-l putea manevra nsa, va necesara
organizarea sa n clase de obiecte cu anumite proprietat i. Mult imea acestor clase
de obiecte se numeste ontologie. Ideea a fost enunt ata de Aristotel, care n scrierile
sale denea drept clase majore substant a (obiectele zice), cantitatea (de exemplu
numerele), calitatea (cum ar luminozitatea, culoarea etc), relat ia, locul, timpul,
pozit ia, starea, act iunea si afect iunea. La aceste clase se pot adauga altele, cum ar
evenimentele, ideile, conceptele si planurile. Dintre acestea se disting cateva clase
cu important a deosebita: act iunile, evenimentele si situat iile.
Denit ia 9.3 Evenimentele sunt lucruri care apar n universul cunoasterii pentru
a asigura structurarea organizarii si interpretarii propozit iilor.
Act iunile sunt lucruri pe care le fac agent ii (deci cauzeaza evenimente).
Situat iile se refera la un anumit set de circumstant e; ele pot considerate ca
ind incluse n mult imea evenimentelor.
Rezulta ca ambiguitatea este o problema dicila care trebuie tratata n timpul
interpret arii semantice.
Denit ia 9.4 Spunem ca un cuvant este semantic ambiguu daca i putem atribui
mai multe sensuri.
Problema se complica daca vrem sa detaliem termenul de atribuire. Sunt put ine teste
lingvistice care sa deneasca cat mai precis not iunea de ambiguitate semantic a.
Un astfel de test se bazeaza pe ideea ca anumite construct ii sintactice se refera
la clase identice de obiecte. De exemplu, propozit ia
Ion are un vas iar Vasile doua vase.
are ca semnicat ie faptul ca Ion si Vasile poseda vase din aceeasi clasa de obiecte.
Nu reiese de exemplu ca Ion este proprietarul unui vas de pescuit iar cele doua vase
ale lui Vasile sunt vase de bucat arie. Pe de-alta parte, daca spunem
Mihai are un cal iar Radu are doi cai,
de aici nu reiese ca tot i caii din propozit ie au aceleasi caracteristici (sunt tot i
armasari, au aceeasi rasa, sunt tot i cai de curse, si altele). Intuitiv, cuvantul vas este
ambiguu ntre sensurile VAS NAV

A si VAS RECIPIENT, iar cuvantul cal nu este


ambiguu ntre ARM

ASAR si IAP

A, cele doua sensuri ind incluse n semnicat ia


9.2. SENSURILE CUVINTELOR SI AMBIGUITATEA 103
not iunii CAL. Deci, putem deduce de aici ca pentru ecare cuvant exista o ordonare
a preciziei sensurilor sale. Aceasta proprietate este denumit a vaguitate. CAL este
vag deoarece nu distinge ntre armasar si iapa. ARM

ASAR este vag deoarece nu


distinge ntre manz si animal adult. Toate sensurile se pare ca poseda un anumit
grad de vaguitate si pot capata prin completare un grad mai mare de precizie.
Acelasi tip de ambiguitate se poate distinge si n cazul verbelor.
Astfel, propozit ia
Am candidat anul acesta; la fel si George.
se refera la candidaturile a doua persoane pentru atingerea aceluiasi t el: alegeri
politice, admiterea la facultate, mana unei fete, sponsorizarea unui proiect; Nu se
poate deduce de exemplu ca eu am candidat n alegeri iar George la admiterea la
facultate. Deci verbul a candida este ambiguu ntre mai multe sensuri: CANDIDA1
(sens politic), CANDIDA2 (sens academic), CANDIDA3 (sens social), si altele.

In
schimb verbul a saruta este vag deoarece nu specica locul unde se saruta. Se poate
spune
Andrei a sarutat-o pe Andreea; la fel si Paul.
chiar daca Andrei a sarutat-o pe frunte iar Paul a sarutat-o pe obraz.
Unele forme de ambiguitate semantica sunt o consecint a a construct iei sintac-
tice. Un exemplu usor de construit se bazeaza pe domeniul de aplicabilitate al
cuanticatorilor. Astfel, n propozit ia
Orice baiat iubeste un caine.
nu este clar daca tot i baiet ii iubesc acelasi caine, sau ecare baiat are preferint a
pentru un anumit caine. Structura sintactica este aceeasi, dar diferent a rezulta din
domeniile pe care sunt valabili cuanticatorii.
Acestui exemplu i se pot asocia doua semnicat ii (n notat ie FOPC):
d.Caine(d)&b.Baiat(b) Iubeste(b, d)
b.Baiat(b) d.Caine(d)& Iubeste(b, d)
Un aspect foarte important al semnicat iei cuvintelor este relat ia dintre sensurile
cuvintelor aate n aceeasi propozit ie. Adesea sensul corect al unui cuvant este
determinat n mod unic de nt elesul restului propozit iei.
De exemplu, semnicat ia verbului a da este unic determinata n propozit iile
Petre da banii pe cart i.
si n
Petre da perdeaua la o parte.
desi nt elesurile sunt complet diferite. Un rol de baza al interpretarii semantice
consta tocmai n utilizarea de astfel de restrict ii ale propozit iei, care sa conduca la
reducerea numarului de sensuri posibile pentru ecare cuvant.
104 PRELEGEREA 9. SEMANTICI SI LOGIC

A FORMAL

A
9.3 Limbajul formelor logice de baza
Vom deni un limbaj - foarte aseman ator cu FOPC - care sa permita combinarea
unitat ilor de baza ale nt elesului (semnicat ia cuvintelor), pentru a obt ine nt elesuri
asociate unor expresii mai complexe.

Int elesurile unui cuvant vor servi ca atomi
sau constante ale reprezentarii. Aceste constante vor clasicate dupa tipurile
de not iuni pe care le descriu.

In particular, constantele care descriu obiecte ale
universului (inclusiv cele abstracte, cum sunt evenimentele sau situat iile) se numesc
termeni. Constantele care descriu relat ii si proprietat i se numesc predicate.
O propozit ie din acest limbaj este formata dintr-un predicat urmat de un numar
arbitrar de termeni folosit i ca argumente.
Exemplul 9.6 Propozit ia corespunzatoare armat iei:
Andrei este un baiat,
va construita din constantele ANDREI1 (termen) si B

AIAT1 (predicat); re-


prezentarea ei este:
(B

AIAT1 ANDREI1).
Prin utilizarea unei alte clase de constante, numite operatori (conectori) logici
se pot realiza propozit ii mai complexe.

In general conectorii sunt cei cunoscut i din
logica formala, anume:
- negat ia - (NOT)
- disjunct ia ()
- conjunct ia (&)
- implicat ia ()
precum si alte forme (FOPC are 16 astfel de operatori logici binari).
Similar lor, n limba vorbit a exista operatorii si, sau, daca, numai daca etc;
deosebirea este aceea ca relat iile induse de limbajul natural prin acesti conectori sunt
mai complexe decat cele din logica formala. De exemplu, conjunct ia si corespunde
operatorului logic &, dar adesea da si o structura temporala evenimentelor, ca n
Am ajuns acasa si am baut ceva.
n care evenimentul sosirii l precede pe cel al bauturii. La fel, conectorul dar
opereaza dupa aceleasi reguli logice ca si; aici nsa, doilea argument este ceva ce
auditoriul nu se asteapt a sa e adevarat, conform primului argument.
Forma logica generala a propozit iilor construite folosind conectori este:
(< conector > (< propozit ie >)(< propozit ie >)).
Exemplul 9.7 Forma logica pentru asert iunea
Paul cauta cartea sau Paul caut a servieta.
este:
( (CAUT

A1 PAUL1 CARTEA1)(CAUT

A1 PAUL1 SERVIETA1))
Cu aceste propozit ii simple - denite anterior - se poate construi nt elesul unui
sublimbaj foarte limitat al unei limbi naturale, anume propozit ii formate numai din
9.3. LIMBAJUL FORMELOR LOGICE DE BAZ

A 105
verbe simple si substantive (de obicei nume proprii). Pentru a realiza propozit ii mai
complexe, trebuiesc denite si alte construct ii semantice. O astfel de construct ie,
deosebit de importanta, este cuanticatorul.

In calculul predicatelor de ordinul 1
exista doar doi cuanticatori: , . Limbajul natural cont ine o gama mult mai vast a
de cuanticatori, cum ar tot i, unii, cel mult, multe, cat iva etc. Pentru a le atasa
cuanticatori, variabilele sunt scrise ca n FOPC, cu o singura diferent a: n logica
predicatelor de ordinul I se ret ine n domeniul de act iune al cuanticatorului numai
semnicat ia variabilei. Deci doua aparit ii ale aceleiasi variabile x care apar n doua
formule diferite (cum ar x.P(x) si x.Q(x)) sunt considerate variabile diferite,
far a nici o legatur a ntre ele.

In limbajul natural, considerat iile sunt altele.


Exemplul 9.8 Sa luam propozit iile:
Un om a intrat n camer a.
El s-a suit pe masa.
Prima propozit ie introduce n discut ie un nou obiect, un anumit om. Suntem
tentat i sa formalizam aceasta folosind cuanticatorul existent ial ; problema este ca
la acest om - introdus existent ial n prima propozit ie - se face referire prin pronumele
El n a doua propozit ie. Deci variabila aparuta si continua existent a si dupa ce a
fost introdusa. De aceea, ecare introducere a unei variabile n discurs, se realizeaza
asociindu-i un nume unic, nefolosit anterior.
Cuanticatorii pe limbaj natural au domenii mai restranse de act iune si deci sunt
mai complexi.
Astfel, o formula n FOPC de forma x.P(x) este adevarat a daca si numai daca
P(x) este adevarat a pentru orice obiect posibil din domeniu (deci x poate orice
termen din limbaj).
Astfel de armat ii sunt rare n limbajul natural. Aici vom folosi termenul de
cuanticator generalizat; el este folosit n construct ii de forma:
(< var cuanticator >: (< restrict ie >)(< prop principala >))
Exemplul 9.9 Propozit ia Mult i caini latra are forma logica:
(MULTI d1: (C

AINE1 d1)(LATR

A1 d1))
Aceasta arata ca multe obiecte obiecte d1 care satisfac condit ia (C

AINE1 d1),
satisfac si condit ia (LATR

A1 d1). De remarcat ca aceasta condit ie este complet


diferita de formula
(MULTI d2: (LATR

A1 d2)(C

AINE1 d2))
care deneste nt elesul propozit iei Multe lucruri care latra sunt caini.
O clasa foarte importanta de cuanticatori corespunde articolelor hotar at si ne-
hotar at. Astfel, armat ia
Cainele latra.
are forma logica:
106 PRELEGEREA 9. SEMANTICI SI LOGIC

A FORMAL

A
(ART LE x: (C

AINE1 x)(LATR

A1 x))
si va adevarat a numai daca exista un caine unic determinat de context, si acel
caine latra. Evident, n orice aplicat ie practica vor mai mult i caini, asa ca folosirea
contextului pentru a-l identica pe cel corect este cruciala n nt elegerea propozit iei.
Folosind diverse restrict ii pot rezulta expresii substantiv mai complexe.
De exemplu, propozit ia
Cainele fericit latra.
va folosi o restrict ie suplimentara, scrisa sub forma unei conjuct ii, anume:
(ART LE x: (&(C

AINE1 x)(FERICIT x))(LATR

A1 x))
Ea va adevarat a numai daca exista un context unic x astfel ncat
(&(C

AINE1 x) (FERICIT x)) si acest x latra.


Pentru a cuantica formele de plural, trebuiesc introduse alte construct ii.

In
acest scop, denim un operator unar numit operator predicat; el va lua ca argument
un predicat si va produce un nou predicat. Pentru constrcut ia pluralului se foloseste
operatorul predicat PLUR.
Exemplul 9.10 Daca C

AINE1 este un predicat adevarat pentru orice caine, atunci


(PLUR C

AINE1) este un predicat adevarat pentru orice mult ime de caini.


Deci reprezentarea nt elesului propozit iei
Cainii latra.
este:
(ART I x:((PLUR C

AINE1) x)(LATR

A1 x))
Pluralul expresiilor substantivale induce posibilitatea unei noi forme de ambigu-
itate. Sa observam ca nt elesul normal al propozit iei
Cainii latra.
este acela ca exista o haita specicata de caini si ecare din ei latra. Aceasta
este numit a citire distributiva, pentru ca predicatul LATR

A1 se distribuie la ecare
element din mult ime.
Sa consideram acum propozit ia
Cainii s-au strans la colt .
Aici este un nonsens sa armam ca ecare caine s-a strans; armat ia este adeva-
rata pentru ntreaga mult ime de caini.
Aceasta se numeste citire colectiva. Unele propozit ii folosesc ambele tipuri de
interpret ari, deci sunt ambigue.
Exemplul 9.11

In propozit ia
Doi oameni si-au cumparat masina.
se poate nt elege ca ecare om si-a cumparat masina lui proprie (citire distribu-
tiva) sau ca cei doi au cumparat mpreuna o singura masina (citire colectiva).
9.3. LIMBAJUL FORMELOR LOGICE DE BAZ

A 107

In sfarsit, ultimele construct ii care pot introduse sunt operatorii modali, nece-
sari pentru a reprezenta nt elesul verbelor n general, restrict iile de timp n parti-
cular. Acesti operatori sunt destul de aseman atori cu operatorii logici, avand ns a
unele deosebiri importante. Anume, termenii din domeniul unui operator modal pot
avea o interpretare care difera de cea normala; aceasta afecteaza concluziile care se
pot trage dintr-o propozit ie.
De exemplu, sa presupunem ca Adi este cunoscut unora sub numele de Andy;
exista deci doua sensuri ale cuvantului, care sunt egale: ADI1=ANDY2.

In
propozit ii construite folosind aceasta supozit ie, nu are important a care din cele doua
constante este folosita: daca (FERICIT ANDY2) este adevarata, atunci (FERICIT
ADI1) este adevarata si invers; la fel,
(ORI (VESEL ADI1)(SUPARAT ADI1)),
(ORI (VESEL ANDY2)(SUPARAT ANDY2))
sunt ambele adevarate sau false n acelasi timp. Asert iunea nu este ns a tot-
deauna valabila n interiorul domeniului unui operator modal, cum ar CREDE1.
De exemplu, daca
Rodica crede ca Adi este fericit.
deci
(CREDE RODICA1 (FERICIT ADI1)),
aceasta nu implica neaparat valabilitatea propozit iei
Rodica crede ca Andy este fericit.
adica
(CREDE RODICA1 (FERICIT ANDY2)),
pentru simplul motiv ca Rodica poate sa nu stie ca Adi si Andy sunt una si
aceeasi persoana.
Deci nu se pot nlocui liber termenii egali, daca acestia apar n interiorul dome-
niului unui operator modal. Aceasta restrict ie se numeste esecul substitut iei n
contexte modale.
O clasa importanta de operatori modali pentru limbajul natural sunt operatorii
de timp: PREZENT, TRECUT, VIITOR. Deci se pot diferent ia propozit ii ca
Marius vede marea.
Marius a vazut marea.
Marius va vedea marea.
prin:
(PREZENT (VEDE1 MARIUS1 MAREA1)
(TRECUT (VEDE1 MARIUS1 MAREA1)
(VIITOR (VEDE1 MARIUS1 MAREA1)
Acestia sunt operatori modali deoarece ei veric a esecul substitut iei.
De exemplu, sa consideram operatorul TRECUT si sa luam doua constante
VASILE1 si DECAN1, egale n prezent (ceea ce nseamna ca Vasile este acum de-
can), dar care nu au fost egali n trecut (cand Vasile nu era decan). Pe baza acestui
fapt, din
108 PRELEGEREA 9. SEMANTICI SI LOGIC

A FORMAL

A
(TRECUT (VIZITA1 VASILE1 FRANTA1)),
nu se poate decide daca decanul din trecut a vizitat Frant a, adica
(TRECUT (VIZITA1 DECAN1 FRANTA1)).
De remarcat ca o propozit ie si negat ia ei pot ambele adevarate n trecut (dar
la momente diferite). De exemplu, propozit iile
Aurel a fost vesel.
Aurel nu a fost vesel.
pot ambele adevarate la trecut, deci
(TRECUT (VESEL AUREL1)),
(TRECUT (NOT ((VESEL AUREL1)))
pot simultan adevarate.

In continuare vom ignora totusi efectul operatorilor modali de timp.


9.4 Codicarea ambiguitat ii n forma logica
Dupa cum se stie, o propozit ie tipica poate avea mai multe structuri sintactice posi-
bile, ecare din ele cu multiple forme logice.

In plus, cuvintele propozit iei pot avea
mai multe sensuri. Simpla enumerare a formelor logice posibile nu este deci practica.
Este mai ecient sa construim o cale prin care anumite ambiguit at i comune pot
unicate si reprezentate local ntr-o forma logica.

In unele lucrari aceasta maniera
de codicare a ambiguit at ilor este tratata ca un nivel separat de reprezentare n
forma logica, numit forma cvasi-logica.
Poate cea mai mare sursa de ambiguitate n forma logica provine din faptul ca
multe cuvinte au sensuri multiple. Unele sensuri au proprietat i structurale diferite,
astfel ca ele pot eliminate de contextul n care se aa scufundata propozit ia.

In prezent, singurul mod de a codica acestea va construct ia unei forme logice


separate pentru ecare combinat ie posibila de sensuri ale cuvintelor din propozit ie.
Pentru a reduce aceasta explozie a formelor logice, putem folosi aceeasi tehnica ca
la asocierea de valori multiple de caracteristici, cunoscuta la structura sintactica.
Anume, aparit ia ntr-o expresie a unui sens atomic, se poate nlocui cu un set de
sensuri atomice.
Exemplul 9.12 Substantivul cheie are cel put in doua sensuri: CHEIE1 - obiectul
necesar pentru deschiderea usilor, si CHEIE2 - metoda de decriptare folosita de
destinatarul unui mesaj cifrat. Deci, propozit ia
Elena a folosit cheia.
utilizata n afara de context, este ambigua. Ambele sensuri posibile pot repre-
zentate printr-o singura forma logica; anume:
(ART A b1:({CHEIE1 CHEIE2} b1)(TRECUT (FOLOSI1 ELENA b1))).
Aceasta scriere este obt inuta din cele doua forme logice posibile:
(ART A b1:(CHEIE1 b1)(TRECUT (FOLOSI1 ELENA b1)))
9.4. CODIFICAREA AMBIGUIT

AT II

IN FORMA LOGIC

A 109
(ART A b1:(CHEIE2 b1)(TRECUT (FOLOSI1 ELENA b1)))
Una din cele mai complexe forme de ambiguitate provine din domeniul relativ
de act iune al cuanticatorilor si operatorilor. Am vazut ca o propozit ie cum ar
Orice baiat iubeste un caine.
este ambigu a ntre cele doua tipuri de citiri, dupa cum este denit domeniul
cuanticatorilor. Nu exista nici o metoda independent a de context pentru a rezolva
aceasta ambiguitate, asa ca ambele citiri vor trebui reprezentate n formele nale
logice ale propozit iei. Dar, n loc de a enumera toate domeniile posibile - ceea ce ar
duce la o crestere exponent ial a a interpetarilor bazate pe numarul de construct ii de
domenii - vom introduce o prescurtare n limbajul formei logice, care reduce masiv
interpret arile. Pur si simplu forma logica abreviata nu va cont ine informat ia relativa
la domeniu.

In plus, construct ii specice (cum ar cuanticatorii generalizat i) vor
tratate sintactic ca termeni si vor apare n pozit ia indicata de structura sintactic a
a propozit iei. Ele sunt marcate prin paranteze unghiulare pentru a indica domeniul
de abreviere.
Exemplul 9.13 Formele logice pentru
Orice baiat iubeste un caine.
sunt prinse ntr-o singura forma ambigua:
(IUBESTE1 < b1 (B

AIAT1 b1)>< d1 (C

AINE1 d1)>)
Aceasta prescurtare este o ambiguitate ntre formele logice
( b1:(B

AIAT1 b1)( d1 (C

AINE1 d1)( IUBESTE1 b1 d1)))


( d1:(C

AINE1 d1)( b1:(B

AIAT1 b1)( IUBESTE1 b1 d1)))


Daca restrict ia ntr-un cuanticator generalizat este o propozit ie care utilizeaza
un singur predicat unar, se poate folosi o abreviere care sa elimine variabila. De
exemplu, forma
< b1 (B

AIAT b1)>
poate scrisa
< b1 B

AIAT>.
Multe construct ii din limbajul natural sunt senzitive la domenii.

In particular,
tot i cuanticatorii generalizat i, inclusiv articolele hotar ate. De exemplu, pentru
propozit ia
La orice hotel recept ionistul era amabil.
n aproape orice context recept ionistul intra n domeniul lui orice hotel, adica
exista cate un recept ionist diferit la ecare hotel.
De asemenea operatori cum ar negat ia sau timpul sunt senzitivi la domeniu.
Folosind un exemplu din limba engleza, propozit ia
Every boy didnt run.
este ambigu a ntre cele doua tipuri de citiri (distributiva si colectiva): astfel, e
doar unii baiet i nu au alergat, adica:
110 PRELEGEREA 9. SEMANTICI SI LOGIC

A FORMAL

A
(NOT (EVERY b1:(BOY1 b1)(RUN1 b1)))
e nici un baiat nu a alergat:
(EVERY b1:(BOY1 b1)(NOT (RUN1 b1)))
Ambele citiri pot scrise sub o singura forma logica:
(<NOT RUN1><EVERY b1 BOY1>)
unde operatorii unari fara domeniu (NOT, PAST, PRES,. . .) au fost omisi.
Ca o ultima observat ie, sa comentam ce se nt ampl a cu numele proprii si cu
pronumele. Vom presupune ca ecare nume propriu identic a un sens caracteristic
unui obiect din domeniu. Orice nume propriu trebuie interpretat n context; astfel,
numele Andrei se va referi la persoane diferite n situat ii diferite.

In semantic a vom
introduce aceasta construct ie ca o funct ie speciala de forma:
(NUME < variabila >< nume >)
care are ca efect producerea n contextul curent a unui obiect cu numele respectiv.
Exemplul 9.14 Deci forma cvasi-logica pentru propozit ia
Andrei a alergat.
este
(<TRECUT ALERGA1>(NUME j1 Andrei)).
Un argument similar poate dat si pentru pronume sau alte cuvinte indexate ca
de exemplu aici, ieri etc. Acestea vor prelucrate folosind funct ii speciale de forma
(PRO < variabila >< propozit ie >)
Exemplul 9.15 Forma cvasi-logica pentru propozit ia
Tot i oamenii l-au iubit.
este:
(<TRECUT IUBI1><PLURAL (TOT m1 OM1)>(PRO m2 (EL1 m2)))
EL1 este acelasi pentru el si lui si - formal - este un predicat cu valoare de
adevar pentru obiectele care satisfac restrict iile precedente.
Ca si cuanticatorii generalizat i, cand restrict iile sunt predicate unare, formele
pronumelor pot abreviate. De exemplu, forma logica pentru el poate scrisa
adesea (PRO m2 EL1).
Construct iile descrise aici reduc semnicativ numarul formelor logice. Totusi, nu
toate ambiguit at ile pot modelate prin prescurtari, asa ca vor propozit ii care vor
necesita liste de forme logice posibile, chiar si pentru o singura structura sintactic a.
Prelegerea 10
Modele si structuri semantice
10.1 Verbe si stari n forma logica
Sa consideram verbele act ion and ca predicate n forma logica.

In acest fel se pot pre-
lucra toate reprezent arile lor distincte si se pot folosi diverse proprietat i de adnotare,
pierzandu-se doar cateva generalitat i.
Exemplul 10.1 Sa consideram urmatoarele armat ii, toate folosind verbul
a sparge:
1. Radu a spart geamul cu ciocanul.
2. Ciocanul a spart geamul.
3. Geamul s-a spart.
Intuitiv, toate aceste armat ii descriu acelasi tip de eveniment, n detalii diferite.
Deci ar de dorit ca verbul a sparge sa corespunda aceluiasi sens n ecare caz.
Problema care apare consta n faptul ca n cele trei armat ii, verbul este folosit cu
aritat i diferite.

In prima propozit ie a sparge indica o relat ie ternara ntre Radu,
geam si ciocan, a doua propozit ie este o relat ie binara ntre ciocan si geam, iar a
treia propozit ie este o relat ie unara relativa la geam. Deci se pare ca sunt necesare
trei sensuri distincte ale verbului a sparge: SPARGE1, SPARGE2, SPARGE3, care
difera prin aritate si produc forme logice de tipul:
1. (<TRECUT SPARGE1>(NUME j1 Radu)
<ART UL w1 GEAM1><ART UL h1 CIOCAN1>),
2. (<TRECUT SPARGE2><ART UL h1 CIOCAN1>)
<ART UL w1 GEAM1>)
3. (<TRECUT SPARGE3><ART UL w1 GEAM1>)
Pentru a garanta ca toate predicatele sunt interpretate corespunzator, ecare
reprezentare va trebui completata cu axiome care sa asigure echivalent a cu celelalte
doua forme. Aceste axiome sunt numite postulate de semnicat ie.
111
112 PRELEGEREA 10. MODELE SI STRUCTURI SEMANTICE
Pare ns a destul de neconvenabil sa specicam astfel de restrict ii pentru ecare
verb. O variant a de rezolvare (Davidson, 1967) constan introducerea drept variabile
a evenimentelor. Acum, nt elesul unui propozit ii de tipul
Radu l-a spart.
poate scris:
( e1: (SPARGE e1 (NUME j1 Radu)(PRO i1 L)))
(s-a omis predicatul de timp) care semnica faptul ca e1 este un eveniment n
care Radu sparge un anumit geam.

In mod similar, nt elesul propozit iei


Radu l-a spart cu ciocanul.
este:
( e1: (& (SPARGE e1 (NUME j1 Radu)(PRO i1 L))
(INSTR e1 <ART L h1 CIOCAN>)))
Avantajul consta n faptul ca modicatorii suplimentari, cum ar cu ciocanul,
sau din greseala, sau mart ea trecuta pot adaugat i la reprezentarea de baza cu
predicate care utilizeaza evenimentul respectiv.
Motivari similare au condus ulterior (nceputul anilor

70) la dezvoltarea gra-
maticilor de caz, care au introdus idei folosite si acum. Una din ele este aceea ca
exista un set limitat de relat ii semantice care pot stabilite ntre un verb si argu-
mentele sale. Aceste relat ii sunt numite roluri tematice sau roluri de caz; desi au
fost folosite n multe aplicat ii practice, numarul lor a ramas totdeauna restrans.
Revenind la exemplul de sus, ideea este aceea ca Radu, ciocanul si geamul joaca
n toate cele trei propozit ii aceleasi roluri semantice. Radu este factorul activ, ac-
torul (rolul agent), geamul este obiectul (rolul tema) iar ciocanul este instrumentul
(rolul instrument) folosit n actul de spargere. Aceasta sugereaza o reprezentare a
nt elesului propozit iei, similara cu cea folosita n ret elele semantice, unde totul este
exprimat n funct ie de relat ii unare si binare.
De exemplu, pe baza celor trei roluri tematice evident iate mai sus, nt elesul
propozit iei
Radu a spart geamul.
va :
( e (& SPARGE e)(AGENT e (NUME j1 Radu))
(TEMA e <ART UL w1 GEAM>)))
Deoarece aceste construct ii sunt foarte des folosite, vom introduce pentru ele o
noua notat ie. Forma prescurtata pentru o armat ie de forma
(e : (&(Eveniment-p e)(Relat ie
1
e obj
1
) . . . (Relat ie
n
e obj
n
)))
este:
(Eveniment-p e [Relat ie
1
obj
1
] . . . [Relat ie
n
obj
n
])

In particular, cu aceasta abreviere, forma cvasi-logica pentru propozit ia de sus


este:
10.2. ROLURILE TEMATICE 113
(<TRECUT SPARGE1> e1 [AGENT (NUME j1 Radu)]
[TEMA <ART UL w1 GEAM1>])
Argumente similare pot evident construite si pentru verbe. Astfel, sa con-
sideram propozit ia
Maria a fost nefericita.
Daca ea este reprezentat a (folosind un predicat unar) sub forma
(<TRECUT NEFERICIT>(NUME j1 Maria))
sa vedem cum poate folosita aceasta informat ie pentru propozit ia
Maria a fost nefericita la ntalnire.

In aceasta situat ie vom generaliza not iunea de eveniment, pentru a include stari,
dupa care se foloseste aceeasi tehnica. De exemplu, se poate considera NEFERICIT
drept predicat care are ca argument o stare de nefericire, si se foloseste rolul TEMA
pentru a include pe Maria:
( s <TRECUT NEFERICIT> s)(TEMA s (NUME j1 Maria))
Folosind aceleasi convent ii de prescurtare (denite la evenimente), propozit ia de
sus se poate reprezenta sub forma
(<TRECUT NEFERICIT> s [TEMA (NUME j1 Maria)]
[LA LOC m1

INT

ALNIRE])

In general - n funct ie de situat ie - se alege unul din cele doua moduri de


reprezentare a nt elesului propozit iilor. Astfel, semnicat ia propozit iei
Sanda vede Bucegii.
poate data atat de
(PREZENT (VEDE1 x1 [AGENT (NUME j1 Sanda)]
[TEMA (NUME m1 (ART I Bucegi))]))
care este echivalent cu
(PREZENT ( x1 (& VEDE1 x1)(AGENT x1 (NUME j1 Sanda))
(TEMA x1 (NUME m1 (ART I Bucegi))))))
dar si sub forma predicatelor argument:
(PREZENT (VEDE1 (NUME j1 Sanda)(NUME m1 (ART I Bucegi)))).
10.2 Rolurile tematice
Sa trecem n revista mai detaliat teoriile bazate pe not iunea de roluri tematice (sau
cazuri). Vom porni de la cele trei propozit ii date n exemplul 10.1, n care Radu,
ciocanul si geamul joaca aceleasi roluri semantice: Radu este actorul, geamul este
obiectul iar ciocanul este instrumentul folosit n actul de spargere al geamului. Pentru
a ret ine aceste idei n forma cvasi-logica, introducem relat iile AGENT, TEMA si
INSTR.
Poate ca rolul tematic cel mai usor de denit este rolul AGENT.
114 PRELEGEREA 10. MODELE SI STRUCTURI SEMANTICE
Denit ia 10.1 O expresie substantiv ndeplineste rolul AGENT daca desemneaza
instigatorul act iunii descrise de propozit ie.
Acest rol poate atribui voint a, intent ie sau responsabilitate pentru act iunea descrisa
de agent. Un test pentru vericarea alegerii corecte a agentului este acela de a
introduce n propozit ii expresii cum ar intent ionat sau trebuie, care sa ntareasc a
rolul celui presupus a AGENT; daca propozit ia obt inuta este corect formata,
expresia substantiv aleasa poate avea rolul de AGENT.
De exemplu, urmatoarele propozit ii sunt acceptabile:
Radu, intent ionat a spart geamul cu ciocanul.
Radu a trebuit sa sparga geamul cu ciocanul pentru a avea mai mult aer.

In schimb urmatoarea propozit ie nu este acceptabila (pragmatic):


Ciocanul, intent ionat a spart geamul.
Referitor la a treia propozit ie, daca scriem ns a:
Geamul a trebuit sa se sparg a pentru a avea mai mult aer.
nu putem spune ca ea nu este corecta. Dar acum propozit ia se refera la o alta
persoana, (Radu), nespecicata n propozit ie, care trebuie sa aiba mai mult aer.
Deci, peste tot Radu joaca rol de AGENT.
Ideea de a detecta agentul prin metoda descrisa mai sus nu este totdeauna posi-
bila. De exemplu, nu vom putea arma n mod normal:
Radu, intent ionat a murit.
Paula a trebuit sa-si aminteasca de ziua ei de nastere, pentru a primi cadouri.
Binent eles, se pot construi propozit ii echivalente cu acestea (de exemplu, pen-
tru prima se poate spune Radu s-a sinucis), dar astfel se modica sensul init ial al
propozit iei (Radu a murit).
Denit ia 10.2 Expresiile substantivale care sufera anumite schimbari sau asupra
carora se act ioneaza, ndeplinesc rolul de TEM

A.
Aceasta corespunde de obicei entitat ii sintactice OBIECT si, pentru un anumit verb
tranzitiv X, constituie raspunsul la ntrebarea
Ce a fost X-at ?
Exemplul 10.2 Pentru propozit ia
Vulturul a vazut soarecele.
NP soarecele este TEMA si raspunsul la ntrebarea
Ce a fost vazut ?
Pentru verbele intranzitive rolul TEM

A este ndeplinit de expresia substantival a


subiect care nu este AGENT. Deci, n
Norii apareau deasupra orizontului.
expresia substantivala norii va TEMA.
10.2. ROLURILE TEMATICE 115
Exemplul 10.3 Alte exemple:
Piatra s-a spart.
Vasile a spart piatra.
I-am dat lui Costel cartea.
(TEMA a fost subliniata).
Pentru locat ii si adresari se denesc alte roluri tematice. Aici va trebuie sa
distingem din nou ntre relat iile care indica un loc (adresa) si cele care indica o
adresare (drum).
Astfel, relat ia LA LOC indica pozit ia unui obiect sau locul unde se petrece un
eveniment, ca n exemplele:
Silviu se plimba pe drum.
Scaunul este langa usa.
Pe drum descrie unde are loc plimbarea, iar langa usa indica localizarea scau-
nului.
Alte propozit ii descriu schimbarea locului, direct ia de miscare, sau drumul:
Ieri m-am plimbat de aici pana la scoala.
Cadea spre pamant.
Pasarile zburau dinspre lac de-a lungul raului.
Exista aici cel put in trei tipuri diferite de propozit ii: cele care descriu unde-vine-
cineva-de-undeva (rolul DIN LOC) - cazul lui de aici; cele care descriu destinat ia
(rolul SPRE LOC) - ca n spre pamant; si cele care descriu traiectoria sau drumul
(rolul DRUM LOC) - cum este de-a lungul raului.
Aceste roluri de adresa pot generalizate n roluri peste valori arbitrare de stari
(numite rol LA) si roluri pentru schimbarea unei stari arbitrare (roluri DIN, SPRE,
DRUM).
Deci, LA LOC este o particularizare a rolului LA etc. Alte particularizari ale
acestui rol se pot obt ine plecand de la relat ia abstracta de posesie. Astfel:
Exemplul 10.4
I-am aruncat mingea lui Tudor. (rolul SPRE LOC)
I-am dat cartea lui Tudor. (rolul SPRE POSS)
Am primit mingea de la Tudor. (rolul DIN LOC)
Am mprumutat cartea de la Tudor. (rolul DIN POSS)
Cutia cont ine o minge. (rolul LA LOC)
Tudor poseda o carte. (rolul LA POSS)
Similar, se pot deni rolurile LA TIMP, SPRE TIMP, DIN TIMP, ca n:
Exemplul 10.5
Am vazut masina la ora 3. (rolul LA TIMP)
Am lucrat de la unu la trei. (rolul DIN TIMP si SPRE TIMP)
Sau roluri relative la valoare, ca n:
Exemplul 10.6
Temperatura ramane la zero. (LA VALOARE)
Temperatura creste peste zero. (DIN VALOARE)
116 PRELEGEREA 10. MODELE SI STRUCTURI SEMANTICE
Un alt rol este motivat de faptul ca, n aceste coordonate, nu se poate clasica
usor rolul NP dintr-o propozit ie cum ar :
Radu a crezut ca plouase.
Rolul TEM

A este ndeplinit de clauza ca plouase, deoarece aceasta este ceea ce


credea subiectul. Radu nu poate AGENT deoarece nu era intent ia lui sa creada
ceva. Deci va trebui introdus un nou rol, numit EXPERIENT

A, ndeplinit de int e
aate ntr-o anumit a stare psihica, sau care ndeplinesc o anumit a stare psihica (cum
ar percept ia - n exemplul anterior).
Alt rol este cel de BENEFICIAR, ndeplinit de persoane pentru care este realizat
un anumit eveniment, ca n:
Am cumparat ori pentru Lucia.
Gaseste-mi hartiile !
I-am dat cartea lui Mihai pentru Tamara.
Ultimul exemplu arata necesitatea de a distinge ntre rolul SPRE POSS (adica
lui Mihai) si BENEFICIAR.
Rolul INSTR descrie un mecanism - material sau fort a - folosite pentru a realiza
un anumit eveniment.
Henry a spart oglinda cu bastonul.
Bastonul a spart oglinda.
Am folosit ceva mirodenii pentru a face o prajitura.
Am facut o prajitura cu ceva mirodenii.

In funct ie de verb, rolul INSTR poate folosit uneori ca subiect, atunci cand rolul
AGENT nu este specicat. Fort ele naturale sunt de asemenea incluse n categoria
INSTR, ca n:
Soarele a ars culturile.
Valentin a folosit soarele pentru a usca panza.
Rolurile AGENT si INSTR pot combinate ntr-un rol mai general numit
AGENT CAUZAL.
Alte roluri trebuiesc identicate nainte de a ncepe analiza anumitor propozit ii.
De exemplu, unele armat ii descriu situat ii n care doi oameni realizeaza mpreuna
o act iune; sa consideram propozit ia:
Paul a mutat dulapul ajutat de Virgil.
Pentru a o prelucra, trebuie denit un rol nou - CO AGENT pentru introducerea
expresiei prepozit ionale ajutat de Virgil.
Un caz mai complicat aparen propozit iile care descriu schimburi sau alte interac-
t iuni complexe. Sa consideram exemplele:
Ion a platit anticarului 10.000 lei pentru carte.
Ion a luat cartea de la anticar pentru 10.000 lei.
Ambele propozit ii descriu o situat ie n care Ion a dat 10.000 lei unui anticar si
10.2. ROLURILE TEMATICE 117
a primit n schimb o carte.

In prima propozit ie 10.000 lei este TEMA, iar cartea
nu are asignat nici un rol.

In a doua propozit ie, situat ia este inversata: cartea este
TEMA iar 10.000 lei nu are atribuit nici un rol. Pentru prelucrarea acestor cazuri
se deneste un rol CO TEM

A pentru al doilea obiect aat n operat ia de schimb.


Problema poate generalizata considerand propozit ii care descriu doua eveni-
mente. Evenimentul primar este cel focalizat pana acum; pe langa el poate apare
si un eveniment secundar.

In aceasta modalitate, prima propozit ie din exemplu
poate analizata astfel (s-a considerat drept eveniment primar Ion platind suma de
10.000 lei, iar ca eveniment secundar Ion primind cartea):
Expresie Primar Secundar
Ion AGENT AGENT
10.000 lei TEMA
anticar SPRE POSS DIN POSS
cartea TEMA
Dupa cum s-a vazut, verbele pot clasicate dupa rolurile tematice pe care le
solicita. Pentru a face o clasicare mai precisa, va trebui sa punem n evident a
rolurile legate intrisec de verbe. De exemplu, aproape orice verb la timpul trecut
are un rol LA TIMP realizat de un adverb (cum ar ieri). Deci acest rol pare a o
proprietate mai strans legata n general de expresiile verbale, decat o proprietate a
oricarui verb individual. Mai pot apare si alte astfel de roluri, anume cele realizate
de constituient ii pentru care verbele au denite subcategorii.
De exemplu, verbul a pune are denita ca subcategorie un PP si deci acest PP
trebuie sa realizeze un rol SPRE LOC.

In clasicarea verbelor, aceste tipuri de roluri sunt importante; ele se numesc


roluri interne ale verbelor.
Aceasta important a sugereaza necesitatea unui test pentru a determina daca un
anumit rol este intern sau nu pentru un verb dat. Folosind exemplele de sus, acest
test se poate formula astfel:
Daca rolul este obligatoriu, atunci este un rol intern.
Exista totusi roluri interne care apar ca opt ionale n anumite situat ii; pentru ele
sunt necesare alte teste.
Se poate construi un test bazat pe observat ia ca orice verb are n rolurile interne
cel mult un NP. Daca sunt necesare mai multe NP-uri, acestea sunt legate printr-o
conjunct ie. Astfel, se poate spune
Andrei si cu mine am alergat la fereastra.
dar nu
Andrei mine am alergat la fereastra.
La fel,
Am alergat la magazin si la banca.
este corect, pe cand
Am alergat la magazin la banca.
nu este. Deci rolurile AGENT si SPRE LOC sunt interne pentru verbul a alerga.
118 PRELEGEREA 10. MODELE SI STRUCTURI SEMANTICE
Verbele au pan a la trei roluri interne, cel put in unul din ele ind realizat n
propozit ia care foloseste verbul. Uneori trebuie sa existe obligatoriu un anumit
rol (de exemplu SPRE LOC pentru verbul a pune). De asemenea, TEMA este
obligatorie, n timp ce AGENTUL este totdeauna opt ional pentru verbele folosite
la diateza pasiva. Exista si restrict ii sintactice referitoare la modul de realizare al
diverselor roluri.

In Tabelul 10.1 sunt listate cateva modalitat i simple de realizare
a rolurilor n propozit ii.
Tabelul 10.1:
Rol Realizare
AGENT Ca subiect n propozit ii active
Dupa prepozit ia prin n propozit ii pasive
TEMA Ca obiect al verbelor tranzitive
Ca subiect al verbelor non-active
INSTR Ca subiect n propozit iile active fara agent
Dupa prepozit ia cu
EXPERIENT

A Ca subiect n propozit ii active fara agent
BENEFICIAR Ca obiect indirect cu verbe tranzitive
Dupa prepozit ia pentru
LA LOC Dupa prepozit iile in, pe,dupa, . . .
LA POSS Expresii substantivale posesive
Ca subiect al propozit iilor, daca nu este agent
SPRE LOC Dupa prepozit iile la, spre, . . .
SPRE POSS Dupa prepozit ia la, obiect indirect cu anumite verbe
DIN LOC Dupa prepozit iile din, afara, . . .
DIN POSS Dupa prepozit ia din
Exemplul 10.7 Sa mai dam cateva exemple; verbele sunt subliniate iar rolurile
(asigurate de NP,PP sau S) sunt listate n ordinea aparit iei lor n fraza.
Ion a alergat. AGENT
Ion a alergat cu un buchet de ori. AGENT +INSTR
Ion a alergat cu un buchet de ori AGENT +INSTR+
pentru Ana. +BENEFICIAR
Ion a stricat masina. AGENT +TEMA
Ion a dat ziarul prin fereastra. AGENT +TEMA +DRUM
Ion i-a platit lui Barbu masina. AGENT +SPRE POSS +TEMA
Barbu a mpins masina de la casa AGENT +TEMA+
lui Ion pana la atelier. +DIN LOC +SPRE LOC
Ion este nalt. TEMA
Barbu crede ca Ion este nalt. EXPERIENT

A +TEMA
Ana are o masina. LA POSS +TEMA
Eu sunt n clasa. TEMA +LA LOC
Mingea s-a rostogolit jos, de pe mal TEMA +DRUM +SPRE LOC
n apa.
10.3. EXPRIMAREA ORAL

A SI PROPOZIT II DERIVATE 119


10.3 Exprimarea orala si propozit ii derivate
Procesul de comunicare consta din exprimarea unor propozit ii; acestea sunt folosite
n diverse scopuri. Fiecare exprimare a unei propozit ii indica o relat ie ntre vorbitor
si cont inutul propozit ional al pronunt iei.
Un prim pas n surprinderea acestor anitat i consta n extinderea formei logice.
Astfel, ecare tip principal de propozit ie are un operator atasat care ia interpretarea
propozit iei drept argument si produce ceea ce se numeste actul de suprafat a al vor-
birii. Acesta indica cum se intent ioneaza folosirea propozit iei alese n actualizarea
situat iei discursului.
Operatorii utilizat i n acest scop sunt:
ASSERT : propozit ia este de tip asert iune (enunt iativa);
Y/N-QUERY : propozit ia este interogativa;
COMMAND : propozit ia descrie o act iune care trebuie realizata;
WH-QUERY : propozit ia descrie un obiect care trebuie identicat.
Pentru propozit ii enunt iative, de tipul
Omul a mancat un mar.
forma logica completa este:
(ASSERT(<TRECUT M

ANCA> e1 [AGENT <ART UL m1 OM1>]


[TEMA <UN p1 M

AR1>]))
Pentru propozit ii interogative (cu raspuns da/nu), cum ar
A mancat omul un mar ?
forma logica completa este:
(Y/N-QUERY (<TRECUT M

ANCA> e1 [AGENT <ART UL m1 OM1>]


[TEMA <UN p1 M

AR1>]))
Pentru comenzi, cum ar
Mananca marul !
forma logica este:
(COMMAND (M

ANCA e1 [TEMA <ART UL p1 M

AR>]))
Pentru ntreb ari de tipul
Ce a mancat omul ?
trebuiesc introduse elemente noi n limbajul formal.

In primul rand este nece-
sara stabilirea unui mod de reprezentare a nt elesului expresiilor substantivale care
folosesc termeni de forma ce (what); aceasta se realizeaza prin cuanticatorul CE
care indica faptul ca termenul se refera la obiectul (sau obiectele) despre care se
ntreaba. Ca o remarca, acesti ce-termeni sunt senzitivi de domeniu, asa ca este
posibila folosirea lor pe rol de cuanticatori.
Deci pentru expresiile substantivale interogative simple avem reprezent arile:
ce? < CE p1 NIMIC >
care om? < CE m1 OM1 >
cine? < CE p1 PERSOAN

A >
120 PRELEGEREA 10. MODELE SI STRUCTURI SEMANTICE
Cu aceste denit ii, forma logica pentru propozit ia interogativa de sus este:
(WH-QUERY (<TRECUT M

ANCA> e1 [AGENT <ART UL m1 OM1>]


[TEMA <CE w1 OBIECT FIZIC>]))
Pentru expresii interogative relative la cantitate, cum ar cate sau cat de mult
se denesc cuanticatorii C

AT respectiv C

AT DE MULT.
Propozit iile derivate, cum ar clauzele relative, completeaza la sfarsit expresiile
substantivale cu restrict ii, deci nu vor necesita notat ii noi.
Exemplul 10.8 Forma logica a propozit iei
Omul care a mancat un mar a plecat.
este:
(ASSERT
(<TRECUT PLECA> k1
[AGENT <ART UL m1 (& (OM1 m1)
(<TRECUT M

ANCA1> e2
[AGENT m1]
[TEMA <UN p1 M

AR>]))>]))

In Tabelul 10.2 se aa o denit ie formala a sintaxei si limbajului pentru formele


logice discutate aici, n cazul limbii engleze.
Tabelul 10.2:
PRONUNT IE (ASSERT PROP)|
(Y/N-QUERY PROP)|
(COMMAND PROP)|
(WH-QUERY PROP)
PROP (n AR OPER PROP
1
. . . PROP
n
)|
(QUANTIF VAR: PROP PROP)|
(n AR PRED TERM
1
. . . TERM
n
)|
(EV ST PRED VAR [ROL TERM]
1
. . . [ROL TERM]
n
)
TERM VAR|
(NUME VAR NUME SIR)|
(PRO VAR PROP)
1 AR OPER NOT|PAST|PERF|PROG| . . .
2 AR OPER AND|BUT|IF THEN| . . .
QUANTIF THE|SOME|WH|| . . .
VAR b1man3| . . .
1 AR PRED TIP PRED|HAPPY 1|RED1| . . .
TIP PRED EV ST PRED|(PLURTIP PRED)|MAN1| . . .
EV ST PRED RUN1|LOV E3|GIV E1|HAPPY | . . .
2 AR PRED ROL|ABOV E| . . .
ROL AGENT|TEM

A|LA LOC|INSTR| . . .
NUME SIR John|The New York Times| . . .
Prelegerea 11
Semantica si teoria modelelor
11.1 Teoria modelelor n semantica

In general, termenul de semantica reecta reprezentarea nt elesului propozit iilor;


aceasta a fost baza limbajului bazat pe logica formala.
Mai exista ns a un nt eles al termenului de semantic a, folosit n teoria limbajelor
formale, care confera la randul lui unnt eles limbajului logicii formale. El se concen-
treaza pe distingerea diferitelor clase de obiecte semantice, explorand proprietat ile
modelului teoretic, adica denind unitat i semantice n termenii aplicat iilor din teoria
mult imilor.
Construct ia de baza pentru denirea proprietat ilor semantice este aceea de model,
care intuitiv consta dintr-o mult ime de obiecte, mpreun a cu proprietat ile si relat iile
lor, nsot ite de specicarea legaturii dintre limbajul studiat si aceste relat ii. Un
model poate gandit ca reprezentarea unui context particular n care este evaluata
o propozit ie. Se pot impune diverse restrict ii care sa reprezinte anumite proprietat i
specice unui anumit model. De exemplu, modelele standard pentru logica, numite
modele Tarskiene, sunt complete, n sensul ca ele asociaza ecarui termen din limbaj
un obiect al modelului si ecarei propozit ii o valoare de adevar (true/false). Exista
nsa diverse forme de modele part iale n care nu se impune ca orice propozit ie sa e
sau adevarata sau falsa. Astfel de modele sunt mai apropiate de situat iile descrise
n prelegerea anterioar a si ele pot baza unei teorii matematice a situat iilor, care
sa constituie un model formal.
Teoria modelelor constituie o metoda adecvat a pentru studiul nt elesului inde-
pendent de context, pentru ca nt elesul propozit iilor nu este denit n raport cu
un anumit model, ci de felul cum se leaga ele de un model abstract. Altfel spus,
nt elesul unei propozit ii este denit n termenii proprietat ilor pe care le are acesta
n raport cu un model arbitrar.
Denit ia 11.1 Se numeste model un cuplu m =< D
m
, I
m
>, unde D
m
(domeniul
de interpretare) este format dintr-o mult ime nita si nevida de primitive, iar
I
m
: S 2
Dm
este funct ia de interpretare. (S este un set de obiecte al sistemului
modelat).
Pentru a modela limbajul natural, domeniul de interpretare trebuie sa aiba
obiecte pentru toate tipurile distincte de elemente la care se poate face referire
121
122 PRELEGEREA 11. SEMANTIC

A SI TEORIA MODELELOR
(obiecte zice, timpi, locat ii, evenimente, situat ii). Funct ia de interpretare aplica
sensuri si structuri mai largi n structuri denite n domeniu.
Exemplul 11.1 Un tip de funct ie de interpretare pentru sensurile urmatoarelor
clase lexicale, poate :
Sensuri ale expresiilor substantivale - se refera la obiecte specicate; funct ia
de interpretare asociaza ecaruia cate un element din D
m
.
Sensuri ale substantivelor comune la singular (cum ar caine, petrecere,
idee) - identica clase de obiecte din domeniu; funct ia de interpretare le
aplica n submult imi din D
m
.
Sensuri ale verbelor - identica mult imi de relat ii n-are ntre obiecte din D
m
.
Aritatea ecarei relat ii depinde de verb. De exemplu, pentru verbul a alerga,
ALERGA1 are valori ntr-un set de relat ii unare (< X > unde X alearga);
pentru a iubi, IUBESTE1 are valori ntr-un set de aplicat ii binare (< X, Y >
unde X iubeste Y ); pentru a pune, PUNE1 are valori ntr-un set de relat ii
ternare (< X, Y, Z >, unde X pune Y n locat ia Z).
Se poate deni acum not iunea de adevar a unei propozit ii (reprezentate n lim-
bajul logicii formale) relativ la un model m.
Denit ia 11.2 O propozit ie de forma (V
n
a
1
a
2
. . . a
n
) este adevarata n raport cu
modelul m daca si numai daca < Im(a
1
), . . . , Im(a
n
) > Im(V
n
).

In notat ie clasica, aceasta se scrie


m P
si semnica faptul ca propozit ia P este adevarat a n raport cu modelul m.
Relat ia se mai citeste m este suport pentru P.
Exemplul 11.2 m este suport pentru (ALERGA1 PAUL1) numai daca
< I
m
(PAUL1) > I
m
(ALERGA1);
m este suport pentru (IUBESTE1 RADU1 MARIA1) numai daca
< I
m
(RADU1), I
m
(MARIA1) > I
m
(IUBESTE1).
Semantica pentru negat ie depinde de proprietat ile modelelor folosite.

In seman-
ticile clasice Tarskiene (unde modelele sunt complete) negat ia este denita prin
armat ia:
m este suport pentru (NOT P) daca si numai daca m nu este suport pentru P.

In alte modele, condit ia aceasta este prea tare, deoarece pot apare propozit ii care
sa nu e nici adevarate si nici false. Problema se rezolva denind cate doua mult imi
disjuncte pentru ecare nume de relat ie; ecare din ele cont ine secvent e pentru care
relat ia este adevarat a respectiv falsa. Orice secvent a care nu se aa n nici una din
cele doua mult imi va nici adevarat a si nici falsa.
Semanticile cuanticatorilor din FOPC sunt banale. Astfel,
11.1. TEORIA MODELELOR

IN SEMANTIC

A 123
Propozit ia x.P(x) este adevarat a n raport cu un model m daca si numai
daca P(x) este adevarat a pentru orice valoare a lui x din D
m
.
Propozit ia x.P(x) este adevarat a n raport cu un model m daca si numai
daca P(x) este adevarat a pentru cel put in o valoare a lui x D
m
.
Pentru limbajele naturale, clasa cuanticatorilor este mult mai larga. Condit iile
de adevar pentru ecare astfel de cuanticator specica relat ia ceruta ntre obiectele
care satisfac cele doua asert iuni de sus.
Exemplul 11.3 Sa consideram propozit ia (reprezentata n forma logica):
(MAJORITATEA1 x (P x)(Q x)).
Ea poate denita ca adevarata n raport cu un model m daca si numai daca
mai mult de jumatate din obiectele din Im(P) sunt n Im(Q).

In particular
(MAJORITATEA1 x (C

AINE1 x)(MUSCA1 x))


va adevarata n raport cu un model m daca si numai daca mai mult de jumatate
din elementele mult imii {x|(C

AINE x)} sunt de asemenea n mult imea {y|(MUSCA1


y)}, adica mai mult de jumatate din cainii din m musca.
11.1.1 Denirea relat iilor semantice pentru propozit ii
Pe baza semanticii astfel denite, se pot stabili relat ii ntre propozit ii. Anume, daca
se stie ca o propozit ie este adevarat a, se poate deduce ca si alte propozit ii sunt
adevarate.
Exemplul 11.4 Daca se stie ca:
O cutie rosie este pe masa.
atunci se stie de asemenea ca:
O cutie este pe masa.
O astfel de relat ie ntre propozit ii se numeste relat ie de necesitate. Referitor la
Exemplul 11.4, spunem ca propozit ia
O cutie rosie este pe masa.
necesita propozit ia
O cutie este pe masa.
Relat ia de necesitate poate denita n termenii modelului care este suport al
propozit iei.
Denit ia 11.3 Propozit ia S necesita propozit ia S

daca si numai daca pentru orice


model m:
m S = m S

.
Invers, daca nu exista nici un model suport simultan pentru S si S

, atunci cele
doua propozit ii nu pot adevarate n acelasi timp (indiferent de situat ie).
Spunem ca cele doua propozit ii sunt contradictorii.
124 PRELEGEREA 11. SEMANTIC

A SI TEORIA MODELELOR
Exemplul 11.5 Propozit iile
O cutie rosie este pe masa.
Pe masa nu este nici o cutie.
sunt contradictorii, pentru ca nu exista nici un model care sa e suport simultan
pentru ambele propozit ii.
Limbajele naturale lucreaza de obicei cu o relat ie mai slaba decat cea de necesi-
tate, anume implicat ia.
Denit ia 11.4 O propozit ie S implica S

daca ori de cate ori S este adevarata, S

poate adevarata.
Exemplul 11.6 Propozit ia
Am obosit sa merg la facultate n ecare zi.
implica
Nu mai merg la facultate.
dar nu o necesita. Daca spunem
Am obosit sa merg la facultate n ecare zi.
O mai fac nca !
va exista un model care sa le asigneze ambelor propozit ii valoarea de adevar;
ntr-un astfel de model, propozit ia
Nu mai merg la facultate.
este falsa.
Una din cele mai dicile probleme n nt elegerea limbajului natural rezulta din
faptul ca inferent ele folosite sunt mai mult implicat ii decat necesitat i; deci concluziile
care se trag la un moment pot ulterior reconsiderate si modicate.
11.1.2 Operatori modali si semantici ale universurilor posi-
bile
Pentru denirea unei semantici care sa utilizeze operatorii modali, trebuiesc intro-
duse structuri noi pe modele.

In particular, adevarul unei proprietat i va denit
n raport cu o mult ime de cel put in doua modele. Aceasta mult ime poate avea o
structura specica - numita de obicei structura de model.
Ca un exemplu, sa consideram operatorul TRECUT si sa presupunem ca ecare
model individual m reprezint a starea universului ntr-un anumit punct n timp.
Atunci o structura de model va mult imea modelelor care descriu o istorie posibila
a universului, n care modelele sunt legate unul de altul prin operatorul <, unde
m
1
< m
2
semnica faptul ca m
1
descrie o stare a universului anterioara starii des-
crise de m
2
. Adevarul unei propozit ii este acum denit n raport cu o structura de
model arbitrara care are ntre modele sale relat ia de ordine <.

In particular, putem deni acum o semantica pentru expresia (TRECUT P) n


raport cu un model m din structura de model astfel:
11.2. UN MODEL TEORETIC DE SEMANTIC

A 125
m

(TRECUT P) m

[m

< m, m

P].
Altfel spus, (TRECUT P) este adevarat ntr-un model m daca si numai daca
exista un alt model n structura care descrie un timp anterior lui m, n care P este
adevarat a.
Acest tip de analiza este numit semantica universurilor posibile.
11.2 Un model teoretic de semantica
Sa consideram o submult ime a FOPC formata numai din propozit ii si conectori
logici (fara termeni, variabile sau cuanticatori - a se vedea Anexa 1); ea este nu-
mita uzual calcul propozit ional. Un model pentru calculul propozit ional va asigna
ecarei formule (propozit ionale) una din valorile T (adevar) sau F (fals). Construct ia
este facut a denind aceste aplicat ii pentru propozit iile simple (atomice) si apoi rea-
lizand pe baza unor formule de calcul, valorile de adevar pentru propozit ii compuse
(construite cu ajutorul operatorilor logici). Ipoteza de baza folosita este aceea ca
nt elesul operatorilor logici poate denit numai n funct ie de valorile de adevar ale
argumentelor, independent de valoarea noii propozit ii.
Cei mai cunoscut i operatori logici folosit i n calculul propozit ional sunt:
Tabelul 11.1:
p q p p&q p q p q p q p q
T T F T T T T T
T F F F T F F F
F T T F T T F T
F F T F F T T T
Formal, modelul semantic bazat pe calculul propozit ional este denit folosind o
funct ie V numita funct ie de valuare, care asociaza ecarei propozit ii o valoare de
adevar din mult imea {T, F}.
Astfel, ind data o logica cont inand o singura propozit ie P, se pot deni pentru
ea doua modele, prin doua funct ii de valuare V
1
, V
2
cu V
1
(P) = T, V
2
(P) = F.

In general, pentru o logica cu n propozit ii se pot deni 2


n
funct ii de valuare
posibile, deci 2
n
modele pentru logica respectiva.
Orice funct ie de valuare V
m
are urmatoarele proprietat i deduse din Tabelul 11.1,
care conduc la un calcul recursiv al funct iei pentru propozit ii compuse, plecand de
la propozit ii atomice:
Pentru orice propozit ii , :
1. V
m
(&) = V
m
()&V
m
()
2. V
m
() = V
m
()
3. V
m
( ) = V
m
() V
m
()
126 PRELEGEREA 11. SEMANTIC

A SI TEORIA MODELELOR
4. V
m
( ) = V
m
() V
m
()
5. V
m
( ) = V
m
() V
m
()
Semnul egal (=) s-a pus ntre doua expresii care pentru acelasi set de valori asignat
variabilelor, conduc la acelasi rezultat.

In acest fel, ind dat un model (adica o funct ie de valuare) se poate determina
valoarea de adevar a oricarei formule n calculul propozit ional careia i apart ine
formula respectiva.
11.2.1 Logica folosita ca un model de gandire
Un prim motiv de folosire a FOPC este acela ca el asigura o formulare precisa a
not iunilor de inferent a si argument valid (pentru precizari facem din nou trimitere
la Anexa 1).
Exemplul 11.7 Sa plecam de la urmatorul exemplu de argumentat ie:
Tot i cainii iubesc copiii.
Grivei este un caine.
Deci Grivei iubeste copiii.
Acest rat ionament poate formalizat n FOPC printr-o forma de inferent a, (re-
gula modus-ponens) astfel:
x.D(x) LB(x) S-a notat cu D un predicat adevarat numai pentru caini,
D(GRIV EI1) iar cu LB un predicat adevarat numai pentru obiectele
LB(GRIV EI1) care iubesc copiii.

In practica, regulile de inferent a nu sunt specice unui anumit predicat; ele sunt
exprimate folosind scheme n care propozit iile sunt notate cu p, q, r, s, termenii cu
a, b, c, d iar variabilele logice cu x, y, z.

In acest mod se poate rescrie n general
orice regula de inferent a.
Exemplul 11.8
p q
p x.px
q pa
Modus ponens Regula universal-particular
Mai multe reguli de inferent a pot combinate pentru a trage concluzii; aceasta
maniera de lucru se numeste demonstrat ie. O demonstrat ie consta dintr-un set de
premise si o secvent a de formule, ecare din ele obt inut a din formulele precedente
si din premise, folosind o anumit a regula de inferent a.

In general, pentru orice operator logic sunt denite apriori doua reguli de inferen-
t a specice: regula de eliminare si regula de introducere.
Regula de introducere pleaca de la una sau mai multe premise care nu cont in
operatorul si ajunge la o concluzie n care operatorul este prezent.
Regula de eliminare ia ca premisa o formula care cont ine operatorul si ajunge la
o concluzie n care acest operator nu mai apare.
11.2. UN MODEL TEORETIC DE SEMANTIC

A 127
Tabelul 11.2:
Regula de introducere & Regula de eliminare &
p p&q p&q
q p q
p&q
Regula de introducere Regula de introducere
p pa
p q x.Px
Regula de introducere Regula de eliminare
p p
verica q& q p
p
Ultima regula (de introducere a negat iei) necesita cateva precizari. Ea foloseste o
contradict ie; aceasta apare daca exista o formula P pentru care se demonstreaza ca
P&P este adevarat a. Intuitiv, demonstrat ia foloseste reducerea la absurd: pentru
a arata p, se presupune p adevarat a si se arata ca se ajunge la o contradict ie.
Fiind dat un set de reguli de inferent a, exista formule care se pot verica far a nici
o premisa. Acestea se numesc tautologii si reecta proprietat i intriseci ale logicii.
Exemplul 11.9
p p (legea tert iului exclus)
(p&q) p q
(p q) p&q (legile lui De Morgan)
11.2.2 Relat ia dintre logica si semantica
Pentru a putea folosita, o regula de inferent a trebuie sa e n primul rand general
valabila, adica sa e adevarata n toate modelele posibile.
Exemplul 11.10 Sa consideram regula modus ponens (care poate privita si ca o
regula de eliminare a implicat iei):
p q
p
q
Parametrii p si q iau valori din mult imea propozit iilor; vom considera valorile lor
de adevar. Pentru a arata ca aceasta regula de inferent a este general valabila, trebuie
vericat ca n orice model n care premisele sunt adevarate, concluzia trebuie sa e
de asemenea adevarata. Conform Tabelului 11.1, p q, p sunt simultan adevarate
128 PRELEGEREA 11. SEMANTIC

A SI TEORIA MODELELOR
numai n modelul 1; aici, q este de asemenea adevarata. Deci regula este general
valabila, cel put in n logica cu doua propozit ii.
Se stie ca un set de formule este consistent daca exista un model care asigneaza
ecarei formule din mult ime valoarea T. Spunem ca un astfel de model satisface
setul de formule.
Exemplul 11.11 Setul de formule {P, P Q, Q} este consistent, deoarece mod-
elul 3 din Tabelul 11.1 ataseaza ecarei formule valoarea T.

In schimb se poate arata
ca setul de formule {P (Q&R), P, Q} nu este consistent, deoarece nu exista
nici un model care sa le asocieze simultan valoarea T.

In acesti termeni se poate deni not iunea de tautologie.


Denit ia 11.5 O formula f este o tautologie daca n orice model i se asigneaza
valoarea T.
Se poate arata imediat ca formulele date n Exemplul 11.9 veric a denit ia tau-
tologiei.
Se poate da acum denit ia formala a doua relat ii sugerate n paragrafele ante-
rioare:
suport:
Denit ia 11.6 S este suport pentru P (S P) daca si numai daca P ia
valoarea T n toate modelele care satisfac S.
demonstrabil:
Denit ia 11.7 P poate demonstrat din S (S |= P) daca si numai daca
exista o demonstrat ie a lui P avand ca singura premisa pe S.
Problema nala care se pune este urmatoarea:
Fiind dat un set de reguli de inferent a, este el sucient pentru a demonstra toate
formulele ?

In termenii de sus, aceasta revine la a spune:


Daca S P atunci S |= P.
Un astfel de sistem de reguli se numeste complet.
11.2.3 O semantica pentru FOPC
Pentru a asocia o semantic a la calculul predicatelor de ordinul I, va trebui sa ex-
tindem not iunea de expresie. Astfel, termenii n FOPC nu vor reprezenta valori de
adevar ci obiecte zice, evenimente, locat ii etc. Toate vor considerate ca ind
elemente ale unui domeniu unic general, notat cu .
11.2. UN MODEL TEORETIC DE SEMANTIC

A 129

In calculul propozit ional (care era un subset al FOPC), funct ia de valuare aso-
cia simbolurilor propozit ionale valorile T, F.

In FOPC propozit iile au ele nsele o
structura, iar funct ia de valuare trebuie sa deneasca interpretarea constantelor,
funct iilor si numelor de predicate.

In particular, funct ia de valuare aplica ecare
termen ntr-un anumit element din domeniu.
Pentru a urmari mai usor datele, sa consideram domeniul = {, , } si sa luam
un model n care funct ia de valuare V
1
este denita pentru trei termeni A1, B1, C1
astfel:
V
1
(A1) = , V
1
(B1) = , V
1
(C1) = .
Funct ia de valuare asociaza de asemenea numelor de predicate diverse tipuri de
mult imi, n funct ie de num arul de argumente. Sa consideram n prima faza numai
predicate unare (cum ar ROSU) care merg ntr-o submult ime a lui (adica acele
obiecte care au proprietatea de a rosii).
De exemplu, sa presupunem ca modelul deneste predicatul ROSU prin mult imea
{, } : V
1
(ROSU) = {, }.
Valoarea de adevar a propozit iilor simple construite dintr-un nume de predicat
unar si un argument poate acum denita prin:
V
1
(P(a)) =

T daca V
1
(a) V
1
(P),
F altfel.
(s-a notat cu P un predicat unar iar cu a un termen arbitrar).
Tabelul 11.3:
Model A1 B1 C1 ROSU ROSU(A1) ROSU(B1) ROSU(C1)
1. {} T F F
2. {} T T F
3. {} T F F
4. {, } T T T
5. {, } T T F
6. {, } F F F
7. {, } F F T
Fiind date denit ia lui V
1
si regula care stabileste valoarea de adevar a propozi-
t iilor construite cu nume de predicate unare, se observa usor ca:
V
1
(P(A1)) = T, V
1
(P(B1)) = F, V
1
(P(C1)) = F
Ca si n cazul propozit ional, se pot construi tabele de adevar pentru toate mode-
lele posibile. Tabelul 11.3 listeaza numai cateva modele pentru logica cu trei cons-
tante si numele de predicat unar ROSU; un tabel complet ar avea 216 linii.

In cazul predicatelor de aritate n, valorile funct iei de valuare sunt luate ntr-o
mult ime de vectori cu n componente. Regula de calcul este:
V (P(a
1
, . . . , a
n
)) =

T daca (V (a
1
), . . . , V (a
n
)) V (P),
F altfel.
130 PRELEGEREA 11. SEMANTIC

A SI TEORIA MODELELOR
Exemplul 11.12 Luand predicatul binar Iubeste, el poate denit n modelul 1,
n ipoteza ca iubeste si iubeste : V
1
(Iubeste)= {, }.
Acum se pot deni valorile de adevar ale diverselor formule n acest model:
V
1
(Iubeste(A1,B1))=F,
V
1
(Iubeste(B1,A1))=T,
V
1
(Iubeste(A1,C1))=T.
Regulile de denire a operatorilor logici sunt identice cu cele de la calculul
propozit ional. Deci se pot calcula valorile de adevar pentru diverse formule mai
complicate; de exemplu, conform asignarilor date mai sus:
(Rosu(A1) Iubeste(A1,B1))=F.
11.3 Semantici pentru cuanticatori
Pentru a deni semantici ale formulelor care cont in variabile cuanticate, trebuie sa
existe posibilitatea de a face substitut ii ale variabilelor n formule. Pentru aceasta,
denim V
i{x/}
ca o extensie a funct iei de valuare, care este similara funct iei V
i
,
numai ca deneste evaluarea variabilei x n domeniul dat de constanta .
Exemplul 11.13 Pentru funct ia de valuare V
1
denita n sect iunea anterioara,
V
1{x/}
(x) = , V
1{x/}
(Rosu) = V
1
(Rosu) = {}.
Deci V
1{x/}
(Rosu(x)) = T deoarece V
1{x/}
(x) V
1{x/}
(Rosu).

In aceste condit ii, o semantic a a formulelor care cont in cuanticatori este denita
de urmatoarele condit ii:
V
m
(x.P) = T daca pentru orice , V
m{x/}
(P) = T
V
m
(x.P) = T daca exista cel put in un astfel nc at V
m{x/}
(P) = T.
Toate denit iile precedente de suport, demonstrabilitate, completitudine etc. pot
considerate fara modicari si n cazul semanticilor pentru FOPC.

In particular, se
poate arata ca un set de formule este consistent construind un model n care toate
formulele iau valoarea adevar.
Exemplul 11.14 Sa luam setul de formule
{x.Q(x) R(x), Q(A1), Q(B1), Q(C1)}
Pentru a arata ca este consistent, denim un model astfel:
Fie = {, , } unde V (A1) = , V (B1) = , V (C1) = .
Sa luam V (Q) = {, }, V (R) = .
Se verica usor ca n acest model, toate formulele din setul ales iau valoarea T.
Prelegerea 12
Reprezentarea universului
cunoasterii
12.1 Reprezentarea cunostint elor
Exista doua forme de cunoastere, cruciale n orice sistem de reprezentare a cunos-
tint elor: cunoasterea generala a universului si cunoasterea specica a situat iei curen-
te.
Anumite aspecte ale cunoasterii universului au fost deja considerate si introduse
n ierarhia tipurilor, n relat iile dintre ele, n structurile sintactice si semantice ale
limbii etc. Este vorba de informat ii privind restrict ii generale ale universului denite
n termenii limbajului.

In majoritatea lor, elementele de cunoastere generala sunt
specicate n caracteristicile tipurilor de obiecte din univers; nu este necesara o
specicare individuala a ecarui element.
Aceasta cunoastere generala este esent iala pentru a rezolva probleme de inter-
pretare din multe limbaje; una din ele este ambiguitatea de exprimare.
Exemplul 12.1 Modul de atasare a PP nale din urmatoarele doua propozit ii de-
pinde numai de nivelul de cunostint e al cititorului n domeniul respectiv:
Am urmarit evolut ia 10 minute.
Am urmarit evolut ia zece milioane de ani.
Cunoasterea specica este important a n multe situat ii, cum ar de exemplu
determinarea persoanei la care se refera construct iile substantivale, sau eliminarea
sensurilor ambigui ale cuvintelor bazate pe situat ia curenta.
Denit ia 12.1 O reprezentare a cunostint elor consta dintr-o baza de date de propo-
zit ii numita baza de cunostint e (KB) si un set de tehnici de inferent a folosite pentru
a deduce noi propozit ii plecand de la KB curent.
Un set de tehnici de inferent a este rezonant daca genereaza numai propozit ii
adevarate cand toate propozit iile din KB sunt adevarate.
Dupa cum vom vedea, aceasta condit ie de rezonant a nu este o condit ie necesara.
Limbajul n care sunt denite propozit iile din KB este numit limbajul de repre-
zentare a cunostint elor (KRL). Acesta poate acelasi cu cel folosit la limbajul formei
logice, dar este preferabila diferent ierea lor.
131
132 PRELEGEREA 12. REPREZENTAREA UNIVERSULUI CUNOASTERII
Sa consideram de exemplu tratarea cuanticatorilor.

In limbajul formei logice au
fost denit i un num ar mare de cuanticatori, lucru motivat de numeroasele sensuri
oferite de limbajul natural.

In multe limbaje de reprezentare de cunostint e sunt
denit i uzual un num ar mult mai mic - si practic folosit numai unul: o construct ie
asociata cuanticatorului universal.
De aceea se recomanda folosirea a doua limbaje de reprezentare separate si uti-
lizarea unor funct ii pentru a face legatura ntre ele.
Cand o formul a P trebuie sa e adevarata pe baza formulelor din KB sau a
formulelor care reprezint a nt elesul unei propozit ii date, spunem ca KB (respectiv
propozit ia) suporta P. Multe concluzii necesare n nt elegerea limbajului nu sunt
bazate pe suporturi, dar sunt totusi implicat ii ale propozit iei.
Denit ia 12.2 Implicat iile sunt concluzii tipice trase dintr-o propozit ie, care pot
inrmate n anumite circumstant e.
Exemplul 12.2 Propozit ia
Matei are doua masini.
suporta faptul ca
Matei are masina.
(acesta nu poate negat) si implica faptul ca
Matei nu are trei masini.
Aceasta ultima observat ie poate negata daca discut ia continua cu
De fapt el are trei.
Sistemele KR trebuie sa accepte ambele forme de inferent a.
12.1.1 Tipuri de inferent a
Tehnicile de inferent a se mpart n forme deductive si nedeductive. Formele deductive
de inferent a sunt justicate de notat ia logica a suportului. Fiind dat un set de fapte,
un proces de inferent a deductiva va genera concluzii care se desprind logic din acele
fapte.
Inferent a nedeductiva se mparte n mai multe clase. Astfel, avem deducerea
elementelor generale plecand de la exemple (inferent a inductiva), sau a cauzelor
studiind efectele (inferent a abductiva).
Inferent a inductiva - de exemplu - reprezint a modul principal de lucrun prezen-
tarea procedeelor lingvistice din prelucrarea limbajului natural.
Inferent a abductiva lucreaza de obicei invers fat a de cea deductiva; pentru
exemplicare, sa consideram axioma
A B
Inferent a deductiva va folosi aceasta axioma pentru a deni B atunci cand se da A.
Inferent a abductiva este folosita pentru a construi A atunci cand se da B, deoarece
A este o rat iune pentru ca B sa e adevarat a.
Multe sisteme permit folosirea informat iei incomplete.
12.1. REPREZENTAREA CUNOSTINT ELOR 133
Denit ia 12.3 O regula incompleta este o regula de inferent a care poate excep-
tata.
Sa notam folosirea informat iei incomplete prin =. Atunci o regula de inferent a
incompleta va lucra astfel:
Daca A =B, A este adevarata si B nu este demonstrabila, atunci se
poate deduce B.
Exemplul 12.3 Propozit ia
Pasarile zboara.
poate reprezentata n FOPC prin
xPAS

ARE(x) =ZBOAR

A(x)
Aceasta are ca efect faptul ca ori de cate ori exista o pasare B pentru care nu
este demonstrabil ca ZBOAR

A(B), atunci se poate presupune ca ZBOAR

A(B).
Cu alte cuvinte, despre o anumita pasare se poate spune ca este capabila sa zboare
numai daca nu s-a armat explicit ca nu poate face acest lucru. De exemplu, strut ul
este ment ionat separat ca o pasare care nu zboara.
Regulile incomplete introduc un nou set de complexitat i n reprezentare. Fara
astfel de reguli, majoritatea reprezentarilor sunt monotone, deoarece prin adaugarea
de noi armat ii creste doar num arul de formule suportate. Formal,
Denit ia 12.4 O reprezentare este monotona daca verica urmatoarea condit ie:
Daca baza sa de cunostint e - KB - suporta o concluzie C si la KB se adauga o
formula noua construind o baza consistenta KB

, atunci KB

va suporta de aseme-
nea C.
Acest lucru nu este adevarat ntr-o reprezentare care foloseste reguli incomplete.
Astfel de reprezent ari se numesc nemonotone.
Exemplul 12.4 Sa consideram baza de cunostint e K alcatuita din formulele:
Pisica (Puy) Puy este o pisica.
Siamez(Pisica (Puy)) Puy este o pisica siameza.
c.Pisica(c) =Toarce(c) Pisicile torc.
De aici, folosind informat ia incompleta se poate deduce Toarce(Puy), pentru
ca nu exista nici o informat ie care sa contrazica noua armat ie. Dar daca se adauga
o noua formula care spune ca nici o pisica siameza nu toarce, atunci noua baza de
cunostint e nu va mai suporta faptul ca Puy toarce.
Concluziile nemonotone nu sunt specice informat iilor incomplete; exista si alte
tehnici de introducere a lor. Astfel, n ipoteza universului minim (CWA - Closest
World Assumption) se poate ret ine informat ie incompleta despre anumite predicate.
Atunci,
despre un predicat P pentru care CWA este valabila, daca o propozit ie folosind
P nu poate demonstrata ntr-o KB, atunci negat ia ei este presupusa corecta.
134 PRELEGEREA 12. REPREZENTAREA UNIVERSULUI CUNOASTERII
Exemplul 12.5 Sa consideram o baza de date pentru programul zborurilor unei
companii de avioane.
KB stocheaza informat ia care exista despre zboruri - de exemplu:
FDG100 zboara de la Roma la Paris.
dar nu cont ine explicit nici o informat ie negativa - cum ar
FDG100 nu zboara la Londra.
sau
Nu exista nici un zbor FDG231.
Astfel de informat ii pot doar deduse daca procesul de inferent a lucreaza n
ipoteza universului minim despre zboruri.
Se poate dezvolta un model de semantica teoretica pentru logici nemonotone
folosind conceptul de model minimal. Sa consideram de exemplu ipoteza universului
minimal pentru un predicat P. Se poate deni atunci o ordonare totala pe modelele
lui KB astfel:
m
1
<
P
m
2
I
m
1
(P) I
m
2
(P)
Deci, un model m
1
este mai mic decat un model m
2
n raport cu un predicat P
daca si numai daca mult imea obiectelor x pentru care P(x) este adevarat a n m
1
este o submult ime a mult imii obiectelor x cu P(x) adevarata n m
2
.
Odata denita aceasta ordonare, modelul minimal n raport cu P consta din
mult imea
{m| m model m

<
P
m}.
O alta modalitate de a formaliza ipoteza universului minim este de a adauga o
axioma la KB care sa nchida suportul. Ea este numit a axioma de completare.
Exemplul 12.6 Sa consideram un KB cont inand propozit iile
{P(A), P(B), Q(C), Q(A) }.
Atunci axioma de completare pentru P este
x.P(x) (x = A x = B).
Ea spune ca P este adevarata numai pentru valorile A sau B ale argumentului.
Se poate arata ca mult imea modelelor, extinsa cu aceasta axioma axioma de com-
pletare, coincide cu mult imea modelelor minimale (n raport cu P) a KB init ial.
12.1.2 Tehnici de inferent a

In sistemele de reprezentare a cunostint elor exista doua clase mari de tehnici de


inferent a: procedurale si declarative. Majoritatea sistemelor combin a aceste tehnici
acoperind o paleta larga de variante, de la sistemele pur declarative la cele pur
procedurale.
Primele sunt bazate pe demonstrarea automata. KB este reprezentat printr-
un sistem de axiome, iar inferent a este realizata folosind un algoritm deductiv de
demonstrare automata a teoremelor. Accentul cade aici pe asignarea unei semantici
formale expresiilor, independent de componenta inferent a.
12.1. REPREZENTAREA CUNOSTINT ELOR 135
Figura 12.1:

FIINT

A
OBIECT
6
-
-
ACTIUNE
OBIECT/ACTIUNE
AGENT
s
TEMA
Sistemele pur procedurale pe de alta parte folosesc aspectele inferent iale ale
reprezent arii; expresiile ntr-o KB pot sa nu aiba nici un nt eles independent de
manipularea lor n program.
Ca un exemplu putem da un sistem care foloseste procedurile aritmetice proprii
calculatorului pentru a evalua expresiile aritmetice, fara nici o reprezentare explicita
a cunostint elor despre matematica (de pilda, axiomele lui Peano).
Adesea eciente, aceste tehnici sunt greu de analizat din cauza lipsei formalis-
mului specic aplicat iei.
Exemplul 12.7

In prelegerile anterioare s-a introdus not iunea de ret ele seman-
tice. Procesul lor de inferent a poate realizat procedural sau declarativ. O modali-
tate pur declarativa va modela ecare fapt despre subtipuri si roluri ca o axioma,
iar proprietat ile de dependent a vor rezulta din inferent a standard deductiva. Ast-
fel, pentru ret eaua din Figura 12.1, informat ia poate reprezentata prin axiomele
(scrise n FOPC):
1. x.ACTIUNE(x) a.AGENT(x, a)&FIINT

A(a)
2. ax.ACTIUNE(x)&AGENT(x, a) FIINT

A(a)
3. x.OBIECT/ACTIUNE(x) ACTIUNE(x)
4. x.OBIECT/ACTIUNE(x) o.TEMA(x, o)&OBIECT(o)
5. ox.OBIECT/ACTIUNE(x)&TEMA(x, o) OBIECT(o)
Folosind aceste axiome, se poate demonstra ca rolul AGENT este mostenit de
clasa OBIECT/ACTIUNE. Altfel spus, pentru orice obiect A astfel ncat
OBIECT/ACTIUNE(A) este adevarat, se poate demonstra ca A are rolul agent;
deci, folosind axiomele 3 si 1,
a.AGENT(A, a)&FIINT

A(a).
O versiune procedurala a acestei construct ii va un program care pleaca de la un
nod OBIECT/ACTIUNE precizat, aa toate rolurile atasate lui, apoi traverseaza ar-
cul s pana la supertipul ACTIUNE si aa toate rolurile atasate aici. Raspunsul este
dat de mult imea totala de roluri colectate de aceasta procedura. Deci, n particular,
orice OBIECT/ACTIUNE are un rol AGENT mostenit de la clasa ACTIUNE.
136 PRELEGEREA 12. REPREZENTAREA UNIVERSULUI CUNOASTERII
12.2 O reprezentare bazata pe FOPC
Plecand de la FOPC se deneste un KRL care este o extensie pentru a cuprinde si
informat iile specice reprezent arii cunostint elor.
Termenii limbajului sunt constante (exemplu Ion), funct ii (exemplu tata (Ion))
si variabile (x, y, . . .). De remarcat - ca o diferent a - ca limbajul formei logice nu
avea denite constante; aici (n KB) constantele sunt folosite pentru a reprezenta
singularitat i specice.
De exemplu, termenul din forma logica (NUME j1 Ion) reprezinta nt elesul
unei armat ii referitoare la Ion. Persoana prezent a la care se face referire ntr-un
context dat poate reprezentata n KB de constanta Ion.
Similar notat iei domeniului cuanticatorilor generalizat i din limbajul formei logi-
ce, se procedeaza si n KRL: restrict ia domeniului se noteaza prin variabila cuanti-
cata, urmata de

:

.
Exemplul 12.8
x : Om(x) Fericit(x) este echivalent cu x.Om(x)&Fericit(x)
x : Om(x) Fericit(x) este echivalent cu x.Om(x) Fericit(x)
Aici este necesar si predicatul egalitate (a = b), care semnica faptul ca termenii
a si b au aceeasi notat ie.
Fiind data o propozit ie simpla P
a
care foloseste constanta a, daca P
a
este
adevarata si a = b, atunci P
b
trebuie sa e adevarata.
Multe sisteme de reprezentare a cunostint elor nu folosesc explicit cuanticatori.
Ele pot introduce totusi variabile, care act ioneaza ca variabile cuanticate universal
cu domeniul vid.
Exemplul 12.9 Formula
(P ?x A)
scrisa n KB corespunde ca nt eles formulei din FOPC
x.P(x, A).
Variabilele cuanticate existent ial sunt prelucrate cu o tehnica numit a skolemi-
zare care nlocuieste variabila cu o constant a noua, nedenita anterior.
Exemplul 12.10 Formula
yx.P(x, y)
va codicata n KB n formula
(P ?x Sk1)
unde Sk1 este o constanta noua, neutilizata anterior, xata pentru obiectul despre
care se stie ca exista.
12.2. O REPREZENTARE BAZAT

A PE FOPC 137
Dependent ele de domeniu ale cuanticatorilor sunt indicate folosind funct ii noi,
numite funct ii Skolem. De exemplu, formula
yx.P(x, y)
va codicata n KB n formula
(P (Sk2 ?y) ?y)
unde Sk2 este o funct ie noua, care produce un obiect (eventual) distinct pentru
ecare valoare a lui ?y.
Formulele vor reprezentate adesea n formate care combina ambele modalitat i
de scriere: cuanticatorii universali sunt scrisi explicit, iar variabilele existent iale
sunt skolemizate.
Exemplul 12.11 Formula
yx.P(x, y)
poate scrisa si
y P (Sk1(y), y).
De fapt, dupa cum se vede, toate aceste forme de scriere sunt echivalente.
Stilul prezent arii n denirea limbajului nu are nici o restrict ie (n afara de aceea
de a conforma cu notat ia FOPC).

In particular, nu se poate spune nimic despre
forma predicatelor. Exista o plaja exprem de larga de select ie. La o extrema se pot
deni predicate diferite pentru ecare sens al cuvantului (strategia fundamental a
folosita n limbajul formei logice). La cealalta extrema, se poate folosi un set pre-
denit de predicate numite primitive, si sensurile cuvintelor vor scrise n termenii
acestor primitive.
Fiecare modalitate are avantajele si dezavantajele sale. De obicei ele sunt com-
binate folosind tehnica ierarhiei tipurilor.
De multe ori, o reprezentare a cunostint elor trebuie sa extraga informat ie din
modalitat i diverse de denire a sensurilor cuvintelor.
Uneori se stie o denire completa a unui termen. De exemplu, se poate deni
predicatul tata ca parinte mascul, adica
x.TAT

A(x) y P

ARINTE(x, y)&MASCUL(x)
Majoritatea cuvintelor nu sunt nsa denite asa de precis. Astfel, nu exista nici
un set de proprietat i care sa deneasca precis not iuni uzuale cum ar caine, pisica,
scaun etc. Ele pot clasicate n ierarhii de tipuri, ecare nsot it a de axiomele
aferente; dar nici o denit ie precisa nu poate data. Privite ca axiome n FOPC,
ele vor folosi doar implicat ii.
Exemplul 12.12 O axioma pentru C

AINE1 poate
x.C

AINE(x) CANIN(x)&ANIMAL DOMESTIC(x)


unde CANIN va denit la randul lui ca un tip de MAMIFER s.a.m.d.
138 PRELEGEREA 12. REPREZENTAREA UNIVERSULUI CUNOASTERII
Astfel de axiome stabilesc multe proprietat i esent iale pe care trebuie sa le aiba un
obiect ca sa e recunoscut drept caine, dar conceptul nu se poate deni complet.
De exemplu, cineva poate creste un pui de lup, care are toate proprietat ile unui
caine, dar nu este caine.
Din punct de vedere al propozit iilor generate, majoritatea predicatelor din limba-
jul de reprezentare sunt abstractizari ale cuvintelor limbajului natural. Dicultatea
apare la generarea de propozit ii bazate pe un anumit nt eles.
De exemplu, sa presupunem ca avem formula:
p.((Mascul Om p)&c.Parinte(p, c)).
Merge Cu Masina(p, L1)&Cladire(L1)& Destinata nvat arii(L1)
care are o realizare naturala prin propozit ia
Tot ii tat ii sofeaza spre scoala.
Pentru a genera o astfel de armat ie, sistemul trebuie sa e capabil sa interpreteze
formula
p.((Mascul Om p)& c.Parinte(p, c))
sub forma
int a umana de genul masculin care are un copil,
sa considere propozit ia
Merge Cu Masina (p, L1)& Cladire (L1)& Destinata nvat arii (L1)
care literar se poate trata drept
se deplaseaza cu masina spre o cladire folosita pentru nvat atura,
si apoi sa le comprime n propozit ia data anterior.
Evident, aceasta nseamn a un volum substant ial de cunostint e despre nt elesul
unor cuvinte specice cum ar tata sau sofeaza si un proces complicat de combinare
a formulelorn KRL. Daca nu exista predicate corespunzatoare acestor semnicat ii n
KRL, procesul devine foarte complicat. Daca ns a exista predicate pentru cuvintele
solicitate, organizarea lor ntr-o maniera ierarhica permite diverse metode pentru
identicarea realizarilor posibile ale unei formule.
Revenind la exemplu, ind dat predicatul abstract Mascul Om, se pot cerceta
toate predicatele aate pe nivelele inferioare ntr-o astfel de ierarhie de abstractizare,
pentru a gasi unul care sa reecte concis nt elesul dorit. Predicatul tata va o alegere
buna pentru ca suporta nu numai Mascul Om dar si a doua parte a nt elesului,
anume c.Parinte(p, c).
Ideea folosita n desemnarea unei reprezent ari efective a cunostint elor este de a
alege setul de predicate cu o structura ierarhica cat mai bogata.
12.3 Cadrul ca reprezentare a informat iei
Mare parte din inferent a ceruta de nt elegerea limbajului natural foloseste prezumt ii
despre ceea ce este tipic la anumite obiecte sau situat ii aate n discut ie. Astfel de
informat ie este codicata n structuri numite cadre.
12.3. CADRUL CA REPREZENTARE A INFORMAT IEI 139
Denit ia 12.5 Un cadru este o colect ie de fapte si obiecte care descriu un anumit
obiect (sau situat ie), mpreuna cu strategiile de inferent a specice noilor situat ii care
pot apare.
Situat ia reprezentata poate varia de la scene vizuale la structura obiectelor zice
complexe. Sistemele bazate pe cadre ofera facilitat i cum ar rat ionamentul cu
reguli incomplete, descendent a automata a proprietat ilor pe baza ierarhiilor sau
rat ionamente procedurale.
Obiectele principale ntr-un cadru sunt numele asignate, numite sloturi sau roluri
(similar rolurilor tematice de la forma logica). De exemplu, cadrul pentru casa poate
avea drept sloturi bucataria, sufrageria, holurile, usa de la intrare etc.
Cadrul specica de asemenea si relat iile ntre sloturi si obiectele reprezentate
n cadru. De exemplu, slotul bucatarie din cadrul casa trebuie ncadrat zic n
interiorul casei si sa cont in a diverse unelte necesare prepararii manc arii.
Fiecare slot poate considerat o funct ie care ia un obiect descris de cadru (o
instant a a cadrului) si produce valoarea sa corespunzatoare.
Deci o instant a particulara a cadrului casa - sa o notam cu H1 - consta dintr-
o instant a particulara a unei bucatarii, la care se poate face referire sub forma
bucatarie(H1), plus alte instant e particulare ale tuturor celorlaltor sloturi.
Exemplul 12.13 Denit ia cadrului unui calculator personal poate scrisa:
Clasa de obiecte: PC(e)
Roluri: Tasta, Disc1, Cutie
Restrict ii: Tastatura(Tasta), Unitate Disc(Disc1), CPU(Cutie)
Aceasta structura reprezinta ideea ca toate obiectele de tipul PC au sloturi de
tip tastatura, unitate disc si Unitate centrala (CPU) - identicate respectiv prin
funct iile Tasta, Disc1 si Cutie. Se poate da si o reprezentare graca (Figura 12.2):
Figura 12.2:
`
_
Tastatura
Unitate Disc
CPU
6
-
-
? -
PC
Tasta
Disc1
Cutie
O aparit ie de tipul PC - sa spunem PC3 - avand ca subcomponente Tast13,
Dc11 si CPU00023 va reprezentata n notat ia cadru prin
(PC3 este PC cu Tasta = Tast13, Disc1 = Dc11, Cutie = CPU00023)
Aceasta denit ie poate privita ca o prescurtare a formulei FOPC:
PC(PC3) & Tasta(PC3) = Tast13 & Disc1(PC3) = Dc11 &
Cutie(PC3) = CPU00023
140 PRELEGEREA 12. REPREZENTAREA UNIVERSULUI CUNOASTERII
12.3.1 Sloturi cu restrict ii
Reprezentarea cadrelor poate folosita pentru a codica informat ie suplimentar a
despre subcomponente. Un exemplu des ntalnit n nt elegerea limbajului natural
consta n reprezentarea act iunilor. Cunoasterea situat iilor obisnuite n care apare
o act iune poate foarte utila n interpretarea limbajului. Este vorba mai ales de
cunoasterea relat iei cauza - efect si cunoasterea condit iilor tipice necesare aparit iei
act iunii. Notat ia slotului este extinsa pentru a ret ine relat iile ntre aparit ia cadrului
si alte propozit ii sau evenimente.
Pentru act iuni, sunt utile urmatoarele relat ii:
precondit ii proprietat i care declanseaza de obicei act iunea;
efecte proprietat i cauzate de obicei de act iune;
descompunere modul n care este realizata de obicei act iunea
(denita ca o secvent a de subact iuni).
Exemplul 12.14 Figura 12.3 arata denit ia act iunii de a cumpara ceva. Act iunea
foloseste 4 obiecte: cumparatorul, vanzatorul, obiectul si o suma de bani egala cu
pret ul obiectului.
Denit ia arata ca act iunea se poate declansa numai daca cumparatorul are destui
bani si vanzatorul are obiectul (precondit iile); tipic, la sfarsit cumparatorul det ine
obiectul iar vanzatorul are banii (efectele).

In sfarsit, un mod tipic de act iune este
acela n care cumparatorul da banii vanzatorului iar acesta da obiectul cumpara-
torului (descompunere).
Figura 12.3:
Clasa de act iune: CUMP

AR

A(b)
Roluri : Cumparator, Vanzator, Obiect, Bani
Restrict ii : Om(Cumparator),
Agent Vanzari(Vanzator),
EObiect(Obiect),
Valoare(Bani),
Pret (Obiect)
Precondit ii : DETINE(Cumparator, Bani),
DETINE(Vanzator, Obiect)
Efect : DETINE(Cumparator, Bani),
DETINE(Vanzator, Obiect),
DETINE(Cumparator, Obiect),
DETINE(Vanzator, Bani)
Descompunere : D

A(Cumparator, Vanzator, Bani),


D

A(Vanzator,Cumparator, Obiect)
12.4. FOLOSIREA MULT IMILOR

IN DEFINIREA CUANTIFICATORILOR141
12.4 Folosirea mult imilor n denirea cuantica-
torilor
Avand denit un KRL, sa facem cateva observat ii referitoare la aplicarea limbajului
formei logice n KRL. Cele mai mari diferent e au aparut n scrierea cuanticatorilor
(foarte numerosi n limbajul formei logice, maxim doi n KRL). Aceasta diferent a
de numar poate redusa extinzand denit ia KRL si asupra obiectelor.
KRL poate lucra cu mult imi, cu condit ia ca acestea sa e nite. O mult ime
poate indicata listand elementele ei (de exemplu {Ana1,Cici1}).
Mult imile sunt notate n mod uzual cu constante; astfel, S
1
poate o mult ime
denita prin formula S
1
= {Ana1, Cici1}.
Proprietat ile din teoria mult imilor sunt valabile si n KRL. Operat ii cum ar
reuniunea, intersect ia, incluziunea, apartenent a etc. apar sub denumirea de predi-
cate.
Folosirea mult imilor n denit ii se face obisnuit; de exemplu, propozit ia
Unii s-au ntalnit la trei.
produce interpetarea:
M : M {x|OM(x)}.

INT

ALNI(M,3PM)
Prin convent ie, numele mult imilor se vor scrie cu majuscule. Sunt anumite verbe
care n unele argumente opereaza numai cu mult imi. Altele dimpotriva.
Sa consideram cateva formule care apar n urma citirilor colective/distributive.
Astfel, exista doua interpret ari ale propozit iei
Cat iva oameni au cumparat un costum.
care are urmatoarea forma logica (s-a omis operatorul de timp):
(C

ATIVA m1:(PLUR OM1)


(UN s1:(COSTUM1
(CUMP

ARA1 m1 s1)))
Citirea colectiva va aplica aceasta forma n
M1 : M1 {z |OM(z )} s : COSTUM(s).CUMP

ARA1(M1, s)
Citirea distributiva conduce la formula:
M2 : M2 {z |OM(z )} m : m M2 s : COSTUM(s).CUMP

ARA1(m, s)
Se observa ca diferent a principala dintre cele doua scrieri consta n tipul de
argument folosit de predicatul CUMP

ARA1: o mult ime (M1) la citirea colectiva,


un element (m) la cea distributiva.
Reprezentarea folosind mult imi poate folosita pentru informat ii suplimentare;
astfel putem arata ca mai mult i oameni (nu numai unul) cumpar a un costum.
Aceasta informat ie se poate codica denind o funct ie care da cardinalul |S| al
unei mult imi S.
142 PRELEGEREA 12. REPREZENTAREA UNIVERSULUI CUNOASTERII
Exemplul 12.15 Propozit ia
Trei oameni au intrat n camer a.
are reprezentarea (s-a omis operatorul timp):
M : (M {y|OM(y)} & |M| = 3) m : m M.INTRA1(m, CAMERA1)
Schimband egalitatea |M| = 3 cu |M| 3, se obt ine nt elesul propozit iei

In camera au intrat cel put in trei oameni.


Folosind mult imi se pot aproxima si alt i cuanticatori din limbajul formei logice.
Astfel, daca cuanticatorul mult i se poate deni prin cel put in jumatate, atunci
Mult i oameni radeau.
are nt elesul
M : (M {y|OM(y)} & |M| |{y|Om(y)}|/2) m : m M.R

ADE1(m)
Prelegerea 13
Rat ionament si cunoastere
13.1 Verbele n reprezentarea cunoasterii
Una din componentele centrale n orice reprezentare a cunoasterii consta n tratarea
verbelor si a timpului. Multe limbaje folosesc timpul incluzand informat ia temporala
implicit n timpul verbelor si explicit n adverbe temporale (de exemplu pentru cinci
minute, la ora 3, dupa ce am plecat etc.).

In limbajul formei logice, informat ia temporala era manevrata n mai multe


moduri. Astfel, existau operatorii modali pentru reprezentarea timpului (TRECUT,
PREZ etc), conectori temporali (

INAINTE,

IN TIMPUL, . . .), iar toate predicatele
puteau avea argumente de timp.
Exista mai multe tipuri diferite de timp. Din acest punct de vedere, avem punct
temporal, interval temporal, durata. Pentru ele se denesc urmatoarele relat ii:
t
1
< t
2
punctul/intervalul t
1
este naintea punctului/intervalului t
2
;
t
1
: t
2
intervalul t
1
continu a cu intervalul t
2
, sau
punctul t
1
deneste nceputul intervalului t
2
, sau
punctul t
2
deneste sfarsitul intervalului t
1
;
t
1
t
2
punctul/intervalul t
1
este cont inut n punctul/intervalul t
2
.
Propozit iile descriu armat ii care apart in unei anumite clase: cele care descriu
stari (armat ii statice), cele care descriu activitat i de deplasare (armat ii active) si
cele care descriu evenimente complete (armat ii totale).
Denit ia 13.1 Armat iile statice descriu anumite proprietat i ale universului, care
pot avea loc (pentru un moment sau pentru o perioada nedenita).
De exemplu:
Mihai este fericit.
Eu cred ca pamantul este plat.
De asemenea, ele descriu situat ii care nu au un punct nal precis si nu pot apare
n anumite contexte lingvistice:
* Mihai ind fericit.
* Eu crezand ca pamantul este plat.
143
144 PRELEGEREA 13. RAT IONAMENT SI CUNOASTERE
Denit ia 13.2 Armat iile active descriu activitat i care pot apare ntr-un interval
de timp.
De exemplu:
Mihai alearga.
Usa se deschide si se nchide permanent.
Propozit iile care descriu stari sau activitat i nu folosesc de obicei operatori tem-
porali (cum ar cinci minute), dar au modicatori de durata (pentru cinci minute).
Denit ia 13.3 Armat iile totale descriu act iuni nalizate.
Astfel, urmatoarele armat ii sunt totale:
Paul a reusit sa adoarma.
Silvia s-a urcat pe munte.

In ambele propozit ii, evenimentul se termina la un anumit moment (numit punct


culminant) si rezulta o anumita proprietate carencepe din acest punct.

In exemplele
de sus, stim ca Paul este adormit la sfarsitul evenimentului, iar n a doua, ca Silvia
se aa pe varful muntelui.
Propozit iile care includ armat ii totale pot folosi modicatori temporali;
de exemplu:
Au suit muntele n doua zile.
Paul a reusit sa adoarma ntr-o ora.
Eventualitat ile totale pot clasicate n doua subclase, dupa felul cum descriu
numai o tranzit ie (clasa nalizare) sau prezinta o activitate care duce la punctul
culminant (clasa completare). Exemplele de sus descriu nalizari; pentru completari
putem exemplica prin:
Sorin a recunoscut persoana.
Elena l-a lamurit.
Cele patru tipuri de clase de armat ii pot distinse prin tipuri diferite de argu-
mente temporale. Astfel:
Armat iile statice pot adevarate ntr-un punct sau un interval; n acest din
urma caz, spunem ca sunt omogene. Evident, daca o armat ie este omogena
pe un interval, ea va omogena pe orice subinterval al sau.
Propozit iile de nalizare, cum ar
Paul a atins varful.
Rodica a nchis usa.
corespund propozit iilor care descriu tranzit ii. Astfel, n exemplele date, prima
descrie o tranzit ie dupa care Paul se aa n varf, n timp ce a doua descrie o
tranzit ie dupa care usa este nchis a. Asemenea predicate nu pot adevarate
pe intervale dar pot oferi informat ie relativ la pozit ia statica rezultata.
13.1. VERBELE

IN REPREZENTAREA CUNOASTERII 145
Exemplul 13.1
a1, l1, t1 .ATINGE(a1, l1, t1) T1. t1 : T1 & LA(a1, l1, T1)
se interpreteaza astfel: daca un agent a1 atinge o locat ie l1 la momentul t1,
atunci a1 sta n l1 un anumit interval de timp care ncepe din t1.
Propozit iile care descriu procese corespund verbelor active (Ion alerga). Predi-
catele unor astfel de procese apar numai pe intervale si tind sa e omogene, desi
nu ntr-un mod atat de strict ca cele statice.

In particular, poate adevarat
ca
Ion a alergat ntre orele 2 si 3.
desi este posibil ca el sa facut si unele popasuri de cateva minute pentru a
se odihni.
Deci, daca un proces P acopera un interval T1, este posibil ca el sa acopere si
un interval T2 T1 (dar nu este sigur !).
Propozit iile de completare, cum ar
Ion a alergat la magazin.
au o structura mai complexa si pot combina mai multe forme. Putem analiza
aceasta aplicand predicatele din forma logica n propozit ii mai detaliate din
KRL.

In particular, propozit ia anterioar a poate utilizata ntr-o formula in-
dicand ca procesul de alergare care a aparut a culminat ntr-o stare de existent a
a lui Ion la magazin, adica:
T1, T2. ALERGA(Ion1, T1) & LA(Ion1, MAGAZIN1, T2) & T1 : T2
Tabelul 13.1 sumarizeaza cateva proprietat i ale acestor clase.
Tabelul 13.1:
Clasa Poate adevarat Poate adevarat
ntr-un punct ? ntr-un interval ?
Static DA DA
Activ NU DA
Finalizare DA NU
Completare NU DA
13.1.1 Codicarea timpului
Operatorii de timp pot si ei reprezentat i n logica temporala far a a folosi operatori
modali. Ideea consta n denirea de relat ii temporale n raport cu un anumit mo-
ment de referint a (timpul curent). Sa presupunem ca ACUM1 este o constant a care
reprezint a timpul curent; atunci TRECUT se poate codica ntr-o formul a folosind
cuanticatorul existent ial.
146 PRELEGEREA 13. RAT IONAMENT SI CUNOASTERE
Exemplul 13.2 De exemplu,
Mircea era fericit.
se poate reprezenta n KR prin expresia:
T1 . T1 < ACUM1 . FERICIT(Mircea1, T1)
Aceeasi propozit ie, dar la timpul prezent:
Mircea este fericit.
da expresia
T1 . ACUM1 T1 . FERICIT(Mircea1, ACUM1)
iar la viitor:
T1 . T1 > ACUM1 . FERICIT(Mircea1, T1)
De remarcat ca exista o ambiguitate n reprezentarea timpului, deoarece unele
propozit ii scrise la prezent se refera la viitor (cum ar Autobuzul soseste la amiaza),
iar unele scrise la viitor se refera la prezent (De acum el va n clasa). Nu vom lua
n considerat ie nsa asemenea disfunct ionalitat i.
Dar chiar si far a ambiguitate, apar unele probleme dicile. De exemplu, exista
mai multe moduri diferite de a arata ca ceva a fost adevarat n trecut (corespunzator
imperfectului, perfectului simplu, perfectului compus si mai mult ca perfectului).
Cum sa facem deosebirea ntre:
Maria citea anunt ul.
Maria citi anunt ul.
Maria a citit anunt ul.
Maria citise anunt ul.
Ca propozit ii simple, acest lucru este foarte dicil de realizat. Sa folosim doua
din aceste forme n propozit ii mai complexe:
Cand Virgil a deschis usa, Maria citi anunt ul.
Cand Virgil a deschis usa, Maria citise anunt ul.

In prima propozit ie, actul citirii este simultan cu cel al deschiderii usii, n timp
ce n a doua propozit ie, el l precede.
Formalizarea se bazeaza pe not iunea de timp de referint a.

In cele doua propozit ii anterioare, timpul de referint a este momentul n care


Virgil deschide usa. Perfectul simplu este simultan (contemporan) cu timpul de
referint a, iar mai mult ca perfectul este anterior lui. Modelul - dezvoltat de Re-
ichenbach (1947) - foloseste informat ii despre 3 timpi:
S - timpul vorbirii;
E - timpul evenimentului (starii);
R - timpul de referint a.
Timpul de referint a poate folosit ca adverb de timp (vezi exemplele anterioare)
sau determinat de contextul discursului.
Pentru timpii simpli (perfect simplu, viitor simplu) timpul de referint a si cel al
evenimentului coincid (E = R).
13.2. DEDUCT IA AUTOMAT

A 147
Exemplul 13.3 Cele trei forme generate n acest caz de relat ia dintre S si R sunt
exemplicate prin:
Pisica toarce. Prezentul simplu: S = R, E = R
Pisica toarse. Perfectul simplu: R < S, E = R
Pisica va toarce. Viitorul simplu: S < R, E = R
La timpurile perfecte (perfectul compus, mai mult ca perfectul, viitorul perfect)
timpul evenimentului precede timpul de referint a.
Exemplul 13.4 Cele trei situat ii posibile sunt exemplicate astfel:
Pisica a tors. Perfectul compus: S = R, E < R
Pisica torsese. Mai mult ca perfectul: R < S, E < R
Pisica va tors. Viitorul compus: S < R, E < R
Analiza pune n evident a si alte trei posibilitat i, datorate relat iei R < S (timpul
posterior):
Exemplul 13.5
Pisica urmeaza sa toarca. Prezentul posterior: S = R, R < E
Pisica urma sa toarca. Trecutul posterior: R < S, R < E
Pisica va urma sa toarca. Viitorul posterior: S < R, R < E
13.2 Deduct ia automata
Sa studiem n continuare cateva strategii si tehnici de rat ionament folosite n sis-
temele de reprezentare a cunoasterii. Dupa cum s-a aratat n prelegerea anterioar a,
sistemele de rat ionament se mpart n doua categorii mari: declarative si procedurale.
Ne vom ndrepta atent ia asupra catorva tehnici pur declarative.
Una din complicat iile demonstrarii automate provine din faptul ca anumite for-
mule se pot demonstra n mai multe moduri; num arul demonstrat iilor se reduce ns a
mult daca se realizeaza o reducere a complexitat ii formulelornainte de demonstrat ie.

In particular, este util de folosit o forma normala pentru formule, bazata pe un sub-
set al sintaxei FOPC. De exemplu,
P&Q, (P Q), (P Q)
sunt logic echivalente si conduc la aceeasi forma normala.
Sa dezvolt am deci o forma normala pentru FOPC, numit a forma normala con-
junctiva (FNC). La nivelul constantelor, funct iilor si propozit iilor atomice, FNC
este identic a cu cea din FOPC. Un literal corespunde unei propozit ii atomice, posi-
bil negata. De exemplu:
Persoana(Ion1),
Masina(Masina1),
Apart ine(Ion1,Masina 1),
Fericit(Ion1)
148 PRELEGEREA 13. RAT IONAMENT SI CUNOASTERE
O clauza este o formul a avand forma generala
(P
1
, . . . , P
n
Q
1
, . . . , Q
m
)
unde P
i
si Q
i
sunt literali, cu semnicat ia:
Daca Q
1
, . . . , Q
m
sunt adevarate, atunci cel put in una din propozit iile P
1
, . . . , P
n
este adevarata.
Exemplul 13.6 Clauza
(Apart ine(Elena1,Masina2) Fericit(Elena1))
corespunde formulei - scrisa ca disjunct ie:
Apart ine(Elena1,Masina2) Fericit(Elena1)
Sub aceasta forma, tot i Q
i
sunt literali scrisi cu negat ie.
Se poate arata ca toate formulele din FOPC au o forma clauzala echivalent a.
Tabelul 13.2 cont ine cateva astfel de forme echivalente.
Tabelul 13.2:
Formula n FOPC Forma clauzala echivalenta
(P )
P ( P)
P&Q doua clauze : (P ), (Q )
P Q (PQ )
Q P (Q P)
P Q (Q P)
(P Q) doua clauze : (P ), ( Q)
(P&Q) R doua clauze : (PR ), (QR )
Daca n = 1 avem clauza Horn. Strategia folosita de limbajul Prolog, bazata pe
clauze Horn, este capabila sa demonstreze orice formula rezultata logic din KB.
Rat ionamentul cu clauze face posibila extensia algoritmilor de unicare. Sa
consideramnt ai un KB limitat numai la literali (similar unei baze de date relat ionale
care foloseste cuanticatori). Aici, formula FOPC
yxP(x, y)
corespunde literalului
P(Sk2(?y), ?y).
Presupunem ca KB cont ine acest literal si sa vedem ce se nt ampla dacan acelasi
KB va rezulta ulterior formula
wzP(w, z).
Transformat a direct n forma clauzala, se ajunge la ceva de tipul
P(Sk3(?w), ?w)
care nu se unica cu literalul din baza de date pentru ca funct iile Skolem sunt
notate diferit.

Intr-un sistem bazat pe cautarea patternurilor, aceasta problema
13.2. DEDUCT IA AUTOMAT

A 149
se evita invers and interpretarea cuanticatorilor nedenit i (folosit i cu ?). Deci, o
formul a
yxP(x, y)
va conduce la
P(?z, Sk4),
care se va unica cu literalul pentru aceeasi formul a, existent n baza de cunostin-
t e.
Aceasta idee rezulta din strategia de demonstrare automata.

In general exista
doua metode generale de vericare a unei formule P.
Prima se bazeaza pe o demonstrare a lui P direct din KB, folosind regulile de
inferent a.
A doua (tehnica refuzului) consta n a arata ca P este inconsistenta n KB
(si deci P trebuie sa rezulte din KB); aceasta este modalitatea uzuala folosita
n deduct ia automata si formeaza fundamentul teoretic al tehnicii de regasire
a patternului descris anterior, a strategiilor de demonstrare bazate pe clauze
Horn.
Ambele tehnici pot considerate implement ari specializate ale unei singure reguli
de inferent a numit a regula de rezolut ie.
Exemplul 13.7 Un caz foarte simplu de regula de rezolut ie este modus ponens.

In
particular, ind data o clauza (Q P) (adica P Q) si clauza (P ) (adica P
este adevarata), regula de rezolut ie decide (Q ) (adica Q este adevarata).
Un alt caz simplu de regula de rezolut ie trateaza contradict iile. Din clauzele
(P ), ( P) (adica P este adevarata respectiv falsa) rezulta clauza vida
() care indica inconsistent a bazei de date.
Regula de rezolut ie este generalizata la FOPC folosind unicarea pentru a instan-
t ia variabilele cu valori identice din cele doua clauze.
Exemplul 13.8 Sa consideram un KB care include clauze ce arma ca tot i cainii
musca si ca Grivei este caine:
(MUSCA(?x) C

AINE(?x))
(C

AINE(Grivei1) )
Regula de rezolut ie, dupa substitut ia lui ?x cu Grivei1, va elimina literalul
C

AINE(Grivei1) din cele doua clauze, conducand la clauza nala


(MUSCA(Grivei1)).
Cu aceste idei se poate determina strategia de construct ie a demonstrat iilor.
Fiind dat un KB n forma clauzala, pentru a determina daca o formul a P rezulta
din KB, se procedeaza astfel:
P se scrie sub forma de clauza si se adauga la KB; e KB noua baza de
cunostint e.
Folosind regula de rezolut ie n KB, se obt ine clauza vida; deci KB este in-
consistent a.
150 PRELEGEREA 13. RAT IONAMENT SI CUNOASTERE
Tabelul 13.3:
(ZBOR F1) (STIMP F1 ESTE 17:00 HR)
(ZBOR F2) (STIMP F2 ESTE 10:00 HR)
(ZBOR F3) (STIMP F3 ESTE 9:00 HR)
(ZBOR F4) (STIMP F4 CJ 17:00 HR)
(AERP B) (PTIMP F1 CJ 16:00 HR)
(AERP CJ) (PTIMP F2 B 9:00 HR)
(AERP B) (PTIMP F3 CJ 8:00 HR)
13.3 Semantici procedurale si chestionare
Tehnicile procedurale sunt frecvent folositen aplicat ii bazate pe chestionarea bazelor
de date.

In formalismul denit anterior, KB (baza de date) va consta numai din
literali pozitivi, adesea far a variabile.

In loc de a converti limbajul formei logice ntr-
un FOPC extins, forma logica este tratata ca o expresie ntr-un chestionar. Fiecare
construct ie corespunde unei proceduri particulare care rezolva o anumita ntrebare.
De exemplu, ntrebarea:
Pe toate zborurile spre Iasi se serveste masa ?
cu forma logica:
(ORICE f1:(&(ZBOR f1)(DEST f1(NUME c1 Iasi))) ((SERV MASA f1))
va interpretat ca procedura astfel:
1. Se aa toate zborurile din baza de date cu destinat ia IS (simbolul pentru Iasi);
2. Pentru ecare zbor aat, controleaza daca se serveste masa; daca raspunsul
este armativ pentru toate zborurile, rezulta DA; altfel NU.
Sa vedem cum se pot interpreta ca proceduri expresiile formei logice; vom face
referint a la o metoda de interpretare numita semantica procedurala, utilizata pe
scara larga si n modulul de analiza semantica al compilatoarelor.
Exemplul 13.9 Vom folosi o baza de date simpla prezentata n Tabelul 13.3
Ea consta dintr-un set de literali pozitivi, fara variabile. Timpii sunt indicat i n
notat ia internat ionala: 17:00 HR nseamna ora 17:00 PM. Relat ia
(STIMP f c t)
indica faptul ca zborul f soseste la aeroportul c la timpul t;
(PTIMP f c t)
indica faptul ca zborul f pleaca din aeroportul c la timpul t.
Pentru dezvoltarea chestionarului se folosesc doua funct ii:
(Test < literal >
1
, . . . , < literal >
n
)
care ntoarce Adev arat daca exista o instant iere a variabilelor astfel ncat
ecare literal este gasit n baza de date;
13.3. SEMANTICI PROCEDURALE SI CHESTIONARE 151
(Aa < var > < literal >
1
, . . . , < literal >
n
)
care, n caz de succes ntoarce ecare aparit ie a variabilei indicate care este o
solut ie.
Astfel, pentru baza de date de sus, ntrebarea
(Aa ?x (ZBOR ?x)(STIMP ?x ESTE 10 : 00 HR))
va ntoarce valoarea (F2), deoarece F2 este singura instant iere a lui ?x n care
ambii literali sunt n baza de date.
Toate expresiile din limbajul formei logice trebuiesc interpretate ntr-un mod
care sa se reduca eventual la cele doua forme de ntrebare din exemplul 13.9.
Acesta este dat aplicand forma logica ntr-o procedura care realizeaza ntrebarile
corespunzatoare din baza de date. Deci raspunsul la o ntrebare este dat n doi pasi:
Translatarea formei logice ntr-un program;
Executarea acelui program pentru calculul raspunsului.
Sa consideram primul pas (cel de translatare). Pentru orice expresie logica E notam
T(E) translatarea lui E n limbajul de chestionar al bazei de date. Modul de trans-
latare variaz a dupa tipul aplicat iei. De exemplu, expresii ca (NUME c1 Iasi) sunt
translatate n constante ale bazei de date, n acest caz IS; n plus, simbolul c1 va
stocat mpreun a cu constanta IS ntr-o tabela de simboluri. Astfel, va posibil
ca la aparit ia lui c1 ntr-o alta parte a formei logice, acest simbol sa e nlocuit de
valoarea sa IS.
Unele relat ii ale formei logice se translateaza direct n relat ii ale bazei de date;
pentru altele sunt necesare expresii mai complexe. De exemplu, relat ia DEST din
forma logica nu apare n baza de date; ea este codicata n relat ia STIMP care
include doua elemente: destinat ia zborului si timpul de aterizare. Deci relat ia din
forma logica
(DEST f1 (NUME c1 Iasi)
unde f1 a fost deja asociat cu o variabila ?f, se translateaza n relat ia din baza
de date
(STIMP ?f ESTE ?t).
Deoarece timpul nu este cont inut n relat ia DEST, el este interpretat ca o vari-
abila far a restrict ii n translatare.

In general translatarea ecarei relat ii din forma
logica n baza de date trebuie specicata distinct.
Semantica procedurala are o modalitate specica de interpretare a conectorilor
logici si a cuanticatorilor, care - binent eles - nu au corespondent n baza de date
relat ional a. Operatorii logici sunt interpretat i astfel:
Conjunct ii:
(AND R
1
, . . . , R
n
)
se translateaza ntr-un program de forma
152 PRELEGEREA 13. RAT IONAMENT SI CUNOASTERE
(VERIFIC TOT ADEV T(R
1
), . . . , T(R
n
))
care la execut ie va verica ecare T(R
i
) daca este adevarat si trece variabila
instant iat a ntrebarilor care urmeaza. Daca exista un set de instant ieri de
variabile cu pentru care tot i T(R
i
) sunt valabili, atunci programul are succes;
altfel esueaz a.
Disjunct ii:
(OR R
1
, . . . , R
n
)
se translateaza ntr-un program de forma
(AFL

A UNUL ADEV T(R


1
), . . . , T(R
n
))
care la execut ie va ntreba succesiv ecare T(R
i
) pan a gaseste un R
i
armativ;
n acest caz programul are succes.
Procedura pentru negat ii presupune ipoteza universului minim la toate relat iile
bazei de date:
(NOT R)
se translateaza ntr-un program de forma
(DAC

A NU T(R))
care are succes numai daca T(R) esueaz a la ntrebare.
Cuanticatorii necesita folosirea unor transformari mai complexe. Fiecare cuan-
ticator se translateaza ntr-un program care efectueaza o anumit a operat ie pe baza
de date. Din cauza limitarilor impuse de limbajul bazei de date, de obicei se pot
prelucra numai citirile distributive ale cuanticatorilor multipli.
Sa consideram trei cuanticatori folosit i n aplicat iile de tip ntrebare/raspuns:
(L x : R
x
P
x
)
se translateaza ntr-un program
(AFL

A L ?x T(R
?x
) T(P
?x
))
care aa toate variabilele ?x care satisfac T(R
?x
), adica (AFL

A ?x T(R
?x
)).
Daca se gaseste un singur raspuns, atunci acel raspuns este substituit lui
?x n toata expresia si se executa T(P
?x
) pentru a gasi raspunsul nal la
ntrebare.
Daca nu se gaseste nici un obiect lantrebarea adresata lui T(R
?x
), atunci
exista o anumita contradict ie care va folosita n sistemul ntrebare/ras-
puns; de exemplu se anunt a utilizatorul ca nu exista nici un obiect soli-
citat.
Daca se gasesc mai multe raspunsuri, construct ia sistemului va decide
calea care va urmata: unele sisteme executa T(P
?x
) pentru ecare valoa-
re gasita, altele anunt a eroare, etc.
13.3. SEMANTICI PROCEDURALE SI CHESTIONARE 153
(FIECARE x : R
x
P
x
)
se translateaza ntr-un program
(ITERARE ?x T(R
?x
) T(P
?x
))
care ncepe de asemenea prin a cauta tot i ?x care satisfac T(R
?x
); n a doua
faza va executa T(P
?x
) pentru ecare valoare gasita si nalizeaza cu succes
numai daca toate aceste ntreb ari au raspuns acceptabil.
(CE x : R
x
P
x
)
se translateaza ntr-un program
(SCRIE TOT ?x T(R
?x
) T(P
?x
))
care aa toate obiectele ce satisfac (AFL

A ?x T(R
?x
) T(P
?x
)), dupa care
scrie rezultatele. Determinarea celui mai bun format de scriere, n special a
informat iei suplimentare necesare, este o problema dicila pe care momentan
o vom evita.
Plecand de la baza de date din Tabelul 13.3, putem construi cateva exemple de
chestionare.
Exemplul 13.10

Intrebarea
Ce zbor spre Iasi pleac a la ora 4 PM ?
va avea forma logica:
(CE f1 : (AND (ZBOR f1)(DEST f1 (NUME c1

Iasi

)))
(PLECA t1 (NUME t1

4 PM

)))
Ea se translateaza ntr-o ntrebare de forma:
(SCRIE TOT ?f (ZBOR ?f)(STIMP ?f ESTE ?t)
(PTIMP ?f ?s 16 : 00 HR))
Aici relat ia DEST se aplica n relat ia STIMP descrisa anterior, iar predicatul
PLECA n relat ia PTIMP. De remarcat ca locul de plecare nu a fost specicat n
forma logica; de aceea aici este folosit ca o variabila.

Intr-o aplicat ie reala, orasul de
plecare va determinat de context sau prin lipsa. Pentru baza de date din Tabelul
13.3, exista un singur zbor care satisface descrierea curenta, anume F1.
Exemplul 13.11 Solicitarea:
Dat i timpul de plecare al ec arui zbor spre Iasi.
are forma logica:
(FIECARE f1 : (AND (ZBOR f1)(DEST f1 (NUME c1

Iasi

)))
(L t1 : (PLEC TIMP f1 t1)(DA SCRIE1 g1)))
Ea se transcrie n ntrebarea:
(ITERARE ?f1 (CONTROL TOT(ZBOR ?f1)(STIMP ?f(ESTE ?t1))
(AFLA L ?t1 (PTIMP ?f1 ?ORAS ?t1)(SCRIE ?t1)))

In acest caz, interpretarea verbului a da foloseste tiparirea argumentului sau,


adica timpul de plecare. Execut ia expresiei va parcurge urmatoarele etape:
154 PRELEGEREA 13. RAT IONAMENT SI CUNOASTERE
1. Se lanseaza prima parte a pasului ITERARE pentru a aa tot i ?f1 care
verica restrict ia. Procedura CONTROL TOT satisface vericarile pentru
?f1 numai daca (ZBOR ?f1) si (STIMP ?f1 ESTE ?t1) sunt n baza de
date. Se ntorc valorile zborurilor F1, F2, F3.
2. Se lanseaza a doua parte a pasului pentru a executa
(AFLA L ?t1 (PTIMP ?f1 ?ORAS ?t1)(SCRIE ?t1))
pentru ecare din cele trei valori. Sa parcurgem aceasta execut ie cu prima
valoare F1. Expresia este:
(AFLA L ?t1 (PTIMP F1 ?ORAS ?t1)(SCRIE ?t1))
Programul pentru AFLA L realizeaza ntai ntrebarea
(AFLA ?t1 (PTIMP f1 ?ORAS ?t1)).
Este ntors un singur raspuns, anume timpul 17 : 00 HR.
Al doilea pas din programul AFLA L executa SCRIE pentru aceasta valoare
tiparind valoarea 17 : 00 HR.
A doua si a treia iterat ie vor tipari valorile 10 : 00 HR respectiv 9 : 00 HR.
13.3.1 LUNAR - Un sistem de chestionare bazat pe o baza
de date limbaj natural
La nceputul anilor

70 a fost dezvoltat un sistem de chestionare numit LUNAR,
bazat n mare parte pe ideile prezentate n paragraful anterior. Baza de date cons-
truita cont inea informat ii despre mostrele de sol lunar aduse de pe Luna de misiunile
Apollo. Acesta a fost primul sistem bazat pe limbaj natural care a aplicat n practica
construct iile teoretice; el a fost de asemenea folosit ulterior si n alte sisteme.
LUNAR foloseste un analizor ATN care produce o reprezentare bazata pe relat ii
gramaticale; ea este interpretat a cu un modul interpretor semantic care foloseste o
tehnica de cautare realizand o expresie n limbajul de interpretare. Informat ia data
de cuanticatori este pastrata si prelucrata separat de restul reprezent arii semantice,
prin procedee euristice. Rezultatul este o reprezentare a nt elesului, exprimata ntr-
un limbaj similar celui construit aici, plecand de la limbajul formei logice. Execut ia
se realizeaza folosind semantica procedurala.
Cateva exemple de cerint e pe care proiectul LUNAR le poate ndeplini:
Gaseste toate mostrele lunare cu proprietat i magnetice.

In care roci a fost identicata apatita ?


Care este activitatea specica a lui A 126 n sol ?
Care este concentrat ia medie de olivina n probele din zona X23 ?

In care roci concentrat ia medie de titan depaseste 6% ?


Prelegerea 14
Contextul local al discursului
14.1 Componentele contextului local al discursu-
lui
Denit ia 14.1 Contextul local al discursului cuprinde sintaxa si semantica propozi-
t iilor care preced propozit ia curenta, mpreuna cu o lista a obiectelor ment ionate
n propozit ie, la care se poate face referire ulterior prin pronume sau construct ii
substantivale.
Acest context local este util n multe situat ii. De exemplu el poate cont ine
antecedente ale pronumelor, ca n:
1a. Sorin
i
si-a pierdut portofelul
j
n masina.
1b. El
i
l
j
-a cautat mult timp.
De asemenea, contextul local ajuta la interpretarea propozit iilor care folosesc
construct ii verbale eliptice. Exemplu:
2a. Sorin si-a uitat portofelul.
2b. La fel si Tudor.
Construct iile de acest gen se refera n mod normal la evenimentele descrise de
propozit iile imediat anterioare. Astfel, n
3a. Sorin si-a uitat portofelul.
3b. El a cautat pe cineva sa-l mprumute cu bani.
3c. La fel si Tudor.
propozit ia 3c. nu semnica faptul ca Tudor si-a pierdut si el portofelul.
Exista ns a probleme privind lucrul cu propozit iile n context local; acestea sunt
provocate n special de prezent a conjunct iilor. De exemplu, propozit iile 3a si 3b pot
unite n una singura folosind o conjunct ie, dar asta nu schimba nt elesul nal.
4a. Sorin si-a uitat portofelul, asa ca a cautat pe cineva sa-l mprumute cu bani.
4b. La fel si Tudor.
Este greu de interpretat 4b sub forma ca si Tudor si-a pierdut portofelul.
155
156 PRELEGEREA 14. CONTEXTUL LOCAL AL DISCURSULUI
De ment ionat ca o propozit ie simpla care foloseste o conjunct ie, accepta expresii
verbale eliptice cum ar :
5. Sorin a plecat de la curs, ca si Tudor.

In schimb, o conjunct ie asezat a ntre expresii verbale conduce n caz de elipsa,


la pastrarea ntregului context. Deci:
6a. Sorin si-a uitat portofelul si a pierdut tot i banii.
6b. La fel si Tudor.

In acest caz, Tudor a pat it aceleasi necazuri: uitat portofel, pierdut banii.
Din aceste exemple, putem deduce contextul local ca ind derivat din clauzele
principale precedente (nu din propozit iile precedente !). Astfel, deoarece conjunct iile
(cum ar si) pot alipi clauze majore (vezi exemplul 5), se poate arma:
Prima parte a conjunct iei stabileste contextul local pentru a doua parte.
Conjunct iile ntre VP-uri apar n interiorul unei clauze majore, asa ca ambele au
acelasi context local (6a si 6b). Clauzele secundare sunt incluse drept componente
ale unor clauze majore, deci ele nu vor crea un context local nou. Putem exemplica
aceasta prin:
7a. Sorin si-a uitat portofelul cand s-a dus la cinema.
7b. La fel si Tudor.
Propozit ia 7b poate interpretat a ca Tudor si-a pierdut portofelul (eventual
cand s-a dus la cinema), dar nu ca Tudor s-a dus la cinema.
O parte important a a contextului local este lista antecedentelor posibile pentru
pronume; o vom numi lista entitat ilor discursului (DE). Lista DE este un set de cons-
tante denite n KB, care reprezint a obiectele ment ionate n ultima clauza majora
si la care se poate face referire prin pronume. Chiar daca o DE nu este ment ionat a
explicit n clauza precedenta, ea este introdusa implicit. Pentru a rezolva astfel
de situat ii vom vorbi despre obiectele pe care le evoca (sau la care face referire) o
propozit ie (obiectele ment ionate explicit sau implicit de aceasta).
Cand un pronume are un anumit antecedent, se nt elege ca atat pronumele cat
si antecedentul sau se refera la acelasi obiect; spunem ca pronumele si antecedentul
sau co-refera. De remarcat ca un pronume si antecedentul sau se pot co-referi la
acelasi obiect X, chiar daca nici vorbitorul si nici auditoriul nu pot identica X
ntr-un mod concret. De exemplu:
8a. Marin si-a cumparat ieri o masina
i
.
8b. Ea
i
a costat foarte mult.
Armat iile sunt facute fara ca vre-un participant la conversat ie sa vazut masina
sau sa aiba vre-un mijloc de a o identica. Desi aceasta co-referire introduce anumite
probleme n reprezentare (nu se poate deni un obiect din lumea reala fara a-l
identica), o solut ie consta n folosirea de funct ii Skolem sub o forma similara celei
din Prelegerea 12: adaugarea de noi termeni la limbaj.
14.1. COMPONENTELE CONTEXTULUI LOCAL AL DISCURSULUI 157
Exemplul 14.1 Daca o masina are forma logica
< O c1 MASIN

A >,
constanta Skolem generata va C1. Co-referint a este indicata folosind egali-
tatea. Deci, daca pronumele Ea are forma logica
(PRO i1 EA1),
atunci faptul ca Ea co-refera cu C1 va prins n asert iunea
(I1 = C1).
14.1.1 Entitat i de generare a discursului
Pentru ecare expresie substantivala este generata o entitate specica a discursu-
lui. NP distincte reprezinta restrict ii distincte ale universului discursului. Un NP
nedenit evoca de obicei o noua entitate a discursului care uzual nu mai trebuie
identicat a ulterior n KB. Un nume propriu - pe de-alta parte - descrie n general
un anumit obiect din KB care are asociat acelasi nume. Un NP denit (inclusiv
pronumele) se refera la un obiect ment ionat anterior n discurs, de obicei o entitate
a discursului n context local. Pluralul NP-urilor reprezint a mult imi de obiecte. Un
NP complex care foloseste conjunct ii reprezint a o mult ime formata din elementele
conjunct iei.
Exemplul 14.2 Expresia substantivala
Ion si Ana.
semnica trei DE: Ion1, Ana1 si {Ion1 Ana1}.

In cele ce urmeaza vom considera entitat ile discursului reprezentate prin NP-uri
nedenite. Aceasta clasa este foarte importanta deoarece elementele ei introduc
numeroase entit at i noi ale discursului si acopera multe elemente necesare prelucrarii
referint elor denite (care vor discutate n prelegerea urmatoare). Pentru a calcula
mult imea entit at ilor discursului, vom converti ntai forma logica n reprezentarea
cuanticatorilor descrisa anterior, reducand tot i cuanticatorii limbajului natural la
cei universal si existent ial denit i pe baza mult imilor scrise explicit.
De asemenea, n exemplele simple folosite, vom presupune ca toate numele proprii
si NP-urile denite sunt nlocuite cu constante din KB reprezentand referint e la
acestea.
Pluralul NP-urilor va notat cu aceeasi mult ime, indiferent daca este vorba de
o interpretare colectiva sau distributiva.

In citirea colectiva, mult imea introdusa
este folosita direct n propozit ie ca argument, n timp ce n citirea distributiva
mult imea reprezinta domeniul cuanticatorului universal. Pentru denirea mult imii,
modicatorii trebuiesc mp art it i n faza de translatare n doua clase:
Restrict ii ale mult imii (SR),
Restrict ii ale ecarui obiect al mult imii (IR).
De exemplu, translatarea expresiei substantivale Trei baiet i din propozit ia
9. Trei baiet i l-au hranit pe Grivei.
158 PRELEGEREA 14. CONTEXTUL LOCAL AL DISCURSULUI
Tabelul 14.1:
Exemplu Entitatea Dis- Restrict ia de Restrict ia
cursului (DE) mult ime (SR) individuala (IR)
un om M1 none OM1(M1)
trei femei W1 |W1| = 3 W1 {w|FEMEIE1(w)}
sau, echivalent,
w . w W1 FEMEIE1(w)
cateva C1 |C1| > 1 C1 {c|PISIC

A1(c)&
pisici negre NEGRU1(c)}
va folosi un SR care arata ca mult imea are trei elemente si un IR care specica
ca ecare element este un baiat.

In Tabelul 14.1 sunt date translatari pentru cateva NP nedenite.


14.1.2 NP nedenite peste domeniul cuanticatorilor uni-
versali
Daca un NP apare - n urma unei interpret ari distributive - n domeniul unui cuanti-
cator universal, se ivesc dicultat i destul de mari. Astfel, o expresie substantival a
nedenita - la singular - folosita n domeniul unui cuanticator universal, poate
reprezenta atat o mult ime cat si un element.
Sa consideram urmatorul discurs:
10a. Trei baiet i
i
cumpara cate o pizza
j
.
10b. Ei
i
le
j
-au mancat n parc.
De remarcat ca
Ei au mancat-o n parc
nu este o continuare corecta a propozit iei 10a. Ce proprietat i sunt necesare
pentru a deni entitatea discursului generata n 10a de o pizza ? Mult imea denita
prin {x|PIZZA(x)} este prea generala, pentru ca le
j
-au din 10b nu se refera la
mult imea tuturor pizz-elor. O tratare mai corecta constan denirea unei noi entitat i
P1 a discursului, reprezentand o submult ime a lui {x|PIZZA(x)}; n acest fel, le
j
-
au din 10b se poate referi la o mult ime corecta de pizze, anume acele introduse de
ultima propozit ie.
Aceasta tratare pierde totusi informat ie despre P1, n particular faptul ca mult i-
mea consta din pizz-ele cumparate de baiet ii ment ionat i la 10a. De aceea este
preferabil sa se mbogat easc a reprezentarea lui P1 considerand formula originala
pentru 10a:
b : b B1 . p : PIZZA(p) . CUMP

AR

A(b, p)
unde |B1| = 3 & B1 {x|B

AIAT(x)}.
Forma skolemizata este:
b : b B1 . PIZZA(sk4(b)) & CUMP

AR

A(b, sk4(b))
14.2. UN MODEL DE REFERIRE BAZAT PE LISTE ISTORICE 159
unde sk4(b) este o funct ie noua reprezentand pizza cumparat a de ecare baiat.
Analiza completa a propozit iei este:
Propozit ie: Trei baiet i au cumparat cate o pizza.
Translatare init iala:
B : |B| = 3 & B {x|B

AIAT(x)}
b : b B . p : PIZZA(p) . CUMP

AR

A(b, p)
Entitat ile discursului:
B1 : |B1| = 3 & B1 {x|B

AIAT(x)}
P1 : P1 = {x|PIZZA(x) & y : y B1 . x = sk4(y)}
Cont inutul semantic:
b : bB1 . sk4(b) P1 & CUMP

AR

A(b, sk4(b))
14.2 Un model de referire bazat pe liste istorice

In aceasta sect iune vom construi o tehnica simpla pentru identicarea antecedentelor
pronumelor. Ea se bazeaza pe liste istorice - o stiva de liste ale entitat ii discursului
generate de propozit iile anterioare; entitat ile din discursul local curent (adica cele
generate de clauza precedenta) sunt n topul stivei.
Sa presupunem ca a fost denit algoritmul de generare a entitat ilor discursului
produse de o propozit ie. Lista istorica va consta din toate aceste entit at i, evocate
ntr-un trecut destul de recent. Unele sisteme reduc acest trecut la ultimele 1 3
contexte locale, n timp ce altele nu fac nici o limitare.
Fiind data lista istorica, algoritmul de aare a unui antecendent opereaza astfel:
Se cauta n cel mai recent context local un antecedent care sa verice toate
restrict iile relative la pronume.
Restrict iile pot proveni din orice sursa. De exemplu, reexivitatea poate elimina
anumite obiecte din lista ascendent ilor posibili; la fel genul, numarul, si alte condit ii.
Daca nu se gaseste nici un antecedent n contextul local curent, se activeaz a lista
istorica a urmatorului context local si procedeul de cautare se reia.
Algoritmul acesta poarta numele de restrict ia recenta si are drept conjectura
faptul ca antecedentul trebuie sa e cel mai recent obiect ment ionat care
satisface toate restrict iile.
Exemplul 14.3 Sa consideram urmatorul discurs, referitor la o cursa maritima:
11a. Antreprenorii aveau mult i bani si au cheltuit mult pentru a construi nava
de concurs.
11b. Baiet ii n schimb si-au construit nava cu un buget mult mai mic.
11c. Ei stiau ca vor castiga cursa fara probleme.
Acest Ei din 11c se refera mai degraba la baiet i, desi - la o analiza seman-
tica mai atenta - este mai probabil ca antreprenorii sunt cei care aveau convingerea
castigarii cursei.
160 PRELEGEREA 14. CONTEXTUL LOCAL AL DISCURSULUI
Tabelul 14.2:
Propozit ie Generarea entitat ilor discursului
11b B2 : B2 {x|B

AIAT(x)}
B3 : NAV

A(B3) & CONSTRUIT(B3, B2)


B4 : BUGET(B4) & FOND LIMITAT(B3)
11a C1 : C1 {a|ANTREPRENOR(a)}
M1 : BANI(M1)
B1 : NAV

A(B1) & PROPRIETAR(B1, C1)


Lista istorica a propozit iei 11c poate arata ca n Tabelul 14.2. Pentru a aa
antecedentul pronumelui Ei trebuie cautat n aceasta lista primul obiect care satis-
face restrict iile pronumelui. Deci trebuie cautat un obiect x care satisface condit iile
Ei(x), unde Ei(x) este adevarat daca:
x reprezinta o int a;
x este la plural.
Prima entitate testata, B2 satisface aceste condit ii si va selectata.
Aceeasi tehnica se poate folosi pentru descrieri denite. De exemplu, daca 11c
este
Ei stiau ca nava lor va nvinge usor.
antecedentul expresiei substantivale nava va primul obiect x care satisface
restrict ia NAVA(x), care va B3.
14.3 Pronume si centralizare (Focus)
Restrict ia recenta stabileste deci o ordine de prioritate pe mult imea contextelor
locale. Problema care se pune este aceea de a realiza o relat ie de ordine si n inte-
riorul unui context local. Se pare ca limbajul natural acorda o anumit a preferint a
obiectelor care ocupa roluri centrale n clauzele majore peste entit at ile discursu-
lui.

In anumite condit ii, aceste preferint e sunt destul de tari pentru a interfera cu
interpetarile logice posibile.
Sa consideram discursul:
Maria a varsat berea pe masa. Ea era rece.
Chiar daca restrict ia recent a si cea semantic a sugereaza ca Ea se refera la masa,
mult i au ndoieli n aceasta interpretare si considera ca de fapt este vorba de bere.
Preferint ele ntre argumentele majore din clauza principala sunt mai subtile.
Astfel:
12a. Sandu l-a vazut pe Andrei la petrecere.
14.3. PRONUME SI CENTRALIZARE (FOCUS) 161
12b. El s-a dus la bar si si-a luat alta bautura.
Desi atat Sandu cat si Andrei sunt antecedent i posibili pentru pronumele El din
12b, exista se pare o preferint a pentru Sandu. Aceasta preferint a nu este atat de
puternica ncat sa acopere inuent ele semantice si contextuale, cum ar n:
13a. Sandu l-a vazut pe Andrei la petrecere.
13b. Bause prea mult.
Aici este mai greu de interpretat ca propozit ia 13b se refera la Sandu, si nu este
evident ca cele doua propozit ii sunt legate una de alta.
Exista se pare un factor care inuent eaz a procesul de interpretare; el se bazeaza
pe not iunea de centru sau focalizarea discursului.

In general discursurile sunt or-
ganizate n jurul unui obiect despre care se ocupa discursul. Acest obiect, numit
centru, tinde sa ram ana acelasi pentru un anumit numar de propozit ii, dupa care
locul lui este ocupat de alt obiect. De asemenea se observa tendint a ca centrul unei
propozit ii sa e pronominalizat.
Aceasta afecteaza interpretarea pronumelor, deoarece odata stabilit un centru,
va o tendint a puternica ca pronumele secundare sa continue sa se refere la el. De
exemplu:
14a. Radu a plecat tarziu la petrecere.
14b. Cand el a ajuns, Sorin l-a nt alnit la us a.
14c. El a decis sa plece devreme.
Semantic, 14c are sens cu oricare din cei doi subiect i (Radu si Sorin) ca an-
tecedent; preferint a structurala este pentru Sorin, deoarece acesta joaca un rol cen-
tral n clauza majora din 14b. Teoria centrului totusi l da pe Radu ca antecedent
deoarece n 14b se face referire la el prin pronume - deci Radu este centrul n 14b,
iar nimic din 14c nu indica faptul ca centrul s-ar schimbat.
Mai precis, n teoria centrului sunt folosite doua structuri interactive:
Entit at ile discursului n contextul local, pe care le numim urmatorii centri
potent iali; acestia sunt listat i ntr-o ordine care reecta preferint ele structurale:
subiectul, apoi obiectele directe, obiectele indirecte, iar la sfarsit celelalte en-
titat i ale discursului din propozit ie. Primul din lista este numit urmatorul
centru preferat (Cp).
Centrul, notat cu Cb (centrul anterior denit), la care se refera propozit ia
curent a. Cb este unul din urmatorii centri potent iali si este pronominalizat.
Restrict iile ntre centru si pronominalizare pot enunt ate astfel:
162 PRELEGEREA 14. CONTEXTUL LOCAL AL DISCURSULUI
Restrict ia de centralizare 1:
Dacan propozit ia curent a se face referire printr-un pronume la un obiect
din contextul local, atunci centrul propozit iei trebuie sa e si el pronomi-
nalizat.
Restrict ia de centralizare 2:
Centrul trebuie sa e entitatea din discurs preferata n contextul local,
la care se face referire printr-un pronume.
Restrict ia de centralizare 3:
La trecerea de la o propozit ie la urmatoarea, pastrarea centrului are
prioritate fat a de schimbarea lui.
Relativ la restrict ia 1, de remarcat ca daca n propozit ie exista numai un pronu-
me, acesta va identica centrul n mod neambiguu.

In a doua restrict ie, daca si a
doua propozit ie cont ine un singur pronume si este contextual rezonabil ca cele doua
pronume sa se refere la acelasi obiect, atunci ele vor co-referi.
Exemplul 14.4 Sa consideram discursul:
15a. Paul
1
l
2
-a vazut n parcare
3
.
15b. El
4
se urca pe bicicleta
5
.
Vom nota DR
1
, DR
2
, DR
3
cele trei entitat i ale discursului generate respectiv de
Paul, l, parcare. DR
2
este centrul (Cb) propozit iei 15a. Lista urmatoarelor
centre potent iale este, n ordine DR
1
, DR
3
; primul element din aceasta lista, DR
1
este preferat (Cp) ca urmator centru.

In acest context local, sa consideram propozit ia
15b. Din motive pur semantice, ea se va referi la DR
1
sau DR
2
. Restrict ia de
centralizare ofera ca preferint a DR
4
= DR
2
, continuand cu acelasi centru. Din
acest motiv, DR
2
este centrul lui 15b, asa cum a fost si al lui 15a.
O propozit ie cu mai multe pronume este mai complexa din cauza posibilelor
ambiguit at i relative la pronumele care va corespunde centrului. Astfel, restrict ia de
centralizare data mai jos arata ca nu exista nici o preferint a n urmatorul exemplu.
Exemplul 14.5 Sa consideram urmatorul discurs:
16a. Nicolae
1
se plimba prin parc
2
cand l
1
-a ntalnit pe Gabriel
3
.
16b. El
4
l
5
-a invitat la o petrecere
6
.
Cu restrict ia de centralizare 1, centrul lui 16a este fara nici o ambiguitate DR
1
,
adica Nicolae (pentru ca exista un singur pronume). Propozit ia 16b cont ine doua
pronume, asa ca restrict ia de centralizare poate satisfacuta de una din relat iile
DR
4
= DR
1
, DR
5
= DR
1
; nu exista nici o preferint a daca El
4
din 16b se refera
la Nicolae sau Gabriel.

In funct ie de intuit ie, acesta este ales dintre ei; n
majoritatea cazurilor este ales Nicolae.
14.3. PRONUME SI CENTRALIZARE (FOCUS) 163
Sa facem un studiu formal al acestei situat ii. Exista patru combinat ii posibile ntre
centrul unei propozit ii si centrul urmatoareia. Ele sunt sumarizate n Tabelul 14.3.
Cand centrul ramane acelasi ntre cele doua propozit ii, tranzit ia este o continuare
Tabelul 14.3:
Cb
2
= Cp
2
Cb
2
= Cp
2
Cb
1
= Cb
2
Continuare Finalizare
Cb
1
= Cb
2
Schimbare cu preferint a Schimbare far a preferint a
sau o nalizare a celei precedente, dupa cum urmatoarea preferint a de centru se
schimb a sau nu. Daca centrul se schimb a, apar doua cazuri, dupa cum noul centru
este sau nu cel preferat.
Aceste restrict ii pot formulate astfel:
Restrict ia de centralizare 3

In Tabelul 14.3 ordinea preferint elor este:


Continuare - Finalizare - Schimbare cu preferint a - Schimbare fara
preferint a.
Sa consideram acum din nou interpretarea discursului 16, prezentat a schematic
n Tabelul 14.4:
Tabelul 14.4:
Propozit ia 16a: Nicolae
1
se plimba prin parc
2
cand l
1
-a ntalnit pe Gabriel
3
.
Entitat ile discursului: Cp : DR
1
= Nicolae
1
;
Altele: DR
2
= Parc7, DR
3
= Gabriel1
Centrul discursului: Cb : Nicolae1
Propozit ia 16b: El
4
l
5
-a invitat la o petrecere
6
.
Interpretarea 1: (Continuare)
Entitat ile discursului: Cp : DR
4
= Nicolae1;
Altele: DR
5
= Gabriel1, DR
6
= Petrecere1
Centrul discursului: Cb : Nicolae1
Interpretarea 2: (Finalizare)
Entitat ile discursului: Cp : DR
4
= Gabriel1;
Altele: DR
5
= Nicolael, DR
6
= Petrecere1
Centrul discursului: Cb : Nicolae1
Deoarece Nicolae si Gabriel sunt referit i pronominal n 16b, restrict ia 2 cere ca
164 PRELEGEREA 14. CONTEXTUL LOCAL AL DISCURSULUI
centrul sa e Nicolae1. Dar aceasta nu precizeaza exact la cine se refera El
4
; de
aceea sunt doua antecedente posibile: DR
1
- centrul n contextul local, indicand o
continuare a centrului precedent, si DR
3
- indicand o schimbare catre urmatorul
centru preferat. Restrict ia 3

prefera interpretarea 1, asa ca El


4
se refera tot la
Nicolae1.
14.4 Descrieri denite
O descriere denita se refera la un obiect unic determinat n context.
Pentru aceasta se poate folosi informat ie din toate cele patru tipuri de context:
obiectul poate denit unic sau prin proprietat i specice, sau poate descris n
contextul local sau global al discursului.
Expresiile substantivale trebuiesc privite distinct dupa modul lor de denire:
existent ial sau referent ial. Astfel:
Citirea existent iala asigura existent a unui obiect unic care satisface condit iile
descrierii;
Citirea referent iala foloseste descrierea pentru a se referi la un obiect cunoscut
anterior, prin numele sau sau printr-un pronume.
Prin citirea referent ial a, auditoriul poate identica obiectul de referint a, fara
sa e obligat sa accepte existent a acestuia.
De remarcat ca o descriere denita nu trebuie sa identice obiectul ntr-un sens
absolut al cuvantului, asa ca se poate folosi contextul discursului pentru a restrange
aria referint elor posibile. Uneori o expresie substantival a referent ial a se poate referi
cu succes la un obiect care nu este identicabil n univers de catre participant ii la
discut ie.
De exemplu, sa consideram discursul:
17a. Elena a cumparat ieri o masin a
i
si o rulota.
17b. Ea a platit prea mult pentru masina
i
.
El este neinteligibil daca vorbitorul sau ascultatorul nu pot identica masina n
lumea reala. Descrierea denita masina din 17b identica n mod unic un obiect
din KB, anume acea masin a pe care Elena a cumparat-o, evocata n propozit ia
precedent a.
Acest exemplu sugereaza o paralela stransa ntre descrierile denite si pronume,
desi exista si unele diferent e. Astfel, descrierile denite nu poseda acea tendint a
puternica de a avea antecedente n contextul local imediat, cum au pronumele. De
asemenea, ele nu se pot co-referi cu mai mult i constituient i n aceeasi propozit ie.
Descrierile denite se pot referi la obiecte care nu au fost introduse anterior n
contextul discursului. Aceste obiecte sunt unice pentru discurs, n funct ie de un
anumit nt eles.
De exemplu, descrierea denita Luna se refera n mod normal la satelitul natural
al Pamantului, desi sunt numite Luni si satelit i ai altor planete; deci se poate face
14.4. DESCRIERI DEFINITE 165
referire la ele n anumite contexte; dar fara un context specic care face relevanta
existent a altor Luni, descrierea se refera la obiectul standard.
De asemenea, descrierile denite se pot referi la obiecte vizual prezente pentru
participant i, dar care nu au fost ment ionate.
De exemplu, daca am ajuns n fat a unei case, pot ruga pe cineva sa mi deschida
usa (fara a face referire explicita la care us a anume; se subnt elege ca este vorba de
usa din fat a a casei).
Se pot specica restrict iile unei referiri denite corect introducand conceptul de
unicitate contextuala.
Denit ia 14.2 Un obiect O este unic contextual n raport cu o descriere DX, o
situat ie S care include denirea specica si generala si un context al discursului
format dintr-o secvent a de contexte locale ale discursului C
1
, . . . , C
n
daca si numai
daca:
1. Exista un numar k astfel ncat:
(a) pentru tot i i < k, nu exista nici un obiect x C
i
pentru care D
x
este
adevarata;
(b) O este singurul obiect n C
k
astfel ncat DX este adevarata.
2. Altfel, exista un obiect unic O n S astfel ncat DX este adevarata.
Aceasta denit ie sugereaza un algoritm de prelucrare a expresiilor substantivale,
care modica modul de cautare prin listele istorice.
Intrare: O descriere denita de forma < UL x D
X
> unde D
X
este formula
care reprezinta descrierea.
Algoritm:
1. Se testeaza ecare entitate r din contextul local al discursului pentru a
vedea daca D
r
este adevarata.
Daca D
r
este adevarat a pentru un singur r, atunci acesta este refe-
rentul.
Daca se gasesc mai multe elemente r, atunci descrierea este aban-
donata ntr-un mod sau altul.
Daca nici o entitate a discursului nu satisface D
X
, atunci procedura
se repeta pe contextul anterior al discursului.
2. Daca nu s-a gasit nici un referent n nici un context local, se testeaza
daca D
X
este adevarata pentru un obiect (unic) din S.
Ca la interpretarea pronumelor, decizia nala despre referent va trebui data de
sistemul general de rat ionament. Deci, algoritmul ment ionat mai sus va trebui sa
sugereze o lista total ordonata de referent i posibili. Aceasta informat ie va adaugat a
la forma logica, similar cum s-a procedat pentru pronume.
Pentru a identica referent ii unei expresii substantivale complexe, tot i termenii
referent iali din expresie trebuiesc rezolvat i simultan.
166 PRELEGEREA 14. CONTEXTUL LOCAL AL DISCURSULUI
Exemplul 14.6 Sa consideram NP casa din colt .
Daca pentru a gasi referentul la aceasta expresie ncercam sa stabilim o ordonare,
pot apare dicultat i suplimentare.
De exemplu, sa presupunem ca se cauta ntai referentul la colt . Se poate imagi-
na o situat ie n care exista doua colt uri P
1
, P
2
si doua case C
1
- aata n colt ul P
1
,
si C
2
- situata pe aceeasi strada S. Aceasta situat ie poate descrisa de formula:
Casa(C
1
), Casa(C
2
), Colt (P
1
), Colt (P
2
), Strada(S)

In(C
1
, P
1
),

In(C
2
, S).
NP casa din colt se refera n mod clar la C
1
, dar colt este ambiguu ntre P
1
si P
2
.
Deci, aarea unui referent unic pentru colt va esua, asa ca va esua de asemenea
cautarea pentru tot NP.
Cautarea simultana elimina acest neajuns; n acest exemplu, se va cauta simultan
un obiect care satisface formula
c : CAS

A(c) p : COLT(p) .

IN(c, p)
La aceasta ntrebarea raspunsul este unic, anume cand c este instant iat cu C
1
iar p cu P
1
.
14.4.1 Citirea existent iala si referint a indirecta
Citirea existent ial a identic a un obiect unic denit de descriere. Dar chiar unicitatea
nu este o condit ie sucienta pentru determinarea acestui obiect.
De exemplu, daca ne aam ntr-o scoal a si directorul spune
Copilul este bolnav.
acesta, desi unic, nu este determinat far a informat ii suplimentare.
De fapt, citirea existent iala poate doar introduce un obiect, denindu-l n ter-
menii altor obiecte care pot denite referent ial. Fie exemplul:
18. Castigatorul la cursa de 3000 m obstacole a fost roman.
Nici vorbitorul si nici auditoriul nu trebuie sa stie exact cine a castigat cursa,
dar ambii sunt de acord ca acesta a fost unic, si - mai mult - acea persoana este de
cetat enie romana.
Deci, descrierile denite nu se refera totdeauna la obiecte aate deja n istoria
discursului. Ele pot ns a introduce obiecte. Acest proces poarta numele de aco-
modare, datorita faptului ca auditoriul acomodeaza vorbitorul introducand obiecte
si proprietat i necesare pentru ca propozit ia sa e nt eleasa.
Pentru unicitatea existent ei este introdus cuanticatorul;
!x : R
x
. P
x
Aceasta formula este adevarat a numai daca exista un obiect unic care satisface
regula R
x
, si daca P
x
este adevarata pentru acest obiect.
Cu acest cuanticator, propozit ia 18 - n care presupunem ca proba de 3000 m
obstacole se refera la obiectul CURSA 3000 - se translateaza n:
! c : C

ASTIGA(c, CURSA 3000) . ROM

AN(c)
14.4. DESCRIERI DEFINITE 167
Entitat ile discursului evocate de expresiile substantivale denite existent ial sunt
generate la fel ca cele nedenite. Singura diferent a este ca aici referentul este denit
precis de catre descriere.

In particular, entitatea discursului pentru castigatorul cursei de 3000 m obstacole


va entitatea discursului C
1
, unic denita prin
C

ASTIGA(C
1
, CURSA 3000).

In schimb, pentru o expresie substantivala nedenita cum ar


Un alergator n proba de 3000 m obstacole a fost roman.
entitatea discursului R
1
va denita prin:
ALERG

ATOR IN(R
1
, CURSA 3000) & ROM

AN(R
1
)
Unele citiri existent iale nu includ explicit termeni referent iali care sa poata
folosit i la identicarea lor unica.

In aceste cazuri, obiectul si relat ia trebuiesc inter-
ferate din contextul discursului.
Ca exemplu, sa consideram discursul:
19a. Clubul la care activez a organizat o cursa.
19b. Castigatorul a primit o masina.
Nu exista nici un complement n expresia substantivala castigatorul care sa indice
n raport cu ce este denit el. Dar, daca termenului lexical castigatorul i este data
aceeasi interpretare semantica ca la 18, aceasta sugereaza ca interpretarea poate :
!c : C

ASTIGA(c, PRO)
unde *PRO* este un termen anaforic care trebuie denit prin context.
Aceasta idee este mai clara daca se da un exemplu unde nu exista un concurs
unic determinat de context. Astfel:
20a. Atat clubul la care activez cat si cel la care este nscris Radu au organizat
curse.
20b. Castigatorul a primit o masina.
Propozit ia 20b este sau gresita (nu are nici un referent) sau foarte imprecisa
deoarece suporta o interpretare n care ambele curse au avut acelasi castigator.
Exemple de referire indirecta pot apare folosind cuvinte care nu sunt interpretate
n mod normal ca funct ii relative la un alt obiect. Astfel:
21a. Toma a adus un stilou la masa.
21b. Dar a constatat ca are varful rupt.
NP varful din 21b, care - intuitiv - se refera la varful stiloului pe care l-a adus
Toma la masa, constituie problema. Acest tip de referint a poate caracterizat
denind o relat ie R si un termen anaforic *PRO*. Interpretarea corecta a acestei
expresii substantivale necesita aarea unei forme si a unei relat ii *R*. Varful se va
aplica atunci ntr-o citire existent ial a de forma:
!v : V

ARF(v) & R (v, PRO)


unde *R* si *PRO* vor identicate prin context.

In acest exemplu, se ajunge
la forma
!v : V

ARF(v) & PARTE DIN(v,STILOU)


168 PRELEGEREA 14. CONTEXTUL LOCAL AL DISCURSULUI
unde s-a presupus ca STILOU este entitatea discursului generata de stilou din
21a.
De asemenea, deoarece cuvantul varf este ambiguu (av and mai multe nt elesuri:
varf de munte, varf de cut it etc), relat ia denita i identic a si sensul corect din
propozit ie.
De remarcat ca unele relat ii folosite pe pozit ia *R* sunt foarte uzuale si nu aduc
mult a informat ie n context.
Astfel, relat ia PARTE DIN este de fapt o relat ie de incluziune, des folosita. De
exemplu,
Cand am intrat n clasa, am observat ca tabla era zgariata.
Aici trebuie introdusa si informat ia ca n general clasele au table.
14.4.2 Referint e la obiecte neevocate prin NP
Toate situat iile de citiri referent iale studiate n aceasta prelegere au folosit antece-
dente evocate prin expresii substantivale. Sunt nsa posibile referiri si la alte obiecte
ale propozit iei.

In majoritatea cazurilor, cont inutul expresiei care face referirea
specica explicit faptul ca aceasta referire este de un tip special.

In general referentul acestor construct ii este gasit n contextul local. Sa con-


sideram de exemplu cateva continu ari ale propozit iei
Ion s-a dus la Brasov anul trecut.
Se pot face referiri la acest eveniment, ca n propozit iile:
Calatoria i-a schimbat viat a.
Aceasta i-a schimbat viat a.
Se poate face referint a la act iunea pe care a facut-o Ion:
El face acum asta n ecare an.
Paul a reusit abia acum.
Ne putem referi la faptul ca Ion s-a dus la Brasov, prin propozit ii de forma:
Asta a luat-o prin surprindere pe Anca.
Se poate face - n sfarsit - referire la timpul si locat ia evenimentului, folosind
pronumele speciale atunci si acolo:
Atunci era iarna.

Ii place sa se duca acolo.


Exista doua modalitat i de prelucrare a acestor referint e. anume:
1. Mult imea generata a entit at ilor discursului poate extinsa pentru a include
orice act iune, eveniment, timp, locat ie, sau propozit ie descrisa implicit n
clauza;
2. Deriveaz a (atunci cand este necesar) referint ele din contextul local.
Ambele abordari sunt la fel de mult folosite n practica.
Prelegerea 15
Propozit ii eliptice si anafora
15.1 Referint e denite bazate pe mult imi
Sa ne ocupam de situat ia referint elor denite care folosesc mult imi sau se refera la
mult imi de obiecte denite anterior.

In general, modicatorii din expresiile substantivale care descriu mult imi pot
deni e proprietat i ale mult imii ns asi, e proprietat i ale elementelor din mult ime.
Deci expresia substantivala:
Cei trei oameni care au par asit petrecerea.
descrie o mult ime de cardinalitate trei, n care ecare membru este o persoana
caracterizata prin faptul ca a parasit petrecerea.
Citirea existent iala a acestei NP denite va ceva de forma:
!M : |M| = 3 & M = {m|OM(m) & P

AR

ASI(m, PETRECERE1)}
Unicitatea se bazeaza pe faptul ca exact trei oameni au par asit petrecerea; alt-
fel, ar mai multe seturi posibile care ndeplinesc aceasta proprietate. Pentru
comparat ie, descrierea nedenita
Trei oameni care au parasit petrecerea.
va reprezentat a prin
M : |M| = 3 & M {m|OM(m) & P

AR

ASI(m, PETRECERE1)}.
Deoarece mult imea M nu este unica, petrecerea poate parasit a de mai mult de
trei oameni.
Expresiile substantivale la plural folosesc n mod constant referirea indirecta,
adesea la submult imi ale mult imilor deja introduse.
De exemplu, sa consideram discursul:
1a. Cat iva baiet i si fete au venit la petrecere.
1b. Baiet ii au plecat la miezul nopt ii.
Expresia Baiet ii nu descrie o mult ime prezent a explicit n contextul local ci de-
neste o mult ime indirect, anume mult imea tuturor baiet ilor din mult imea anterior
ment ionat a. Pentru a ret ine aceasta interpretare, o translatare a lui 1b poate :
P

AR

ASI(B1, 12PM) unde B1 = {x|B

AIAT(x)} PROSET
169
170 PRELEGEREA 15. PROPOZIT II ELIPTICE SI ANAFOR

A
n care s-a notat cu PROSET o mult ime denita contextual. Daca notam cu
S2 entitatea discursului generata de Cat iva baiet i si fete din 1a, aceasta se poate
rezolva prin
P

AR

ASI(B1, 12PM) unde B1 = {x|B

AIAT(x)} S2.
Ca un alt exemplu, sa consideram discursul
2a. Ion, Anca, Radu si Maria merg la mare.
2b. Baiet ilor le-a fost frica sa intre n apa.

In propozit ia 2b, descrierea Baiet ilor se refera la mult imea {Ion, Radu}, unic
denita prin intersect ia mult imii baiet ilor cu {Ion1, Anca1, Radu1, Maria1} intro-
dusa de expresia substantivala conjunctiva data de 2a.
Aceasta tehnica funct ioneaza n multe cazuri; probleme apar atunci cand mult i-
mea de referint a nu este prezent a n universul local al discursului.
Sa consideram discursul:
3a. Paul l-a ntalnit la Mihai pe plaja.
3b. Cei doi baiet i s-au dus apoi la magazin.
Aici 3a nu deneste explicit nici o mult ime. O propunere ar ca mult imea
{Paul, Mihai} sa devina relevant a via un rat ionament despre situat ie.

In acest caz
se poate folosi cunostint a generala ca atunci cand doi oameni se ntalnesc, ei sunt
mpreuna si deci formeaza o mult ime noua.
Dar aceasta tehnica nu funct ioneaz a totdeauna; astfel ea nu se poate aplica
pentru discursul:
4a. Paul traieste la Bucuresti iar Mihai la Iasi.
4b. Cei doi nu s-au ntalnit niciodata.
Prelucrarea la modul general a unor asemenea cazuri ramane problematica.
15.1.1 Referirea la elementele unei mult imi
Cand o mult ime este n contextul discursului, descrierile se pot referi si la elemente
ale sale. Multe exemple folosesc cuvinte specice care semnaleaza aceasta com-
portare.
De exemplu, cuvantul unul poate semnul unei referiri indirecte la o mult ime;
astfel, n discursul:
5a. La turneu, un junior a jucat cu trei mari maestri.
5b. Cel put in pe unul l-a nvins.
5b. I-a nvins pe tot i nafara de unul.
O reprezentare cat mai completa a lui unul poate obt inut a daca translatam
aceasta referire n
x : x PROSET
unde PROSET este determinat referent ial.

In 5b antecedentul va mult imea
marilor maestri cu care a jucat juniorul n turneu; sa o notam MAESTRU1. Atunci
forma pentru 5b care realizeaza o referire nedenita, este:
x : x MAESTRU1 .

INVINGE(x, JUNIOR1)
15.1. REFERINT E DEFINITE BAZATE PE MULT IMI 171
Referirea denita realizata n 5b este o referire de forma:
!x : x MAESTRU1 &

INVINGE(x, JUNIOR1).
Se pot imagina si exemple mai complexe, n care nu exista nici o modalitate ex-
plicita de semnalare cand este denita contextual referint a printr-o mult ime. Astfel:
6a. Silviu a utilizat n drumul lui doua mijloace de transport.
6b. Calatoria cu avionul i-a placut mai mult.

In acest caz se poate can contextul discursului sa nu e nici un obiect cu proprie-


tatea ca este avion. Pe de-alta parte, expresia substantivala a selectat un element
din mult imea ment ionata anterior si i-a adaugat proprietat i noi (care, prezumtiv o
determina n mod unic). Deci, presupunand ca am notat cu TRANSP1 entitatea
discursului pentru doua mijloace de transport, reprezentarea propozit iei 6b este:
t! : t TRANSP1 & AV ION(t) . PREFERA(Silviu1, t)
Deoarece asemenea situat ii cont in proprietat i necunoscute auditoriului nainte
de perceperea propozit iei, ele sunt adesea dicil de detectat.
15.1.2 Cuanticatori universali pentru mult imi
Cuanticatorii universali cum ar ecare sau oricare au o comportare interesanta.
Sintactic, ei sunt singulari si traverseaza propozit iile folosind pronume singulare, ca
n
Orice om
i
, cand vede marea, aceasta l
i
fascineaza.

Intre propozit ii, totusi, acesti cuanticatori evoca o mult ime ca entitate a dis-
cursului; de exemplu:
7a.

In parc, ecare baiat
i
a vazut-o pe Sanda.
7b. * El
i
s-a suparat pe ea.
7b. Ei
i
s-au suparat pe ea.
De remarcat ca El din 7b nu se poate referi la unul din baiet ii introdusi n
universul cunoasterii de 7a; acest lucru este posibil cu Ei din 7b

. Asa ca entitatea
discursului evocata de 7a este mult imea
{x|B

AIAT(x) &

IN(x, PARC1)}.
Aceste expresii substantivale folosesc adesea o referint a denita implicit la o
mult ime care limiteaza domeniul cuanticatorului. De exemplu, entitatea discursu-
lui generata pentru Fiecare fata din propozit ia
Fiecare fata a vazut-o pe Laura.
luata izolat (fara context) va un element din mult imea {x|FAT

A(x)}. Aceasta
este ns a o interpretare foarte dicil de utilizat, deoarece ea exprima ideea ca orice
persoana din lume care este fata a vazut-o pe Laura. Sa luam ns a discursul:
8a. Mai multe fete s-au dus la petrecere.
8b. Fiecare fata a vazut-o pe Laura.
172 PRELEGEREA 15. PROPOZIT II ELIPTICE SI ANAFOR

A
Cand se prelucreaza 8a, expresia Mai multe fete va crea o constanta - sa o numim
F1 - care reprezinta aceasta mult ime de fete. Cu F1 folosit drept context local
pentru propozit ia 8b, interpretarea lui Fiecare fata poate privit ca un element din
F1; forma logica (translatarea) lui 8b va f : f F1 . V EDE1(f, Laura1).
Aceasta analiza trateaza expresia substantivala
ecare fata ca o parafraza pentru ecare din fetele
si
orice fata ca oricare din fetele.
Mult imea fetelor trebuie determinata referent ial si este folosita apoi ca domeniu
pentru cuanticator.

In alte situat ii, mult imea este denita folosind referint a indirecta.
Exemplul 15.1 Sa consideram 8b n contextul creat de propozit ia
Mai mult i baiet i si fete s-au dus la petrecere.
Aici entitatea BF1 a fost creata pentru mult imea baiet ilor si fetelor, cu pro-
prietatea ca s-au dus la petrecere.

In acest caz, domeniul este generat printr-o
intersect ie, ca la 1b. Translatarea lui 8b va n acest caz:
!F3 : F3 = {x|FAT

A(x)} BF1 f : f F3 . V EDE1(f, Laura1)


15.2 Expresii eliptice
Dupa cum s-a evocat n prelegerea anterioar a, eliptica apare la folosirea unor clauze
care nu sunt propozit ii complete sintactic. Adesea, part ile lipsa pot acoperite prin
clauzele majore anterioare. Eliptica poate apare ca efect al conjunct iilor, ca n
9. Nelu a vazut lmul si Cici a facut la fel.
unde se nt elege ca Cici a vazut si ea lmul.
Alte cazuri privesc perechi de propozit ii, cum ar :
9a. Unii gandesc ca Silviu va castiga cursa de saptamana viitoare.
9b. Dar n-a reusit.
O aplicat ie important a a elipticii se refera la chestionare; de exemplu, ntre doua
persoane poate apare urmatorul dialog:
10a. A: A gasit Mioara banane ?
10b. B: Da.
10c. A: Dar pepene ?
Aici a doua armat ie a lui A poate nt eleas a numai n contextul primei sale
ntrebari si este o forma eliptica a lui
A gasit Mioara pepene ?
15.2. EXPRESII ELIPTICE 173
15.2.1 Restrict ii sintactice referitoare la expresiile eliptice
Majoritatea analizelor referitoare la expresiile eliptice se bazeaza pe ipoteza ca struc-
tura completa a clauzei eliptice corespunde structurii clauzei precedente. Odata
identicat a corespondent a structurala dintre cele doua clauze, interpretarea seman-
tica a clauzei anterioare poate actualizata cu noua informat ie adusa de clauza
eliptica, pentru a produce o noua interpretare.
Sa consideram din nou propozit ia 9, a carei analiza este facuta n Figura 15.1:
Figura 15.1:
Clauza contextuala: Nelu a vazut lmul.
Structura sintactica:
(S (NP Nelu)
(V P a vazut
(NP lmul)))
Forma semantica: VEDE1(Nelu1, FILM24)
Clauza eliptica: Cici a facut la fel.
Structura sintactica:
(S (NP Cici)
(V P a facut))
Comparand structurile sintactice, va gasit a o similitudine ntre Nelu si Cici.
Aceasta va determina modicari cerute de forma semantic a, n modul urmator:

Intai Nelu1 va scos din forma semantic a abstracta a primei clauze, obt inandu-se
(n termeni de -calcul - pentru detalii, a se vedea [3]):
p V EDE1(p, FILM24).
Aceasta forma este aplicata apoi noii informat ii, anume interpretarea lui Cici
pentru a produce forma semantic a a clauzei eliptice:
V EDE(Cici1, FILM24).
Tehnica exemplicata anterior lucreaza si pentru cazuri mai complexe. Astfel,
un exemplu clasic n literatura (numit problema identitat ii colaterale) foloseste dis-
cursuri voit ambigui, cum ar :
11a. Mihai si-a sarutat sot ia.
11b. La fel si Sandu.
Propozit ia 11b poate nsemna faptul ca Sandu a sarutat sot ia lui Mihai (in-
terpretare numita citire colaterala) sau ca si-a sarutat propria sa sot ie. Structura
sintactic a va lucra ca mai sus si va gasi o corespondent a ntre Mihai si Sandu.
Sa presupunem ca forma semantic a a lui 11a este
S

ARUTA1(Mihai1, SOTIA LUI(Mihai1)).


Pentru a genera forma semantic a a lui 11b, aceasta forma trebuie abstractizata;
sunt doua feluri de a o abstractiza:
p S

ARUTA1(p, SOTIA LUI(Mihai1)) si


p S

ARUTA1(p, SOTIA LUI(p)).


Aplicarea lui Sandu1 n prima forma va conduce la
174 PRELEGEREA 15. PROPOZIT II ELIPTICE SI ANAFOR

A
S

ARUTA1(Sandu1, SOTIA LUI(Mihai1))


iar n a doua forma, produce:
S

ARUTA1(Sandu1, SOTIA LUI(Sandu1)).


Deci ambele citiri pot obt inute formal, similar intuit iei.
15.2.2 Un algoritm bazat pe sintaxa
Intrare:
Structura sintactic a din contextul local;
O structura sintactica part ial a generata de clauza eliptica.
Algoritm: Consta n gasirea corespondent ei structurale dintre doua clauze.
Aceste corespondent e pot aate prin cautarea unui pattern derivat din frag-
mentul de intrare.
1. Pentru a aa fragmentele care pot sintactic paralele n structura, se ncepe
cu un tip care cont ine toata informat ia din fragmentul de intrare, exceptand
cuvintele aate n structura (substantive sau adjective). Cuvintele auxiliare
(prepozit ii, articole) sunt pastrate.
2. Daca acest pattern nu conduce la o iesire corecta prin nlocuirea cu ele-
mentele aate n clauza curent a, se reia ncercarea, pastr and mai put in a
informat ien pattern (de exemplu se elimina restrict iile de num ar, articolele,
prepozit iile, modicatorii etc).
3. Daca s-a gasit o corespondent a, STOP.
Altfel, se reia pasul anterior.
Observat ii:
Procesul este mult inuent at de factorii sintactici ai textului.
Un analizor sintactic bottom-up poate produce aceasta analiza, chiar daca o
analiza completa a propozit iei nu poate realizata.
Pentru anumite construct ii, cum ar V P eliptice, corespondent a este reali-
zata neambiguu. O astfel de expresie verbal a consta din verbul a face (sau
construct ii echivalente: a act iona, a se comporta, . . .) urmat de un modicator
(la fel, tot asa, identic, din contra, . . .) care indica aparit ia unei construct ii
verbale eliptice; n acest caz, corespondent a se face ntre cei doi subiect i.
Pentru alte construct ii, aarea acestei corespondent e este mai dicila.
Exemplul 15.2 Sa reluam dialogul 10 n care NP din clauza eliptica corespunde
obiectului NP din clauza precedenta.
15.2. EXPRESII ELIPTICE 175
Clauza contextuala: A gasit Mioara banane ?
Structura sintactica:
(S[inter] (V P gasit)
(NP1 Mioara
(NP2[3p] banane)))
Forma semantica: ? G

ASIT1(Mioara1, Banane2)
Clauza eliptica: Dar pepene ?
Structura sintactica:
(S[inter] (DAR dar)
(NP pepene))
Aici, patternul init ial este
(V P[3s] NP1[nume] NP2[3s, plural]).
Aceasta structura sintactica a clauzei contextuale este instant iata cu constituien-
t ii care pot nlocuit i; singurul posibil ar pepene pe pozit ia NP2; dar nu se
verica coincident a de numar.
Se reia procedeul cedand informat ie, anume cu patternul
(V P[3s] NP1[nume] NP2[3s]).
Aici se gaseste o nlocuire posibila a expresiei banane cu pepene si se ajunge
la construct ia corecta
A gasit Mioara pepene ?
Daca si la acest pas nu s-ar reusit o construct ie corecta, se continua cu re-
laxarea condit iilor, ncercand patternul
(V P NP1[nume] NP2), apoi
(V P NP1[nume]) urmat de
(V P NP1), iar n nal
(V P).
Formele eliptice care constau din o secvent a de constituient i sunt mai complicate.
Sa considera m exemplul:
12a. A: A pus tata bananele pe masa ?
12b. B: Da.
12c. A: Si nghet ata n frigider ?
Interpretatea corecta a lui 12c va folosi doi constituient i independent i (n loc de
unul), anume NP nghet ata si PP n frigider (care este un complement al verbului a
pune). Cautarea completarii patternului se face pentru ecare constituient separat,
cu restrict ia pastrarii ordinii ntre ei.
176 PRELEGEREA 15. PROPOZIT II ELIPTICE SI ANAFOR

A
15.2.3 Preferint e semantice
Algoritmul discutat anterior nu identica totdeaunan mod unic fragmentele corecte.
Sa consideram ca exemplicare dialogul:
A: A pus tata nghet ata n frigider ?
B: Nu.
A: Dar friptura ?

In acest caz, patternul generat de fragmentul de intrare ofera posibilitat i de


nlocuire pentru trei NP-uri: tata, nghet ata, frigider; sintactic, toate pot nlocuite
cu sanse egale de friptura. Este necesara o informat ie semantic a pentru a indica
preferint a pentru friptura. La fel, daca replica lui A ar fost
Dar menajera ?
atunci se nlocuia tata, iar pentru replica
Pe masa ?
se nlocuia n frigider.
O tehnica care sa ia n considerare aceste informat ii semantice ar introducerea
unei masuri de similaritate semantic a ntre fragmentele de intrare si fragmentele
nale, iar apoi algoritmul sa preia fragmentul cel mai apropiat conform cu aceasta
masur a.
Pentru exemplul dat, sa presupunem ca sistemul are o taxonomie ierarhica data
n Figura 15.2:
Figura 15.2:
TATA MENAJERA MARE MIC GATITA DULCE MAGAZIN
FRIGIDER MASINA RADIO CINA INGHETATA
UMAN APARAT HRANA CLADIRE
ANIMAT NEANIMAT
OB FIZIC
?
?
-
?
?
?
?
-
?
-
?
?
?
-
?
?
?
-
?
?
?
-
? ?
?
?
-
? ? ? ?
Sa luam cea mai simpla masura de similaritate, anume distant a dintre noduri.
Pentru exemplul dat, distant ele vor :
d(cina, tata) = 7 d(cina, nghet ata) = 4 d(cina, frigider) = 6.
Daca se alege pentrunlocuire constituientul a carui familie este cea mai apropia-
ta de cina, acesta este nghet ata.
15.3. ANAFORA DE SUPRAFAT

A 177
Evident, pot apare si cazuri n care aceasta construct ie nu funct ioneaza cu rezul-
tate bune. Daca interpretorul semantic nu este capabil sa analizeze corect structura
rezultata, pot obt inute alte alegeri.
Sa consideram urmatorul dialog:
A: Ai vazut in magazin pe menajera ?
B: Da.
A: Dar frigiderul ?
Aici, o nlocuire conform algoritmului anterior va conduce la
Ai vazut n frigider pe menajera ?
deoarece d(frigider, menajera) = 7, d(frigider, magazin) = 5.
De obicei nsa, regulile semantice sunt sucient de bogate pentru a determina
improbabilitatea unei asemenea armat ii. Algoritmul va sugera atunci alternativa
urmatoare, cu menajera ca posibil element nlocuit, ceea ce duce la o construct ie
semantic corecta:
Ai vazut n magazin frigiderul ?
15.3 Anafora de suprafat a
Exista o clasa de expresii referent iale care introduc obiecte noi, legate de obiectele
din universul discursului. Aceste cazuri sunt numite anafore
1
de suprafat a deoarece
multe teorii se refera la ele n termenii formei de suprafat a a propozit iei precedente,
spre deosebire de cazurile tratate anterior care se refereau la obiectele din contextul
discursului si sunt numite anafore de adancime.
Sa consideram cateva exemple de anafora de suprafat a:
13a. Spune-mi gradul lui Mateescu n CSC271.
13b. Da-mi-l si n MTH444.
13b. Spune-l pe al lui Ionescu, tot n MTH444.
Obiectele la care se face referint a n 13b si 13b

nu sunt ment ionate n 13a. Dar


contextul creat de 13a sugereaza sa interpretam ecare termen ca un grad diferit
(gradul lui Mateescu si respectiv al lui Ionescu n MTH444).
Exista componente sintactice specice care sa semnaleze anafora de suprafat a.
O clasa larga foloseste expresiile substantivale cu un cuvant lipsa:
lui Mateescu n MTH444.
Se pot utiliza construct ii adverbiale, de tipul: ca, la fel cu, si el, care indica
explicit o comparat ie cu ceva din contextul discursului.
Exista mai multe metode propuse pentru a lucra cu anafora de suprafat a.
Una din ele foloseste identicarea pe o structura sintactic a/semantic a, asa cum
s-a procedat la construct iile eliptice. Ideea se bazeaza pe faptul ca expresia
anaforei de suprafat a este un constituient incomplet. Expresia este procesata
1
Anafora: procedeu stilistic constand n repetarea unui cuvant la nceputul mai multor fraze
sau part i de fraza pentru accentuarea unei idei sau pentru obt inerea unor simetrii.
178 PRELEGEREA 15. PROPOZIT II ELIPTICE SI ANAFOR

A
parcurgand arborele sintactic al propozit iei precedente, pana se aa un cons-
tituient a carui structura corespunde cu structura cautat a, apoi se extrage
informat ia respectiva - pentru ca mpreun a cu informat ia curent a sa formeze
o expresie noua care poate analizata cu procedeele obisnuite si sa produca o
interpretare.

In exemplul de sus, pentru 13b

se procedeaza n acest fel pana se selecteaza


constituientul gradul, care va nlocui pronumele -l.
O alta abordare se bazeaza pe semantic a. Ea presupune ca informat ia care
lipseste este caracterizata de o anumita mult ime anterior ment ionata. Pentru
aceasta se prelucreaza abstract iile mult imilor denite n contextele anterioare.
Astfel, propozit ia 13a va evoca mult imea (cu un singur element) a gradelor lui
Mateescu:
{g| GRAD(g, Mateescu, CSC271)}.
O abstractizare a acesteia poate mult imea gradelor oricui
{g|p : PERSOAN

A(p) . GRAD(g, p, CSC271)}


sau mult imea gradelor lui Mateescu pe orice scala:
{g|c : SCAL

A(c) . GRAD(g, Mateescu, c)}.


Anafora de suprafat a va selecta una din aceste mult imi si i va adauga pro-
prietat i suplimentare, bazate pe informat ia nou introdusa n fraza.
Modul de inferent a necesita totusi un algoritm care sa stie sa incorporeze
modicatorii adit ionali. Acestia sunt destul de dicili si nu reusesc sa acopere
ntotdeauna toate cazurile.
Bibliography
[1] Allen, J. - Natural Language Understanding, The Benjamin/Cummings Publ.
Co. Inc, 1995
[2] Atanasiu, A - Bazele Informaticii; suport de curs pentru anul II seral; Tipograa
Universitatii, 1987;
[3] Atanasiu, A. - Modele matematice n scrierea compilatoarelor; Ed. Olimp, 1996.
[4] Craciun, Dragos- Analizor morfologic pentru limba romana, Lucrare de licent a,
1997
[5] Holan, T, Kubon, V, Platek, M - An implementation of Syntactic Analysis of
Czech, Proceedings of Fourth International Workshop on Parsing Technologies,
Prague and Karlovy Vary, sept. 20-24, 1995, pp. 126-135.
[6] Joshi, A.K., Levi, L.S., Takahashi, M. - Tree Adjunct Grammars, J. Comput.
Syst. Sci. 10(1), 1975.
[7] Joshi, A.K. - How much context-senzitivity is necessary for Characterizing
Structural description - Tree Adjoining Grammars; n Natural Language Pro-
cessing - Theoretical Computational and Psychological Perspectives, Cam-
bridge University Press, 1985.
[8] Joshi, A.K. - The relevance of Tree Adjoining Grammar to generation; n Nat-
ural Language Generation, Martinus Nijho Publishers, Dordrecht, 1987
[9] Schabes, Y. - Mathematical and Computational aspects of Lexicalized Gram-
mars; Eight European Summer School in Logic, Language and Information,
Praga, 12-23 August 1996
[10] Gramatica Limbii Romane, Editura Academiei, 1966
179
Prelegerea 16
Agent conversat ional
16.1 Ce este un agent conversat ional

In aceasta sect iune, prin agent conversat ional vom nt elege o int a (sau ceva
similar) care poate participa la un dialog purtat n limbaj natural. Aplicat iile unei
astfel de construct ii sunt numeroase, plecand de la tipul de comunicare om - masina
care se doreste a se realiza n viitor, pan a la stabilirea subtilitat ilor caracteristice
unei limbi.
Primele ntrebari care se pun relativ la un agent conversat ional sunt:
De ce trebuie el sa vorbeasc a ?
Ce motiv are sa spuna orice sau sa ncerce sa nt eleaga ce i se spune ?
De exemplu, sa consideram o baza de date de tip ntrebare - raspuns realizata
printr-un program, care pentru ecare intrare executa urmatoarele operat ii:
1. Analizeaza si interpreteaza ntrebarea sub o forma logica reprezent and o cerin-
t a;
2. Executa cerint a folosind baza de date si genereaza o iesire.
Poate considerata aceasta un agent conversat ional ?
Raspunsul este negativ, deoarece ea nu va putea react iona pozitiv la nici o cerint a
care nu satisface regulile - foarte precise - de intrare; nici o alta formulare antreb arii,
oricat de apropiata de cea folosita de program, nu este acceptata.

In plus, ea nu
este capabila de nici o comportare independent a care sa poata primi calicativul de
inteligenta.
Ce tras aturi trebuie sa aibansa un agent pentru a putea calicat cu inteligen-
t a ? Credem ca cele mai specice sunt:
Percept ii: agentul trebuie sa e capabil sa perceapa lumea din jurul sau;
Cunostint e: agentul trebuie sa aiba o reprezentare constienta a starii univer-
sului n care este ncorporat
1
;
1
prin aceasta denire se va nt elege ceea ce crede agentul ca este adevarat
179
180 PRELEGEREA 16. AGENT CONVERSAT IONAL
Dorint e: agentul trebuie sa aiba raspunsuri (pozitive sau negative) la diverse
stari ale universului, dispunand de un mod de a le compara;
Planicare/rat ionament: trebuie sa e capabil sa rat ioneze asupra cailor de a
atinge alte stari;
Strategii: agentul trebuie sa aiba capacitatea de a decide act iuni pentru schim-
barea starii universului;
Intent ii: trebuie sa poata ment ine strategia act iunii decise;
Act iuni: agentul trebuie sa e capabil sa act ioneze si deci sa-si schimbe starea.
Un agent conversat ional traieste ntr-un univers al limbajului si logicii. Singurele
sale percept ii sunt armat iile care i se adreseaza, iar singurele act iuni sunt armat iile
pe care le genereaza.
Din cele sapte aspecte ale comportarii inteligente ment ionate anterior, patru -
percept ii, planicari, strategii, act iuni sunt procese, iar celelalte trei - cunostint e,
dorint e, intent ii, sunt componente ale starii cognitive ale agentului.
Un model pentru un agent inteligent este dat n Figura 16.1
Figura 16.1:
Cunostint e
Dorint e
Intent ii
-
-
? -
-
6
-
-
6

?
Percept ii
Planicare
Strategii
Act iuni
Se observa de aici ca agentul si actualizeaza permanent cunostint ele bazate
pe percept ii, foloseste aceste cunostint e pentru a rat iona relativ la posibile strategii
pentru a-si planica anumite intent ii bazate pe cunostint ele si dorint ele sale, intent ii
pe care le realizeaza prin act iuni.
Pentru a aplica un astfel de model la limbaje, trebuie precizata not iunea de
armat ie.
Denit ia 16.1

In limbaj natural, o armat ie este un act de vorbire; prezent a ei
este fundamentala n dezvoltarea agentului conversat ional.
Actele de vorbire sunt precizate prin anumite verbe, cum ar a ntreba, a cere,
a informa, a nega, a mult umi, a felicita, a conrma etc.
16.1.1 Limbajul ca activitate multi-agent
Limbajul foloseste totdeauna mai mult i agent i. Alte forme de comunicare - cum ar
scrisul - fac doar o extensie n timp a comunicarii. Orice persoana comunic a cu
16.1. CE ESTE UN AGENT CONVERSAT IONAL 181
scopul nal de a afecta starea cognitiva a celorlalt i. Monologul nu constituie un
agent conversat ional.

In plus, comunicarea nu poate apare daca unul din agent i nu percepe ncercarea
celuilalt de a comunica.
Exemplul 16.1 Sa presupunem ca Ion si Ana sunt amant i si pun la punct o schema
n care Ion o poate vizita pe Ana numai daca aceasta lasa fereastra deschisa. Astfel,
fereastra constituie un mijloc de comunicare ntre cei doi.

Intr-o zi, ind foarte cald, Ana deschide fereastra pentru a se racori; Ion intra
ind sigur ca acesta este semnalul convenit. Nu mai spunem ce se ntampla.
Alta data, desi este cald, Ana deschide fereastra pentru a-l anunt a pe Ion ca poate
veni. Dar acesta nu intra, convins ca deschiderea ferestrei s-a facut doar pentru a
racori camera.
Ambele cazuri sunt situat ii n care ecare din parteneri nu recunoaste intent ia
de comunicare a celuilalt.
Deci, o comunicare poate apare numai atunci cand un agent intent ioneaza sa trans-
mita ceva, iar celalalt agent recunoaste aceasta intent ie.
O alta cerint a pentru comunicare este existent a unui set de convent ii cunoscut
de tot i agent ii, cu semnicat ii neambigui.

In exemplul de sus exista numai doua simboluri convenite: fereastra deschis a


(semn de sigurant a) si fereastra nchis a (semn de pericol). Astfel, Ion si Ana si-au
denit propriul lor limbaj, care funct ioneaz a perfect - din pacate, numai cand nu
este prea cald.
Conform cu Austin (1962), atunci cand se spune ceva, se realizeaza trei act iuni:
actul locut ionar: realizarea unei armat ii ca o secvent a de cuvinte;
actul ilocut ionar: act iunea prin care vorbitorul realizeaza actul locut ionar;
actul perlocut ionar: act iunea care apare ca urmare a armat iei.
Revenind la Exemplul 16.1: act iunea de deschidere a ferestrei reprezint a actul locu-
t ional; el poate realizat cu sau far a intent ia de a comunica. Cand Ana deschide
fereastra cu intent ia de a semnala ca drumul este liber, ea executa un act ilocut ional.
Daca Ion vede fereastra deshisa si nt elege semnicat ia mesajului - atunci actul
perlocut ional - convingerea ca este asteptat - este realizat.
Unele verbe se folosesc pentru a descrie acte ilocut ionale, iar altele - pentru acte
perlocut ionale. Actele ilocut ionale pot folosite n propozit ii care exprima explicit
act iunea ce trebuie realizata; aceste utilizari se numesc explicit performative.
De exemplu:
Promit ca maine nu mai pierd vremea.
Prin aceasta va informez ca avet i de platit o amenda.
Pe de-alta parte, verbul a convinge descrie un act perlocut ional. De remarcat ca
o intent ie poate transmisa cuiva, dar aparit ia ei este sub controlul agentului are
face armat ia. Deci, nu se poate spune:
182 PRELEGEREA 16. AGENT CONVERSAT IONAL
* Prin aceasta va conving ca avet i de platit o amenda.
Un act perlocut ional poate realizat far a ca celalalt agent sa e nevoit sa re-
cunoasca intent ia de comunicare.
De exemplu, Paul l poate convinge pe Dorin ca are de platit o amenda las and
actul respectiv n cutia postala.
O problema dicila n nt elegerea limbajului consta n identicarea actului ilocu-
t ional creat de vorbitor. Astfel, acelasi act locut ionar
Stit i cat este ceasul ?
poate genera trei act iuni ilocut ionale diferite: o ntrebare cu raspuns Da/Nu, o
ntrebare despre ora exacta, sau o ntrebare despre pret ul unui obiect care se vinde.
Identicarea sensului corect al unui act locut ional este problema fundamentala
din teoria vorbirii.
16.2 Reprezentarea cunostint elor
Sunt multe moduri de reprezentare a cunostint elor unui agent, n funct ie de cat de
profunde sunt ele si cat de dornic de comunicare este agentul.
Astfel, sa folosim ca baza de cunostint e KB toate evenimentele acestui an si
sa spunem doar ca tot ce este n KB este cunoscut de agent
2
. Aceasta denit ie va
produce un agent limitat. El nu va putea - de exemplu - sa-si reprezinte informat ia
despre cunostint ele celorlalt i agent i, astfel ca nu este motivat sa comunice. Mai
mult, nu se poate proteja, deoarece nu poate face deosebire ntre ceea ce stie si ce
observa adevarat n univers - deci percept ia nu i foloseste pentru a aa ceva nou.
Cea mai simpla extensie este divizarea KB-ului n zone numite spat ii de cunos-
tint e. Un astfel de spat iu este un set de propozit ii care reprezinta cunostint ele unui
anumit agent. Practic, va necesar un predicat modal - Cred - care leaga un agent
de un spat iu de cunostint e, si ia valoarea adevarat daca si numai daca spat iul
respectiv caracterizeaza cunostint ele agentului.
Faptul ca o propozit ie p este n spat iul de cunostint e al agentului A va nt eleas a
prin armat ia:
A crede ca p.
Pentru ca unele propozit ii folosind predicatul Cred pot apare si n alte spat ii, va
necesara o ierarhizare a spat iilor de cunostint e.
Exemplul 16.2 Fie un KB descris n Figura 16.2. Cele doua coloane reprezinta
acelasi set de propozit ii; coloana din stanga le listeaza n logica modala(cu predicatul
Cred), iar cea din dreapta le grupeaza pe spat ii de cunostint e.
Acest KB strange cunostint ele lui Ion n spat iul BS1 - deci Ion crede ca Dick
este caine, cainii musca, si cunostint ele lui Ana sunt stranse n BS2.
Spat iul BS2 descrie ceea ce crede Ion ca crede Ana: Dick este un caine, cainii
musca, si ca orice caine care musca poarta zgarda.
2
O propozit ie este n baza de cunostint e a unui agent daca agentul crede ca ea este adevarata.
16.2. REPREZENTAREA CUNOSTINT ELOR 183
Figura 16.2:
Cred(Ion1,Caine(Dick1))
Cred(Ion1,x : Caine(x).Musca(x))
Cred(Ion1, CRED(Ana1,Caine(Dick1)))
Cred(Ion1, CRED(Ana1,
x : Caine(x).Musca(x)))
Cred(Ion1, CRED(Ana1,
x : Caine(x).Musca(x) Zgarda(x)
CRED(Ion1,BS1)
BS1:Cunostint ele lui Ion
Caine(Dick1)
x : Caine(x).Musca(x)
CRED(Ana1, BS2)
BS2: Cunostint ele lui Ion
despre cunostint ele lui Ana
Caine(Dick1)
x : Caine(x).Musca(x)
x : Caine(x).Musca(x) Zgarda(x)

Intr-un astfel de model, inferent a este data relativ la un spat iu. De exemplu, n
raport cu BS2, putem trage concluzia ca Dick poarta zgarda, deci Ion crede ca
Ana crede caDick poarta zgarda.
O astfel de concluzie nu poate trasa n spat iul BS1: Ion nu crede ca Dick
poarta zgarda.
Denit ia 16.2 Propozit iile listate n spat iul de cunostint e ale unui agent formeaza
cunostint ele explicite ale agentului.
Propozit iile care pot derivate prin inferent e formeaza cunostint ele implicite
ale agentului.
Exista o distinct ie neta ntre ce crede un agent si ce crede acel agent ca alt i agent i
cred. Aceasta se reliefeaza clar cand asistam la o conversat ie ntre doua persoane
cu vederi diferite.
De exemplu, sa presupunem ca Ana crede ca o carte Zece negri mititei, este pe
biroul lui Ion, dar crede ca Ion crede ca aceasta carte este n biblioteca. Daca Ana
ntreaba:
Ai citit cartea de pe birou ?
ea se va referi la Zece negri mititei, indiferent ce va spune Ion despre carte.
Deci, cunostint ele unui agent relativ la cunostint ele altui agent joaca un rol
important n nt elegerea oricarui limbaj.
Problema care apare este cat de adanc trebuie iterat nivelul de cunostint e pentru
a nt elege toate limbajele.
Exemplul 16.3 Sa presupunem ca Ion crede ca Ana l-a mint it cand i-a spus ca
ploua.

In acest caz, Ion va crede urmatoarele:
Nu ploua.
Ana crede ca nu ploua.
Ana crede ca Ion crede ca ploua.
Amandoi cred ca nu ploua, dar Ion mai crede ca Ana crede ca el se gandeste ca
ploua, pentru ca el crede ca ea crede ca minciuna ei a fost crezuta.
184 PRELEGEREA 16. AGENT CONVERSAT IONAL

In exemplul de sus a fost introdus un al treilea nivel; evident ca se pot introduce


similar un num ar arbitrar de nivele de cunostint e. Un mod de solut ionare a pro-
blemei consta n introducerea not iunii de cunostint e comune - cunostint ele pe care
ambii agent i le cunosc si ecare crede ca celalalt le cunoaste. Acestea pot constitui
elementul de nceput al oricarei conversat ii.
16.2.1 Despre cunostint ele altora
O alta problema extrem de dicila este cuanticarea cunostint elor pe care agentul
A crede ca le poseda agentul B, dar pe care A nu le stie.
De exemplu, Ion crede ca Ana stie numele mamei ei, dar el nu cunoaste acest
nume. Folosind logica modala, se introduce n spat iul de cunostint e al lui Ion
propozit ia
1. !x . Cred(Ana1,Nume(Mama(Ana1),x))
De remarcat ca o armat ie de forma:
2. Cred(Ana1, !x . Nume(Mama(Ana1),x))
semnica cu totul altceva: Ana stie ca mama ei are un nume !
Se introduce un operator nou StieDespre care formalizeaza faptul ca un agent
cunoaste un obiect unic care satisface o anumit a descriere. Folosind notat ii de -
calcul ([3]), el se poate deni astfel:
StieDespre(A, x, P
x
) ! y . Cred(A, ((x P
x
), y)) y . Cred(A, P
y
)
Cu aceasta notat ie, formula 1 se scrie
StieDespre(Ana1,x Nume(Mama(Ana1),x))
O alta forma de cunostint e reprezinta ceea ce un agent A stie ca alt agent crede
ca un anumit fapt este adevarat (fara ca A sa aiba idee daca acesta este adevarat
sau nu).
De exemplu, Ion poate crede ca Ana stie daca a luat examenul sau nu. Acest
lucru poate reprezentat n logica modala ca o disjunct ie de cunostint e. Problema
este unde va scrisa aceasta disjunct ie: nafara sau n interiorul operatorului modal
Cred.
Astfel, daca disjunct ia este interioara operatorului, adica:
Cred(Ana1, Luat(Ana1, Examen) Luat(Ana1,Examen))
aceasta reprezent a faptul ca Ana stie ca a luat examenul sau stie ca nu l-a
luat. Este o informat ie stiut a sigur de Ana sau oricare alt agent rat ional (conform
principiului tert ului exclus).
Celalalt caz (cu disjunct ia n exteriorul operatorului) se reprezinta:
Cred(Ana1, Luat(Ana1, Examen)) Cred(Ana1, Luat(Ana1,Examen))
Aici, Ana stie ca a luat examenul sau nu stie ca l-a luat.
16.3. DORINT E, INTENT II SI PLANURI 185
Pentru reprezentarea n spat iul cunostint elor, se foloseste un operator nou
StieDaca, denit prin
StieDaca(A, P) Cred(A, P) Cred(A, P)
16.3 Dorint e, Intent ii si Planuri
La prima lectura, se pare ca cele doua not iuni Dorint a si Intent ie au aceeasi semni-
cat ie: scop, t inta, vrere. Sa ncerc am sa punem n evident a diferent ele dintre ele,
justicand printre altele si realizarea de stari cognitive distincte.

In general, dorint ele reecta starile universului pe care un agent le gaseste placute
sau neplacute. Un agent poate avea mai multe dorint e, adesea aate n conict unele
cu altele.
De exemplu, vrei sa ai cateva zile libere si sa mergi la munte. Pe de-alta parte,
ai un examen si doresti sa iei o nota buna, deci vei sta acasa pentru a nvat a. Aceste
doua dorint e intr a n conict si comportarea va rezulta printr-un compromis care sa
mpace si capra si varza.
Intent iile ns a nu vor niciodata n conict. Nu pot i niciodata sa intent ionezi
sa mergi la munte pentru recreere si sa stai sa nvet i. Intent iile sunt legate puternic
de comportare si nu sunt posibile doua act iuni n acelasi timp.
Exista doua not iuni ale termenului intent ie.
Prima - intent ia act iunii - se refera la proprietatea unei act iuni intent ionate.
De exemplu, se da o mare important a diferent ei ntre o alergare fara t inta, facuta
numai de dragul de a alerga, si o alergare efectuata pentru a ajungentr-un loc precis.
A doua este numit a direct ia viitoarei intent ii, si reecta deciziile care vor luate
pentru viitoarea act iune.
De exemplu, daca dupa o anumit a deliberare ai decis ca este mai important sa
lasi de-o parte pregatirea pentru examen si sa mergi la munte, asta nseamn a ca ai
adoptat o direct ie a viitoarei decizii: destinderea la munte.
Desi pe baza unei direct ii a viitoarei intent ii se ajunge la o act iune intent ionata,
nu ntotdeauna o astfel de intent ie este si realizata. De exemplu, dupa ce ai decis
ca mergi la munte, descoperi ca nu ai cu cine, ca tot i prietenii nvat a, te apuca un
val de remuscari si revii sa nvet i. Nu este binent eles un scenariu agreabil, dar este
pe deplin posibil.

In problemele de reprezentare a cunostint elor, acest concept de direct ie a viitoarei


act iuni este cel mai sensibil. Vom introduce un operator numit Intent ie care leaga un
agent de act iunea pe care intent ioneaz a sa o ntreprinda. Exista mai multe restrict ii
care vor luate n considerare:
Restrict ia de rat ionalitate 1: Un agent nu poate intent iona sa faca doua
act iuni care se exclud reciporc.
Restrict ia de rat ionalitate 2: Un agent nu poate intent iona sa porneasca o
act iune pe care nu o poate realiza.
Aceste doua restrict ii sunt greu de exprimat n forma logica.

In cele ce urmeaza
vom considera numai act iuni care satisfac cele doua restrict ii.
186 PRELEGEREA 16. AGENT CONVERSAT IONAL
Evident, planurile, scopurile si planicarea sunt legate de intent ii. Dar legatura
este mai complicata decat la prima vedere.
De exemplu, propozit ia
Ion planuieste jefuirea unei banci.
poate avea doua semnicat ii diferite:
Ion intent ioneaz a sa atace o banca;
Ion a lucrat la o schem a cu care cineva poate jefui o banca.

In prima descriere, a avea un plan semnica una din direct iile viitoarelor intent ii, n
timp ce n a doua descriere, a avea un plan nseamna n principiu ca Ion stie cum
sa jefuiasca o banca. Aici deci, un plan reprezinta un set de act iuni care conduc la
un anumit efect (ca o ret et a). A avea o ret eta nu nseamna neaparat ca exista o
intent ie.

In general, not iunea plan este folosita n ideea de ret eta.


Denit ia 16.3 Un plan este un set de act iuni cu un anumit efect, numit scopul
planului.
Un scop este o propozit ie care reprezinta o rezultanta a act iunilor descrise de
plan, sau chiar o act iune realizata de act iunile planului.
Recunoasterea unui plan se refera la problema construirii unui plan - ret eta,
format dintr-un set de act iuni.
Pentru a evita confuzii, nu vom folosi termenul de plan legat de not iunea de intent ie.
Structura intent ionala a unui agent este o component a mintala a sa (cum sunt
cunostint ele si dorint ele). Ea apare n momentul cand agentul ncepe realizarea
unui plan. Exista o corespondent a stransa ntre structura unui plan si structura
intent ional a rezultata.
Exemplul 16.4 Sa presupunem ca Ion cunoaste un plan foarte simplu pentru a
merge la munte; stand langa gara, va lua trenul. Planul este o secvent a de cunostint e
care spun ca daca Ion va lua trenul n direct ia corecta, el va ajunge la munte. La
sfarsit de saptamana, Ion vrea sa mearga la munte. Cunoscand acest plan, el l
poate adopta.

Isi va pune n aplicare intent ia luand trenul spre munte.

In Figura 16.3 sunt reprezentate cunostint ele lui Ion despre plan si structura
intent ionala pentru adoptarea lui.
Figura 16.3:
Cred(Ion1, Intentie(Ion1, IaTren(Ion1))&
Genera(IaTren(Ion1), Intentie(Ion1, MergeMunte(Ion1))&
MergeMunte(Ion1))) Intentie(Ion1, Genera(IaTren(Ion1),
MergeMunte(Ion1)))
Stiind un plan de mers la munte Intent ia de a merge la munte
De remarcat ca intent iile trebuie sa includa atat act iunile cat si relat iile dintre
act iuni. De exemplu:
16.4. ACTELE DE VORBIRE CA ACTE COMUNICATIVE 187
Daca se omite act iunea IaTren, atunci Ion va dori sa mearga la munte dar
nu va avea un plan cum sa ajunga acolo.
Daca se omite act iunea MergeMunte, Ion va intent iona sa ia trenul, dar nu
necesar pentru a merge la munte.
Daca se omite relat ia Genera, atunci Ion poate efectua independent ecare
act iune (poate merge cu trenul, apoi poate sa ajunga la munte cu o masina).
Este interesant faptul ca intent iile se pot exprima n funct ie de act iuni. Pollack
(1990) a introdus un operator Cu astfel:
Fiind date act iunile , , Cu(, ) este act iunea de efectuare a lui facand .
Atunci, a treia intent ie din Figura 16.3 va
Intentie(Ion1,Cu(MergeMunte(Ion1), IaTren(Ion1)))
16.4 Actele de vorbire ca acte comunicative
Dupa cum am vazut, actele de vorbire sunt act iuni realizate prin procesul emiterii
de sunete. Ele vizeaza doar doua tipuri de acte: cele ilocut ionare si perlocut ionare.
Din puncte de vedere ilocut ionar, se pare ca sunt cinci tipuri (clase) de acte de
vorbire. Fiecare act iune din clasa este specicata ulterior prin condit ii suplimentare.
Cele cinci clase sunt:
1. Clasa reprezentativa: vorbirea este orientat a pentru a sublinia adevarul
armat iilor prezentate. Aici intra acte descrise de verbe ca a informa, a nega,
a arma, a conrma;
2. Clasa directiva: vorbirea ncearc a sa inuent eze intent iile si comportarea
altui agent. Sunt incluse act iunile descrise de verbe ca a cere, a comanda, a
ruga, a invita, a ntreba;
3. Clasa orientativa: vorbitorul se refera la act iuni viitoare, cum ar cele
descrise de a promite, a comite;
4. Clasa expresiva: vorbitorul exprima o stare psihologica sau o react ie; aici
intr a verbe ca a felicita, a mult umi, a slavi, a mult umi, a ura;
5. Clasa declarativa: vorbitorul realizeaza anumite convent ii sau act iuni ritu-
ale. Exemple caracteristice sunt a da foc, a se ruga, a se resemna.
Se pare ns a ca datorita restrict iilor modelului impuse de planicare, actele perlo-
cut ionare capata o important a deosebita; motivul este ca acestea prind efectele
intent iilor pe care le exprima agent ii prin vorbire.
Exemplul 16.5 Un agent vrea sa construiasca un plan prin care sa convinga un alt
agent ca un anumit fapt este adevarat, sau ca celalalt agent sa realizeze o anumita
act iune. Pentru aceasta, agentul va construi un act ilocut ionar (din clasa reprezen-
tativa sau din cea directiva) si spera ca celalalt agent sa react ioneze dupa asteptari,
188 PRELEGEREA 16. AGENT CONVERSAT IONAL
nalizand actul perlocut ionar. Evident, pentru construirea actului ilocut ionar, agen-
tul va init ia un act locut ionar care va folosit la momentul potrivit prin exprimarea
unei propozit ii.
Modelul dezvoltat aici foloseste actele comunicative, care corespund actelor perlocu-
t ionare generate de actele ilocut ionare.
De exemplu, actul comunicativ ConvingePrinInformare convinge alt agent sa
creada anumite propozit ii, spunand ca sunt adevarate.
Figura 16.4: Denirea a doua acte comunicative
Clasa de act iune : ConvingePrinInformare
Roluri : Vorbitor, Auditor, Prop
Restrict ii : Agent(Vorbitor), Agent(Auditor),
Propozit ie(Prop), Cred(Vorbitor, Prop)
Precondit ii : La(Vorbitor), Loc(Auditor))
Efecte : Cred(Auditor), Prop)

Clasa de act iune : MotivatDeCerer(e/i)


Roluri : Vorbitor, Auditor, Act
Restrict ii : Agent(Vorbitor), Agent(Auditor), Act iune(Act)
Precondit ii : La(Vorbitor, Loc(Auditor))
Efecte : Intent ie(Auditor, Act)
Exemplul 16.6 Sa consideram ce trebuie sa e adevarat pentru Andrei pentru a
ConvingePrinInformare pe Dana ca ploua la mare:
1. Andrei spune cuvintele Ploua la mare cu intent ia de a o informa pe Dana
de acest fapt.
2. Dana aude propozit ia Ploua la mare si recunoaste intent ia lui Andrei de a o
informa de acest fapt. De aceea, ea decide ca Andrei intent ioneaza sa o faca
sa creada ca ploua la mare.
3. Dana considera evident faptul ca ploua la mare, inclusiv faptul ca Andrei spune
ca ploua.
4. Dana stie ca ploua la mare.
Desi unele act iuni par redondante, tot i pasii descrisi mai sus sunt esent iali. Astfel:
- Daca lipseste pasul 1, Andrei nu spune nimic; astfel s-a eliminat actul locut ional
si - fara condit ia de intent ie - apare un scenariu prin care Andrei scoate niste sunete
oarecare (eventual sub hipnoza). Chiar daca prin absurd Dana are o revelat ie si
realizeaza restul pasilor, Andrei poate nega mai tarziu ca a transmis informat ia ca
ploua la mare.
- Prin lipsa pasului 2, Dana nu aude propozit ia; deci ea aude eventual ceva, dar
nu stie ce, asa ca nu poate comite actul ilocut ional. Chiar daca va parcurge restul
16.5. ACTUL COMUNICATIV SI RECUNOASTEREA INTEN-T IILOR 189
pasilor si va sti n nal ca ploua la mare, Dana va nega ca stie acest lucru de la
Andrei.
- Eliminand pasul 3, Dana - recunoscand ca Andrei ncearca sa i transmita o
informat ie - va ignora complet aceasta informat ie. Este un gest nepoliticos, dar -
chiar daca n nal Dana va sti ca ploua la mare, aceasta nu are nici o legatura cu
ce a spus Andrei.
- Daca se sare peste pasul 4, Andrei i-a spus Danei ca ploua la mare, dar nu a
convins-o.

In acest fel, actul Inform s-a realizat dar ConvingePrinInformare a
esuat.
Act iunile comunicative asigura legatura principala ntre rat ionamentele agent ilor.

In Figura 16.4 sunt reprezentate denit iile a doua acte comunicative de baza n
orice model de comunicare: informare simpla (clasa reprezentativ a) si cerere (clasa
directiva).
Aceste act iuni sunt construite n ipoteza ca agent ii sunt sinceri. De exem-
plu, o restrict ie a actului ConvingePrin Informare este aceea ca vorbitorul crede
n propozit ia pe care o enunt a.
16.5 Actul comunicativ si recunoasterea inten-
t iilor
Far a abilitatea de a recunoaste intent iile agentului partener, act iunile unui agent vor
extrem de dicile.

In particular, va imposibil de nt eles si act ionat ntr-un dialog.
De aceea va trebui sa luam put in n considerare aceasta problema de recunoastere
a intent iilor si cum leaga ea vorbirea de actul de interpretare.

In dialog exista totdeauna un agent care realizeaza act iunea (agent activ) si un
agent care observa act iunea (agent observator). Ceea ce vom discuta aici este modul
n care agentul observator recunoaste intent iile agentului activ.

In primul rand, faptul ca s-a identicat un plan care include toate act iunile
observate nu nseamn a ca acel plan descrie intent iile agentului. Pot mai multe
planuri posibile care cont in act iunile observate, iar agentul activ realizeaza doar
unul din ele. Determinarea exacta a planului corect pare imposibila teoretic.
Dupa cum s-a ment ionat anterior, planul recunoscut trebuie sa e plauzibil, desi
din punctul de vedere al agentului observator poate parea inecient sau gresit. Prac-
tic, aceasta nseamn a ca recunoasterea unui plan se bazeaza numai pe cunostint ele
comune, la care se pot adauga eventual unele informat ii (daca se cunosc) despre
cunostint ele celuilalt agent.
Exemplul 16.7 Sa presupunem ca Radu are o camera a carei usa se deschide nu-
mai pe baza amprentelor mainii sale; Sandu crede ca la camera lui Radu este o
broasca simpla, cu cheie. Cunostint ele lor comune cuprind informat ia ca usa tre-
buie descuiata pentru a intra n camera, informat ii despre efecte ale diverselor acte
comunicative si despre situat ia curenta. Amandoi stiu - de exemplu - ca pentru a in-
tra n camera lui Radu, Sandu trebuie sa i ceara permisiunea lui Radu, si ca acesta
i-o va da (n mod normal).

In aceste condit ii, ce va nt elege Radu din ntrebarea lui
Sandu:
190 PRELEGEREA 16. AGENT CONVERSAT IONAL
Pot i sa-mi dai cheia de la camera ta ?
Sarind peste detalii (cum identica Radu acest act locut ionar ca o cerere pentru
cheie), el poate infera un plan plauzibil n jurul acestei act iuni, astfel:
Armat ia este identicata ca o componenta a act iunii:
MotivatDeCerere(Sandu1, Radu1, Da(Radu1, Sandu1, Cheie(Broasca1)))
Folosind cunostint ele comune despre actele de comunicare, Radu stie ca Andrei
crede ca un efect al acestui act este
Intent ie(Radu1, Da(Radu1, Andrei1, Cheie(Brioasca1)))
care la randul ei, folosind informat ia comuna despre intent ie, va motiva act iunea
Da(Radu1, Andrei1, Cheie(Broasca1))
Cunostint ele comune despre relat iile dintre Radu si Sandu conduc la concluzia
Avea(Sandu1, Cheie(Broasca1))
Aici, Radu crede ca Sandu - crezand ca la usa este o broasca cu cheie - va realiza
act iunea
Deschide(Sandu1, Broasca1)
Radu concluzioneaza ca aceasta act iune este intent ia lui Sandu cand a cerut
cheia.

In ideea ca acesta pare singurul plan plauzibil, Radu presupune ca a denit
structura intent ionala a lui Sandu. Intent iile primare pe care le atribuie Radu lui
Sandu n acest plan sunt:
Intent ie(Sandu1, MotivatDeCerere(Sandu1, Radu1,
Da(Radu1, Sandu1, Cheie(Broasca1))))
Intent ie(Sandu1, Realiza(Avea(Sandu1, Cheie(Broasca1))))
Intent ie(Sandu1, Deschide(Sandu1, Broasca1))

In practica un sistem computat ional care foloseste un astfel de algoritm va con-


duce la o lista de intent ii posibile, care va servi la ordonarea orizontului de astept ari.
Cat de departe trebuie mers pentru a recunoaste intent iile depinde de scopul pe care
vrea sa-l atinga agentul n procesul interactiv.

In unele conversat ii - de exemplu cand
se negociaza un plan de pace - este foarte important sa se cunoasca exact intent iile
partenerului atunci cand vorbeste. Alteori - cum ar cand cineva te opreste pe
strada si te ntreaba cat este ceasul - intent iile interlocutorului nu sunt interesante
(nafara celei evidente - vrea sa stie ora). Un sistem de operare computat ional tre-
buie sa aiba specicat nivelul de detaliu necesar pentru aarea intent iilor; acesta va
depinde de domeniul specic, de problema ridicata, de scopurile urmarite etc.
16.6 Recunoasterea actelor ilocut ionare
Dupa cum s-a subliniat anterior, comunicarea lingvistica nu apare decat daca se
recunoaste intent ia de a face aceasta. Nu exista ns a o corespondent a biunivoca
ntre mult imea frazelor si cea a intent iilor.
Astfel, am vazut ca propozit ia
Stii cat este ceasul ?
poate ntrebare, o cerere sau o oferta, n funct ie de ce a intent ionat vorbitorul.

In acest caz, apare problema modului n care un agent recunoaste intent iile altui
agent din spusele acestuia.
16.6. RECUNOASTEREA ACTELOR ILOCUT IONARE 191
Cea mai uzuala solut ie la aceasta problema este bazata pe ipoteza nt elesului
literal. Ea presupune ca orice propozit ie are un nt eles bazat numai pe convent iile
limbajului. Astfel, exemplul de sus are urmatorul nt eles literal: propozit ia este o
ntrebare cu raspuns Da/Nu n care ascultatorul este chestionat daca stie cat este
ceasul.
Acesta este numit actul de vorbire de suprafat a si este dat de modul sintac-
tic al propozit iei (aici, o propozit ie interogativ a). Fiind dat nt elesul literal, actul
intent ional de vorbire este derivat printr-un proces de inferent a, cum ar cel de
recunoastere a planurilor.
Sunt doua moduri de a privi actul de vorbire de suprafat a.

In prima variant a,
acesta este un act ilocut ionar - care poate uneori gresit.
Astfel, pentru a pune n mod sincer o ntrebare, vorbitorul trebuie sa vrea sa stie
raspunsul.
Exemplul 16.8 Sa consideram o situat ie n care Elena stie ca Paul are probleme
cu timpul, si spune (ca o oferta pentru ajutor):
Stii cat este ceasul ?
Actul de vorbire de suprafat a este o ntrebare cu raspuns dicotomic daca Paul stie
cat este ora; el este ilocut ionar gresit deoarece Elena nu este interesata de raspuns.
Deduct ia ca actul de vorbire de suprafat a este gresit, init iaza cautarea pentru actul
intent ional de vorbire. Din pacate nu este sucient ca actul de suprafat a sa e gresit
pentru a ca propozit ia sa aiba un nt eles ascuns. Astfel, n exemplul de sus, Elena
poate sa nu stie daca Paul stie cat este ceasul, si ntrebarea ei are doua scopuri -
acela de a primi un raspuns, dar si cel referitor la faptul ca ea se ofera sa l ajute pe
Paul.

In cealalta modalitate, actul de vorbire de suprafat a nu este un act ilocut ionar


ci un act la alt nivel de analiza, si inferent a trebuie sa identice actul intent ional de
vorbire. Aici actul de vorbire de suprafat a este doar o parte a analizei semantice a
propozit iei.
Revenind la contextul din exemplul anterior, ntrebarea Elenei este o act iune
Interog cu cont inutul propozit ional
Sti(Paul1,timp).
Atunci, ecare din actele ilocut ionare vor specica ce forme de suprafat a pot
folosite pentru a-l realiza.
Figura 16.5 deneste actul ilocut ional CereRef cu mai multe descompuneri posi-
bile, ecare corespunzand unei anumite forme de act de vorbire de suprafat a. Mai
este prezentat si MotivatInformRef, care este o versiune specializata a act iunii Mo-
tivatDe Cerere.
Cele trei descompuneri corespund formelor de suprafat a folosite de obicei pentru
transformarea unei act iuni CereRef.
Chiar daca se trece direct la citirea indirecta (omit and citirea literala), forma
propozit iei poate afecta tipurile de raspuns. Aceasta sugereaza ca n analiza nala
nu se poate face abstract ie de forma nt elesului literal.
192 PRELEGEREA 16. AGENT CONVERSAT IONAL
Figura 16.5:
Clasa de act iune: MotivatInformRef
Roluri: Vorbitor, Auditor, Pred
x
Restrict ii: Agent(Vorbitor), Agent(Auditor), Pred unar(Pred
x
),
StiRef(Vorbitor, Pred
x
), StiRef(Auditor, Pred
x
)
Precondit ii: La(Vorbitor, Loc(Auditor))
Efecte: Intent ie(Auditor, InformRef(Auditor, Vorbitor, Pred
x
))
Descompunere: CereRef(Vorbitor, Auditor, Prop
x
)
Decide(Auditor, InformRef(Auditor, Vorbitor, Pred
x
))
Act ilocut ionar: CereRef
Descompunere 1: Ce(Vorbitor, Auditor, Pred
x
)
Descompunere 2: Interog(Vorbitor, Auditor, StiRef(Auditor, Pred
x
))
Descompunere 3: Imperat(Vorbitor, Auditor,
InformRef(Auditor, Vorbitor, Pred
x
))
Exemplul 16.9 Sa consideram propozit iile:
Stii cat este ceasul ?
Spune-mi ce ora este.
Cateva raspunsuri posibile la ele sunt:
a) Da, este ora trei.
b) Nu.
c) Ora trei.
d) Nu pot.
Raspunsurile (a, b, c) sunt normale pentru prima ntrebare, pe cand (d) este
fort at.

In schimb, la a doua propozit ie, raspunsurile (a, b) par fort ate, iar (c, d)
sunt normale.
16.7 Nivele de planicare ale discursului
Multe teorii ale discursului se bazeaza pe un set xat de relat ii ntre propozit ii; aceste
relat ii, numite relat ii ale discursului, relat ii retorice, jocuri conversat ionale, miscari
ale discursului (n funct ie de autori) denesc structura unui discurs corect formu-
lat.

In consecint a, identicarea lor este esent iala pentru nt elegerea propozit iilor
din discurs. Armat ia este valabila mai ales n partea de generare a limbajului,
unde sistemul necesita prelucrarea unei mari cantit at i de informat ie, folosind multe
propozit ii.

In astfel de cazuri, partajarea informat iei in unitat i de marimea unei
propozit ii este considerata similara unui proces de planicare bazat pe un set de
relat ii de discurs.
Exemplul 16.10 Sa consideram o aplicat ie n care sistemul are o interfat a cu o
baza de date enciclopedica. Una din problemele pe care trebuie sa le realizeze sis-
temul poate denirea claselor de obiecte.

In mod normal, o astfel de denit ie poate
lua mai multe propozit ii. Denirea unui set de act iuni de nivel al discursului, care
16.7. NIVELE DE PLANIFICARE ALE DISCURSULUI 193
folosesc diverse moduri de denire ale claselor, poate realizata ca o problema de
planicare. Astfel, doua act iuni de nivel al discursului, necesare la denirea claselor
de obiecte, sunt denite n Figura 16.6. Fiecare pas intermediar din DeniClasa este
Figura 16.6:
Act comunicativ: DeniClasa(e)
Roluri: Vorbitor, Audotir, Clasa
Descompunere: IdenticaSuperClasa(Vorbitor, Auditor, Clasa)
IdenticaProprietat i(Vorbitor, Auditor, Clasa)
DaExemplu(Vorbitor, Auditor, Clasa)

Act comunicativ: IdenticaSuperClasa(Vorbitor, Auditor, Clasa)


Roluuri: Vorbitor, Auditor, Clasa
Restrict ii: Agent(Vorbitor), Agent(Auditor), SubTip(Clasa, SuperClasa)
Descompunere: ConvingPrinInform(Vorbitor, Auditor,
SubTip(Clasa, Superclasa))
construit n funct ie de alte act iuni ale actului de vorbire, cum este IdenticaSuper-
Clasa. Sistemul va folosi aceste denit ii pentru a ajuta la planicarea unei secvent e
de propozit ii care denesc obiectul. Astfel, pentru o baza corespunzatoare de date,
la ntrebarea
Ce este un caine ?
sistemul poate planica urmatoarele act iuni de vorbire:
Cainii sunt animale.
Ei au de obicei dimensiuni mici.
De exemplu, Grivei este un caine.
Pentru a se obt ine rezultate mai aproape de astept ari, este necesar sa se stabileasca
mai multe strategii diferite pentru denirea claselor si a restrict iilor din ecare clasa;
pentru ecare problema particulara se va selecta strategia adecvata. De exemplu,
unele clase de obiecte sunt mai bine denite prin comparare si contrast cu alte clase
care sunt deja cunoscute.
Alte aplicat ii folosesc nivelul discursului pentru determinarea structurii dialogu-
lui.
Exemplul 16.11 Sa consideram un sistem automat de comanda, angajat ntr-un
dialog cu un utilizator pentru cumpararea unui produs pe baza unui catalog.
Aici vor trebui denite mai multe etape ale dialogului, cum ar obt inerea adresei si
ordinului de plata, vericarea ordinului, emiterea de informat ii privind modalitatea
de livrare a mari. Un astfel de sistem poate coordonat de un discurs (mult
simplicat) reprezentat n Figura 16.7
Evident, ecare act iune poate descompusa n continuare. De exemplu, Veri-
caNumar este compusa din cel put in doua scrieri: Prima - cand numarul ordinului
de plata este corect - foloseste simpla baza de cunost int e a sistemului. A doua -
cand numarul nu este corect - va continua dialogul pentru reconrmarea lui si posi-
bil, pentru a obt ine mai multa informat ie, eventual alt numar.
194 PRELEGEREA 16. AGENT CONVERSAT IONAL
Figura 16.7:
Discurs scris: IaComanda
Roluri: Sistem, Utilizator, Nume, Adresa, OrdinPlataInf, Produse
Descompunere: BunaZiua(Sistem, Utilizator)
DaAdresa(Sistem, Utilizator, Adresa)
DaOrdinPlataInf(Sistem, Utilizator, OrdinPlataInf )
DaComanda(Sistem, Utilizator, Produse)
VericaLivrare(Sistem, Utilizator, Produse)
Inchide(Sistem, Utilizator)

Discurs Scris: DaOrdinPlataInf


Roluri: Sistem, Utilizator, OrdinPlataInf
Descompunere: MotivaInfRef(Sistem, Utilizator,.x OrdinPlataInf= x)
ConvingePrinInfRef(Utilizator, Sistem, .x OrdinPlataInf= x)
VericaNumar(Sistem, Utilizator, OrdinPlataInf )

In aplicat ii mai generale ale dialogului, planicarea nivelului discursului devine im-
portanta din alte motive. Daca utilizatorul este abilitat sa controleze uxul dia-
logului, atunci sistemul va trebui sa e poata recunoaste ce face acest utilizator.
De exemplu, el trebuie sa recunoasca momentul cand utilizatorul schimb a subiectul
conversat iei si sa e capabil sa discute despre noul subiect. Similar, el trebuie sa
e apt sa recunoasca cand utilizatorul cere informat ii suplimentare despre anumite
aspecte ale dialogului precedent.

In acest fel, complexitatea nivelelor de dialog poate tot mai ridicata.


Bibliograe
[1] Allen, J. - Natural Language Understanding, The Benjamin/Cummings Publ.
Co. Inc, 1995
[2] Atanasiu, A - Bazele Informaticii; suport de curs pentru anul II seral; Tipograa
Universitatii, 1987;
[3] Atanasiu, A. - Modele matematice n scrierea compilatoarelor; Ed. Olimp, 1996.
[4] Craciun, Dragos- Analizor morfologic pentru limba romana, Lucrare de licent a,
1997
[5] Holan, T, Kubon, V, Platek, M - An implementation of Syntactic Analysis of
Czech, Proceedings of Fourth International Workshop on Parsing Technologies,
Prague and Karlovy Vary, sept. 20-24, 1995, pp. 126-135.
[6] Joshi, A.K., Levi, L.S., Takahashi, M. - Tree Adjunct Grammars, J. Comput.
Syst. Sci. 10(1), 1975.
[7] Joshi, A.K. - How much context-senzitivity is necessary for Characterizing
Structural description - Tree Adjoining Grammars; n Natural Language Pro-
cessing - Theoretical Computational and Psychological Perspectives, Cam-
bridge University Press, 1985.
[8] Joshi, A.K. - The relevance of Tree Adjoining Grammar to generation; n Nat-
ural Language Generation, Martinus Nijho Publishers, Dordrecht, 1987
[9] Schabes, Y. - Mathematical and Computational aspects of Lexicalized Gram-
mars; Eight European Summer School in Logic, Language and Information,
Praga, 12-23 August 1996
[10] Gramatica Limbii Romane, Editura Academiei, 1966
195

You might also like