Professional Documents
Culture Documents
.
Constante: valori primitive (eventual indexate) peste un alfabet xat. De
exemplu: a, beta, c
2
, . . .
Variabile: elemente neprecizate, notate cu litere mici (eventual indexate) de
la sfarsitul alfabetului (x, y, z
5
, . . .).
Vom nota cu C, V mult imea constantelor respectiv a variabilelor. Acestea sunt
mult imi (teoretic) innite si disjuncte. Prin denit ie, Term = V C.
195
196 ANEXA 1. CALCULUL CU PREDICATE DE ORDINUL I
Un aspect fundamental - din punct de vedere al aplicat iilor - l constituie sta-
bilirea domeniului L al obiectelor de studiu, domeniu din care vor lua valori varia-
bilele; acesta poarta de obicei numele de univers al discursului. Evident, C L.
Tot aici vor denite si mult imile de valori ale predicatelor.
Predicatele sunt aplicat ii : Term L. Vom nota cu Pred k mult imea predi-
catelor de aritate k(k 1). Astfel, (apartenent a), = (egalitatea) sunt aplicat ii
din Pred 2 n teoria mult imilor; n lingvistica putem exemplica cu
merge, mananca Pred 1, saruta, iubeste, arata Pred 2, . . .
Vom nota cu Pred clasa tuturor predicatelor, indiferent de aritate.
Se deneste inductiv clasa Form, astfel:
Term Form;
Daca P Pred n, T
1
, . . . , T
n
Term, atunci P(T
1
, . . . , T
n
) Form;
Daca P, Q Form atunci
P, (P Q), (P&Q), (P Q), ((P Q) Form;
Daca P Form, x V , atunci
x P Form, x P Form;
Orice formula se obt ine prin aplicarea de un num ar nit de ori a regulilor
precedente.
Observat ii:
1. Uneori se pot introduce predicate noi pentru scrierea simplicata a formulelor.
Astfel, (x = y) poate scrisa x = y prin introducerea unui nou predicat binar
=. Sau, n lingvistica, este cazul antonimelor.
2. Atunci cand este posibil, parantezele sunt eliminate. Aceasta se poate reali-
za n funct ie de prioritatea conectorilor si cuanticatorilor. Daca (x) este
prioritatea lui x, atunci
() = () = () > (&) > () > () = ().
1.2 Axiomele FOPC
1.
A (B A)
(A B) ((A (B C)) (A C))
2.
A (B A&B)
A&B A
A&B B
3.
A A B
B A B
(A C) ((B C) (A B C))
1.3. REGULILE DE INFERENT
A ALE FOPC 197
4.
(A B) ((A B) A)
A A
5.
(A B) ((B A) (A B))
(A B) (A B)
(A B) (B A)
6. x(A(x)) A(a)
7. A(a) x(A(x))
Primele cinci axiome sunt valabile pentru orice calcul propozit ional, iar ultimele
doua sunt specice FOPC.
Aceste axiome sunt de fapt scheme de axiome, n sensul ca ecare caz particular
de alegere a formulelor conduce la o axioma. De fapt, dupa cum se observa din
modul de scriere, orice axioma este o formula (un element din Form).
1.3 Regulile de inferent a ale FOPC
1. Modus Ponens:
A, A B
B
2. Universalizarea consequentului:
C A(x)
C x(A(x))
unde C nu cont ine variabila x.
3. Universalizarea antecedentului:
A(x) C
x(A(x)) C
unde C nu cont ine variabila x.
Daca regula Modus Ponens este adevarat a n orice calcul propozit ional, ultimele
doua reguli de inferent a sunt specice FOPC.
Dupa cum se vede, o regula de inferent a este un procedeu de deduct ie a unei
formule din alta formula.
Teoremele (propozit iile, lemele) sunt deduse din axiome folosind regulile de infe-
rent a.
In acest context, se numeste demonstrat ie a unei formule P Form orice
secvent a nita
1
,
2
, . . . ,
n
i
Form
denita astfel:
n
= P
i
(1 i n) este o axioma sau se obt ine din
1
, . . . ,
i1
prin folosirea unei
reguli de inferent a.
198 ANEXA 1. CALCULUL CU PREDICATE DE ORDINUL I
In ce fel ?
este 3 ?X este ?Y Cunosti ?Y ?
totdeauna 5 ?X Pot i sa dai un exemplu ?
Cand ?
Intr-adevar, totdeauna ?
ce 2 ?X De ce ntrebi ?
Te intereseaza ?
Daca pentru o structura -tip sunt mai multe iesiri posibile, ELIZA selecteaza
cate una distincta pentru ecare aparit ie, n scopul de a preveni repetit ia. Primele
doua raspunsuri ale ELIZEI din Tabelul 1.2 sunt generate pe baza acestei baze de
date.
Dupa cum se vede din descrierea algoritmului ELIZA, programul nu nt elege
conversat ia la care participa. Practic, el este o colect ie de siretlicuri.
De ce totusi a avut ELIZA un succes atat de mare ? Pot mai multe raspunsuri
posibile. Cel mai probabil este acela ca, atunci cand oamenii aud sau citesc o
secvent a de cuvinte pe care o nt eleg ca o propozit ie, ei atribuie nt elesul respectiv
acelei propozit ii si considera automat ca el apart ine celui care a produs-o (chiar
daca este o masin a). Deci ELIZA apare ca inteligent a pentru ca interlocutorii ei si
folosesc propria lor inteligent a pentru a da un sens propozit iilor.
Iluzia de inteligent a este sust inut a si de o alta caracteristica. Sistemul nu are
nevoie de nici un cuvant inteligent, pentru ca el nu face armat ii, nu argumenteaz a
si nu raspunde la ntreb ari. Pur si simplu, el pune o serie de ntrebari, ceea ce,
nafara situat iei pacient - doctor, ar o discut ie inacceptabila. ELIZA ocoleste
toate ntreb arile raspunz and cu alte ntreb ari, cum ar n ultima instant a
12 PRELEGEREA 1. STUDIUL LIMBAJULUI
De ce ntrebi ?.
Nu exista nici o posibilitate n a face programul sa spuna ceva concret despre
orice.
Chiar si n aceste situat ii restrictive, este relativ usor sa demonstram ca progra-
mul nu nt elege. El produce uneori raspunsuri complet aiurea. De exemplu, pentru
ELIZA pe baza caruia s-a dat exemplul din Tabelul 1.2, armat ia
Repetit ia este mama nt elepciunii.
va genera (datorita cuvantului cheie mama) iesirea
Spune-mi mai multe despre familia ta.
De asemenea, cu cat conversat ia progreseaza, devine evident ca ELIZA nu ret ine
nimic din cont inutul discut iei; ea va ncepe sa puna ntrebari care sunt far a sens n
lumina discut iei anterioare.
Sa presupunem ca vi se cere ca n sase luni sa construit i un program de limbaj
natural pentru o anumit a aplicat ie. Daca vet i ncepe construct ia unui model general
al nt elegerii limbajului, el sigur nu va gata n intervalul de timp considerat si va
obt ine rezultate dezastruoase la teste. Un sistem tip ELIZA care sa produca un
comportament de tipul celui de sus, poate scris n mai put in de o jumatate de
an; si cu sigurant a ca el va trece cu succes multe teste. Deci, daca luam ca unic
criteriu performant a pe termen scurt, un program tip ELIZA va preferat; acesta
este totusi inacceptabil pentru scopul nal al proiectului.
Pentru a elimina aceasta posibilitate, va trebui sau sa acceptam anumite ipoteze
teoretice despre arhitectura sistemelor limbajului natural si sa dezvolt am teste de
evaluare specice diferitelor componente, sau sa ignoram rezultatele slabe ale testelor
de evaluare pan a cand sistemul ajunge la un nivel rezonabil de ridicat de performan-
t a.
1.4 Nivele ale analizei limbajului
Un program de limbaj natural trebuie sa se bazeze pe cunostint e considerabile despre
structura limbajului nsusi, inclusiv ce sunt cuvintele, cum se combin a ele pentru
a forma propozit ii, ce nt eles au cuvintele, cum contribuie nt elesul lor la nt elesul
propozit iei s.a.m.d. Totusi aspectul lingvistic al problemei, desi necesar, nu este si
sucient; intervine si un studiu al comportamentului uman - cunostint e generale des-
pre lumea nconjur atoare, precum si abilitat i de rat ionament. De exemplu, pentru a
raspunde la ntrebari si a participa la o conversat ie, o persoana trebuie sa cunoasca
nu numai structura limbajului folosit, dar sa se bazeze si pe o cultura personala.
Nivelurile de cunostint e relevante pentru nt elegerea limbajului natural pot
clasicate n felul urmator:
1. Nivelul fonetic si fonologic; se refera la modul de exprimare al cuvintelor
prin sunete (modul de legatur a si de realizare cuvant - sunet). Astfel de
cunostint e sunt cruciale n sistemele bazate pe voce.
2. Nivelul morfologic; se refera la modul de construct ie al cuvintelor din o serie
de elemente de baza numite morfeme. Un morfem este unitatea structurala de
baza din limbaj care are asociat un nt eles (De exemplu, nt elesul cuvantului
1.4. NIVELE ALE ANALIZEI LIMBAJULUI 13
prietenos este derivat din nt elesul substantivului prieten si a suxului os, care
transforma un substantiv ntr-un adjectiv).
3. Nivelul sintactic; trateaza modul de combinare al cuvintelor pentru a forma
propozit ii corecte, determina rolul structural al ecarui cuvant n propozit ie
precum si relat ia propozit iilor ntr-o fraza.
4. Nivelul semantic; se refera la semnicat ia cuvintelor, modul de combinare al
acestor semnicat ii pentru a forma semnicat ia unei propozit ii. Este studiul
unui nt eles independent de context: o propozit ie tratata far a nici o legatur a
cu contextul n care a fost utilizata.
5. Nivelul pragmatic; trateaza folosirea propozit iilor n diverse situat ii, modul
n care inuent eaz a contextul interpretarea unei propozit ii.
6. Nivelul discursului; se ocupa de modul n care propozit iile anterioare afec-
teaza interpretarea propozit iilor care urmeaza. Un aspect important se refera
la interpretarea pronumelor si la aspectul temporal al informat iei vehiculate.
7. Nivelul cunoasterii universului; include cunostint e generale despre struc-
tura lumii la care face referire utilizatorul pentru ca, de exemplu, sa faca fat a
conversat iei. Sunt incluse toate informat iile pe care trebuie sa le aiba un uti-
lizator despre partenerii sai de discut ie.
Evident, aceasta este o clasicare destul de imprecisa, care nu acopera chiar
toate preocuparile referitoare la lingvistica. Orice eveniment particular poate include
aspecte din mai multe nivele, si un algoritm va trebui sa trateze simultan nivele
diferite.
Exemplul 1.1 Sa ncercam sa arata m prin exemple diferent ele dintre sintaxa,
semantic a si pragmatica. Fie urmatoarele propozit ii:
1. Broastele sunt int e.
2. Broastele verzi au nasuri mari.
3. Ideile verzi au nasuri mari.
4. Mari ideile verzi are nasuri.
Prima propozit ie poate considerata corecta sintactic, semantic si pragmatic. Fie-
care din celelalte armat ii violeaza nsa unul sau mai multe din aceste concepte.
Propozit ia 2 este corecta sintactic si semantic dar nu si pragmatic. Cunostint ele
noastre despre broaste ar respinge valoarea ei de adevar.
Cu propozit ia 3 este mai rau. Ea este corecta sintactic dar este gresita semantic
si pragmatic. Daca propozit ia 2 poate lansata ntr-o discut ie si combatuta eventual
cu argumente, propozit ia 3 nu poate nici macar enunt ata ntr-o conversat ie coe-
renta. Ea nu se poate nici arma si nici nega. Un program care sa o nege pragmatic,
ar trebui sa demonstreze ca ideile nu pot verzi sau - daca sunt - n mod sigur nu
au nasul mare.
14 PRELEGEREA 1. STUDIUL LIMBAJULUI
Propozit ia 4 nu este corecta din nici unul din cele trei puncte de vedere (sintactic,
semantic, pragmatic). Ea este de fapt neinteligibila; nu are o structura pe baza careia
sa putem decide ce este gresit.
Este interesant ca se pot gasi exemple n care o propozit ie, sa e gresit a sintactic
desi este corecta pragmatic. Daca te ntreaba cineva unde mergi si raspunzi
Eu merg facultate.
desi este gresita sintactic, ea are un nt eles pragmatic corect si - eventual, este
chiar si semantic corecta.
1.5 Reprezentari si nt elegeri
O component a cruciala ant elegerii foloseste calculul reprezentarii nt elesului propo-
zit iilor si textelor. Chiar si far a o denire a not iunii de reprezentare, aceasta
armat ie este neclara. De exemplu, de ce nu se foloseste propozit ia nsasi ca o
reprezentare a nt elesului ei ? Un motiv este acela exista multe cuvinte cu nt elesuri
multiple, pe care le numim sensuri. Cuvantul port de exemplu are un sens de sub-
stantiv (loc unde acosteaza navele) si sens de verb (a purta, persoana 1 singular,
prezent). Astfel de ambiguit at i ar crea multiple dicultat i sistemului. Pentru oa-
meni, rezolvarea lor este foarte simpla, reiesind din context; de multe ori oamenii
nu observa ambiguitat ile decat daca li se atrage atent ia, pentru amuzament. Sunt
celebre versurile lui Eminescu
Sa -t i e somnul lin sau
Cobori n jos luceafar bland
carora li se pot gasi astfel de ambiguit at i n exprimare.
Dar daca o persoana nu pare sa ia n considerare toate sensurile unui cuvant,
acest lucru nu este posibil n cazul unui program care trebuie sa le trateze explicit.
Pentru a reprezentant elesul, este necesar un limbaj mai precis. Acesta este oferit
de Limbaje formale, de Logica si de Matematica. O reprezentare utila a limbajului
satisface urmatoarele doua proprietat i:
Este precisa si neambigua. Ea va permite exprimarea oricarei citiri a unei
propozit ii ca o formul a distincta.
Reprezentarea trebuie sa pastreze structura intuitiva a propozit iilor limbaju-
lui natural pe care l modeleaza. De exemplu, propozit iile cu structuri simi-
lare trebuie sa aiba reprezent ari similar structurate; sau - nt elesurile a doua
propozit ii care sunt parafraze una alteia, trebuie sa e foarte apropiate.
1.5.1 Sintaxa; Structura de reprezentare a propozit iilor
Structura sintactic a a unei propozit ii indica modul n care sunt legate ntre ele cuvin-
tele propozit iei. Ea arata cum sunt grupate cuvintele, cum anumite cuvinte modica
altele si care cuvinte sunt de important a central a n fraza.
In plus, sintaxa poate
identica tipurile de relat ii care exista ntre fraze si poate ret ine diverse informat ii
despre structura propozit iei, care vor necesare n prelucrarea ulterioara .
1.5. REPREZENT
ARI SI
INT ELEGERI 15
Exemplul 1.2 Sa consideram urmatoarele doua propozit ii:
1. Ion i vinde lui Maria cartea.
2. Cartea este vanduta Mariei de catre Ion.
Propozit iile au anumite similitudini structurale: ambele folosesc substantivele
Ion, Maria, carte; ambele descriu o act iune de vanzare. Din alte puncte de vedere,
propozit iile sunt semnicativ deosebite. Chiar daca ambele au aceeasi valoare de
adevar, la ntrebarea
Ce face Ion pentru Maria ?
nu poate folosit ca raspuns propozit ia 2, ci numai 1.
Propozit ia 2 poate folosita ca o continuare a unei propozit ii de tipul Desi este
rupta. . ., ca n cele ce urmeaza:
3. (*) Desi este rupta, Ion i vinde lui Maria cartea.
4. Desi este rupta, cartea este vanduta Mariei de catre Ion.
H
H
Hj
@
@R
@
@R
H
H
Hj
H
H
Hj
@
@R
S S
A B
Viat a
A
Viat a
curge
ca
apa curge
B
ca
apa
16 PRELEGEREA 1. STUDIUL LIMBAJULUI
1.5.2 Forma logica
Structura unei propozit ii nu reecta si nt elesul ei. De exemplu, substantivul broasca
poate avea diverse nt elesuri, n funct ie de propozit ia n care este folosit. Ce
semnicat ie se poate da propozit iei
Emil are o broasca ?
Aceea ca Emil are o int a (broasca) sau un obiect pe care urmeaza sa-l monteze la
us a (broasca). Propozit ia este corecta sintactic, semantic si pragmatic, dar ambigua
din punct de vedere al semnicat iei. Sa presupunem ca din discut ie reiese ca a fost
vorba de primul nt eles. Nici acuma semnicat ia nu este completa, putand vorba
de diverse specii de broaste.
Int elesul unei propozit ii depinde de situat ian care este folosita propozit ia respec-
tiva. Exista aici o relat ie ntre dependent a de context si independent a de context.
Faptul ca broasca se refera la un lucru sau o int a, este o informat ie legata de limba
roman a, independent de locul n care este folosit cuvantul. Pe de-alta parte subs-
tantivul broasca se refera la ceva ce are Emil, si depinde de contextul conversat iei.
Denit ia 1.1 Reprezentarea nt elesului independent de context al unei propozit ii se
numeste forma logica.
Forma logica codica sensuri diverse ale cuvintelor si identic a relat iile semantice
ntre cuvinte si fraze. Multe astfel de relat ii sunt regasite n relat iile semantice dintre
verb si substantivul asociat.
De exemplu, n propozit iile 1 si 2, act iunea descrisa este una de vanzare, unde Ion
este vanz atorul, cartea este obiectul n cauza, iar Maria este cumparatorul. Aceste
roluri sunt instant ieri ale unor obiecte semantice generale, sa le numim
AGENT, TEMA, POSESOR FINAL.
Odata determinate relat iile semantice, unele sensuri ale cuvintelor pot deveni
imposibile, si deci vor eliminate dintre posibilitat i.
Exemplul 1.3 Sa luam propozit ia:
Mama ta de-i vie, bine-ar sa vie pe la noi la vie.
Cuvantul vie este folosit aici de trei ori, de ecare data cu alta semnicat ie.
Determinarea interpretarii semantice se face nsa n mod unic, datorita legarii lui
de semnicat iile celorlaltor cuvinte. Astfel, prima utilizare este legata de cuvantul
mama si devine adjectiv; a doua aparit ie este n relat ie tot cu mama, dar prin
pozit ia sa i se asigura interpretarea semantica de verb.
In sfarsit, ind legat de
predicat, a treia aparit ie a cuvantului vie este complement de loc, cu semnicat ie
de substantiv.
Una din problemele cheie n interpretarea semantic a este aceea de a stabili ce
semnicat ii individuale ale cuvintelor se pot combina pentru a crea unnt eles coerent
al propozit iei. Prin exploatarea interconexiunilor dintre semnicat iile cuvintelor,
se poate reduce masiv numarul sensurilor pe care le poate avea ecare cuvant n
propozit ie.
1.6. LIBERTATEA LIMBAJULUI 17
1.5.3 Reprezentarea nt elesului nal
Reprezentarea nala ceruta este o reprezentare generala de cunostint e (KR) pe care
o foloseste sistemul pentru a reprezenta si rat iona asupra domeniului sau de aplicat ii.
Acesta este un limbaj n care sunt reprezentate toate cunostint ele specice bazate
pe aplicat ii. Scopul unei interpret ari contextuale este de a lua o reprezentare a
structurii unei propozit ii si forma sa logica, si de a o aplica ntr-o anumit a expresie
din KR, oferind-o sistemului sa o utilizeze n reprezentarea sa.
De obicei se foloseste ca limbaj de reprezentare nala calculul predicatelor de
ordinul I (FOPC).
Cursul va urmari trei nivele de reprezentare a limbajului natural: structura
sintactic a, forma logica si reprezentarea nt elesului nal. Fluxul de informat ie dat
de un mesaj trece prin urmatoarele etape de prelucrare. Aceasta structura vom
ncerca sa o urmarim. Nu vor mai dezvoltate elementele formale introduse si
studiate n anii anteriori (limbaje formale, translatori, logica, calcul propozit ional),
decat printr-o trecere sumara n revista n cadrul anexelor. Prelegerile vor completa
aceste cunostint e cu elemente specice studierii si analizei proprietat ilor limbajului
natural.
1.6 Libertatea limbajului
Cea ce face deosebit de dicil studiul unui limbaj este dinamica sa, faptul ca el se
modica destul de rapid n timp si spat iu. Un limbaj natural - spre deosebire de
unul articial - nu poate denit strict; de aceea se folosesc anumite convent ii sau
norme de prezentare. O parte din ele sunt:
Gramatica: n general regulile gramaticale (privind lexicul) se modica mult
mai greu n timp; de aceea ele pot folosite destul de ecient n caracterizarea
unei limbi.
Norme fonetice si morfologice. Sunt structurile de baza folosite n construct ia
cuvintelor unei limbi.
Regularitat i ale procesului de comunicat ie. Aici intr a convent ii ale actului de
vorbire, construct ii specice folosite n mod mecanic (de genul Ce mai faci ?,
How do you do etc).
Facem precizarea ns a ca aceste norme nu sunt obligatorii. Orice vorbitor se poate
departa de ele oricat de mult, atata timp cat este nt eles (exemplul tipic l constituie
argourile).
Aceasta libertate rezulta direct din natura interactiv a a limbajului. Astfel:
Vorbitorii vor act iona liber n funct ie de mediu, de variabilitatea situat iilor
sau de contextele verbale;
Posibilitatea repetit iilor face ca unele port iuni de limbaj sa e codicate, pres-
curtate. Exista tendint a de a nu repeta literar anumite pasaje.
18 PRELEGEREA 1. STUDIUL LIMBAJULUI
Aproape orice element de vorbire care poate eliminat, va avea n cele din
urma aceasta soarta. Aceasta este generata nu numai din necesitatea de a vorbi
mai repede, dar si din din acea de a nt elege mai usor semnicat ia mesajului.
Consecint e ale libertat ii limbajului:
Variabilitatea. Vorbitorul va alege si va crea colocat ii si chiar cuvinte noi;
alegerea individuala conduce la schimbarea sistemului. De fapt, n acest mod
s-a creat ecare cuvant din lexic.
Posibilitatea de dezvoltare. Reducerea repetata a morfemelor gramaticale este
legata de aparit ia unor funct ii ale cuvintelor; acest lucru funct ioneaz a cu
condit ia pastrarii unui anumit grad de redundant a a limbii.
Complexitatea limbilor naturale.
Universalitatea. Nevoia de claricare a unor nt elesuri noi face necesara dez-
voltarea limbii pe toate direct iile. De remarcat ca universalitatea este atat o
precondit ie dar si o consecint a a libertat ii limbajului. Ea conduce la imposi-
bilitatea denirii de reguli far a except ii.
Ceea ce face - n ultima instant a - necesar un studiu sistematic al limbajului natural
este observat ia ca
Omul nt elege mai mult decat poate spune dar vorbeste ca sa e nt eles.
Prelegerea 2
Elemente de lingvistica. Sintaxa
limbii
Nu se poate ncepe un studiu de lingvistica computat ional a far a a face o scurta
trecere n revista a structurii sintactice a limbajului natural. Vor tratate n prin-
cipal elemente de sintaxa ale limbii romane, far a a intra n detalii. O dezvoltare de
catre lingvisti a acestui capitol ar putea conduce la un studiu sistematic aprofundat
privind prelucrarea automata a limbii romane.
2.1 Cuvinte
La prima vedere, se pare ca unitatea de baza n structura unei limbi este cuvantul.
Totusi, acesta este departe de a elementul fundamental al studiului n lingvistica,
el ind rezultatul aplicarii unui set complex de alte elemente (considerate primitive).
Denit ia 2.1 Disciplina lingvistica numita morfologie se ocupa cu formarea cu-
vintelor din diverse componente de baza.
Exista doua moduri n care se formeaza cuvintele noi, moduri numite forme
inexionale si derivat ionale.
Formele inexionale utilizeaza o componenta numita radacina a cuvantului,
caruia de obicei i adauga unul sau mai multe suxe. Verbele constituie cel mai
bun exemplu n aceasta direct ie. Fiecare verb are o forma de baza, care este apoi
schimbat an funct ie de persoana si timpul propozit iei; se formeaza astfel conjugarile.
De exemplu, verbul a citi are o rad acina cit, pe baza careia se formeaza conjugarea
din Tabelul 2.1:
Toate elementele din Tabelul 2.1 sunt verbe si au acelasi nt eles.
Morfologia derivat ionala foloseste cuvinte pentru a construi alte cuvinte noi
complet diferite (privind nt elesul si/sau forma gramaticala). De exemplu, substan-
tivul prieten, prin adaugarea suxului -esc devine prietenesc, care este adjectiv; cu
suxul -os se transforma n prietenos si poate folosit ca adverb. O forma ceva mai
complicata este mprietenire. Limba romana ofera moduri deosebit de complicate
n construirea unor astfel de forme derivat ionale.
19
20 PRELEGEREA 2. ELEMENTE DE LINGVISTIC
A. SINTAXA LIMBII
Tabelul 2.1:
Timpul prezent Timpul perfect simplu
eu cit-esc eu cit-eam
tu cit-esti tu cit-eai
el cit-este el cit-ea
noi cit-im noi cit-eam
voi cit-it i voi cit-eat i
ei cit-esc ei cit-eau
Lingvistica clasica cuvintele n categorii diferite, n funct ie de utilizarea lor. Se
pot considera doua zone de interes care contribuie la aceasta mpart ire a cuvintelor.
Prima zona se refera la contribut ia cuvintelor nnt elesul frazei din care fac parte, iar
a doua zona este legata de structura sintactica particulara la care participa cuvintele.
De exemplu, orice limbaj natural cont ine doua clase fundamentale:
Clasa substantivelor, formata din acele cuvinte care se folosesc la identicarea
tipului de baza al unui obiect, concept sau loc;
Clasa adjectivele - acele cuvinte care atribuie diverse calitat i obiectelor, con-
ceptelor sau locurilor.
Astfel, verde este un adjectiv iar padure este un substantiv, dupa cum se vede si
din construct ia padure verde sau paduri verzi. Lucrurile nu sunt ns a asa de simple;
verde poate si substantiv, ca n propozit ia Acest verde este mai deschis decat altul;
de asemenea, si padure poate avea alt rol nafara de substantiv - n construct ia
luminisul padurii. Deci, nu exista o linie neta trasata ntre clase. Problema este
daca ele sunt comparabile sau nu. Aceasta armat ie este falsa si o putem observa
prin urmatorul exemplu. Sa consideram toate cuvintele care, completand propozit ia
Este asa de .., aceasta sa ram an a semantic corecta. Se poate spune: Este asa de
frumos, Este asa de cald, Este asa de bine,.. dar nu putem arma niciodata Este
asa de padure.
La fel, nu toate adjectivele pot folosite si ca substantive; aici exemplele care se
pot da sunt numeroase.
Fie V alfabetul limbii romane si V
monoidul liber generat de V cu operat ia
de concatenare. Vom nota cu ST V
clasa substantivelor limbii romane, iar cu
AJ V
clasa adjectivelor. Din observat iile de sus rezulta urmatoarele relat ii:
ST AJ = , ST AJ = ST, ST AJ = AJ.
Gramatica limbii a pus n evident a patru clase importante de cuvinte.
Inafara de
substantive si adjective, celelalte doua clase sunt: verbe (V ) si adverbe (AV ). Toate
propozit iile sunt construite folosind ca baza cuvinte din aceste clase. Mai sunt si
alte clase de cuvinte necesare n formarea propozit iilor, cum ar articole, pronume,
prepozit ii, particule, cuanticatori, conjunct ii, etc. Dar aceste ultime clase sunt
2.2. ELEMENTELE EXPRESIILOR-SUBSTANTIV SIMPLE 21
xe, n sensul ca sunt except ional de rare cazurile n care apar cuvinte noi care sa e
introduse aici.
In schimb, substantive, adjective, verbe si adverbe noi sunt introduse
n mod constant odata cu evolut ia limbii. De aceea, aceste clase sunt numite clase
deschise de cuvinte, n timp ce celelalte sunt clase nchise de cuvinte.
Orice cuvant din una din cele patru clase deschise de cuvinte poate folosit
pentru a forma baza unei expresii. Acest cuvant va numit liderul (header) expresiei
si va indica tipul de lucru, activitate sau calitate descris de expresie. Vom avea
astfel expresii-substantiv, expresii -adjectiv, expresii-verb si expresii-adverb, ecare
din ele caracterizand o clasa de not iuni (care pot obiecte, nsusiri, act iuni sau
proprietat i). De exemplu, cu expresiile-substantiv, cuvintele lider indica clasele
generale de obiecte descrise. Expresiile
Cabana
Cabana mica
Cabana mica din Bucegi
sunt toate expresii-substantiv care descriu un element din clasa cabanelor. Pri-
mul se refera la un element din clasa tuturor cabanelor, al doilea la un element din
clasa cabanelor mici, iar al treilea, la un element din clasa cabanelor mici situate n
munt ii Bucegi. Cuvantul cabana este lider n toate aceste expresii.
Uneori, o expresie este formata numai din lider (nisip poate considerat expresie-
substantiv, slab poate o expresie-adjectiv, ridicandu-se este expresie-verb, nfo-
metat este expresie-adverb). Cel mai adesea ns a, liderul cere n expresie cuvinte
adit ionale prin care sa clarice nt elesul dorit. De exemplu, verbul a pune nu poate
forma singur o expresie-verb, nt elesul sau neind complet. Propozit ia
(*) Ion pune.
este incompleta, ea solicitand continuarea cu o expresie-substantiv, urmata even-
tual de o expresie exprimand o localizare.
Denit ia 2.2 Expresia sau setul de expresii necesare pentru a completa nt elesul
unui lider se numeste complementul liderului.
Daca scriem
Ion pune mana pe carte
Ion este liderul, iar pune mana pe carte este complementul.
In Tabelul 2.2 sunt date exemple de lideri (subliniat i) din toate cele patru clase
majore, nsot ite de complement i.
2.2 Elementele expresiilor-substantiv simple
Expresiile-substantiv (NP) sunt folosite pentru a face referire la obiecte, locat ii,
concepte, evenimente etc. Cele mai simple astfel de expresii constau dintr-un singur
pronume: el, ea, ei, noi s.a.m.d. Pronumele se pot referi la obiecte zice, ca n
propozit ia
El este la usa.
la evenimente, ca n propozit ia:
Dupa ce am deschis usa, am regretat-o luni de zile.
sau la calitat i, ca n propozit ia:
22 PRELEGEREA 2. ELEMENTE DE LINGVISTIC
A. SINTAXA LIMBII
Tabelul 2.2:
Expresii-substantiv Expresii-verb
Presedintele companiei priveste la trecatori
Dorint a lui de a reusi credea ca lumea este rea
Diverse provocari ale echipei adverse a mancat o pizza
Expresii-adjectiv Expresii-adverb
usor de trecut nauntrul casei
fericit ca nu a luat premiu urgent s-a urcat n tren
lung ca o girafa intermitent priveste usa
Ne era foame, dar nu o aratam.
O alta forma de baza a expresiilor-substantiv consta dintr-un nume sau nume
propriu, cum ar Ionescu sau Galat i. Numele pot formate si din mai multe
cuvinte, ca n Drobeta Turnu Severin sau Evenimentul zilei.
A. SINTAXA LIMBII
2.3 Expresii-verb si propozit ii simple
In aceasta situat ie, primul NP este numit NP direct, iar al doilea - NP indirect.
A. SINTAXA LIMBII
3. reexiva:(Eu stiu ca pizza se mananca calda).
Alt tip de clauze foloseste forma innitiva a verbelor: VP[inf] este un V P care
ncepe cu innitivul. Exemplul tipic este versul eminescian
Nu credeam sa nvat a muri vreodata.
S[inf] poate apare si prin folosirea particulei pentru, ca n
Ion s-a nchis n casa pentru a avea liniste.
A. SINTAXA LIMBII
Nu am nvat at a manui condeiul.
Anca doreste sa ajunga arhitect.
Astfel de construct ii complexe de expresii-adjectiv sunt specice pe pozit ii de com-
plement ale anumitor verbe (a , a parea) sau dupa liderul unei expresii substantiv.
2.7 Expresii-adverb
Expresiile-adverb pot apare n diverse pozit ii n propozit ii:
- pe prima pozit ie, ca n:
Pe urma Anca a deschis radioul.
- n expresii-verb:
Anca a deschis pe urma radioul.
- pe ultima pozit ie a propozit iei:
Anca a deschis radioul pe urma.
Exista binent eles restrict ii ale formelor de adverb care pot folosite n ecare
pozit ie, dar acestea sunt legate strans de structura interna a ecarei limbi.
Totusi, din cauza num arului mare de forme, n general este util ca expresiile-
adverb (ADVP) sa e considerate dupa funct ii, nu dupa forma sintactic a. Deci,
putem avea expresii-adverb temporale, de durata, de locat ie, grad, frecvent a, mod
etc, ecare n forma sa specica.
De exemplu, expresiile-adverb temporale se pot folosi ca particule adverbiale
(acum), expresii-substantiv (astazi, ieri), expresii-prepozit ionale (la pranz, n timpul
lmului) si clauze (cand ceasul a sunat de amiaza, nainte ca lupta sa nceapa).
In aceasta lucrare, adverbele vor apare adesea ca modicatori ai act iunilor sau
starilor descrise de propozit ie. De obicei, asemenea situat ii ridica problema dis-
tingerii ntre complementele verbului si aceste adverbe. O distinct ie uzuala este
aceea ca expresiile adverbiale sunt ntotdeauna opt ionale. Deci, prin eliminarea lor
se obt ine o propozit ie cu aproximativ acelasi nt eles. Sa consideram ca exemplu
propozit iile:
Ion taie picioarele la masa.
Ion mananca o prajitura la masa.
Expresia la masa este un complement n prima propozit ie (eliminarea ei duce la
o propozit ie horror, fara nt eles) si o expresie adverb n a doua (important este
ca Ion man anca o prajitur a, locul unde se petrece aceasta act iune ind o informat ie
suplimentar a).
Prelegerea 3
Not iuni de morfologie
3.1 Structura morfologica a cuvintelor
Regulile de formare ale cuvintelor - care pornesc de la o anumita structura a acestora
- difera de la o limb a la alta, atat prin numarul lor cat si prin complexitate. Aceste
reguli permit uneori ca pe baza unei rad acini sa se formeze un num ar impresionant
de cuvinte nrudite. Limbile aglutinate (germana, maghiara, nlandeza) folosesc
mult acest procedeu.
In limba nlandeza de exemplu, pornind de la rad acina unui
substantiv se pot forma prin procedee morfologice cateva mii de cuvinte valide si
interpretabile de catre un vorbitor nativ. Pentru verbe se pot genera uneori peste
10.000 de forme diferite ale aceluiasi cuvant. Fenomenul este similar - la o scara
mai redusa - si pentru limbile neaglutinate. De pilda, n limba rusa prin conjugarea
unui verb se pot obt ine n jur de o suta de forme, cifra aproximativ valabila si
pentru limba roman a (daca luamn considerare si formele compuse). Deci cuvintele
evident iaz a o anumit a structura ce furnizeaza o mare bogat ie informat ionala care
nu poate ignorata.
A A CUVINTELOR 31
Din punct de vedere semantic, este greu de decis algoritmic formarea si mo-
dicarea semnicat iei cuvintelor formate derivativ. De exemplu, este greu de
derivat semnicat ia cuvantului mpartasanie plecand de la radacina -part-.
Folosind regulile de derivare se pot obt ine cuvinte inexistente n fondul lexical
al unei limbi.
Cu toate acestea, avantajul major al unei abordari derivative consta n posibilitatea
de reducere a dict ionarelor (de rad acini) la dimensiuni modeste, necesitand un efort
constructiv rezonabil. Pe de-alta parte, chiar unele obiect ii pot conduce la avantaje.
De exemplu, dinamica unei limbi solicita frecvent introducerea de cuvinte noi; aces-
tea se supun regulilor exionare si derivative deja existente, reguli care se modica
mult mai greu (n timp).
Denit ia 3.3 Un dict ionar construit conform paradigmei declarative va cont ine
(explicit sau nu) toate informat iile structurale ale cuvintelor unei limbi.
Deci, ntr-o abordare declarativa, un dict ionar nu va cont ine radacini sau teme, ci
cuvinte; de exemplu, odata cu cuvantul program, n dict ionar se vor gasi si programe,
programele, programul, programului, programelor etc. Informat iile contextuale legate
de forma exionara a unui cuvant sunt reprezentate explicit. Astfel, pentru intrarea
corespunzatoare cuvantului programelor, dict ionarul va cont ine explicit informat ii
de tipul:
forma-normala: program;
numarul: plural;
cazul: genitiv/dativ
articulare: enclitic
. . .
Aceasta este ideea de baza n construct ia corpusului unei limbi.
Procesul morfo - lexical se va reduce aici la simpla cautare a elementului curent n
dict ionar, eliminandu-se complet nedeterminismul ntalnit la abordarea procedurala.
Cuvintele nrudite sunt de obicei puse n corespondent a prin asa numitele reguli de
redondant a.
Doarece nu ne vom ocupa de aceasta maniera de construct ie, nu vom detalia mai
departe argumentele pro si contra utilizarii procedurii declarative.
Analiza morfo-lexicala consta din cateva subfaze specice, care apar explicit n
abordarile procedurale. Acestea sunt:
1. Primul obiectiv este prelucrarea individuala a cuvintelor, ceea ce nseamna
identicarea rad acinii sau temei, precum si a axelor modicatoare. Structura
rezultata este numit a de obicei atom morfologic.
32 PRELEGEREA 3. NOT IUNI DE MORFOLOGIE
2. Atomii morfologici sunt supusi unui proces reductiv, numit analiza perifras-
tica, care are rolul de a identica formele compuse ale verbelor, gradele de
comparat ie ale adjectivelor si adverbelor precum si mijloacele analitice de ex-
ionare (construct ii cu propozit ii, conjunct ii, articole). Ceea ce se obt ine este o
secvent a de structuri de date numite atomi morfo - lexicali.
3. Atomii morfo - lexicali sunt prelucrat i pentru a identica expresiile compuse
cu semnicat ie lexicala stabila (cum ar locut iunile si sintagmele); aceasta
prelucrare este numita analiza sintagmatica. Rezultatul nal este o lista de
atomi lexicali care constituie baza prelucrarilor ulterioare.
Structura atomilor morfologici, morfo - lexicali si lexicali depinde de mai mult i
factori care se inuent eaza reciproc, anume:
Teoria lingvistica (sintactic a, semantic a, pragmatica) pe care se cladeste sis-
temul de prelucrare al limbajului natural;
Situat ia conversat ionala si universul de discurs modelate;
Tipul aplicat iei proiectate.
In raport cu aceste condit ionari, structura si cont inutul dict ionarului pot varia
foarte mult. Un element de dict ionar poate cont ine, nafara radacinii, temei sau
cuvantului propriu-zis (dupa cum se foloseste paradigma procedurala respectiv de-
clarativa):
Un camp etimologic (mai ales la abordarile derivative);
Un camp fonologic, descriind structura proozodica (la dict ionarele destinate
limbajului vorbit sau la editoarele de texte, unde se foloseste de exemplu la
despart irea n silabe);
Un camp sintactic;
Un camp semantic, descriind semnicat iile lexicale asociate rad acinii, temei
sau cuvantului, relat iile de sinonimie, antonimie, polisemie.
Un camp pragmatic, sepcicand construct ii uzuale, interpret ari preferent iale
sau probabile, modicari ale semnicat iilor lexicale generale, etc.
3.3 Morfologia pe doua nivele
Cea mai cunoscuta teorie din zona paradigmei derivative este morfologia pe doua
nivele, prezentat a prima oara de Kimmo Koskenniemi n teza sa de doctorat din
1983. Ea s-a impus mai ales datorita fundament arii teoretice solide si usurint ei de
implementare.
A NIVELE 33
2. Nivelul lexical, corespunzator ortograerii cuvintelor n dict ionar.
Esent a teoriei consta n utilizarea unor reguli care ncearc a sa generalizeze fenome-
nele morfologice prin corelarea reprezent arii nivelului lexical cu reprezentarea de
suprafat a.
Denit ia 3.4 Fiind date doua alfabete nite nevide si , se numeste pereche -
simbolica un element (a, b) .
Inafara acestor doua reguli, se mai foloseste si un al treilea tip de regula care are ca
separator . O regula P Q este echivalent a cu pereche de reguli P C si
P C.
Sa coment am semnicat ia simbolurilor folosite n regulile morfologice cu doua
nivele:
Alfabetul se numeste alfabetul lexical si cont ine:
Coduri pentru literele alfabetului limbii naturale a carei morfologie se descrie;
Simbolul + pentru separarea morfemelor;
Metasimboluri (notate cu litere latine mari) pentru notarea submult imilor lui
. De exemplu, C poate deni mult imea consoanelor din , iar V - mult imea
vocalelor.
Alfabetul se numeste alfabetul de suprafat a si cont ine:
Literele si diacriticele ce pot apare n graa unui cuvant;
Metasimboluri pentru submult imi din ;
Simbolul vid .
Exemplul 3.1 Pentru ilustrarea notat iei folosite n modelul lui Koskenniemi, sa
consideram regula urmatoare:
e : {=: C
2
< +: V :=>}
{< C: C V : V > < +: e: e >}
{c: c < +: a: t : t >}
In aceasta regula, = , V , C , C
2
, V . Perechile sim-
bolice nchise ntre paranteze unghiulare reprezinta secvent e, iar perechile simbolice
cuprinse ntre acolade reprezinta alternative.
Deci perechea simbolica e : este legala numai daca apare n contextele listate
n partea dreapta a regulii, n pozit ia indicata de simbolul . Fiecare context are o
parte stanga si o parte dreapta, care sunt e perechi simbolice e expresii regulate
cu perechi simbolice.
Interpretarea regulii (vom explicita doar componenta a relat iei ) este
urmatoarea: transcrierea unui element lexical (morfem, lema, radacina) ntr-unul
de suprafat a se face prin nlocuirea simbolului lexical e cu caracterul de suprafat a
(deci se sterge litera e n procesul de generare a formei grafemice) daca apare una
din variantele urmatoare:
3.3. MORFOLOGIA PE DOU
A NIVELE 35
a. Simbolul lexical e este precedat n reprezentarea lexicala de un simbol din clasa
= care n transcrierea de suprafat a apart ine clasei C
2
si este urmat de un
delimitator morfemic (+) care se va sterge n reprezentarea de suprafat a; dupa
acest delimitator urmeaza un simbol lexical din clasa V care se rescrie n forma
de suprafat a printr-un simbol din clasa =;
b. Simbolul lexical e este precedat n reprezentarea lexicala de doua simboluri din
clasele C respectiv V , care se vor rescrie n simbolurile de suprafat a apart inand
acelorasi clase; el este urmat de un delimitator morfemic (care se va sterge)
si simbolul lexical e care ramane nemodicat n reprezentarea de suprafat a;
c. Simbolul lexical e este precedat n reprezentarea lexicala de simbolul c (scris
n reprezentarea de suprafat a); el este urmat de de secvent a lexicala formata
de delimitatorul morfemic, simbolul a (sters n reprezentarea de suprafat a) si
simbolul t (nemodicat n reprezentarea de suprafat a).
Vom mai da un exemplu - practic - de folosire a acestui model.
Exemplul 3.2 Regula de geminat ie consonantica (dublarea consoanei nale a unui
morfem) n limba engeza este:
+ : CG =: CGV : V
unde
CG {b, d, f, g, l, m, n, p, r, s, t}, V {a, e, i, u}.
Sa urmarim cum funct ioneaza aceasta regula, atat n generarea cat si analiza unui
cuvant:
Fie morfemul refer apart inand dict ionarului. Generarea gerunziului (sau tre-
cutului) presupune selectarea morfemului +ing (sau +ed) astfel ncat prin con-
catenare se obt ine sirul lexical refer+ing (sau refer+ed) deoarece delimitatorul
morfemic + apare n contextul cerut de regula precedenta: r CG, i(e) V, n
reprezentarea de suprafat a simbolul din CG substituind simbolul +. Se obt ine astfel
forma referring (sau reered).
In R exista cel mult o regula de aceasta forma, cu C cont inand o pereche de
contexte < LC, RC > astfel ncat P
1
LC, P
2
RC.
Denit ia 3.7 O regula morfologica pe doua nivele << a : b >, C > permite
coercitiv o secvent a S de perechi simbolice daca si numai daca pentru orice partit io-
nare posibila a lui S n < P
1
, a
: b
, P
2
> si pentru ecare element < LC, RC > C
cu P
1
LC, P
2
RC, daca a = a
atunci b = b
.
O gramatica morfologica cu doua nivele pentru alfabetele , se deneste for-
mal printr-o pereche < RRC, RRS > unde RRC este o mult ime de reguli de
restrict ionare contextual a peste si , iar RRS este o mult ime de reguli de restric-
t ionare a formelor de suprafat a peste si .
O pereche simbolica a : b este fezabila ntr-o gramatica cu doua nivele denita
peste alfabetele , daca si numai daca:
a = b si a , sau
a , si a : b apare ntr-o regula din gramatica.
O pereche a : b apare ntr-o regula << a
, b = b
sau
< LC, RC > C astfel ncat a : b LC RC.
Denit ia 3.8 Fiind data o gramatica morfologica cu doua nivele G =< RRC,
RRS >, o secvent a S de perechi simbolice este generata de G daca si numai daca:
1. Toate perechile simbolice din S sunt fezabile;
2. Orice regula din RRS permite coercitiv S;
3. Mult imea regulilor din RRC permite contextual S.
Observat ii:
1. Conform denit iei de mai sus, regulile din RRS formeaza o mult ime conjunc-
tiva de restrict ii care trebuiesc satisfacute simultan, n timp ce regulile din
RRC formeaza o mult ime disjunctiva de restrcit ii specicand toate contextele
legale posibile.
3.3. MORFOLOGIA PE DOU
A NIVELE 37
2. Din denit ia mult imilor RRC si RRS rezulta ca daca nici o regula nu se aplica
unei perechi simbolice, ea este acceptaa daca si numai daca este fezabila.
Denit ia 3.9 Fiind date = s
1
s
2
. . . s
n
, = I
1
I
2
. . . I
n
si o gramatica
morfologica cu doua nivele G, spunem ca este reprezentarea lexicala a lui
n G daca secvent a de perechi simbolice I
1
: s
1
I
2
: s
2
. . . I
n
: s
n
este generata de G.
Din denit ia de sus se observa restrict ia foarte puternica || = ||; ea poate
relaxata permit and ca I
i
{}, s
i
{}.
Procesul de prelucrare morfologica n morfologia pe doua nivele poate ab-
stractizat folosind doua not iuni suplimentare: sistemul de segmentare lexicala si
dict ionarul.
Denit ia 3.10 Un sistem de segmentare lexicala ntr-o morfologie cu doua nivele
este o structura (, , , L
x
, f, G) unde:
si sunt alfabetele lexical respectiv de suprafat a;
este un simbol special;
L
x
= {L
1
, . . . , L
n
} este o mult ime de mult imi de cuvinte din
numita lexicon,
ecare L
i
ind un sublexicon;
f :
2
L
este o funct ie denita astfel: w L
i
, f(w) = {L
i
1
, . . . , L
i
k
}
L
x
. f(w) se numeste mult imea de continuare valida a morfemului lexical w;
G este o gramatica morfologica cu doua nivele.
Cu aceasta denit ie, procesul de segmentare valid a a unui cuvant n elementele
sale lexicale constitutive se descrie natural astfel:
Denit ia 3.11 Fiind date cuvantul
unde
, care este
prelucrata, conducand la secvent a de perechi simbolice:
< b: b r : r a: a d: z +: i : i >
si
+i
se pleaca de la radacina
coad
(substantiv
comun, genul feminin) iar prin adaugarea morfemului
+ i
(nearticulat plural) se
obt ine secvent a
coad +i
.
Se observa ca n acest caz se putea aplica si regula R
1
, ceea ce ar dus la gener-
area unui cuvant incorect; este o exemplicare a uneia din decient ele modelului.
3.4 Morfologia paradigmatica
Al doilea model morfologic procedural prezentat se nscrie n clasa morfologiilor ex-
ionare si a fost elaborat de Dr. Dan Tus de la Institutul de cercetari al Academiei
Romane. Marele sau avantaj consta n naturalet ea sa - posibilitatea de a dezvoltat
prin tehnici ale nv at arii.
Denit ia 3.12 Se numeste model morfologic (MM) structura
(C, SC, A, V, F
1
, F
2
, F
3
, P)
unde:
C = {c
1
, c
2
, . . . , c
i
} este o mult ime de categorii;
SC = {sc
1
, sc
2
, . . . ,
j
} este o mult ime de subcategorii ale categoriilor din C;
3.4. MORFOLOGIA PARADIGMATIC
A 39
A = {a
1
, a
2
, . . . , a
k
} este o mult ime de atribute ale subcategoriilor din SC (n
raport cu care fenomenul exionar este relevant);
V = {v
1
, v
2
, . . . , v
m
} este o mult ime de valori pe care le pot lua atributele din
A;
F
1
: C 2
SC
, F
2
: SC 2
A
, F
3
: A 2
V
sunt aplicat ii;
P CSC2
A
2
V
- numit spat iul paradigmatic exionar - are proprietatea
ca p
i
= (c
i
, sc
i
, A
i
, V
i
) P sunt adevarate armat iile:
1. c
i
C, sc
i
F
1
(c
i
);
2. A
i
= {a
i
1
, a
i
2
, . . . , a
i
k
} A, V
i
= {v
i
1
, v
i
2
, . . . , v
i
k
} V ;
3. M
i
= {m
i
1
, . . . , m
i
k
} F
2
(sc
i
) cu v
iq
F
3
(m
iq
), 1 q k.
Se numeste familie tematica (FT) asociata unui lexem Lx
i
mult imea sortata
lexicograc a tuturor cuvintelor obt inute prin exarea gramaticala a lexemului re-
spectiv: FT(Lx
i
) = {w
1
, w
2
, . . . , w
m
}.
Sa notam cu < X > un sir arbitrar de litere si cu < X >< Y > sirul de litere
obt inut prin concatenarea sirurilor < X > si < Y >.
Denit ia 3.13 O mult ime FT(Lx
i
) este regulata daca si numai daca exista un
subsir < R
q
> de lungime q numit radacina, comun tuturor cuvintelor din FT(Lx
i
)
astfel ncat:
1. k, < W > FT(Lx
i
) =< w
k
>=< R
q
>< t
k
>;
2. < R
q
> este cel mai lung subsir cu proprietatea anterioara;
3. q o limita inferioara (constanta ntreaga, dependenta de limba);
4. j, 2 j m 1, submult imile {w
1
, . . . , w
j
}, {w
j+1
, . . . , w
m
} au radacinile
< R
q
1
> respectiv < R
q
2
> unde < R
q
1
> este un subsir (nu neaparat propriu)
al lui < R
q
2
>.
Partea care ramane dintr-un cuvant din FT(Lx
i
) dupa ndep artarea rad acinii se
numeste terminat ie (vom folosi termenul de terminat ie atat pentru desinent e cat si
pentru suxe).
Denit ia 3.14 O familie tematica (FT) a unui lexem Lx
i
se numeste part ial
regulata daca exista o partit ie FT(Lx
i
) = {FT
1
(LX
i
), . . . , FT
k
(Lx
i
)} astfel ncat:
j=1
FT
j
(Lx
i
) = FT(Lx
i
);
m, n(m = n), FT
m
(Lx
i
) FT
n
(Lx
i
) = ;
j, FT
j
(Lx
i
) este regulata si |FT
j
(Lx
i
)| > 1.
Deci, o familie tematica part ial regulata este caracterizata de k radacini.
40 PRELEGEREA 3. NOT IUNI DE MORFOLOGIE
Denit ia 3.15 Mult imea terminat iilor obt inute dintr-o familie tematica (regulata
sau part ial regulata) se numeste familie paradigmatica FP.
Daca notam cu T reuniunea tuturor FP, se obt ine not iunea central a a modelului,
respectiv paradigma exionara Qn modul urmator:
Q = {(t
1
, p
1
), (t
2
, p
2
), . . . , (t
k
, p
k
)} 2
TP
;
FP
i
astfel ncat FP
i
= {t
1
, t
2
, . . . , t
k
}.
Pentru a simplica notat ia, vom folosi n continuare paranteze unghiulare numai
cand va necesar de evident iat (des)compunerea unei forme exate.
Fie FL mult imea obt inuta din reuniunea a k familii tematice, numita fond lexical:
FL =
k
j=1
FT(Lx
i
)
.
Vom numi dict ionar neinterpretat al fondului lexical FL mult imea
DN = {R
1
, R
2
, . . . , R
p
}
cu proprietatea ca oricare R
i
este o radacin a a unei familii tematice FT
j
din FL.
Aplicat ia I : FL 2
DNP
se numeste interpretarea fondului lexical FL n
modelul morfologic MM n cadrul caruia este denit P. Se observa ca interpretarea
unui cuvant poate sa nu e unica, fapt natural la nivelul analizei izolate a cuvantului.
Acest lucru se datoreaza ambiguitat ii (intriseci sau extrinseci) legate de omograe.
Interpretarea I abstractizeaza procesul de analiza morfologica.
Abstractizarea procesului invers, de generare a formelor exate, este reprezentat a
de aplicat ia G : DN P FL.
3.4.1 Organizarea terminat iilor
Conform denit iilor anterioare, un cuvant este privit - din punct de vedere structural
- ca o juxtapunere a unei part i xe (tema) si a unei part i variabile (terminat ia).
In
cadrul terminat iei nu se mai face distinct ie ntre suxe si desinent e. Un cuvant
poate coincide cu tema sa, caz n care spunem ca are terminat ie nula. Conceptul
de tema are un cont inut lexical, dar unui cuvant i pot corespunde mai multe teme,
cum sunt de exemplu verbele neregulate.
Terminat iile sunt organizate arborescent, ecare nod al arborelui ind etichetat
cu cate o litera care intr a n compozit ia unei terminat ii. Un drum care pleaca
de la rad acina arborelui (corespunzatoare terminat iei nule) la o frumza semnica
una sau mai multe terminat ii obt inute prin concatenarea literelor asociate nodurilor
parcurse. Exista posibilitatea (n limba roman a) ca un drumn arbore sa reprezinte
mai multe terminat ii, care se ncheie la diferite noduri ale drumului.
Denit ia 3.16 Se numeste nod terminal orice nod al arborelui de terminat ii cu
proprietatea ca prin concatenarea literelor asociate nodurilor parcurse pe drumul de
la radacina la nodul respectiv se obt ine o terminat ie valida.
3.4. MORFOLOGIA PARADIGMATIC
A 41
Tabelul 3.1: Arbore de terminat ii
a
c z
e
s
u
r
i
>
>
>
>
>
>
>.
`
`
`
`
`
-
`
`
`
`
`
`
`
`
-
`
`
`
`
`
`
-
`
`
`
Nivel 0
Nivel 1
Nivel 2
Nivel 3
Nivel 4
)
+
crieri. O descriere consta dintr-un identicator unic n dict ionar, care corespunde
not iunii de lexem, un cod care identic a partea de vorbire asociata lexemului, o ca-
racterizare morfologica a lexemului, precum si una sau mai multe descrieri sintactice
si semantico-pragmatice asociate. Formal, o intrare lexicala este de forma data n
Tabelul 3.2.
Unei teme i pot corespunde mai multe lexeme. De exemplu, pentru tema munc
vor exista lexemele a munci (verb) si munca (substantiv).
Campurile <parte de vorbire> si <descriere morfologica> asociate unui lexem
sunt unice. Omografele vor diferent iate prin identicatori lexemici diferit i; de
exemplu, pentru tema duc care are asociate doua lexeme omografe (duce - a cara, a
transporta, si duce - rang nobiliar), distinct iantre lexeme se va face prin intermediul
unui indice numeric: duce1, duce2.
Doua sau mai multe teme distincte pot avea asociate acelasi lexem, situat ie cores-
punzatoare n dict ionar sinonimiei. De asemenea, polisemia este asigurata prin posi-
bilitatea de a avea mai multe descrieri semantico-pragmatice pentru acelasi lexem.
Informat iile din dict ionar corespunzt oare acestor campuri (sintactic si semantic) nu
sunt folosite n faza analizei morfo - lexicale, ci n fazele ulterioare.
Bibliograe
[1] Allen, J. - Natural Language Understanding, The Benjamin/Cummings Publ.
Co. Inc, 1995
[2] Atanasiu, A - Bazele Informaticii; suport de curs pentru anul II seral; Tipograa
Universitatii, 1987;
[3] Atanasiu, A. - Modele matematice n scrierea compilatoarelor; Ed. Olimp, 1996.
[4] Craciun, Dragos- Analizor morfologic pentru limba romana, Lucrare de licent a,
1997
[5] Gramatica Limbii Romane, Editura Academiei, 1966
[6] Joshi, A.K., Levi, L.S., Takahashi, M. - Tree Adjunct Grammars, J. Comput.
Syst. Sci. 10(1), 1975.
[7] Joshi, A.K. - How much context-senzitivity is necessary for Characterizing Struc-
tural description - Tree Adjoining Grammars; n Natural Language Processing
- Theoretical Computational and Psychological Perspectives, Cambridge Uni-
versity Press, 1985.
[8] Joshi, A.K. - The relevance of Tree Adjoining Grammar to generation; n Nat-
ural Language Generation, Martinus Nijho Publishers, Dordrecht, 1987
[9] Schabes, Y. - Mathematical and Computational aspects of Lexicalized Gram-
mars; Eight European Summer School in Logic, Language and Information,
Praga, 12-23 August 1996
43
Prelegerea 4
Gramatici si analizori sintactici
Pentru a formaliza studiul structurii sintactice a unei propozit ii, sunt necesare doua
not iuni noi: gramatica - o construct ie formala specica unei structuri lingvistice,
si tehnicile de analiza sintactica care determina corectitudinea unei propozit ii
n conformitate cu regulile gramaticii.
Vom face observat ia ca mare parte din elementele folosite n acest capitol sunt
cunoscute din cursurile anilor anteriori ([2], [3]). Vom ncerca de aceea sa punctam
numai diferent ele de prezentare a conceptelor, cu o apropiere de structura temei
actuale - lingvistica matematica.
4.1 Gramatici si structuri lingvistice
Unul din punctele majore de interes ale lingvisticii matematice consta n descrierea
modului de descompunere al unei propozit ii si explorarea structurilor sale corecte
din punct de vedere sintactic. Aparatul folosit n aceste explorari este de obicei
arborele de derivare.
Un astfel de arbore este reprezentat e sub forma uzuala (arborele asociat unei
derivari independente de context) sau prin operat ia de parantezare.
Exemplul 4.1 Sa consideram gramatica (independenta de context) cu product iile:
1. S NP VP 5. NUME Andrei
2. VP V NP 6. V a rupt
3. NP NUME 7. ART o
4. NP ART N 8. N musca
Product iile 5 8 (de tip < neterminal >< terminal>) se numesc product ii
lexicale.
In studiul care urmeaza, acest tip de reguli vor ignorate, deoarece nu
modica cu nimic fondul discut iei.
Semnicat ia neterminalelor (denita si n prelegerile anterioare) este:
S propozit ie NP expresie-substantiv V P expresie-verb
ART articol NUME substantiv propriu V verb
N substantiv comun
43
44 PRELEGEREA 4. GRAMATICI SI ANALIZORI SINTACTICI
Pentru propozit ia Andrei a rupt o musca se poate construi derivarea (stanga):
S = NP VP = NUME VP = Andrei VP = Andrei V NP
= Andrei a rupt NP = Andrei a rupt ART N
= Andrei a rupt o N = Andrei a rupt o musca.
Arborele de derivare corespunzator poate reprezentat n doua moduri:
)
H
H
Hj
?
H
H
Hj
? ?
H
H
Hj
? ?
S
NP VP
NUME V NP
Andrei
a rupt ART N
o
musca
Figura 4.1
sau, sub forma parantezata (parcurgerea inx a unui arbore oarecare):
(S (NP (NUME Andrei))
(VP (V a rupt)
(NP (ART o)
(N musca))))
Sa reamintim cateva elemente. Unei gramatici i se pot asocia doua modalitat i
de operare:
Modalitatea generativa: pentru construirea limbajului asociat se folosesc de-
rivarile;
Modalitatea de recunoastere: se cauta structura propozit iilor care pot
construite de regulile gramaticii.
Modalitat ile de recunoastere se mpart n:
1. Strategii top-down: se pleaca de la S si se cauta pe diverse cai sa se rescrie
simbolurile, pana se ajunge la propozit ia cautata (sau pan a au fost epuizate
toate variantele de construct ie - n caz ca se cauta structura unei propozit ii
incorecte din punct de vedere al gramaticii enunt ate);
2. Strategii bottom-up: se pleaca de la cuvintele propozit iei si prin procedee
de deplasare-reducere (caut and membrii drept i ai regulilor si nlocuindu-i cu
membrii stangi corespunzatori), se cauta construirea arborelui de jos n sus,
pana se ajunge la simbolul radacin a S.
4.2. SEMNIFICAT IA UNEI GRAMATICI BUNE 45
4.2 Semnicat ia unei gramatici bune
La construct ia gramaticii care sa caracterizeze un limbaj L peste un alfabet V ,
trebuiesc urmarite cateva obiective:
generalitate: ordinul de marime al lui card(L) (propozit iile pe care gramatica
le considera corecte);
selectivitate: ordinul de marime al lui card(V
In gramaticile cu reguli put ine (cum sunt cele folosite n exemple) sunt generate
doar un numar mic de tipuri de propozit ii; aici, o analiza structurala poate parea
far a rost; totusi, analizorii sintactici construit i pentru aceste gramatici sunt usor de
generalizat la limbaje mari, n timp ce alte module de lucru vor necesita modicari
majore.
A SINTACTIC
A TOP-DOWN 47
Exemplul 4.3 Sa consideram propozit ia:
1
Un
2
caine
3
plange
4
O stare tipica de analiza poate : ((N VP) 2).
A SINTACTIC
A BOTTOM-UP 49
Tabelul 4.2:
Pas Stare curenta Stari backup Comentarii
1. ((S) 1) Pozit ia init iala
2. ((NP VP) 1) Se rescrie S cu regula 1
3. ((ART N VP) 1) Se rescrie NP cu
((ART ADJ N VP) 1) regulile 2 si 3
4. ((N VP) 2) Se reduce ART cu Un
((ART ADJ N VP) 1)
5. ((VP) 3) Se reduce N cu
((ART ADJ N VP) 1) batran
6. ((V ) 3) Se rescrie VP cu
((V NP) 3) regulile 4 si 5
((ART ADJ N VP) 1)
7. ((), 4) Se reduce V cu toc
((V NP) 3)
((ART A|!DJ N VP) 1)
8. ((V NP) 3) Se alege primul backup
((ART ADJ N VP) 1)
9. ((NP) 4)
((ART ADJ N VP) 1)
10. ((ART N) 4) Esec; la 4 nu este ART
((ART ADJ N) 4)
((ART ADJ N VP) 1)
11. (ART ADJ N) 4) Din nou esec
12 ((ART ADJ N VP) 1) Se ia ultimul backup
13. ((ADJ N VP) 2) Se reduce ART cu Un
14. ((N VP) 3) Se reduce ADJ
cu batran
15. ((VP) 4) Se reduce N cu toc
16. ((V ) 4)
((V NP) 4)
17. (() 5) Secvent a corecta !
4.4 Algoritm de analiza sintactica bottom-up
Dupa cum se stie ([3]), algoritmii bottom-up difera de cei top-down prin modul de
folosire a product iilor. Operat ia de baza este aceea de a lua o secvent a de simboluri
si a o compara cu membrii drept i ai product iilor; daca exista o regula cu acest
membru drept, secvent a se nlocuieste cu membrul stang al product iei folosite, dupa
care procesul se reia.
Intr-un astfel de analizor, o stare este o lista de simboluri, init ial ind secvent a
de analizat. Starile succesoare pot generate explorand toate posibilitat ile astfel
ca:
1. Sa se rescrie un cuvant din secvent a prin toate categoriile sale lexicale posibile;
50 PRELEGEREA 4. GRAMATICI SI ANALIZORI SINTACTICI
2. Sa se nlocuiasca o secvent a de simboluri care formeaza membrul drept al unei
reguli, cu membrul ei stang.
Din pacate, o astfel de implementare conduce la un algoritm foarte inecient
ca timp; pentru a simplica problema, vom introduce o structura de date numit a
harta, n care se stocheaza rezultatele part iale ale procesului de identicare (pentru
a elimina repetarea lor).
Procesul de identicare are loc pe baza unui constituient numit cheie; de ecare
data se cauta identicarea pentru product iile al caror membru drept ncepe cu cheia,
sau au nceput cu o cheie anterioara si solicita o noua cheie pentru a completa
membrul drept al product iei sau a o extinde la una noua.
. NP ART ADJ N
3
. NP ART N
Daca urmatoarea cheie de intrare este un ADJ, atunci poate ncepe regula 4 (ca
mai sus), iar regula 2
A SINTACTIC
A BOTTOM-UP 51
arce active indicand constituient ii posibili; ele sunt indicate prin saget i si interpretate
astfel (de sus n jos):
Exista un NP posibil cu plecare din pozit ia 1, care necesita un ADJ ncepand
cu pozit ia 2.
Este posibil un NP care pleaca din pozit ia 1, si cere un N pe pozit ia 2.
Este posibil un NP care pleaca din pozit ia 2 si cere un N pe pozit ia 3.
In sfarsit, mai este posibil un NP care pleaca din pozit ia 1 cu un ART urmat
de un ADJ si cere un N ncepand cu pozit ia 3.
Operat iile de baza ale unui analizor bazat pe hart i folosesc o combinare ntre arce
active si constituient i complet i. Rezultatul este sau un constituient complet nou sau
un arc activ nou, extensie a arcului activ originar. Noii constituient i activi complet i
sunt depusi ntr-o lista numita agenda, pan a n momentul cand sunt adaugat i la
harta.
Procesul se poate exprima algoritmic astfel:
Algoritmul de extensie a arcelor:
Pentru a adauga un constituient C de la pozit ia p
1
la pozit ia p
2
:
1. Se insereaza C n harta de la p
1
la p
2
;
2. Pentru orice arc activ de forma X X
1
. . . C . . . X
n
de la p
0
la p
1
,
se adauga un arc activ nou X X
1
. . . C . . . X
n
de la p
0
la p
2
;
3. Pentru orice arc activ de forma X X
1
. . . X
n
C de la p
0
la p
1
, se
adauga n agenda un nou constituient de tipul X de la p
0
la p
2
.
Fiind dat acest algoritm, putem construi un algoritm de analiza bottom-up astfel:
Se efectueaza urmatorii pasi pan a se parcurge toata secvent a de intrare:
1. Daca agenda este vida, se cauta si se introduc n agenda toate inter-
pretarile pentru urmatorul cuvant de la intrare;
2. Se selecteaza un constituient C din agenda, de la pozit ia p
1
la pozit ia
p
2
;
3. Pentru ecare regula din gramatica de forma X CX
1
. . . X
n
se
traseaza un arc activ de forma X C X
1
. . . X
n
de la p
1
la p
2
;
4. Se adauga C la harta folosind algoritmul de extensie a arcelor.
52 PRELEGEREA 4. GRAMATICI SI ANALIZORI SINTACTICI
Exemplul 4.8 : Sa luam urmatoarea secvent a de intrare
O vie vie are rod.
Vom folosi pentru analizor gramatica de product ii:
1. S NP VP 3. NP ART ADJ N 5. VP V N
2. NP ART N 4. VP V
plus lexiconul:
O:ART
vie:N, ADJ, V
are:V
rod:N, V
Init ial agenda este vida; deci se citeste cuvantul O si se plaseaza n agenda
constituientul ART1. Deci:
Se introduce ART1 (O de la 1 la 2);
Se adauga arcul activ NP ART ADJ N de la 1 la 2;
Se adauga arcul activ NP ART N de la 1 la 2;
(ambele activitat i au fost generate de pasul 3 al algoritmului, pe baza product iilor
2 si 3 ale gramaticii).
- - -
?-
6
NP: NP NP1 NP2
art
adj
subst
pop
53
54 PRELEGEREA 5. ALTE MODELE GRAMATICALE
Denit ia 5.2 O ret ea recursiva de tranzit ie este o ret ea de tranzit ie n care mult i-
mea marcajelor arcelor se mbogat este si cu nume de ret ele de tranzit ie.
Exemplul 5.2 O ret ea RTN care accepta propozit ii simple din limba romana este:
Figura 5.2:
- - - -
S S S
1
S
2
S
3
NP verb NP
pop
Marcajele scrise cu litere mari se refera la ret ele. Arcul de la S la S
1
poate
traversat numai daca ret eaua NP din Figura 5.1 poate traversata pana la un arc
marcat pop.
Evident, o ret ea RTN poate cont ine arce marcate cu propriul ei nume (deci o
denit ie recursiva).
In practica, sistemele RTN ncorporeaza unele tipuri adit ionale
de arce, utile dar nu formal necesare. Aceste tipuri sunt (Tabelul 5.1):
Tabelul 5.1:
Tip de arc Semnicat ie
CAT Este traversat numai de un cuvant din categoria specicata
de marcaj
WRD Este traversat numai de un cuvant identic cu marcajul
PUSH Este un arc marcat cu numele unei ret ele
JUMP Este un arc care poate traversat far a nici o condit ie
POP Arc care semnaleaza sfarsitul ret elei
5.2 Analiza sintactica top-down folosind RTN
Algoritmul prezentat este similar celui pentru gramatici independente de context
([2]). Astfel, starea analizorului poate reprezentata sub forma unui triplet
(n c, p c, rev, s rev)
unde:
n c (nod curent) este nodul din ret ea, activ n momentul act iunii;
p c (pozit ie curenta) este un pointer la urmatorul cuvant de analizat din
secvent a de intrare;
rev (puncte de revenire) este o stiva cu nodurile din alte ret ele, unde se
revine daca n ret eaua curent a se parcurge un arc pop.
5.2. ANALIZ
A SINTACTIC
- -
-
? -
6
-
?-
6
-
- - -
?-
6
NP NP1 NP2
S S1 S2
NP
S
art
nr
subst
pron
adj
pop
1
2
3
1
2
NP verb
pop
NP
1
2
a latra: V(verb);
slab: ADJ(adj);
(am scris n paranteza notat iile folosite pentru arcele din ret ea).
(S, 1, , ) (NP, 1, S1, ) (NP1, 2, S1, ) (NP2, 3, S1, )
(S1, 3, , (NP1, 3, S1, )) (NP2, 3, S1, ) (NP2, 4, S1, )
(S1, 4, , (NP2, 4, S1, )) (S2, 5, , (NP2, 4, S1, ))
(NP, 5, S2, (NP2, 4, S1, )) (NP1, 6, S2, (NP2, 4, S1, ))
(NP2, 7, S2, (NP2, 4, S1, )) (S2, 7, , (NP2, 4, S1, ))
Analiza este corecta.
5.3 Utilizarea automatelor nite n prelucrarea
morfologica
Sa reluam ideea pe baza careia s-a denit morfologia paradigmatica.
Desi n exemplele simple si sistemele mici listarea tuturor cuvintelor din dict ionar
este relativ simpla, pentru sistemele cu vocabulare mari, reprezentarea lexiconului
reprezint a o problema dicila. Nu numai ca exista un mare num ar de cuvinte, dar -
dupa cum am vazut ntr-o prelegere anterioar a - ecare din ele, combinat cu axe,
produce o serie de alte cuvinte care au semnicat ii diferite. O modalitate des uzitata
de a rezolva problema consta n rearanjarea secvent ei de intrare ntr-o secvent a de
morfeme. Reamintim ca un cuvant poate format dintr-un singur morfem, dar
poate consta dintr-o rad acina la care se adauga diverse axe (prexe si/sau suxe).
De exemplu, la radacina cred se pot adauga diverse axe din mult imea {e,em,in,t a,
re, cios} formandu-se cuvinte cum ar
cred-e, cred-in-t a, cred-in-cios, n-cred-e-re, s.a.m.d.
O modalitate de ret inere ecient a a cuvintelor cu aceeasi radacin a este construirea
lor pe baza unor automate nite.
Sa luam de exemplu verbul a nvat a. Formele la care se prezinta el la indicativ
prezent {nvat , nvet i, nvat a, nvat am, nvat at i} reprezinta limbajul acceptat de
automatul nit din n Figura 5.4.
El pleaca de la morfemul vat , n care litera din mijloc se poate modica n a
sau e, n funct ie de declinare. Dupa cum se vede, au fost ret inute doar 14 caractere
5.4. GRAMATICI SI PROGRAMARE LOGIC
A 57
Figura 5.4:
j j j j j z j z
z
z
j j
j j
- - - - - - -
3
- -
Q
Q
Q
Q
Q
Qs
- -
6
n v
a
t
a
m
e
t
i
a
a
t
a
n loc de 32; informat iile suplimentare legate de structura automatului (arce, stari
nale, etc) sunt usor de ret inut prin forma de memorare a datelor (de exemplu, liste
nlant uite).
Automatul poate completat pentru a lega si celelalte forme exionare ale ver-
bului a nvat a, precum si cuvintele nrudite, cum ar substantivele care pleaca de
la nvat atura, adjective (nvat at), dar si forme cu alte prexe, cum este de exemplu
dezvat .
) n(P2
T
, se deneste un arbore Tr
dominat de nodul X V astfel:
1. ecare nod din Tr este un triplet [A, i, j] unde A V, 1 i, j n. Numarul i
este indexul orizontal al nodului, iar j este indexul vertical.
2. Nodul [A, i, m] are descendent ii [B, j, p], [C, k, r], daca si numai daca:
j < k, m = p + 1, j = i, si A
L
BC P, sau
j < k, m = r + 1, k = i, si A
R
BC P.
3. Radacina este un nod de forma [X, i, m] pentru anumit i i, m {1, 2, . . . , n}.
4. Nodurile terminale sunt toate nodurile de forma [a
i
, i, 1], 1 i n.
60 PRELEGEREA 5. ALTE MODELE GRAMATICALE
Pentru simplicare, daca arborele este dominat de S, nu vom mai specica aceasta
n mod explicit.
Exemplul 5.5 Limbajul L = {w|w {a, b, c}
, N
a
(w) = N
b
(w) = N
c
(w)}
este generat de o gramatica NCFDG n care V
N
= {S, T}, V
T
= {a, b, c},
P = {S
L
aT|Ta|SS, T
L
bc|cb}.
De exemplu, w = aabbcc este generat prin
S =
L
SS =
L
aST =
L
aaTT =
L
aabTc =
L
aabbcc
care are arborele de derivare Tr reprezentat n Figura 5.5:
Figura 5.5:
[S, 1, 3]
[S, 1, 2] [S, 2, 2]
[T, 3, 2] [T, 4, 2]
[a, 1, 1] [a, 2, 1] [b, 3, 1] [b, 4, 1] [c, 5, 1] [c, 6, 1]
a a
b b
c c
?
Z
Z
Z
Z
Z
Z~
?
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
XXz
?
Z
Z
Z
Z
Z
Z~
?
P
P
P
P
P
P
P
P
P
P
Pq
?
P
P
P
P
P
P
P
P
P
P
Pq
Denit ia 5.5 Fie Tr arborele corespunzator cuvantului w = a
1
a
2
. . . a
n
V
T
n
gramatica NCFDG G. Arborele de dependent a Dep(Tr) = (, U) asociat lui Tr se
deneste astfel:
= {[a, i] | [a, i, 1] Tr},
U este format din toate arcele ([a, i], [b, j]) cu proprietatea ca [a, i, 1], [b, j, 1]
sunt noduri distincte n Tr, unde exista si un arc ([A, i, p], [B, j, r]), pentru anumit i
A, B, p, r.
Astfel, pentru arborele din Exemplul 5.5, arborele de dependent a este (pentru
usurin-t a, s-a marcat si neterminalul corespunzator nodului):
[a, S, 1]
[a, S, 2]
[b, T, 3] [b, T, 4]
[c, c, 5] [c, c, 6]
+
Z
Z
Z
Z
Z
Z~
Q
Q
Qs
5.5. DEFINIREA FORMAL
+
Q
Q
Qs
?
S
NP
0 V P
V NP
1
ia
+
Q
Q
Qs
+
Z
Z
Z~
?
S
NP
0 V P
V NP
1
ia D N
o
cana
+
Q
Q
Qs
+
Z
Z
Z~
?
=
Q
Q
Qs
? ?
(
1
)
(
2
)
(
3
)
Din denit ie rezulta imediat unele proprietat i ale gramaticilor lexicalizate:
Lema 6.1 Gramaticile lexicalizate sunt nite ambigui.
Demonstrat ie: O gramatica este nit ambigu a daca nu exista nici un cuvant de
lungime nita pentru care se pot construi un num ar innit de analize.
Armat ia din lema este evidenta pentru propozit ii (secvent e) de lungime arbi-
trara nita. Mult imea structurilor ancorate de cuvintele acestor propozit ii consta
din structurile necesare pentru analiza lor; oricare alte structuri introduc termeni
lexicali care nu sunt n propozit ii.
Deoarece mult imea structurilor selectate este nita, acestea pot combinate
doar ntr-un num ar nit de moduri. 2
Pentru ca orice propozit ie de lungime nita este nit ambigu a, spat iul de lucru
necesar analizei sintactice este nit. Deci problema de recunoastere pentru gramati-
cile lexicalizate este decidabila.
Lema 6.2 Este decidabil daca o propozit ie este acceptata sau nu de o gramatica
lexicalizata.
O consecint a important a a acestei leme este aceea ca problema recunoasterii pen-
tru o unicare bazata pe gramatici lexicalizate este decidabila; pentru gramatici
nelexicalizate, ea este nedecidabila.
6.2. LEXICALIZAREA CFG 65
Principala ntrebare care apare acum este:
Pot lexicalizate gramaticile independente de context ?
Evident, nu orice cfg (gramatica independent a de context) este n forma lexicali-
zata. De exemplu, o regula de tipul S NP VP nu este lexicalizata deoarece nu
are n membrul drept nici un termen lexical.
Avand o gramatica G denita ntr-un anumit formalism, sa ncerc am sa gasim o
gramatica echivalenta G
lex
lexicalizata (nu neaparat n acelasi formalism).
Denit ia 6.2 Spunem ca un formalism F poate lexicalizat de un alt formalism
F
daca pentru orice gramatica nit ambigua G din F exista o gramatica lexicalizata
G
n F
cu proprietatea ca G si G
In cele ce urmeaza vom lucra numai cu cfg de ambiguitate nita. Vom extinde
domeniul lor local de valabilitate pentru a permite ca termenii lexicali sa apara ca
elemente ale structurilor elementare, folosind o gramatica pe arbori cu substitut ia
ca operat ie de combinare.
Aceasta gramatica este formata dintr-un set de arbori care nu sunt condit ionat i
la adancimea 1 (cum sunt product iile unei gramatici independente de context), pe
care se deneste operat ia de substitut ie (n loc de derivare directa). Substitut iile pot
nlocui un nod neterminal aat pe frontiera unui arbore. Prin convent ie, nodurile
care se pot nlocui (substitui) sunt marcate cu . Dupa substituirea unui nod n,
acesta este nlocuit cu subarborele respectiv.
66 PRELEGEREA 6. GRAMATICI PE ARBORI
Denit ia 6.3 O gramatica de substitut ie pe arbori (TSG - Tree Substitution Gram-
mar) este o structura G = (V
N
, V
T
, I, S), unde:
1. V
T
este o mult ime nita nevida de simboluri terminale;
2. V
N
este o mult ime nita nevida de simboluri neterminale, V
T
V
N
= ;
3. S V
N
este un simbol special;
4. I este o mult ime nita nevida de arbori nit i ale caror noduri interioare sunt
marcate cu elemente din V
N
iar cele de pe frontiera sunt marcate cu elemente
din V
N
V
T
. Toate nodurile neterminale de pe frontiera sunt marcate pentru
substitut ie cu .
Spunem ca un arbore este derivat daca s-a obt inut dintr-un arbore init ial n care
s-au efectuat substitut ii cu arbori init iali sau derivat i. Un X-arbore este un arbore
a carui rad acina este marcata cu X.
Un arbore este complet daca frontiera lui este formata numai din noduri marcate
cu simboluri terminale.
Vom nota frontiera V
N
V
T
a unui X-arbore t
X
cu Fr(t
X
) = .
Fiind dat i doi arbori t
A
, t
B
, denim derivarea t
A
= t
B
astfel:
t
A
este un A-arbore, Fr(t
A
) = w;
Exista un B-arbore init ial t cu Fr(t) = uA v;
t
B
este un B arbore cu Fr(t
B
) = uwv obt inut din t prin nlocuirea nodului
marcat A cu t
A
.
Observat ie: t
A
poate arbore init ial sau derivat, iar t
B
este un arbore derivat.
Exemplul 6.2 Din arborii init iali
?
@
@R
?
@
@R
@
@R
?
?
?
D NP S NP
un D N NP
0
V P N
om V NP
1
oua
ia
(
un
) (
om
) (
ia
) (
oua
)
se obt ine arborele derivat
6
@
@R
H
H
Hj
@
@R
? ? ? ?
?
S
NP V P
D N V NP
un om
ia N
oua
6.2. LEXICALIZAREA CFG 67
Fie =
I, t
t}
Spunem ca o cfg G este echivalent a cu o TSG G
T
daca:
Orice arbore de derivare din G este n L(G
T
);
t L(G
T
), L(G) cu Fr(t) = .
Exemplul 6.3 Gramatica denita prin arborii init iali
@
@R
@
@R
S S
a
A
S
b
@
@R
a
b
este echivalenta cu gramatica de product ii
S aA|ab, A Sb
care genereaza limbajul L(G) = {a
n
b
n
|n 1}.
Este usor de demonstrat ca mult imea limbajelor generate de gramaticile de substitu-
t ie pe arbori coincide cu L
2
(clasa limbajelor independente de context).
Sa revenim la problema lexicalizarii gramaticilor independente de context. Un
prim rezultat este:
Lema 6.3 Gramaticile independente de context nit ambigui nu pot lexicalizate
cu gramatici de substitut ie pe arbori.
Demonstrat ie: Sa presupunem prin absurd ca acest lucru este posibil si sa con-
sideram gramatica de product ii:
S SS, S a.
Fie G gramatica lexicalizata echivalenta si sa lua un arbore init ial arbitrar t. Din
denit ie, exista un nod n pe frontiera lui t marcat cu a. Pentru ca substitut iile pot
efectuate numai pe frontiera arborilor init iali (conform derivarilor in G), distant a
dintre n si rad acina lui t este constant a pentru orice arbore init ial. Deci, n orice
arbore derivat din G exista o ramur a de lungime xata de la radacin a la un nod
notat a, ramura ce nu mai poate extinsa. Dar n cfg denita mai sus se pot
construi arbori de derivare n care orice drum la un nod terminal are o lungime
oricat de mare. Contradict ie. 2
68 PRELEGEREA 6. GRAMATICI PE ARBORI
6.3 Gramatici TAG
Rezultatul prezentat anterior conduce la ideea de a mari puterea generativa a gra-
maticilor pe arbori prin introducerea unei operat ii noi, care sa insereze arbori n
arbori. Aceasta operat ie, numit a adjunct ie a fost denita n [6] si [7] si a condus
la o noua clasa de sisteme generative, TAG-urile.
Denit ia 6.4 O gramatica TAG (Tree Adjoining Grammar) este un quintuplu
(V
N
, V
T
, I, A, S), unde:
1. V
T
este o mult ime nita nevida de simboluri terminale;
2. V
N
este o mult ime nita nevida de simboluri neterminale, V
T
V
T
= ;
3. S V
N
este simbolul de start;
4. I este o mult ime nita nevida de arbori nit i numit i arbori init iali si caracteri-
zat i prin:
nodurile interioare sunt etichetate cu simboluri neterminale;
nodurile de pe frontiera sunt etichetate cu terminale sau neterminale;
simbolurile neterminale de pe frontiera sunt marcate pentru substitut ie cu
;
5. A este o mult ime nita nevida de arbori nit i numit i arbori auxiliari si caracte-
rizat i prin:
nodurile interioare sunt etichetate cu simboluri neterminale;
nodurile de pe frontiera sunt etichetate cu simboluri terminale sau neter-
minale; neterminalele sunt marcate pentru substitut ie cu nafara de un
singur nod numit picior, care este marcat cu asterisc ();
eticheta piciorului coincide cu eticheta nodului radacina al arborelui.
In gramaticile TAG lexicalizate, ecare arbore din I A are cel put in un simbol
terminal (ancora) pe frontiera.
Arborii din I A sunt numit i arbori elementari. Un X-arbore elementar este un
arbore din I A care are neterminalul X ca etichet a a radacinii.
Un arbore construit prin compunerea a doi arbori este numit arbore derivat.
Cand un nod este marcat pentru substitut ie, numai arborii derivat i din arborii
init iali pot substituit i n pozit ia lui.
Sa denim acum operat ia de adjunct ie. Fie un arbore (init ial, auxiliar sau
derivat) care are un nod n etichetat cu X si nemarcat (pentru substitut ie); con-
sideram un X-arbore auxiliar. Arborele rezultat prin adjunct ia lui la n
nodul n se construieste astfel:
1. Subarborele t al lui dominat de n este sters din , pastrandu-se o copie a
sa;
6.3. GRAMATICI TAG 69
2. Arborele este atasat nodului n;
3. Copia lui t este atasat a piciorului lui (inserat n ).
Exemplul 6.4 Un exemplu simplu de folosire a operat iei de ajunct ie este:
@
@ R
@
@R
@
@R
@
@R ?
@
@R
? ?
@
@R
?
S V P S
NP
0
V P V V P
NA
NP
0
V P
V NP
1
era V V P
NA
ars era V NP
1
ars
() () ()
Din considerente lingvistice apare necesitatea de a construi si o precizare a arbo-
rilor auxiliari care pot adjunct i unui nod dat (ceva similar dependent ei de context
n gramaticile Chomski). Aceasta se realizeaza prin restrict iile unei adjunct ii ([7],[8])
Fie G = (V
N
, V
T
, I, A, S) un TAG. Pentru orice nod al unui arbore elementar se
pot deni trei tipuri de restrict ii ale adjunct iilor:
1. Adjunct ie selectiva (SA(T)) - arborii care pot adjunctat i nodului sunt
din mult imea T A; adjunct ia nu este obligatorie.
2. Adjunct ie nula (NA) - nodul respectiv nu este implicat n nici o operat ie de
adjunct ie; restrict ia este echivalent a cu SA().
3. Adjunct ie obligatorie (OA(T)) - nodul trebuie sa e modicat cu o adjun-
ct ie folosind un arbore din T A. Pentru OA(A) se foloseste prescurtarea
OA.
In Exemplul 6.4, nodul V P din arborele are restrict ia NA, ceea ce nseamn a
ca la el nu se poate face nici o adjunct ie.
Daca nu se fac alte specicat ii, vom folosi n continuare gramatici TAG cu
substitut ii, adjunct ii si restrict ii pe adjunct ii.
Pentru un TAG G = (V
N
, V
T
, I, A, S), mult imea arborilor T(G) este mult imea
tuturor S-arborilor derivat i t cu Fr(t) V
T
. Acesti arbori sunt obt inut i plecand de
la arborii init iali.
Se mai poate deni si limbajul generat de un G ca ind
L(G) = {Fr(t)|t T(G)}.
70 PRELEGEREA 6. GRAMATICI PE ARBORI
Similar gramaticilor independente de context, se poate deni si aici arborele de
derivare; interpretarea sa este ns a put in diferita: un arbore de derivare este un
obiect care specica n mod unic construct ia arborelui derivat. Rad acina sa este S
(deci este un S-arbore), nodurile sale sunt radacini pentru arbori auxiliari (pentru
adjunct ie) sau init iali (pentru substitut ie), ordinea interpretarii derivarii n arbore
este arbitrara.
Exemplul 6.5 Gramatica de product ii
S SS, S a
care nu putea lexicalizata cu un TSG, poate lexicalizata folosind adjunct ia, astfel:
?
@
@R
?
S S
a
S
S
a
De remarcat ca a este ancora ambilor arbori (cel init ial si cel auxiliar).
Teorema 6.1 Daca G = (V
N
, V
T
, S, P) este o cfg nit ambigua cu L(G), atunci
exista o TAG lexicalizata G
lex
= (V
N
, V
T
, I, A, S) care genereaza acelasi limbaj si
arbori ca si G. Mai mult, G
lex
poate denita sa nu aiba noduri de sunstitut ie.
Demonstrat ie: Fie G = (V
N
, V
T
, S, P) o cfg nit ambigua cu L(G). Spunem ca
A V
N
este un simbol recursiv daca si numai daca , (V
N
V
T
)
, A =
A.
O product ie A este recursiva daca A este recursiv. Se pot da diversi algoritmi
pentru determinarea mult imilor simbolurilor (regulilor) recursive si nerecursive ([2]).
Partit ionam mult imea P a product iilor lui G n doua: mult imea R a regulilor
recursive si mult imea NR a regulilor nerecursive. Evident RNR = V
N
, RNR = .
Fie L(NR) = {w|S =
j
B
j
j
(conform cu c
i
);
daca B
j
este eticheta unui nod dintr-un arbore din I A atunci
pentru toate derivarile
j
=
w
j
V
T
,
j
=
z
j
V
T
care folosesc numai reguli nerecursive,
se adauga la A arborii auxiliari corspunzatori derivarii
B
j
=
j
B
j
j
=
w
j
B
j
z
j
, unde nodul B
j
de pe frontiera
este picior.
Construct ia de mai sus asigura ca tot i arborii auxiliari au cel put in un termen
lexical pe frontiera (
j
j
trebuie sa duca ntr-o secvent a terminala, altfel se ajunge
la derivarea B
j
=
B
j
, imposibila pentru o gramatica nit ambigu a).
G
lex
astfel construita este lexicalizata si genereaza acelasi set de arbori ca si G.
Teorema este demonstrata. 2
Evident, construct ia de mai sus nu conduce la o gramatica optima din punct de
vedere al num arului de elemente din I A; dar nu acest lucru s-a avut n vedere.
O alta concluzie a demonstrat iei anterioare este aceea ca adjunct ia este sucienta
pentru lexicalizarea gramaticilor independente de context. Totusi, luand adjunct ia
ca baza, substitut ia este utila pentru a scadea gradul de complexitate al gramaticilor.
Sa dam un exemplu pentru a ilustra aceasta armat ie:
Exemplul 6.6 Fie gramatica de product ii
S NP VP, VP V NP NP, V v, NP n
i
; i [1, k].
unde S, NP, VP, V V
N
, n, v V
T
.
H
H
Hj
?
?
@
@R
? ? ?
H
H
Hj
?
@
@R
?
?
S S NP
NP V P NP V P
n
i
n
i
V NP NP V NP NP
v
n
j
n
m
v
(a) (b)
Deoarece gramatica nu are product ii recursive, nu vor derivari de forma A =
In general, pentru gramatici de acest tip, folosirea substitut iei ca o a doua operat ie
scade numarul de arbori init iali de la O(k
3
) la O(k).
Se poate arata ca o proprietate remarcabila, faptul ca mult imea gramaticilor
TAG este nchisa la operat ia de lexicalizare.
Teorema 6.2 Daca G este un TAG nit ambiguu ( L(G)) cu substitut ia si
adjunct ia ca operat ii, atunci exista un TAG lexicalizat G
lex
care genereaza acelasi
limbaj si aceiasi arbori ca G.
Demonstrat ie: Demonstrat ia este similara celei de la teorema anterioar a; de aceea o
vom schit a doar. Separam din nou partea recursiva a gramaticii de cea nerecursiva.
Partea recursiva formeaza arborii auxiliari din G
lex
; deoarece G este nit ambigu a,
tot i arborii auxiliari vor avea cel put in un simbol terminal pe frontiera. Product iile
nerecursive vor genera arborii init iali. Cum L(G), si acestia vor avea cel put in
un simbol terminal pe frontier a. 2
Pentru aplicarea TAG-urilor n construct ii lingvistice se poate folosi (n cazul
limbii engleze) [9].
Bibliograe
[1] Allen, J. - Natural Language Understanding, The Benjamin/Cummings Publ.
Co. Inc, 1995
[2] Atanasiu, A - Bazele Informaticii; suport de curs pentru anul II seral; Tipograa
Universitatii, 1987;
[3] Atanasiu, A. - Modele matematice n scrierea compilatoarelor; Ed. Olimp, 1996.
[4] Craciun, Dragos- Analizor morfologic pentru limba romana, Lucrare de licent a,
1997
[5] Holan, T, Kubon, V, Platek, M - An implementation of Syntactic Analysis of
Czech, Proceedings of Fourth International Workshop on Parsing Technologies,
Prague and Karlovy Vary, sept. 20-24, 1995, pp. 126-135.
[6] Joshi, A.K., Levi, L.S., Takahashi, M. - Tree Adjunct Grammars, J. Comput.
Syst. Sci. 10(1), 1975.
[7] Joshi, A.K. - How much context-senzitivity is necessary for Characterizing
Structural description - Tree Adjoining Grammars; n Natural Language Pro-
cessing - Theoretical Computational and Psychological Perspectives, Cam-
bridge University Press, 1985.
[8] Joshi, A.K. - The relevance of Tree Adjoining Grammar to generation; n Nat-
ural Language Generation, Martinus Nijho Publishers, Dordrecht, 1987
[9] Schabes, Y. - Mathematical and Computational aspects of Lexicalized Gram-
mars; Eight European Summer School in Logic, Language and Information,
Praga, 12-23 August 1996
[10] Gramatica Limbii Romane, Editura Academiei, 1966
73
Prelegerea 7
Extensii ale cfg-urilor
Dupa cum se stie, majoritatea analizorilor sintactici se bazeaza pe gramatici in-
dependente de context; acestea sunt ns a prea restrictive si nu pot cuprinde toata
bogat ia unui limbaj natural. De aceea vom face o extensie a acestor gramatici
asociindu-le un set de caracteristici.
7.1 Sisteme de caracteristici si gramatici augmen-
tate
In limbajele naturale exista not iunea de acordntre cuvinte n cadrul unei propozit ii.
De exemplu, construct ia NP: un creioane nu este corecta, deoarece articolul ne-
hotar at un este la singular, iar substantivul creioane este la plural. Spunem ca acest
NP nu satisface acordul de numar al limbii romane. Exista multe alte acorduri,
cum ar acordul subiect-predicat, acordul de gen pentru pronume, si altele. Pen-
tru a controla aceste fenomene de limb a, vom extinde formalismul gramatical prin
adaugarea de constituient i numit i caracteristici.
De exemplu, putem deni caracteristica NUM
AR2
Semnicat ia ei este: o expresie substantivala corecta este formata dintr-un articol
urmat de un substantiv, cu condit ia ca cele doua cuvinte sa e n acord relativ la
numar.
Aceasta product ie este echivalent a cu doua reguli independente de context care
vor folosi terminale distincte pentru codicarea formei singular si respectiv plural
ale expresiilor substantivale:
NP.
SING
ART.
SING
N.
SING
NP.
PLURAL
ART.
PLURAL
N.
PLURAL
Utilizarea unei astfel de construct ii ar conduce nsa la dublarea num arului de
product ii din gramatica. Si n mod similar, orice caracteristica noua ar multiplica
num arul product iilor n mod articial. Din acest punct de vedere, este preferabila
73
74 PRELEGEREA 7. EXTENSII ALE CFG-URILOR
maniera de denire formala a caracteristicilor (si deci dimensiunea gramaticii va
ram ane neschimbat a).
Pentru a realiza aceasta, se denesc constituient i numit i structuri caracteristice;
ei sunt de fapt aplicat ii part ial denite de la caracteristici la valori de caracteristici,
care denesc proprietat i relevante ale constituient ilor.
De exemplu, o structura caracteristica a unui constituient ART1 care reprezint a
o anumita utilizare a unui cuvant poate scrisa astfel:
ART1 : (CAT ART
ROOT
NUM
AR s)
Aceasta spune ca ART1 este un constituient din categoria ART care are ca
rad acin a cuvantul si este la numarul singular.
De obicei se foloseste o alta scriere, care se apropie de modul de reprezentare al
product iilor unei gramatici independente de context. Astfel, denit ia de mai sus are
forma:
ART1:(ART ROOT NUM
AR s)
Structurile caracteristice pot folosite ele nsele ca valori, ducand la formarea
de constituient i mai complexi.
Intr-o astfel de construct ie, ordinea de aparit ie a
substructurilor este numerotat a. Astfel, pentru regula
NP ART N
reprezentarea de exemplu a expresiei substantivale NP: un pui, poate :
NP1 : (NP NUM
AR s
1 (ART ROOT un
NUM
AR s)
2 (N ROOT pui
NUM
AR s))
Acelasi constituient se poate reprezenta sub forma arborescenta astfel:
Figura 7.1:
NP
ART N
s
s s
un pui
-
H
H
Hj
?
?
?
?
NUM
AR
1 2
ROOT ROOT
NUM
AR NUM
AR
Pentru a surprinde aceste caracteristici, vom folosi o augmentare a product iilor
gramaticii, n care neterminalele sunt valori de caracteristici.
De exemplu, pentru regula folosita anterior, product ia augmentata este:
(NP NUM
AR ?n)(N NUM
AR ?n)
7.1. SISTEME DE CARACTERISTICI SI GRAMATICI AUGMENTATE 75
Semnicat ia ei este: un constituient NP consta din doi subconstituient i, primul ind
un ART iar al doilea un N, n care caracteristica NUM
AR s)
2 (N NUM
AR s))
nu este corect, deoarece NP nu are denita caracteristica NUM
AR; la fel,
(NP NUM
AR s
1 (ART NUM
AR s)
2 (N NUM
AR p))
nu este corect deoarece caracteristica NUM
AR ?n)
Aceasta nseamn a ca orice valoare a caracteristicii NUM
AR ?n{s,p})
dar si - mai simplu
(N ROOT pui NUM
AR {s,p})
O problema teoretica care se pune este aceea daca puterea generativa a gramati-
cilor astfel augmentate nu depaseste cumva L
2
. Este clar ca - n cazul n care
mult imile de valori pentru restrict iile caracteristicilor sunt nite, se pot crea cate-
gorii de constituient i pentru toate combinat iile de caracteristici, ceea ce conduce tot
la o gramatica independent a de context. Pentru mult imi arbitrare de valori, puterea
generativa o egaleaza pe cea a masinilor Turing. Totusi, din punct de vedere prac-
tic, chiar daca o mult ime de valori nu este restrans a explicit, ea nu parcurge decat
o mult ime nita, deci se pot folosi algoritmii standard de analiza construit i pentru
gramaticile independente de context.
76 PRELEGEREA 7. EXTENSII ALE CFG-URILOR
7.2 Cateva sisteme de caracteristici
7.2.1 Caracteristici de numar si persoana
Aceste doua restrict ii - numite si acord numar - persoana - sunt foarte des folosite
n gramatica limbii romane. Locul unde ele sunt nt alnite cel mai frecvent este la
mbinarea subiect - predicat.
Deoarece - asa cum se stie din practica - ele sunt dependente unul de altul n
conjugari, este convenabil sa se creeze o caracteristica comun a AGR - cu sase valori
posibile (persoanele I,II,III singular si plural) codicate respectiv prin 1s, 2s, 3s, 1p,
2p, 3p.
De exemplu, cuvantul este poate corect numai pentru persoana a III-a singular;
deci caracteristica sa AGR este 3s. Pentru cuvantul scriu, caracteristica AGR este
o valoare din mult imea {1s, 3p}.
7.2.2 Caracteristici ale verbelor
Exista o caracteristica importanta a limbii - VFORM - legata de forma verbelor n
conjugare. Utilitatea ei apare mai ales la analiza part ilor auxiliare de propozit ie si la
stabilirea de restrict ii de mp art ire pe subdomenii pentru prexe a verbelor. Limba
roman a prezint a destule complicat ii; de aceea, pentru a surprinde anumite nuant e,
vom lucra cu urmatoarele valori ale caracteristicii VFORM:
Tabelul 7.1:
inf : innitiv: a , a lucra, a sti, a culege, . . .
ind : indicativ: , lucra, sti, culege, . . .
pres : indicativ prezent (sau prezentul simplu): sunt, lucrez, stiu, culeg, . . .
imp : indicativ trecut - imperfect: eram, lucram, stiam, culegeam, . . .
sim : indicativ trecut - perfectul simplu: fusei, lucrai, stiui, culesei, . . .
conj : conjunctiv: sa u, sa lucrez, sa stiu, sa culeg, . . .
prt : participiu: fost, lucrat, stiut, cules, . . .
ger : gerunziu: ind, lucrand, stiind, culegand, . . .
Pentru a putea realiza interact iunea dintre predicate si complementele lor, se
foloseste o alta caracteristica, SUBCAT.
In Tabelul 7.2 sunt prezentate cateva valori
ale acestei caracteristici pentru complemente formate din combinat ii NP V P.
Sa luam din acest tabel de exemplu valoarea np vp:conj; ea va utilizata pentru
a indica un complement format dintr-un NP urmat de un VP a carui valoare carac-
teristica VFORM este conj. Aceasta regula poate scrisa sub forma unei product ii
astfel:
(VP) (V SUBCAT np vp : conj)
(NP)
(VP VFORM conj)
Explicitand n cuvinte, o expresie verbala V P consta dintr-un V cu valoarea
SUBCAT np vp:conj, urmat de un NP, urmat de un V P cu valoarea VFORM
conj.
7.2. C
In Tabelul 7.3 sunt date cateva exemple de valori ale caracteristicii PFORM.
Aceasta caracteristica poate folosita pentru a sistematiza formele de comple-
ment ale verbelor. Astfel, valoarea SUBCAT a unui verb cum ar a pune este
np pp:loc, iar o regula scrisa similar product iilor gramaticale va avea forma:
(VP) (V SUBCAT np pp : loc)
(NP)
(PP PFORM LOC)
In cazul propozit iilor dependente unele de altele, not iunea de completiva apare
n mod natural si va trebui sa construim o subcategorie pentru ea; o vom numi
caracteristica COMP, cu valori posibile ca, pentru, ca, pentru ca,. . . De exemplu,
verbul a spune poate solicita o completiva prin ca; deci, o valoare SUBCAT pentru
a spune va s:ca.
In Tabelul 7.4 sunt listate cateva valori SUBCAT suplimentare si exemple pentru
cateva verbe.
Tabelul 7.4:
Valoare Exemplu verb Exemplu propozit ie
np pp : lui a da Ion a dat un pix lui Marin.
pp : loc a Adrian este la scoala.
np pp : loc a pune Eugen a pus cutia n colt .
pp : mot a se duce Laura s-a dus la magazin.
np pp : mot a lua Ana a luat copilul la piat a.
adjp a Paul este fericit.
np adjp a t ine Sot ia t ine cina calda.
s:ca a crede Radu crede ca lumea e mica.
s:pentru ca a se ruga Ana se roaga pentru ca este crestina.
7.2.3 Caracteristici binare
Anumite caracteristici au proprietatea ca orice constituient poseda sau nu caracter-
istica respectiva (deci o decizie binara). Putem formaliza aceasta ca o caracteristica
cu mult imea valorilor {, +}.
De exemplu, caracteristica INV indica daca o propozit ie S este enunt iativ a sau
interogativ a. Deci, S - structura pentru propozit ia
Ion rade.
are o INV valoare , n timp ce S - structura pentru propozit ia
Ion rade ?
are valoarea INV +.
Adesea aceasta valoare este folosita ca prex, si se scrie + INV sau INV.
7.3. ANALIZA MORFOLOGIC
A SI LEXICONUL 79
7.2.4 Valoarea eroare pentru caracteristici
In multe ocazii este util sa alocam pentru caracteristici si o valoare de eroare. Ori
de cate ori un constituient este construit sa aiba o caracteristica iar valoarea acelei
caracteristici lipseste (nu este specicata), caracteristica va lua valoarea de eroare
.
Aceasta valoare este inserata automat la prima construire a constituientului.
7.3 Analiza morfologica si lexiconul
A SI LEXICONUL 81
want : (V ROOT want
SUBCAT { np vp : inf np vp : ger}
VFORM pres)
AGR 3s)
Exemplul 7.2 O alta regula va genera constituient ii pentru indicativ trecut per-
soanele I si II care, pentru limba engleza, au aproape totdeauna aceeasi forma cu
participiul.
(V ROOT ?r SUBCAT ?s VFORM prez AGR (1s 2s 1p 2p 3p))
(V ROOT ?r SUBCAT ?s VFORM ind)
Aceasta regula funct ioneaza numai pentru verbele regulate. Aplicata fara dis-
cernamant, ea poate conduce la forme gresite. De exemplu, verbul to be nu poate
folosi aceasta regula; propozit ia
We be at the store.
este gresita. Nu mai vorbim de limba romana, unde numarul verbelor neregulate
este semnicativ mai mare.
Pentru aceste situat ii - cum este cea din Exemplul 7.2 - se introduce o ca-
racteristica suplimentara care va identica verbele neregulate. Anume, vom avea
o caracteristica binara IRREG-PRES pentru verbele care au forme neregulate la
indicativ prezent.
In acest fel, regula de mai sus se scrie corect:
(V ROOT ?r SUBCAT ?s VFORM prez AGR (1s 2s 1p 2p 3p))
(V ROOT ?r SUBCAT ?s VFORM ind IRREGPRES)
Folosind valoarea de eroare pentru caracteristici, aceasta caracteristica va spe-
cicata numai n cazul verbelor neregulate. Similar se procedeaza n cazul realiza-
rii timpului trecut sub forma neregulata (pentru limba roman a - perfectul sim-
plu): caracteristica binara va IRREG-PAST; sau a participiului: EN-PASTPRT
pentru verbele care au terminat ia la participiu - en n loc de - ed (similar limbii
romane pentru unele verbe: a - fost, a scoate - scos). Toate aceste caracteristici
restrict ioneaz a aplicarea regulilor lexicale standard si toate formele neregulate sunt
adaugate explicit n lexicon.
In Tabelul 7.5 este denita o gramatica pentru cateva astfel de reguli, aplicate n
declinarea substantivelor si conjugarea verbelor din limba engleza (am folosit ns a
termenii din gramatica limbii romane - participiu, gerunziu).
Fiind dat un set mare de astfel de caracteristici, sarcina de a scrie elementele unui
lexicon devine foarte dicila. De aceea este necesara utilizarea de diverse mecanisme
care sa ajute la simplicarea denit iilor.
O prima tehnica - valoarea de eroare pentru caracteristici (care poate eventual
omisa) - a fost deja ment ionata.
O alta tehnica consta n denirea de pachete de caracteristici, notate cu cate un
simbol.
In Tabelul 7.6 este construit un mic lexicon. El cont ine trei intr ari pentru
cuvantul saw: ca substantiv (erastrau), verb regulat (a taia) si trecutul - forma
neregulata a verbului to see (a vedea).
82 PRELEGEREA 7. EXTENSII ALE CFG-URILOR
Cu acest lexicon si gramatica din Tabelul 7.5 se pot genera si alte cuvinte, cum
ar : been, being, cries, cried, dogs, saws (doua interpretari), sawed, sawing, seen,
seeing, seeds, wants, wanting, wanted.
Adesea un cuvant are mai multe interpret ari care folosesc diverse linii din lexicon
si diferite reguli lexicale ale gramaticii. Cuvantul saws de exemplu, transformat n
secvent a saw+s, poate pluralul unui substantiv (via product ia 7 si prima denit ie
pentru saw), sau indicativ prezent, persoana a treia singular a verbului saw (via
product ia 1 si a doua denit ie pentru saw). De remarcat ca product ia 1 nu se poate
aplica celei de-a treia denit ii, deoarece la aceasta VFORM nu este ind.
Prelegerea 8
Utilizarea caracteristicilor n
analiza
8.1 Generarea gramaticilor cu caracteristici
Vom construi aici o gramatica simpla bazata pe sistemele de caracteristici si lexiconul
(de limba engleza) dezvoltat n cursul trecut. Ea va accepta propozit ii cum ar :
The man cries. The men cry.
The man saw the dogs. He wants the dog.
He wants to be happy. He wants the man to see the dog.
He is happy to be a dog.
si va respinge propozit ii de forma:
() The men cries. () The man cry.
() The man saw to be happy. () He wants.
() He wants the man saw the dog.
A
Anumite caracteristici trebuie sa verice restrict ia ca valoarea denita la nceput
sa coincida cu valoarea unui subconstituient; ele sunt numite caracteristici direc-
toare. De exemplu, n toate regulile VP, valorile caracteristicilor VFORM si AGR
au aceasta proprietate, ca n regula:
(VP VFORM ?v AGR ?a)
(V VFORM ?v AGR ?a SUBCAT np vp : inf)
(NP)
(VP VFORM inf)
Daca am putea scrie caracteristicile directoare separat de reguli, la cerere, sis-
temul le poate adauga automat. Astfel, daca VFORM si AGR sunt declarate ca-
racteristici directoare, regula de sus poate abreviata n:
VP (V SUBCAT np vp : inf) NP (VP VFORM inf)
Constituientul director al unei reguli a fost indicat prin o scriere ngrosata.
Combinand toate aceste prescurtari convenite, regula anterioar a va scrisa:
VP V [ np vp : inf] NP VP[inf]
In Tabelul 8.1 este denita o gramatica simpla. Exceptand product iile 1 si 2 care
trebuie sa asigure acordul de numar, toate celelalte restrict ii de caracteristici pot
folosi abrevierile denite anterior.
Tabelul 8.1:
1. S[inv] (NP AGR ?a) (VP [{prez past}] AGR ?a)
2. NP (ART AGR ?a) (N AGR ?a)
3. NP PRO
4. VP V [ none]
5. VP V [ np] NP
6. VP V [ vp : inf] VP[inf]
7. VP V [ np vp : inf] NP VP[inf]
8. VP V [ adjp] ADJP
9. VP[inf] TO VP[ind]
10. ADJP ADJ
11. ADJP ADJ[ vp : inf] VP[inf]
Caracteristici directoare pentru S,VP: VFORM,AGR
Caracteristici directoare pentru NP: AGR
Aceasta gramatica este o scriere prescurtata a gramaticii urmatoare:
8.1. GENERAREA GRAMATICILOR CU CARACTERISTICI 85
1. (S INV VFORM ?v{pres past} AGR ?a)
(NP AGR ?a) (VP VFORM ?v{pres past} AGR ?a)
2. (NP AGR ?a) (ART AGR ?a) (N AGR ?a)
3. (NP AGR ?a) (PRO AGR ?a)
4. (VP AGR ?a VFORM ?v) (V SUBCAT none AGR ?a VFORM ?v)
5. (VP AGR ?a VFORM ?v) (V SUBCAT np AGR ?a VFORM ?v) NP
6. (VP AGR ?a VFORM ?v)
(V SUBCAT vp : inf AGR ?a) (VP VFORM inf)
7. (VP AGR ?a VFORM ?v)
(V SUBCAT np vp : inf AGR ?a VFORM ?v) NP (VP VFORM inf)
8. (VP AGR ?a VFORM ?v)
(V SUBCAT adjp AGR ?a VFORM ?v) ADJP
9. (VP SUBCAT inf AGR ?a VFORM inf)
(TO AGR ?a VFORM inf ) (VP VFORM ind)
10. ADJP ADJ
11. ADJP ADJ (SUBCAT vp : inf) (VP VFORM inf)
Forma prescurtata este de asemenea foarte utila n reprezentarea arborilor de
analiza. De exemplu, n Figura 8.1 sunt reprezentat i arborii de analiza pentru doua
propozit ii date anterior ca exemplu; se arata astfel ca ele sunt construct ii corecte
din punct de vedere al gramaticii denite n Tabelul 8.1.
Figura 8.1:
S[3s]
NP[3s] V P[pres, 3s]
ART[3s] N[3s] V [pres, 3s, none]
the
man
cries
S[3s]
NP[3s] V P[pres, 3s]
PRO[3s] V [pres, 3s, vp : inf] V P[inf]
TO
V P[ind]
V [ind, adjp]
ADJP
He wants
to
be
happy
>
>
> >.
-
-
-
-
-
-
>
>
>.
.
.
.
.
.
.,
-
-
-
-
-
-
.
.
.
.
.
.,
-
-
-
-
-
--
.
.
.
.
.
.,
Sa vedem motivele pentru care propozit iile date ca exemple negative la nceputul
prelegerii, nu sunt acceptate de aceasta gramatica.
The men cries nu verica acordul de numar al regulii 1. Constituientul NP
pentru the men are valoarea AGR 3p n timp ce VP cries are valoarea AGR 3s; deci
86 PRELEGEREA 8. UTILIZAREA CARACTERISTICILOR
IN ANALIZ
A
regula 1 nu se poate aplica.
La fel, The man cry nu este acceptat deoarece the man are valoarea AGR 3s iar
VP cry are ca valoare AGR o variabila cu valori n domeniul {1s 2s 1p 2p 3p}.
Propozit ia The man saw to be happy nu este acceptata deoarece verbul saw are
valoarea SUBCAT np; deci numai regula 5 poate folosita pentru a construi un
VP. Dar regula 5 cere un complement NP, imposibil pentru secvent a to be happy.
Propozit ia He wants nu este acceptata deoarece verbul wants are valoarea SUB-
CAT din domeniul { np vp:inf np vp:inf}, deci pot folosite numai regulile 5, 6
sau 7 pentru a construi un V P. Toate aceste reguli cer ns a un complement nevid
de un tip oarecare.
Propozit ia He wants the man saw the dog nu este acceptata din motive similare:
din nou, wants face posibila aplicarea regulilor 5, 6 sau 7.5 si 6 nu se pot aplica, iar
7 cere un NP si un VP[inf ]. Construct ia the man da NP-ul cerut, dar saw the dog
nu este un VP[inf ]; n particular saw the man este un VP corect, dar restrict ia sa
VFORM va past, nu inf.
8.2 Analiza sintactica folosind caracteristici
Algoritmii de analiza dezvoltat i anterior pentru gramatici independente de con-
text pot extinsi la aceste clase noi de gramatici, prin generalizarea regulilor la
constituient i.
Reamintim, algoritmul bottom-up dadea posibilitatea extensiei arcelor active cu
constituient i noi. Astfel, un constituient X putea extinde un arc de forma C
C
1
. . . C
i
X . . . C
n
, producand un arc nou de forma C C
1
. . . C
i
X . . . C
n
.
O operat ie similara poate facut a n cazul gramaticilor cu caracteristici; aici
nsa analizorul trebuie ca - nainte de a face extensia cu X - sa instant ieze variabilele
din arcul originar.
Exemplul 8.1 Sa consideram regula:
1. (NP AGR ?a) (ART AGR ?a) (N AGR ?a)
Ea spune ca se poate deni un NP dintr-un ART si un N, daca toate cele trei
componente sunt n rezonant a pe caracteristica AGR. Nu exista nici o restrict ie
pentru alte caracteristici pe care le pot avea n plus NP,ART si N. Deci, daca con-
sideram constituient ii pentru aceasta regula, doar caracteristica AGR este cea care
conteaza; celelalte pot ignorate.
Fie de exemplu construct ia un pahar. Pentru nceput, va trebui sa consideram
extensia arcului 1 cu constituientul
2. (ART ROOT UN AGR 3s)
Pentru a face arcul 1 aplicabil, variabila ?a trebuie instant iata cu 3s, ceea ce
duce la:
3. (NP AGR 3s) (ART AGR 3s) (N AGR 3s)
Deoarece caracteristica din regula este si n constituientul 2, arcul poate extins:
4. (NP AGR 3s) (ART AGR 3s) (N AGR 3s)
Sa ncercam acum extensia acestui arc cu constituientul corespunzator cuvantului
pahar:
5. (N ROOT PAHAR1 AGR 3s)
8.2. ANALIZA SINTACTIC
A FOLOSIND CARACTERISTICI 87
Extensia este posibila pentru ca valoarea caracteristicii AGR este aceeasi. Deci:
6. (NP AGR 3s) (ART AGR 3s) (N AGR 3s)
Aceasta nseamna ca n nal analizorul a gasit un constituient de forma
(NP AGR 3s).
Algoritmul este urmatorul:
Fiind dat un arc A n care constituientul de dupa este NEXT, si un nou
constituient X utilizat pentru extensia arcului:
1. Se cauta o instant iere a variabilelor astfel nc at toate caracteristicile spe-
cicate n NEXT se aa n X;
2. Se creaza un nou arc A care este o copie a lui A, cu valorile variabilelor
determinate la pasul anterior;
3. Se actualizeaza A conform algoritmului de analiza sintactica similar.
Exemplul 8.2 Revenind la exemplul anterior, e A arcul 1 si X constituientul ART
dat de 2. Atunci NEXT va (ART AGR ?a).
A
Exemplul 8.4 Sa presupunem ca harta cont ine deja doi constituient i ART1 si
N1 pentru cuvintele un respectiv pahar; constituientul adaugat n harta pentru
secvent a un pahar este:
(NP AGR 3s
1 ART1
2 N1)
unde
ART1 = (ART ROOT un AGR {3s 3p}), N1 = (N ROOT pahar AGR {3s}).
Caracteristica AGR a lui ART1 nu a fost schimbata; deci ea poate folosita si
de alte interpretari pentru care este posibila valoarea 3p. Orice algoritm de analiza
bottom-up construit anterior poate folosit lucrand cu o gramatica augmentata n
acest mod.
Figura 8.2:
S1 CAT S
AGR 3s
VFORM prez
INV
1 NP1
2 VP3
VP3 CAT VP
VFORM prez
AGR 3s
1 V 1
2 VP2
VP2 CAT VP
VFORM
inf
1 TO1
2 VP1
NP1 CAT NP VP1 CAT V P
AGR 3s VFORM ind
1 PRO1 1 V 2
PRO CAT PRO V 1 CAT V TO1 CAT TO V 2 CAT V
AGR 3s ROOT want ROOT cry
VFORM prez VFORM ind
AGR 3s SUBCAT
SUBCAT none
{ np, vp : inf,
np vp : inf}
He wants to cry
Exemplul 8.5 Figura 8.2 cont ine o harta nala obt inuta din analiza propozit iei
He wants to cry.
8.3. RET ELE DE TRANZIT IE AUGMENTATE 89
folosind gramatica din Tabelul 8.1 (pentru care s-a construit si derivarea din Figura
8.1).
`
NP NP1 NP2
art subst
pop
nume
1 2
3
Arc Test Act iuni
1 none DET :=
AGR := AGR
2 AGR AGR
HEAD :=
AGR := AGR AGR
3 none NUME :=
AGR := AGR
A
Orice ATN foloseste un mecanism special pentru a extrage rezultatul n urma
traversarii unui arc. Cand se parcurge un arc - de exemplu arcul 1 - n prima
faza constituientul denit n cuvantul de intrare este salvat ntr-o variabila speciala
numita . Act iunea DET := asigneaza apoi acest constituient registrului DET. A
doua act iune a arcului, AGR := AGR
S S1 S2 S3
NP V NP
pop
4 5 6
Arc Test Act iuni
4 none SUBJ :=
5 AGR
SUBJ
AGR
MAIN V :=
AGR := AGR
SUBJ
AGR
6 none OBJ :=
AGR := AGR
corect scoate:
((S SUBJ (NP DET the
HEAD dog
AGR 3s)
MAIN V saw
AGR 3s
OBJ (NP NUME Jack
AGR 3s))
B. Primul apel al ret elei NP: (arc 4)
Pas Nod Pozit ie Arc traversat Set de registri
2 NP 1 1 DET the
AGR {3s 3p}
3 NP1 2 2(verica HEAD dog
{3s 3p} 3s)
4 NP2 pop ntoarce:
(NP DET the
HEAD dog
AGR 3s)
C. Al doilea apel al ret elei NP: (arc 6)
Pas Nod Pozit ie Arc traversat Set de registri
7 NP 4 3 NUME Jack
AGR 3s
8 NP2 pop ntoarce:
(NP NUME Jack
AGR 3s)
8.4 Gramatici de unicare
Dupa cum s-a vazut, caracteristicile sunt deosebit de utile n generalizarea not iunilor
de gramatica independent a de context si ret ea de tranzit ie. Rolul lor poate extins
astfel nc at sa elimine complet folosirea gramaticilor.
In acest fel, o gramatica poate
92 PRELEGEREA 8. UTILIZAREA CARACTERISTICILOR
IN ANALIZ
A
utilizata doar ca un set de restrict ii ntre diverse structuri de caracteristici. Astfel
de sisteme sunt cunoscute sub numele de gramatici de unicare.
Conceptul de baza ntr-o gramatica de unicare este acela de extensie ntre doua
structuri de caracteristici.
Denit ia 8.2 O structura de caracteristici F
1
extinde (sau este mai precisa de-
cat) F
2
daca orice valoare de caracteristica din F
1
este specicata n F
2
.
Exemplul 8.9 Structura (CAT V ROOT doarme) extinde structura (CAT V ). Pe
de-alta parte nici una din structurile
(CAT V ROOT doarme) si (CAT V VFORM prez)
nu este extensia celeilalte.
Denit ia 8.3 Doua structuri unica daca exista o structura de caracteristici care
este o extensie a ambelor.
Structura de caracteristici minimala cu aceasta proprietate se numeste cel mai
general unicator.
Exemplul 8.10 Cel mai general unicator al celor doua structuri din exemplul
anterior este
(CAT V ROOT doarme VFORM prez)
In schimb, structurile (CAT V AGR 3s) si (CAT V AGR 3p) nu se pot unica.
Acest neajuns se elimina daca putem aloca si seturi de valori de caracteris-
tici (de exemplu {3s 3p}). Atunci putem spune ca, de exemplu (AGR 3s) extinde
(AGR {3s 3p}).
Folosind aceste idei, se poate deni o gramatica numai n termeni de unicare. O
regula cum ar
S NP VP
(uzuala n gramaticile pentru limbaje naturale) poate exprimata ntr-o gramatica
de unicare astfel:
X
0
X
1
X
2
CAT
0
= S
CAT
1
= NP
CAT
2
= VP
AGR
0
= AGR
1
= AGR
2
VFORM
0
= VFORM
2
Aceasta spune ca un constituient X
0
poate construit dintr-o scevent a de doi
constituinet i X
1
si X
2
, daca CAT pentru X
0
este S, pentru X
1
este NP, iar pentru
X
2
este VP; n plus, trebuie ca valorile AGR ale celor trei constituient i sa e identice,
la fel ca si valorile VFORM pentru X
0
si X
2
.
Daca valoarea CAT este specicata totdeauna, regula poate scrisa mai concis
(folosind valorile CAT n scrierea product iei, iar indicele 0 este omis):
S NP VP AGR = AGR
1
= AGR
2
VFORM = VFORM
2
. S NP VP AGR = AGR
1
= AGR
2
VFORM = VFORM
2
2
. VP V ADJP SUBCAT
1
= adjp
VFORM = VFORM
1
AGR = AGR
1
10
. ADJP ADJ
Reprezentarea structurilor de caracteristici sub forma de DAG
Formalismul de unicare poate denit mai precis reprezentand structurile de
caracteristici sub forma de grafuri orientate aciclice - pe scurt dag (Directed Acyclic
Graphs). Fiecare constituient si valoare formeaza un nod, iar caracteristicile sunt
reprezentate prin arce marcate.
Atent ie ! A nu se face confuzie ntre dag si tag - Tree Adjoining Grammars,
introdusi anterior pentru modelari lexicale si sintactice.
Exemplul 8.12 Pentru constituient ii
N1 : (CAT N N2 : (CAT N
ROOT peste AGR 3s)
AGR {3s 3p})
se pot construi dag-urile:
N1 N2
N
peste {3s 3p}
N
{3s}
-
`
`
`
`
`
``
-
`
`
`
`
`
`
CAT
ROOT
AGR CAT AGR
Trecerea de la un mod de realizare la altul este evident a.
Unicarea a doua structuri de caracteristici este denita sub forma unui algoritm
de unicare a doua grafuri. Anume:
Algoritmul 8.1
Intrare: Doua dag-uri avand ca radacini nodurile N
i
respectiv N
j
.
Iesire: Un dag corespunzator unicarii celor doua dag-uri de la intrare.
Algoritm:
1. Daca N
i
coincide cu N
j
, atunci ntoarce N
i
; Stop.
2. Daca N
i
si N
j
sunt noduri terminale, se compara marcajele lor; daca intersec-
t ia acestora este nevida, se construieste un nou nod care are ca marcaj aceasta
intersect ie. Altfel, dag-urile nu se pot unica.
94 PRELEGEREA 8. UTILIZAREA CARACTERISTICILOR
IN ANALIZ
A
3. Daca N
i
si N
j
nu sunt noduri terminale, atunci se creaza un nod nou N.
Pentru ecare arc marcat cu F de la nodul N
i
la nodul NF
i
:
(a) Daca exista un arc marcat cu F de la nodul N
j
la NF
j
, atunci se unica
recursiv nodurile NF
i
cu NF
j
. Se construieste un arc marcat cu F de la
N la rezultatul acestei construct ii recursive.
(b) Daca din N
j
nu exista nici un arc marcat cu F, se construieste un arc
marcat cu F de la N la NF
i
.
(c) Pentru ecare arc marcat cu F de la N
j
la NF
j
ce nu are arc similar
care pleaca din N
i
, se creaza un arc nou marcat cu F de la N la NF
j
.
Exemplul 8.13 Aplicand acest algoritm nodurilor N1 si N2 date anterior, se ob-
t ine constituientul
N3 : (CAT N ROOT peste AGR 3s)
Se poate construi acum un algoritm de generare a constituient ilor folosind ecua-
t iile de unicare bazate pe dag-uri.
Algoritmul 8.2
Intrare:
Product ia X
0
X
1
. . . X
n
;
SC
1
, SC
2
, . . . , SC
n
- subconstituient ii corespunzatori lui X
1
, X
2
, . . . , X
n
;
Un set de ecuat ii caracteristice de forma F
i
= V , unde F
i
este caracteristica
F a subconstituientului i.
Iesire: Un dag care satisface toate ecuat iile caracteristice.
Algoritm:
1. Se genereaza un nod CC
0
ca radacina a noii structuri;
2. Pentru ecare i, 1 i n:
Se face o copie a dag-ului de radacina SC
i
si se noteaza cu CC
i
radacina
acestei copii;
Se traseaza un arc marcat cu i de la CC
0
la CC
i
.
3. Pentru ecare ecuat ie caracteristica de forma F
i
= V unde V este o valoare,
se urmareste legatura F de la nodul CC
i
la un nod N
i
si se unica N
i
cu V .
4. Pentru ecare ecuat ie caracteristica (de forma F
i
= G
j
):
(a) Daca exista o legatura F din CC
i
si o legatura G
j
din CC
j
, atunci:
i. se urmareste F pana la un nod N
i
si G pana la un nod N
j
;
ii. se unica N
i
cu N
j
folosind algoritmul anterior si se creaza astfel un
nod nou X;
iii. toate arcele care intrau n N
i
sau N
j
sunt aduse n X.
8.4. GRAMATICI DE UNIFICARE 95
(b) Daca nu exista nici o legatura F din CC
i
dar exista o legatura G de la
CC
j
la un nod N
j
, se creaza o legatura F de la CC
i
la N
j
;
(c) Daca nu exista nici o legatura G din CC
j
dar exista o legatura F de la
CC
i
la un nod N
i
, se creaza o legatura G de la CC
j
la N
i
.
Exemplul 8.14 Sa presupunem ca sunt denit i constituient ii
ART
1
: (CAT ART N1 : (CAT N
ROOT the ROOT sh
AGR {3s 3p}) AGR {3s 3p})
sau, n notat ie de dag-uri:
ART1
the
{3s 3p}
ART
ROOT
AGR
CAT
N1
fish {3s 3p}
N
ROOT
AGR
CAT
Un NP pentru expresia the sh poate acum construit folosind regula 2
.
Ecuat iile caracteristice sunt:
CAT
0
= NP
CAT
1
= ART
CAT
2
= N
AGR
0
= AGR
1
= AGR
2
Algoritmul va realiza constituientul reprezentat de dag-ul:
the ART
{3s 3p} fish
N
CC
1
CC
2
CC
0 NP
CAT
1
AGR
2
ROOT
CAT
AGR AGR
ROOT
CAT
96 PRELEGEREA 8. UTILIZAREA CARACTERISTICILOR
IN ANALIZ
A
Exemplul 8.15 Sa presupunem ca expresia verbala (V P) is happy este anal-
izata similar si reprezentata prin dag-ul (pentru simplicare nu au fost trasate arcele
CAT):
V P1
V 1
ADJP1
is
{3s}
ADJ1
happy
.
`
`
`
`
`
`
``
.
`
`
`
`
`
`
``
1 AGR 2
ROOT AGR 1
ROOT
Pe baza acestor analize si a regulii 1 din gramatica data n Tabelul 8.1, se poate
construi analiza propozit iei
The sh is happy:
the
fish {3s} is happy
ADJ1
ART1 N1 V 1 ADJP1
NP1 V P1
S1
.
`
`
`
`
`
`
``
.
`
`
`
`
`
`
`
`
`
`
`
`
`
`
`
`
`
`
`
`
`
`
`
`
`
`
`
`
`
`
`
`
`
`
`
`
`
`
`
`
`
`
`
`
`
`
1 AGR 2
1 2 AGR AGR 1 2
1 ROOT AGR AGR AGR
ROOT ROOT ROOT
Prelegerea 9
Semantici si logica formala
Denirea precisa a not iunilor de semantica si a nt elege este surprinzator de dicila,
pentru ca acesti termeni sunt folosit i de obicei cu diverse utilizari, adesea nrudite.
Astfel, exista ntrebuint ari ale verbului a nt elege care nu au nici o legatura cu
lingvistica. De exemplu:
Desi nu vorbeste, Clara nt elege limba spaniola.
Ii nt eleg durerea.
Ceea ce dorim sa folosim este mai apropiat de utilizarea acestui cuvant n
propozit ia
Prin singur se nt elege nensot it de nimeni altcineva.
Aceleasi probleme apar relativ la termenul a nsemna.
A FORMAL
A
prelucrarea limbajului, nu se ntampl a totdeauna n practica. De aceea vom folosi
termenul de nt eles pentru acest sens de tratare a propozit iilor - independent de
context; pentru aspectele dependente de context vom folosi termenul de utilizare.
Denit ia 9.1 Reprezentarea nt elesului independent de context este numita forma
logica. Operat ia de asociere unei propozit ii a formei sale logice este numita in-
terpretare semantica, iar procesul de asociere unei formei logice n limbajul de
reprezentare a cunostint elor (KR), se numeste interpretare contextuala.
Pentru moment vom folosi drept limbaj de reprezentare a cunostint elor calculul
predicatelor de ordinul I (First-Order Predicate Calculus: FOPC); denirea sa
formala, riguroasa, este data n Anexa 1.
In mod normal, forma logica nu face parte din limbajul de reprezentare a cunos-
tint elor. Aceasta conduce la problema de a stabili pozit ia sa n procesul de pre-
lucrare a limbajului natural. O idee folosita cu succes se bazeaza pe not iunea de
situat ie - care este denita ca ind o mult ime particulara de circumstant e ale lumii
nconjuratoare.
De exemplu, la intrarea ntr-o sala de clasa, suntem n situat ia cand exista
student i, un profesor, se fac anumite armat ii, se pun ntrebari etc., sunt impli-
cate si anumite obiecte, cum ar tabla, creta, scaune, s.a.m.d.
Denit ia 9.2 Se numeste situat ie o pereche ordonata S = (O, R) unde:
O este o mult ime nita de elemente numite obiecte, un obiect ind un cuplu
(x, y); orice doua obiecte din O difera cel put in prin y.
R este o mult ime nita de elemente numite relat ii, o relat ie ind de forma
(, y
1
, . . . , y
n
), (n 1) cu proprietatea ca pentru orice i(1 i n) exista un
obiect de forma (x, y
i
); este o relat ie de aritate n.
Exemplul 9.1 O situat ie foarte simpla poate urmatoarea:
S
1
= ({(MINGE, B0005), (COPIL, C86), (COPIL, C87)},
{(POSED
A, C86, B0005)}).
Exista deci trei obiecte - o minge si doi copii - codicate prin B0005, C86 respectiv
C87 si o relat ie binara - aceea ca mingea apart ine copilului C86.
Limbajul creaza tipuri speciale de situat ii bazate pe modul de utilizare a informa-
t iei. Deoarece acest mod de lucru va detaliat mai tarziu, vom prezenta pentru
nceput cateva elemente intuitive.
In orice conversat ie sau text, sa presupunem ca
exista o situat ie generata de discurs care nregistreaza informat ia pentru a o utiliza
n continuare. Orice noua armat ie este interpretat a n raport cu aceasta situat ie,
producand o situat ie noua care va include informat ia folosita.
Din acest punct de vedere, putem modela universul discursului sub forma unui
automat cu o innitate de stari - ecare stare ind o situat ie a discursului, iar forma
logica este funct ia de tranzit ie a automatului care aplica situat ia discursului n care
este facut a prezumt ia, ntr-o noua situat ie, rezultata din aceasta prezumt ie.
9.1. DESPRE FOPC 99
Exemplul 9.2 Sa presupunem ca situat ia prezentat a n Exemplul 9.1 a fost des-
cris a de o armat ie anterioara care cont inea mingea si carui baiat i apart ine ea.
Prezumt ia
Mingea este rosie.
creaza o noua situat ie, formata din cea anterioara, la care se adauga faptul ca
B0005 are proprietatea ROSU:
S
2
= ({(MINGE, B0005), (COPIL, C86), (COPIL, C87)},
{(POSED
H
H
H
H
H
Hj
?
=
Z
Z
Z
Z
Z~
? ? ?
interpretare semantica
Forma logica: = (ASIGN (ROSU1 < b1 MINGE >)
Interpretare contextuala:
"!
#
"!
#
-
S
1
S
2
A FORMAL
A
proprietat i structurale au corespondent n limbaj natural. De exemplu, se face deose-
birentre expresii care identic a obiecte si expresii care atribuie proprietat i obiectelor
si identica relat iile dintre obiecte. Expresiile substantivale corespund primului tip,
iar propozit iile si clauzele, celui de-al doilea.
In FOPC, aceeasi distinct ie se face
ntre termeni (care semnica obiecte ale universului) si propozit ii (care fac armat ii
despre obiectele universului).
Exista doua clase importante de termeni: constante si funct ii. Constantele sunt
similare practic numelor proprii din limbaj: Radu1, Radu2, C1, . . . Ele nu sem-
nica nimic prin simpla enunt are; proprietat ile lor apar numai din formulele care le
folosesc.
Apare totusi o diferent a majora ntre numele proprii din limbajul natural si
constantele din FOPC: n timp ce limbajul natural este ambiguu, ecare simbol din
FOPC are un singur nt eles. Numele Ion poate folosit n limbaj natural pentru a
face referint a la mai mult i oameni diferit i; acest lucru nu este posibil n logica, unde
este necesar cate un nume unic pentru ecare persoana.
Funct iile n FOPC corespund expresiilor substantivale care se refera la un obiect
n termenii anumitor proprietat i sau relat ii cu alte obiecte, cum ar tatal lui Ion
sau print ul Arabiei. Ele sunt scrise n FOPC ca expresii formate dintr-un nume de
funct ie (constanta) urmat de o lista de argumente (termeni), nchise ntre paranteze.
Numarul de argumente formeaza aritatea funct iei; de remarcat ca ea nu mai este o
constant a (ca n matematica). De exemplu, tatal lui Ion desemneaza o funct ie tata
si se scrie tata(Ion1). Dar aceeasi funct ie, n Tatal lui Ion si al Anei se va scrie prin
tata(Ion1,Ana1).
Propozit iile simple din FOPC (n care numele predicatului corespunde unei ex-
presii verbale formata numai din verb) constau dintr-un nume de predicat (cons-
tant a) si o lista de argumente (termeni) nchise ntre paranteze.
Exemplul 9.3 Pentru propozit ia
Ion si iubeste tatal.
se poate construi formula
Iubeste(Ion1,tata(Ion1)).
Propozit iile mai complexe sunt construite din cele simple folosind o serie de
operatori logici cu corespondent n limbaj natural. Aritatea acestor operatori este
xa, independent a de propozit iile n care sunt folosite.
Cel mai simplu operator logic este negat ia, scrisa . Astfel, propozit iei
Ion nu-si iubeste tatal.
i poate corespunde formula
Iubeste(Ion1,tata(Ion1)).
Practic, aproape tot i conectorii folosit i n limbajul natural corespund la diversi
operatori logici din FOPC. De exemplu:
si & (conjunct ie)
sau (sau concesiv)
(sau exclusiv)
daca atunci (implicat ie)
daca si numai daca (echivalent a)
9.1. DESPRE FOPC 101
(punct). El este
folosit n formule pentru a indica ca domeniul operatorului care l precede este extins
pan a la sfarsitul formulei. Aceasta convent ie usureaza scrierea, eliminand o serie de
paranteze.
Exemplul 9.5 Propozit iei:
Orice pasare are cuibul ei.
i se poate construi formula logica:
b.PAS
ARE(b) g.CUIB(g)&APARTINE(b, g)
Aceasta este echivalenta cu formula (n care nu s-a folosit convent ia cu punct):
b(PAS
A FORMAL
A
9.2 Sensurile cuvintelor si ambiguitatea
Pentru a dezvolta o teorie a semanticii si a interpret arii semantice, va nevoie sa
construim un model structural, asa cum s-a procedat si la sintax a. Acolo s-a denit
ntai not iunea de clasa sintactica de baza, apoi s-au dezvoltat caile prin care aceste
clase se pot combina pentru a forma structuri mai largi.
In semantic a problema
este ceva mai complicata, din cauza ambiguitat ii. De exemplu, n Micul dict ionar
enciclopedic, verbul a da are 32 denit ii (12 ca verb tranzitiv, 14 ca verb intranzitiv
si 6 ca verb tranzitiv sau intranzitiv, urmat de determinari locale). Uneori pentru
el se pot gasi sinonime, cum ar : a oferi, a restitui, a atribui, a renunt a, a se lovi,
a iesi (ecare din ele avand nsa sensuri usor diferite de verbul a da).
Daca ecare cuvant are unul sau mai multe sensuri, atunci va trebui denit un
univers al sensurilor deosebit de larg; pentru a-l putea manevra nsa, va necesara
organizarea sa n clase de obiecte cu anumite proprietat i. Mult imea acestor clase
de obiecte se numeste ontologie. Ideea a fost enunt ata de Aristotel, care n scrierile
sale denea drept clase majore substant a (obiectele zice), cantitatea (de exemplu
numerele), calitatea (cum ar luminozitatea, culoarea etc), relat ia, locul, timpul,
pozit ia, starea, act iunea si afect iunea. La aceste clase se pot adauga altele, cum ar
evenimentele, ideile, conceptele si planurile. Dintre acestea se disting cateva clase
cu important a deosebita: act iunile, evenimentele si situat iile.
Denit ia 9.3 Evenimentele sunt lucruri care apar n universul cunoasterii pentru
a asigura structurarea organizarii si interpretarii propozit iilor.
Act iunile sunt lucruri pe care le fac agent ii (deci cauzeaza evenimente).
Situat iile se refera la un anumit set de circumstant e; ele pot considerate ca
ind incluse n mult imea evenimentelor.
Rezulta ca ambiguitatea este o problema dicila care trebuie tratata n timpul
interpret arii semantice.
Denit ia 9.4 Spunem ca un cuvant este semantic ambiguu daca i putem atribui
mai multe sensuri.
Problema se complica daca vrem sa detaliem termenul de atribuire. Sunt put ine teste
lingvistice care sa deneasca cat mai precis not iunea de ambiguitate semantic a.
Un astfel de test se bazeaza pe ideea ca anumite construct ii sintactice se refera
la clase identice de obiecte. De exemplu, propozit ia
Ion are un vas iar Vasile doua vase.
are ca semnicat ie faptul ca Ion si Vasile poseda vase din aceeasi clasa de obiecte.
Nu reiese de exemplu ca Ion este proprietarul unui vas de pescuit iar cele doua vase
ale lui Vasile sunt vase de bucat arie. Pe de-alta parte, daca spunem
Mihai are un cal iar Radu are doi cai,
de aici nu reiese ca tot i caii din propozit ie au aceleasi caracteristici (sunt tot i
armasari, au aceeasi rasa, sunt tot i cai de curse, si altele). Intuitiv, cuvantul vas este
ambiguu ntre sensurile VAS NAV
ASAR si IAP
A FORMAL
A
9.3 Limbajul formelor logice de baza
Vom deni un limbaj - foarte aseman ator cu FOPC - care sa permita combinarea
unitat ilor de baza ale nt elesului (semnicat ia cuvintelor), pentru a obt ine nt elesuri
asociate unor expresii mai complexe.
Int elesurile unui cuvant vor servi ca atomi
sau constante ale reprezentarii. Aceste constante vor clasicate dupa tipurile
de not iuni pe care le descriu.
In particular, constantele care descriu obiecte ale
universului (inclusiv cele abstracte, cum sunt evenimentele sau situat iile) se numesc
termeni. Constantele care descriu relat ii si proprietat i se numesc predicate.
O propozit ie din acest limbaj este formata dintr-un predicat urmat de un numar
arbitrar de termeni folosit i ca argumente.
Exemplul 9.6 Propozit ia corespunzatoare armat iei:
Andrei este un baiat,
va construita din constantele ANDREI1 (termen) si B
AIAT1 ANDREI1).
Prin utilizarea unei alte clase de constante, numite operatori (conectori) logici
se pot realiza propozit ii mai complexe.
In general conectorii sunt cei cunoscut i din
logica formala, anume:
- negat ia - (NOT)
- disjunct ia ()
- conjunct ia (&)
- implicat ia ()
precum si alte forme (FOPC are 16 astfel de operatori logici binari).
Similar lor, n limba vorbit a exista operatorii si, sau, daca, numai daca etc;
deosebirea este aceea ca relat iile induse de limbajul natural prin acesti conectori sunt
mai complexe decat cele din logica formala. De exemplu, conjunct ia si corespunde
operatorului logic &, dar adesea da si o structura temporala evenimentelor, ca n
Am ajuns acasa si am baut ceva.
n care evenimentul sosirii l precede pe cel al bauturii. La fel, conectorul dar
opereaza dupa aceleasi reguli logice ca si; aici nsa, doilea argument este ceva ce
auditoriul nu se asteapt a sa e adevarat, conform primului argument.
Forma logica generala a propozit iilor construite folosind conectori este:
(< conector > (< propozit ie >)(< propozit ie >)).
Exemplul 9.7 Forma logica pentru asert iunea
Paul cauta cartea sau Paul caut a servieta.
este:
( (CAUT
A1 PAUL1 CARTEA1)(CAUT
A1 PAUL1 SERVIETA1))
Cu aceste propozit ii simple - denite anterior - se poate construi nt elesul unui
sublimbaj foarte limitat al unei limbi naturale, anume propozit ii formate numai din
9.3. LIMBAJUL FORMELOR LOGICE DE BAZ
A 105
verbe simple si substantive (de obicei nume proprii). Pentru a realiza propozit ii mai
complexe, trebuiesc denite si alte construct ii semantice. O astfel de construct ie,
deosebit de importanta, este cuanticatorul.
In calculul predicatelor de ordinul 1
exista doar doi cuanticatori: , . Limbajul natural cont ine o gama mult mai vast a
de cuanticatori, cum ar tot i, unii, cel mult, multe, cat iva etc. Pentru a le atasa
cuanticatori, variabilele sunt scrise ca n FOPC, cu o singura diferent a: n logica
predicatelor de ordinul I se ret ine n domeniul de act iune al cuanticatorului numai
semnicat ia variabilei. Deci doua aparit ii ale aceleiasi variabile x care apar n doua
formule diferite (cum ar x.P(x) si x.Q(x)) sunt considerate variabile diferite,
far a nici o legatur a ntre ele.
AINE1 d1)(LATR
A1 d1))
Aceasta arata ca multe obiecte obiecte d1 care satisfac condit ia (C
AINE1 d1),
satisfac si condit ia (LATR
A1 d2)(C
AINE1 d2))
care deneste nt elesul propozit iei Multe lucruri care latra sunt caini.
O clasa foarte importanta de cuanticatori corespunde articolelor hotar at si ne-
hotar at. Astfel, armat ia
Cainele latra.
are forma logica:
106 PRELEGEREA 9. SEMANTICI SI LOGIC
A FORMAL
A
(ART LE x: (C
AINE1 x)(LATR
A1 x))
si va adevarat a numai daca exista un caine unic determinat de context, si acel
caine latra. Evident, n orice aplicat ie practica vor mai mult i caini, asa ca folosirea
contextului pentru a-l identica pe cel corect este cruciala n nt elegerea propozit iei.
Folosind diverse restrict ii pot rezulta expresii substantiv mai complexe.
De exemplu, propozit ia
Cainele fericit latra.
va folosi o restrict ie suplimentara, scrisa sub forma unei conjuct ii, anume:
(ART LE x: (&(C
A1 x))
Ea va adevarat a numai daca exista un context unic x astfel ncat
(&(C
AINE1) x)(LATR
A1 x))
Pluralul expresiilor substantivale induce posibilitatea unei noi forme de ambigu-
itate. Sa observam ca nt elesul normal al propozit iei
Cainii latra.
este acela ca exista o haita specicata de caini si ecare din ei latra. Aceasta
este numit a citire distributiva, pentru ca predicatul LATR
A1 se distribuie la ecare
element din mult ime.
Sa consideram acum propozit ia
Cainii s-au strans la colt .
Aici este un nonsens sa armam ca ecare caine s-a strans; armat ia este adeva-
rata pentru ntreaga mult ime de caini.
Aceasta se numeste citire colectiva. Unele propozit ii folosesc ambele tipuri de
interpret ari, deci sunt ambigue.
Exemplul 9.11
In propozit ia
Doi oameni si-au cumparat masina.
se poate nt elege ca ecare om si-a cumparat masina lui proprie (citire distribu-
tiva) sau ca cei doi au cumparat mpreuna o singura masina (citire colectiva).
9.3. LIMBAJUL FORMELOR LOGICE DE BAZ
A 107
In sfarsit, ultimele construct ii care pot introduse sunt operatorii modali, nece-
sari pentru a reprezenta nt elesul verbelor n general, restrict iile de timp n parti-
cular. Acesti operatori sunt destul de aseman atori cu operatorii logici, avand ns a
unele deosebiri importante. Anume, termenii din domeniul unui operator modal pot
avea o interpretare care difera de cea normala; aceasta afecteaza concluziile care se
pot trage dintr-o propozit ie.
De exemplu, sa presupunem ca Adi este cunoscut unora sub numele de Andy;
exista deci doua sensuri ale cuvantului, care sunt egale: ADI1=ANDY2.
In
propozit ii construite folosind aceasta supozit ie, nu are important a care din cele doua
constante este folosita: daca (FERICIT ANDY2) este adevarata, atunci (FERICIT
ADI1) este adevarata si invers; la fel,
(ORI (VESEL ADI1)(SUPARAT ADI1)),
(ORI (VESEL ANDY2)(SUPARAT ANDY2))
sunt ambele adevarate sau false n acelasi timp. Asert iunea nu este ns a tot-
deauna valabila n interiorul domeniului unui operator modal, cum ar CREDE1.
De exemplu, daca
Rodica crede ca Adi este fericit.
deci
(CREDE RODICA1 (FERICIT ADI1)),
aceasta nu implica neaparat valabilitatea propozit iei
Rodica crede ca Andy este fericit.
adica
(CREDE RODICA1 (FERICIT ANDY2)),
pentru simplul motiv ca Rodica poate sa nu stie ca Adi si Andy sunt una si
aceeasi persoana.
Deci nu se pot nlocui liber termenii egali, daca acestia apar n interiorul dome-
niului unui operator modal. Aceasta restrict ie se numeste esecul substitut iei n
contexte modale.
O clasa importanta de operatori modali pentru limbajul natural sunt operatorii
de timp: PREZENT, TRECUT, VIITOR. Deci se pot diferent ia propozit ii ca
Marius vede marea.
Marius a vazut marea.
Marius va vedea marea.
prin:
(PREZENT (VEDE1 MARIUS1 MAREA1)
(TRECUT (VEDE1 MARIUS1 MAREA1)
(VIITOR (VEDE1 MARIUS1 MAREA1)
Acestia sunt operatori modali deoarece ei veric a esecul substitut iei.
De exemplu, sa consideram operatorul TRECUT si sa luam doua constante
VASILE1 si DECAN1, egale n prezent (ceea ce nseamna ca Vasile este acum de-
can), dar care nu au fost egali n trecut (cand Vasile nu era decan). Pe baza acestui
fapt, din
108 PRELEGEREA 9. SEMANTICI SI LOGIC
A FORMAL
A
(TRECUT (VIZITA1 VASILE1 FRANTA1)),
nu se poate decide daca decanul din trecut a vizitat Frant a, adica
(TRECUT (VIZITA1 DECAN1 FRANTA1)).
De remarcat ca o propozit ie si negat ia ei pot ambele adevarate n trecut (dar
la momente diferite). De exemplu, propozit iile
Aurel a fost vesel.
Aurel nu a fost vesel.
pot ambele adevarate la trecut, deci
(TRECUT (VESEL AUREL1)),
(TRECUT (NOT ((VESEL AUREL1)))
pot simultan adevarate.
AT II
IN FORMA LOGIC
A 109
(ART A b1:(CHEIE2 b1)(TRECUT (FOLOSI1 ELENA b1)))
Una din cele mai complexe forme de ambiguitate provine din domeniul relativ
de act iune al cuanticatorilor si operatorilor. Am vazut ca o propozit ie cum ar
Orice baiat iubeste un caine.
este ambigu a ntre cele doua tipuri de citiri, dupa cum este denit domeniul
cuanticatorilor. Nu exista nici o metoda independent a de context pentru a rezolva
aceasta ambiguitate, asa ca ambele citiri vor trebui reprezentate n formele nale
logice ale propozit iei. Dar, n loc de a enumera toate domeniile posibile - ceea ce ar
duce la o crestere exponent ial a a interpetarilor bazate pe numarul de construct ii de
domenii - vom introduce o prescurtare n limbajul formei logice, care reduce masiv
interpret arile. Pur si simplu forma logica abreviata nu va cont ine informat ia relativa
la domeniu.
In plus, construct ii specice (cum ar cuanticatorii generalizat i) vor
tratate sintactic ca termeni si vor apare n pozit ia indicata de structura sintactic a
a propozit iei. Ele sunt marcate prin paranteze unghiulare pentru a indica domeniul
de abreviere.
Exemplul 9.13 Formele logice pentru
Orice baiat iubeste un caine.
sunt prinse ntr-o singura forma ambigua:
(IUBESTE1 < b1 (B
AIAT1 b1)>< d1 (C
AINE1 d1)>)
Aceasta prescurtare este o ambiguitate ntre formele logice
( b1:(B
AIAT1 b1)( d1 (C
AIAT b1)>
poate scrisa
< b1 B
AIAT>.
Multe construct ii din limbajul natural sunt senzitive la domenii.
In particular,
tot i cuanticatorii generalizat i, inclusiv articolele hotar ate. De exemplu, pentru
propozit ia
La orice hotel recept ionistul era amabil.
n aproape orice context recept ionistul intra n domeniul lui orice hotel, adica
exista cate un recept ionist diferit la ecare hotel.
De asemenea operatori cum ar negat ia sau timpul sunt senzitivi la domeniu.
Folosind un exemplu din limba engleza, propozit ia
Every boy didnt run.
este ambigu a ntre cele doua tipuri de citiri (distributiva si colectiva): astfel, e
doar unii baiet i nu au alergat, adica:
110 PRELEGEREA 9. SEMANTICI SI LOGIC
A FORMAL
A
(NOT (EVERY b1:(BOY1 b1)(RUN1 b1)))
e nici un baiat nu a alergat:
(EVERY b1:(BOY1 b1)(NOT (RUN1 b1)))
Ambele citiri pot scrise sub o singura forma logica:
(<NOT RUN1><EVERY b1 BOY1>)
unde operatorii unari fara domeniu (NOT, PAST, PRES,. . .) au fost omisi.
Ca o ultima observat ie, sa comentam ce se nt ampl a cu numele proprii si cu
pronumele. Vom presupune ca ecare nume propriu identic a un sens caracteristic
unui obiect din domeniu. Orice nume propriu trebuie interpretat n context; astfel,
numele Andrei se va referi la persoane diferite n situat ii diferite.
In semantic a vom
introduce aceasta construct ie ca o funct ie speciala de forma:
(NUME < variabila >< nume >)
care are ca efect producerea n contextul curent a unui obiect cu numele respectiv.
Exemplul 9.14 Deci forma cvasi-logica pentru propozit ia
Andrei a alergat.
este
(<TRECUT ALERGA1>(NUME j1 Andrei)).
Un argument similar poate dat si pentru pronume sau alte cuvinte indexate ca
de exemplu aici, ieri etc. Acestea vor prelucrate folosind funct ii speciale de forma
(PRO < variabila >< propozit ie >)
Exemplul 9.15 Forma cvasi-logica pentru propozit ia
Tot i oamenii l-au iubit.
este:
(<TRECUT IUBI1><PLURAL (TOT m1 OM1)>(PRO m2 (EL1 m2)))
EL1 este acelasi pentru el si lui si - formal - este un predicat cu valoare de
adevar pentru obiectele care satisfac restrict iile precedente.
Ca si cuanticatorii generalizat i, cand restrict iile sunt predicate unare, formele
pronumelor pot abreviate. De exemplu, forma logica pentru el poate scrisa
adesea (PRO m2 EL1).
Construct iile descrise aici reduc semnicativ numarul formelor logice. Totusi, nu
toate ambiguit at ile pot modelate prin prescurtari, asa ca vor propozit ii care vor
necesita liste de forme logice posibile, chiar si pentru o singura structura sintactic a.
Prelegerea 10
Modele si structuri semantice
10.1 Verbe si stari n forma logica
Sa consideram verbele act ion and ca predicate n forma logica.
In acest fel se pot pre-
lucra toate reprezent arile lor distincte si se pot folosi diverse proprietat i de adnotare,
pierzandu-se doar cateva generalitat i.
Exemplul 10.1 Sa consideram urmatoarele armat ii, toate folosind verbul
a sparge:
1. Radu a spart geamul cu ciocanul.
2. Ciocanul a spart geamul.
3. Geamul s-a spart.
Intuitiv, toate aceste armat ii descriu acelasi tip de eveniment, n detalii diferite.
Deci ar de dorit ca verbul a sparge sa corespunda aceluiasi sens n ecare caz.
Problema care apare consta n faptul ca n cele trei armat ii, verbul este folosit cu
aritat i diferite.
In prima propozit ie a sparge indica o relat ie ternara ntre Radu,
geam si ciocan, a doua propozit ie este o relat ie binara ntre ciocan si geam, iar a
treia propozit ie este o relat ie unara relativa la geam. Deci se pare ca sunt necesare
trei sensuri distincte ale verbului a sparge: SPARGE1, SPARGE2, SPARGE3, care
difera prin aritate si produc forme logice de tipul:
1. (<TRECUT SPARGE1>(NUME j1 Radu)
<ART UL w1 GEAM1><ART UL h1 CIOCAN1>),
2. (<TRECUT SPARGE2><ART UL h1 CIOCAN1>)
<ART UL w1 GEAM1>)
3. (<TRECUT SPARGE3><ART UL w1 GEAM1>)
Pentru a garanta ca toate predicatele sunt interpretate corespunzator, ecare
reprezentare va trebui completata cu axiome care sa asigure echivalent a cu celelalte
doua forme. Aceste axiome sunt numite postulate de semnicat ie.
111
112 PRELEGEREA 10. MODELE SI STRUCTURI SEMANTICE
Pare ns a destul de neconvenabil sa specicam astfel de restrict ii pentru ecare
verb. O variant a de rezolvare (Davidson, 1967) constan introducerea drept variabile
a evenimentelor. Acum, nt elesul unui propozit ii de tipul
Radu l-a spart.
poate scris:
( e1: (SPARGE e1 (NUME j1 Radu)(PRO i1 L)))
(s-a omis predicatul de timp) care semnica faptul ca e1 este un eveniment n
care Radu sparge un anumit geam.
In aceasta situat ie vom generaliza not iunea de eveniment, pentru a include stari,
dupa care se foloseste aceeasi tehnica. De exemplu, se poate considera NEFERICIT
drept predicat care are ca argument o stare de nefericire, si se foloseste rolul TEMA
pentru a include pe Maria:
( s <TRECUT NEFERICIT> s)(TEMA s (NUME j1 Maria))
Folosind aceleasi convent ii de prescurtare (denite la evenimente), propozit ia de
sus se poate reprezenta sub forma
(<TRECUT NEFERICIT> s [TEMA (NUME j1 Maria)]
[LA LOC m1
INT
ALNIRE])
A.
Aceasta corespunde de obicei entitat ii sintactice OBIECT si, pentru un anumit verb
tranzitiv X, constituie raspunsul la ntrebarea
Ce a fost X-at ?
Exemplul 10.2 Pentru propozit ia
Vulturul a vazut soarecele.
NP soarecele este TEMA si raspunsul la ntrebarea
Ce a fost vazut ?
Pentru verbele intranzitive rolul TEM
In funct ie de verb, rolul INSTR poate folosit uneori ca subiect, atunci cand rolul
AGENT nu este specicat. Fort ele naturale sunt de asemenea incluse n categoria
INSTR, ca n:
Soarele a ars culturile.
Valentin a folosit soarele pentru a usca panza.
Rolurile AGENT si INSTR pot combinate ntr-un rol mai general numit
AGENT CAUZAL.
Alte roluri trebuiesc identicate nainte de a ncepe analiza anumitor propozit ii.
De exemplu, unele armat ii descriu situat ii n care doi oameni realizeaza mpreuna
o act iune; sa consideram propozit ia:
Paul a mutat dulapul ajutat de Virgil.
Pentru a o prelucra, trebuie denit un rol nou - CO AGENT pentru introducerea
expresiei prepozit ionale ajutat de Virgil.
Un caz mai complicat aparen propozit iile care descriu schimburi sau alte interac-
t iuni complexe. Sa consideram exemplele:
Ion a platit anticarului 10.000 lei pentru carte.
Ion a luat cartea de la anticar pentru 10.000 lei.
Ambele propozit ii descriu o situat ie n care Ion a dat 10.000 lei unui anticar si
10.2. ROLURILE TEMATICE 117
a primit n schimb o carte.
In prima propozit ie 10.000 lei este TEMA, iar cartea
nu are asignat nici un rol.
In a doua propozit ie, situat ia este inversata: cartea este
TEMA iar 10.000 lei nu are atribuit nici un rol. Pentru prelucrarea acestor cazuri
se deneste un rol CO TEM
AR1>]))
Pentru propozit ii interogative (cu raspuns da/nu), cum ar
A mancat omul un mar ?
forma logica completa este:
(Y/N-QUERY (<TRECUT M
AR1>]))
Pentru comenzi, cum ar
Mananca marul !
forma logica este:
(COMMAND (M
AR>]))
Pentru ntreb ari de tipul
Ce a mancat omul ?
trebuiesc introduse elemente noi n limbajul formal.
In primul rand este nece-
sara stabilirea unui mod de reprezentare a nt elesului expresiilor substantivale care
folosesc termeni de forma ce (what); aceasta se realizeaza prin cuanticatorul CE
care indica faptul ca termenul se refera la obiectul (sau obiectele) despre care se
ntreaba. Ca o remarca, acesti ce-termeni sunt senzitivi de domeniu, asa ca este
posibila folosirea lor pe rol de cuanticatori.
Deci pentru expresiile substantivale interogative simple avem reprezent arile:
ce? < CE p1 NIMIC >
care om? < CE m1 OM1 >
cine? < CE p1 PERSOAN
A >
120 PRELEGEREA 10. MODELE SI STRUCTURI SEMANTICE
Cu aceste denit ii, forma logica pentru propozit ia interogativa de sus este:
(WH-QUERY (<TRECUT M
AT respectiv C
AT DE MULT.
Propozit iile derivate, cum ar clauzele relative, completeaza la sfarsit expresiile
substantivale cu restrict ii, deci nu vor necesita notat ii noi.
Exemplul 10.8 Forma logica a propozit iei
Omul care a mancat un mar a plecat.
este:
(ASSERT
(<TRECUT PLECA> k1
[AGENT <ART UL m1 (& (OM1 m1)
(<TRECUT M
ANCA1> e2
[AGENT m1]
[TEMA <UN p1 M
AR>]))>]))
A|LA LOC|INSTR| . . .
NUME SIR John|The New York Times| . . .
Prelegerea 11
Semantica si teoria modelelor
11.1 Teoria modelelor n semantica
A SI TEORIA MODELELOR
(obiecte zice, timpi, locat ii, evenimente, situat ii). Funct ia de interpretare aplica
sensuri si structuri mai largi n structuri denite n domeniu.
Exemplul 11.1 Un tip de funct ie de interpretare pentru sensurile urmatoarelor
clase lexicale, poate :
Sensuri ale expresiilor substantivale - se refera la obiecte specicate; funct ia
de interpretare asociaza ecaruia cate un element din D
m
.
Sensuri ale substantivelor comune la singular (cum ar caine, petrecere,
idee) - identica clase de obiecte din domeniu; funct ia de interpretare le
aplica n submult imi din D
m
.
Sensuri ale verbelor - identica mult imi de relat ii n-are ntre obiecte din D
m
.
Aritatea ecarei relat ii depinde de verb. De exemplu, pentru verbul a alerga,
ALERGA1 are valori ntr-un set de relat ii unare (< X > unde X alearga);
pentru a iubi, IUBESTE1 are valori ntr-un set de aplicat ii binare (< X, Y >
unde X iubeste Y ); pentru a pune, PUNE1 are valori ntr-un set de relat ii
ternare (< X, Y, Z >, unde X pune Y n locat ia Z).
Se poate deni acum not iunea de adevar a unei propozit ii (reprezentate n lim-
bajul logicii formale) relativ la un model m.
Denit ia 11.2 O propozit ie de forma (V
n
a
1
a
2
. . . a
n
) este adevarata n raport cu
modelul m daca si numai daca < Im(a
1
), . . . , Im(a
n
) > Im(V
n
).
In alte modele, condit ia aceasta este prea tare, deoarece pot apare propozit ii care
sa nu e nici adevarate si nici false. Problema se rezolva denind cate doua mult imi
disjuncte pentru ecare nume de relat ie; ecare din ele cont ine secvent e pentru care
relat ia este adevarat a respectiv falsa. Orice secvent a care nu se aa n nici una din
cele doua mult imi va nici adevarat a si nici falsa.
Semanticile cuanticatorilor din FOPC sunt banale. Astfel,
11.1. TEORIA MODELELOR
IN SEMANTIC
A 123
Propozit ia x.P(x) este adevarat a n raport cu un model m daca si numai
daca P(x) este adevarat a pentru orice valoare a lui x din D
m
.
Propozit ia x.P(x) este adevarat a n raport cu un model m daca si numai
daca P(x) este adevarat a pentru cel put in o valoare a lui x D
m
.
Pentru limbajele naturale, clasa cuanticatorilor este mult mai larga. Condit iile
de adevar pentru ecare astfel de cuanticator specica relat ia ceruta ntre obiectele
care satisfac cele doua asert iuni de sus.
Exemplul 11.3 Sa consideram propozit ia (reprezentata n forma logica):
(MAJORITATEA1 x (P x)(Q x)).
Ea poate denita ca adevarata n raport cu un model m daca si numai daca
mai mult de jumatate din obiectele din Im(P) sunt n Im(Q).
In particular
(MAJORITATEA1 x (C
.
Invers, daca nu exista nici un model suport simultan pentru S si S
, atunci cele
doua propozit ii nu pot adevarate n acelasi timp (indiferent de situat ie).
Spunem ca cele doua propozit ii sunt contradictorii.
124 PRELEGEREA 11. SEMANTIC
A SI TEORIA MODELELOR
Exemplul 11.5 Propozit iile
O cutie rosie este pe masa.
Pe masa nu este nici o cutie.
sunt contradictorii, pentru ca nu exista nici un model care sa e suport simultan
pentru ambele propozit ii.
Limbajele naturale lucreaza de obicei cu o relat ie mai slaba decat cea de necesi-
tate, anume implicat ia.
Denit ia 11.4 O propozit ie S implica S
poate adevarata.
Exemplul 11.6 Propozit ia
Am obosit sa merg la facultate n ecare zi.
implica
Nu mai merg la facultate.
dar nu o necesita. Daca spunem
Am obosit sa merg la facultate n ecare zi.
O mai fac nca !
va exista un model care sa le asigneze ambelor propozit ii valoarea de adevar;
ntr-un astfel de model, propozit ia
Nu mai merg la facultate.
este falsa.
Una din cele mai dicile probleme n nt elegerea limbajului natural rezulta din
faptul ca inferent ele folosite sunt mai mult implicat ii decat necesitat i; deci concluziile
care se trag la un moment pot ulterior reconsiderate si modicate.
11.1.2 Operatori modali si semantici ale universurilor posi-
bile
Pentru denirea unei semantici care sa utilizeze operatorii modali, trebuiesc intro-
duse structuri noi pe modele.
In particular, adevarul unei proprietat i va denit
n raport cu o mult ime de cel put in doua modele. Aceasta mult ime poate avea o
structura specica - numita de obicei structura de model.
Ca un exemplu, sa consideram operatorul TRECUT si sa presupunem ca ecare
model individual m reprezint a starea universului ntr-un anumit punct n timp.
Atunci o structura de model va mult imea modelelor care descriu o istorie posibila
a universului, n care modelele sunt legate unul de altul prin operatorul <, unde
m
1
< m
2
semnica faptul ca m
1
descrie o stare a universului anterioara starii des-
crise de m
2
. Adevarul unei propozit ii este acum denit n raport cu o structura de
model arbitrara care are ntre modele sale relat ia de ordine <.
A 125
m
(TRECUT P) m
[m
< m, m
P].
Altfel spus, (TRECUT P) este adevarat ntr-un model m daca si numai daca
exista un alt model n structura care descrie un timp anterior lui m, n care P este
adevarat a.
Acest tip de analiza este numit semantica universurilor posibile.
11.2 Un model teoretic de semantica
Sa consideram o submult ime a FOPC formata numai din propozit ii si conectori
logici (fara termeni, variabile sau cuanticatori - a se vedea Anexa 1); ea este nu-
mita uzual calcul propozit ional. Un model pentru calculul propozit ional va asigna
ecarei formule (propozit ionale) una din valorile T (adevar) sau F (fals). Construct ia
este facut a denind aceste aplicat ii pentru propozit iile simple (atomice) si apoi rea-
lizand pe baza unor formule de calcul, valorile de adevar pentru propozit ii compuse
(construite cu ajutorul operatorilor logici). Ipoteza de baza folosita este aceea ca
nt elesul operatorilor logici poate denit numai n funct ie de valorile de adevar ale
argumentelor, independent de valoarea noii propozit ii.
Cei mai cunoscut i operatori logici folosit i n calculul propozit ional sunt:
Tabelul 11.1:
p q p p&q p q p q p q p q
T T F T T T T T
T F F F T F F F
F T T F T T F T
F F T F F T T T
Formal, modelul semantic bazat pe calculul propozit ional este denit folosind o
funct ie V numita funct ie de valuare, care asociaza ecarei propozit ii o valoare de
adevar din mult imea {T, F}.
Astfel, ind data o logica cont inand o singura propozit ie P, se pot deni pentru
ea doua modele, prin doua funct ii de valuare V
1
, V
2
cu V
1
(P) = T, V
2
(P) = F.
A SI TEORIA MODELELOR
4. V
m
( ) = V
m
() V
m
()
5. V
m
( ) = V
m
() V
m
()
Semnul egal (=) s-a pus ntre doua expresii care pentru acelasi set de valori asignat
variabilelor, conduc la acelasi rezultat.
In acest fel, ind dat un model (adica o funct ie de valuare) se poate determina
valoarea de adevar a oricarei formule n calculul propozit ional careia i apart ine
formula respectiva.
11.2.1 Logica folosita ca un model de gandire
Un prim motiv de folosire a FOPC este acela ca el asigura o formulare precisa a
not iunilor de inferent a si argument valid (pentru precizari facem din nou trimitere
la Anexa 1).
Exemplul 11.7 Sa plecam de la urmatorul exemplu de argumentat ie:
Tot i cainii iubesc copiii.
Grivei este un caine.
Deci Grivei iubeste copiii.
Acest rat ionament poate formalizat n FOPC printr-o forma de inferent a, (re-
gula modus-ponens) astfel:
x.D(x) LB(x) S-a notat cu D un predicat adevarat numai pentru caini,
D(GRIV EI1) iar cu LB un predicat adevarat numai pentru obiectele
LB(GRIV EI1) care iubesc copiii.
In practica, regulile de inferent a nu sunt specice unui anumit predicat; ele sunt
exprimate folosind scheme n care propozit iile sunt notate cu p, q, r, s, termenii cu
a, b, c, d iar variabilele logice cu x, y, z.
In acest mod se poate rescrie n general
orice regula de inferent a.
Exemplul 11.8
p q
p x.px
q pa
Modus ponens Regula universal-particular
Mai multe reguli de inferent a pot combinate pentru a trage concluzii; aceasta
maniera de lucru se numeste demonstrat ie. O demonstrat ie consta dintr-un set de
premise si o secvent a de formule, ecare din ele obt inut a din formulele precedente
si din premise, folosind o anumit a regula de inferent a.
In general, pentru orice operator logic sunt denite apriori doua reguli de inferen-
t a specice: regula de eliminare si regula de introducere.
Regula de introducere pleaca de la una sau mai multe premise care nu cont in
operatorul si ajunge la o concluzie n care operatorul este prezent.
Regula de eliminare ia ca premisa o formula care cont ine operatorul si ajunge la
o concluzie n care acest operator nu mai apare.
11.2. UN MODEL TEORETIC DE SEMANTIC
A 127
Tabelul 11.2:
Regula de introducere & Regula de eliminare &
p p&q p&q
q p q
p&q
Regula de introducere Regula de introducere
p pa
p q x.Px
Regula de introducere Regula de eliminare
p p
verica q& q p
p
Ultima regula (de introducere a negat iei) necesita cateva precizari. Ea foloseste o
contradict ie; aceasta apare daca exista o formula P pentru care se demonstreaza ca
P&P este adevarat a. Intuitiv, demonstrat ia foloseste reducerea la absurd: pentru
a arata p, se presupune p adevarat a si se arata ca se ajunge la o contradict ie.
Fiind dat un set de reguli de inferent a, exista formule care se pot verica far a nici
o premisa. Acestea se numesc tautologii si reecta proprietat i intriseci ale logicii.
Exemplul 11.9
p p (legea tert iului exclus)
(p&q) p q
(p q) p&q (legile lui De Morgan)
11.2.2 Relat ia dintre logica si semantica
Pentru a putea folosita, o regula de inferent a trebuie sa e n primul rand general
valabila, adica sa e adevarata n toate modelele posibile.
Exemplul 11.10 Sa consideram regula modus ponens (care poate privita si ca o
regula de eliminare a implicat iei):
p q
p
q
Parametrii p si q iau valori din mult imea propozit iilor; vom considera valorile lor
de adevar. Pentru a arata ca aceasta regula de inferent a este general valabila, trebuie
vericat ca n orice model n care premisele sunt adevarate, concluzia trebuie sa e
de asemenea adevarata. Conform Tabelului 11.1, p q, p sunt simultan adevarate
128 PRELEGEREA 11. SEMANTIC
A SI TEORIA MODELELOR
numai n modelul 1; aici, q este de asemenea adevarata. Deci regula este general
valabila, cel put in n logica cu doua propozit ii.
Se stie ca un set de formule este consistent daca exista un model care asigneaza
ecarei formule din mult ime valoarea T. Spunem ca un astfel de model satisface
setul de formule.
Exemplul 11.11 Setul de formule {P, P Q, Q} este consistent, deoarece mod-
elul 3 din Tabelul 11.1 ataseaza ecarei formule valoarea T.
In schimb se poate arata
ca setul de formule {P (Q&R), P, Q} nu este consistent, deoarece nu exista
nici un model care sa le asocieze simultan valoarea T.
A 129
In calculul propozit ional (care era un subset al FOPC), funct ia de valuare aso-
cia simbolurilor propozit ionale valorile T, F.
In FOPC propozit iile au ele nsele o
structura, iar funct ia de valuare trebuie sa deneasca interpretarea constantelor,
funct iilor si numelor de predicate.
In particular, funct ia de valuare aplica ecare
termen ntr-un anumit element din domeniu.
Pentru a urmari mai usor datele, sa consideram domeniul = {, , } si sa luam
un model n care funct ia de valuare V
1
este denita pentru trei termeni A1, B1, C1
astfel:
V
1
(A1) = , V
1
(B1) = , V
1
(C1) = .
Funct ia de valuare asociaza de asemenea numelor de predicate diverse tipuri de
mult imi, n funct ie de num arul de argumente. Sa consideram n prima faza numai
predicate unare (cum ar ROSU) care merg ntr-o submult ime a lui (adica acele
obiecte care au proprietatea de a rosii).
De exemplu, sa presupunem ca modelul deneste predicatul ROSU prin mult imea
{, } : V
1
(ROSU) = {, }.
Valoarea de adevar a propozit iilor simple construite dintr-un nume de predicat
unar si un argument poate acum denita prin:
V
1
(P(a)) =
T daca V
1
(a) V
1
(P),
F altfel.
(s-a notat cu P un predicat unar iar cu a un termen arbitrar).
Tabelul 11.3:
Model A1 B1 C1 ROSU ROSU(A1) ROSU(B1) ROSU(C1)
1. {} T F F
2. {} T T F
3. {} T F F
4. {, } T T T
5. {, } T T F
6. {, } F F F
7. {, } F F T
Fiind date denit ia lui V
1
si regula care stabileste valoarea de adevar a propozi-
t iilor construite cu nume de predicate unare, se observa usor ca:
V
1
(P(A1)) = T, V
1
(P(B1)) = F, V
1
(P(C1)) = F
Ca si n cazul propozit ional, se pot construi tabele de adevar pentru toate mode-
lele posibile. Tabelul 11.3 listeaza numai cateva modele pentru logica cu trei cons-
tante si numele de predicat unar ROSU; un tabel complet ar avea 216 linii.
In cazul predicatelor de aritate n, valorile funct iei de valuare sunt luate ntr-o
mult ime de vectori cu n componente. Regula de calcul este:
V (P(a
1
, . . . , a
n
)) =
T daca (V (a
1
), . . . , V (a
n
)) V (P),
F altfel.
130 PRELEGEREA 11. SEMANTIC
A SI TEORIA MODELELOR
Exemplul 11.12 Luand predicatul binar Iubeste, el poate denit n modelul 1,
n ipoteza ca iubeste si iubeste : V
1
(Iubeste)= {, }.
Acum se pot deni valorile de adevar ale diverselor formule n acest model:
V
1
(Iubeste(A1,B1))=F,
V
1
(Iubeste(B1,A1))=T,
V
1
(Iubeste(A1,C1))=T.
Regulile de denire a operatorilor logici sunt identice cu cele de la calculul
propozit ional. Deci se pot calcula valorile de adevar pentru diverse formule mai
complicate; de exemplu, conform asignarilor date mai sus:
(Rosu(A1) Iubeste(A1,B1))=F.
11.3 Semantici pentru cuanticatori
Pentru a deni semantici ale formulelor care cont in variabile cuanticate, trebuie sa
existe posibilitatea de a face substitut ii ale variabilelor n formule. Pentru aceasta,
denim V
i{x/}
ca o extensie a funct iei de valuare, care este similara funct iei V
i
,
numai ca deneste evaluarea variabilei x n domeniul dat de constanta .
Exemplul 11.13 Pentru funct ia de valuare V
1
denita n sect iunea anterioara,
V
1{x/}
(x) = , V
1{x/}
(Rosu) = V
1
(Rosu) = {}.
Deci V
1{x/}
(Rosu(x)) = T deoarece V
1{x/}
(x) V
1{x/}
(Rosu).
In aceste condit ii, o semantic a a formulelor care cont in cuanticatori este denita
de urmatoarele condit ii:
V
m
(x.P) = T daca pentru orice , V
m{x/}
(P) = T
V
m
(x.P) = T daca exista cel put in un astfel nc at V
m{x/}
(P) = T.
Toate denit iile precedente de suport, demonstrabilitate, completitudine etc. pot
considerate fara modicari si n cazul semanticilor pentru FOPC.
In particular, se
poate arata ca un set de formule este consistent construind un model n care toate
formulele iau valoarea adevar.
Exemplul 11.14 Sa luam setul de formule
{x.Q(x) R(x), Q(A1), Q(B1), Q(C1)}
Pentru a arata ca este consistent, denim un model astfel:
Fie = {, , } unde V (A1) = , V (B1) = , V (C1) = .
Sa luam V (Q) = {, }, V (R) = .
Se verica usor ca n acest model, toate formulele din setul ales iau valoarea T.
Prelegerea 12
Reprezentarea universului
cunoasterii
12.1 Reprezentarea cunostint elor
Exista doua forme de cunoastere, cruciale n orice sistem de reprezentare a cunos-
tint elor: cunoasterea generala a universului si cunoasterea specica a situat iei curen-
te.
Anumite aspecte ale cunoasterii universului au fost deja considerate si introduse
n ierarhia tipurilor, n relat iile dintre ele, n structurile sintactice si semantice ale
limbii etc. Este vorba de informat ii privind restrict ii generale ale universului denite
n termenii limbajului.
In majoritatea lor, elementele de cunoastere generala sunt
specicate n caracteristicile tipurilor de obiecte din univers; nu este necesara o
specicare individuala a ecarui element.
Aceasta cunoastere generala este esent iala pentru a rezolva probleme de inter-
pretare din multe limbaje; una din ele este ambiguitatea de exprimare.
Exemplul 12.1 Modul de atasare a PP nale din urmatoarele doua propozit ii de-
pinde numai de nivelul de cunostint e al cititorului n domeniul respectiv:
Am urmarit evolut ia 10 minute.
Am urmarit evolut ia zece milioane de ani.
Cunoasterea specica este important a n multe situat ii, cum ar de exemplu
determinarea persoanei la care se refera construct iile substantivale, sau eliminarea
sensurilor ambigui ale cuvintelor bazate pe situat ia curenta.
Denit ia 12.1 O reprezentare a cunostint elor consta dintr-o baza de date de propo-
zit ii numita baza de cunostint e (KB) si un set de tehnici de inferent a folosite pentru
a deduce noi propozit ii plecand de la KB curent.
Un set de tehnici de inferent a este rezonant daca genereaza numai propozit ii
adevarate cand toate propozit iile din KB sunt adevarate.
Dupa cum vom vedea, aceasta condit ie de rezonant a nu este o condit ie necesara.
Limbajul n care sunt denite propozit iile din KB este numit limbajul de repre-
zentare a cunostint elor (KRL). Acesta poate acelasi cu cel folosit la limbajul formei
logice, dar este preferabila diferent ierea lor.
131
132 PRELEGEREA 12. REPREZENTAREA UNIVERSULUI CUNOASTERII
Sa consideram de exemplu tratarea cuanticatorilor.
In limbajul formei logice au
fost denit i un num ar mare de cuanticatori, lucru motivat de numeroasele sensuri
oferite de limbajul natural.
In multe limbaje de reprezentare de cunostint e sunt
denit i uzual un num ar mult mai mic - si practic folosit numai unul: o construct ie
asociata cuanticatorului universal.
De aceea se recomanda folosirea a doua limbaje de reprezentare separate si uti-
lizarea unor funct ii pentru a face legatura ntre ele.
Cand o formul a P trebuie sa e adevarata pe baza formulelor din KB sau a
formulelor care reprezint a nt elesul unei propozit ii date, spunem ca KB (respectiv
propozit ia) suporta P. Multe concluzii necesare n nt elegerea limbajului nu sunt
bazate pe suporturi, dar sunt totusi implicat ii ale propozit iei.
Denit ia 12.2 Implicat iile sunt concluzii tipice trase dintr-o propozit ie, care pot
inrmate n anumite circumstant e.
Exemplul 12.2 Propozit ia
Matei are doua masini.
suporta faptul ca
Matei are masina.
(acesta nu poate negat) si implica faptul ca
Matei nu are trei masini.
Aceasta ultima observat ie poate negata daca discut ia continua cu
De fapt el are trei.
Sistemele KR trebuie sa accepte ambele forme de inferent a.
12.1.1 Tipuri de inferent a
Tehnicile de inferent a se mpart n forme deductive si nedeductive. Formele deductive
de inferent a sunt justicate de notat ia logica a suportului. Fiind dat un set de fapte,
un proces de inferent a deductiva va genera concluzii care se desprind logic din acele
fapte.
Inferent a nedeductiva se mparte n mai multe clase. Astfel, avem deducerea
elementelor generale plecand de la exemple (inferent a inductiva), sau a cauzelor
studiind efectele (inferent a abductiva).
Inferent a inductiva - de exemplu - reprezint a modul principal de lucrun prezen-
tarea procedeelor lingvistice din prelucrarea limbajului natural.
Inferent a abductiva lucreaza de obicei invers fat a de cea deductiva; pentru
exemplicare, sa consideram axioma
A B
Inferent a deductiva va folosi aceasta axioma pentru a deni B atunci cand se da A.
Inferent a abductiva este folosita pentru a construi A atunci cand se da B, deoarece
A este o rat iune pentru ca B sa e adevarat a.
Multe sisteme permit folosirea informat iei incomplete.
12.1. REPREZENTAREA CUNOSTINT ELOR 133
Denit ia 12.3 O regula incompleta este o regula de inferent a care poate excep-
tata.
Sa notam folosirea informat iei incomplete prin =. Atunci o regula de inferent a
incompleta va lucra astfel:
Daca A =B, A este adevarata si B nu este demonstrabila, atunci se
poate deduce B.
Exemplul 12.3 Propozit ia
Pasarile zboara.
poate reprezentata n FOPC prin
xPAS
ARE(x) =ZBOAR
A(x)
Aceasta are ca efect faptul ca ori de cate ori exista o pasare B pentru care nu
este demonstrabil ca ZBOAR
A(B).
Cu alte cuvinte, despre o anumita pasare se poate spune ca este capabila sa zboare
numai daca nu s-a armat explicit ca nu poate face acest lucru. De exemplu, strut ul
este ment ionat separat ca o pasare care nu zboara.
Regulile incomplete introduc un nou set de complexitat i n reprezentare. Fara
astfel de reguli, majoritatea reprezentarilor sunt monotone, deoarece prin adaugarea
de noi armat ii creste doar num arul de formule suportate. Formal,
Denit ia 12.4 O reprezentare este monotona daca verica urmatoarea condit ie:
Daca baza sa de cunostint e - KB - suporta o concluzie C si la KB se adauga o
formula noua construind o baza consistenta KB
, atunci KB
va suporta de aseme-
nea C.
Acest lucru nu este adevarat ntr-o reprezentare care foloseste reguli incomplete.
Astfel de reprezent ari se numesc nemonotone.
Exemplul 12.4 Sa consideram baza de cunostint e K alcatuita din formulele:
Pisica (Puy) Puy este o pisica.
Siamez(Pisica (Puy)) Puy este o pisica siameza.
c.Pisica(c) =Toarce(c) Pisicile torc.
De aici, folosind informat ia incompleta se poate deduce Toarce(Puy), pentru
ca nu exista nici o informat ie care sa contrazica noua armat ie. Dar daca se adauga
o noua formula care spune ca nici o pisica siameza nu toarce, atunci noua baza de
cunostint e nu va mai suporta faptul ca Puy toarce.
Concluziile nemonotone nu sunt specice informat iilor incomplete; exista si alte
tehnici de introducere a lor. Astfel, n ipoteza universului minim (CWA - Closest
World Assumption) se poate ret ine informat ie incompleta despre anumite predicate.
Atunci,
despre un predicat P pentru care CWA este valabila, daca o propozit ie folosind
P nu poate demonstrata ntr-o KB, atunci negat ia ei este presupusa corecta.
134 PRELEGEREA 12. REPREZENTAREA UNIVERSULUI CUNOASTERII
Exemplul 12.5 Sa consideram o baza de date pentru programul zborurilor unei
companii de avioane.
KB stocheaza informat ia care exista despre zboruri - de exemplu:
FDG100 zboara de la Roma la Paris.
dar nu cont ine explicit nici o informat ie negativa - cum ar
FDG100 nu zboara la Londra.
sau
Nu exista nici un zbor FDG231.
Astfel de informat ii pot doar deduse daca procesul de inferent a lucreaza n
ipoteza universului minim despre zboruri.
Se poate dezvolta un model de semantica teoretica pentru logici nemonotone
folosind conceptul de model minimal. Sa consideram de exemplu ipoteza universului
minimal pentru un predicat P. Se poate deni atunci o ordonare totala pe modelele
lui KB astfel:
m
1
<
P
m
2
I
m
1
(P) I
m
2
(P)
Deci, un model m
1
este mai mic decat un model m
2
n raport cu un predicat P
daca si numai daca mult imea obiectelor x pentru care P(x) este adevarat a n m
1
este o submult ime a mult imii obiectelor x cu P(x) adevarata n m
2
.
Odata denita aceasta ordonare, modelul minimal n raport cu P consta din
mult imea
{m| m model m
<
P
m}.
O alta modalitate de a formaliza ipoteza universului minim este de a adauga o
axioma la KB care sa nchida suportul. Ea este numit a axioma de completare.
Exemplul 12.6 Sa consideram un KB cont inand propozit iile
{P(A), P(B), Q(C), Q(A) }.
Atunci axioma de completare pentru P este
x.P(x) (x = A x = B).
Ea spune ca P este adevarata numai pentru valorile A sau B ale argumentului.
Se poate arata ca mult imea modelelor, extinsa cu aceasta axioma axioma de com-
pletare, coincide cu mult imea modelelor minimale (n raport cu P) a KB init ial.
12.1.2 Tehnici de inferent a
FIINT
A
OBIECT
6
-
-
ACTIUNE
OBIECT/ACTIUNE
AGENT
s
TEMA
Sistemele pur procedurale pe de alta parte folosesc aspectele inferent iale ale
reprezent arii; expresiile ntr-o KB pot sa nu aiba nici un nt eles independent de
manipularea lor n program.
Ca un exemplu putem da un sistem care foloseste procedurile aritmetice proprii
calculatorului pentru a evalua expresiile aritmetice, fara nici o reprezentare explicita
a cunostint elor despre matematica (de pilda, axiomele lui Peano).
Adesea eciente, aceste tehnici sunt greu de analizat din cauza lipsei formalis-
mului specic aplicat iei.
Exemplul 12.7
In prelegerile anterioare s-a introdus not iunea de ret ele seman-
tice. Procesul lor de inferent a poate realizat procedural sau declarativ. O modali-
tate pur declarativa va modela ecare fapt despre subtipuri si roluri ca o axioma,
iar proprietat ile de dependent a vor rezulta din inferent a standard deductiva. Ast-
fel, pentru ret eaua din Figura 12.1, informat ia poate reprezentata prin axiomele
(scrise n FOPC):
1. x.ACTIUNE(x) a.AGENT(x, a)&FIINT
A(a)
2. ax.ACTIUNE(x)&AGENT(x, a) FIINT
A(a)
3. x.OBIECT/ACTIUNE(x) ACTIUNE(x)
4. x.OBIECT/ACTIUNE(x) o.TEMA(x, o)&OBIECT(o)
5. ox.OBIECT/ACTIUNE(x)&TEMA(x, o) OBIECT(o)
Folosind aceste axiome, se poate demonstra ca rolul AGENT este mostenit de
clasa OBIECT/ACTIUNE. Altfel spus, pentru orice obiect A astfel ncat
OBIECT/ACTIUNE(A) este adevarat, se poate demonstra ca A are rolul agent;
deci, folosind axiomele 3 si 1,
a.AGENT(A, a)&FIINT
A(a).
O versiune procedurala a acestei construct ii va un program care pleaca de la un
nod OBIECT/ACTIUNE precizat, aa toate rolurile atasate lui, apoi traverseaza ar-
cul s pana la supertipul ACTIUNE si aa toate rolurile atasate aici. Raspunsul este
dat de mult imea totala de roluri colectate de aceasta procedura. Deci, n particular,
orice OBIECT/ACTIUNE are un rol AGENT mostenit de la clasa ACTIUNE.
136 PRELEGEREA 12. REPREZENTAREA UNIVERSULUI CUNOASTERII
12.2 O reprezentare bazata pe FOPC
Plecand de la FOPC se deneste un KRL care este o extensie pentru a cuprinde si
informat iile specice reprezent arii cunostint elor.
Termenii limbajului sunt constante (exemplu Ion), funct ii (exemplu tata (Ion))
si variabile (x, y, . . .). De remarcat - ca o diferent a - ca limbajul formei logice nu
avea denite constante; aici (n KB) constantele sunt folosite pentru a reprezenta
singularitat i specice.
De exemplu, termenul din forma logica (NUME j1 Ion) reprezinta nt elesul
unei armat ii referitoare la Ion. Persoana prezent a la care se face referire ntr-un
context dat poate reprezentata n KB de constanta Ion.
Similar notat iei domeniului cuanticatorilor generalizat i din limbajul formei logi-
ce, se procedeaza si n KRL: restrict ia domeniului se noteaza prin variabila cuanti-
cata, urmata de
:
.
Exemplul 12.8
x : Om(x) Fericit(x) este echivalent cu x.Om(x)&Fericit(x)
x : Om(x) Fericit(x) este echivalent cu x.Om(x) Fericit(x)
Aici este necesar si predicatul egalitate (a = b), care semnica faptul ca termenii
a si b au aceeasi notat ie.
Fiind data o propozit ie simpla P
a
care foloseste constanta a, daca P
a
este
adevarata si a = b, atunci P
b
trebuie sa e adevarata.
Multe sisteme de reprezentare a cunostint elor nu folosesc explicit cuanticatori.
Ele pot introduce totusi variabile, care act ioneaza ca variabile cuanticate universal
cu domeniul vid.
Exemplul 12.9 Formula
(P ?x A)
scrisa n KB corespunde ca nt eles formulei din FOPC
x.P(x, A).
Variabilele cuanticate existent ial sunt prelucrate cu o tehnica numit a skolemi-
zare care nlocuieste variabila cu o constant a noua, nedenita anterior.
Exemplul 12.10 Formula
yx.P(x, y)
va codicata n KB n formula
(P ?x Sk1)
unde Sk1 este o constanta noua, neutilizata anterior, xata pentru obiectul despre
care se stie ca exista.
12.2. O REPREZENTARE BAZAT
A PE FOPC 137
Dependent ele de domeniu ale cuanticatorilor sunt indicate folosind funct ii noi,
numite funct ii Skolem. De exemplu, formula
yx.P(x, y)
va codicata n KB n formula
(P (Sk2 ?y) ?y)
unde Sk2 este o funct ie noua, care produce un obiect (eventual) distinct pentru
ecare valoare a lui ?y.
Formulele vor reprezentate adesea n formate care combina ambele modalitat i
de scriere: cuanticatorii universali sunt scrisi explicit, iar variabilele existent iale
sunt skolemizate.
Exemplul 12.11 Formula
yx.P(x, y)
poate scrisa si
y P (Sk1(y), y).
De fapt, dupa cum se vede, toate aceste forme de scriere sunt echivalente.
Stilul prezent arii n denirea limbajului nu are nici o restrict ie (n afara de aceea
de a conforma cu notat ia FOPC).
In particular, nu se poate spune nimic despre
forma predicatelor. Exista o plaja exprem de larga de select ie. La o extrema se pot
deni predicate diferite pentru ecare sens al cuvantului (strategia fundamental a
folosita n limbajul formei logice). La cealalta extrema, se poate folosi un set pre-
denit de predicate numite primitive, si sensurile cuvintelor vor scrise n termenii
acestor primitive.
Fiecare modalitate are avantajele si dezavantajele sale. De obicei ele sunt com-
binate folosind tehnica ierarhiei tipurilor.
De multe ori, o reprezentare a cunostint elor trebuie sa extraga informat ie din
modalitat i diverse de denire a sensurilor cuvintelor.
Uneori se stie o denire completa a unui termen. De exemplu, se poate deni
predicatul tata ca parinte mascul, adica
x.TAT
A(x) y P
ARINTE(x, y)&MASCUL(x)
Majoritatea cuvintelor nu sunt nsa denite asa de precis. Astfel, nu exista nici
un set de proprietat i care sa deneasca precis not iuni uzuale cum ar caine, pisica,
scaun etc. Ele pot clasicate n ierarhii de tipuri, ecare nsot it a de axiomele
aferente; dar nici o denit ie precisa nu poate data. Privite ca axiome n FOPC,
ele vor folosi doar implicat ii.
Exemplul 12.12 O axioma pentru C
AINE1 poate
x.C
AR
A(b)
Roluri : Cumparator, Vanzator, Obiect, Bani
Restrict ii : Om(Cumparator),
Agent Vanzari(Vanzator),
EObiect(Obiect),
Valoare(Bani),
Pret (Obiect)
Precondit ii : DETINE(Cumparator, Bani),
DETINE(Vanzator, Obiect)
Efect : DETINE(Cumparator, Bani),
DETINE(Vanzator, Obiect),
DETINE(Cumparator, Obiect),
DETINE(Vanzator, Bani)
Descompunere : D
A(Vanzator,Cumparator, Obiect)
12.4. FOLOSIREA MULT IMILOR
IN DEFINIREA CUANTIFICATORILOR141
12.4 Folosirea mult imilor n denirea cuantica-
torilor
Avand denit un KRL, sa facem cateva observat ii referitoare la aplicarea limbajului
formei logice n KRL. Cele mai mari diferent e au aparut n scrierea cuanticatorilor
(foarte numerosi n limbajul formei logice, maxim doi n KRL). Aceasta diferent a
de numar poate redusa extinzand denit ia KRL si asupra obiectelor.
KRL poate lucra cu mult imi, cu condit ia ca acestea sa e nite. O mult ime
poate indicata listand elementele ei (de exemplu {Ana1,Cici1}).
Mult imile sunt notate n mod uzual cu constante; astfel, S
1
poate o mult ime
denita prin formula S
1
= {Ana1, Cici1}.
Proprietat ile din teoria mult imilor sunt valabile si n KRL. Operat ii cum ar
reuniunea, intersect ia, incluziunea, apartenent a etc. apar sub denumirea de predi-
cate.
Folosirea mult imilor n denit ii se face obisnuit; de exemplu, propozit ia
Unii s-au ntalnit la trei.
produce interpetarea:
M : M {x|OM(x)}.
INT
ALNI(M,3PM)
Prin convent ie, numele mult imilor se vor scrie cu majuscule. Sunt anumite verbe
care n unele argumente opereaza numai cu mult imi. Altele dimpotriva.
Sa consideram cateva formule care apar n urma citirilor colective/distributive.
Astfel, exista doua interpret ari ale propozit iei
Cat iva oameni au cumparat un costum.
care are urmatoarea forma logica (s-a omis operatorul de timp):
(C
ARA1 m1 s1)))
Citirea colectiva va aplica aceasta forma n
M1 : M1 {z |OM(z )} s : COSTUM(s).CUMP
ARA1(M1, s)
Citirea distributiva conduce la formula:
M2 : M2 {z |OM(z )} m : m M2 s : COSTUM(s).CUMP
ARA1(m, s)
Se observa ca diferent a principala dintre cele doua scrieri consta n tipul de
argument folosit de predicatul CUMP
ADE1(m)
Prelegerea 13
Rat ionament si cunoastere
13.1 Verbele n reprezentarea cunoasterii
Una din componentele centrale n orice reprezentare a cunoasterii consta n tratarea
verbelor si a timpului. Multe limbaje folosesc timpul incluzand informat ia temporala
implicit n timpul verbelor si explicit n adverbe temporale (de exemplu pentru cinci
minute, la ora 3, dupa ce am plecat etc.).
INAINTE,
IN TIMPUL, . . .), iar toate predicatele
puteau avea argumente de timp.
Exista mai multe tipuri diferite de timp. Din acest punct de vedere, avem punct
temporal, interval temporal, durata. Pentru ele se denesc urmatoarele relat ii:
t
1
< t
2
punctul/intervalul t
1
este naintea punctului/intervalului t
2
;
t
1
: t
2
intervalul t
1
continu a cu intervalul t
2
, sau
punctul t
1
deneste nceputul intervalului t
2
, sau
punctul t
2
deneste sfarsitul intervalului t
1
;
t
1
t
2
punctul/intervalul t
1
este cont inut n punctul/intervalul t
2
.
Propozit iile descriu armat ii care apart in unei anumite clase: cele care descriu
stari (armat ii statice), cele care descriu activitat i de deplasare (armat ii active) si
cele care descriu evenimente complete (armat ii totale).
Denit ia 13.1 Armat iile statice descriu anumite proprietat i ale universului, care
pot avea loc (pentru un moment sau pentru o perioada nedenita).
De exemplu:
Mihai este fericit.
Eu cred ca pamantul este plat.
De asemenea, ele descriu situat ii care nu au un punct nal precis si nu pot apare
n anumite contexte lingvistice:
* Mihai ind fericit.
* Eu crezand ca pamantul este plat.
143
144 PRELEGEREA 13. RAT IONAMENT SI CUNOASTERE
Denit ia 13.2 Armat iile active descriu activitat i care pot apare ntr-un interval
de timp.
De exemplu:
Mihai alearga.
Usa se deschide si se nchide permanent.
Propozit iile care descriu stari sau activitat i nu folosesc de obicei operatori tem-
porali (cum ar cinci minute), dar au modicatori de durata (pentru cinci minute).
Denit ia 13.3 Armat iile totale descriu act iuni nalizate.
Astfel, urmatoarele armat ii sunt totale:
Paul a reusit sa adoarma.
Silvia s-a urcat pe munte.
In prima propozit ie, actul citirii este simultan cu cel al deschiderii usii, n timp
ce n a doua propozit ie, el l precede.
Formalizarea se bazeaza pe not iunea de timp de referint a.
A 147
Exemplul 13.3 Cele trei forme generate n acest caz de relat ia dintre S si R sunt
exemplicate prin:
Pisica toarce. Prezentul simplu: S = R, E = R
Pisica toarse. Perfectul simplu: R < S, E = R
Pisica va toarce. Viitorul simplu: S < R, E = R
La timpurile perfecte (perfectul compus, mai mult ca perfectul, viitorul perfect)
timpul evenimentului precede timpul de referint a.
Exemplul 13.4 Cele trei situat ii posibile sunt exemplicate astfel:
Pisica a tors. Perfectul compus: S = R, E < R
Pisica torsese. Mai mult ca perfectul: R < S, E < R
Pisica va tors. Viitorul compus: S < R, E < R
Analiza pune n evident a si alte trei posibilitat i, datorate relat iei R < S (timpul
posterior):
Exemplul 13.5
Pisica urmeaza sa toarca. Prezentul posterior: S = R, R < E
Pisica urma sa toarca. Trecutul posterior: R < S, R < E
Pisica va urma sa toarca. Viitorul posterior: S < R, R < E
13.2 Deduct ia automata
Sa studiem n continuare cateva strategii si tehnici de rat ionament folosite n sis-
temele de reprezentare a cunoasterii. Dupa cum s-a aratat n prelegerea anterioar a,
sistemele de rat ionament se mpart n doua categorii mari: declarative si procedurale.
Ne vom ndrepta atent ia asupra catorva tehnici pur declarative.
Una din complicat iile demonstrarii automate provine din faptul ca anumite for-
mule se pot demonstra n mai multe moduri; num arul demonstrat iilor se reduce ns a
mult daca se realizeaza o reducere a complexitat ii formulelornainte de demonstrat ie.
In particular, este util de folosit o forma normala pentru formule, bazata pe un sub-
set al sintaxei FOPC. De exemplu,
P&Q, (P Q), (P Q)
sunt logic echivalente si conduc la aceeasi forma normala.
Sa dezvolt am deci o forma normala pentru FOPC, numit a forma normala con-
junctiva (FNC). La nivelul constantelor, funct iilor si propozit iilor atomice, FNC
este identic a cu cea din FOPC. Un literal corespunde unei propozit ii atomice, posi-
bil negata. De exemplu:
Persoana(Ion1),
Masina(Masina1),
Apart ine(Ion1,Masina 1),
Fericit(Ion1)
148 PRELEGEREA 13. RAT IONAMENT SI CUNOASTERE
O clauza este o formul a avand forma generala
(P
1
, . . . , P
n
Q
1
, . . . , Q
m
)
unde P
i
si Q
i
sunt literali, cu semnicat ia:
Daca Q
1
, . . . , Q
m
sunt adevarate, atunci cel put in una din propozit iile P
1
, . . . , P
n
este adevarata.
Exemplul 13.6 Clauza
(Apart ine(Elena1,Masina2) Fericit(Elena1))
corespunde formulei - scrisa ca disjunct ie:
Apart ine(Elena1,Masina2) Fericit(Elena1)
Sub aceasta forma, tot i Q
i
sunt literali scrisi cu negat ie.
Se poate arata ca toate formulele din FOPC au o forma clauzala echivalent a.
Tabelul 13.2 cont ine cateva astfel de forme echivalente.
Tabelul 13.2:
Formula n FOPC Forma clauzala echivalenta
(P )
P ( P)
P&Q doua clauze : (P ), (Q )
P Q (PQ )
Q P (Q P)
P Q (Q P)
(P Q) doua clauze : (P ), ( Q)
(P&Q) R doua clauze : (PR ), (QR )
Daca n = 1 avem clauza Horn. Strategia folosita de limbajul Prolog, bazata pe
clauze Horn, este capabila sa demonstreze orice formula rezultata logic din KB.
Rat ionamentul cu clauze face posibila extensia algoritmilor de unicare. Sa
consideramnt ai un KB limitat numai la literali (similar unei baze de date relat ionale
care foloseste cuanticatori). Aici, formula FOPC
yxP(x, y)
corespunde literalului
P(Sk2(?y), ?y).
Presupunem ca KB cont ine acest literal si sa vedem ce se nt ampla dacan acelasi
KB va rezulta ulterior formula
wzP(w, z).
Transformat a direct n forma clauzala, se ajunge la ceva de tipul
P(Sk3(?w), ?w)
care nu se unica cu literalul din baza de date pentru ca funct iile Skolem sunt
notate diferit.
Intr-un sistem bazat pe cautarea patternurilor, aceasta problema
13.2. DEDUCT IA AUTOMAT
A 149
se evita invers and interpretarea cuanticatorilor nedenit i (folosit i cu ?). Deci, o
formul a
yxP(x, y)
va conduce la
P(?z, Sk4),
care se va unica cu literalul pentru aceeasi formul a, existent n baza de cunostin-
t e.
Aceasta idee rezulta din strategia de demonstrare automata.
In general exista
doua metode generale de vericare a unei formule P.
Prima se bazeaza pe o demonstrare a lui P direct din KB, folosind regulile de
inferent a.
A doua (tehnica refuzului) consta n a arata ca P este inconsistenta n KB
(si deci P trebuie sa rezulte din KB); aceasta este modalitatea uzuala folosita
n deduct ia automata si formeaza fundamentul teoretic al tehnicii de regasire
a patternului descris anterior, a strategiilor de demonstrare bazate pe clauze
Horn.
Ambele tehnici pot considerate implement ari specializate ale unei singure reguli
de inferent a numit a regula de rezolut ie.
Exemplul 13.7 Un caz foarte simplu de regula de rezolut ie este modus ponens.
In
particular, ind data o clauza (Q P) (adica P Q) si clauza (P ) (adica P
este adevarata), regula de rezolut ie decide (Q ) (adica Q este adevarata).
Un alt caz simplu de regula de rezolut ie trateaza contradict iile. Din clauzele
(P ), ( P) (adica P este adevarata respectiv falsa) rezulta clauza vida
() care indica inconsistent a bazei de date.
Regula de rezolut ie este generalizata la FOPC folosind unicarea pentru a instan-
t ia variabilele cu valori identice din cele doua clauze.
Exemplul 13.8 Sa consideram un KB care include clauze ce arma ca tot i cainii
musca si ca Grivei este caine:
(MUSCA(?x) C
AINE(?x))
(C
AINE(Grivei1) )
Regula de rezolut ie, dupa substitut ia lui ?x cu Grivei1, va elimina literalul
C
A NU T(R))
care are succes numai daca T(R) esueaz a la ntrebare.
Cuanticatorii necesita folosirea unor transformari mai complexe. Fiecare cuan-
ticator se translateaza ntr-un program care efectueaza o anumit a operat ie pe baza
de date. Din cauza limitarilor impuse de limbajul bazei de date, de obicei se pot
prelucra numai citirile distributive ale cuanticatorilor multipli.
Sa consideram trei cuanticatori folosit i n aplicat iile de tip ntrebare/raspuns:
(L x : R
x
P
x
)
se translateaza ntr-un program
(AFL
A L ?x T(R
?x
) T(P
?x
))
care aa toate variabilele ?x care satisfac T(R
?x
), adica (AFL
A ?x T(R
?x
)).
Daca se gaseste un singur raspuns, atunci acel raspuns este substituit lui
?x n toata expresia si se executa T(P
?x
) pentru a gasi raspunsul nal la
ntrebare.
Daca nu se gaseste nici un obiect lantrebarea adresata lui T(R
?x
), atunci
exista o anumita contradict ie care va folosita n sistemul ntrebare/ras-
puns; de exemplu se anunt a utilizatorul ca nu exista nici un obiect soli-
citat.
Daca se gasesc mai multe raspunsuri, construct ia sistemului va decide
calea care va urmata: unele sisteme executa T(P
?x
) pentru ecare valoa-
re gasita, altele anunt a eroare, etc.
13.3. SEMANTICI PROCEDURALE SI CHESTIONARE 153
(FIECARE x : R
x
P
x
)
se translateaza ntr-un program
(ITERARE ?x T(R
?x
) T(P
?x
))
care ncepe de asemenea prin a cauta tot i ?x care satisfac T(R
?x
); n a doua
faza va executa T(P
?x
) pentru ecare valoare gasita si nalizeaza cu succes
numai daca toate aceste ntreb ari au raspuns acceptabil.
(CE x : R
x
P
x
)
se translateaza ntr-un program
(SCRIE TOT ?x T(R
?x
) T(P
?x
))
care aa toate obiectele ce satisfac (AFL
A ?x T(R
?x
) T(P
?x
)), dupa care
scrie rezultatele. Determinarea celui mai bun format de scriere, n special a
informat iei suplimentare necesare, este o problema dicila pe care momentan
o vom evita.
Plecand de la baza de date din Tabelul 13.3, putem construi cateva exemple de
chestionare.
Exemplul 13.10
Intrebarea
Ce zbor spre Iasi pleac a la ora 4 PM ?
va avea forma logica:
(CE f1 : (AND (ZBOR f1)(DEST f1 (NUME c1
Iasi
)))
(PLECA t1 (NUME t1
4 PM
)))
Ea se translateaza ntr-o ntrebare de forma:
(SCRIE TOT ?f (ZBOR ?f)(STIMP ?f ESTE ?t)
(PTIMP ?f ?s 16 : 00 HR))
Aici relat ia DEST se aplica n relat ia STIMP descrisa anterior, iar predicatul
PLECA n relat ia PTIMP. De remarcat ca locul de plecare nu a fost specicat n
forma logica; de aceea aici este folosit ca o variabila.
Intr-o aplicat ie reala, orasul de
plecare va determinat de context sau prin lipsa. Pentru baza de date din Tabelul
13.3, exista un singur zbor care satisface descrierea curenta, anume F1.
Exemplul 13.11 Solicitarea:
Dat i timpul de plecare al ec arui zbor spre Iasi.
are forma logica:
(FIECARE f1 : (AND (ZBOR f1)(DEST f1 (NUME c1
Iasi
)))
(L t1 : (PLEC TIMP f1 t1)(DA SCRIE1 g1)))
Ea se transcrie n ntrebarea:
(ITERARE ?f1 (CONTROL TOT(ZBOR ?f1)(STIMP ?f(ESTE ?t1))
(AFLA L ?t1 (PTIMP ?f1 ?ORAS ?t1)(SCRIE ?t1)))
In acest caz, Tudor a pat it aceleasi necazuri: uitat portofel, pierdut banii.
Din aceste exemple, putem deduce contextul local ca ind derivat din clauzele
principale precedente (nu din propozit iile precedente !). Astfel, deoarece conjunct iile
(cum ar si) pot alipi clauze majore (vezi exemplul 5), se poate arma:
Prima parte a conjunct iei stabileste contextul local pentru a doua parte.
Conjunct iile ntre VP-uri apar n interiorul unei clauze majore, asa ca ambele au
acelasi context local (6a si 6b). Clauzele secundare sunt incluse drept componente
ale unor clauze majore, deci ele nu vor crea un context local nou. Putem exemplica
aceasta prin:
7a. Sorin si-a uitat portofelul cand s-a dus la cinema.
7b. La fel si Tudor.
Propozit ia 7b poate interpretat a ca Tudor si-a pierdut portofelul (eventual
cand s-a dus la cinema), dar nu ca Tudor s-a dus la cinema.
O parte important a a contextului local este lista antecedentelor posibile pentru
pronume; o vom numi lista entitat ilor discursului (DE). Lista DE este un set de cons-
tante denite n KB, care reprezint a obiectele ment ionate n ultima clauza majora
si la care se poate face referire prin pronume. Chiar daca o DE nu este ment ionat a
explicit n clauza precedenta, ea este introdusa implicit. Pentru a rezolva astfel
de situat ii vom vorbi despre obiectele pe care le evoca (sau la care face referire) o
propozit ie (obiectele ment ionate explicit sau implicit de aceasta).
Cand un pronume are un anumit antecedent, se nt elege ca atat pronumele cat
si antecedentul sau se refera la acelasi obiect; spunem ca pronumele si antecedentul
sau co-refera. De remarcat ca un pronume si antecedentul sau se pot co-referi la
acelasi obiect X, chiar daca nici vorbitorul si nici auditoriul nu pot identica X
ntr-un mod concret. De exemplu:
8a. Marin si-a cumparat ieri o masina
i
.
8b. Ea
i
a costat foarte mult.
Armat iile sunt facute fara ca vre-un participant la conversat ie sa vazut masina
sau sa aiba vre-un mijloc de a o identica. Desi aceasta co-referire introduce anumite
probleme n reprezentare (nu se poate deni un obiect din lumea reala fara a-l
identica), o solut ie consta n folosirea de funct ii Skolem sub o forma similara celei
din Prelegerea 12: adaugarea de noi termeni la limbaj.
14.1. COMPONENTELE CONTEXTULUI LOCAL AL DISCURSULUI 157
Exemplul 14.1 Daca o masina are forma logica
< O c1 MASIN
A >,
constanta Skolem generata va C1. Co-referint a este indicata folosind egali-
tatea. Deci, daca pronumele Ea are forma logica
(PRO i1 EA1),
atunci faptul ca Ea co-refera cu C1 va prins n asert iunea
(I1 = C1).
14.1.1 Entitat i de generare a discursului
Pentru ecare expresie substantivala este generata o entitate specica a discursu-
lui. NP distincte reprezinta restrict ii distincte ale universului discursului. Un NP
nedenit evoca de obicei o noua entitate a discursului care uzual nu mai trebuie
identicat a ulterior n KB. Un nume propriu - pe de-alta parte - descrie n general
un anumit obiect din KB care are asociat acelasi nume. Un NP denit (inclusiv
pronumele) se refera la un obiect ment ionat anterior n discurs, de obicei o entitate
a discursului n context local. Pluralul NP-urilor reprezint a mult imi de obiecte. Un
NP complex care foloseste conjunct ii reprezint a o mult ime formata din elementele
conjunct iei.
Exemplul 14.2 Expresia substantivala
Ion si Ana.
semnica trei DE: Ion1, Ana1 si {Ion1 Ana1}.
In cele ce urmeaza vom considera entitat ile discursului reprezentate prin NP-uri
nedenite. Aceasta clasa este foarte importanta deoarece elementele ei introduc
numeroase entit at i noi ale discursului si acopera multe elemente necesare prelucrarii
referint elor denite (care vor discutate n prelegerea urmatoare). Pentru a calcula
mult imea entit at ilor discursului, vom converti ntai forma logica n reprezentarea
cuanticatorilor descrisa anterior, reducand tot i cuanticatorii limbajului natural la
cei universal si existent ial denit i pe baza mult imilor scrise explicit.
De asemenea, n exemplele simple folosite, vom presupune ca toate numele proprii
si NP-urile denite sunt nlocuite cu constante din KB reprezentand referint e la
acestea.
Pluralul NP-urilor va notat cu aceeasi mult ime, indiferent daca este vorba de
o interpretare colectiva sau distributiva.
In citirea colectiva, mult imea introdusa
este folosita direct n propozit ie ca argument, n timp ce n citirea distributiva
mult imea reprezinta domeniul cuanticatorului universal. Pentru denirea mult imii,
modicatorii trebuiesc mp art it i n faza de translatare n doua clase:
Restrict ii ale mult imii (SR),
Restrict ii ale ecarui obiect al mult imii (IR).
De exemplu, translatarea expresiei substantivale Trei baiet i din propozit ia
9. Trei baiet i l-au hranit pe Grivei.
158 PRELEGEREA 14. CONTEXTUL LOCAL AL DISCURSULUI
Tabelul 14.1:
Exemplu Entitatea Dis- Restrict ia de Restrict ia
cursului (DE) mult ime (SR) individuala (IR)
un om M1 none OM1(M1)
trei femei W1 |W1| = 3 W1 {w|FEMEIE1(w)}
sau, echivalent,
w . w W1 FEMEIE1(w)
cateva C1 |C1| > 1 C1 {c|PISIC
A1(c)&
pisici negre NEGRU1(c)}
va folosi un SR care arata ca mult imea are trei elemente si un IR care specica
ca ecare element este un baiat.
AR
A(b, p)
unde |B1| = 3 & B1 {x|B
AIAT(x)}.
Forma skolemizata este:
b : b B1 . PIZZA(sk4(b)) & CUMP
AR
A(b, sk4(b))
14.2. UN MODEL DE REFERIRE BAZAT PE LISTE ISTORICE 159
unde sk4(b) este o funct ie noua reprezentand pizza cumparat a de ecare baiat.
Analiza completa a propozit iei este:
Propozit ie: Trei baiet i au cumparat cate o pizza.
Translatare init iala:
B : |B| = 3 & B {x|B
AIAT(x)}
b : b B . p : PIZZA(p) . CUMP
AR
A(b, p)
Entitat ile discursului:
B1 : |B1| = 3 & B1 {x|B
AIAT(x)}
P1 : P1 = {x|PIZZA(x) & y : y B1 . x = sk4(y)}
Cont inutul semantic:
b : bB1 . sk4(b) P1 & CUMP
AR
A(b, sk4(b))
14.2 Un model de referire bazat pe liste istorice
In aceasta sect iune vom construi o tehnica simpla pentru identicarea antecedentelor
pronumelor. Ea se bazeaza pe liste istorice - o stiva de liste ale entitat ii discursului
generate de propozit iile anterioare; entitat ile din discursul local curent (adica cele
generate de clauza precedenta) sunt n topul stivei.
Sa presupunem ca a fost denit algoritmul de generare a entitat ilor discursului
produse de o propozit ie. Lista istorica va consta din toate aceste entit at i, evocate
ntr-un trecut destul de recent. Unele sisteme reduc acest trecut la ultimele 1 3
contexte locale, n timp ce altele nu fac nici o limitare.
Fiind data lista istorica, algoritmul de aare a unui antecendent opereaza astfel:
Se cauta n cel mai recent context local un antecedent care sa verice toate
restrict iile relative la pronume.
Restrict iile pot proveni din orice sursa. De exemplu, reexivitatea poate elimina
anumite obiecte din lista ascendent ilor posibili; la fel genul, numarul, si alte condit ii.
Daca nu se gaseste nici un antecedent n contextul local curent, se activeaz a lista
istorica a urmatorului context local si procedeul de cautare se reia.
Algoritmul acesta poarta numele de restrict ia recenta si are drept conjectura
faptul ca antecedentul trebuie sa e cel mai recent obiect ment ionat care
satisface toate restrict iile.
Exemplul 14.3 Sa consideram urmatorul discurs, referitor la o cursa maritima:
11a. Antreprenorii aveau mult i bani si au cheltuit mult pentru a construi nava
de concurs.
11b. Baiet ii n schimb si-au construit nava cu un buget mult mai mic.
11c. Ei stiau ca vor castiga cursa fara probleme.
Acest Ei din 11c se refera mai degraba la baiet i, desi - la o analiza seman-
tica mai atenta - este mai probabil ca antreprenorii sunt cei care aveau convingerea
castigarii cursei.
160 PRELEGEREA 14. CONTEXTUL LOCAL AL DISCURSULUI
Tabelul 14.2:
Propozit ie Generarea entitat ilor discursului
11b B2 : B2 {x|B
AIAT(x)}
B3 : NAV
In(C
1
, P
1
),
In(C
2
, S).
NP casa din colt se refera n mod clar la C
1
, dar colt este ambiguu ntre P
1
si P
2
.
Deci, aarea unui referent unic pentru colt va esua, asa ca va esua de asemenea
cautarea pentru tot NP.
Cautarea simultana elimina acest neajuns; n acest exemplu, se va cauta simultan
un obiect care satisface formula
c : CAS
A(c) p : COLT(p) .
IN(c, p)
La aceasta ntrebarea raspunsul este unic, anume cand c este instant iat cu C
1
iar p cu P
1
.
14.4.1 Citirea existent iala si referint a indirecta
Citirea existent ial a identic a un obiect unic denit de descriere. Dar chiar unicitatea
nu este o condit ie sucienta pentru determinarea acestui obiect.
De exemplu, daca ne aam ntr-o scoal a si directorul spune
Copilul este bolnav.
acesta, desi unic, nu este determinat far a informat ii suplimentare.
De fapt, citirea existent iala poate doar introduce un obiect, denindu-l n ter-
menii altor obiecte care pot denite referent ial. Fie exemplul:
18. Castigatorul la cursa de 3000 m obstacole a fost roman.
Nici vorbitorul si nici auditoriul nu trebuie sa stie exact cine a castigat cursa,
dar ambii sunt de acord ca acesta a fost unic, si - mai mult - acea persoana este de
cetat enie romana.
Deci, descrierile denite nu se refera totdeauna la obiecte aate deja n istoria
discursului. Ele pot ns a introduce obiecte. Acest proces poarta numele de aco-
modare, datorita faptului ca auditoriul acomodeaza vorbitorul introducand obiecte
si proprietat i necesare pentru ca propozit ia sa e nt eleasa.
Pentru unicitatea existent ei este introdus cuanticatorul;
!x : R
x
. P
x
Aceasta formula este adevarat a numai daca exista un obiect unic care satisface
regula R
x
, si daca P
x
este adevarata pentru acest obiect.
Cu acest cuanticator, propozit ia 18 - n care presupunem ca proba de 3000 m
obstacole se refera la obiectul CURSA 3000 - se translateaza n:
! c : C
AN(c)
14.4. DESCRIERI DEFINITE 167
Entitat ile discursului evocate de expresiile substantivale denite existent ial sunt
generate la fel ca cele nedenite. Singura diferent a este ca aici referentul este denit
precis de catre descriere.
ASTIGA(C
1
, CURSA 3000).
ATOR IN(R
1
, CURSA 3000) & ROM
AN(R
1
)
Unele citiri existent iale nu includ explicit termeni referent iali care sa poata
folosit i la identicarea lor unica.
In aceste cazuri, obiectul si relat ia trebuiesc inter-
ferate din contextul discursului.
Ca exemplu, sa consideram discursul:
19a. Clubul la care activez a organizat o cursa.
19b. Castigatorul a primit o masina.
Nu exista nici un complement n expresia substantivala castigatorul care sa indice
n raport cu ce este denit el. Dar, daca termenului lexical castigatorul i este data
aceeasi interpretare semantica ca la 18, aceasta sugereaza ca interpretarea poate :
!c : C
ASTIGA(c, PRO)
unde *PRO* este un termen anaforic care trebuie denit prin context.
Aceasta idee este mai clara daca se da un exemplu unde nu exista un concurs
unic determinat de context. Astfel:
20a. Atat clubul la care activez cat si cel la care este nscris Radu au organizat
curse.
20b. Castigatorul a primit o masina.
Propozit ia 20b este sau gresita (nu are nici un referent) sau foarte imprecisa
deoarece suporta o interpretare n care ambele curse au avut acelasi castigator.
Exemple de referire indirecta pot apare folosind cuvinte care nu sunt interpretate
n mod normal ca funct ii relative la un alt obiect. Astfel:
21a. Toma a adus un stilou la masa.
21b. Dar a constatat ca are varful rupt.
NP varful din 21b, care - intuitiv - se refera la varful stiloului pe care l-a adus
Toma la masa, constituie problema. Acest tip de referint a poate caracterizat
denind o relat ie R si un termen anaforic *PRO*. Interpretarea corecta a acestei
expresii substantivale necesita aarea unei forme si a unei relat ii *R*. Varful se va
aplica atunci ntr-o citire existent ial a de forma:
!v : V
In general, modicatorii din expresiile substantivale care descriu mult imi pot
deni e proprietat i ale mult imii ns asi, e proprietat i ale elementelor din mult ime.
Deci expresia substantivala:
Cei trei oameni care au par asit petrecerea.
descrie o mult ime de cardinalitate trei, n care ecare membru este o persoana
caracterizata prin faptul ca a parasit petrecerea.
Citirea existent iala a acestei NP denite va ceva de forma:
!M : |M| = 3 & M = {m|OM(m) & P
AR
ASI(m, PETRECERE1)}
Unicitatea se bazeaza pe faptul ca exact trei oameni au par asit petrecerea; alt-
fel, ar mai multe seturi posibile care ndeplinesc aceasta proprietate. Pentru
comparat ie, descrierea nedenita
Trei oameni care au parasit petrecerea.
va reprezentat a prin
M : |M| = 3 & M {m|OM(m) & P
AR
ASI(m, PETRECERE1)}.
Deoarece mult imea M nu este unica, petrecerea poate parasit a de mai mult de
trei oameni.
Expresiile substantivale la plural folosesc n mod constant referirea indirecta,
adesea la submult imi ale mult imilor deja introduse.
De exemplu, sa consideram discursul:
1a. Cat iva baiet i si fete au venit la petrecere.
1b. Baiet ii au plecat la miezul nopt ii.
Expresia Baiet ii nu descrie o mult ime prezent a explicit n contextul local ci de-
neste o mult ime indirect, anume mult imea tuturor baiet ilor din mult imea anterior
ment ionat a. Pentru a ret ine aceasta interpretare, o translatare a lui 1b poate :
P
AR
AIAT(x)} PROSET
169
170 PRELEGEREA 15. PROPOZIT II ELIPTICE SI ANAFOR
A
n care s-a notat cu PROSET o mult ime denita contextual. Daca notam cu
S2 entitatea discursului generata de Cat iva baiet i si fete din 1a, aceasta se poate
rezolva prin
P
AR
AIAT(x)} S2.
Ca un alt exemplu, sa consideram discursul
2a. Ion, Anca, Radu si Maria merg la mare.
2b. Baiet ilor le-a fost frica sa intre n apa.
In propozit ia 2b, descrierea Baiet ilor se refera la mult imea {Ion, Radu}, unic
denita prin intersect ia mult imii baiet ilor cu {Ion1, Anca1, Radu1, Maria1} intro-
dusa de expresia substantivala conjunctiva data de 2a.
Aceasta tehnica funct ioneaza n multe cazuri; probleme apar atunci cand mult i-
mea de referint a nu este prezent a n universul local al discursului.
Sa consideram discursul:
3a. Paul l-a ntalnit la Mihai pe plaja.
3b. Cei doi baiet i s-au dus apoi la magazin.
Aici 3a nu deneste explicit nici o mult ime. O propunere ar ca mult imea
{Paul, Mihai} sa devina relevant a via un rat ionament despre situat ie.
In acest caz
se poate folosi cunostint a generala ca atunci cand doi oameni se ntalnesc, ei sunt
mpreuna si deci formeaza o mult ime noua.
Dar aceasta tehnica nu funct ioneaz a totdeauna; astfel ea nu se poate aplica
pentru discursul:
4a. Paul traieste la Bucuresti iar Mihai la Iasi.
4b. Cei doi nu s-au ntalnit niciodata.
Prelucrarea la modul general a unor asemenea cazuri ramane problematica.
15.1.1 Referirea la elementele unei mult imi
Cand o mult ime este n contextul discursului, descrierile se pot referi si la elemente
ale sale. Multe exemple folosesc cuvinte specice care semnaleaza aceasta com-
portare.
De exemplu, cuvantul unul poate semnul unei referiri indirecte la o mult ime;
astfel, n discursul:
5a. La turneu, un junior a jucat cu trei mari maestri.
5b. Cel put in pe unul l-a nvins.
5b. I-a nvins pe tot i nafara de unul.
O reprezentare cat mai completa a lui unul poate obt inut a daca translatam
aceasta referire n
x : x PROSET
unde PROSET este determinat referent ial.
In 5b antecedentul va mult imea
marilor maestri cu care a jucat juniorul n turneu; sa o notam MAESTRU1. Atunci
forma pentru 5b care realizeaza o referire nedenita, este:
x : x MAESTRU1 .
INVINGE(x, JUNIOR1)
15.1. REFERINT E DEFINITE BAZATE PE MULT IMI 171
Referirea denita realizata n 5b este o referire de forma:
!x : x MAESTRU1 &
INVINGE(x, JUNIOR1).
Se pot imagina si exemple mai complexe, n care nu exista nici o modalitate ex-
plicita de semnalare cand este denita contextual referint a printr-o mult ime. Astfel:
6a. Silviu a utilizat n drumul lui doua mijloace de transport.
6b. Calatoria cu avionul i-a placut mai mult.
Intre propozit ii, totusi, acesti cuanticatori evoca o mult ime ca entitate a dis-
cursului; de exemplu:
7a.
In parc, ecare baiat
i
a vazut-o pe Sanda.
7b. * El
i
s-a suparat pe ea.
7b. Ei
i
s-au suparat pe ea.
De remarcat ca El din 7b nu se poate referi la unul din baiet ii introdusi n
universul cunoasterii de 7a; acest lucru este posibil cu Ei din 7b
. Asa ca entitatea
discursului evocata de 7a este mult imea
{x|B
AIAT(x) &
IN(x, PARC1)}.
Aceste expresii substantivale folosesc adesea o referint a denita implicit la o
mult ime care limiteaza domeniul cuanticatorului. De exemplu, entitatea discursu-
lui generata pentru Fiecare fata din propozit ia
Fiecare fata a vazut-o pe Laura.
luata izolat (fara context) va un element din mult imea {x|FAT
A(x)}. Aceasta
este ns a o interpretare foarte dicil de utilizat, deoarece ea exprima ideea ca orice
persoana din lume care este fata a vazut-o pe Laura. Sa luam ns a discursul:
8a. Mai multe fete s-au dus la petrecere.
8b. Fiecare fata a vazut-o pe Laura.
172 PRELEGEREA 15. PROPOZIT II ELIPTICE SI ANAFOR
A
Cand se prelucreaza 8a, expresia Mai multe fete va crea o constanta - sa o numim
F1 - care reprezinta aceasta mult ime de fete. Cu F1 folosit drept context local
pentru propozit ia 8b, interpretarea lui Fiecare fata poate privit ca un element din
F1; forma logica (translatarea) lui 8b va f : f F1 . V EDE1(f, Laura1).
Aceasta analiza trateaza expresia substantivala
ecare fata ca o parafraza pentru ecare din fetele
si
orice fata ca oricare din fetele.
Mult imea fetelor trebuie determinata referent ial si este folosita apoi ca domeniu
pentru cuanticator.
In alte situat ii, mult imea este denita folosind referint a indirecta.
Exemplul 15.1 Sa consideram 8b n contextul creat de propozit ia
Mai mult i baiet i si fete s-au dus la petrecere.
Aici entitatea BF1 a fost creata pentru mult imea baiet ilor si fetelor, cu pro-
prietatea ca s-au dus la petrecere.
In acest caz, domeniul este generat printr-o
intersect ie, ca la 1b. Translatarea lui 8b va n acest caz:
!F3 : F3 = {x|FAT
Intai Nelu1 va scos din forma semantic a abstracta a primei clauze, obt inandu-se
(n termeni de -calcul - pentru detalii, a se vedea [3]):
p V EDE1(p, FILM24).
Aceasta forma este aplicata apoi noii informat ii, anume interpretarea lui Cici
pentru a produce forma semantic a a clauzei eliptice:
V EDE(Cici1, FILM24).
Tehnica exemplicata anterior lucreaza si pentru cazuri mai complexe. Astfel,
un exemplu clasic n literatura (numit problema identitat ii colaterale) foloseste dis-
cursuri voit ambigui, cum ar :
11a. Mihai si-a sarutat sot ia.
11b. La fel si Sandu.
Propozit ia 11b poate nsemna faptul ca Sandu a sarutat sot ia lui Mihai (in-
terpretare numita citire colaterala) sau ca si-a sarutat propria sa sot ie. Structura
sintactic a va lucra ca mai sus si va gasi o corespondent a ntre Mihai si Sandu.
Sa presupunem ca forma semantic a a lui 11a este
S
A
S
ASIT1(Mioara1, Banane2)
Clauza eliptica: Dar pepene ?
Structura sintactica:
(S[inter] (DAR dar)
(NP pepene))
Aici, patternul init ial este
(V P[3s] NP1[nume] NP2[3s, plural]).
Aceasta structura sintactica a clauzei contextuale este instant iata cu constituien-
t ii care pot nlocuit i; singurul posibil ar pepene pe pozit ia NP2; dar nu se
verica coincident a de numar.
Se reia procedeul cedand informat ie, anume cu patternul
(V P[3s] NP1[nume] NP2[3s]).
Aici se gaseste o nlocuire posibila a expresiei banane cu pepene si se ajunge
la construct ia corecta
A gasit Mioara pepene ?
Daca si la acest pas nu s-ar reusit o construct ie corecta, se continua cu re-
laxarea condit iilor, ncercand patternul
(V P NP1[nume] NP2), apoi
(V P NP1[nume]) urmat de
(V P NP1), iar n nal
(V P).
Formele eliptice care constau din o secvent a de constituient i sunt mai complicate.
Sa considera m exemplul:
12a. A: A pus tata bananele pe masa ?
12b. B: Da.
12c. A: Si nghet ata n frigider ?
Interpretatea corecta a lui 12c va folosi doi constituient i independent i (n loc de
unul), anume NP nghet ata si PP n frigider (care este un complement al verbului a
pune). Cautarea completarii patternului se face pentru ecare constituient separat,
cu restrict ia pastrarii ordinii ntre ei.
176 PRELEGEREA 15. PROPOZIT II ELIPTICE SI ANAFOR
A
15.2.3 Preferint e semantice
Algoritmul discutat anterior nu identica totdeaunan mod unic fragmentele corecte.
Sa consideram ca exemplicare dialogul:
A: A pus tata nghet ata n frigider ?
B: Nu.
A: Dar friptura ?
A
parcurgand arborele sintactic al propozit iei precedente, pana se aa un cons-
tituient a carui structura corespunde cu structura cautat a, apoi se extrage
informat ia respectiva - pentru ca mpreun a cu informat ia curent a sa formeze
o expresie noua care poate analizata cu procedeele obisnuite si sa produca o
interpretare.
In aceasta sect iune, prin agent conversat ional vom nt elege o int a (sau ceva
similar) care poate participa la un dialog purtat n limbaj natural. Aplicat iile unei
astfel de construct ii sunt numeroase, plecand de la tipul de comunicare om - masina
care se doreste a se realiza n viitor, pan a la stabilirea subtilitat ilor caracteristice
unei limbi.
Primele ntrebari care se pun relativ la un agent conversat ional sunt:
De ce trebuie el sa vorbeasc a ?
Ce motiv are sa spuna orice sau sa ncerce sa nt eleaga ce i se spune ?
De exemplu, sa consideram o baza de date de tip ntrebare - raspuns realizata
printr-un program, care pentru ecare intrare executa urmatoarele operat ii:
1. Analizeaza si interpreteaza ntrebarea sub o forma logica reprezent and o cerin-
t a;
2. Executa cerint a folosind baza de date si genereaza o iesire.
Poate considerata aceasta un agent conversat ional ?
Raspunsul este negativ, deoarece ea nu va putea react iona pozitiv la nici o cerint a
care nu satisface regulile - foarte precise - de intrare; nici o alta formulare antreb arii,
oricat de apropiata de cea folosita de program, nu este acceptata.
In plus, ea nu
este capabila de nici o comportare independent a care sa poata primi calicativul de
inteligenta.
Ce tras aturi trebuie sa aibansa un agent pentru a putea calicat cu inteligen-
t a ? Credem ca cele mai specice sunt:
Percept ii: agentul trebuie sa e capabil sa perceapa lumea din jurul sau;
Cunostint e: agentul trebuie sa aiba o reprezentare constienta a starii univer-
sului n care este ncorporat
1
;
1
prin aceasta denire se va nt elege ceea ce crede agentul ca este adevarat
179
180 PRELEGEREA 16. AGENT CONVERSAT IONAL
Dorint e: agentul trebuie sa aiba raspunsuri (pozitive sau negative) la diverse
stari ale universului, dispunand de un mod de a le compara;
Planicare/rat ionament: trebuie sa e capabil sa rat ioneze asupra cailor de a
atinge alte stari;
Strategii: agentul trebuie sa aiba capacitatea de a decide act iuni pentru schim-
barea starii universului;
Intent ii: trebuie sa poata ment ine strategia act iunii decise;
Act iuni: agentul trebuie sa e capabil sa act ioneze si deci sa-si schimbe starea.
Un agent conversat ional traieste ntr-un univers al limbajului si logicii. Singurele
sale percept ii sunt armat iile care i se adreseaza, iar singurele act iuni sunt armat iile
pe care le genereaza.
Din cele sapte aspecte ale comportarii inteligente ment ionate anterior, patru -
percept ii, planicari, strategii, act iuni sunt procese, iar celelalte trei - cunostint e,
dorint e, intent ii, sunt componente ale starii cognitive ale agentului.
Un model pentru un agent inteligent este dat n Figura 16.1
Figura 16.1:
Cunostint e
Dorint e
Intent ii
-
-
? -
-
6
-
-
6
?
Percept ii
Planicare
Strategii
Act iuni
Se observa de aici ca agentul si actualizeaza permanent cunostint ele bazate
pe percept ii, foloseste aceste cunostint e pentru a rat iona relativ la posibile strategii
pentru a-si planica anumite intent ii bazate pe cunostint ele si dorint ele sale, intent ii
pe care le realizeaza prin act iuni.
Pentru a aplica un astfel de model la limbaje, trebuie precizata not iunea de
armat ie.
Denit ia 16.1
In limbaj natural, o armat ie este un act de vorbire; prezent a ei
este fundamentala n dezvoltarea agentului conversat ional.
Actele de vorbire sunt precizate prin anumite verbe, cum ar a ntreba, a cere,
a informa, a nega, a mult umi, a felicita, a conrma etc.
16.1.1 Limbajul ca activitate multi-agent
Limbajul foloseste totdeauna mai mult i agent i. Alte forme de comunicare - cum ar
scrisul - fac doar o extensie n timp a comunicarii. Orice persoana comunic a cu
16.1. CE ESTE UN AGENT CONVERSAT IONAL 181
scopul nal de a afecta starea cognitiva a celorlalt i. Monologul nu constituie un
agent conversat ional.
In plus, comunicarea nu poate apare daca unul din agent i nu percepe ncercarea
celuilalt de a comunica.
Exemplul 16.1 Sa presupunem ca Ion si Ana sunt amant i si pun la punct o schema
n care Ion o poate vizita pe Ana numai daca aceasta lasa fereastra deschisa. Astfel,
fereastra constituie un mijloc de comunicare ntre cei doi.
Intr-o zi, ind foarte cald, Ana deschide fereastra pentru a se racori; Ion intra
ind sigur ca acesta este semnalul convenit. Nu mai spunem ce se ntampla.
Alta data, desi este cald, Ana deschide fereastra pentru a-l anunt a pe Ion ca poate
veni. Dar acesta nu intra, convins ca deschiderea ferestrei s-a facut doar pentru a
racori camera.
Ambele cazuri sunt situat ii n care ecare din parteneri nu recunoaste intent ia
de comunicare a celuilalt.
Deci, o comunicare poate apare numai atunci cand un agent intent ioneaza sa trans-
mita ceva, iar celalalt agent recunoaste aceasta intent ie.
O alta cerint a pentru comunicare este existent a unui set de convent ii cunoscut
de tot i agent ii, cu semnicat ii neambigui.
Intr-un astfel de model, inferent a este data relativ la un spat iu. De exemplu, n
raport cu BS2, putem trage concluzia ca Dick poarta zgarda, deci Ion crede ca
Ana crede caDick poarta zgarda.
O astfel de concluzie nu poate trasa n spat iul BS1: Ion nu crede ca Dick
poarta zgarda.
Denit ia 16.2 Propozit iile listate n spat iul de cunostint e ale unui agent formeaza
cunostint ele explicite ale agentului.
Propozit iile care pot derivate prin inferent e formeaza cunostint ele implicite
ale agentului.
Exista o distinct ie neta ntre ce crede un agent si ce crede acel agent ca alt i agent i
cred. Aceasta se reliefeaza clar cand asistam la o conversat ie ntre doua persoane
cu vederi diferite.
De exemplu, sa presupunem ca Ana crede ca o carte Zece negri mititei, este pe
biroul lui Ion, dar crede ca Ion crede ca aceasta carte este n biblioteca. Daca Ana
ntreaba:
Ai citit cartea de pe birou ?
ea se va referi la Zece negri mititei, indiferent ce va spune Ion despre carte.
Deci, cunostint ele unui agent relativ la cunostint ele altui agent joaca un rol
important n nt elegerea oricarui limbaj.
Problema care apare este cat de adanc trebuie iterat nivelul de cunostint e pentru
a nt elege toate limbajele.
Exemplul 16.3 Sa presupunem ca Ion crede ca Ana l-a mint it cand i-a spus ca
ploua.
In acest caz, Ion va crede urmatoarele:
Nu ploua.
Ana crede ca nu ploua.
Ana crede ca Ion crede ca ploua.
Amandoi cred ca nu ploua, dar Ion mai crede ca Ana crede ca el se gandeste ca
ploua, pentru ca el crede ca ea crede ca minciuna ei a fost crezuta.
184 PRELEGEREA 16. AGENT CONVERSAT IONAL
In general, dorint ele reecta starile universului pe care un agent le gaseste placute
sau neplacute. Un agent poate avea mai multe dorint e, adesea aate n conict unele
cu altele.
De exemplu, vrei sa ai cateva zile libere si sa mergi la munte. Pe de-alta parte,
ai un examen si doresti sa iei o nota buna, deci vei sta acasa pentru a nvat a. Aceste
doua dorint e intr a n conict si comportarea va rezulta printr-un compromis care sa
mpace si capra si varza.
Intent iile ns a nu vor niciodata n conict. Nu pot i niciodata sa intent ionezi
sa mergi la munte pentru recreere si sa stai sa nvet i. Intent iile sunt legate puternic
de comportare si nu sunt posibile doua act iuni n acelasi timp.
Exista doua not iuni ale termenului intent ie.
Prima - intent ia act iunii - se refera la proprietatea unei act iuni intent ionate.
De exemplu, se da o mare important a diferent ei ntre o alergare fara t inta, facuta
numai de dragul de a alerga, si o alergare efectuata pentru a ajungentr-un loc precis.
A doua este numit a direct ia viitoarei intent ii, si reecta deciziile care vor luate
pentru viitoarea act iune.
De exemplu, daca dupa o anumit a deliberare ai decis ca este mai important sa
lasi de-o parte pregatirea pentru examen si sa mergi la munte, asta nseamn a ca ai
adoptat o direct ie a viitoarei decizii: destinderea la munte.
Desi pe baza unei direct ii a viitoarei intent ii se ajunge la o act iune intent ionata,
nu ntotdeauna o astfel de intent ie este si realizata. De exemplu, dupa ce ai decis
ca mergi la munte, descoperi ca nu ai cu cine, ca tot i prietenii nvat a, te apuca un
val de remuscari si revii sa nvet i. Nu este binent eles un scenariu agreabil, dar este
pe deplin posibil.
In prima descriere, a avea un plan semnica una din direct iile viitoarelor intent ii, n
timp ce n a doua descriere, a avea un plan nseamna n principiu ca Ion stie cum
sa jefuiasca o banca. Aici deci, un plan reprezinta un set de act iuni care conduc la
un anumit efect (ca o ret et a). A avea o ret eta nu nseamna neaparat ca exista o
intent ie.
In Figura 16.3 sunt reprezentate cunostint ele lui Ion despre plan si structura
intent ionala pentru adoptarea lui.
Figura 16.3:
Cred(Ion1, Intentie(Ion1, IaTren(Ion1))&
Genera(IaTren(Ion1), Intentie(Ion1, MergeMunte(Ion1))&
MergeMunte(Ion1))) Intentie(Ion1, Genera(IaTren(Ion1),
MergeMunte(Ion1)))
Stiind un plan de mers la munte Intent ia de a merge la munte
De remarcat ca intent iile trebuie sa includa atat act iunile cat si relat iile dintre
act iuni. De exemplu:
16.4. ACTELE DE VORBIRE CA ACTE COMUNICATIVE 187
Daca se omite act iunea IaTren, atunci Ion va dori sa mearga la munte dar
nu va avea un plan cum sa ajunga acolo.
Daca se omite act iunea MergeMunte, Ion va intent iona sa ia trenul, dar nu
necesar pentru a merge la munte.
Daca se omite relat ia Genera, atunci Ion poate efectua independent ecare
act iune (poate merge cu trenul, apoi poate sa ajunga la munte cu o masina).
Este interesant faptul ca intent iile se pot exprima n funct ie de act iuni. Pollack
(1990) a introdus un operator Cu astfel:
Fiind date act iunile , , Cu(, ) este act iunea de efectuare a lui facand .
Atunci, a treia intent ie din Figura 16.3 va
Intentie(Ion1,Cu(MergeMunte(Ion1), IaTren(Ion1)))
16.4 Actele de vorbire ca acte comunicative
Dupa cum am vazut, actele de vorbire sunt act iuni realizate prin procesul emiterii
de sunete. Ele vizeaza doar doua tipuri de acte: cele ilocut ionare si perlocut ionare.
Din puncte de vedere ilocut ionar, se pare ca sunt cinci tipuri (clase) de acte de
vorbire. Fiecare act iune din clasa este specicata ulterior prin condit ii suplimentare.
Cele cinci clase sunt:
1. Clasa reprezentativa: vorbirea este orientat a pentru a sublinia adevarul
armat iilor prezentate. Aici intra acte descrise de verbe ca a informa, a nega,
a arma, a conrma;
2. Clasa directiva: vorbirea ncearc a sa inuent eze intent iile si comportarea
altui agent. Sunt incluse act iunile descrise de verbe ca a cere, a comanda, a
ruga, a invita, a ntreba;
3. Clasa orientativa: vorbitorul se refera la act iuni viitoare, cum ar cele
descrise de a promite, a comite;
4. Clasa expresiva: vorbitorul exprima o stare psihologica sau o react ie; aici
intr a verbe ca a felicita, a mult umi, a slavi, a mult umi, a ura;
5. Clasa declarativa: vorbitorul realizeaza anumite convent ii sau act iuni ritu-
ale. Exemple caracteristice sunt a da foc, a se ruga, a se resemna.
Se pare ns a ca datorita restrict iilor modelului impuse de planicare, actele perlo-
cut ionare capata o important a deosebita; motivul este ca acestea prind efectele
intent iilor pe care le exprima agent ii prin vorbire.
Exemplul 16.5 Un agent vrea sa construiasca un plan prin care sa convinga un alt
agent ca un anumit fapt este adevarat, sau ca celalalt agent sa realizeze o anumita
act iune. Pentru aceasta, agentul va construi un act ilocut ionar (din clasa reprezen-
tativa sau din cea directiva) si spera ca celalalt agent sa react ioneze dupa asteptari,
188 PRELEGEREA 16. AGENT CONVERSAT IONAL
nalizand actul perlocut ionar. Evident, pentru construirea actului ilocut ionar, agen-
tul va init ia un act locut ionar care va folosit la momentul potrivit prin exprimarea
unei propozit ii.
Modelul dezvoltat aici foloseste actele comunicative, care corespund actelor perlocu-
t ionare generate de actele ilocut ionare.
De exemplu, actul comunicativ ConvingePrinInformare convinge alt agent sa
creada anumite propozit ii, spunand ca sunt adevarate.
Figura 16.4: Denirea a doua acte comunicative
Clasa de act iune : ConvingePrinInformare
Roluri : Vorbitor, Auditor, Prop
Restrict ii : Agent(Vorbitor), Agent(Auditor),
Propozit ie(Prop), Cred(Vorbitor, Prop)
Precondit ii : La(Vorbitor), Loc(Auditor))
Efecte : Cred(Auditor), Prop)
In Figura 16.4 sunt reprezentate denit iile a doua acte comunicative de baza n
orice model de comunicare: informare simpla (clasa reprezentativ a) si cerere (clasa
directiva).
Aceste act iuni sunt construite n ipoteza ca agent ii sunt sinceri. De exem-
plu, o restrict ie a actului ConvingePrin Informare este aceea ca vorbitorul crede
n propozit ia pe care o enunt a.
16.5 Actul comunicativ si recunoasterea inten-
t iilor
Far a abilitatea de a recunoaste intent iile agentului partener, act iunile unui agent vor
extrem de dicile.
In particular, va imposibil de nt eles si act ionat ntr-un dialog.
De aceea va trebui sa luam put in n considerare aceasta problema de recunoastere
a intent iilor si cum leaga ea vorbirea de actul de interpretare.
In dialog exista totdeauna un agent care realizeaza act iunea (agent activ) si un
agent care observa act iunea (agent observator). Ceea ce vom discuta aici este modul
n care agentul observator recunoaste intent iile agentului activ.
In primul rand, faptul ca s-a identicat un plan care include toate act iunile
observate nu nseamn a ca acel plan descrie intent iile agentului. Pot mai multe
planuri posibile care cont in act iunile observate, iar agentul activ realizeaza doar
unul din ele. Determinarea exacta a planului corect pare imposibila teoretic.
Dupa cum s-a ment ionat anterior, planul recunoscut trebuie sa e plauzibil, desi
din punctul de vedere al agentului observator poate parea inecient sau gresit. Prac-
tic, aceasta nseamn a ca recunoasterea unui plan se bazeaza numai pe cunostint ele
comune, la care se pot adauga eventual unele informat ii (daca se cunosc) despre
cunostint ele celuilalt agent.
Exemplul 16.7 Sa presupunem ca Radu are o camera a carei usa se deschide nu-
mai pe baza amprentelor mainii sale; Sandu crede ca la camera lui Radu este o
broasca simpla, cu cheie. Cunostint ele lor comune cuprind informat ia ca usa tre-
buie descuiata pentru a intra n camera, informat ii despre efecte ale diverselor acte
comunicative si despre situat ia curenta. Amandoi stiu - de exemplu - ca pentru a in-
tra n camera lui Radu, Sandu trebuie sa i ceara permisiunea lui Radu, si ca acesta
i-o va da (n mod normal).
In aceste condit ii, ce va nt elege Radu din ntrebarea lui
Sandu:
190 PRELEGEREA 16. AGENT CONVERSAT IONAL
Pot i sa-mi dai cheia de la camera ta ?
Sarind peste detalii (cum identica Radu acest act locut ionar ca o cerere pentru
cheie), el poate infera un plan plauzibil n jurul acestei act iuni, astfel:
Armat ia este identicata ca o componenta a act iunii:
MotivatDeCerere(Sandu1, Radu1, Da(Radu1, Sandu1, Cheie(Broasca1)))
Folosind cunostint ele comune despre actele de comunicare, Radu stie ca Andrei
crede ca un efect al acestui act este
Intent ie(Radu1, Da(Radu1, Andrei1, Cheie(Brioasca1)))
care la randul ei, folosind informat ia comuna despre intent ie, va motiva act iunea
Da(Radu1, Andrei1, Cheie(Broasca1))
Cunostint ele comune despre relat iile dintre Radu si Sandu conduc la concluzia
Avea(Sandu1, Cheie(Broasca1))
Aici, Radu crede ca Sandu - crezand ca la usa este o broasca cu cheie - va realiza
act iunea
Deschide(Sandu1, Broasca1)
Radu concluzioneaza ca aceasta act iune este intent ia lui Sandu cand a cerut
cheia.
In ideea ca acesta pare singurul plan plauzibil, Radu presupune ca a denit
structura intent ionala a lui Sandu. Intent iile primare pe care le atribuie Radu lui
Sandu n acest plan sunt:
Intent ie(Sandu1, MotivatDeCerere(Sandu1, Radu1,
Da(Radu1, Sandu1, Cheie(Broasca1))))
Intent ie(Sandu1, Realiza(Avea(Sandu1, Cheie(Broasca1))))
Intent ie(Sandu1, Deschide(Sandu1, Broasca1))
In acest caz, apare problema modului n care un agent recunoaste intent iile altui
agent din spusele acestuia.
16.6. RECUNOASTEREA ACTELOR ILOCUT IONARE 191
Cea mai uzuala solut ie la aceasta problema este bazata pe ipoteza nt elesului
literal. Ea presupune ca orice propozit ie are un nt eles bazat numai pe convent iile
limbajului. Astfel, exemplul de sus are urmatorul nt eles literal: propozit ia este o
ntrebare cu raspuns Da/Nu n care ascultatorul este chestionat daca stie cat este
ceasul.
Acesta este numit actul de vorbire de suprafat a si este dat de modul sintac-
tic al propozit iei (aici, o propozit ie interogativ a). Fiind dat nt elesul literal, actul
intent ional de vorbire este derivat printr-un proces de inferent a, cum ar cel de
recunoastere a planurilor.
Sunt doua moduri de a privi actul de vorbire de suprafat a.
In prima variant a,
acesta este un act ilocut ionar - care poate uneori gresit.
Astfel, pentru a pune n mod sincer o ntrebare, vorbitorul trebuie sa vrea sa stie
raspunsul.
Exemplul 16.8 Sa consideram o situat ie n care Elena stie ca Paul are probleme
cu timpul, si spune (ca o oferta pentru ajutor):
Stii cat este ceasul ?
Actul de vorbire de suprafat a este o ntrebare cu raspuns dicotomic daca Paul stie
cat este ora; el este ilocut ionar gresit deoarece Elena nu este interesata de raspuns.
Deduct ia ca actul de vorbire de suprafat a este gresit, init iaza cautarea pentru actul
intent ional de vorbire. Din pacate nu este sucient ca actul de suprafat a sa e gresit
pentru a ca propozit ia sa aiba un nt eles ascuns. Astfel, n exemplul de sus, Elena
poate sa nu stie daca Paul stie cat este ceasul, si ntrebarea ei are doua scopuri -
acela de a primi un raspuns, dar si cel referitor la faptul ca ea se ofera sa l ajute pe
Paul.
In aplicat ii mai generale ale dialogului, planicarea nivelului discursului devine im-
portanta din alte motive. Daca utilizatorul este abilitat sa controleze uxul dia-
logului, atunci sistemul va trebui sa e poata recunoaste ce face acest utilizator.
De exemplu, el trebuie sa recunoasca momentul cand utilizatorul schimb a subiectul
conversat iei si sa e capabil sa discute despre noul subiect. Similar, el trebuie sa
e apt sa recunoasca cand utilizatorul cere informat ii suplimentare despre anumite
aspecte ale dialogului precedent.