You are on page 1of 27

FrameNet

Maria Husarciuc
Diana-Maria Trandab

Introducere
FrameNet = o resurs lexical on-line

pentru limba englez, bazat pe cadre


semantice (frame semantics).
Scop: inventarierea posibilitilor
combinatorii semantice i sintactice
(valene) ale fiecrui cuvnt cu toate
sensurile sale.
S-a folosit adnotarea manual a
propoziiilor i organizarea automat a
rezultatelor acestei adnotri.

Baza de date FrameNet


Dimensiuni:
mai 2001 (lexiconul disponibil iniial): ~2.000
itemi verbe, substantive i adjective
reprezentativi pentru diferite domenii lexicale .
Analiza s-a realizat pe aproximativ 40.000 de
propoziii adnotate;
2002: aproximativ 6.000 uniti lexicale i
130.000 propoziii adnotate
2003: nc 1.500 uniti lexicale noi + noi
propoziii adnotate + reanalizarea unor frame-uri

Baza de date FrameNet


Baza de date FrameNet servete ca:
- DICIONAR: sunt incluse definiii (preluate din
the Concise Oxford Dictionary, 10th Edition sau
scrise de membrii echipei FrameNet), exemple
adnotate din corpus, precum i un index
alfabetic (pe uniti lexicale i pe cadre
semantice)
- TEZAUR: exist linkuri de la cuvinte spre cadrele
semantice din care ele fac parte, precum i spre
alte cuvinte care evoc acele cadre; exist, de
asemenea, legturi ntre cadre semantice diferite

Terminologie
Unitate lexical = asocierea unui sens unui

cuvnt, fiecare sens al unui cuvnt polisemantic


aparinnd unui cadru semantic diferit;
Cadru semantic (frame)= o structur de inferene
care caracterizeaz un anumit tip de situaie, obiect
sau eveniment; o structur semantic tripartit,
cuprinznd:
un rol semantic (frame element FE - say, Patient);
o funcie gramatical (grammatical function GF - say,
Object);
un grup sintactic (phrase type PT - say, NP)
=> 3

nivele de adnotare

Exemple de roluri semantice

Funcii gramaticale
Funciile gramaticale folosite sunt:
External Argument (Ext) pentru verbe, adjective,

prepoziii, substantive;
Object (Obj) pentru verbe, prepoziii;
Complement (Comp) verbe, adjective, substantive;
Modifier (Mod) verbe, adjective, substantive;
Head noun modified by attributive adjective (Head)
pentru adjective;
Genitive determiner (Gen) pentru substantive;
Appositive (Appos) pentru substantive.

Adnotarea corpusului
Corpusul principal folosit de FrameNet este
British National Corpus (BNC), coninnd
100.000.000 cuvinte.
Adnotarea corpusului se realizeaz, cu
ajutorul unui software propriu, n dou
etape:
- adnotarea semantic (cu ajutorul unui
software numit "Annotate);
- adnotarea sintactic, prin care se
adaug fiecrui grup sintactic funcia
gramatical (GF) i tipul grupului (PT)

Adnotarea corpusului
Propoziiile adnotate, n format XML,
sunt punctul de plecare pentru
descrierea unitilor lexicale.
Acest format faciliteaz cutarea
dup unitate lexical, dup frame,
dup un element dintr-un frame.

Adnotare - exemplu
REVENGE frame

Definition: An Avenger performs some Punishment on an Offender

as a response to an earlier action, the Injury, that was inflicted on


an Injured_party. The Avenger need not be identical to the
Injured_party but needs to consider the prior action of the
Offender a wrong. Importantly, the punishment of the Offender by
the Avenger is seen as justified by individual or group opinion
rather than by law.

Frame elements: Avenger, Punishment, Offender, Injury, and


Injured_party.

Lexical units: avenge.v, avenger.n, get even.v, retaliate.v,

retaliation.n, retribution.n, retributive.a, retributory.a, revenge.v,


revenge.n, revengeful.a, revenger.n, vengeance.n, vengeful.a , and
vindictive.a.

Adnotare exemplu
Example sentence:
[His brothers Avenger] avenged [him
Injured_party].
With this, [El Cid Agent] at once avenged [the
death of his son Injury].
[Hook Avenger] tries to avenge [himself
Injured_party] [on Peter Pan Offender] [by
becoming a second and better father Punishment].

Principii generale n
adnotare

Adnotarea FrameNet este ntotdeauna relativ la o anumit unitate lingvistic


(the target), care este n general un singur cuvnt, dar poate fi i o expresie
(verb frazal: give in sau idiom: take into account).

Sunt adnotai toi constituenii i nu numai cuvintele-head ale grupurilor

sintactice. => a se vedea exemplul III (prepoziia ON este inclus n grupul


sintactic dependent avnd rolul semantic Offender)

Fiecare grup dependent este adnotat conform celor trei nivele: FE, PT i GF
relativ la unitatea lexical LU.

Sunt adnonate propoziii ce constituie contexte pentru unitatea lexical LU

vizat.
Propoziiile folosite n descrierea unei uniti lexicale LU sunt adnotate numai
relativ la acel LU.

Setul de propoziii adnotate pentru o unitate lexical dat este ales astfel nct
s reprezinte seria complet de posibiliti combinatorice pentru acea unitate
lexical.

Adnotarea verbelor
Adnotarea este mai uor de realizat atunci cnd sunt
exprimate n propoziie numai elementele de tip core
ale cadrului semantic (adic numai valenele
obligatorii ale elementului predicativ).
Elementele de tip non-core reprezint valene
facultative ale elementului predicativ situat n centrul
cadrului semantic. Aceste roluri nu sunt strict
necesare exprimrii, n sensul c nu caracterizeaz n
mod unic cadrul respectiv. Astfel, pentru majoritatea
cadrelor ce indic evenimente sau procese, rolurile
temporale i spaiale nu sunt eseniale, din acest
motiv nefiind ntotdeauna adnotate.

Adnotarea verbelor
Diferitele tipuri de informaie
semnificativ sunt nregistrate pe nivele
de adnotare separate. Aceast separare pe
nivele face posibil reprezentarea unor
situaii complexe, cum ar fi situaia n care
un constituent care reprezint un element
al cadrului este inclus ntr-un alt
constituent cu alt rol semantic.

Adnotarea substantivelor
Tipuri de substantive:
Substantive care denot evenimente,
precum withdrawal sau replacement;
Substantive relaionale, precum
brother sau girlfriend;
Substantive artifact, precum house
sau vest;

Exemplu
The Americans must have felt as if he was taking
revenge on them for what had happened.
King Menephta took awful revenge on the Libyan
army.
n ambele exemple, este evident c se raporteaz
un fapt de rzbunare i nu unul de luare, dei este
folosit verbul take. Cadrul sugerat de substantivul
revenge este dominant, astfel fiind necesar
adnotarea substantivului ca fiind legat de cadrul
verbului. Multe din aspectele discutate anterior
pentru verb se aplic adnotrii substantivelor,
totui aceast iniiativ a ridicat i unele probleme.

Expresii suport
Dup cum s-a vzut n exemplul precedent, cadrul
dominat este determinat de substantivul revenge i nu de
verbul take. Astfel de verbe sunt tratate separat sub
denumirea de support verbs. Intuiia din spatele acestei
manevre este c verbele suport nu introduc nici un fel de
semantic. Verbele suport sunt astfel definite ca fiind
acele verbe care se combin cu un substantiv de stare sau
de eveniment pentru a crea un predicat verbal, permind
argumentelor verbului s fie roluri n cadrul evocat de
substantiv. n exemplu discutat, subiectul verbului take are
rolul de Rzbuntor, chiar dac cadrul verbului nu implic
singur acest rol.
Dimpotriv, n exemplul urmtor, verbul encouraged
modific semnificativ sensul propoziiei.
The Prime Minister encouraged revenge against
Absurdistan.

Expresii suport
n concordan cu statutul lor de argumente
sintactice ale substantivelor, expresiile suport nu
sunt elemente ale cadrului semantic. Sunt adnotate
pe rndul NOUN i nici nu au funcie gramatical,
nici nu sunt asignate unui grup sintactic.

Verbe auxiliare i propoziii


copulative
Denumirea de verb auxiliar este dat n general n englez
verbului be n context de forma NP1 V NP2.

De exemplu:

1. John is a sailor.
2. Smithers is the vice-president of the armchair division.

OBS: Prima utilizare a verbului este predicativ: proprietatea

de a fi marinar este atribuit lui John. A doua folosire a


verbului este ecuaionl: identitatea ntre Smithers i the vicepresident of the armchair division. n astfel de propoziii, NP1
i NP2 pot fi inversate, pstrndu-se sensul propoziiei, ceea
ce nu se poate n primul caz.
1. *A sailor is John.
2. The vice-president of the armchair division is Smithers.

Verbe auxiliare i propoziii


copulative
Unele substantive apar n propoziii ecuaionale n

care ce e la dreapta lui be exprim un rol semantic


al cadrului evocat de substantiv.

His decision is to leave the company.


To leave the company is his decision.
Pentru a se putea distinge ntre cele dou plasri ale
substantivului int, este numit be verb copulativ
doar atunci cnd urmeaz substantivul int. Cnd l
precede este numit verb suport, la fel ca n cazul
verbului take.
His decision [is Copula] to leave the company.
To leave the company [is Supp] his decision.

Verbe auxiliare i propoziii


copulative
Adnotarea verbului copulativ dup substantivul
understanding.

Adnotarea adjectivelor
i adjectivele pot evoca cadre. Unele cadre semantice
precum cele legate de emoii conin un numr semnificativ
de uniti lexicale adjectivale.
Adjectivele atributive vs. predicative.
Adjectivele atributive modific substantivele.
Adjectivele predicative accept n general drept complement
acelai tip de fraze ca verbele sau substantivele:
propoziii finale : Jo is happy that he passed
Infinitivale:
Jo is eager to finish
Gerundivale:
Jo is busy writing
Preposiionale: Jo is curious about the new student
Adverbiale:
Jo is not in the least disappointed
etc.
Totui adectivele predicative nu pot avea complement direct, cu
excepia adjectivului worth (de exemplu n It's not worth the
trouble).

Adnotarea adjectivelor
Cnd

adjectivele
sunt
folosite
predicativ,
adnotarea verbelor precum be se realizeaz la fel
ca n cazul verbului take, ca verbe suport. Se
observ c n cazul adjectivelor, spre deosebire de
substantive, nu se poate specifica modul de
folosire, deoarece adjectivele nu sunt refereniale.
Verbele copulative ce apar mpreun cu
substantivele sunt adnotate ca fiind verbe suport
indiferent de poziia fa de verb.
Smithers [is Supp] very clever but he's no
Einstein. Clever though he may [be Supp],
Smithers is no Einstein.

Concluzii
Cine va folosi aceast imens baz de date?
1. Cercettori din domeniul NLP ce lucreaz pe aplicaii ale
limbajului natural ce includ:
word sense disambiguation: FrameNet ofer informaii
sintactice i referitoare la colocaii care permit de multe ori
asocierea sensului corect;
machine translation: FrameNets pentru diferite limbi va
scoate la iveal diferene inter-lingvistice n ceea ce
privete nelesul i comportamentul gramatical al
cuvintelor ce aparin unor cadre.
information extraction: Adnotrile din FrameNet ofer o
mare precizie ce poate fi folosit la construirea tiparelor
pentru extragerea informaiilor.
question answering: Datele din FrameNet vor facilita
recunoaterea relaiilor cadrelor semantice ce exist ntre
limbajul ntrebrii i cel al documentului n care se caut
rspunsul.

Concluzii
2. Lexicografii care ncearc realizarea unei noi intrri n
dicionare sau revizuirea unei intrri dea existente vor aprecia:
O caracterizare complet a gramaticii cuvntului i a
posibilitilor sale de combinare , cu exemple din corpusuri
pentru a le arta folosirea autentic.
O tehnic de analiz a corpusului, bazat pe cadre semantice
i pe capacitatea lor de a identifica faptele relevante din punct
de vedere lexicografic n contextul propoziiilor din corpus.
3. Profesori de limbi i cei care vor s nvee o limb strin la
nivel avansat vor descoperi c lexiconul FrameNetului ofer
un complement pentru informaia redus din dicionarele
convenionale:
Un sumar al potenialului sintactic i semantic al unui cuvnt
cu ilustrri autentice, ceea ce formeaz o baz ideal pentru
crearea materialului didactic, precum i a exerciiilor.
Exemple reale ale folosirii unui cuvnt n context, care explic
cum sunt formate frazele.

V mulumim!

You might also like