Professional Documents
Culture Documents
Maria Husarciuc
Diana-Maria Trandab
Introducere
FrameNet = o resurs lexical on-line
Terminologie
Unitate lexical = asocierea unui sens unui
nivele de adnotare
Funcii gramaticale
Funciile gramaticale folosite sunt:
External Argument (Ext) pentru verbe, adjective,
prepoziii, substantive;
Object (Obj) pentru verbe, prepoziii;
Complement (Comp) verbe, adjective, substantive;
Modifier (Mod) verbe, adjective, substantive;
Head noun modified by attributive adjective (Head)
pentru adjective;
Genitive determiner (Gen) pentru substantive;
Appositive (Appos) pentru substantive.
Adnotarea corpusului
Corpusul principal folosit de FrameNet este
British National Corpus (BNC), coninnd
100.000.000 cuvinte.
Adnotarea corpusului se realizeaz, cu
ajutorul unui software propriu, n dou
etape:
- adnotarea semantic (cu ajutorul unui
software numit "Annotate);
- adnotarea sintactic, prin care se
adaug fiecrui grup sintactic funcia
gramatical (GF) i tipul grupului (PT)
Adnotarea corpusului
Propoziiile adnotate, n format XML,
sunt punctul de plecare pentru
descrierea unitilor lexicale.
Acest format faciliteaz cutarea
dup unitate lexical, dup frame,
dup un element dintr-un frame.
Adnotare - exemplu
REVENGE frame
Adnotare exemplu
Example sentence:
[His brothers Avenger] avenged [him
Injured_party].
With this, [El Cid Agent] at once avenged [the
death of his son Injury].
[Hook Avenger] tries to avenge [himself
Injured_party] [on Peter Pan Offender] [by
becoming a second and better father Punishment].
Principii generale n
adnotare
Fiecare grup dependent este adnotat conform celor trei nivele: FE, PT i GF
relativ la unitatea lexical LU.
vizat.
Propoziiile folosite n descrierea unei uniti lexicale LU sunt adnotate numai
relativ la acel LU.
Setul de propoziii adnotate pentru o unitate lexical dat este ales astfel nct
s reprezinte seria complet de posibiliti combinatorice pentru acea unitate
lexical.
Adnotarea verbelor
Adnotarea este mai uor de realizat atunci cnd sunt
exprimate n propoziie numai elementele de tip core
ale cadrului semantic (adic numai valenele
obligatorii ale elementului predicativ).
Elementele de tip non-core reprezint valene
facultative ale elementului predicativ situat n centrul
cadrului semantic. Aceste roluri nu sunt strict
necesare exprimrii, n sensul c nu caracterizeaz n
mod unic cadrul respectiv. Astfel, pentru majoritatea
cadrelor ce indic evenimente sau procese, rolurile
temporale i spaiale nu sunt eseniale, din acest
motiv nefiind ntotdeauna adnotate.
Adnotarea verbelor
Diferitele tipuri de informaie
semnificativ sunt nregistrate pe nivele
de adnotare separate. Aceast separare pe
nivele face posibil reprezentarea unor
situaii complexe, cum ar fi situaia n care
un constituent care reprezint un element
al cadrului este inclus ntr-un alt
constituent cu alt rol semantic.
Adnotarea substantivelor
Tipuri de substantive:
Substantive care denot evenimente,
precum withdrawal sau replacement;
Substantive relaionale, precum
brother sau girlfriend;
Substantive artifact, precum house
sau vest;
Exemplu
The Americans must have felt as if he was taking
revenge on them for what had happened.
King Menephta took awful revenge on the Libyan
army.
n ambele exemple, este evident c se raporteaz
un fapt de rzbunare i nu unul de luare, dei este
folosit verbul take. Cadrul sugerat de substantivul
revenge este dominant, astfel fiind necesar
adnotarea substantivului ca fiind legat de cadrul
verbului. Multe din aspectele discutate anterior
pentru verb se aplic adnotrii substantivelor,
totui aceast iniiativ a ridicat i unele probleme.
Expresii suport
Dup cum s-a vzut n exemplul precedent, cadrul
dominat este determinat de substantivul revenge i nu de
verbul take. Astfel de verbe sunt tratate separat sub
denumirea de support verbs. Intuiia din spatele acestei
manevre este c verbele suport nu introduc nici un fel de
semantic. Verbele suport sunt astfel definite ca fiind
acele verbe care se combin cu un substantiv de stare sau
de eveniment pentru a crea un predicat verbal, permind
argumentelor verbului s fie roluri n cadrul evocat de
substantiv. n exemplu discutat, subiectul verbului take are
rolul de Rzbuntor, chiar dac cadrul verbului nu implic
singur acest rol.
Dimpotriv, n exemplul urmtor, verbul encouraged
modific semnificativ sensul propoziiei.
The Prime Minister encouraged revenge against
Absurdistan.
Expresii suport
n concordan cu statutul lor de argumente
sintactice ale substantivelor, expresiile suport nu
sunt elemente ale cadrului semantic. Sunt adnotate
pe rndul NOUN i nici nu au funcie gramatical,
nici nu sunt asignate unui grup sintactic.
De exemplu:
1. John is a sailor.
2. Smithers is the vice-president of the armchair division.
Adnotarea adjectivelor
i adjectivele pot evoca cadre. Unele cadre semantice
precum cele legate de emoii conin un numr semnificativ
de uniti lexicale adjectivale.
Adjectivele atributive vs. predicative.
Adjectivele atributive modific substantivele.
Adjectivele predicative accept n general drept complement
acelai tip de fraze ca verbele sau substantivele:
propoziii finale : Jo is happy that he passed
Infinitivale:
Jo is eager to finish
Gerundivale:
Jo is busy writing
Preposiionale: Jo is curious about the new student
Adverbiale:
Jo is not in the least disappointed
etc.
Totui adectivele predicative nu pot avea complement direct, cu
excepia adjectivului worth (de exemplu n It's not worth the
trouble).
Adnotarea adjectivelor
Cnd
adjectivele
sunt
folosite
predicativ,
adnotarea verbelor precum be se realizeaz la fel
ca n cazul verbului take, ca verbe suport. Se
observ c n cazul adjectivelor, spre deosebire de
substantive, nu se poate specifica modul de
folosire, deoarece adjectivele nu sunt refereniale.
Verbele copulative ce apar mpreun cu
substantivele sunt adnotate ca fiind verbe suport
indiferent de poziia fa de verb.
Smithers [is Supp] very clever but he's no
Einstein. Clever though he may [be Supp],
Smithers is no Einstein.
Concluzii
Cine va folosi aceast imens baz de date?
1. Cercettori din domeniul NLP ce lucreaz pe aplicaii ale
limbajului natural ce includ:
word sense disambiguation: FrameNet ofer informaii
sintactice i referitoare la colocaii care permit de multe ori
asocierea sensului corect;
machine translation: FrameNets pentru diferite limbi va
scoate la iveal diferene inter-lingvistice n ceea ce
privete nelesul i comportamentul gramatical al
cuvintelor ce aparin unor cadre.
information extraction: Adnotrile din FrameNet ofer o
mare precizie ce poate fi folosit la construirea tiparelor
pentru extragerea informaiilor.
question answering: Datele din FrameNet vor facilita
recunoaterea relaiilor cadrelor semantice ce exist ntre
limbajul ntrebrii i cel al documentului n care se caut
rspunsul.
Concluzii
2. Lexicografii care ncearc realizarea unei noi intrri n
dicionare sau revizuirea unei intrri dea existente vor aprecia:
O caracterizare complet a gramaticii cuvntului i a
posibilitilor sale de combinare , cu exemple din corpusuri
pentru a le arta folosirea autentic.
O tehnic de analiz a corpusului, bazat pe cadre semantice
i pe capacitatea lor de a identifica faptele relevante din punct
de vedere lexicografic n contextul propoziiilor din corpus.
3. Profesori de limbi i cei care vor s nvee o limb strin la
nivel avansat vor descoperi c lexiconul FrameNetului ofer
un complement pentru informaia redus din dicionarele
convenionale:
Un sumar al potenialului sintactic i semantic al unui cuvnt
cu ilustrri autentice, ceea ce formeaz o baz ideal pentru
crearea materialului didactic, precum i a exerciiilor.
Exemple reale ale folosirii unui cuvnt n context, care explic
cum sunt formate frazele.
V mulumim!