Professional Documents
Culture Documents
1. Introduo
Este documento relata as opes de anotao do campo semntico do corpo humano nos corpora
do projeto AC/DC (http://www.linguateca.pt/ACDC, Costa et al., 2009, Santos, 2011).
A anotao do campo semntico do corpo humano motivada por dois principais interesses:
- como se descreve a aparncia fsica em portugus?
- quando usamos palavras do lxico do corpo, de que mais falamos (e que no o corpo)?
Quanto ao esquema e formato de anotao, procuramos nos alinhar ao tipo de anotao semntica
j em uso no AC/DC, com informao de grupos e de semas, conforme explicado no Arco-ris
(documentao do campo semntico das cores (Silva e Santos, 2012)), e no Guarda-Fatos (anotao
do campo semntico do vesturio (Santos, Silva e Mota, 2011)).
2. Questes tcnicas
A anotao do corpo comea com a criao de um lxico, onde listamos: Palavras do corpo
(palavras que denotam geralmente corpo humano), independentemente da classe gramatical:
http://www.linguateca.pt/acesso/corpos/corpo/corpo.txt
Expresses em que comparecem palavras do corpo, estejam elas se referindo ao corpo (cu da
boca; ma do rosto) ou no (dar o brao a torcer):
http://www.linguateca.pt/acesso/corpos/corpo/corpo_mwe.txt
Nas expresses, indicamos quais so as palavras do corpo com um [] depois da palavra em questo:
dor de cotovelo[]
fazer das tripas[] corao[]
Se a palavra do corpo for a primeira palavra da expresso, no fazemos nada:
barriga de aluguel
A seo 3 trata da anotao das palavras do corpo em expresses.
Para mais questes tcnicas referentes anotao do corpo humano, veja o Ortopedista
http://www.linguateca.pt/acesso/Ortopedista.html
Por outro lado, nas palavras do corpo igualmente usadas para pessoas e animais, deixamos
indicado se as ocorrncias esto associadas a animais ou pessoas:
par=FSP941006-806: A orelha do porco [sema="corpo:animal"], o rabo
[sema="corpo:animal"] do porco ou aquelas outras pequenas partes privadas do
porco que aparecem, de repente, escondidas no fundo da gloriosa gororoba de
nossa feijoada equivalem a um segmento da pirmide da mdia americana que
vive um rpido processo de crescimento.
PUBLICO-19951009-085: Foi com alguma alegria que a rapariga percebeu que
tinha preferido o rabo [sema="corpo"] do seu companheiro.
Ainda com relao ao grupo Interno, o interesse tambm est em perceber quando uma mesma
parte do corpo usada como parte interna ou externa. Por exemplo:
ela tinha a boca cheia de comida (interno)
ela tinha a boca cheia de baton (externo)
possvel tambm que uma mesma palavra pertena, simultaneamente, a mais de um grupo:
mandbula pertence aos grupos Cabea e a Osso;
patela pertence aos grupos Osso e Perna.
dedo pertence aos grupos Perna e Brao
Algumas partes do corpo esto no limite dos grupos propostos. Nesses casos, optamos por incluir
as palavras em todos os grupos possveis.
ombro: grupos Tronco e Brao
glteo: grupos Tronco e Perna
Tudo o que est no grupo Cabelo no se inclui no grupo Cabea. Assim, para procurar as duas
coisas, a procura deve ser [grupo="Cabelo|Cabea"]
Quando a palavra do corpo no usada em referncia a uma parte do corpo humano, podem-se
escolher entre, at o momento, 10 diferentes valores de sema.
[sema="corpo:sentimento"]
[sema="corpo:vegetal"]
[sema="corpo:partedeobjeto"]
[sema="corpo:lugar"]
[sema="corpo:doena"]
[sema="corpo:opinio"]
[sema="corpo:posicao"]
[sema="corpo:faculdade"]
[sema="corpo:animal"]
[sema="corpo:movimento"]
[sema="corpo:outros"]
sema=corpo:sentimento
notcia cai no corao
<p>: cantam a paixo pela moa, a dor de cotovelo, mais uma ou outra
homenagem Gonzago.
par=fut39774: Os matches que se assistem de corao apertado e n na
garganta.
sema=corpo:vegetal
Esta classe semntica indica palavras do corpo que se referem a vegetais:
Ento ela plantou um p de Jatob
A massa fresca total das folhas, dos galhos vivos e mortos, da casca e da
madeira do tronco das nove rvores foi determinada no campo
Esfregue o po com o outro dente de alho
sema=corpo:partedeobjeto
H situaes em que pode haver dvida entre a classificao como partedeobjeto ou lugar, como
em boca do rio, boca do caixa, boca do gol. Nesses casos, como boca entendido como
entrada, decidimos considerar lugar [sema=corpo:lugar].
H casos em que o contexto informar se estamos diante de parte_de_objeto ou lugar, ou se
ambos, como o caso abaixo:
Tinham aquelas armas de carregar pela boca e os garrotes onde se metiam
pregos e taxas
sema=corpo:lugar
Palavras do corpo usadas para fazer referncia a um lugar:
Bem no corao da floresta amaznica, a cidade realmente uma bolha.
Ele nasceu em So Pedro Alfa, ao p de Coimbra.
O seu nome de batismo deve-se ao fato de estar localizado na boca do rio
Riachuelo.
A sua localizao geogrfica fez com que os nativos a batizassem de Te
Pito o Te Henua, o umbigo do mundo
sema=corpo:doena
Palavras associadas a doenas que envolvem alguma palavra do corpo.
No vou a piscinas pblicas, mas no tenho medo do p de atleta
Ele tem p chato
sema=corpo:opinio
Palavras ou expresses com palavras do corpo que correspondem a maneiras de indicar uma
opinio, e que no tm relao com o corpo propriamente.
Ora acontecia que, defronte da tal casa, morava um barbeiro linguarudo,
como so em geral todos os barbeiros -- e apurado isso...
Hoje em dia todo mundo muito cabeudo e intelectual.
O filme um soco no estmago, pois mostra uma realidade de sofrimento e
violncia que beira o surreal.
O Oramento, ou melhor, a sua aprovao, deixou de ser uma dor de cabea.
e o Ministro Palocci, que tambm danou a noite inteira, revelou-se um
grande p de valsa
Por outro lado, as privatizaes andam mal das pernas
Vale notar que tambm podemos descrever a aparncia fsica de algum de maneira pejorativa, e
portanto indicando opinio: ele tem um narigo. Por enquanto, NO estamos tratando esses
casos. O que consideramos [sema=corpo:opinio] o uso de palavras do corpo para indicar coisas
no-corpo. Por isso a palavra bundo abaixo recebe [sema=corpo:opinio]. (No Brasil, bundo (ou
bunda mole) algum covarde.
Chamado de bundo pelo mesmo Qurcia, na campanha de 90, Covas agora promete
reagir em tom idntico, o que aumenta o risco de que a disputa deste ano atinja um
nvel de rs-do-cho, para dizer o menos.
J a palavra bundona, abaixo, no recebe qualquer tipo de marcao, uma vez que faz referncia
ao tamanho da bunda (parte do corpocovarde):
A idia de beleza no Brasil tem a ver com cabelo ` de escova ', decoto,
bundona.
sema=corpo:posio
O sema corpo:posio refere-se utilizao de palavras do lxico do corpo para indicar a situao
espacial de algo, no necessariamente do corpo humano. Corpo:posio atribudo sobretudo s
expresses de p/em p, quando do a ideia de erguer-se; diversos casos de de cabea no domnio
futebol, entre outros:
(a)
(b)
(c)
(d)
(e)
(f)
(g)
No atribumos [sema=corpo:posicao] a casos como (h)-(m), ainda que tambm, de maneira geral,
os exemplos indiquem posies do corpo humano:
(h)
Ele cruzou os braos[corpo]; sentou-se, cruzou as pernas[corpo] e
esperou
(i)
Ergueu os braos[corpo]
(j)
Ergueu os olhos[corpo] ao cu
(k)
Ergueu a cabea[corpo]
(l)
Ps a mo na cintura[corpo]
(m)
Levantou a cabea[corpo]
A opo pela distino se sustenta na ideia de que, nos exemplos h-m, a posio decorre da
associao entre os verbos (cruzar, erguer; colocar; pr etc) e as palavras do corpo. J nos
exemplos (a)-(g), a ideia de posio decorre da adio da palavra/expresso do corpo, e s. Esta
situao acontece em verbos como suplicar, aplaudir, mergulhar, dormir, esperar, cair, andar, em
geral com a palavra do corpo antecedida de preposio.
Dormir em p[sema=corpo:posicao]
sema=corpo:animal
Palavras do corpo humano usadas para referir ao corpo de animais:
Os moradores daqui esto a ser mandados embora e esto a fazer ali museus
com ossos de galinha que tm 300 anos ou 400 anos.
Especialmente com relao a rabo, notamos a diferena de uso entre as variantes brasileira e
portuguesa. Em Portugal, rabo parte do corpo humano; no Brasil, rabo parte do corpo de
animais (como pata e focinho), e pejorativamente associado ao corpo humano, sobretudo o
feminino.
Assim, em uma anotao sobre texto da variante BR, teramos:
o rabo do cachorro --> no anotado porque do tipo "a pata do cavalo"
sema=corpo:movimento
sema=corpo:outros
Nesses casos encontram-se as demais ocorrncias de palavras ou expresses que no fazem
referncia ao corpo, e que no esto se enquadram nas classificaes anteriores:
considerado o pulmo da cidade
barriga de aluguel
os teus textos mostram uma veia forte do pop
Na ocasio, aproveitou para puxar a orelha dos colegas que se querem mais do que
simples diretores.
3. COMO ANOTAR
3.1. Palavras simples:
Todas as palavras do corpo so anotadas conforme a intepretao da frase, em contexto. O valor
do atributo semntico ser atribudo da seguinte forma: [sema="tipo_de_sema"]
Espirra, di o corpo[sema="corpo"], a febre no vai embora
Para eles, a sociedade no tem ouvidos[sema="corpo:faculdade"] nem
olhos[sema="corpo:faculdade"]; tampouco tem
corao[sema="corpo:sentimento"]
pos=V
Diferentemente da anotao feita com as cores (Silva & Santos), no Esqueleto propomos que, nas
expresses EVPs, a marcao de sema seja acontea em dois nveis: na classificao das expresses
E na(s) palavra(s) do corpo.
Assim, em
A educadora tinha um n na garganta e vontade de chorar
A EVP n=na=garganta uma EVP do tipo corpo:sentimento. Mas a palavra garganta, nessa mesma
EVP, classificada como parte do corpo. Em
Se a criana apresenta p chato, o uso da palmilha no fez bem
p=chato uma EVP do tipo corpo:doena. Mas a palavra p, nessa mesma EVP, classificada
como parte do corpo. E em
Quem est de cabelo em p o zagueiro Joo Carlos
Cabelo=em=p uma EVP do tipo corpo:sentimento, mas, nessa EVP, temos ainda em=p como
uma EVP do tipo corpo:posicao e cabelo como parte do corpo.
A anotao feita da seguinte forma:
n=na=garganta[sema="corpo"] <evp sema="corpo:sentimento">
p[sema="corpo"]=chato <evp sema="corpo:doena">
cabelo[sema="corpo"]=em=p[sema="corpo:posicao"] <evp
sema="corpo:sentimento">
Uma palavra do corpo dentro de uma EVP tem tambm a informao de qual a anlise da
expresso toda, refletindo assim os dois nveis em que essa palavra do corpo tinha sido classificada:
a da expresso a que pertence, e a dela mesmo dentro da expresso. Com essa forma de marcao,
Para encontrar palavras de corpo que so por exemplo corpo no nvel baixo e corpo:outros no nvel
acima
[sema=".*corpo_.*" & sema=".*corpo:outrosEVP.*"]
As EVPs so codificadas tambm quanto aos seus lemas. O lema de falar pelos cotovelos
falar=por=o=cotovelo.
Nesses casos, consideramos o lema a forma cannica lembrar de cabea, mesmo que a
ocorrncia na frase no seja exatamente essa.
Eu no lembro disso de cabea evp sema=corpo:outros
cabea[sema=corpo:faculdade] [lema=lembrar de cabea]
Outras vezes, em que, aparentemente temos a mesma EVP com uma variao apenas na
preposio, como em
Foi pedir o apoio de Jos Eduardo de Andrade Vieira (PTB) e saiu com as mos
abanando.
Os humanistas, coitados, esto de mos abanando, sem assunto
inclumos a preposio no lema, e nesses casos como tivssemos dois lemas distintos:
de=mo=abanar
com=o=mo=abanar
Contra a existncia do Grupo Agresso, h o argumento de que a criao de subgrupos pode abrir
espao para um nvel de granularidade muito alto. Uma alternativa seria considerar apenas o grupo
Contato, e adicionar um campo de polaridade, indicando se o contato considerado positivo
(abrao, abraar, beijar) ou negativo (chute, pontap, cotovelada, tapa, soco...). No entanto, se
consideramos o interesse em procurar por palavras do corpo, pode no ser relevante recuperar
tapa, beijo, chute ou bofetada.
Assim, notamos que as palavras do grupo Contato/Agresso no so palavras que se referem
estritamente ao corpo humano, mas a aes que fazemos com o corpo humano, e que tm o corpo
como alvo. E, considerando as perguntas iniciais do Esqueleto (como se descreve a aparncia fsica
e que outros usos sistemticos as palavras do corpo podem ter) so grupos que comeam a se
distanciar. Por outro lado, muito interessante a identificao dessas palavras do "corpo como
alvo", sobretudo em termos de expressividade.
Aparncia: Temos em portugus a produtividade do sufixo udo associado a partes do corpo:
narigudo, peitudo, orelhudo, barrigudo, bochechudo etc. E temos tambm os aumentativos pouco
produtivos, como bocarra. Por enquanto, no estamos anotando essas palavras, embora
tenhamos criado a seguinte lista.
http://www.linguateca.pt/acesso/corpos/corpo/Grupo_Aparencia.txt
Condies: Do mesmo modo, no anotamos palavras que remetem a condies fsicas especiais,
como grvida, surdo ou cegueira, embora tenhamos criado a seguinte lista:
http://www.linguateca.pt/acesso/corpos/corpo/Grupo_Condicoes.txt
Processos: Palavras que se referem a processos ou funes corporais, como respirao, digesto
tambm no receberam qualquer anotao, embora tenhamos criado a seguinte lista:
http://www.linguateca.pt/acesso/corpos/corpo/Grupo_Processo.txt
Produtos: Palavras que se referem a produtos de processos corporais, como cuspe, calo, espirro ou
hlito, tambm no receberam qualquer anotao, embora tenhamos criado a seguinte lista:
http://www.linguateca.pt/acesso/corpos/corpo/Grupo_Produto.txt
4.2. Identificao de Expresses vinculadas a agresso fsica, como
dar/levar um pontap/bofetada/cotovelada/pancada
bastante produtiva em termos dos verbos utilizados. Devemos classific-las como EVP ou basta a
indicao no N?
Em favor da anotao apenas no N, a possibilidade de encontrar outros verbos associados aos
termos de agresso.
Junta, membro, articulao s sero palavras de corpo quando explicitamente indicados (dor
nas juntas)
As seguintes palavras:
vulto
pontap
gordura
corcunda
feio
Referncias
[Costa et al. 2009]
Lus Costa, Diana Santos & Paulo Alexandre Rocha. "Estudando o portugus tal como usado: o
servio AC/DC", STIL 2009, The 7th Brazilian Symposium in Information and Human Language
Technology (So Carlos, Brasil, 8-11 de Setembro de 2009)
[Mota 2013]
Cristina Mota. "Anotao de emoes nos corpos do AC/DC". (2013).
http://www.linguateca.pt/documentos/Mota2013.pdf
[Santos 2011]
Diana Santos. Linguatecas infrastructure for Portuguese and how it allows the detailed study of
language varieties. OSLa: Oslo Studies in Language 3.2 (2011), pp. 113-128. [Volume edited by
J.B.Johannessen, Language variation infrastructure]
[Silva & Santos em edio permanente]
Rosrio Silva & Diana Santos. "Arco-ris: notas sobre a anotao do campo semntico da cor em
portugus". Primeira edio: 25 de Junho de 2009. http://www.linguateca.pt/acesso/ArcoIris.pdf
[Santos et al. em edio permanente]
Diana Santos, Augusto Soares da Silva & Cristina Mota. "Guarda-fatos: notas sobre a anotao do
campo semntico do vesturio em portugus". Primeira edio: 26 de Outubro de 2009.
http://www.linguateca.pt/acesso/GuardaFatos.pdf