You are on page 1of 18

Puentes entre la Lingstica computacional y la Psicolingstica

Juan Carlos Tordera Yllescas


Universitat de Valncia
juan.tordera@uv.es

1. INTRODUCCIN

En los inicios de la Lingstica computacional, la teora lingstica que


fundamentaba las aplicaciones computacionales era nula o casi nula. Sin embargo, a
partir de los fracasos en la Traduccin automtica y del informe ALPAC (un informe
que dio cuenta en 1966 de los resultados negativos de la Traduccin automtica
durante los cuarenta y los cincuenta y que aconsejaba una mayor investigacin
terica), hay un cambio significativo en el rumbo que se deba seguir.
Durante los sesenta y sententa, se comienzan a aplicar teoras con base
lingstica. As por ejemplo, en 1970, Woods propondr la utilizacin para la
Lingstica computacional de las redes de transicin aumentadas, ATNs (de
Augmented Transition Network). Hacia las mismas fechas, el grupo de investigacin
MITRE tratar de utilizar en su investigacin computacional el modelo estndar la
Gramtica

Gnerativa

Transformacional

(GGT)

de

Noam

Chomsky.

Desgraciadamente, su aplicacin result infructuosa, dada la complejidad lingstica


que conllevaba dicha teora (en concreto, determinar si ante una oracin se haba
aplicado o no una determinada regla transformacional). En 1968, surge como
alternativa terica a la GGT, la Gramtica de casos de Charles Fillmore. Dicha
gramtica tratar de ser utilizada en la Lingstica computacional como es en el caso
de los traductores automticos Atlas-I y Atlas-II. Asimismo, Quillian en 1968 y Woods
en 1975 proponen un tipo de representacin de ndulos y arcos que dara cuenta de la
estructura (o jerarqua) semntica entre los elementos y que se denomin, justamente,
redes semnticas. Y por ltimo, dentro de la Inteligencia Artificial, cabe sealar las
aportaciones de Minsky o de Schank y Abelson para dar cuenta de la informacin
procedente del conocimiento no lingstico o enciclopdico utilizada en el
procesamiento del lenguaje. En 1975, Minsky publicaba su artculo A framework for
representing the knowledge, en el que defenda que el conocimiento humano est
almacenado en la memoria como estructuras de datos, denominadas marcos

(frame), que representan situaciones estereotipadas. Dos aos despus, Schank y


Abelson publicaban su libro Scripts, plans, goals and understanding 1, en el que
exponan el concepto de guin script, un concepto similar al de marco, salvo por su
carcter dinmico y secuencial es decir, cada suceso dentro de la situacin
estereotipada est bien delimitado o encadenado. Los conceptos de marcos y
guiones, generados dentro de la Inteligencia Artificial, son conceptos que han tenido
una acogida dentro de la Lingstica textual, con el fin de explicar cmo el ser humano
procesa e interpreta los mensajes.
As pues, queda claro que existe una relacin clara entre la Lingstica
computacional y la Lingstica terica. El objetivo del presente trabajo es mostrar cmo
los problemas de la Lingstica computacional no son muy dispares a los de la
Psicolingstica, lo cual es fcil de entender si se entiende que la Lingstica
computacional persigue la simulacin del procesamiento y la comprensin del lenguaje
humano.

2. LINGSTICA COMPUTACIONAL Y PSICOLINGSTICA


Siguiendo a HALVORSEN (1988: 254), se pueden establecer las siguientes
subdisciplinas computacionales: 1) Tratamiento del habla (sntesis de voz y
reconocimiento del habla); 2) Anlisis, Generacin e Interpretacin del lenguaje
natural; 3) Traduccin automtica. Las primeras disciplinas computacionales daran
cuenta de la onda sonora del habla, es decir, cmo se produce (sntesis de voz) o
cmo se reconoce (reconocimiento del habla). Las siguientes disciplinas se
encargaran de desentraar los aspectos sintcticos, semnticos y pragmticos de un
mensaje bien producido o bien recibido. Finalmente, el desidertum (todava no
alcanzado plenamente) de la Traduccin automtica es que un sistema computacional
consiga traducir un texto de una lengua origen a otra lengua meta de forma automtica
(sin intervencin humana). En las siguientes lneas, se detallarn los puntos de
contacto que existe entre la Lingstica computacional y la Psicolingstica.
Que existe una importante relacin entre la Lingstica computacional y la
Psicolingstica/Neurolingstica o, dicho en otros trminos, entre el ordenador y la
1

Previamente, entre 1972 y 1975, Schank introduca el concepto de dependencia conceptual


(BROWN y YULE, 1983 [1993]: 296-303, MART ANTONN y CASTELLN MASALLES, 2000: 15 o
SPARCK JONES, 1992: 55-57). Grosso modo, se aceptaba que cada oracin representa distintos
conceptos, que, a su vez, mantenan dependencias con otros conceptos ms generales. Los
conceptos ms generales (o hiperonmicos) tratan de representar los primitivos semnticos
esto es, palabras semnticamente bsicas o no descomponible mediante otros conceptos y,
para Schank, estos eran necesarios para una adecuada comprensin de los distintos
enunciados.

mente humana, es algo que no ha pasado desapercibido para los estudiosos e


investigadores de estas disciplinas, como se ilustra a continuacin con algunas
afirmaciones de psicolingistas y lingistas computacionales.
1) a.
En un ordenador, lo mismo que en nuestros procesos mentales, se
puede identificar un conjunto finito de estados internos del sistema, denominados
computacionales, y una serie de instrucciones que prescriben, para cada posible
estado, las operaciones que deben ejecutarse para acceder a otro estado distinto.
Estas operaciones tienen, adems, un carcter sistemtico, en la medida en que
suponen la aplicacin o ejecucin de reglas de forma no aleatoria. Por ltimo, las
propiedades relevantes de los estados mentales/computacionales sobre las que se
ejecutan las operaciones son las relativas a la estructura de tales estados es decir,
a la disposicin u organizacin de los elementos o smbolos primitivos del sistema,
y no al contenido o a los referentes externos de esos smobolos. (BELINCHN,
IGOA y RIVIRE, 1992 [1998]: 294)
b.
La similitud entre los ordenadores y la mente humana es obvia
y ha sido explotada en ambas direcciones. Los ingenieros electrnicos y sobre
todo los tcnicos de Inteligencia Artificial tratan de trasladar intuitivamente sus
ideas sobre el funcionamiento mental al campo del ordenador. Por su parte, los
psiclogos cognitivos toman como modelo el ordenador para plantear hiptesis
psicolgicas y elaborar interpretaciones tericas (DE VEGA, 1984: 31).
c. Otro factor relevante que ha acarreado el resurgimiento de numerosos tipos
de gramticas dentro de la LC es la relacin interdisciplinaria con la psicologa, la
lgica y las matemticas. La LC, a causa de la influencia de reflexiones
psicolgicas, se interesa ms por la semntica que por la sintaxis e intenta
dilucidar los procesos cognitivos subyacentes al lenguaje para as poder
modelarlos y computerizarlos en ordenadores inteligentes que simulen una
capacidad de comprensin. (MEYA y HUBER, 1986: 93).
d.
[Actualmente], se est produciendo un gran desarrollo en el campo de
la simulacin, y no slo de la simulacin de los procesos cognitivos normales, sino
tambin de los trastornos producidos por lesin cerebral, por lo que se habla de
una nueva disciplina conocida con el nombre de neuropsicologa cognitiva
computacional. Si la simulacin, en general, es una metodologa interesante de
investigacin porque exige un nivel de precisin mucho mayor en los modelos,
evitando todo tipo de ambigedades, la simulacin de la conducta de los pacientes
es an ms interesante, porque permite, mediante lesiones en distintos puntos del
sistema, localizar qu proceso o procesos hay que lesionar para que se
reproduzca exactamente un determinado trastorno afsico (DE VEGA, 1999: 564565).

Las afirmaciones recogidas en (1c) y (1d) ponen de manifiesto que las


investigaciones de los psicolingistas y de los lingistas computacionales no han sido
tareas aisladas, sino que los avances de una y otra disciplina se han visto reforzados
por el desarrollo de la otra. Y esto es as, porque, tal como se recogen en (1a) y (1b),
se puede establecer una relacin analgica entre el ordenador y la mente humana. Sin
embargo, tal como advierte DE VEGA (1984: 31), dicha relacin es solo de semejanza,
no de identidad. La mente humana y el ordenador no son lo mismo. Aunque la mente
humana y el ordenador se caracterizan por codificar, retener y operar con smbolos y
representaciones internas, cabe advertir que el soporte fsico o hardware no es el

mismo. El sistema nervioso del hombre consta de millones de neuronas que son
capaces de establecer miles de complejas conexiones sinpticas y, hasta la fecha, la
ingeniera informtica ha sido incapaz de simular esta complejidad del sistema
nervioso. Por ello, a nuestro juicio, la heurstica (esto es, las tcnicas y habilidades de
resolver un problema o, dicho en otros trminos, la capacidad de plantear un
algoritmo) de la mente humana y del ordenador no son idnticos. Si a un ordenador se
le pide que retenga los nombres propios como Ana y Mara Jess, gastar mayor
memoria en retener el nombre propio Mara Jess que no Ana (pues este
contiene menos caracteres que aquel). Sin embargo, si un ser humano tiene como
hermana o pareja a una persona que se llame Mara Jess (o si se llama as el
propio sujeto), posiblemente le cueste menos retener este nombre que no Ana.
Dadas las relaciones de semejanza entre la mente humana y el ordenador, en
las siguientes lneas, se pretende sealar cmo los problemas planteados para la
produccin del habla, la expresin del mensaje, la recepcin del habla y la
comprensin del mensaje son parejos a los problemas planteados en la Lingstica
computacional y, cmo, en ocasiones, las soluciones aportadas no han sido tampoco
muy distintas.

3. PRODUCCIN Y RECONOCIMIENTO DEL HABLA


En el plano de la produccin del habla, cabe indicar que, al igual que ocurre
con la sntesis de voz (i.e., la produccin automtica de la voz humana), uno de los
mayores retos que plantea la Psicolingstica es describir cmo se articulan los
sonidos, puesto que no parece adecuado defender que el sistema nervioso ordene al
aparato

bucofonatorio

articular

sonido

sonido.

Es

decir,

la

Psicolingstica/Neurolingstica presta atencin a la coarticulacin, esto es, a la


contaminacin acstica de los sonidos por los sonidos anteriores y posteriores, al
pronunciarse todos conjuntamente (CAPLAN, 1987 [1992]: 245 o BELINCHN, IGOA y
RIVIRE, 1992 [1998]: 614-617).
2)
La co-articulacin sugiere que, en vez de planificarse la
actividad motora fonema a fonema, se da una planificacin jerrquica que implica la
codificacin de unidades relacionadas con los movimientos de grupos de msculos que
son ms amplios que los que participan en la emisin de un nico sonido. [] esta
planificacin afecta, como mnimo, a los msculos implicados en la produccin de una
slaba; al mismo tiempo, permite dar cuenta tambin de la existencia de movimientos
de anticipacin de los sonidos finales de las palabras e incluso de sonidos que ocupan
hasta seis segmentos posteriores a aquel que se est emitiendo. Estos movimimientos
de anticipacin contaminan o hacen an ms patente el carcter co-articulado de la
emisin de los sonidos del habla. En este sentido, restan credibilidad a la hiptesis de
que la planificacin articulatoria es un derivado directo de los rasgos fonticos y/o que

el programa motor consta de instrucciones articulatorias invariantes que se aplican una


a una con independencia del contexto (i.e., de cules sean los fonemas adyacentes)
(BELINCHN, IGOA y RIVIRE, 1992 [1998]: 615).

Igualmente, un reto que plantea la sntesis de voz era la produccin de los


aspectos prosdicos. La prosodia (aspecto del lenguaje necesario para una buena
comprensin del mensaje) era un aspecto que, en sntesis, estaba vinculada a la
sintaxis (LLISTERRI et alii, 2003: 8-9, LLISTERRI et alii, 2004, o HUALDE, 2003).
Igualmente, en Psicolingstica, un tema investigado es cmo la correcta
pronunciacin de la entonacin, el acento, las pausas, la duracin influye en la
comprensin del mensaje en casos de ambigedad o en casos de dirigir la atencin
hacia un elemento del mensaje (BUTTERWORTH, 1990 y BELINCHN, IGOA y RIVIRE,
1992 [1998]: 594-597).
En el caso del uso de claves prosdicas para desambiguar los enunciados,
BELINCHN, IGOA y RIVIRE (1992 [1998]: 595) exponen el ejemplo de (3) y, en el caso
del uso de claves prosdicas con fines enfticos o contrastivos, BELINCHN, IGOA y
RIVIRE (1992 [1998]: 596) aportan el ejemplo de (4).
3)

a. Si Solti dirige la orquesta / tendr un gran xito.


b. Si Solti dirige / la orquesta tendr un gran xito.

4)

a. TU HERMANO rob el dinero (no mi padre).


b. Tu hermano rob EL DINERO (no las joyas).

En (3), la entonacin y la pausa permiten delimitar de qu verbo depende el


sintagma la orquesta, mientras que, en (4), la intensidad y la entonacin permiten
identificar el elemento remtico o informacin nueva. Precisamente, la prosodia para
estos casos tambin es tenida en cuenta por la sntesis de habla, ya que facilitaban la
produccin de mensajes comprensibles e inteligibles para el receptor, tal como se
muestra a continuacin (LLISTERRI et alii, 2003: 8-9, LLISTERRI et alii, 2004, o HUALDE,
2003):
5)

a. -Dnde lo ponemos?
- Si te parece bajo el armario. (prep)
b. - Qu bajars ahora?
- Si te parece bajo el armario. (verb)
c. -En qu caso podemos poner una repisa ah arriba?
- (Pues) si te parece bajo el armario. (adj).

6)

a. [La vieja]SN [lanza [la amenaza]SN ]SV


b. [La vieja lanza]SN [la amenaza]SV

7)

a. DNDE ha ido Juan? A LA FIESTA ha ido.


b. No ha cogido DOS caramelos, sino TRES.

En (5), dependiendo de la categora que se le asigne a bajo, ha de ser


pronunciada de forma tnica (verbo y adjetivo) o de forma tona (preposicin). En (6),
dependiendo del lugar en donde se asigne una pausa potencial se pueden entender
dos cosas diferentes: que la seora mayor lanza una amenaza (6a) o que la lanza
vieja amenaza a alguien (6b). Finalmente, a partir de los ejemplos de (7), el acento de
constraste sirve para indicar cul puede ser el foco en un enunciado.
Respecto a la percepcin del habla, cabe sealar que, al igual que ocurre en el
reconocimiento del habla, en Psicolingstica, un desafo al que han prestado atencin
los expertos es explicar cmo es posible que el ser humano reconozca como unidad
invariante una unidad acstica determinada (v.gr.: un fonema, una slaba) que sufre
no pocas variaciones (BELINCHN, IGOA y RIVIRE, 1992 [1998]: 319-349, SEBASTIAN,
BOSCH y COSTA, 1999, 53-88 y YENI-KOMSHIAN, 2000: 113-167).
8)
Resultara relativamente sencillo desarrollar modelos para los
procesos de percepcin del habla, si cada sonido distintivo de una lengua estuviera
asociado a un patrn acstico estndar. Desgraciadamente, ni el habla, ni sus
caractersticas acsticas resultan ser tan sencillas. En vez de presentar patrones
invariantes (estndares, invariables), los sonidos de la lengua varan
considerablemente en lo que respecta a sus caractersticas acsticas por varias
razones (YENI-KOMSHIAN, 2000: 118).

Los psicolingistas sealan como problema el hecho de que el reconocimiento


de los sonidos se ve afectado, tanto por las diferencias de interlocutor como por las de
intralocutor (dado que, para un mismo hablante, los sonidos pueden variar por el
contexto fnico). Es decir, precisamente, el problema suscitado es el mismo que se
plantea en el reconocimiento del habla.
9)
Una razn muy importante para esta variacin reside en que la
produccin, y en consecuencia la acstica, de un determinado segmento fontico
cambia dependiendo del contexto en el que se inserte. [] Estos efectos del contexto,
que resultan del solapamiento de los movimientos del habla, se denominan efectos de
coarticulacin.
[] Por otro lado, las propiedades fsicas de los sonidos de la lengua, especialmente
de las vocales, varan segn hayan sido emitidas por hombres, mujeres o nios, cuyos
tractos vocales difieren en tamao y configuracin
[] Otro factor que ocasiona la variacin de las propiedades acsticas de los sonidos
del habla es que no pronunciamos dos veces la misma expresin de la misma manera.
Este tipo de variacin es caracterstico del lenguaje natural; si lo suprimiramos, lo que
decimos sonara como algo artificial (YENI-KOMSHIAN, 2000: 118-119).

Tal es la influencia que se puede registrar entre los estudios psicolingsticos


del habla y los estudios de lingstica computacional del habla, que no ha de extraar
que se hayan utilizado aplicaciones del tratamiento del habla para las investigaciones
psicolingsticas. As por ejemplo, en YENI-KOMSHIAN (2000: 132-133), se describe
cmo se utiliz un sintetizador pionero, diseado a principios de los cincuenta por

Franklin Cooper (un ingeniero), Alvin Liberman (un psiclogo) y Pierre Delatre (un
lingista) para detectar las propiedades acsticas perceptivamente relevantes (v.gr.:
los dos primeros formantes en el caso de las vocales) frente a las propiedades
redundantes

es

decir,

para

determinar

qu

rasgos

acsticos

son,

psicolingsticamente, prominentes.

4. ANLISIS, GENERACIN DEL LENGUAJE

Si ha habido una interrelacin notable entre los estudios psicolingsticos y las


investigaciones computacionales acerca del habla, las relaciones que se pueden
establecer dentro de la comprensin y expresin del lenguaje no son menores.
En primer lugar, cabe sealar que una figura tan importante como Noam
Chomsky no solo fue, en su momento, un punto de referencia dentro de la Lingstica
computacional, sino tambin dentro de la Psicolingstica en sus distintos modelos
(estndar, estndar extendido) (BELINCHN, IGOA y RIVIRE, 1992 [1998]: 260-274,
WINGFIELD y TITONE, 2000: 251-255 u OWENS, 1987 [1990: 37-48). As por ejemplo,
una investigacin clsica de la Psicolingstica relacionado con la Gramtica
Generativa Transformacional ha sido el estudio de cmo se procesan las oraciones
activas y las oraciones pasivas. De acuerdo con la Gramtica Generativa
Transformacional, dado que en la generacin de las oraciones pasivas, se ha tenido
que aplicar una regla adicional, una regla transformacional (que, en el modelo de
Principios y Parmetros, es muvase-), lo predecible sera que el hablante-oyente
ideal tardara ms tiempo en comprender o procesar las oraciones pasivas que no las
activas. Y, para corroborar esta prediccin, algunos estudios psicolingsticos
calcularon el tiempo de respuesta que tardaban diferentes sujetos al comprender las
oraciones activas y pasivas.
Y, al igual que la Gramtica Generativa Transformacional cedi paso a
diferentes teoras gramaticales aplicables a la Lingstica computacional (GRISHMAN,
1985 [1990]: 63-67, 122-124 y 144-147; SPARCK JONES, 1992: 55-57, MORENO
SANDOVAL, 1998: 42-43, MART ANTONN y CASTELLN MASALLES, 2000: 14-15 y 140142), del mismo modo, se han llevado a cabo investigaciones psicolingsticas cuya
base gramatical han sido las redes de transicin aumentadas (MITCHELL, 1987 [1990]:
189-192 y BELINCHN, IGOA y RIVIRE, 1992 [1998]: 442-446), la Gramtica LxicoFuncional (MITCHELL, 1987 [1990]: 193-194 y BELINCHN, IGOA y RIVIRE, 1992 [1998]:
274-275) o la Gramtica de casos de Fillmore (BELINCHN, IGOA y RIVIRE, 1992
[1998]: 268-270 y OWENS, 1987 [1990: 48-56). E igualmente, se puede registrar el

estudio de otras teoras lingsticas no sintcticas en la Psicolingstica, que han


tenido su relevancia en Lingstica computacional. Por citar algunas teoras, se
pueden mencionar el modelo de representacin por redes semntica de Collins y
Quillian (REEVES, HIRSH-PASEK y GOLINKOFF, 2000: 217-223), la Teora de la
Dependencia Conceptual de Abelson o la Teora de los guiones, planes y metas de
Schank y Abelson (BELINCHN, IGOA y RIVIRE, 1992 [1998]: 472-477 y 519-522).
Es interesante constatar el hecho de que las gramticas empleadas en la
Lingstica computacional y en la Psicolingstica son las mismas: si el objetivo de la
Lingstica computacional es simular la competencia lingstica o algunas de sus
subcompetencias de un hablante-oyente humano, entonces el hecho de que una
determinada gramtica no tenga nicamente justificacin aplicada (como exigira la
Lingstica computacional), sino, adems, psicolgica, nos puede inducir a pensar que
el grado de simulacin alcanzado es adecuado. As por ejemplo, en Lingstica
computacional, las gramticas que de mayor auge han gozado han sido las gramticas
lexicalistas, esto es, aquellas que consideran que la sintaxis est codificada en el
lxico (v.gr.: la Gramtica Lxico-Funcional, la Gramtica de Estructura Generalizada
orientada al Ncleo). Pues bien, en autores como HERNNDEZ SACRISTN (2003), se
puede apreciar la constatacin y defensa de que la rehabilitacin de sujetos con
agramatismos no puede estar separada de la rehabilitacin lxica, pues lxico y
sintaxis se interrelacionan. De hecho, como recuerda el autor respecto al desarrollo del
lenguaje, es a los dos aos de vida del nio cuando se puede hablar de una
protosintaxis, que es, precisamente, cuando se produce la explosin de vocabulario.
Por tanto, podemos afirmar que el uso de gramticas lexicalistas en Lingstica
computacional es, psicolingsticamente, ms que plausible y acertado.
Y si el conocimiento declarativo de la Lingstica computacional (i.e., las
gramticas) mantiene estrechas relaciones con la Psicolingstica, el conocimiento
procedimental de igual modo ha sido otro punto de contacto. Al igual que la Lingstica
computacional ha prestado especial atencin a los parsers o analizadores sintcticos,
la Psicolingstica tambin ha prestado inters por cmo los seres humanos procesan
y analizan sintcticamente las oraciones. En concreto, la cuestin que se plantean en
las investigaciones psicolingsticas es si el procesamiento o anlisis sintctico es
autnomo (y, consecuentemente, cualquier proceso de desambiguacin llevado a cabo
por la aportacin de informacin semntica o pragmtica es posterior al anlisis
sintctico) o, por el contrario, interactivo y, por tanto, en el mismo proceso de anlisis,
se recibe informacin de tipo semntico o pragmtico que puede ayudar a guiar el
anlisis (v.gr.: en la oracin El polica ve al caballo con los prismticos se interpreta
preferentemente, por nuestro conocimiento del mundo, que el sintagma preposicional

con los prismticos es un complemento verbal, mientras que en la oracin El


polica ve al caballo con la montura desgastada se interpreta preferentemente, por
nuestros conocimientos del mundo, con la montura desgastada como modificador
de caballo). Asimismo, otra cuestin que ha suscitado inters es la forma en que se
analizan las oraciones. En concreto, si el analizador lleva a cabo el proceso de anlisis
de forma determinstica o no determinstica, es decir, dada una categora no terminal
que se puede reescribir de ms de una forma (v.gr.: un SN se puede reescribir como
SN Det + N + ADJ, como SN Det + N o bien como SN Det + ADJ + N), el
analizador tiene en cuenta todas las posibilidades de anlisis o solo una. Y lo
significativo es que existen estudios psicolingsticos como el de MITCHELL (1987
[1990]: 192-193) que explican las ventajas y desventajas de los anlisis
determinsticos no en funcin de los resultados aportados por pruebas o tests
psicolingsticos, sino por los resultados obtenidos por el parser PARSIFAL de Marcus,
con lo que se vuelve a hacer manifiesta la interrelacin Psicolingstica-Lingstica
computacional.
Cuando los psicolingistas estudian cmo se analizan las oraciones, una
pregunta capital que tratan de responder es cmo se interpretan las oraciones
ambiguas (v.gr.: El polica ve al nio con los prismticos); es decir, si el ser humano
tiene en consideracin todas las posibles interpretaciones durante el anlisis o, por el
contrario, solo tiene en cuenta una nica interpretacin que puede ser ratificada al final
del anlisis2. En este segundo caso, con el fin de justificar que el ser humano solo
tiene en cuenta una nica interpretacin, los psicolingistas partidarios de esta
hiptesis suelen ejemplificar sus ideas mediante las oraciones denominadas oraciones
de sendero de jardn o de va muerta (garden-path sentences), esto es, oraciones
que, al terminar de ser procesadas, el receptor (oyente o lector) puede verse obligado
a retroceder hacia atrs ante un anlisis errneo.
10)

a. Cuando el bibliotecario subi [los libros] se cayeron al suelo.


b. Mientras el granjero coma [el pollo] se escapaba del corral.

En las oraciones de (10), el receptor puede verse obligado a volver a


escuchar/leer la oracin (esto es, dar marcha atrs ante un camino interpretativo
errneo) si ha considerado que los sintagmas los libros y el pollo es un
complemento de los verbos subi y coma respectivamente, en lugar de
interpretar dichos sintagmas como los sintagmas nominales que funcionan como
sujeto de la oracin principal. Como el ser humano ha de volver a interpretar las
2

Para quienes defienden que el anlisis sintctico es autnomo y que, adems, el anlisis es
determinista, el ser humano solo podr tener en consideracin una nica interpretacin al
procesar la oracin ambigua.

oraciones de (10), podra interpretarse que el ser humano no tiene en cuenta todas las
posibles interpretaciones de la oracin, sino una nica interpretacin (en este caso
errnea) y, por ello, ha tenido que dar una marcha atrs.
Quienes apoyndose en las oraciones de va muerta o de sendero de jardn
sostienen que el ser humano solo tiene en cuenta una nica interpretacin en el
anlisis, defienden que existen dos estrategias que guan al ser humano en la
interpretacin preferida de las oraciones ambiguas. Segn algunos autores, estas
estrategias de anlisis se denominan adjuncin mnima (minimal attachment) y
cierre tardo (late closure).
Segn la estrategia de la adjuncin mnima, se preferirn aquellos anlisis que
requieren la generacin de un menor nmero de nudos sintagmticos. As, en
BELINCHN, IGOA y RIVIRE (1992 [1998]: 431-432), CARREIRAS y MESEGUER (1999:
171-172) y WINGFIELD y TITONE (2000: 260-261), se recoge que el motivo por el que se
prefiere interpretar el sintagma preposicional con unos prismticos de la oracin El
polica vio a el espa con unos prismticos como un modificador verbal y no nominal
obedece a esta estrategia. Adaptando los ejemplos aportados por los autores citados,
una oracin como El polica vio a el espa con unos prismticos se podra analizar
de las siguientes maneras:
11)

a.

b.

10

Como se observa a partir de los anlisis de (11), la interpretacin del sintagma


preposicional con unos prismticos como modificador verbal (anlisis de (11a))
requiere menos nudos que la interpretacin como modificador nominal (anlisis de
(11b)), ya que en este ltimo, se ha tenido que reescribir el SN como SN+SP, lo que
no ocurre en el primer anlisis. As pues, tal como prev la adjuncin mnima, el primer
anlisis es el preferido.
Respecto al cierre tardo, tal como se recoge en BELINCHN, IGOA y RIVIRE
(1992 [1998]: 433), CARREIRAS y MESEGUER (1999: 173) y WINGFIELD y TITONE (2000:
260-261), esta estrategia de anlisis sintctico predice que se preferirn aquellos
anlisis cuyos nuevos constituyentes se interpretan como parte del constituyente
actual en proceso de anlisis (esto es, como constituyentes de constituyentes
inferiores mejor que constituyentes de constituyentes superiores). Por ejemplo, en
(12), por esta estrategia, se prefiere interpretar que el adverbio ayer modifica al
verbo de la oracin subordinada y no al verbo de la oracin principal.
12)

a. Juan dijo que Mara fue a la biblioteca ayer.


b. Juan dijo que [O Mara [SV fue a la biblioteca ayer]]
= Juan dijo que fue ayer cuando Mara fue a la biblioteca.
c. [O Juan [SV dijo que [O Mara fue a la biblioteca] ayer]]
= Ayer fue cuando Juan dijo que Mara fue a la biblioteca.

Las estrategias de la adjuncin mnima y el cierre tardo pueden actuar como


estrategias complementarias o bien como estrategias en conflicto. Por ejemplo, en la
oracin Mientras el granjero coma [el pollo] se escapaba del corral, las dos
estrategias preferiran aquella interpretacin (errnea) por la que el pollo sera un
complemento verbal respecto a coma, ya que, por la adjuncin mnima, de este
modo no se habra de proponer una nueva oracin (pues, en la interpretacin correcta,

11

el pollo es el SN dominado directamente por O) y, por el cierre tardo, sera


preferible la interpretacin en la que el constituyente nuevo (en este caso, el pollo)
puede formar parte del constituyente en proceso de anlisis (en este caso, del
sintagma verbal coma). Sin embargo, en el caso de la oracin El polica vio al
espa con unos prismticos, aunque la adjuncin mnima preferira la interpretacin
por la que el sintagma preposicional con unos prismticos es modificador verbal, el
cierre tardo preferira la interpretacin en la que dicho sintagma preposicional sera
modificador nominal de espa, ya que el sintagma nominal sera el constituyente en
proceso de anlisis al que se puede adjuntar el sintagma preposicional. De hecho, en
oraciones como El polica vio al caballo con una montura, la interpretacin preferida
sera aquella en la que el sintagma preposicional con una montura es un
modificador nominal3.
Una vez ms, lo interesante de las estrategias de anlisis investigadas por la
Psicolingstica, como la adjuncin mnima y el cierre tardo, es que han sido
estrategias estudiadas por la Lingstica computacional, tal como se recoge en ALLEN
(1995: 160-161), con el fin de ofrecer una gua de anlisis a los analizadores
sintcticos o parsers ante los casos de ambigedad sintctica. Obsrvese que este
modo de proceder implica que se espera que el sistema computacional analice (e
interprete) una oracin al igual que lo hace el ser humano, es decir, gracias a la
interrelacin entre la Psicolingstica y la Lingstica computacional, se puede hablar
de una (casi) autntica simulacin computacional de la comprensin del lenguaje
natural.

5. TRADUCCIN Y OTROS
En Lingstica computacional, existen, bsicamente, dos mtodos de llevar a
cabo la Traduccin automtica: el mtodo de transferencia y el mtodo por interlengua
(HUTCHINS y SOMERS, 1992 [1995]: 116-121, 160-182 y 192-198, MOURE y LLISTERRI,
1996: 186-187, MART ANTONN y CASTELLN MASSELLES, 2000: 33-34, ALONSO MARTN,
2003: 102-107 y 109-126, y HUTCHINS, 2003: 502-505). Los mtodos de transferencia y
de interlengua se pueden identificar por los niveles lingsticos implicados; en los de
3

Cabe recordar, no obstante, que, como se recoge en NORRIS (1987 [1990]: 215-216),
BELINCHN, IGOA y RIVIRE (1992 [1998]: 431-433), CARREIRAS y MESEGUER (1999: 170-176) y
W INGFIELD y TITONE (2000: 260-261), la preferencia de una interpretacin u otra no solo
responde a criterios sintcticos (esto es, estrategias de anlisis), sino tambin a criterios
lxicos, semnticos y pragmticos. Si se tiene en consideracin que el anlisis sintctico no se
realiza de forma autnoma, se puede entender por qu el sintagma preposicional con una
montura prefiere interpretarse como modificador nominal y no verbal, ya que no tiene mucho
sentido considerar que el polica llevaba puesto una montura cuando vea al caballo.

12

transferencia, intervienen los componentes lxico y sintctico(-semntico) y, en los


segundos, en los mtodos de interlengua, se incluye, adems, el componente
semntico. El sistema de traduccin basado en el mtodo de interlengua se
caracteriza por generar, a partir del texto origen, una representacin (semntica).
Dicha representacin abstracta (una interlengua) supone un estadio intermedio en el
proceso de traduccin, a partir del cual se obtendr el texto meta. Como la
representacin abstracta es neutra, es decir, no existen propiedades lexicolgicas
(morfolgicas), ni sintcticas, ni semnticas exclusivas de una lengua que se
proyecten hacia dicha representacin intermedia, los mdulos de anlisis y generacin
de cada lengua son independientes entre s, lo que posibilita que la adicin de una
lengua al sistema de traduccin solo implique un analizador y un generador ms de
dicha lengua (HUTCHINS y SOMERS, 1992 [1995]: 116-118).
En el mbito de la traduccin automtica, tambin se pueden establecer
paralelismos con la Psicolingstica y, en concreto, con las investigaciones referentes
al bilingismo (o plurilingismo). En LPEZ GARCA (1989: 92-100) y en HARDING-ESCH
y RILEY (1986 [2003]: 51-55), se recoge un par de conceptos clsicos referentes al
estudio de la mente bilinge, que, aunque ha perdido fuerza terica en los ltimos
aos, no dejan de ser conceptos a los que merece hacer referencia. En las obras
sealadas, se indica que Erving y Osgood, influidos por Weinreich, propusieron en
1954 los conceptos de bilingismo coordinado y de bilingismo compuesto. El
bilingismo compuesto sera propio del individuo que posse un solo contenido
cognitivo para dos etiquetas formales diferentes, y el bilingismo coordinado, que es
aquel donde cada etiqueta (i.e., cada forma fnica) arrastra su propio contenido, de
manera que los trminos se acercan sin igualarse (LPEZ GARCA, 1989: 93).
13)

(Extrado de LPEZ GARCA, 1989: 93)


A nuestro parecer, se puede establecer un paralelismo entre el bilingismo
coordinado y el mtodo de transferencia de la traduccin automtica as como entre el
bilingismo compuesto y el mtodo de interlengua. En el caso del bilingismo

13

coordinado, para traducir un concepto de la lengua L1 a la lengua L2, el proceso que ha


de llevar a cabo el individuo bilinge es buscar los equivalentes conceptuales de cada
lengua implicada, es decir, ha de realizar un proceso de transferencia (v.gr.: casa
house o, viceversa, house casa). En el bilingismo (o plurilingismo)
compuesto, son indiferentes las lenguas implicadas para acceder al significado de las
palabras de cada lengua; las palabras de las diferentes lenguas remiten a un nico
significado cognitivo que es compartido, es decir, se podra decir que existe una
interlengua en la que hallan su significado las palabras del resto de lenguas.
Por ltimo, nos gustara registrar una ltima conexin entre la Psicolingstica y
la Lingstica computacional; y dicha relacin la hemos encontrado en un campo de
investigacin de la Psicolingstica que, a priori, podra parecer alejado de la
Lingstica computacional, a saber, las investigaciones y estudios relacionados con el
desarrollo del lenguaje. Y el caso es que un concepto clave de estos estudios es el de
materns. Segn se recoge en OWENS (1987 [1990: 211-217), el materns es la
modalidad lingstica que utilizan los adultos (v.gr.: las madres, de ah la denominacin
de materns) cuando interectan con los bebs para facilitar la comprensin del
mensaje y, por tanto, ayudar implcitamente en el desarrollo del lenguaje. Esta
modalidad se caracteriza, prosdicamente, por un tempo o velocidad de habla lento,
una entonacin exagerada, una intensidad marcada; lxicamente, por un vocabulario
restringido temticamente y no complicado; y, sintcticamente, por oraciones simples
(frente a la subordinacin) y bien formadas (esto es, gramaticales) sin interrupciones ni
reelaboraciones. Pues bien, nosotros hemos observado que, para las distintas
aplicaciones disponibles en las que interviene el tratamiento del habla y,
especialmente, el reconocimiento del habla, los locutores (quiz al considerar que las
mquinas no son tan maduras e inteligentes como el locutor adulto) utilizan una
modalidad del lenguaje prxima al materns, solo que, en este caso, el mensaje no va
dirigido a un nio sino a un sistema computacional. Por ello, dado el paralelismo
apuntado, nos gustara denominar a dicha modalidad lingstica como el computerns.

6. CONCLUSIONES

A la luz de los datos aportados, se puede observar que los retos estudiados
tanto por lingistas computacionales como por psicolingistas son parejos y que, en
ocasiones, las soluciones aportadas por uno u otro campo han sido aprovechadas de
forma complementaria. No obstante, pese a las semejanzas sealadas, no

14

quisiramos concluir diciendo que las soluciones de la Lingstica computacional bien


podran venir de la mano de la Psicolingstica (o viceversa). Cabe recordar que la
Lingstica computacional trata de simular un producto llamado lenguaje. Pero simular
no implica equivaler. Es decir, los procesos que pueda llevar a cabo la Lingstica
computacional

para

solucionar

determinados

problemas

del

lenguaje

no

necesariamente han de ser idnticos a los de la Psicolingstica. El hardware del ser


humano es un cerebro cuya complejidad neuronal y sinptica es tan compleja, que su
heurstica (i.e., su forma de solucionar los problemas), a da de hoy, dista mucho de
ser imitada. Por tanto, hemos de estar de acuerdo con DE VEGA (1984: 31-32), cuando
advierte a este respecto que la analoga solo es funcional y no fsica, por lo que no
parecera adecuado que se estableciera una identificacin absoluta entre el modo
(especfico) de procesar y memorizar la informacin del ser humano y el modo de
procesarla y memorizarla de la mquina. Pinsese, por ejemplo, que una mquina
consume menos memoria al memorizar el nmero 2.987 que 1.000.000 (esto es, un
milln); en contraste, posiblemente, para un ser humano, sea ms fcil recordar el
nmero 1.000.000. Asimismo, para una mquina, memorizar entre el nmero 1.978 y
el 1.979 posiblemente no haya diferencia alguna; sin embargo, al ser humano le es
ms fcil memorizar determinada informacin si puede relacionarla con la almacenada
previamente. Por ello, si el sujeto ha nacido en 1.979, tal vez le sea ms difcil olvidar
esta cifra que no 1.978. Por ltimo, pinsese cmo suele memorizar el ser humano los
nmeros de telfono. Nos es ms fcil memorizar un nmero telefnico agrupando
cifras (96-154-42-63) que no como un todo (961544263). Sin embargo, para una
mquina, no hay diferencia alguna. Es decir, el ser humano cuenta con unas
estrategias propias de procesar y memorizar la informacin que estn ausentes en las
mquinas (al menos, por el momento).

BIBLIOGRAFA

ALLEN,

JAMES,
1995:
Natural
Language
Understanding.
Redwood:
Benjamin/Cummings, ed. 2.
ALLWOOD, JENS, LARS-GUNNAR ANDERSSON, y STEN DAHL, 1981: Lgica para
linguistas. Madrid: Paraninfo.
ALONSO, AMADO y PEDRO HENRQUEZ UREA, 1938 [1951]: Gramtica castellana I.
Buenos Aires: Editorial Losada, ed. 11.
ALONSO, AMADO y PEDRO HENRQUEZ UREA, 1938 [1953]: Gramtica castellana II.
Buenos Aires: Editorial Losada, ed. 11.
15

ALONSO MARTN, JUAN ALBERTO, 2003: La traduccin automtica. En Maria Antnia


Mart Antonn, ed. Tecnologas del lenguaje. Barcelona: UOC;
BELINCHN, MERCEDES, JOS MANUEL IGOA, y NGEL RIVIRE, 1992 [1998]: Psicologa
del lenguaje. Investigacin y teora. Valladolid: Trotta.
BERKO GLEASON, JEAN y NAN BERNSTEIN RATNER, eds., 2000: Psicolingstica. Madrid:
McGraw Hill; 2 edicin:
BRIGHT, WILLIAM, ed. 1992: International Encyclopedia of Lynguistics. Nueva York y
Oxford: Oxford University Press.;
BROWN, GILLIAN y GEORGE YULE, 1983 [1993]: Anlisis del discurso. Madrid: Visor.
BUTLER, CHRISTOPHER S., 1990: Language and computation. En Neville E. Collinge,
ed. An encyclopedia of Language. Londres: Routledge; pgs. 611-667.
BUTTERWORTH, BRIAN, 1990: Aportaciones del estudio de las pausas en el habla. En
Francisco Valle et alii, eds., Lecturas de Psicolingstica I. Comprensin y
produccin del lenguaje. Madrid: Alianza;
CAPLAN, DAVID, 1987 [1992]: Introduccin a la Neurolingstica y al estudio de los
trastornos del lenguaje. Madrid: Visor.
CARREIRAS, MANUEL y ENRIQUE MESEGUER, 1999: Procesamiento de ambigedades
sintcticas. En Manuel de Vega y Fernando Cuetos Vega, eds., Psicolingstica
del espaol. Madrid: Trotta;
CHOMSKY, NOAM, 1957 [1974]: Estructuras sintcticas. Mjico: Siglo veintiuno
editores.
CHOMSKY, NOAM, 1965 [1999]: Aspectos de la teora de la sintaxis. Barcelona: Gedisa.
CUETOS VEGA, FERNANDO, 1999: Neuropsicologa cognitiva del lenguaje. En Manuel
de Vega y Fernando Cuetos Vega, eds., Psicolingstica del espaol. Madrid:
Trotta;
DE VEGA, MANUEL,

1984: Introduccin a la psicologa cognitiva. Madrid: Alianza.


VEGA, MANUEL, et alii, 1990: Lectura y comprensin. Una perspectiva cognitiva.
Madrid: Alianza.
DE VEGA, MANUEL y FERNANDO CUETOS VEGA, eds., 1999: Psicolingstica del espaol.
Madrid: Trotta;
DE VEGA, MANUEL, JOS MIGUEL DAZ, y INMACULADA LEN, 1999: Procesamiento del
discurso. En Manuel de Vega y Fernando Cuetos Vega, eds., Psicolingstica
del espaol. Madrid: Trotta;
GRISHMAN, RALPH, 1986 [1992]: Introduccin a la lingstica computacional. Madrid:
Visor.
HALVORSEN, PER-KRISTIAN, 1988 [1991]: Las aplicaciones informticas de la teora
lingstica. En Frederick J. Newmeyer, ed. Panorama de la Lingstica
moderna de la Universidad de Cambridge. II. Teora lingstica: extensiones e
implicaciones. Madrid: Visor;
HARDING-ESCH, EDITH y PHILIP RILEY, 1986 [2003]: La familia bilinge. Madrid:
Cambridge.
HERNNDEZ SACRISTN, CARLOS, 2003, Lingstica cognitiva y patologa verbal. Lynx,
pgs.
HUALDE, JOS IGNACIO, 2003: El modelo mtrico y autosegmental. En Pilar Prieto, ed.
Teoras de la entonacin. Barcelona: Ariel; pgs. 155-184.
DE

16

HUTCHINS, JOHN, 2003: Machine Translation: General Overview. En Ruslan Mitkov,


ed. The Oxford Handbook of Computational Linguistics. Nueva York y Oxford:
Oxford University Press;
HUTCHINS, W. JOHN y HAROLD L. SOMERS, 1992 [1995]: Introduccin a la traduccin
automtica. Madrid: Visor.
JUANG, B-H. y I. R. RABINER, 2006: Speech Recognition, Automatic: History. En Keith
Brown, ed. The Encyclopedia of Language and Linguistics. Oxford y Nueva
York: Elsevier; 2:
LLISTERRI, JOAQUIM, et alii, 2003: El papel de la lingstica en el desarrollo de las
tecnologas del habla. In. pgs. 43).
LLISTERRI, JOAQUIM, et alii, 2004: La conversin de texto en habla: aspectos
lingsticos. In. pgs. 44.
LPEZ GARCA-MOLINS, NGEL, 1989: Fundamentos de Lingstica perceptiva. Madrid:
Gredos.
LPEZ GARCA-MOLINS, NGEL, 1991: Psicolingstica. Madrid: Sntesis.
MART ANTONN, MARIA ANTNIA, ed. 2003: Tecnologas del lenguaje. Barcelona:
Editorial UOC;
MART ANTONN, MARIA ANTNIA e IRENE CASTELLN MASALLES, 2000: Lingstica
computacional. Barcelona: Edicions Universitat de Barcelona.
MART ANTONN, MARIA ANTNIA y JOAQUIM LLISTERRI, eds., 2002: Tratamiento del
lenguaje natural. Barcelona: Edicions Universitat de Barcelona;
MEYA, MONTSERRAT y WOLFGANG HUBER, 1986: Lingstica computacional. Barcelona:
Teide.
MITCHELL, DON C., 1987 [1990]: Lectura y anlisis sintctico. En Francisco Valle et
alii, eds., Lecturas de Psicolingstica I. Comprensin y produccin del
lenguaje. Madrid: Alianza; pgs. 187-210.
MORENO SANDOVAL, ANTONIO, 1998: Lingstica computacional. Madrid: Sntesis.
MORENO SANDOVAL, ANTONIO, 2001: Gramticas de unificacin y rasgos. Madrid: Visor.
NEWMEYER, FREDERICK J., ed. 1988 [1991]: Panorama de la Lingstica moderna de la
Universidad de Cambridge. II. Teora lingstica: extensiones e implicaciones.
Madrid: Visor;
OWENS, ROBERT E., 2003: Desarrollo del lenguaje. Madrid: Pearson
Educacin/Prentince Hall.
RABINER, I. R. y B-H. JUANG, 2006: Speech Recognition: Statistical Methods. En
Gillian Brown, ed. The Encyclopedia of Language and Linguistics. Oxford y
Nueva York: Elsevier; 2:
REEVES, LAURETTA M., KATHY HIRSH-PASEK, y ROBERTA GOLINKOFF, 2000: Palabras y
significado: de los elementos simples a la organizacin compleja. En Jean
Berko Gleason y Nan Bernstein Ratner, eds., Psicolingstica. Madrid: McGraw
Hill;
SEBASTIAN, NRIA, LAURA BOSCH, y ALBERT COSTA, 1999: La percepcin del habla. En
Manuel de Vega y Fernando Cuetos Vega, eds., Psicolingstica del espaol.
Madrid: Trotta; pgs. 53-88.
SIKKEL, KLAAS y ANTON NIJHOLT, 1997: Parsing of Context-Free Languages. En
Grzegorz Rozenberg y Arto Salomaa, eds., Handbook of Formal Languages.
Berln, Heidelberg, Nueva York, Barcelona, Budapest, Hong Kong, Londres,
Miln, Pars, Santa Clara, Singapur y Tokio: Springer;
SPARCK JONES, KAREN, 1992: Natural Language Processing. En William Bright, ed.
International Encyclopedia of Lynguistics. vol. III; pgs. 53-59.

17

WINGFIELD, ARTHUR y DEBRA TITONE, 2000: Procesamiento de oraciones. En Jean


Berko Gleason y Nan Bernstein Ratner, eds., Psicolingstica. Madrid: McGraw
Hill;
YENI-KOMSHIAN, GRACE H., 2000: Percepcin del habla. En Jean Berko Gleason y Nan
Bernstein Ratner, eds., Psicolingstica. Madrid: McGraw Hill; pgs. 113-167.
YULE, GEORGE, 1996 [1998]: El lenguaje. Madrid: Cambridge University press.

18

You might also like