You are on page 1of 14

qwertyuiopasdfghjklzxcvbnmqwerty

uiopasdfghjklzxcvbnmqwertyuiopasd
fghjklzxcvbnmqwertyuiopasdfghjklzx
cvbnmqwertyuiopasdfghjklzxcvbnmq
El anlisis del discurso: hacia sistemas
expertos de recuperacin informativa
wertyuiopasdfghjklzxcvbnmqwertyui
opasdfghjklzxcvbnmqwertyuiopasdfg
hjklzxcvbnmqwertyuiopasdfghjklzxc
vbnmqwertyuiopasdfghjklzxcvbnmq
wertyuiopasdfghjklzxcvbnmqwertyui
opasdfghjklzxcvbnmqwertyuiopasdfg
hjklzxcvbnmqwertyuiopasdfghjklzxc
vbnmqwertyuiopasdfghjklzxcvbnmq
wertyuiopasdfghjklzxcvbnmqwertyui
opasdfghjklzxcvbnmqwertyuiopasdfg
hjklzxcvbnmrtyuiopasdfghjklzxcvbn
mqwertyuiopasdfghjklzxcvbnmqwert
yuiopasdfghjklzxcvbnmqwertyuiopas
El anlisis del discurso como mtodo para la elaboracin de estructuras conceptuales que
alimenten sistemas de organizacin del conocimiento para la recuperacin de informacin
especializada dentro de un dominio temtico concreto
Carolina Callejo Lavado

[Escribir elynombre
de la compaa]
| Error!
No hay texto para
con ellaestilo
especificado
1
Representacin
organizacin
conceptuales
del conocimiento
recuperacin
de la informacin.
en el documento.
Mster de Informacin y comunicacin cientfica de la Universidad de Granada (UGR), curso 2014-2015.

ndice
1. Introduccin .............................................................................................................................................................................3
2. Fundamentos tericos del mtodo: anlisis de dominio en el paradigma socio-cognitivo ..................4
3. Objetivos del mtodo: un modelo metodolgico para la construccin de estructuras conceptuales
especializadas .........................................................................................................................................................................7
4. Proceso de construccin de estructuras conceptuales mediante el anlisis del discurso ....................8
5. Representacin del usuario en la estructura conceptual ..................................................................................10
6. Conclusiones: hacia sistemas expertos de recuperacin informativa .........................................................11
7. Bibliografa .............................................................................................................................................................................14

1. Introduccin
La organizacin y representacin del conocimiento humano constituye una tradicional va
de investigacin que se enmarca en el campo de estudio de la Organizacin del
Conocimiento (OC o KO, por sus siglas en ingls). Desde que el hombre comenz a registrar
la informacin emprica (aquella procedente de la experiencia percibida a travs de los
sentidos) se ha realizado un esfuerzo continuo por representar y organizar ese
conocimiento para hacerlo accesible. Me refiero a la actividad acadmico-investigadora en
la organizacin del conocimiento para la Recuperacin de Informacin (RI o IR, por sus
siglas en ingls), un dominio de estudio inserto en el mbito de las Ciencias de la
Informacin y la Documentacin (LIS, por sus siglas en ingls).
En este contexto terico, diferentes paradigmas cientficos tratan de definir la forma en
que el conocimiento humano tiene que ser representado y organizado para servir a su
recuperacin informativa por parte de los usuarios interesados. La organizacin del
conocimiento es la base para adquirir nuevo conocimiento. Se deduce, por tanto, que esta
tarea es fundamental para la actividad investigadora, el avance de la ciencia y, por ende, el
desarrollo humano y social1.
Pero trasladar una entidad abstracta como lo es el conocimiento a algo concreto y hacerlo
accesible es una tarea difcil. Es aqu cuando entran en juego los Sistemas de Organizacin
del Conocimiento (SOC o KOS, por sus siglas en ingls), desarrollados con el objetivo de
estructurar y organizar formalmente el conocimiento humano.
Los sistemas de organizacin del conocimiento integran una serie de tecnologas
que ayudan a crear, gestionar y visualizar modelos que muestren una
perspectiva simplificada de los conceptos que forman determinado dominio y de
la estructura semntica subyacente. (Snchez-Cuadrado, 2009)
Los sistemas de organizacin del conocimiento son propuestas para la
representacin y organizacin del conocimiento en una determinada disciplina o
temtica o bien propuestas universales con la finalidad de recuperar la
informacin de un determinado sistema. (Lpez-Huertas, 2015: diapositiva 11)

Por tanto, el campo terico de la organizacin del conocimiento encuentra su aplicacin


prctica en el desarrollo de sistemas de organizacin del conocimiento tales como
ontologas, tesauros, encabezados de materia, clasificaciones que pueden ser de dominio
general o especializado. Y estos sistemas constituyen la base de conocimiento de los
Sistemas de Recuperacin de Informacin (SRI), tales como directorios, navegadores,
sistemas de bsqueda de respuestas (QA, por sus siglas en ingls), etc. De esta manera, los
productos tericos son las reglas para descubrir la ordenacin natural del conocimiento o
para imponer una secuencia til en el conocimiento descubierto (Smiraglia, 2012).

La actividad cientfico-investigadora es un proceso acumulativo de obtencin de conocimiento en


el que el acceso a los resultados de investigacin previos es vital. Pero la capacidad de recuperacin
informativa es tambin una base fundamental para el desarrollo social, no solo porque ste sea
inherente al desarrollo cientfico, sino tambin porque sociedades ms y mejor informadas se
traduce en sociedades ms evolucionadas.
1

Pero cmo representar el conocimiento y organizarlo de forma que sea accesible por parte
del usuario? Primero, mediante la representacin terminolgica y conceptual del dominio
(lenguaje especializado y descripcin de los conceptos que caracterizan el dominio) que da
como resultado un corpus de conocimiento del dominio; segundo, mediante la organizacin
de este ltimo, a travs de la ordenacin formal de los conceptos que definen el dominio en
una determinada estructura y el establecimiento de las relaciones semnticas entre los
conceptos que representan el dominio, lo que se traduce en una estructura conceptual del
dominio.
El objetivo de este trabajo es presentar las virtudes del anlisis del discurso como mtodo
para la elaboracin de estructuras conceptuales que alimenten sistemas de organizacin
del conocimiento para la recuperacin de informacin especializada dentro de un dominio
temtico concreto. En otras palabras, defender que el anlisis del discurso es un mtodo
eficaz para representar y organizar el conocimiento de un dominio concreto de forma que
sirva al desarrollo de sistemas expertos de recuperacin de informacin.
A partir de la revisin bibliogrfica se describen los fundamentos tericos y objetivos del
mtodo, se explica el proceso de construccin de estructuras conceptuales mediante el
anlisis del discurso, se realizan propuestas especficas para incorporar la representacin
del usuario a la estructura conceptual resultante y se explica por qu el anlisis del discurso
es un prometedor modelo metodolgico para la elaboracin de estructuras conceptuales
que alimenten sistemas de organizacin del conocimiento para la recuperacin de
informacin especializada.

2. Fundamentos tericos del mtodo: anlisis de dominio en el


paradigma socio-cognitivo
El anlisis del discurso es un mtodo alternativo a los enfoques tradicionales y dominantes
en el mbito de la organizacin del conocimiento para la recuperacin de informacin.
Estos enfoques han evolucionado desde un paradigma fsico (modelo objetivo) de la
organizacin del conocimiento, hacia un paradigma cognitivo (modelo subjetivo) e incluso
socio-cognitivo (constructivista).
En el primero, la elaboracin de las estructuras conceptuales se sustenta exclusivamente en
la representacin del conocimiento objetivo de los documentos (los textos son la base del
diseo y construccin de las estructuras) sin tener en cuenta a los usuarios que recuperarn
la informacin, con las limitaciones y dificultades que esto supone para responder al
objetivo de los sistemas recuperacin de informacin: proporcionar al usuario una
respuesta relevante a su consulta.
El enfoque cognitivo o paradigma orientado por el usuario, que comenz a ganar
popularidad a partir de los aos 70, introduce al usuario como novedad dando lugar a una
organizacin del conocimiento ms cercana al usuario final de los sistemas de recuperacin
informativa y basada en estudios empricos de los usuarios (Hjrland, 2008: 13). En este

modelo los textos son solo una de las bases para la elaboracin de estructuras
conceptuales, que se completa con el usuario como segundo pilar bsico de la misma.
Por ltimo, el paradigma socio-cognitivo introduce, adems de los textos y los usuarios, las
influencias de su esfera socio-laboral como elemento activo del modelo, que evolucion a
partir de la corriente cognitiva hacia el mbito de lo social y es una de las ltimas grandes
corrientes de pensamiento en el campo de la organizacin del conocimiento (LpezHuertas, 2015: diapositiva 38).
En cualquiera de los casos, el proceso de representacin y organizacin conceptuales del
conocimiento se fundamenta en la teora del concepto que algunos sostienen que es el
elemento ms bsico o primario en el universo del conocimiento (Van den Heuvel;
Smiraglia, 2010; Szostak, 2011 en Smiraglia, 2012). El concepto es aqu entendido como una
unidad de conocimiento que comprende expresiones verificables y necesarias sobre el
referente, de manera que se convierte en la expresin relevante y representativa de un
determinado dominio a travs de la definicin de los conceptos que lo integran y de las
relaciones existentes entre los mismos.
Los conceptos poseen una serie de caractersticas que se derivan de su referente y que se
identifican con las categoras potenciales (cualidades de los conceptos) para representar el
conocimiento de un dominio temtico. De esta manera, las estructuras conceptuales
resultantes del proceso de representacin y organizacin del conocimiento parten de los
conceptos definitorios de una especialidad (dominio temtico) para posteriormente
identificar las categoras que los describen y las relaciones semnticas que se dan entre los
mismos, con el objetivo final de establecer un orden jerrquico entre las categoras (en
funcin de la relevancia de las mismas en los textos) y elaborar una estructura conceptual
que represente y organice formalmente el conocimiento de esa especialidad.
El anlisis del discurso como mtodo para la elaboracin de estas estructuras conceptuales
que representan el conocimiento de un determinado dominio, se enmarca dentro de la
principal va de investigacin para la organizacin del conocimiento: el anlisis de dominio.
El anlisis de dominio es un enfoque terico formulado inicialmente por Hjrland y
Albrechtsen en la dcada de los 90 como una alternativa a la visin cognitiva dominante en
las Ciencias de la Informacin y la Documentacin (Hjrland, 2008: 16).
Este enfoque terico se sustenta en el estudio de los dominios del conocimiento o las
comunidades de pensamiento o discursivas (Hjrland, 2004: 17) como modelo y referente
para la elaboracin de estructuras conceptuales especializadas. Parte de la idea de que la
representacin de un documento se realiza para permitir al usuario realizar
discriminaciones significativas, por lo que el documento debera ser mirado con los ojos de
potenciales usuarios (Hjrland, 2008: 17).
Si esos potenciales usuarios estn influidos no solo por aspectos objetivos y subjetivos, sino
tambin por aspectos sociales y culturales, resulta lgico que estas particularidades sean
tambin incorporadas a la representacin y organizacin formal del conocimiento. De esta
manera, se obtendrn estructuras conceptuales ms complejas, enriquecidas y fieles a la

ordenacin natural del conocimiento y, por ende, se desarrollarn sistemas de organizacin


del conocimiento y sistemas de recuperacin de informacin ms eficaces.
El conocimiento del dominio temtico en cuestin se convierte as en la unidad de anlisis
para la representacin y organizacin del conocimiento especializado segn el anlisis de
dominio. Con el objetivo de obtener un conocimiento multidisciplinar y enriquecido del
dominio, los autores de esta va terica proponen once mtodos para estudiar los dominios
desde una perspectiva socio-cognitiva (Hjrland, 2004: 17):
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.

Produccin de guas bibliogrficas.


Produccin de clasificaciones especializadas.
Indexacin y recuperacin de informacin especializada.
Estudios empricos de los usuarios en los diferentes campos.
Estudios bibliomtricos.
Estudios histricos de intercambio de informacin.
Estudios del documento y de gnero.
Estudios epistemolgicos y crticos.
Estudios terminolgicos, idiomas para fines especiales (IFE) y estudios del discurso.
Estudios de las estructuras e instituciones de la comunicacin cientfica.
Anlisis de dominio en la cognicin profesional, el conocimiento experto y la
Inteligencia Artificial (IA).

Estos once mtodos pueden ser aplicados por separado, aunque la idea del anlisis de
dominio es la utilizacin conjunta de ms de uno en el mismo dominio para proporcionar
una comprensin ms profunda de la dinmica subyacente (Hjrland, 2004: 17-18).
El resultado del anlisis de dominio es la descripcin y el conocimiento de los dominios
temticos en base a tres bases de teoras y conceptos que constituyen cada dominio
(Hjrland y Hartel, 2003 en Lpez-Huertas, 2015: diapositiva 50):
1. Teoras ontolgicas sobre objetos de la actividad humana.
2. Teoras epistemolgicas sobre el conocimiento y las formas de obtenerlo.
3. Teoras sociolgicas sobre los grupos de personas que se relacionan con los objetos.
As, las interacciones entre los factores ontolgicos, epistemolgicos y sociales influyen en
el desarrollo de los campos de conocimiento (dominios temticos) y deben ser, por tanto,
tenidos en cuenta a la hora de representar y organizar el conocimiento en un determinado
dominio.
El anlisis de dominio es una perspectiva terico-prctica muy influyente en el mbito de la
organizacin del conocimiento para la recuperacin de informacin, que ha ido ganando
terreno durante el ltimo cuarto de siglo porque se ha pasado de la bsqueda de soluciones
universalmente aceptables, a enfoques centrados en un rea concreta (Smiraglia, 2012).
ste es un modelo terico prometedor para entender el discurso cientfico y
potencialmente una herramienta muy til para proyectar el mapa estructural del discurso
cientfico (Mai, 2004 en Lpez-Huertas, 2015: diapositiva 60).

El anlisis del discurso puede ser entendido, por tanto, como sub-enfoque terico dentro
del anlisis de dominio del que toma (1) el estudio y anlisis del discurso como herramienta
para la identificacin de las categoras que representan e identifican el dominio y el peso o
relevancia de stas en los textos y (2) la identificacin de la relevancia del contenido de las
definiciones para establecer las categoras y su orden basado en una jerarqua.
La diferencia entre el anlisis de dominio y el anlisis del discurso es que en el primero la
unidad de anlisis para la representacin y organizacin del conocimiento es el dominio
temtico, mientras que en el segundo la unidad de anlisis es el concepto (el conjunto de
conceptos con los que se identifica un dominio temtico, sus categoras y las relaciones
semnticas entre stas), que se expresa formalmente mediante un descriptor.

3. Objetivos del mtodo: un modelo metodolgico para la construccin


de estructuras conceptuales especializadas
El anlisis del discurso en el campo de la organizacin del conocimiento para la
recuperacin de informacin pretende dar respuesta a la complejidad inherente a la tarea
de representar y organizar el conocimiento humano, que crece de manera exponencial y
que debe ser representado en entornos contextualizados, tal y como existe en la realidad.
Su principal objetivo es el de servir de base metodolgica para la construccin sistemtica
de estructuras conceptuales dentro de un dominio determinado a partir del estudio y el
anlisis de los propios textos especializados pertenecientes a ese dominio. Este mtodo se
fundamente en el anlisis de las definiciones de los conceptos del dominio dadas por los
expertos para extraer las categoras.
Los diccionarios y las enciclopedias especializados elaborados por expertos en cada materia
se convierten as en la fuente de informacin (contenido) textual para identificar los
conceptos definitorios del dominio y las relaciones semnticas entre los mismos,
clasificarlos en categoras y determinar la relevancia de stas y su ordenacin en la
estructura.
De esta forma, la estructura conceptual resultante incorporara tanto el conocimiento
objetivo de los documentos, como el conocimiento subjetivo de sus autores (tambin
presente en los documentos y que se desprende de las definiciones de los conceptos que
realizan cada uno de los autores). A esto hay que aadir una dimensin ms, an poco
desarrollada en la teora de este modelo, el usuario final del sistema de recuperacin de
informacin. Esto aportara una dimensin socio-cultural al sistema que se traducira en la
extraccin de nuevas categoras que no estn presentes en los documentos pero que son
relevantes, porque enriquecen las estructuras conceptuales resultantes y ayudan al
desarrollo de sistemas de recuperacin de informacin que respondan de forma eficaz a las
necesidades informativas de los usuarios que van a utilizarlo.
Se pretende as objetivar y automatizar el mtodo para la construccin de estructuras
conceptuales especializadas que sirvan a la recuperacin de informacin inteligente
mediante sistemas expertos de recuperacin informativa.
7

4. Proceso de construccin de estructuras conceptuales mediante el


anlisis del discurso2
Para ilustrar cmo el anlisis del discurso puede contribuir a la tarea anterior, se me ocurre
un escenario en el que ha de elaborarse una estructura conceptual perteneciente al
dominio de la epidemiologa, con el objetivo final de desarrollar un sistema de
organizacin del conocimiento que pueda servir de base a un sistema experto para la
recuperacin de informacin especializada. La epidemiologa es la disciplina mdica
encargada del estudio de las enfermedades humanas, esto es, su distribucin poblacional,
su frecuencia de aparicin y los factores determinantes de su desarrollo, con la finalidad de
predecir y controlar las enfermedades en las sociedades humanas.
En este contexto, sera til el desarrollo de un sistema experto que pueda ser empleado por
los cientficos que investigan en esta rama mdica (usuarios finales del sistema) para la
recuperacin inteligente de informacin relevante.
Y qu informacin es relevante para los epidemilogos? Para averiguarlo, primero hay que
identificar los conceptos que van a constituir el punto de partida del anlisis del discurso
para seleccionar despus las definiciones de los mismos que realizan diferentes autores en
textos especializados (enciclopedias y diccionarios). En este ejemplo, el concepto como
unidad de anlisis del discurso que define al dominio temtico es evidente: cada una de las
enfermedades humanas. Es decir, los conceptos que van a constituir el objeto de anlisis del
discurso y que se expresan formalmente mediante descriptores son: cncer, diabetes,
obesidady as cada una de las enfermedades mdicas registradas. Para cada uno de estos
descriptores se crea un texto que constituye la base del anlisis.
Para establecer las categoras (caractersticas) de los conceptos e identificar las relaciones
semnticas y jerrquicas entre las mismas (la relevancia de cada una dentro de la
estructura) acudiremos a las definiciones dadas por expertos en la materia presentes en
textos especializados como lo son las enciclopedias mdicas. Este es el primer paso en el
anlisis del discurso, seleccionar los textos especializados que van a constituir la base
informativa para la descripcin de los conceptos, a partir de las definiciones que diferentes
autores realizan de los mismos.
En este caso las definiciones3 de cada uno de los conceptos, que son cada una de las
enfermedades, dadas en las enciclopedias contendrn diferentes elementos textuales
relevantes para representar cada uno de los conceptos cncer, diabetes, obesidad,
etc. en el dominio de la epidemiologa. Y estos elementos textuales son los que sugerirn
las categoras y su relevancia dentro de la estructura conceptual. Este es el segundo paso
en el proceso de elaboracin de estructuras conceptuales mediante el anlisis del discurso,
La informacin relativa a este apartado sobre el proceso de construccin de estructuras
conceptuales se ha extrado de Lpez-Huertas, 2015: dispositivas 127-140.
2

No se incluyen aqu las definiciones del ejemplo por la imposibilidad de acceso a estas
enciclopedias mdicas especializadas y porque esta tarea desbordara los lmites del trabajo. Se
considera que la descripcin del proceso de anlisis del discurso es suficiente para ilustrar la
aplicabilidad del mtodo en la prctica.
3

sealar los elementos textuales relevantes contenidos en las diferentes definiciones de


cada uno de los conceptos.
En el ejemplo que nos ocupa, tras analizar diversas enciclopedias mdicas seguramente
obtendramos elementos textuales relevantes muy similares a los recogidos en la siguiente
tabla, y las categoras se estableceran a partir de esos elementos textuales (el nombre de
las categoras viene propuesto directamente por los propios textos).
Elementos textuales relevantes
Exceso de grasas
Consumo de alcohol
Tabaquismo
Sedentarismo
IMC
Medida de la circunferencia de la cintura
Cambios en el estilo de vida
Frmacos
Riesgos para la salud
El 13% de las personas son obesas

Identificacin de categoras
Causa
Factor de riesgo
Factor de riesgo
Factor de riesgo
Prueba diagnstica
Prueba diagnstica
Tratamiento
Tratamiento
Tratamiento
Prevalencia

Estas categoras definitorias de las enfermedades (los conceptos) se ampliaran muchsimo


en la realidad (factores de riesgo, procesos biolgicos, origen, sntomas, tratamiento,
incidencia, prevalencia, grupos de riesgo, pronstico, etc.), pero baste con el ejemplo
anterior para entender cmo se realiza la identificacin de las categoras en el anlisis del
discurso (tercer paso del proceso de elaboracin de la estructura conceptual).
Una vez identificadas, hay que evaluar las categoras para determinar su importancia dentro
de la estructura conceptual (clculo del ndice de relevancia, cuarto paso) y organizarlas
segn un orden jerrquico (ordenacin de las categoras segn el ndice de relevancia,
quinto paso). El orden en que deben aparecer las categoras en la estructura y los criterios
de organizacin de las mismas es una decisin muy importante en la elaboracin de una
estructura conceptual (Lpez-Huertas, 2015: diapositiva 136).
La relevancia de las categoras se convierte en el criterio de ordenacin de los conceptos en
la estructura conceptual y viene dada por el nmero de veces que cada una de ellas aparece
en las definiciones de las enciclopedias. Durante la ordenacin de las categoras stas se
agrupan en funcin de su relevancia pero tambin se establecen grupos de categoras en
funcin de su semejanza.
Llegados a este punto habr que realizar el proceso anterior con cada uno de los conceptos
del dominio de la epidemiologa, esto es, con cada una de las enfermedades humanas4.
El ltimo paso sera la propuesta de una estructura conceptual concreta para organizar y
representar el conocimiento del dominio dado con vistas al desarrollo de sistemas de
organizacin del conocimiento para la recuperacin de informacin.

Esta sera una tarea ardua y compleja en la prctica y su mencin aqu solo sirve a modo de
ejemplo ilustrativo.
4

Por tanto, los pasos a seguir para la elaboracin de estructuras conceptuales dentro de un
dominio temtico mediante el anlisis del discurso son:
1.
2.
3.
4.
5.
6.
7.

Seleccin de textos especializados.


Identificacin de elementos textuales relevantes.
Establecimiento de las categoras (sugeridas por los propios textos).
Evaluacin de la relevancia de las categoras.
Ordenacin de las categoras en la estructura.
Repeticin del proceso para cada concepto del dominio.
Propuesta de la estructura conceptual.

5. Representacin del usuario en la estructura conceptual


Para obtener una estructura conceptual completa y enriquecida, digna de representar la
complejidad de un dominio temtico, es vital que se represente al usuario dentro de la
misma, ya que al final ser ste quien utilice los sistemas de recuperacin de informacin
para los que ha sido desarrollada la estructura conceptual.
La representacin del usuario en el marco del anlisis del discurso queda excluida si solo se
tienen en cuenta las categoras sugeridas por los textos (que reflejan tanto el conocimiento
objetivo como el conocimiento subjetivo de los autores). Se me ocurre, por tanto, que una
forma de incorporar la representacin del usuario en la elaboracin de estructuras
conceptuales es considerar tambin cuestiones ajenas a los contenidos de los textos
especializados que son la base del anlisis del discurso.
Me refiero a cuestiones que no estn presentes en los textos pero que son relevantes para
los usuarios finales del sistema y que respondern, por tanto, a sus necesidades de
informacin. En el ejemplo anteriormente expuesto sobre el desarrollo de una estructura
conceptual para el dominio temtico de la epidemiologa, estas cuestiones ajenas a los
textos pero relevantes a los usuarios del sistema (investigadores de esta rama mdica)
abarcaran, por ejemplo, el impacto psicolgico de la enfermedad, su concepcin social, el
control de la enfermedad que llevan a cabo las administraciones pblicas, la inversin en
I+D realizada para su estudio, etc.
Esto se traducira, en el marco del anlisis del discurso, en la identificacin de nuevas
categoras y su incorporacin a la estructura conceptual, que incluira as la representacin
del usuario final del sistema. Pero cmo identificar categoras que no estn presentes en el
texto? Cmo saber qu informacin invisible es relevante para los usuarios? Este
conocimiento se podra obtener con mtodos de investigacin cuantitativos como sondeos
a potenciales usuarios del sistema sobre sus necesidades informativas o con mtodos
cualitativos, como entrevistas a estos usuarios estndar del sistema o grupos de discusin.
De esta manera, el anlisis del discurso podra convertirse en un mtodo para la elaboracin
sistemtica y automatizada de estructuras conceptuales para la representacin y la
ordenacin del conocimiento en los sistemas de organizacin del conocimiento. Y estos
ltimos podran servir de base de conocimiento a los sistemas de recuperacin de
10

informacin especializada, esto es, a sistemas expertos. Esto es lo que abordaremos a


continuacin.

6. Conclusiones: hacia sistemas expertos de recuperacin informativa


Los fundamentos del anlisis del discurso y el proceso aqu descrito para la construccin de
estructuras conceptuales especializadas a partir de los propios textos pero incorporando
tambin la representacin del usuario, dan como resultado estructuras conceptuales
contextualizadas, caracterizadas por una elevada representatividad conceptual y por la
potencial capacidad para establecer relaciones semnticas entre sus conceptos (LpezHuertas, 2015: dispositiva 37).
Esto se traduce en una precisin y exhaustividad elevadas en la representacin y
organizacin del conocimiento de un dominio, ya que la realidad tambin es contextual y
rica a nivel conceptual y semntico. Por tanto, un sistema de organizacin del conocimiento
basado en una estructura conceptual de este tipo (la que proporciona el anlisis del
discurso como modelo metodolgico) dispone de toda la informacin relevante (la de los
textos y la de los usuarios) de cada concepto y su entramado semntico.
Por esto, creo que el anlisis de discurso constituye una potencial va de investigacin para
el desarrollo de sistemas expertos. Los sistemas expertos son sistemas para la recuperacin
inteligente de informacin especializada que reproducen el proceso intelectual de un
experto humano en un dominio concreto y asisten a los usuarios durante el proceso de
recuperacin informativa.
Los sistemas expertos, un producto de la inteligencia artificial, pueden considerarse como
intermediarios entre el experto humano, que transmite su conocimiento al sistema, y el
usuario que lo utiliza para resolver un problema con la eficacia del especialista. El sistema
experto utilizar para ello el conocimiento que tenga almacenado y algunos mtodos de
inferencia (Smper).
Estos sistemas estn diseados para resolver problemas concretos y facilitar la toma de
decisiones dentro de un dominio determinado. Por ejemplo, se han desarrollado sistemas
expertos para el diagnstico mdico que se han convertido en una herramienta de trabajo
de los profesionales sanitarios porque hacen ms eficiente el proceso de diagnstico al
economizar tiempo y recursos.
Cmo funcionara un sistema de este tipo? Siguiendo a Mara Jos Lpez-Huertas (LpezHuertas, 1999) un sistema experto basado en una estructura conceptual inferida a partir del
anlisis del discurso funcionara como un sistema de bsqueda a dos niveles, con un modo
de bsqueda y un modo de pregunta.
En el primero el sistema experto devolvera la informacin relativa a una consulta concreta
planteada por el usuario, que representa una necesidad informativa especfica. Por ejemplo,
siguiendo el ejemplo anteriormente planteado sobre el dominio de la epidemiologa,
podramos realizar al sistema la siguiente consulta: factores de riesgo ambiental del
11

melanoma. Es este caso, el procesador funcionara de la siguiente manera: extraera una


lista de todos los posibles factores de riesgo ambiental en el desarrollo de enfermedades
(productos txicos, rayos ultravioleta, etc.) y seleccionara aquellos relacionados con el
melanoma. O bien, extraera una lista de todos los factores de riesgo (no solo ambiental,
sino tambin gentico o de otro tipo) del melanoma y seleccionara solo aquellos que le
interesan, los ambientales. En cualquiera de los dos casos devolvera al usuario la
informacin relativa a la consulta planteada.
Como vemos, sta podra ser una tpica expresin booleana: factores de riesgo ambiental
y melanoma. Una de las caractersticas de un sistema experto como el aqu referido es que
evita el uso de operadores booleanos (Lpez-Huertas, 1999).
Si realizramos la pregunta anterior en un buscador, por ejemplo, obtendramos una serie
de documentos (ordenados en funcin de una relevancia establecida segn una serie de
criterios) que contendran la cadena de caracteres que constituye la consulta. Porque as es
precisamente como un buscador al uso entiende la consulta que realiza el usuario, de
manera que le devuelve documentos que incluyen esas dos cadenas de caracteres (es decir,
documentos que contienen factores de riesgo ambiental y que tambin contienen
melanoma) sin importar las relaciones entre las mismas.
En este caso el sistema de recuperacin de informacin no sabe (ni le importa) si factores
ambientales es una caracterstica (cualidad, categora) referente a melanoma, algo que
un sistema experto s conoce. Parece lgico, por tanto, que en el segundo caso las
necesidades informativas de los usuarios se vern ms satisfechas.
En el segundo nivel de bsqueda, el modo de pregunta, la consulta planteada por el usuario
representa una necesidad informativa imprecisa, es decir, quiere recuperar una informacin
concreta sobre un concepto o conceptos que l no conoce, por ejemplo, cules son los
factores de riesgo ambiental relacionados con los tumores malignos de la piel. En este caso
el usuario quiere saber cules son los conceptos (cada uno de los factores de riesgo
ambiental) que responden a esas caractersticas (que se relacionan con el desarrollo de
tumores malignos de piel). Para ello, realizara la siguiente consulta al sistema tumores
malignos de la piel y en la pantalla apareceran todos los tipos de factores ambientales
relacionados con la aparicin de tumores malignos de piel: contacto directo con productos
txicos, exposicin a la luz ultravioleta, herencia gentica, etc.
En un sistema experto para la recuperacin inteligente de informacin el sistema
mantendra un dilogo continuo con el usuario y le asistira en todo momento durante el
proceso de bsqueda, pasando del modo bsqueda al modo pregunta y viceversa cuando
as fuese necesario, por lo que va refinando la bsqueda progresivamente hasta dar con la
respuesta a la necesidad informativa del usuario.
Se trata de una ayuda que lo conduce (al usuario) de forma inteligente a navegar por la
estructura del sistema hasta que tiene claro lo que busca y puede expresarlo
adecuadamente en la frase de bsqueda (Lpez-Huertas, 1999).

12

Para concluir, vemos que el anlisis del discurso como modelo metodolgico para la
construccin de estructuras conceptuales es una va de investigacin acadmica
prometedora para el desarrollo de sistemas de organizacin del conocimiento ms
sofisticados y cercanos a la complejidad inherente a la realidad y a la forma de expresarla a
travs del lenguaje.
El anlisis del discurso emplea mtodos cualitativos y cuantitativos. El estudio y anlisis de
los textos especializados que sirven de base son cualitativos, mientras que la decisin sobre
la relevancia de las categoras referentes a cada concepto es cuantitativa (el nmero de
veces que cada categora o caracterstica aparece en el texto). El resultado de aplicar este
mtodo a la elaboracin de estructuras conceptuales son sistemas de organizacin del
conocimiento ms enriquecidos y contextualizados, ms cercanos a la ordenacin natural
del conocimiento.
Estos sistemas proporcionaran, a su vez, una base ms exhaustiva y precisa para el
desarrollo de sistemas de recuperacin inteligente de informacin, sistemas expertos
pensados para dominios temticos concretos cuyos usuarios necesitan recuperar
informacin especializada.

13

7. Bibliografa
HJRLAND, Birger. Domain analysis: a socio-cognitive orientation for information science
research [en lnea]. Bulletin of the American Society for Information Science. 2004, vol. 30,
no. 3, pgs. 17-21. Disponible en
<http://onlinelibrary.wiley.com/doi/10.1002/bult.312/abstract>. [Consulta: 20 marzo 2015].
Traduccin al espaol disponible en
<http://www.academia.edu/6589249/An%C3%A1lisis_de_dominio_Por_Birger_Hjorland>.
HJRLAND, Birger. What is Knowledge Organization (KO)? [en lnea]. Knowledge
Organization. International Journal devoted to Concept Theory, Classification, Indexing and
Knowledge Representation. 2008, vol. 35, no.2-3, pgs. 86-101. Disponible en
<http://arizona.openrepository.com/arizona/handle/10150/106183>. [Consulta: 20 marzo
2015].
LPEZ-HUERTAS, Mara Jos. Representacin y organizacin conceptuales del conocimiento
para la recuperacin de la informacin [presentacin Power Point]. 2015. Material de estudio
de la asignatura en el mster de Informacin y Comunicacin cientfica de la Universidad de
Granada.
LPEZ-HUERTAS, Mara Jos. Potencialidad evolutiva del tesauro: Hacia una base de
conocimiento experto [en lnea]. Granada: 1999, pgs. 133-140. Ponencia (Actas de
congresos). Disponible en <dialnet.unirioja.es/descarga/articulo/1300435.pdf>. [Consulta: 20
marzo 2015].
SMPER MRQUEZ, Juan Jos. Introduccin a los sistemas expertos [en lnea]. Red cientfica
(Ciencia, Tecnologa y Pensamiento). Disponible en
<http://www.redcientifica.com/doc/doc199908210001.html>. [Consulta: 22 marzo 2015].
SNCHEZ-CUADRADO, Sonia; MORATO, Jorge. Organizacin del conocimiento, Sistema de ||
KOS [en lnea]. Snchez-Cuadrado, Sonia: 2009. Recurso electrnico. Disponible en
<http://glossarium.bitrum.unileon.es/Home/organizacion-del-conocimiento-sistema-de>.
[Consulta: 20 marzo 2015].
SMIRAGLIA, Richard P. Knowledge organization: some trends in an emergent domain [en
lnea]. El professional de la informacin. 2012, vol. 21, no. 3. Disponible en
<http://recyt.fecyt.es/index.php/EPI/article/view/epi.2012.may.01/17913>. [Consulta: 20
marzo 2015]. Traduccin al espaol disponible en
<http://www.elprofesionaldelainformacion.com/contenidos/2012/mayo/01_esp.pdf>.

14

You might also like