You are on page 1of 12

UPM Cognitive Robotics Nombre: Fecha: Daro Jos Mendoza Chipantasi 27/11/2013

Uno de los principales problemas de las arquitecturas cognitivas es operar a tiempo real en un entorno real, para que un robot sea til no basta con que se mueva a la posicin correcta, sino que por ejemplo mire y reconozca una lata de cerveza, la recoja y la deseche adecuadamente, y todo esto debe cumplirlo en un tiempo adecuado. Investigue la implementacin de SOAR, SUBSUMPTION, RCS Y LIDA y analice en qu medida. - Los robots que las usan, sern capaces de realizarlas en tiempo real. - Los ingenieros que construyen los robots tendrn los recursos para construir y garantizar un comportamiento en tiempo real. Anlise 1) Robots, 2) diferentes tipos de tareas y 3) ambientes diferentes.

ARQUITECTURAS COGNITIVAS1 Una arquitectura cognitiva es un modelo para crear agentes inteligentes. Donde se propone dotar un sistema cognitivo de conocimiento a agentes computacionales y a procesos que actan en un entorno dinmico, con la finalidad que puedan actuar al igual que una persona, para que acte inteligentemente bajo alguna definicin. Arquitecturas cognitivas forman un subconjunto de arquitecturas generales de un agente. El trmino "arquitectura" implica un enfoque que intenta modelar no slo el comportamiento, sino tambin las propiedades estructurales del sistema modelado. HERBERT USA SUBSUNCION El robot Herbert se utiliza para recoger las latas de bebidas vacas por el laboratorio. El robot memoriza la distribucin de la planta y a continuacin busca en todas las oficinas los objetos que se asemejan a las latas de refrescos. Cuando detecta una, Herbert la recoge para determinar si est o no vaca. Si es as, la lata se almacena en el cuerpo y luego es desechada a un basurero especial. Los investigadores del MIT esperan utilizar esta lgica discriminacin en pequeos robots en el futuro cercano. Herbert2
1

http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.158.3706&rep=rep1&type=pdf

Herbert era un robot mucho ms ambicioso, tiene 24 procesadores, dbilmente acoplados y con computador a bordo para ejecutar la arquitectura SUBSUNCIN. Los procesadores eran lentos CMOS de 8 bits (que corren con baja potencia elctrica; una consideracin importante ya que el robot se alimenta de bateras), puede comunicarse slo con interfaces seriales lentas (mximo 10 paquetes, 24 bits de ancho por segundo). A bordo de Herbert, las interconexiones entre AFSMs estn incorporadas fsicamente por alambres de cobre. Herbert tena 30 sensores infrarrojos de proximidad para evitar obstculos, un manipulador a bordo con un nmero de sensores simples unidos a la mano, y un sistema de lneas de luz lser para recoger datos tridimensionales; la informacin de profundidad dimensional es captada en una amplia franja de 60 grados en frente del robot con un rango de alcance de unos 12 pies. Una imagen de 256 pxeles de ancho por 32 de alto en profundidad es capturada cada segundo con el propsito de generar memoria distribuida en forma de serpentina, toda esta informacin para que cuatro procesadores de 8 bits ejecuten cerca de treinta instrucciones para cada pixel y uniendo los procesadores en una nica cadena logran tener un algoritmo de visin de gran desempeo. Herbert est programado para vagar alrededor de las oficinas, se mueve entre las personas, va buscando latas vacas de soda en los escritorios. El demuestra que evita los obstculos y va siguiendo las paredes, reconoce en tiempo real las latas de soda y tiene 15 comportamientos que hacen que el brazo busque fsicamente la lata frente al robot, la localice y la recoja.
2

http://people.csail.mit.edu/brooks/papers/elephants.pdf

Herbert mostr algunos casos usando al mundo como su mejor modelo y como su comunicacin media. Lo notable de Herbert es que no hay absolutamente ninguna comunicacin interna entre ninguno de sus mdulos de comportamiento internos. Cada uno est conectado a sus sensores en la parte de entrada y a una red de arbitraje en el lado de salida. La red de arbitraje maneja los actuadores. Posee una base laser que encuentra el objeto (lata) y gua al robot hasta que su brazo est alineado frente a la soda, pero no le llama al controlador del brazo que ahora est listo para recogerlo. Ms bien, los comportamientos del brazo monitorean los encoders del eje de las ruedas y cuando ellos detectan que no hay movimiento del robot, inicia el movimiento del brazo, desencadenando otros comportamientos para que el robot pueda levantar la lata de soda. La ventaja de este enfoque es que no necesita configurarse las expectativas internas de lo que est pasando a pasar a continuacin en su entorno, lo que significa que el sistema de control puede tanto (1) ser naturalmente oportunista si se presentara una circunstancia fortuita, y (2) puede responder fcilmente a las nuevas circunstancias, como por ejemplo algn otro objeto que se aproxima en su curso a una posible colisin. Como un ejemplo de cmo los comportamientos de brazo estn en cascada sobre los otros, considere realmente captar una lata de refresco. La mano tena un reflejo de prensin que operaba cada vez que algo se rompa y un haz infrarrojo entre los dedos. Cuando el brazo encuentra una lata de refresco con sus sensores locales, simplemente lleva la mano tal que los dos dedos queden alineados a ambos lados de la lata, tan pronto lo recoja el brazo se retraer, que no importaba si se trataba de una lata de refresco que se agarr intencionalmente o una que por arte de magia apareci, ya que realizar el mismo procedimiento. El mismo oportunismo entre comportamientos permite que el brazo se adapte automticamente a una amplia variedad de escritorios desordenados y an con xito encontrar la lata de refresco. El robot Hebert nos demuestra que se puede crear robots que aunque tienen un fin concreto (recoger las latas vacas), poseen un cierto grado de inteligencia ya que puede desenvolverse en ambientes dinmicos y donde nada es controlado, puede interactuar directamente con el medio, evitando obstculos, no tiene problema con las personas y todo esto a tiempo real. Este tipo de estructura es modular, todo el proceso completo sera de mucha carga computacional para un solo elemento de control y como sabemos, mientras ms compleja es una estructura es ms difcil de implementarla y de evitar errores, por eso esta variante es ideal ya que combina mdulos de control especficos para cada accin como por ejemplo, uno para el movimiento evitando obstculos, otro mdulo para buscar a tiempo real las latas, uno que

recuerda y aprende del entorno, etc y todos estos aunque pudieran tener conectadas sus propias salidas (actuador) en cada mdulo lo que se cre para este robot en particular es una red de arbitraje que en funcin de las seales que envan todos los mdulos organiza y pondera que accin resolver primero, como se explic anteriormente la gran ventaja de esto es que no necesitas predefinir un entorno, el control se va realizando cada instante y va aprendiendo sobre la marcha. 4D/RCS3 Modelo de referencia de arquitectura para vehculos inteligentes no tripulados de tierra. 4d/rcs consiste en una arquitectura mlti-capas de jerarquas multi-resolucin de nodos computacionales, que cada uno contiene elementos de procesamientos de sensores (SP), modelado del mundo (WM), juicio de valor (VJ), y generacin de comportamiento (BG). Los niveles ms bajos generan el (objetivo bsqueda) de comportamiento reactivo. Las capas de nivel superior habilitan los objetivos usando comportamiento deliberativo. A lo largo de la jerarqua, la interaccin entre SP, WM, VJ y BG da lugar a la percepcin, cognicin, imaginacin y razonamiento; los niveles bajos, tienen un rango corto de tiempo y espacio en el que actan pero su resolucin es alta; los niveles altos en cambio tienen distancia y tiempo largos pero la resolucin es baja. Esto habilita alta precisin, rpida accin de respuesta sobre intervalos cortos de tiempo y de espacio, mientras que los planes de largo alcance y los conceptos abstractos se estn formulando sobre amplias regiones del tiempo y el espacio en niveles altos. 4D / RCS cierra ciclos de retroalimentacin en todos los niveles. Los procesos SP centran la atencin (ejemplo, regiones de espacio o de tiempo), grupo (ej, segmento de entidades y regiones), atribuye entidad de cmputo, estima la entidad del estado y asigna entidades a las clases en todos los niveles. Procesos WM mantienen una base de datos rica y dinmica de conocimientos sobre el mundo en forma de imgenes, mapas, entidades, eventos y relaciones en todos los niveles. Otros procesos WM utilizan ese conocimiento para generar estimaciones y predicciones que apoyan la percepcin, el razonamiento y la planificacin en todos los niveles. 4D/RCS fue desarrollado para el programa Army Research Laboratory Demostracin III. Hasta la fecha, slo los niveles ms bajos de la Arquitectura 4D/RCS se han aplicado plenamente, pero los resultados han sido muy positivos.

http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.15.14&rep=rep1&type=pdf

Parece claro que las bases tericas de 4D/RCS es slida y su arquitectura es capaz de ser ampliada para soportar niveles mucho ms altos de rendimiento. Arquitectura La figura muestra el diagrama de jerarqua multi-resolucional y contiene algunas capas de nodos computacionales que contienen elementos de procesamiento de seales, modelado del mundo, juicio de valor y generacin de comportamientos.

Arquitectura de un modelo de referencia para un vehculo individual. Los nodos de procesamiento se organizan de tal manera que el mdulo BG forma un rbol de comandos. Informacin en la KD es compartido entre los mdulos WM y los nodos de arriba, abajo, y en el mismo nivel dentro del mismo subrbol. Mdulos KD no se muestran en esta figura. A la derecha, hay ejemplos de las caractersticas funcionales de los mdulos de BG en cada nivel. A la izquierda, son ejemplos de los tipos de datos y mapas que mantienen el WM en la base de datos de conocimientos KD en cada nivel. Rutas de datos sensoriales que fluyen en la jerarqua forman tpicamente un grafo, no un rbol. Mdulos de VJ se ocultan detrs del mdulo WM. Una interfaz de operador proporciona la entrada y la salida para los mdulos en cada nodo. Un bucle de control puede estar cerrado en cada nodo. En los niveles inferiores, estos elementos generan objetivos-bsquedas de comportamiento reactivo. Rango en el espacio y el tiempo es corto y su

resolucin es alta. Esto permite una alta precisin y respuesta rpida para alcanzar en niveles bajos durante intervalos cortos de tiempo y espacio. Por ejemplo, en el nivel de servo, el ancho de banda del bucle reactivo es 200 Hz y la salida a los actuadores se actualiza cada 5 ms. En la planificacin a largo plazo el nivel Servo est a slo 50 ms y los planes son muy simples (por ejemplo, una spline de tercer orden para una sola variable.) La reprogramacin se produce con frecuencia (posiblemente cada 5 ms) y el retardo de la re planificacin puede ser tan corto como la latencia del circuito de reaccin. Sucesivamente en cada nivel ms alto, el rango en el espacio y tiempo incrementa alrededor de su orden de magnitud, acompaado de una reduccin en la magnitud de resolucin. Por ejemplo, planes del nivel primitivo tienen un tiempo de intervalo de 500ms. La salida del nivel primitivo est en intervalos de 50 ms y los planes pueden ser recalculados cada 50 ms. El nivel del subsiste, los planes extendidos a intervalos de tiempo de 5 ms (o a 50 metros de distancia, asumiendo la velocidad del vehculo a 10 m/s) y la salida es actualizada y recalculada su planificacin cada 500ms; A nivel del vehculo, la planificacin es extendida a 1 minuto en intervalo de tiempo (o 500 metros a 10 m/s), la salida es actualizada y la planificacin recalculada cada 5 segundos. En la seccin nivel, la planificacin es extendida a 10 minutos de intervalo de tiempo (o 5km a 10 m/s). Sucesivamente en cada nivel es ms alto, la planificacin es extendida a intervalos de 10 minutos de tiempo cada vez, y es recalculada con menos frecuencia. La salida tambin es actualizada con menos frecuencia.

Lo interesante de esta estructura es que posee una organizacin en capas segn jerarqua y segn su funcionalidad, la arquitectura 4D/RCS es una variante de la RCS donde se inmiscuye todas las dimensiones incluida el tiempo para sistemas que necesitan un sistema de control en tiempo real, lo interesante es que tienen tiempos de ejecucin distintos entre cada una de las capas jerrquicas, siendo de esta manera, las capas ms inferiores las que generen el (objetivo bsqueda) de comportamiento reactivo, mientras que las capas de nivel superior habilitan los objetivos usando comportamiento deliberativo, dotando de esta manera a que el sistema posea percepcin, cognicin, imaginacin y razonamiento; donde

los niveles bajos, tienen un rango corto de tiempo y espacio en el que actan pero su resolucin es alta, enfocan de manera clara y precisa el problema o la accin a realizar y como se debe hacer mientas que los niveles altos en cambio tienen distancia y tiempo largos de ejecucin pero la resolucin es baja y vendran a ser como los planificadores generales del comportamiento del robot. Todo esto habilita alta precisin, rpida accin de respuesta sobre intervalos cortos de tiempo y de espacio, mientras que los planes de largo alcance y los conceptos abstractos se estn formulando sobre amplias regiones del tiempo y el espacio en niveles altos. SOAR Soar = state, operation and result CONTROL DE UN ROBOT MVIL DE SEIS PATAS USANDO LA ARQUITECTURA COGNITIVA SOAR4

La ejecucin de un agente soar o modelo soar est gobernado por un ciclo de decisin [figura 1], en el que el agente escoge una accin apropiada basado en la informacin tomada y sabiendo su situacin actual y con conocimiento a largo plazo.

El ciclo se lo puede dividir en 5 partes 1. La fase de entrada, Soar puede recibir informacin ya sea esta simulada o real, proveniente del ambiente (entrada del sensor).

http://www.personal.psu.edu/lnl/papers/aiaa2008_0878.pdf

2. En la segunda fase, el estado actual es elaborado y las operaciones propuestas estn basados en el contenido de la memoria de trabajo. 3. En esta fase, un operador es seleccionado. Si ms de un operador ha sido propuesto en la segunda fase, soar tiene un mecanismo para intentar escoger el operador ms apropiado para la situacin actual. 4. En la fase de aplicacin, los operadores seleccionados realizan cambios en la memoria de trabajo que hace que el agente se mueva cerca para alcanzar su objetivo actual. 5. En la fase de salida, Soar puede enviar informacin a su entorno externo (motores y servos). El robot hexpodo utilizado en esta investigacin es el HexCrawler, un kit de robtica de Parallax Inc (www.parallax.com). El agente Soar fue desarrollado para ir a un lugar objetivo basado en la ubicacin GPS evitando obstculos, implementa dos operadores complejos: evitar colisiones y llegar al objetivo. Se propone que el operador evite cuando al menos un sensor sonar detecta un obstculo y se propone el operador ir hacia el objetivo cuando no hay obstculos detectados por los sensores del sonar. Cuando el evitar o ir al objetivo son seleccionados por los operadores complejos, se puede producir un callejn sin salida como resultado del entorno. Entonces el entorno se convertira en un espacio problema que limita el llevar a cabo el objetivo de evitar un obstculo o mover el hexpodo a la ubicacin de destino del GPS. En este tipo de problema, los operadores de bajo nivel que son relevantes para el objetivo de evitar o ir hacia el objetivo, pueden proponer, seleccionar y dirigir la forma ms viable para salir del problema suscitado, no siempre alcanza su objetivo pero es bueno para saltar obstculos determinados en tiempo real. Si el agente soar no tiene suficiente conocimiento para seleccionar el mejor operador en la fase de razonamiento, se produce un callejn sin salida donde soar automticamente crea un sub objetivo para determinar el mejor operador. Este mecanismo soporta la ejecucin de las dos jerarquas de objetivos complejos (como operadores abstractos o problemas de espacios) y la unin entre una seleccin reactiva de un operador (cuando hay suficiente conocimiento y se puede escoger uno) y planeacin bajo demanda es la que ocurre cuando falta conocimiento de los resultados producindose en un callejn sin salida. La fragmentacin del mecanismo de aprendizaje en soar, tambin usa la creacin de sub objetivos y se almacena la solucin del problema que fue usada para alcanzar el sub objetivo como una nueva produccin.

LIDA5 UN MODELO DE TRABAJO DE LA COGNICION En este trabajo se presenta la arquitectura LIDA como un trabajo modelo de la cognicin. Argumentamos que estos modelos de trabajo son de amplio alcance y aborda los problemas del mundo real en comparacin con los modelos basados experimentalmente en modelos que se centran en elementos especficos de la cognicin. Aunque los modelos experimentalmente son tiles, necesitamos un modelo de trabajo de la cognicin que integre lo que conocemos de la neurociencia cognitiva y la Inteligencia Artificial. La arquitectura LIDA proporciona tal modelo de trabajo. Un robot basado en la arquitectura cognitiva LIDA o un agente de software ser capaz de aprender mltiples mecanismos. Con sentimientos y emociones artificiales como motivadores primarios y los mediadores de aprendizaje, tales sistemas sern "en vivo" a travs de un perodo de desarrollo en el que van a aprender en mltiples maneras de actuar de una manera eficaz, similar a un humano actuando en entornos dinmicos e
5

http://cogprints.org/5852/1/ICCM06-UR.pdf

impredecibles. Se discute la integracin de los mecanismos de aprendizaje en el IDA existente, la arquitectura como un modelo de trabajo de la cognicin. LA ARQUITECTURA LIDA Es en parte simblica y en parte conexionista con todos los smbolos que se basan en el mundo fsico en el sentido de Brooks (1990). Los mecanismos usados en la implementacin son varios mdulos que han sido inspirados por un nmero de diferentes tcnicas de Inteligencias Artificiales. La arquitectura es parte de entidades compuestas de un relativo alto nivel de abstraccin, como el comportamiento, nodos de mensajes tipo, emociones, etc y parte de bajo nivel de codelets (pequeas piezas de cdigo). Esto describe el mecanismo primario de LIDA. Percepcin, memoria episdica, memoria procesal y la accin de seleccin. Percepcin. Es un sistema simblico perceptual tanto endgeno como exgeno. El conocimiento perceptual en el que se basa este agente es tambin llamado memoria perceptual asociativa, tomado de una red semntica con activacin llamada slipnet. Los nodos de la slipnet constituyen el agente perceptual simblico, representaciones individuales, categoras y quizs alto nivel de ideas y conceptos. Piezas del slipnet contiene nodos y links, juntos con codelets perceptuales con la tarea de copiar la pieza para trabajar de la memoria. El ciclo cognitivo de lida Ya se trate de un animal, software de agente humano o un robot , cada agente autnomo dentro de un ambiente complejo y dinmico debe con frecuencia y de forma cclica muestrear (sensar) su entorno y actuar, de forma iterativa, en lo que llamamos un ciclo cognitivo. Tenemos la sospecha de que se producen estos ciclos cognitivos cada cinco a diez veces por segundo en los seres humanos, en cascada y de manera que algunos de los pasos en ciclos se producen en paralelo (Baars y Franklin 2003 , Franklin et al 2005). Serialidad se conserva en las emisiones conscientes, ahora se describir el ciclo cognitivo dividindolo en nueve pasos. En cada etapa del ciclo, el papel de los sentimientos y las emociones se destacan por ser recursivas. 1. Percepcin. 2. Percepcin del buffer preconciente. 3. Asociaciones locales 4. Asociaciones para competicin. 5. Conciencia abstracta 6. Fuentes de reclutamiento. 7. Contexto de jerarqua de la configuracin de objetivos. 8. Escoger una accin 9. Tomar una accin.

BREVE RESUMEN DE LAS ARQUITECTURAS COGNITIVAS Subsumption Es un control robusto por capas para un robot mvil, donde su idea central es la subsuncin, que es una va de descomposicin inteligente de un comportamiento complicado dentro de mdulos de comportamiento simples, que estn organizados por capas. Cada capa implementa un objetivo particular del robot y las capas ms altas son ms abstractas, cada objetivo de la capa subsume las de las capas inferiores. Ejemplo: la decisin de moverse hacia el frente para alcanzar comida, las capas tienen dentro la capacidad de decisin de evitar el obstculo primero, hay jerarqua en los niveles de cada capa. Niveles de competencia. Evita contacto con los objetos, estacionarios y en movimiento Vagar sin rumbo pero evitando colisiones Explora el mundo identificando los lugares alcanzables (idneos) Construir un mapa del medio ambiente y planear punto o puntos generando rutas Nota los cambios en el ambiente esttico Razona sobre el mundo en termino de objetos Formula y ejecuta planes que involucra cambios en el mundo Razona sobre objetos, comportamientos y adapta planes a ellos Implementacin del ncleo. Cada capa es implementada por el significado de estar interconectados por mdulos de red, cada mdulo tiene entradas, salidas, reset; hay tres clases de seales: normales, inhibidoras, supresoras. RCS o Sistema de control en tiempo real RCS (Albus et al., 1992) es un marco arquitectnico para el desarrollo de agentes fsicos inteligentes. Experiencia reside en un conjunto jerrquico de mdulos de conocimiento, cada uno con su propio largo plazo y recuerdos a corto plazo. Representacin del conocimiento es heterognea, incluyendo marcos, reglas, imgenes y mapas. Mdulos operan en paralelo, con un intrprete sensorial para examinar el actual estado, un modelo mundial para predecir los estados futuros, seleccin juicio de valor entre las alternativas y la generacin de comportamiento que lleva a cabo las tareas. De RCS para 4D/RCS Se origin en los primeros trabajos de James Albus en modelos neurofisiolgicos y redes neurales de adaptacin Originalmente diseado para el control de las instalaciones de fabricacin, en los que la instalacin completa de fabricacin podra ser considerado como un robot distribuido con la planificacin estratgica en los niveles superiores de la jerarqua de controles, las clulas de trabajo

en los niveles medios, mquinas herramientas individuales en los niveles ms bajos, y servos individuales en el nivel inferior modificado y adaptado para vehculos robticos autnomos RCS viene con una metodologa de ingeniera La premisa fundamental es que en cada punto en el tiempo y dentro de cada unidad organizativa, el estado de la tarea define los requisitos para todo el procesamiento sensorial. IDA Para disear y construir sistemas de computacin capaces de ejecutar ellos mismos, ajustando diversas circunstancias, y la preparacin de sus recursos para manejar de manera ms eficiente las cargas de trabajo que ponemos en ellos. Estos sistemas autnomos deben anticiparse a las necesidades y permitir que los usuarios se concentren en lo que quieren lograr en lugar de averiguar cmo aparejar los sistemas informticos para llegar hasta all. Proporciona un modelo conceptual (y computacional) de la cognicin implementado como un agente de software. AIF "vive" en un sistema informtico con conexin a Internet y de diversas bases de datos Lida es ida + aprendizaje Aprendizaje perceptivo (a travs de un Slipnet) Identificacin, clasificacin, relaciones de aprendizaje episdica (a travs de una memoria distribuida Sparse) Para episodios de memoria transitiva, aprendizaje de procedimiento (a travs de un esquema de red), refuerza las acciones de los ciclos anteriores al aprendizaje atencional, aprendizaje de nuevas codelets. SOAR = STATE, OPERATION AND RESULT La ejecucin de un agente soar o modelo soar est gobernado por un ciclo de decisin en el que el agente escoge una accin apropiada basado en la informacin tomada y sabiendo su situacin actual y con conocimiento del objetivo a largo plazo.

BIBLIOGRAFIA
http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.158.3706&rep=rep1&type=pdf http://people.csail.mit.edu/brooks/papers/elephants.pdf http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.15.14&rep=rep1&type=pdf http://www.personal.psu.edu/lnl/papers/aiaa2008_0878.pdf http://cogprints.org/5852/1/ICCM06-UR.pdf