Módulo 1, Sección 4

Sistemas con Estados
Agentes que reaccionan a lo que perciben y a lo que recuerdan

Antonio Reynoso Lobato

1

Objetivo de la Sección

Analizar: agentes que tienen la capacidad de recordar propiedades y de almacenar modelos internos del mundo

Antonio Reynoso Lobato

2

Temas • Representación mediante vectores de características • Redes de Elman • Representaciones icónicas • Sistemas basados en pizarras • Consideraciones adicionales Antonio Reynoso Lobato 3 Representaciones Icónicas • Estructura de Datos: – Matriz: para almacenar un mapa en el que se representan las casillas que estén libres u ocupadas en el momento que sean percibidas • Los agentes reactivos reaccionan a la estructura de datos de la misma forma que los agentes sin memoria reaccionan a los estímulos sensoriales. ya que calculan un conjunto de características a partir de la matriz Antonio Reynoso Lobato 4 .

Agente con representación icónica Características: Representan el entorno de una forma adecuada al tipo de acción Las entradas sensoriales se utilizan para actualizar la representación icónica Cálculos para extraer las características requeridas Acciones: -Modifican la representació icónica -Tienen algun efecto sobre el entorno Antonio Reynoso Lobato 5 Representación icónica de tipo Mapa • Matriz en la que se representan: – – – – Las celdas libres con: 0 Las celdas ocupadas con: 1 Los estados desconocidos con: ? La posición del robot con: R • El agente debe tener: – Sensores que puedan percibir el estado de cualquiera de las casillas – Después de emprender la acción debe de actualizar la representación para cambiar su posición y tener en cuenta nuevas entradas sensoriales Antonio Reynoso Lobato 6 .

o bien – Calcular incrementalmente respecto de la posición del robot cuando éste necesite determinar el siguiente movimiento Antonio Reynoso Lobato 8 .Campo de Potencial Artificial • Entorno representado por un campo de potencial bidimensional: – Se obtiene sumando las fuerzas “atractivas” y las “repulsivas” Pa(X) = k1d(X)^2 donde: d((X) es la distancia euclidea entre el punto X y el objetivo (donde toma el valor 0) • Posición Objetivo: (donde dirigirse) • Obstáculos en el entorno: Pr(X) = k2/do(X)^2 donde: do(X) es la distancia euclidea entre el punto X y el punto mas cercano del obstáculo Antonio Reynoso Lobato 7 Campo de Potencial Artificial • Potencial total: P = Pa + Pr – El movimiento del robot sigue el gradiente (pendiente) del campo de potencial • Campo de potencial: – Puede ser calculado y almacenado en la memoria del robot como un modelo del mundo.

• o también lleve a cabo una acción externa que afecte el entorno – Cuando dos o mas MC obtengan un 1 al evaluar su condición Antonio Reynoso Lobato 10 • Mecanismo de resolución de conflictos: . – que se lee y se modifica por un programa llamado: – Módulo de conocimiento (MC) formado por una parte de: • Condición: que calcula el valor de una característica y puede ser cualquier condición definida sobre los datos de la pizarra que devuelve un 1 o un 0 • Acción: constituida por cualquier programa que modifique la pizarra (que también puede ser modificada por el sistema perceptual).Curvas Equipotenciales Objetivo Potencial “atractivo” Robot Potencial “repulsivo” Potencial total Curvas equipotenciales Problema: Mínimos de potencial (hoyos) que pueden atrapar al robot Trayectoria Antonio Reynoso Lobato 9 Sistemas basados en Pizarras • Estructura de datos (pizarra) que albergará la solución de un problema particular y/o los cambios que habrá de realizar en el entorno de acuerdo a un objetivo determinado.

Vision esquematizada • Las pizarras se organizan jerárquicamente: – Cada nivel de jerarquía puede estar formado por una o mas pizarras subordinadas una parte o partes de la pizarra – Detectan alguna condición particular y proponen una serie de cambios que pueden activar a otros MC que a su vez pueden provocar la activación de otros MC 11 • Los MC son “expertos” sobre Antonio Reynoso Lobato Robot • Percibe las ocho casillas que lo rodean pero: – Los sensores pueden dar información errónea • Puede almacenar una representación parcial del mundo que lo rodea • Pero: puede estar incompleta o ser errónea Antonio Reynoso Lobato 12 .

• Aplicaciones: – Modelos etológicos – Modelos psicológicos estados finitos con capacidad de aprendizaje • Las redes de Elman son un ejemplo de autómata de Antonio Reynoso Lobato 14 . – Los sistemas con estados son más comunes que los agentes E-R.Corregir los errores • MC: Rellenador de huecos examina la pizarra para localizar pasillos estrechos (en el mapa) y los rellena con 1´s o los expande con 0´s datos sensoriales con los que hay en el mapa e intenta corregir cualquier discrepancia ejecución de determinada acción una vez que el mapa ha sido corregido • MC: Filtro sensorial compara los S4 =1: error S7: error • Otros MC que propongan la Antonio Reynoso Lobato 13 Consideraciones Adicionales • Agentes con Histéresis: cuyo comportamiento depende de la historia pasada.

Consideraciones Adicionales • Aplicaciones de los sistemas basados en pizarras: – Sistema de reconocimiento de voz – Interpretación de señales – Monitorización inteligente de pacientes • Aplicaciones de campos de potencial: – Aprendizaje de mapas espaciales: • Incertidumbre sobre el estado actual • Incertidumbre sobre los efectos de las acciones Antonio Reynoso Lobato 15 .