Inteligencia Artificial - 2011

Qué es un agente?

Agentes
Inteligencia Artificial – 2011

“Un agente es un sistema que está situado en algun ambiente, y que es capaz de realizar acciones autónomas en ese ambiente, para cumplir sus objetivos de diseño. Para que un agente sea inteligente de ser proactivo, reactivo y tener habilidad social.”

Wooldridge & Jennings

Inteligencia Artificial - 2011

Inteligencia Artificial - 2011

Qué es un agente?
“Un agente autónomo es un sistema computacional que habita un ambiente, percibe y actúa autónomamente en ese ambiente, y de este modo realiza un conjunto de tareas para las cuales fue diseñado”

Qué es un agente?
“Un agente es todo aquello que puede considerarse que percibe su ambiente mediante sensores y que responde o actúa en tal ambiente por medio de efectores”

Pattie Maes

Russell & Norvig

Inteligencia Artificial - 2011

Inteligencia Artificial - 2011

Qué es un Agente?
¿percibe? ¿actúa sobre el ambiente? ¿Es autónomo? ¿Tiene habilidad social?

Cuál es la diferencia entre Agente y programa?

Autonomía: Capacidad que tiene un agente de aprender de su experiencia y modificar su comportamiento en tiempo de ejecución

2011 Inteligencia Artificial .2011 Agente Racional Agente Racional Cuando es mas exitoso? Cual es la medida de performance? U:E ℜ como describir el éxito? .Inteligencia Artificial .2011 Cuál es la diferencia entre Agente y programa? Cuál es la diferencia entre Agente y objeto? Inteligencia Artificial . an} Medida de performance U:E ℜ Inteligencia Artificial . a2. ….2011 Inteligencia Artificial .2011 Cuál es la diferencia entre Agente y objeto? decirHolaAlaGente() Agente Racional Agente = f :P* A Objeto Hacer lo correcto Decir Hola a la gente “Hola Gente!” Una clase controla sus estados Un agente controla sus estados y comportamiento y es autónomo Acercarse a sus objetivos de diseño Hola! Percibir: E_a percepción Acciones A={a1.2011 Inteligencia Artificial .

2011 Agente Racional A B A Agente Racional B Percepción: posición.2011 Agente Racional A B Agente Racional RELACIÓN ENTRE Inteligencia Artificial . estado-habitación Por ej. apagar Cómo definimos Función Agente: Aspiradora(pos.0]) Percibir([99.la acción puede no ser la que se espera Racionalidad ≠ éxito! Racionalidad ⇒ exploración. [A.0. abajo] Donde: 99=pared.2011 Inteligencia Artificial .1. sucio] Acciones: irIzq.2011 Inteligencia Artificial .0. p2.0. …. aprendizaje.99]) Percibir([99.1. 2= enemigo 1 4 3 2 1 ok arriba ok arriba ok interprete 2 3 4 Agente y percepciones Percepción(5 volt) Sensor de nivel de Agua en el tanque Interpretar percepción CantidadAguaDelTanque=15 lt Percibir([99. Medida de performance (U: E ℜ ): 1 pto por habitación aspirada en el tiempo T? 1 pto por habitación aspirada en cada etapa T menos 1 por movimiento? Penalizar si hay más de K habitaciones sucias? U: E ℜ ?? Inteligencia Artificial . irDer. Racionalidad ≠ omnisciente .Inteligencia Artificial . limpiar. 0= vacía. der.percepciones pueden no proveer toda la información necesaria Racionalidad ≠ percepción extrasensorial .2011 Agente y percepciones Percepción: [izq.. autonomía.2. pn) ⇒ mejorAcción(A) La clasificación como mejorAcción será determinada por los objetivos del agente. estado) devolver acción Si estado = sucio entonces devolver limpiar sino si pos = A devolver irDer sino si pos = B devolver irIzq. Objetivo: mantener la habitación a 20ºC Si T-habitación ‹ 20ºC ⇒ encender Inteligencia Artificial . arriba.0]) BC 2 tipos de información: Cómo evoluciona el entorno independientemente del agente? Cómo se modifica el ambiente por las acciones del agente? La percepción que el agente recibe debe ser interpretada y transformada en conocimiento para el agente . 1= comida. Un Agente Racional elige la acción que maximice la medida de performance dada la secuencia de percepciones hasta el momento.2011 SECUENCIA DE PERCEPCIÓN Y ACCIONES Si (p1.

clima. legal ? Ambiente = calles de Sta fe. Actuators. Síntomas. girar. Estocástico: estado + acción nuevo estado sucio + limpiar limpio vs. Sensors) Medida de Performance = seguridad. Sensors) Medida de Performance = ? Ambiente = ? Acciones = ? Sensores = ? Diseñar un Agente Inteligencia Artificial . válvulas. Environment. agente = arquitectura + programa El Agente y su Ambiente Totalmente Determinístico Inteligencia Artificial . GPS. Environment. velocímetro. Parcialmente observable: Sistemas de Diagnóstico Médico vs. Actuators. respuestas Tratamientos del paciente Paciente Sano. La visión que tiene el agente de su ambiente influencia en el diseño del mismo. autopista. destino. Maximizar el puntaje del estudiante en los examenes Imágenes de Satélites Cinta transportadora con las partes Refinería único vs. Existen diferentes clasificaciones de ambientes. Continuo Preguntas. sugerencias. combustible. peatones. hablar. autopista. girar.2011 AGENTE PERCEPCIÓN ACCIONES Inteligencia Artificial . Sensors) Medida de Performance = seguridad. Mínimo Costo Paciente. peatones. tráfico? Acciones = acelerar. presión y caudal Imprimir una Categorización correcta categorización de la escena Tomar partes Colocar las y ordenarlas partes coen el emparrectamente quetamiento Abrir y cerrar Maximizar pureza. Dinámico vs.(PEAS=Performance. GPS. … ? Programa del agente: Implementar f :P* A Autonomía= asociar a las acciones una medida de performance Decirle que hacer sin decir cómo Diseñar un Agente Inteligencia Artificial . Estudios.2011 El Agente y su Ambiente Inteligencia Artificial . combustible. Actuators. resultados de estudios. sensor combustible. destino. detenerse? Sensores = video. hablar.2011 (PEAS=Performance. minimizar costos. seguridad Imprimir ejercicios. Environment. sensor combustible.2011 OBJETIVOS AMBIENTE observable vs. legal ? Ambiente = calles de Sta fe. frenar. multiagente Palabras Tutor interactivo de tipeadas idioma Conjunto de estudiantes Refinería . El ambiente se analiza desde el punto de vista del agente y no cómo este es realmente. correcciones . velocímetro. frenar. tráfico? Acciones = acelerar.2011 (PEAS=Performance. Secuencial: episodioi= estado + acción vs. clima. etc. … ? Diseñar un Agente Inteligencia Artificial . detenerse? Sensores = video.2011 Ambiente: representa la situación problemática que el agente debe resolver. Hospital Episódico Estático Discreto Agente ? Sistema Pixels de Analizador de intensidad y Imágenes color variado Satelitales Pixels de Robot para tomar partes distinta intensidad Controlador de una refinería Lecturas de temperatura.

velocímetro. agentes. un elemento por agente repetir por cada agente en agentes hacer Percep [agente] ← Obt-Percep(agente. fn-perfomance) retorna acción variables locales: ponderaciones. fn-actualización. maximizar beneficios Ambiente rutas. acción) retornar acción El agente recibe una sola percepción Inteligencia Artificial . El Agente y su Ambiente Considerar los siguientes agentes: 1) robot jugador de fútbol 2) asistente de procesador de texto 3) controlador de máquina expendedora de productos Inteligencia Artificial . vehículos.2011 El Agente y su Ambiente Considerar los siguientes agentes: 1) robot jugador de fútbol 2) asistente de procesador de texto 3) controlador de máquina expendedora de productos Percepciones 1 2 3 Posición en la cancha Palabras escritas Cantidad de productos Acciones Correr. estado) hasta terminación (estado) retornar ponderaciones. o no. estados) ponderaciones ← fn-perfomance(ponderaciones. Objetivos seguro.2011 Percepciones Acciones Meta/Objetivo Ambiente 1 2 3 Inteligencia Artificial . frenar. sonar.Programa de Agente: Estructura básica función AGENTE (percepción) retorna acción static: memoria. estado) fin por cada agente en agentes hacer Acción[agente]← Programa[agente](Percep[agente]) fin estado ← fn-actualización(acciones. Agente Conductor de Taxi Percepciones cámaras.2011 Simulador del Ambiente Inteligencia Artificial . correcciones Reponer producto. agentes. agentes. doblar.2011 Inteligencia Artificial . Máquina llena avisar cuando siempre vacío Meta/Objetivo Hacer gol Ambiente Cancha de fútbol Texto Máquina expendedora 1 El Agente y su Ambiente Considerar los siguientes agentes: 1) robot jugador de fútbol 2) asistente de procesador de texto 3) controlador de máquina expendedora de productos Ambiente Cancha de fútbol Texto Accesible Determinista Episódico Estático Discreto 2 3 Máquina expendedora . clientes Inteligencia Artificial . terminación. patear la pelota Sugerencias.2011 EI Percepción acción Ambiente actualizar El agente decidirá si requiere. la memoria del agente acerca del mundo memoria ← Actualizar-Memoria (memoria. micrófono Acciones acelerar.2011 Esquema de un Programa que Simula Ambientes función Ejecutar-Ambiente (estado. rápido. percepción) action ← Elegir-Mejor-Acción (memoria) memoria ← Actualizar-Memoria (memoria. peatones. construir en su memoria la SP. etc.

2011 Agente reflejo simple Agente-termostato Cómo decide este agente qué acción emprender? función Agente-Reflexivo-Simple (percepción) retorna acción static: reglas. reglas ) acción ← Acción-de-la-Regla [ regla ] retornar acción Si auto-delante está frenado entonces frenar Inteligencia Artificial .Inteligencia Artificial .2011 siguiente: I x percepción I Cómo decide este agente qué acción emprender? SI (sensor-temperatura < temperatura-deseada) ENTONCES acción-elegida(prender) función Agente-Reflexivo-Estado (percepción) retorna acción static: estado.2011 Inteligencia Artificial .2011 El Agente y su Ambiente Considerar los siguientes agentes: 1) robot jugador de fútbol 2) asistente de procesador de texto 3) controlador de máquina expendedora de productos Ambiente 1 Cancha de fútbol Texto Accesible Determinista Episódico Estático Discreto NO NO NO NO NO Tipos de agentes 1) Agente reactivo/reflejo/reflexivo simple 2) Agente reactivo basado en modelos 3) Agente basado en objetivos 4) Agente basado en utilidad 5) Agente que aprende 2 SI SI SI SI SI 3 Máquina expendedora SI SI NO NO SI 1) Agente Reflejo Simple Reglas condición-acción Inteligencia Artificial . un conjunto de reglas condición-acción acción. la acción más reciente estado ← Actualiza-Estado ( estado.2011 Inteligencia Artificial . percepción ) regla ← Selector-Regla ( estado . descripción del estado actual del Ambiente reglas. acción. reglas ) acción ← Acción-de-la-Regla [ regla ] retornar acción .2011 Agente reflejo simple Agente-termostato 2) Agente Reflejo basado en modelos Inteligencia Artificial . un conjunto de reglas condición-acción estado ← Interprete-Entrada ( percepción ) regla ← Selector-Regla ( estado .

sensor-temperatura)<temperatura-deseada) ENTONCES (acción-elegida(prender)) 3) Agente basado en objetivos Inteligencia Artificial . el agente puede actualizar su conocimiento acerca de cuan bien trabajarán sus frenos. Un agente reflexivo frena cuando observa encendidas las luces de freno del vehículo que va delante de él.2) Agente Reflejo basado en modelos Inteligencia Artificial . En el ejemplo del Taxista.2011 2) Agente Reflejo basado en modelos Actualizar esta información interna acerca del estado requiere que se codifiquen dos tipos de conocimientos: i. • Un agente dirigido por objetivos. el disminuirá su velocidad. Si comienza a llover. esto provocará automáticamente que se adapte el comportamiento a las nuevas condiciones. ya que el programador ha pre-procesado las acciones correctas para cada caso. la información acerca de como las acciones del agente afectan al mundo (por ej. . la única acción que permite alcanzar el objetivo de “no chocar” es frenar. modelo ii. el agente debe mantener en su memoria si en su última inspección del espejo lateral observó algún vehículo en su carril lateral. si éste desea pasar el auto que va delante de él. la información acerca de como evoluciona el mundo independientemente del agente (por ej. deberíamos re-escribir un gran número de reglas condición-acción ante cambios del dominio. Para el agente reflexivo. A partir de la forma en que usualmente evoluciona el mundo. El programa del agente puede combinar la información sobre objetivo y el resultado de las acciones posibles para seleccionar la acción necesaria para alcanzar el objetivo. ya que la información que posee de observar hacia adelante no es suficiente para realizar la acción. En algunos problemas el agente necesita mantener internamente algo de información acerca del estado del mundo (ambiente).2011 Los sensores no dan acceso a una descripción completa del estado del mundo. Este agente considera dos aspectos: i. en principio razonará que si observa encendidas las luces de freno del auto que va delante.2011 Agente reflejo basado en modelo Agente-termostato Agente reflejo basado en modelo Agente-termostato Cómo decide este agente qué acción emprender? Cómo decide este agente qué acción emprender? SI (siguiente(estado-temperatura.Cuánto más lo complace cada acción? Esta información no se utiliza explícitamente en los agentes reflexivos.2011 En el ejemplo del Taxista: • Inteligencia Artificial .: los otros vehículos en la autopista) Inteligencia Artificial . de forma de poder distinguir entre dos estados del mundo que generan la misma percepción por parte de los sensores.2011 Inteligencia Artificial . Que ocurre si ejecuta tal o cual acción? ii.: que ocurre cuando ejecute la acción de pasarse de carril en la autopista) Inteligencia Artificial .2011 El agente necesita información sobre el objetivo que persigue. el cual describe las situaciones deseables.

Función Utilidad: U: E ℜ Usar cuando: • existen objetivos conflictivos (velocidad. que hacen sus acciones.apagarse Qué pasa si el mundo es completamente accesible? .2011 Un objetivo sólo distingue entre un estado de éxito y fracaso. cómo evoluciona el mundo.2011 Ejercicio: definir un Agente-aspiradora El objetivo del agente-aspiradora es que ambas habitaciones estén limpias Agente-aspiradora suciedad Crítica: mecanismo de retroalimentación que analiza la manera de actuar Aprendizaje: incorpora nuevas reglas basadas en el conocimiento obtenido por la experiencia.2011 Inteligencia Artificial .Inteligencia Artificial . (por ej. objetivo) acción= primera(secuencia-acciones) Búsqueda Planificación … 4) Agente basado en utilidad Inteligencia Artificial .aspirar . de acuerdo a cuan exitoso sería el agente si los alcanza. Una medida de perfomance más general debería permitir comparar diferentes estados del Mundo (o secuencia de estados). Acciones mejores a largo plazo hab1 hab2 Sensores: .moverse .2011 Inteligencia Artificial . seguridad) • varios objetivos que no puedan alcanzarse con certeza 5) Agente que aprende Inteligencia Artificial .2011 Agente basado en objetivo Agente-termostato Agente basado en objetivo Agente-termostato Cómo decide este agente qué acción emprender? Cómo decide este agente qué acción emprender? objetivo: 25°C < estado-temperatura < 30°C estado-temperatura = actualizar(sensor-temperatura) secuencia-acciones = buscar-secuencia-acciones(estado-temperatura.sucio/limpio (1/0) Actuadores: . etc) Generador de problemas: sugerir acciones que lo lleven a tener nuevas experiencias.2011 4) Agente basado en utilidad Inteligencia Artificial .

2011 .Toma de decisiones? .Acciones: irH.2011 Ejercicio: definir un Agente-aspiradora como un agente basado en objetivo Ejercicio: definir un Agente-aspiradora como un agente basado en objetivo .Acciones: irH.2011 Ejercicio: definir un Agente-aspiradora como un agente reflejo-simple Ejercicio: definir un Agente-aspiradora como un agente reflejo-simple basado en modelo Inteligencia Artificial .“IF no hay suciedad en H THEN irHabitación” -Toma de decisiones: reglas IF-THEN -“IF hay suciedad en H THEN aspirar” -“IF no hay suciedad en H THEN irHabitación” .Toma de decisiones: reglas IF-THEN -“IF hay suciedad en H THEN aspirar” . irH2.Secuencia de acciones para alcanzar el objetivo: Aspirar. aspirar. apagarse .Toma de decisiones: reglas IF-THEN .Estado interno o modelo del mundo? .Inteligencia Artificial .“IF limpia(H1) AND limpia(H2) THEN apagarse” Este mundo es determinístico? Que pasa si el aspirar no aspira TODA la suciedad existente? Qué pasa si no sabe cuántas habitaciones hay? Inteligencia Artificial . apagarse . aspirar .Toma de decisiones: reglas IF-THEN -“IF hay suciedad en H THEN aspirar” .Toma de decisiones: búsqueda.Acciones: irH.Objetivo: ambas habitaciones limpias . planificación. apagarse .2011 Inteligencia Artificial .y el apagarse? Inteligencia Artificial .2011 Inteligencia Artificial .Evaluar si llegó al objetivo .Llegó al objetivo? .Objetivo? .2011 Ejercicio: definir un Agente-aspiradora como un agente reflejo-simple Ejercicio: definir un Agente-aspiradora como un agente reflejo-simple . aspirar.“IF no hay suciedad en H THEN irHabitación” .Posibles estados que satisfacen el objetivo: Cómo son las acciones ahora? . sistema de reglas… . aspirar.