You are on page 1of 4

El aprendizaje colaborativo - para robots

Algoritmo permite a los agentes independientes
producen colectivamente un modelo de
máquina-aprendizaje sin agregación de datos.

El aprendizaje automático, en el que los ordenadores aprendan nuevas habilidades
mediante la búsqueda de patrones en los datos de entrenamiento, es la base de la
mayoría de los recientes avances en la inteligencia artificial, los sistemas de
reconocimiento de voz a los coches de auto-estacionamiento. Es también la técnica que
los robots autónomos suelen utilizar para construir modelos de sus entornos.
Ese tipo de construcción de modelos se complica, sin embargo, en los casos en los que
grupos de robots trabajan como equipo. Los robots pueden haber reunido información
que, colectivamente, se producen un buen modelo, pero que, de forma individual, es
casi inútil. Si las restricciones sobre el poder, la comunicación, o la computación
significa que los robots no pueden poner en común sus datos en un solo lugar, ¿cómo
van a construir colectivamente un modelo?
En la incertidumbre en conferencia de Inteligencia Artificial en julio, los investigadores
del Laboratorio del MIT para la información y la toma de Sistemas responderán esa
pregunta.Presentan un algoritmo en el que los agentes distribuidos - como robots que
exploran un edificio - recoger datos y analizarlos de forma independiente. Las parejas
de agentes, como los robots que pasan el uno al otro en el pasillo, a continuación,
analiza el intercambio.
En experimentos con varios conjuntos de datos diferentes, algoritmo distribuido de los
investigadores en realidad superó a un algoritmo estándar que funciona en los datos
agregados en un solo lugar.
"Un solo equipo tiene un problema de optimización muy difícil de resolver con el fin de
aprender un modelo a partir de un único lote gigante de los datos, y puede quedar
atrapado en malas soluciones", dice Trevor Campbell, un estudiante graduado en la
aeronáutica y astronáutica en el MIT, que escribió el nuevo papel con su asesor,
Jonathan Cómo, el Richard Cockburn Maclaurin profesor de Aeronáutica y
Astronáutica. "Si trozos más pequeños de datos son primero procesados por los robots
individuales y luego se combinan, el modelo final es menos probable que se atascan en
una mala solución."
Campbell dice que la obra fue motivada por preguntas sobre la colaboración
robot. Pero también podría tener implicaciones para los grandes datos, ya que
permitiría a los servidores distribuidos de combinar los resultados de su análisis de los
datos, sin agregación de los datos en una ubicación central.
"Este procedimiento es completamente sólida a casi cualquier red que se pueda
imaginar", dice Campbell. "Es en gran medida un algoritmo de aprendizaje flexible para
redes descentralizadas."
Problema a juego
Para tener una idea del problema Campbell y cómo resolver, imaginar un equipo de
robots que exploran un edificio de oficinas desconocido. Si su algoritmo de aprendizaje
es lo suficientemente general, ellos no tienen ninguna noción previa de qué es una silla
o una mesa, por no hablar de una sala de conferencias o una oficina. Pero podrían
determinar, por ejemplo, que algunas habitaciones contienen un pequeño número de
objetos en forma de silla-junto con aproximadamente el mismo número de objetos en
forma de tabla, mientras que otras habitaciones contienen un gran número de objetos
en forma de silla-junto con una sola tabla- objeto en forma.
Con el tiempo, cada robot va a construir su propio catálogo de tipos de habitaciones y
sus contenidos. Pero imprecisiones suelen colarse: Un robot, por ejemplo, podría
suceder a encontrar una sala de conferencias en la que algún viajero ha dejado una
maleta y la conclusión de que las maletas son características habituales de las salas de
conferencias.Otro podría entrar en una cocina, mientras que la cafetera está oscurecida
por la puerta de la nevera abierta y dejar la cafetera fuera su inventario de artículos de
cocina.
Idealmente, cuando dos robots encuentran entre sí, se compararían sus catálogos,
reforzando las observaciones mutuas y corregir omisiones o generalizaciones. El
problema es que no saben cómo hacer coincidir categorías. Tampoco conoce la
etiqueta de "cocina" o "sala de conferencias"; sólo tienen etiquetas como "habitación
1" y "sala 3", cada uno asociado a diferentes listas de características distintivas. Pero la
habitación de un robot 1 podría ser la habitación de otro robot 3.
Con Campbell y el algoritmo de Cómo, los robots tratan para que coincida con las
categorías sobre la base de elementos de lista compartidos. Esto se ve obligada a llevar
a errores: Un robot, por ejemplo, podría haber deducido que los sumideros y botes de
basura a pedal están distinguiendo características de baños, otra que se están
distinguiendo características de las cocinas. Pero hacen todo lo posible, la combinación
de las listas que ellos piensan que corresponde.
Cuando uno de esos robots cumple otro robot, realiza el mismo procedimiento,
haciendo coincidir las listas lo mejor que pueda. Pero aquí está el paso crucial: A
continuación, se retira cada una de las listas de origen independiente y revanchas a los
demás, repitiendo este proceso hasta que no hay resultados de reordenamiento. Lo
hace de nuevo con cada nuevo robot que encuentra, construyendo gradualmente
modelos cada vez más precisos.
Para Imponer
Este procedimiento relativamente sencillo resulta de un análisis matemático muy
sofisticado, que los investigadores presentes en su papel. "La forma en que los
sistemas informáticos aprenden estos modelos complejos en estos días es que se
postula un modelo más simple y luego lo utiliza para aproximarse a lo que se obtendría
si fueron capaces de hacer frente a todos los matices y complejidades locos", dice
Campbell. "Lo que nuestro algoritmo no es una especie de reintroducir artificialmente
la estructura, después de que haya resuelto el problema más fácil, y luego usar esa
estructura artificial para combinar los modelos correctamente."
En una aplicación real, los robots probablemente no acaba de estar clasificando
habitaciones de acuerdo a los objetos que contienen: También estarían clasificando los
objetos mismos, y probablemente sus usos. Pero procedimiento Campbell y How
generaliza a otros problemas de aprendizaje igual de bien.
El ejemplo de habitaciones clasificar de acuerdo con el contenido, por otra parte, tiene
una estructura similar a un problema clásico en el procesamiento del lenguaje natural
llamado modelado tema , en el que un equipo intenta utilizar la frecuencia relativa de
las palabras para clasificar documentos de acuerdo al tema. Sería tremendamente
práctico para almacenar todos los documentos en la Web en un solo lugar, por lo que
un algoritmo de aprendizaje de máquina tradicional podría proporcionar un sistema de
clasificación uniforme para todos ellos. Pero Campbell y el algoritmo de ¿Cómo se
entiende que los servidores dispersos podrían batir lejos en los documentos en sus
propios rincones de la Web y aún producir un modelo de tema colectivo.
"La computación distribuida jugará un papel crítico en el despliegue de múltiples
agentes autónomos, como los múltiples vehículos terrestres y aéreos autónomos", dice
Lawrence Carin, profesor de ingeniería eléctrica e informática y vicerrectora de
investigación de la Universidad de Duke. "El método variacional distribuido propuesto
en este trabajo es computacionalmente eficiente y práctico. Una de las claves para ello
es una técnica para el manejo de la ruptura de simetrías que se manifiestan en la
inferencia bayesiana. La solución a este problema es muy novedoso y es probable que
se deje sentir en el futuro por otros investigadores ".