Entrenar a un robot con código lleva mucho tiempo y trabajo, por eso, los especialistas en robótica están centrando sus esfuerzos en desarrollar un robot automatizado que aprenda mientras observa a los humanos. De manera que cada persona en el futuro puede enseñarle a su robot cómo hacer las tareas que requiere, bien sean domésticas, de oficina, de cocina, etc. Los robots pasarían a ser una especie de nuevos empleados que cada persona puede capacitar mostrándoles muchas tareas.
Los investigadores del MIT han desarrollado un sistema que permite a los robots aprender mientras observan a los humanos. Es un robot especial para tareas complicadas con reglas que parecen confusas desde el punto de vista de la programación.
En esencia, el sistema de “Planificación con especificaciones inciertas” (PUnS, por sus siglas en inglés) de los investigadores proporciona a los robots la capacidad de planificación humana para sopesar simultáneamente muchos requisitos ambiguos y potencialmente contradictorios para alcanzar un objetivo final. El sistema elige la acción más probable para la tarea que se supone que debe realizar.
Los investigadores probaron el robot en una tarea que puede ser muy ambigua, como puede ser poner la mesa bajo ciertas condiciones. Un brazo robótico observó por primera vez demostraciones humanas seleccionadas al azar de poner la mesa con los objetos. Luego, los investigadores asignaron al brazo la tarea de establecer automáticamente una mesa en una configuración específica, en experimentos del mundo real y en simulación. El robot debía basar sus acciones en el conocimiento adquirido cuando vio a humanos hacerlo.
El robot había aprendido cómo colocar 8 objetos, una taza, un vaso, una cuchara, un tenedor, un cuchillo, un plato, un plato pequeño y un tazón, en diferentes configuraciones sobre una mesa. Para tener éxito, el robot tuvo que sopesar muchos posibles pedidos de ubicación, incluso cuando los artículos se eliminaron, apilaron u ocultaron a propósito. Cualquier robot se confundiría de inmediato en estas circunstancias. Pero este robot no cometió errores en las pruebas del mundo real y solo se equivocó algunas veces en decenas de miles de pruebas simuladas.
“La visión es poner la programación en manos de expertos en dominios, que pueden programar robots de manera intuitiva, en lugar de describir órdenes a un ingeniero para agregar a su código”, dice el primer autor Ankit Shah, un estudiante graduado en el Departamento de Aeronáutica y Astronáutica (AeroAstro) y el Interactive Robotics Group, que enfatizan que su trabajo es solo un paso para cumplir esa visión. “De esa manera, los robots ya no tendrán que realizar tareas preprogramadas. Los trabajadores de la fábrica pueden enseñarle a un robot a realizar múltiples tareas de ensamblaje complejas. Los robots domésticos pueden aprender cómo apilar gabinetes, cargar el lavavajillas o poner la mesa a la gente en casa”.
Los robots son buenos planificadores en tareas con “especificaciones” claras, pero poner la mesa aprendiendo de los humanos puede ser una tarea muy incierta. Los modelos actuales no pueden llevar a cabo tareas tan inciertas. Este nuevo sistema permite que un robot tenga una “creencia” sobre una gama de posibles especificaciones, gracias a que está basado en la “lógica temporal lineal” (LTL), un lenguaje expresivo que permite el razonamiento robótico sobre los resultados actuales y futuros.