Un perro robot aprende a caminar en terrenos difíciles en solo 20 minutos


rap«>El césped y las rutas de senderismo no son un problema para este robot, que ha aprendido a caminar sobre la marcha gracias a un algoritmo de aprendizaje automático.

Tecnología


26 de agosto de 2022


Un perro robot puede aprender a caminar en terrenos desconocidos y difíciles de dominar, como césped, ladridos y senderos para caminatas, en solo 20 minutos, gracias a un algoritmo de aprendizaje automático.

La mayoría de los robots autónomos deben ser cuidadosamente programados por humanos o probados exhaustivamente en escenarios simulados antes de que puedan realizar tareas del mundo real, como escalar una colina rocosa o una pendiente resbaladiza, y cuando se encuentran con entornos desconocidos, tienden a tener dificultades.

Ahora, Sergey Levine de la Universidad de California, Berkeley y sus colegas han demostrado que un robot que utiliza un tipo de aprendizaje automático llamado aprendizaje de refuerzo profundo puede descubrir cómo caminar en unos 20 minutos en varios entornos diferentes, como un césped. , una capa de corteza, un colchón viscoelástico y una ruta de senderismo.

El robot utiliza un algoritmo llamado Q-learning, que no requiere un modelo funcional del terreno objetivo. Dichos algoritmos de aprendizaje automático se utilizan normalmente en simulaciones. «No necesitamos descubrir cómo funciona realmente la física de un entorno, simplemente colocamos el robot en un entorno y lo activamos», explica Levine.

En cambio, el robot recibe una determinada recompensa por cada acción que realiza, en función de su éxito frente a objetivos predefinidos. Repite este proceso continuamente mientras compara sus éxitos anteriores hasta que aprende a caminar.

«En cierto modo, es muy similar a cómo aprende la gente», dice el miembro del equipo Ilya Kostrikov, también de la Universidad de California, Berkeley. «Interactuar con un entorno, recibir utilidad y simplemente pensar en su experiencia pasada y tratar de comprender qué se podría haber mejorado».

Aunque el robot puede aprender a caminar sobre cada nueva superficie que encuentra, Levine dice que el equipo debería refinar el sistema de recompensas del modelo si el robot quiere aprender otras habilidades.

Hacer que el aprendizaje por refuerzo profundo funcione en el mundo real es difícil, dice Chris Watkins de Royal Holloway, Universidad de Londres, debido a la cantidad de variables y datos diferentes que deben interactuar al mismo tiempo.

«Creo que es muy impresionante», dijo Watkins. «Honestamente, estoy un poco sorprendido de que puedas usar algo tan simple como Q-learning para aprender habilidades como caminar sobre diferentes superficies con tan poca experiencia y tan rápido en tiempo real».

Referencia: arxiv.org/abs/2208.07860

Obtenga más información sobre estos temas:

Sé el primero en comentar

Deja un comentario