Gran Turismo AI: el controlador de la computadora puede vencer a algunos de los mejores jugadores del mundo


rap«>Una IA entrenada para ganar el juego de PlayStation 4 Gran Turismo Sport ha vencido a algunos de los mejores jugadores del mundo aprendiendo a manejar las partes más difíciles de las pistas de carreras.

La tecnologia


9 de febrero de 2022

Deportes GT

Gran Turismo Sport es un juego de carreras

polifonía digital

Una inteligencia artificial ha vencido a cuatro de los mejores pilotos humanos del mundo en tres pistas diferentes en el videojuego de carreras Deportes de gran turismoganando terreno en los tramos más difíciles de un circuito.

La IA, llamada GT Sophy, pudo ejecutar movimientos tácticos como usar la estela de un oponente para impulsarse hacia adelante y bloquear el paso de los oponentes.

Peter Wurman de Sony AI en Nueva York y sus colegas entrenaron el sistema usando aprendizaje de refuerzo profundo, un tipo de aprendizaje automático que usa recompensas y penalizaciones para enseñar a la red neuronal de IA cómo ganar. Durante el entrenamiento, GT Sophy, que se ejecutaba en una computadora separada, jugó el juego en hasta 20 consolas PlayStation 4 simultáneamente.

El equipo le dio a la IA la capacidad de acelerar, frenar y conducir, así como información en tiempo real sobre la posición de los autos en el juego, incluido el suyo propio, y un mapa de los próximos 6 segundos de la pista, lo que significó viendo una distancia más larga por delante cuando la IA se movía más rápido. Los investigadores señalan que esta información no está disponible para los jugadores humanos, lo que le da a la IA una ligera ventaja, pero dicen que las personas tienen otras ventajas, como la capacidad de cambiar de marcha manualmente, que la IA no tenía.

Wurman y su equipo premiaron a GT Sophy por mantener el rumbo y conducir más rápido, y penalizaron a la IA por desviarse o reducir la velocidad. En cuestión de días, la IA aprendió a completar pistas más rápido que el 95 % de los jugadores humanos, en comparación con las clasificaciones en las tablas de clasificación en línea.

Durante aproximadamente nueve días adicionales de entrenamiento, GT Sophy recortó décimas de segundo de sus tiempos de vuelta en un total de 45 000 horas de manejo para terminar más rápido que cualquier jugador humano en las tablas de clasificación.

Sin embargo, GT Sophy se encontró con un escollo. La IA inicialmente evitó adelantar a los oponentes rápidos para minimizar el riesgo de colisión y maximizar las recompensas. Para superar este comportamiento demasiado seguro, los investigadores recompensaron a la IA por pasar a los oponentes y la penalizaron por pasar.

Al asociarse con un jugador competitivo de GT, el equipo se concentró en un pequeño conjunto de las partes más difíciles de cada pista, por lo que GT Sophy pudo aprender rápidamente a sobresalir en esas áreas. Luego, los investigadores desafiaron a cuatro de los mejores jugadores de GT del mundo a competir contra cuatro ejemplos de GT Sophy en una carrera por equipos, por lo que ocho autos estaban en la pista en total. La IA ganó 104-52, con puntos calculados en función de las posiciones finales de los corredores.

“Los resultados sugieren que podría ser posible que los desarrolladores de juegos usen el aprendizaje de refuerzo profundo para diseñar y probar sus juegos, y producir oponentes y compañeros de equipo interesantes para los jugadores humanos”, dice Igor Babuschkin de ‘OpenAI en San Francisco.

Los resultados tendrán poco impacto en la mejora de los vehículos autónomos, que deben sentir el entorno y navegar en condiciones más variables.

«Si bien GT Sophy logró lograr resultados impresionantes, mucho depende de la configuración y las características específicas del juego», dice Georgios Yannakakis del Instituto de Juegos Digitales de Malta.

Referencia de la revista: La naturalezaDOI: 10.1038/s41586-021-04357-7

Únase a nosotros para un festival alucinante de ideas y experiencias. Nuevo científico en vivo se vuelve híbrido, con un evento en vivo en Manchester, Reino Unido, que también puede disfrutar desde la comodidad de su hogar, del 12 al 14 de marzo de 2022. encontrar Siguiente.

Obtenga más información sobre estos temas:

Sé el primero en comentar

Deja un comentario