En DeepMind, una subsidiaria de Alphabet la empresa matriz de Google, se ha entrenado una IA (inteligencia artificial) para que algún día se convierta en el Lionel Messi digital. ¿Cómo? Siguiendo una dinámica no muy distinta a la que se utilizaría en cualquier escuela de fútbol para enseñar a jugar a un niño. Solo que partiendo desde 0 y a un ritmo mucho más acelerado.
En Alphabet comenzaron permitiendo que la IA tome el control de figuras digitales que tienen formas y movimientos humanos. Paso a paso los científicos les enseñaron a andar, regatear o driblear, lanzar y finalmente, jugar con diferentes trucos en competiciones básicas con equipos de dos jugadores de balines.
La IA que pudo marcar un gol e incluso, realizar faltas
En las primeras etapas, los personajes aprendieron las habilidades básicas de movimiento y manejo de la pelota. Este proceso consume las primeras 24 horas de entrenamiento pero representa alrededor de un año y medio de partidos simulados.
En la segunda fase del experimento se empezaron a aplicar los comportamientos cooperativos y de trabajo en equipo típicos de un juego real.
New Scientist señala que las habilidades de trabajo en equipo, que son esenciales para que la IA detecte dónde se recibirá un pase, toman un poco más: unas dos o tres décadas de juegos de simulación, el equivalente a dos o tres semanas en el mundo real.
“Nuestros agentes adquirieron habilidades como la locomoción ágil, el pase y la división del trabajo, tal y como demuestran una serie de estadísticas, incluidas las métricas que se usan en los análisis deportivos del mundo real”, explica DeepMind. Entre las habilidades que muestra la IA se destaca, por ejemplo, la capacidad de anticipar el comportamiento de sus compañeros.
“Al principio del entrenamiento, todos los agentes se limitaban a correr hacia el balón. Al cabo de unos días veíamos que se daban cuenta de que uno de sus compañeros tenía el control del balón, se daban la vuelta y corrían por el campo, anticipando que intentaría marcar o tal vez pasar el balón”, explica DeepMind a Wired Guy Lever, parte del equipo que ha plasmado sus estudios en Science Robotics.
Hace unos cinco años, los investigadores intentaron enseñar explícitamente a los personajes cómo superar obstáculos. La experiencia deja una lección sobre las bondades del ensayo y error y el aprendizaje por refuerzo (RL), pero sus patrones de movimiento son “antinaturales”, con cierto sentido del humor. El problema, admite DeepMind, es que son “poco realistas” para los robots.
El desafío no es tanto tener una IA capaz de mover figuras que imiten a los humanos para lograr un “comportamiento bien afinado”, que es necesario para caminar sobre terreno irregular o incluso manejar objetos frágiles.
“Los movimientos neuronales pueden dañar el propio robot o su entorno, o al menos agotar la batería”, dijo la subsidiaria Alphabet. Por lo tanto, se hacen esfuerzos para crear robots con un comportamiento “seguro y efectivo” que respondan a los comandos que reciben.
Y en este empeño, el juego de Cristiano Ronaldo o Kylian Mbappé podría convertirse en un aliado inesperado. “El fútbol ha sido durante mucho tiempo un reto para la investigación de la inteligencia incorporada, ya que requiere habilidades individuales y un juego de equipo coordinado”, detallan en DeepMind.
Para lograr su objetivo, los científicos utilizaron principios motores neuroprobabilísticos (NPMP), que se basan en aprender patrones de movimiento tomados de humanos y animales y ayudar a traducir los comandos de control.
“Ya habíamos demostrado que el comportamiento coordinado puede surgir en equipos que compiten entre sí. El NPMP nos permitió observar un efecto similar en un escenario que requería un control motor significativamente más avanzado”, profundiza la compañía.
“Básicamente sesga su control motor hacia un comportamiento humano realista, movimientos humanos realistas. Y eso se aprende de la captura de movimiento, en este caso, actores humanos jugando al fútbol”, comenta el equipo a Wired. Como parte del mismo proceso, se recompensó también a la IA para que no se desviase de las estrategias marcadas para cada escenario.
SEGUIR LEYENDO