Niantic trabaja un Gran Modelo Geoespacial basado en los datos de los jugadores de Pokémon Go

Guardar

Niantic ha anunciado que está desarrollando un Gran Modelo Geoespacial (LGM, por sus siglas en inglés) impulsado por Inteligencia Artificial (IA), que estará basado en los datos registrados por los usuarios de servicios de la compañía como Pokémon Go, y que permitirá a los modelos obtener habilidades de "comprensión espacial".

Actualmente, los modelos de IA tienen dificultades para visualizar e inferir partes faltantes de una escena, así como para imaginar cómo sería un lugar desde un nuevo ángulo. Se trata de la "comprensión espacial", una característica del razonamiento humano que se basa la información de "innumerables escenas similares" visualizadas en distintos momentos.

Sin embargo, tal y como ha señalado Niantic, esta tarea es "extraordinariamente difícil" para las máquinas. En este marco, de cara a avanzar hacia "la próxima frontera de los modelos de IA", la compañía ha anunciado que está desarrollando un nuevo Gran Modelo Geoespacial, que dispondrá de capacidades de "inteligencia espacial".

En concreto,como ha explicado en un comunicado en su web, este concepto de modelo geoespacial utilizará el aprendizaje automático a gran escala para comprender una escena y, a partir de ello, conectarla con "millones de otras escenas" a nivel global.

Para ello, se basará en los datos recabados por su Sistema de Posicionamiento Visual (VPS), con el que han entrenado más de 50 millones de redes neuronales con más de 150 billones de parámetros, lo que, según ha detallado, permite el funcionamiento en más de un millón de ubicaciones.

VPS es una tecnología propia de Niantic, que ofrece una precisión a nivel centimétrico y la capacidad de que el contenido digital persista y cambie según el comportamiento del usuario. En concreto, es la tecnología que utiliza la compañía para sus juegos basados en la ubicación, como es el caso de Pokémon Go y su nueva función experimental Pokémon Playgrounds.

Así, con una sola imagen capturada desde un 'smartphone', el sistema permite determinar la posición y orientación del usuario, utilizando un mapa 3D creado a partir de la información que comparten las personas que escanean ubicaciones en los juegos de la desarrolladora y Scaniverse.

Además, se trata de un conjunto de datos únicos, ya que se toman desde una perspectiva peatonal y, por tanto, incluyen lugares inaccesibles mediante otros métodos, como los automóviles.

Teniendo todo ello en cuenta, la compañía ha matizado que cada una de las redes locales del sistema VPS contribuiría al gran modelo global, "implementando una comprensión compartida de las ubicaciones geográficas y comprendiendo lugares que aún no se han escaneado por completo".

Con toda esta información, el LGM de Niantic permitirá a las computadoras percibir y comprender los espacios físicos, así como interactuar con ellos "de nuevas maneras". Según ha subrayado, esto supone un "componente crítico" a la hora de avanzar en la tecnología de sectores como las gafas de realidad aumentada, la robótica, la creación de contenido y los sistemas autónomos.

"A medida que pasamos de los teléfonos a la tecnología portátil vinculada al mundo real, la inteligencia espacial se convertirá en el futuro sistema operativo del mundo", ha sentenciado la tecnológica.

Asimismo, Niantic ha especificado que se trata de un LGM porque funcionará de forma similar a los modelos de lenguaje de gran tamaño (LLM), que se construyen utilizando grandes cantidades de datos sin procesar. En el caso del LGM, "miles de millones" de imágenes del mundo, vinculadas a ubicaciones precisas, "se destilarán" en un gran modelo que permitirá una comprensión basada en la ubicación, las estructuras y las interacciones físicas.

Guardar