La supercomputadora de Google que acompaña a Gemini, su inteligencia artificial más avanzada

Cloud TPU v5p es capaz de manejar el entrenamiento de modelos con cientos de miles de millones o incluso billones de parámetros

Guardar
Se trata de una supercomputadora innovadora que funciona como un sistema integrado de hardware, software, marcos de aprendizaje automático y modelos de consumo optimizados para inteligencia artificial.

Google no solo presentó al mundo su nuevo modelo de lenguaje grande (LLM) Gemini, la gigante tecnológica también hizo el lanzamiento de Cloud TPU v5p, su acelerador de inteligencia artificial más potente que será incorporado en la nueva supercomputadora AI Hypercomputer.

Unas tecnologías que buscan convertirse en soluciones eficaces ante los retos planteados por los modelos de IA generativa, que han crecido exponencialmente en complejidad y tamaño.

En cuanto a la versión más avanzada del procesador TPU, esta promete un rendimiento significativamente superior al de sus predecesores debido a que integra un total de 8960 chips y está dotado de la interconexión más veloz hasta ahora desarrollada, alcanzando hasta 4800 Gbps por chip.

TPU v5p: el siguiente nivel de potencia de procesamiento de IA. (Google)
TPU v5p: el siguiente nivel de potencia de procesamiento de IA. (Google)

Según Google, Cloud TPU v5p duplica la capacidad de operaciones de coma flotante por segundo (FLOPS) respecto a la versión anterior, y triplica la eficiencia de la memoria de gran ancho de banda.

Paralelamente, la AI Hypercomputer de Google Cloud, se presenta como una arquitectura supercomputacional que pretende maximizar la eficiencia en la gestión de cargas de trabajo de IA mediante el uso de un código a nivel de sistema, que se coloca por encima de métodos tradicionales que pueden conducir a ineficiencias durante la ejecución de tareas de inteligencia artificial más demandantes.

Unidades de procesamiento tensorial (TPU)

El nuevo Cloud TPU v5p ofrece una mejora del doble en términos de operaciones de punto flotante por segundo (FLOPS) y un incremento de tres veces en la memoria de gran ancho de banda. (Google)
El nuevo Cloud TPU v5p ofrece una mejora del doble en términos de operaciones de punto flotante por segundo (FLOPS) y un incremento de tres veces en la memoria de gran ancho de banda. (Google)

La Cloud TPU v5p se posiciona como el acelerador de IA más avanzado, debido a que es capaz de soportar los largos períodos de entrenamiento de modelos gigantescos con cientos de miles de millones o incluso billones de parámetros.

Esta herramienta no es nueva para la empresa siendo un pilar en el desarrollo de productos como YouTube, Gmail, Google Maps, Google Play y Android.

Además, Gemini, el más reciente y avanzado modelo de IA de Google, funciona gracias a esta tecnología.

La escalabilidad y flexibilidad, son dos de las fortalezas más destacadas del Cloud TPU v5p. Gracias a sus SparseCores de segunda generación, se consigue entrenar modelos de aprendizaje automático con una densidad de incrustación 1,9 veces más rápido que su antecesor, el TPU v4.

Esta aceleración es aún mayor cuando se trata de entrenar modelos de lenguaje a gran escala (LLM), consiguiendo una mejora de velocidad de hasta 2,8 veces.

Además, el Cloud TPU v5p presenta una escalabilidad cuádruple en términos de FLOP totales por unidad llamada “pod”.

En el contexto de una economía de mercado cada vez más orientada hacia la inteligencia artificial, también se marca un hito importante al ofrecer una herramienta de procesamiento de datos en la nube notablemente mejorada.

AI Hypercomputer, la nueva supercomputadora de Google

La supercomputadora con IA de Google ofrece máximo rendimiento y eficiencia a gran escala. (Google)
La supercomputadora con IA de Google ofrece máximo rendimiento y eficiencia a gran escala. (Google)

La AI Hypercomputer integra hardware de alto rendimiento, software de código abierto, marcos de aprendizaje automático de primera línea y modelos de consumo adaptables.

Un enfoque sistémico que contrasta con la mejora gradual a nivel de componentes individuales, que abordan problemas de ineficiencia y eliminan potenciales cuellos de botella presentes en enfoques menos integrados.

La promesa de Google se centra en una mayor productividad y eficiencia en procesos cruciales como la capacitación, ajuste y operatividad de las aplicaciones basadas en IA.

En el núcleo de la supercomputadora se encuentra un hardware de alto rendimiento impulsado por la tecnología de red de centro de datos Júpiter de Google, con una infraestructura que incluye refrigeración líquida y una huella de alta densidad.

El compromiso de Google con la IA como herramienta de solución a problemas complejos ha llevado a que, a través de la Cloud TPU v5p y AI Hypercomputer, la compañía busque extender décadas de investigación y diseño de sistemas con el objetivo de que la innovación en inteligencia artificial sea accesible y viable en términos de costos y eficiencia.

Guardar