Descubre cómo Gemini de Google está cambiando todo lo que sabías sobre inteligencia artificial

Sundar Pichai, CEO de Google y Alphabet, promete transformar la interacción digital a través de modelos multimodales que comprenden texto, imagen y video, marcando una nueva era

Guardar
Gemini 1.5 Flash: cómo usarlo

Luego de la presentación principal de Sundar Pichai, CEO de Google y Alphabet, durante el I/O de la compañía donde estuvo infobae y donde además se conocieron avances en los servicios basados en IA, el líder mundial publicó una columna de opinión donde resumió todo lo que trae esta nueva era de Gemini para todos los consumidores en el mundo.

Recordemos que en la actual era de Gémini, Google ha sido testigo de una evolución monumental, marcando el inicio de un vínculo más profundo entre la inteligencia artificial (IA) y las interacciones humanas cotidianas. 

Sundar Pichai, CEO de Google y Alphabet, destaca el papel crucial de la IA en este nuevo capítulo: “Hemos estado invirtiendo en IA durante más de una década, innovando en cada paso, desde la investigación y el producto hasta la infraestructura”.

Este compromiso ha llevado a avances significativos en modelos como Gemini, diseñados para ser multimodales desde su concepción, lo que permite un razonamiento a través de texto, imágenes, video, código y más.

Gemini Live es el espacio de conversación con el asistente virtual de Google lleno de inteligencia artificial (Google)
Gemini Live es el espacio de conversación con el asistente virtual de Google lleno de inteligencia artificial (Google)

Por qué Gemini es tan importante para Google

Gemini ha demostrado ser el modelo más capaz hasta la fecha, sobresaliendo en todos los estándares multimodales con sus modelos iniciales y más tarde, con Gemini 1.5 Pro, logrando avances en contextos largos al procesar consistentemente un millón de tokens en producción.

Pichai resalta la importancia de estos desarrollos: “Queremos que todos se beneficien de lo que Gemini puede hacer”. Actualmente, más de 1.5 millones de desarrolladores utilizan modelos Gemini a través de nuestras herramientas, impulsando la próxima generación de aplicaciones de IA.

La integración de Gemini en productos de uso diario como Google Search, Google Photos y Google Workspace simboliza la fusión de la vida digital con capacidades inteligentes.

Más de 1.5 millones de desarrolladores ya están implementando modelos Gemini en sus aplicaciones. (Infobae)
Más de 1.5 millones de desarrolladores ya están implementando modelos Gemini en sus aplicaciones. (Infobae)

Por ejemplo, en Google PhotosGemini ahora permite a los usuarios realizar consultas complejas sobre sus recuerdos almacenados como “¿Cuándo aprendió a nadar Lucía?”, y recibir respuestas detalladas y contextualizadas.

Esta era también introduce conceptos revolucionarios como vistas generales de IA en Google Search, que transforman la forma en la que los usuarios interactúan con sus búsquedas, moviéndose hacia consultas más largas y complejas.

El entusiasmo de Pichai fue evidente: “Estoy emocionado de anunciar que comenzaremos a lanzar esta experiencia totalmente renovada, Vistas Generales de IA, a todos en Estados Unidos esta semana”.

Gemini amplía su alcance con una ventana de contexto de dos millones de tokens, prometiendo una capacidad de análisis sin precedentes. (Google)
Gemini amplía su alcance con una ventana de contexto de dos millones de tokens, prometiendo una capacidad de análisis sin precedentes. (Google)

La base de estos adelantos descansa en las capacidades multimodales y de largo contexto de Gemini, lo que permite un análisis exhaustivo de información variada, desde textos y audios hasta imágenes y videos, abriendo posibilidades antes inimaginables, como comprender y procesar el contenido equivalente a aproximadamente 96 menús de Cheesecake Factory.

Gemini 1.5 Pro y su posterior expansión a 2 millones de tokens subrayan el compromiso de Google con la creación de modelos de IA más sofisticados y accesibles a nivel global. Sundar Pichai expresa su visión: “Esto representa el siguiente paso en nuestro viaje hacia el objetivo final de contexto infinito”.

Cómo reemplaza Google los avances en inteligencia artificial

Además de los avances en IA, Google continúa liderando con innovaciones en infraestructura para respaldar estas ambiciones.

La introducción de Trillium, la sexta generación de Unidades de Procesamiento Tensorial (TPU), simboliza un salto significativo en rendimiento, destacando un aumento de 4.7 veces en el rendimiento de cómputo por chip sobre la generación anterior.

Gemini amplía su alcance con una ventana de contexto de dos millones de tokens, prometiendo una capacidad de análisis sin precedentes. (Infobae)
Gemini amplía su alcance con una ventana de contexto de dos millones de tokens, prometiendo una capacidad de análisis sin precedentes. (Infobae)

Para Pichai, el futuro de Google en la era de Géminis significa no solo avanzar tecnológicamente, sino hacerlo de manera responsable, asegurando que las innovaciones beneficien a todos de manera segura y privada, “Continuamos acercándonos a la oportunidad de la IA con audacia y un sentido de emoción, asegurándonos también de hacerlo de manera responsable”.

Con una mirada constante hacia el futuro, Google se esfuerza por construir un universo donde la IA no solo sea avanzada sino también inclusiva, marcando el comienzo de un nuevo capítulo emocionante en la historia de la tecnología.

Guardar