Google revoluciona la IA con el lanzamiento de Gemini 1.5 Flash: velocidad al servicio de la tecnología

Estas innovaciones no sólo amplían las fronteras de lo que los asistentes de IA pueden hacer, sino que también ofrecen una visión de un futuro donde la tecnología entiende y responde al mundo de una manera más humana

Gemini 1.5 Flash: cómo usarlo

Google ha marcado un antes y un después en el mundo de la inteligencia artificial con el lanzamiento de diversas actualizaciones en su familia de modelos Gemini, presentando al público nuevas versiones y proyectos que tienen el potencial de revolucionar el campo de los asistentes de inteligencia artificial y su integración en la vida cotidiana y profesional de las personas.

Durante el evento Google I/O, en el cual Infobae está presente, se destaca la introducción de Gemini 1.5 Flash, un modelo diseñado para ofrecer una mayor velocidad y eficiencia en la ejecución de tareas de alto volumen y alta frecuencia, optimizando así los procesos a gran escala y reduciendo los costos operativos. Este modelo, más ligero que su predecesor, el 1.5 Pro, se destaca especialmente en aplicaciones que requieren de la generación de resúmenes, chat, subtitulación de imágenes y videos, y extracción de datos de documentos extensos y tablas.

La versión 1.5 Flash hereda las capacidades esenciales de modelos más grandes y complejos, garantizando una calidad impresionante para su tamaño y un rendimiento superior en las tareas asignadas.

Ejemplo práctico de aplicaciones multimodales utilizando Gemini Nano presentado en Google I/O

Por otro lado, el modelo 1.5 Pro ha experimentado notables mejoras desde su liberación inicial, ampliando su ventana de contexto hasta los 2 millones de tokens y enriqueciendo sus facultades en diversas áreas críticas para el desarrollo tecnológico y empresarial.

La optimización en la generación de código, el razonamiento lógico, la planificación, las conversaciones de múltiples turnos, y la comprensión de áudio e imágenes son algunos de las mejoras significativas que lo convierten en una herramienta aún más versátil y robusta para una amplia gama de aplicaciones.

El 1.5 Pro ofrece ahora la capacidad de seguir instrucciones complejas y detalladas, mejorando la personalización del modelo en roles, formatos, y estilos de producto específicos, lo cual es fundamental para su utilización en diferentes sectores.

Adicionalmente, Google ha extendido las capacidades de Gemini Nano, su modelo en dispositivo, para incluir no solo entradas de texto sino también imágenes, mejorando la multimodalidad y la capacidad de comprensión del mundo de una manera más completa y humana, comenzando con su integración en dispositivos Pixel.

Mirando hacia el futuro, Google también ha compartido avances en el proyecto Astra, una iniciativa que busca desarrollar agentes de inteligencia artificial universales capaces de comprender y responder al mundo de manera similar a los humanos.

Estos agentes están enfocados en ser proactivos, enseñables y personales, ofreciendo una interacción natural y sin retrasos para los usuarios. Este proyecto representa un paso significativo en la misión de Google DeepMind de construir una inteligencia artificial de manera responsable, que pueda beneficiar a la humanidad en sus más amplios espectros.

Sundar Pichai, CEO de Google, dijo que los eventos de Google I/O 2024 son como el tour de Taylor Swift, The Eras Tour. (Crédito: Infobae)

La evolución de la familia de modelos Gemini demuestra el compromiso de Google con el avance continuo de la inteligencia artificial. La inversión en una línea de innovación constante no solo permite explorar nuevas ideas en la vanguardia tecnológica, sino que también abre puertas a la posibilidad de descubrir casos de uso nuevos y emocionantes que pueden transformar la manera en que interactuamos con la tecnología en nuestra vida diaria y profesional.

El futuro vislumbrado por Google, donde los asistentes de inteligencia artificial juegan un papel central, más que una mera posibilidad, es una realidad cada vez más tangible que promete revolucionar nuestro entorno digital y físico.

Qué es Google I/O

Google I/O es la conferencia anual de desarrolladores organizada por Google para presentar las últimas actualizaciones y avances tecnológicos de la compañía. Este evento, muy esperado por la comunidad de desarrolladores, tecnólogos y entusiastas de la innovación donde está Infobae, sirve como un escenario para anunciar y demostrar nuevas tecnologías, productos y proyectos en los que Google ha estado trabajando.

Gemini 1.5 Pro ahora cuenta con mayor capacidad. (Crédito: Infobae)

Desde su lanzamiento en 2008, Google I/O se ha convertido en una cita fundamental en el calendario tecnológico, ofreciendo una amplia gama de sesiones técnicas, talleres y presentaciones en vivo que abarcan desde la inteligencia artificial y el desarrollo de aplicaciones hasta la realidad aumentada y las últimas tendencias en la web y el móvil.

Además de ser un foro de divulgación de las novedades de Google, I/O apoya la creación de redes entre los desarrolladores y proporciona valiosos recursos educativos, incluyendo el acceso a expertos de Google y herramientas de desarrollo vanguardistas.

Este evento no solo es una plataforma para que Google muestre su liderazgo e innovación tecnológica, sino que también refleja el compromiso de la empresa con el avance del ecosistema tecnológico global, promoviendo la colaboración, el aprendizaje y el intercambio de ideas para impulsar el desarrollo de soluciones innovadoras que beneficien a usuarios de todo el mundo.