Google ha lanzado Gemini 2.0, su modelo de inteligencia artificial más avanzado y rápido hasta la fecha, disponible de forma gratuita para probar en la página de Gemini tanto en versión de escritorio como en dispositivos móviles. Este sistema se enfoca en mejorar la autonomía para realizar tareas complejas que requieren múltiples pasos, minimizando la necesidad de supervisión humana.
Por ejemplo, un usuario que investigue sobre los efectos del cambio climático puede emplear Gemini 2.0 para recopilar y organizar artículos científicos, estadísticas y tendencias globales, simultáneamente. Además, esta IA integra capacidades de generación de imágenes, lo que permite crear contenido gráfico a partir de descripciones textuales dadas por los usuarios.
Google también ha presentado una variante especializada, Gemini 2.0 Flash, optimizada para ejecutar tareas de gran volumen a alta velocidad. Esto resulta ideal para aplicaciones empresariales o individuales como la automatización de análisis de grandes bases de datos o la generación de informes complejos en pequeños lapsos de tiempo.
“Si Gemini 1.0 se centraba en organizar y comprender la información, Gemini 2.0 se centra en hacerla mucho más útil”, afirmó Sundar Pichai, director ejecutivo de Google y Alphabet, subrayando la evolución del modelo hacia una mayor funcionalidad práctica para los usuarios.
Cómo utilizar la nueva IA de Google
El proceso para utilizar la nueva IA de Google llamada Gemini 2.0 es el siguiente:
- Dirigirse a la página web de Gemini en su versión de escritorio o móvil.
- Dirigirse a la parte superior izquierda donde dice ‘Gemini 1.5 Flash’ y seleccionar ‘2.0 Flash Experimental’.
- Empezar a utilizar la nueva IA de Google.
Demis Hassabis, director ejecutivo de Google DeepMind y Koray Kavukcuoglu, director de tecnología de Google DeepMind explican que este modelo puede:
“Admitir entradas multimodales como imágenes, video y audio, 2.0 Flash ahora admite salida multimodal como imágenes generadas de forma nativa mezcladas con texto y audio multilingüe de texto a voz (TTS) dirigible. También puede llamar de forma nativa a herramientas como Google Search, ejecución de código y funciones definidas por el usuario de terceros”.
Esto significa que Gemini 2.0 Flash cuenta con la capacidad procesar diferentes tipos de datos como imágenes, videos y audio, y generar resultados en varios formatos.
Además, puede buscar información en Google, ejecutar programas y usar herramientas de terceros. Esto lo hace ideal para tareas como analizar un video educativo, resumirlo en texto con gráficos y generar una presentación con narración en diferentes idiomas.
Los ejecutivos de Google señalaron que “pronto estará disponible en la aplicación móvil de Gemini” y que “a principios del próximo año, se ampliará Gemini 2.0 a más productos de Google”.
Mariner, otro nuevo proyecto de Google
El Proyecto Mariner de Google, basado en Gemini 2.0, es un prototipo que explora cómo agentes de inteligencia artificial pueden realizar tareas complejas directamente desde un navegador. Este sistema analiza elementos en pantalla como texto, imágenes, código y formularios, utilizando una extensión experimental de Chrome para completar tareas.
Por ejemplo, puede rellenar formularios o buscar información automáticamente. Durante pruebas, logró un desempeño destacado del 83.5 % en tareas web reales, según el estándar WebVoyager.
Aunque aún enfrenta retos como la velocidad y precisión, Mariner incorpora medidas de seguridad, como confirmaciones antes de acciones sensibles, y es probado actualmente por evaluadores de Google.
“Con Project Mariner, estamos trabajando para garantizar que el modelo aprenda a priorizar las instrucciones del usuario por sobre los intentos de terceros de introducir instrucciones, de modo que pueda identificar instrucciones potencialmente maliciosas de fuentes externas y evitar el uso indebido”, explica Google.
“Los lanzamientos de hoy marcan un nuevo capítulo para nuestro modelo Gemini. Con el lanzamiento de Gemini 2.0 Flash y la serie de prototipos de investigación que exploran las posibilidades de la agencia, hemos alcanzado un hito emocionante en la era Gemini”, destacó la compañía.