La Universidad de Harvard, en colaboración con Google, ha lanzado Institutional Data Initiative, un proyecto destinado a publicar un millón de libros de dominio público. Su propósito es proporcionar datos precisos para entrenar modelos de inteligencia artificial.
“Buscamos construir un amplio acervo común de datos bien estructurados, reunir a una comunidad diversa para investigarlos y mejorarlos, y reafirmar el papel de las instituciones como guardianes del conocimiento en la era de la IA”, explica la página web del proyecto.
La iniciativa comenzó con la recopilación de datos de cerca de un millón de libros de dominio público escaneados en la Biblioteca de Harvard, como parte de Google Books. Tras completar la estructuración y análisis del corpus, el proyecto se enfoca en difundir este recurso ampliamente con el apoyo de Google.
Los libros estarán listos de forma abierta a principios de 2025. “Hoy, mientras el mundo busca formas de guiar el camino de la IA hacia el progreso humano, los datos lo son todo”, señaló Greg Leppert, director ejecutivo del proyecto.
Por otra parte, esta iniciativa cuenta con el apoyo financiero de OpenAI y Microsoft. “El lanzamiento de IDI cuenta con el generoso apoyo de donaciones de Microsoft y OpenAI”, señala el proyecto.
Cuál es la importancia de esta iniciativa
El proyecto Institutional Data Initiative de Harvard y Google es crucial para mejorar la inteligencia artificial al ofrecer datos estructurados de un millón de libros de dominio público. Esto permite desarrollar sistemas más precisos, éticos y accesibles.
Por ejemplo, en educación, la IA podría generar resúmenes de textos complejos para estudiantes, mientras que en salud, analizar información histórica para identificar patrones en pandemias. Además, asistentes virtuales como Alexa o Google Assistant se beneficiarían al ofrecer respuestas más completas y contextualizadas.
Al basarse en libros públicos, el proyecto garantiza transparencia, accesibilidad y diversidad en los datos, promoviendo una IA al servicio del bien común y el acceso al conocimiento global.
Google presenta Gemini 2.0
Google ha presentado Gemini 2.0, su modelo de inteligencia artificial más avanzado y rápido hasta la fecha. Este sistema está diseñado para ejecutar tareas complejas de múltiples pasos con mayor autonomía, reduciendo la necesidad de supervisión humana.
Una característica destacada de Gemini 2.0 es su capacidad para procesar y generar información en diversos formatos, incluyendo texto, imágenes, audio y video.
Por ejemplo, un usuario investigando sobre los efectos del cambio climático puede utilizar Gemini 2.0 para recopilar y organizar artículos científicos, estadísticas y tendencias globales de manera simultánea. Además, la IA puede generar contenido gráfico a partir de descripciones textuales proporcionadas por el usuario, facilitando la creación de presentaciones o informes visuales.
Google también ha lanzado una variante especializada llamada Gemini 2.0 Flash, optimizada para ejecutar tareas de gran volumen a alta velocidad.
Esta versión es ideal para aplicaciones empresariales o individuales que requieren el análisis automatizado de grandes bases de datos o la generación de informes complejos en cortos periodos de tiempo.
Para acceder a Gemini 2.0, los usuarios pueden visitar la página web de Gemini en su versión de escritorio o móvil. Una vez allí, deben seleccionar ‘2.0 Flash Experimental’ en la parte superior izquierda para comenzar a utilizar la nueva IA de Google.
Además, Google ha introducido el Proyecto Mariner, un prototipo que explora cómo agentes de inteligencia artificial pueden realizar tareas complejas directamente desde un navegador. Este sistema analiza elementos en pantalla, como texto, imágenes, código y formularios, utilizando una extensión de Chrome para completar tareas de manera autónoma.
Gemini 2.0 representa un avance en la inteligencia artificial de Google, ofreciendo a los usuarios herramientas más potentes y versátiles para manejar información compleja de manera eficiente y autónoma.