Wikimedia Foundation comparte un conjunto de datos estructurados para el entrenamiento de IA

Guardar

Wikimedia Foundation ha decidido crear un conjunto de datos estructurados que ha puesto a disposición de la comunidad dedicada al aprendizaje automático, para que puedan usarlos en el entrenamiento de sus modelos.

La organización responsable de la popular enciclopedia 'online', Wikipedia, alertó recientemente de un aumento del tráfico procedente de programas automatizados para descargar sus contenidos y usarlos en el entrenamiento de modelos de inteligencia artificial.

Esto estaba repercutiendo su capacidad de operar, ya que tenían que dedicar más tiempo y recursos a responder al tráfico no humano, lo que suponía un mayor coste de uso y mantenimiento de las infraestructuras.

Ahora, ha anunciado la creación de un conjunto de datos estructurados de Wikipedia que ha compartido en Kaggle de manera gratuita y abierta, para que pueda puedan usarse en "el entrenamiento de modelos, la construcción de características y para probar canales de procesamiento de lenguaje natural", como explica en un comunicado.

Los datos se han compartido en un formato que pueden leer los ordenadores, en inglés y francés, e incluyen "resúmenes, descripciones breves, datos clave-valor de estilo infobox, enlaces de imágenes y secciones de artículos claramente segmentadas".

EuropaPress

Últimas Noticias

El papa aprueba el primer paso para la beatificación del diácono brasileño João Pozzobon

La telemática de video gana terreno en el seguimiento de activos con la CV200 de Queclink, que obtiene la certificación 2025 IoT Evolution

Queclink presenta la solución telemática de video CV200, galardonada con el premio de seguimiento de activos 2025, que proporciona localización y monitoreo de condiciones en tiempo real para flotas y logística

Wikimedia Foundation comparte un conjunto de datos estructurados para el entrenamiento de IA

Últimas Noticias

El papa aprueba el primer paso para la beatificación del diácono brasileño João Pozzobon

La telemática de video gana terreno en el seguimiento de activos con la CV200 de Queclink, que obtiene la certificación 2025 IoT Evolution

Queclink presenta la solución telemática de video CV200, galardonada con el premio de seguimiento de activos 2025, que proporciona localización y monitoreo de condiciones en tiempo real para flotas y logística

El papa autoriza la beatificación del sacerdote español Salvador Valera Parra

Rusia y Ucrania canjean el sexto grupo de prisioneros en el marco de acuerdos de Estambul

España facilitará que estudiantes extranjeros bloqueados por Trump estudien en el país

Temas Relacionados

Últimas Noticias

El papa aprueba el primer paso para la beatificación del diácono brasileño João Pozzobon

La telemática de video gana terreno en el seguimiento de activos con la CV200 de Queclink, que obtiene la certificación 2025 IoT Evolution

Queclink presenta la solución telemática de video CV200, galardonada con el premio de seguimiento de activos 2025, que proporciona localización y monitoreo de condiciones en tiempo real para flotas y logística

El papa autoriza la beatificación del sacerdote español Salvador Valera Parra

Rusia y Ucrania canjean el sexto grupo de prisioneros en el marco de acuerdos de Estambul

España facilitará que estudiantes extranjeros bloqueados por Trump estudien en el país