Cómo es la enorme base de datos COVID-19 que rastrea las variantes y cuánto dura la inmunidad

El repositorio abierto financiado por Google da acceso gratuito a más de 160 millones de puntos de datos con detalles sobre infecciones individuales, y ayuda a los epidemiólogos a responder preguntas candentes sobre el SARS-CoV-2

Guardar
Los investigadores esperan que la base de datos les ayude a monitorear las variantes del coronavirus y las vacunas, y proporcione una plantilla para rastrear datos en tiempo real en futuras epidemias (REUTERS)
Los investigadores esperan que la base de datos les ayude a monitorear las variantes del coronavirus y las vacunas, y proporcione una plantilla para rastrear datos en tiempo real en futuras epidemias (REUTERS)

Una enorme base de datos internacional ayuda a los epidemiólogos a responder preguntas candentes sobre el coronavirus SARS-CoV-2, como qué tan rápido se propagan las nuevas variantes entre las personas, si las vacunas protegen contra ellas y cuánto tiempo dura la inmunidad al COVID-19.

A diferencia del panel global de COVID-19 mantenido por la Universidad Johns Hopkins en Baltimore, Maryland, y otros rastreadores populares que enumeran las infecciones y muertes por COVID-19 en general, el repositorio de la iniciativa de ciencia de datos llamada Global.health recopila una cantidad sin precedentes de datos anónimos e información sobre casos individuales en un solo lugar. Para cada individuo, la base de datos incluye hasta 40 variables asociadas, como la fecha en la que tuvieron por primera vez los síntomas de COVID-19, cuándo recibieron una prueba positiva y su historial de viajes.

“Los datos a nivel individual brindan las pistas que los epidemiólogos necesitan para determinar cómo se propagan las enfermedades -dice Caitlin Rivers, epidemióloga de Johns Hopkins, que es parte del proyecto-. Para cuando comprendemos la gravedad de un brote, a menudo es demasiado tarde. “Los datos pueden cerrar ese ciclo y hacer que el proceso sea más rápido”.

Los investigadores esperan que la base de datos les ayude a monitorear las variantes del coronavirus y las vacunas, y proporcione una plantilla para rastrear datos en tiempo real en futuras epidemias. El repositorio fue creado por 21 investigadores de 7 instituciones académicas de Estados Unidos y Europa, con el apoyo técnico y financiero de Google y la Fundación Rockefeller. Hasta ahora, el equipo ha recopilado información de cerca de 30 millones de casos en unos 150 países.

A teacher holds a bandage after receiving a dose of China's CanSino COVID-19 vaccine during a mass vaccination for teachers and school staff against coronavirus disease in Mexico City, Mexico May 18, 2021. REUTERS/Edgard Garrido
A teacher holds a bandage after receiving a dose of China's CanSino COVID-19 vaccine during a mass vaccination for teachers and school staff against coronavirus disease in Mexico City, Mexico May 18, 2021. REUTERS/Edgard Garrido

Cuando los datos aún eran confusos, un epidemiólogo, Moritz Kraemer de la Universidad de Oxford, había creado y compartido su propia hoja de cálculo de Google con la comunidad. Scarpino analizó los números y admitió que Rivers tenía razón en cuanto a la generalización del uso de los datos.

Pronto, decenas de epidemiólogos agregaron información de casos de todo el mundo a esa hoja de cálculo. Adam Kucharski, epidemiólogo de la Escuela de Higiene y Medicina Tropical de Londres, junto a un grupo de profesionales del mismo centro, utilizaron los datos para estimar que había aproximadamente diez veces más personas en Wuhan, China, con síntomas de COVID-19 en enero de lo que había sido confirmado por los funcionarios de salud, basado en parte en el número de personas que habían viajado fuera del país y tenían una infección confirmada.

Después de superar los 100.000 casos, la hoja de cálculo original se sobrecargó. En abril, el equipo recibió asistencia de ingenieros y desarrolladores de Google.org, el brazo benéfico de la empresa de Silicon Valley. Juntos, escribieron códigos de computadora que cargarían automáticamente datos diarios de coronavirus de unos 60 gobiernos en un formato estandarizado, códigos que eliminan entradas duplicadas y un algoritmo para fusionar información que se agrega de todo el mundo en un único repositorio basado en la nube.

Cualquiera puede registrarse para acceder a hasta 8 gigabytes de datos anónimos en la última versión de la base de datos Global.health (Getty)
Cualquiera puede registrarse para acceder a hasta 8 gigabytes de datos anónimos en la última versión de la base de datos Global.health (Getty)

Cualquiera puede registrarse para acceder a hasta 8 gigabytes de datos anónimos en la última versión de la base de datos Global.health. “La mitad de los millones de casos recopilados tienen datos para una docena de variables y alrededor del 10% tienen más”, dice Scarpino. El especialista señala que “la infografía no ha sido un foco, porque priorizaron la estandarización de la recopilación de datos y la navegación por los problemas de privacidad para que las personas de todo el mundo puedan agregar datos a este espacio”. Los arquitectos del proyecto consultaron a especialistas legales y éticos sobre cómo manejar y compartir de forma segura datos anónimos sobre individuos, que a menudo están estrechamente protegidos por agencias gubernamentales, universidades y hospitales.

Julien Riou, epidemiólogo de la Universidad de Berna en Suiza, ha basado gran parte de su trabajo de COVID-19 en datos de una cohorte suiza, pero dice que “un conjunto de datos internacional profundo podría proporcionar mejores respuestas a preguntas fundamentales, como la tasa real de infección en países de todo el mundo. Más datos significa que podemos acercarnos a la verdad”. Otros investigadores están de acuerdo y agregan que la información sobre el estado de la vacuna de una persona o si está infectada con una variante del coronavirus podría ayudar a responder preguntas científicas urgentes sobre la inmunidad en los próximos meses.

Kucharski reinvindica la necesidad de aporte de fondos para este tipo de iniciativas: “Muchas de estas bases de datos son de colaboración colectiva, pero si solo confías en voluntarios, a menudo no es sostenible”, dice.

Scarpino espera eventualmente expandir la base de datos COVID-19 a una plataforma adaptable para estudiar otras enfermedades, especialmente la próxima epidemia emergente.

SEGUIR LEYENDO:

Guardar