Intriga científica: eliminaron de una base de datos secuencias genómicas del primer brote de COVID-19 en Wuhan

Las secuencias parciales de SARS-CoV-2 de los primeros brotes en Wuhan fueron eliminadas de una base de datos del gobierno de los Estados Unidos por los científicos que las depositaron, advierte una investigación publicada en la revista científica Nature

Guardar
Las secuencias del genoma parcial abordan un enigma evolutivo sobre la diversidad genética temprana del coronavirus SARS-CoV-2, aunque los científicos enfatizan que no arrojan luz sobre sus orígenes (REUTERS)
Las secuencias del genoma parcial abordan un enigma evolutivo sobre la diversidad genética temprana del coronavirus SARS-CoV-2, aunque los científicos enfatizan que no arrojan luz sobre sus orígenes (REUTERS)

Los esfuerzos para estudiar las primeras etapas de la pandemia de coronavirus han recibido ayuda de una fuente sorprendente. Un biólogo en los Estados Unidos ha “excavado” secuencias parciales del genoma del SARS-CoV-2 desde los inicios del probable epicentro de la pandemia en Wuhan, China, que fueron depositadas, pero luego eliminadas, de una base de datos del gobierno de los Estados Unidos.

Según una investigación publicada en la revista científica Nature, las secuencias del genoma parcial abordan un enigma evolutivo sobre la diversidad genética temprana del coronavirus SARS-CoV-2, aunque los científicos enfatizan que no arrojan luz sobre sus orígenes. Tampoco está del todo claro por qué los investigadores de la Universidad de Wuhan pidieron que las secuencias se eliminen del Archivo de Lectura de Secuencias (SRA, por sus siglas en ingles), un repositorio de datos de secuenciación sin procesar que mantiene el Centro Nacional de Información Biotecnológica (NCBI), parte de los Institutos Nacionales de Estados Unidos of Health (NIH).

“Estas secuencias son informativas, no transformadoras”, dice Jesse Bloom, genetista evolutivo viral del Centro de Investigación del Cáncer Fred Hutchinson en Seattle, Washington, quien describe en un preimpreso del 22 de junio cómo recuperó las secuencias.

Bloom descubrió las secuencias después de buscar datos genómicos de las primeras etapas de la pandemia. Un artículo de investigación de mayo de 2020 contenía una tabla de datos de secuencia disponibles públicamente, que incluía entradas que Bloom no había encontrado. Las secuencias se asociaron con un artículo, que aplicó una tecnología conocida como secuenciación de nanoporos para detectar material genético del SARS-CoV-2 en muestras de personas. Ese estudio fue publicado en la revista Small en junio de 2020.

Cuando Bloom buscó las secuencias en la SRA utilizando los detalles enumerados en el documento de mayo de 2020, la base de datos no arrojó entradas. La SRA mantiene las secuencias en el almacenamiento en la nube mantenido por Google, y Bloom se preguntó si podría encontrar versiones archivadas de las secuencias en servidores en la nube. Este enfoque funcionó y el experto pudo recuperar datos de 50 muestras, 13 de las cuales contenían suficientes datos sin procesar para generar secuencias parciales del genoma.

Misterio evolutivo

Las secuencias recuperadas, que probablemente se recopilaron en enero y febrero de 2020, muestran que este es el caso: están más estrechamente relacionadas con los virus de los murciélagos que las secuencias de personas vinculadas al mercado de productos del mar (REUTERS)
Las secuencias recuperadas, que probablemente se recopilaron en enero y febrero de 2020, muestran que este es el caso: están más estrechamente relacionadas con los virus de los murciélagos que las secuencias de personas vinculadas al mercado de productos del mar (REUTERS)

“Las secuencias ayudan a resolver un misterio evolutivo sobre las primeras etapas de la pandemia”, dice Bloom. Las primeras secuencias virales de Wuhan provienen de individuos vinculados al mercado de mariscos de Huanan de la ciudad en diciembre de 2019, que inicialmente se pensó que era el lugar donde el coronavirus saltó por primera vez de los animales a las personas. Pero las secuencias del mercado de mariscos están más relacionadas con los parientes más cercanos del SARS-CoV-2 en los murciélagos, el origen último más probable del virus, que las secuencias posteriores, incluida una recolectada en los Estados Unidos.

Eso fue sorprendente, según Bloom, porque cabría esperar que los virus de las primeras etapas de la epidemia de Wuhan estuvieran más estrechamente relacionados con los parientes del SARS-CoV-2 que infectan a los murciélagos. Las secuencias recuperadas, que probablemente se recopilaron en enero y febrero de 2020, muestran que este es el caso: están más estrechamente relacionadas con los virus de los murciélagos que las secuencias de personas vinculadas al mercado de productos del mar.

Esto se suma a un creciente cuerpo de evidencia, incluidos informes de casos probables que se remontan a noviembre de 2019, de que los primeros casos humanos de COVID-19 no estaban asociados con el mercado de mariscos de Huanan, advierten Bloom y otros científicos.

“A mí me pareció que el mercado de Wuhan fue uno de los primeros eventos de súper propagación”, explica Sudhir Kumar, un genetista evolutivo de la Universidad de Temple en Filadelfia, Pensilvania. “Las secuencias que descubrió Bloom -agrega- sugieren que el SARS-CoV-2 desarrolló una amplia diversidad en las primeras etapas de la pandemia en China, incluso en Wuhan”.

Esto se suma a un creciente cuerpo de evidencia, incluidos informes de casos probables que se remontan a noviembre de 2019, de que los primeros casos humanos de COVID-19 no estaban asociados con el mercado de mariscos de Huanan (REUTERS)
Esto se suma a un creciente cuerpo de evidencia, incluidos informes de casos probables que se remontan a noviembre de 2019, de que los primeros casos humanos de COVID-19 no estaban asociados con el mercado de mariscos de Huanan (REUTERS)

Stephen Goldstein, virólogo de la Universidad de Utah en Salt Lake City, señala que “las secuencias que recuperó Bloom no estaban ocultas: se describen en detalle, con suficiente información de secuencia para conocer su relación evolutiva con otras secuencias tempranas del SARS-CoV-2, en el periódico Small”. “No creo que esta preimpresión nos diga muchas cosas nuevas, pero sí trae a la vanguardia datos de secuencia que han estado disponibles públicamente, aunque bajo el radar”, indica Goldstein.

Bloom dice que aunque las secuencias se publicaron, su eliminación de la SRA significó que pocos científicos las conocían. Un informe encargado por la Organización Mundial de la Salud sobre los orígenes de la pandemia no incluyó las secuencias en un análisis evolutivo de los primeros datos del SARS-CoV-2. “Nadie se dio cuenta de que existían”, subraya.

Los autores correspondientes del artículo de Small no respondieron a las preguntas del equipo de noticias de Nature sobre por qué pidieron que se eliminaran las secuencias de la SRA, lo que sucedió antes de que se publicara el artículo. En un comunicado, el NIH dijo que eliminó los datos a pedido de los investigadores, quienes dijeron que planeaban enviarlos a otra base de datos.

Bloom, quien fue coautor de una carta en la que pedía una investigación renovada sobre los orígenes de la pandemia, incluida la posibilidad de que el virus se escapara o se filtrara de un laboratorio, dice que “su estudio no arroja luz sobre los orígenes de la pandemia ni sobre por qué las secuencias fueron eliminadas”. Pero espera que sus esfuerzos animen a los investigadores a “pensar de manera innovadora” y buscar otras fuentes, como datos de archivo, para obtener más información de los primeros días de la pandemia. “Probablemente haya más datos por ahí”, concluye.

SEGUIR LEYENDO:

Guardar