La era genómica alumbró avances en la tecnología de secuenciación de próxima generación que reforzaron el campo de la genética. Hoy en día, la secuenciación del ADN es más rápida, económica y precisa que nunca, lo que permite su aplicación en una amplia gama de disciplinas científicas.
La secuenciación del ADN se usa comúnmente en la medicina moderna, desde el diagnóstico hasta el desarrollo de fármacos, la agricultura y, en el caso del análisis del ADN antiguo, para responder preguntas sobre la historia de la Tierra.
Ahora investigadores del Big Data Institute (BDI) de la Universidad de Oxford han creado un “primer borrador” del árbol genealógico de la humanidad mediante la combinación de secuencias genómicas modernas y antiguas de ocho grandes bancos de datos. La investigación acaba de publicarse en Science.
Existe un número creciente de repositorios de datos genómicos que recopilan y almacenan datos de secuenciación de poblaciones de todo el mundo. Los conjuntos de datos a menudo se utilizan en estudios de investigación que pueden, por ejemplo, explorar la constitución genética de una enfermedad mediante el análisis de personas diagnosticadas con esa condición específica dentro del banco de datos.
Sin embargo, estos repositorios de datos no son exclusivamente para muestras de ADN humano; hay bancos de datos genómicos para una amplísima gama de organismos diferentes que se encuentran en la Tierra.
A medida que aumenta la cantidad de datos genómicos públicos disponibles, también aumentan las oportunidades para estudiar la ascendencia genética de la población humana. En consecuencia, los investigadores pueden armar una imagen de cómo surgió nuestra diversidad genética y cómo las diferentes personas en el mundo se relacionan entre sí.
“El trasfondo teórico de las genealogías de todo el genoma, que describen cómo hemos heredado genes de nuestros antepasados, se ha desarrollado durante las últimas tres décadas”, explicó Anthony Wilder Wohns, investigador postdoctoral en el Instituto Broad del MIT y Harvard, ex estudiante de doctorado en el Big Data Institute (BDI) de la Universidad de Oxford y autor principal de la investigación-. Sin embargo, estimar realmente esta estructura es un problema estadístico tremendamente difícil”.
Las dificultades asociadas con la combinación de enormes conjuntos de datos de un gran número de bases diferentes han sido una gran barrera para este esfuerzo de investigación, hasta ahora. Wilder Wohns, otro de los autores principales de este nuevo estudio realizado durante su tiempo en el BDI, informó sobre “un método novedoso para combinar fácilmente millones de secuencias genómicas de poblaciones antiguas y modernas”.
Junto con sus colegas, Wohns utilizó este método para crear un “primer borrador” del árbol genealógico de la humanidad. “Ideamos un algoritmo novedoso que deduce relaciones genéticas sin necesidad de comparar cada secuencia de ADN entre sí y lo combinamos con otro algoritmo que coloca fechas en ancestros comunes al tratar a toda la ascendencia como una sola red -explicó-. Además, al estimar toda la genealogía de la humanidad, pudimos crear algoritmos que nos permitieron usar todo el genoma para estimar cuándo y, por primera vez, dónde vivieron nuestros antepasados”.
Los datos se combinaron de un total de ocho conjuntos de datos, siete de los cuales ya estaban disponibles públicamente y un conjunto novedoso, conocido como Afanasievo, que contiene ADN antiguo.
El árbol contiene genomas completos obtenidos de 3.609 individuos de 215 poblaciones diferentes. Debido a que cada individuo hereda regiones genómicas específicas (conocidas como alelos) de uno de los padres, la genealogía mapea más de 7000 genomas.
La ascendencia de cada región genómica se puede comparar con un árbol. Al observar los “árboles” colectivamente en los grandes conjuntos de datos, el equipo de investigación pudo vincular regiones específicas a través del tiempo utilizando los datos de ADN antiguo, creando un “gráfico de recombinación ancestral” que demuestra dónde apareció por primera vez la variación genética. Este gráfico contenía aproximadamente 27 millones de antepasados.
Usando los algoritmos para determinar dónde vivían los antepasados, los investigadores pudieron recuperar eventos, desde una perspectiva genética, que se sabe que ocurrieron en la historia humana, como la migración fuera de África.
SEGUIR LEYENDO