Más de 20 años después de que se publicara el primer borrador del genoma del histórico Proyecto Genoma Humano, los investigadores dieron a conocer los primeros datos del pangenoma humano: un atlas que se convertirá en una nueva referencia para la investigación genética ya que brinda un conocimiento más profundo y complejo sobre la diversidad de las poblaciones humanas.
El genoma de referencia humano (GRCh38) ha formado la columna vertebral de la investigación genética desde su versión preliminar inicial divulgada por primera vez hace dos décadas. Considerado un hito histórico de la ciencia, la secuenciación de 2003 reveló el conjunto del material genético de un hombre y sirvió de referencia para otros genomas humanos publicados desde entonces. Estas secuencias primarias son una representación en mosaico que contienen una secuencia de armazón representativa para cada cromosoma.
El nuevo hito que se conoció en las últimas horas consiste en una mapa de alta calidad de secuencias del genoma humano fruto del trabajo del Consorcio Internacional de Referencia del Pangenoma Humano, un grupo financiado por el Instituto Nacional de Investigación del Genoma Humano (NHGRI), parte de los Institutos Nacionales de Salud de EEUU y que acaba de publicarse en la revista Nature en una sucesión de artículos que integran a una centena de especialistas.
La nueva referencia de pangenoma incluye secuencias del genoma de 47 personas (africanos, nativos americanos y asiáticos, entre otros grupos) en un atlas genético gigante que, dicen, captura mejor la sorprendente diversidad genética de nuestra especie. Asemás, los investigadores persiguen el objetivo de aumentar ese número a 350 para mediados de 2024.
Dado que cada individuo porta un par de cromosomas, la referencia actual en realidad incluye 94 secuencias genómicas distintas, con el objetivo de llegar a 700 para la finalización del proyecto.
“Ahora entendemos que tener un mapa de un solo genoma humano no puede representar adecuadamente a toda la humanidad”, señaló Karen Miga, profesora de la Universidad de California en Santa Cruz y participante en el nuevo proyecto.
Qué es el genoma humano
Un genoma es el conjunto de instrucciones de ADN que ayuda a cada ser vivo a desarrollarse y funcionar. Sus secuencias difieren ligeramente entre los individuos. En el caso de los humanos, los de dos personas son, en promedio, más del 99% idénticos. Las pequeñas diferencias contribuyen a la singularidad de cada individuo y pueden brindar información sobre su salud, ayudando a diagnosticar enfermedades, predecir resultados y guiar tratamientos médicos.
Para comprender estas diferencias, los especialistas crean secuencias del genoma humano de referencia para usarlas como estándar: una fusión digital que se puede usar como comparación para alinear, ensamblar y estudiar otras secuencias.
La secuencia de referencia original tiene casi 20 años y se ha actualizado regularmente a medida que avanza la tecnología y los investigadores corrigen errores y descubren más regiones. Sin embargo, tiene limitaciones en su representación de la diversidad de la especie humana, ya que consta de genomas de solo unas 20 personas, y la mayor parte de la secuencia de referencia es de un solo individuo.
El aporte crucial del nuevo pangenoma podría ser mejores formas de diagnosticar enfermedades raras, aunque las aplicaciones prácticas no son fáciles de nombrar. Por otra parte, los científicos dicen que principalmente les está dando una idea de parte de la “materia oscura” del genoma que antes era difícil de ver, incluidas regiones extrañas de cromosomas que parecen compartir e intercambiar genes.
“Todo el mundo tiene un genoma único, por lo que el uso de una única secuencia genómica de referencia para cada persona puede generar inequidades en los análisis -advirtió Adam Phillippy, investigador principal en la Rama de Genómica Computacional y Estadística dentro del Programa de Investigación Intramural del NHGRI y coautor del estudio principal-. Por ejemplo, predecir una enfermedad genética podría no funcionar tan bien para alguien cuyo genoma es diferente al de referencia”.
Camino en construcción
La secuencia de referencia actual tiene lagunas que reflejan información faltante, especialmente en áreas que eran repetitivas y difíciles de leer. Los avances tecnológicos recientes, como la secuenciación de ADN de lectura larga, que lee tramos más largos a la vez, ayudaron a los investigadores a llenar esos vacíos para crear la primera secuencia completa del genoma humano publicada el año pasado.
Usando técnicas computacionales avanzadas, los investigadores construyeron una nueva referencia de pangenoma humano con cada ensamblaje cubriendo más del 99% de la secuencia esperada con más del 99% de precisión.
También se basaron en la secuencia del genoma de referencia anterior, agregando más de 100 millones de nuevas bases o letras en el ADN. Mientras que la secuencia anterior era única y lineal, el nuevo representa muchas versiones diferentes de la secuencia del genoma humano al mismo tiempo. Esto brinda a los investigadores una gama más amplia de opciones para usarlo en el análisis de otras secuencias.
“Al usarlo de referencia podemos identificar con mayor precisión variantes genómicas más grandes llamadas variantes estructurales -informó Mobin Asri, estudiante de la Universidad de California Santa Cruz y co-primera autora del artículo-. Podemos encontrar variantes que no se identificaron con métodos anteriores que dependen de secuencias de referencia lineales”. Estas pueden involucrar miles de bases. Hasta ahora, los investigadores no han podido identificar la mayoría de las variantes estructurales que existen en cada genoma humano usando secuenciación de lectura corta debido al sesgo de usar una sola secuencia de referencia.
“La referencia del pangenoma humano nos permitirá representar decenas de miles de variantes novedosas en regiones que antes eran inaccesibles -afirmó Wen-Wei Liao, estudiante de la Universidad de Yale y coautor del documento-. Podemos acelerar la investigación clínica al mejorar nuestra comprensión del vínculo entre los genes y los rasgos de la enfermedad”.
Se proyecta que el costo total de apoyar el trabajo del Consorcio de Referencia del Pangenoma Humano sea de aproximadamente $40 millones de dólares durante cinco años, lo que incluye esfuerzos para crear su referencia, mejorar la tecnología de secuenciación del ADN, operar un centro de coordinación, llevar a cabo actividades de divulgación y crear recursos para la comunidad de investigación para su uso.
Muchos de los individuos cuyos genomas fueron secuenciados para construir la nueva referencia fueron reclutados originalmente como parte del Proyecto 1000 Genomas, un esfuerzo colaborativo e internacional financiado en parte por NIH que tenía como objetivo mejorar el catálogo de variantes genómicas en diversas poblaciones.
“Los investigadores y los médicos que utilizan la genómica necesitan acceder a una secuencia de referencia que refleje la notable diversidad de la población humana. Esto aportará a que la referencia sea útil para todas las personas, lo que podrá reducir la propagación de disparidades en la salud -sugirió Eric Green, director del NHGRI-. La creación y mejora de una referencia del pangenoma humano se alinea con el objetivo del NHGRI de luchar por la diversidad global en todos los aspectos de la investigación genómica, que es crucial para avanzar en el conocimiento e implementar la medicina de manera equitativa”.
En línea con este esfuerzo, el Consorcio de Referencia del Pangenoma Humano incluye un grupo de ética integrado que está trabajando para anticipar problemas desafiantes y ayudar a guiar el consentimiento informado, priorizar el estudio de diferentes muestras, explorar posibles problemas regulatorios relacionados con la adopción clínica y trabajar con expertos internacionales y comunidades indígenas a incorporar sus secuencias genómicas.
Seguir leyendo: