Un nuevo algoritmo revolucionó el estudio de las proteínas y sus vínculos evolutivos con la inmunidad humana

Esta herramienta analizó 200 millones de estructuras y descubrió más de 2 millones de conjuntos. Los hallazgos publicados en la Revista Nature y los detalles sobre las similitudes entre distintas especies

Guardar
La investigación ilumina el origen y la evolución de proteínas específicas de especies (Getty)
La investigación ilumina el origen y la evolución de proteínas específicas de especies (Getty)

Las proteínas son claves para todos los procesos celulares, y su estructura es importante para comprender su función y evolución. Las predicciones basadas en secuencias de estructuras de proteínas han aumentado en precisión y más de 214 millones de estructuras predichas están disponibles en la base de datos AlphaFold. Sin embargo, estudiarlas a esta escala requiere métodos muy eficientes.

Ahora, investigadores del Instituto Europeo de Bioinformática (EMBL-EBI), el Instituto de Biología de Sistemas Moleculares de ETH Zurich y la Facultad de Ciencias Biológicas de la Universidad Nacional de Seúl han logrado avances significativos en ese proceso. Aprovecharon el poder de la vasta base de datos de AlphaFold sobre estructuras de proteínas 3D predichas por IA, arrojando luz sobre su evolución y los orígenes de la inmunidad humana.

La base de datos de AlphaFold, piedra angular en este tipo de investigación, ofrece información estructural generada por IA para las proteínas conocidas, complementando los datos experimentales. Si bien no reemplazan los resultados experimentales, estas predicciones son invaluables para la comunidad científica. Su estudio, que acaba de publicarse en la revista Nature, presentó Foldseek Cluster, un algoritmo innovador.

Esta herramienta analizó de manera eficiente 200 millones de estructuras de proteínas dentro de la base de datos, descubriendo más de 2 millones de conjuntos estructurales únicos que representan una asociación de proteínas que comparten formas 3D similares, y un tercio carece, llamativamente, de anotaciones o categorizaciones previas.

Los expertos utilizaron la base de datos AlphaFold para descubrir más de 2 millones de conjuntos estructurales únicos de proteínas, revelando aspectos desconocidos hasta el momento
Los expertos utilizaron la base de datos AlphaFold para descubrir más de 2 millones de conjuntos estructurales únicos de proteínas, revelando aspectos desconocidos hasta el momento

Cerrando la brecha

Una comprensión profunda de las proteínas en los procesos celulares es fundamental para desentrañar sus funciones y su historia evolutiva. Si bien se han logrado grandes avances en la predicción de esas estructuras basada en secuencias, los desafíos computacionales han limitado la capacidad para abordar esta tarea a gran escala. Sin embargo, Foldseek Cluster ofreció un medio sin precedentes para explorar el vasto reino de las proteínas.

Hemos marcado el comienzo de una era revolucionaria en biología estructural, gracias a herramientas computacionales que nos otorgan un acceso incomparable a las complejidades del universo proteico. Su algoritmo ha acelerado drásticamente el proceso, reduciendo lo que podría haber llevado una década usando métodos tradicionales a tan solo cinco días.

Esta potencia computacional puede examinar de manera eficiente millones de estructuras de proteínas predichas dentro de la base de datos AlphaFold, agrupándolas según sus formas 3D. La aceleración de la capacidad computacional no sólo hace que las tareas sean más rápidas; los hace alcanzables en una escala que antes se consideraba imposible.

En el estudio, lograron avances en la comprensión de las estructuras proteicas y su papel en procesos celulares utilizando predicciones de IA
En el estudio, lograron avances en la comprensión de las estructuras proteicas y su papel en procesos celulares utilizando predicciones de IA

La investigación también profundiza en las ramificaciones evolutivas de estos grupos de proteínas. Si bien la mayoría tienen orígenes antiguos, un 4% parece ser específico de determinadas especies. Esta revelación proporciona nuevos conocimientos sobre fenómenos evolutivos como el nacimiento de genes de novo, donde nuevos genes emergen de regiones no codificantes del genoma. Además, arroja luz sobre numerosas conexiones evolutivas que podrían mejorar la comprensión de las funciones de las proteínas en diversas especies, en particular su papel en la inmunidad humana.

Pedro Beltrao, profesor asociado del Instituto de Biología de Sistemas Moleculares de ETH Zurich, enfatizó: “Este trabajo va más allá de simplemente hacer que las comparaciones sean más eficientes; se trata de desentrañar nuevos conocimientos sobre el viaje evolutivo de las proteínas”.

Uno de los descubrimientos más intrigantes de este estudio es la identificación de semejanzas estructurales entre las proteínas del sistema inmunológico humano y las que se encuentran en las bacterias. Esto sugiere la posibilidad de que las relacionadas con el sistema inmunológico tengan antiguas raíces evolutivas compartidas con especies bacterianas, lo que podría remodelar nuestra comprensión de la inmunidad. Esta investigación no sólo avanza el conocimiento actual, sino que también allana el camino para futuras exploraciones en los enigmáticos reinos de la función y la evolución de las proteínas.

* Martin Steinegger, profesor asistente de la Facultad de Ciencias Biológicas de la Universidad Nacional de Seúl *Fotos: Getty

Guardar