El genoma humano codifica aproximadamente 20.000 proteínas, muchas aún sin caracterizar. Ha quedado claro que la investigación científica tiende a centrarse en proteínas bien estudiadas, lo que genera la preocupación de que los genes poco conocidos se descuiden injustificadamente. Para abordar esto, investigadores del Reino Unido han desarrollado una “base de datos Unknome” disponible públicamente y personalizable que clasifica las proteínas en función de lo poco que se sabe sobre ellas.
Los especialistas esperan que la nueva base de datos disponible públicamente que han creado se reduzca, no crezca, con el tiempo. Considerando que han intentado crear un compendio de las miles de proteínas poco estudiadas codificadas por genes en el genoma humano, cuya existencia se conoce pero cuyas funciones en su mayoría no.
La base de datos es obra de Matthew Freeman de la Escuela de Patología Dunn de la Universidad de Oxford y Sean Munro del Laboratorio de Biología Molecular MRC en Cambridge, ambos especialistas de entidades inglesas. Junto a un equipo de colegas lograron describir en detalle su proceso en el revista de acceso abierto PLOS Biología.
Sus propias investigaciones de un subconjunto de proteínas en la base de datos revelan que la mayoría contribuye a importantes funciones celulares, incluido el desarrollo y la resistencia al estrés.
“La secuenciación del genoma humano ha dejado claro que codifica miles de probables secuencias de proteínas cuyas identidades y funciones aún se desconocen -explica Freeman-. Hay múltiples razones para esto, incluida la tendencia a centrar los escasos dólares de investigación en objetivos ya conocidos, además de la falta de herramientas, incluidos los anticuerpos, para trabajar en las células sobre la función de estas proteínas. Pero los riesgos de ignorarlas son significativos, ya que es probable que algunas, quizás muchas, desempeñen funciones importantes en los procesos celulares críticos, y pueden proporcionar información y objetivos para la intervención terapéutica”.
Sobre qué investigar
Para promover una exploración más rápida de tales proteínas, los autores crearon la base de datos Unknome, que asigna a cada proteína una puntuación de “conocimiento”, reflejando la información en la literatura científica sobre función, conservación entre especies, compartimentación subcelular, entre otros elementos.
Según este sistema, hay muchas miles de proteínas cuyo conocimiento es casi nulo. Se incluyen proteínas de organismos modelo, junto con las del genoma humano. La base de datos está abierta a todos y es personalizable, lo que permite al usuario proporcionar sus propios pesos a diferentes elementos, generando así su personal conjunto de puntajes de conocimiento para priorizar su propia investigación.
Para probar la utilidad de la base de datos, los autores eligieron 260 genes en humanos para los cuales había otros comparables en moscas, y que tenían puntajes de conocimiento de 1 o menos en ambas especies, lo que indica que casi nada se sabía sobre ellos.
Para muchos, una desactivación completa del gen era incompatible con la vida; las caídas parciales o las caídas específicas de tejido llevaron al descubrimiento de que una gran fracción contribuía a funciones esenciales que influyen en la fertilidad, el desarrollo, el crecimiento de tejidos, el control de calidad de las proteínas o la resistencia al estrés.
Los resultados sugieren que, a pesar de décadas de estudio detallado, hay miles de genes de moscas que quedan por comprender incluso en el nivel más básico, y lo mismo es claramente cierto para el genoma humano. “Estos genes no caracterizados no han merecido su descuido”, afirmó Munro.
“Nuestra base de datos proporciona una plataforma poderosa, versátil y eficiente para identificar y seleccionar genes importantes de función desconocida para el análisis, acelerando así el cierre de la brecha en el conocimiento biológico que representa lo desconocido. El papel de miles de proteínas humanas aún no está claro y, sin embargo, la investigación tiende a centrarse en aquellas que ya se comprenden bien - continuó el experto-. Para ayudar a abordar esto, creamos Unknome que presenta pantallas funcionales en una selección de estas proteínas misteriosas para demostrar cómo la ignorancia puede impulsar el descubrimiento biológico”.
Vale destacar que el equipo de trabajo se completó con João J. Rocha, Satish Arcot Jayaram, Tim J. Stevens, Nadine Muschalik, Rajen D. Shah, Sahar Emra y Cristina Robles.