En los últimos dos años y medio, se han enviado al espacio dos telescopios de próxima generación: el Espacial James Webb (JWST) de la NASA y el Observatorio Euclid de la ESA. Antes de que termine la década, se les unirán el Telescopio Espacial Romano Nancy Grace (RST), el Espectrofotómetro para la Historia del Universo, la Época de la Reionización y el Explorador de Hielos (SPHEREx) de la NASA, y el Tránsito y Oscilaciones Planetarias de la ESA (PLATO), entre otros.
Estos observatorios se basarán en óptica e instrumentos avanzados para ayudar en la búsqueda y caracterización de exoplanetas con el objetivo final de encontrar planetas habitables. Junto con las misiones aún operativas, estos observatorios recopilarán volúmenes masivos de datos espectroscópicos de alta resolución.
Clasificar esta información requerirá técnicas de aprendizaje automático de vanguardia para buscar indicios de vida y procesos biológicos (también conocidos como biofirmas). En un artículo reciente, un equipo de científicos del Instituto de Teoría Fundamental de la Universidad de Florida (UF-IFL) recomendó que futuros estudios utilicen el aprendizaje automático para buscar anomalías en los espectros, que podrían revelar firmas químicas inusuales y biológicas desconocidas.
Una preimpresión de su artículo se publicó en arXiv y está siendo revisada para su publicación en Astrophysical Journal. Allí los especialistas explicaron, que la “vida” sigue siendo una cuestión abierta para los científicos, y sería ventajoso ampliar el alcance de nuestra búsqueda.
La primera detección confirmada de un exoplaneta (una opción similar a la Tierra que podría albergar vida) fue en 1992, y consistió en dos Supertierras (Poltergeist y Phobitor) observadas alrededor de un púlsar (PSR B1257+12, también conocido como Lich) situado a 2.300 años luz de la Tierra. Si bien los científicos creían firmemente que la mayoría de las estrellas tenían su propio sistema de planetas, antes de este descubrimiento no contaban con pruebas indiscutibles. Y hasta el lanzamiento del Telescopio Espacial Kepler en 2009, los descubrimientos de exoplanetas se sumaban a un ritmo de unos pocos por año.
Desde entonces, se han confirmado un total de 5.496 exoplanetas en 4.096 sistemas, y otros 9.820 candidatos esperan confirmación. En los últimos años, el proceso ha pasado del descubrimiento a la caracterización, donde instrumentos y métodos mejorados han permitido a los astrónomos analizar las atmósferas de los exoplanetas directamente para medir su habitabilidad potencial.
“Los instrumentos son cada vez mejores -explicó Matcheva en una entrevista otorgada a USA Today-; mejor resolución espectral, nivel excepcional de señal/ruido, cobertura de longitud de onda más amplia. Además del JWST, que ha realizado algunas observaciones espectroscópicas excepcionales de varios exoplanetas, la ESA está planeando un telescopio espacial dedicado a exoplanetas ARIEL que observará 1000 de ellos. El análisis de estos datos mantendrá a los científicos ocupados durante mucho tiempo”.
Según Matcheva, los campos de los estudios de exoplanetas y la astrobiología son increíblemente fascinantes debido al gran potencial que implican. Actualmente, este campo se ocupa en gran medida de limitar la habitabilidad mediante la búsqueda específica de biofirmas: evidencia de vida y procesos orgánicos.
Buscar lo desconocido
Utilizando la Tierra como modelo, el único planeta donde se sabe que existe vida, las biofirmas más buscadas incluyen gas nitrógeno (N2), oxígeno gaseoso (O ), dióxido de carbono (CO2), metano (CH4), amoníaco. (NH3) y agua (H2O).
Esto constituye el enfoque fácil, en el que los científicos buscan vida que se ajuste a los estándares terrestres. Esto no es un accidente ni un foco perezoso. Es simplemente porque es extremadamente difícil buscar signos de vida con los que no estamos familiarizados. Pero esto también presenta una oportunidad para contemplar las posibilidades y ampliar el alcance de lo que sabemos.
“¿Sabemos qué buscar? -se preguntó Matcheva-. ¿Sabemos dónde? ¿Lo reconoceríamos si lo viéramos? La comunidad científica de exoplanetas siempre trabaja con estas preguntas en mente”.
Para su estudio, Matcheva y sus colegas investigaron cómo se podría entrenar el aprendizaje automático para buscar anomalías en los espectros de tránsito. Esto se refiere a las curvas de luz obtenidas al observar estrellas distantes en busca de caídas periódicas de luminosidad, que podrían indicar la presencia de un planeta que pasa frente a la estrella en relación con el observador. Esto se conoce como espectroscopia de tránsito (o método de tránsito), que sigue siendo el método más eficaz y más utilizado para detectar exoplanetas. Además de la detección, este método permite a los astrónomos observar ocasionalmente la luz que atraviesa su atmósfera.
Cuando se miden con un espectrómetro, estas observaciones revelarán datos sobre la composición química, que podrían incluir biofirmas reveladoras. En los próximos años, la combinación de telescopios de próxima generación y aprendizaje automático permitirá a los astrónomos determinar con mayor precisión la habitabilidad potencial de los exoplanetas. “Creemos que los métodos de aprendizaje automático en astrofísica pueden cambiar las reglas del juego en la forma en que procesamos datos en términos de velocidad, volumen y metodología -continuó Matcheva-. Y lo vemos en todos los campos de la ciencia”.
Para sus propósitos, ella y su equipo utilizaron dos métodos populares de aprendizaje automático para la detección de anomalías: el factor atípico local (LOF) y la máquina de vectores de soporte de una clase (OCSVM) para analizar una gran base de datos pública de espectros sintéticos.
Esta base de datos fue desarrollada por el equipo científico ARIEL de la ESA en anticipación de la misión (cuyo lanzamiento está previsto para 2029) y contiene más de 100.000 señales espectrales de exoplanetas generadas por computadora. El equipo también utilizó curvas de características operativas del receptor (ROC) para cuantificar y comparar el rendimiento de las dos técnicas de ML. El proceso y los resultados, como relató Matcheva, fueron fascinantes: los espectros se calculan con modelos actuales, asumiendo que la atmósfera de cada planeta es una mezcla de cinco gases diferentes en diferentes proporciones.
“A modo de experimento, tratamos a uno de los absorbentes (por ejemplo, H2O) como un misterio absorbedor. Entrenamos el algoritmo en un subconjunto de datos que son deficientes en H2O y probamos si marcará correctamente los planetas con agua como anómalos. Repetimos el experimento para cuatro de los gases. Usamos tanto LOF como OCSVM. Ambos métodos hicieron un excelente trabajo al encontrar planetas anómalos cuando no hay ruido o hay muy poco ruido (~10 ppm), incluso para cantidades muy pequeñas de el gas misterioso. Como era de esperar, el modelo ML comienza a cometer errores cuando el nivel de ruido aumenta demasiado”, señaló.
Aunque la búsqueda de firmas biológicas no era el objetivo principal de este artículo, “es un resultado muy interesante y estamos muy entusiasmados con el potencial del método -afirmó Matcheva-. Buscar señales de vida en el universo es más como buscar una aguja en un pajar que una prueba humeante. En realidad, es incluso más desafiante porque no sabemos cómo es la aguja. Los novedosos métodos de detección están diseñados exactamente: eventos raros que no sabemos cómo se ven, huelen o suenan”.
Como se señaló anteriormente, la búsqueda de vida extraterrestre puede resumirse como la búsqueda de vida tal como la conocemos. Pero si es muy rara o muy exótica, lo que significa que puede surgir de todo tipo de sustancias químicas y condiciones. Entonces, tiene sentido lanzar una red más amplia. “La comunidad de astrobiología ha estado trabajando en una definición de vida durante mucho tiempo -continuó la científica-, pero no tenemos idea de cómo son realmente los extraterrestres y cómo interactuarían con su entorno”, aseguró.
Y concluyó: “Estamos sesgados por nuestra experiencia humana y las estrategias actuales. Debemos buscar vida en la zona habitable, que por definición es amigable para los humanos (o la vida terrestre). Entonces, ¿cómo se busca algo cuando no se sabe qué aspecto tiene? Ahí es donde entran en juego las técnicas de aprendizaje automático de detección de novedades: pueden señalar puntos de datos que son inconsistentes con los datos de entrenamiento, es decir, que no están de acuerdo con los modelos teóricos actuales. De hecho, en ese sentido, nuestro método es buscar vida como no la conocemos”. El trabajo también formaron parte físicos y expertos en aprendizaje automático, con lo cual además de Matcheva, participaron Roy T. Forestano, Konstantin T. Matchev y Eyup B. Unlu.