A esta altura, ya son más de 621 millones los casos de COVID-19 en todo el mundo, con más de 6,5 millones de muertes. A pesar de la alta tasa de contagio de COVID-19 en hogares compartidos, algunas personas expuestas parecen “inmunes” a contraer el virus. Incluso, aún se desconoce, en profundidad, si la aparición de resistencia al coronavirus difiere entre las personas, según las características de la salud.
Ahora investigadores de Johns Hopkins Medicine y de la Universidad Johns Hopkins han creado y probado, preliminarmente, lo que creen que puede ser uno de los primeros modelos para predecir quién tiene la mayor probabilidad de ser resistente al COVID-19, a pesar de la exposición al virus. Los hallazgos de los científicos se publicaron en la revista PLOS ONE.
“Si podemos identificar qué personas pueden evitar naturalmente la infección por el SARS-CoV-2, podremos aprender, además de los factores sociales y de comportamiento, qué diferencias genéticas y ambientales influyen en su defensa contra el virus. Esa idea podría conducir a nuevas medidas preventivas y tratamientos más específicos”, afirmó la autora principal del estudio, Karen Yang, estudiante de posgrado en ingeniería biomédica en el Laboratorio de Investigación e Innovación en Informática Traslacional de la Universidad Johns Hopkins.
El equipo de investigación se propuso determinar si un modelo estadístico de aprendizaje automático podría usar las características de salud almacenadas en registros de salud electrónicos, proporcionando datos de pacientes como comorbilidades y medicamentos recetados, como un medio para identificar sujetos con una capacidad natural para evitar la infección por SARS-CoV-2. “Esas personas, podrían ser estudiadas para comprender mejor los factores que permiten su resistencia”, afirmó Yang.
De la mano de la IA
Un modelo de aprendizaje automático es un sistema informático que utiliza algoritmos matemáticos para encontrar patrones estadísticos y luego de identificados aplicarlos en el futuro. Esto permite a la tecnología limitar el pensamiento y el razonamiento humanos y, de manera similar al cerebro, aprender con el tiempo.
“El uso de un sistema de aprendizaje automático para reconocer patrones complejos en un gran número de personas con COVID-19 permitió a otro equipo de investigadores de Johns Hopkins Medicine en 2021 predecir el curso del caso de un paciente individual y determinar la probabilidad de que se vuelva grave. Debido a su éxito, nuestro equipo se preguntó si el mismo enfoque también podría aplicarse para predecir quién podría estar expuesto al SARS-CoV-2 en lugares cerrados y aún así no infectarse”, recordó el coautor principal del estudio, Stuart Ray, vicepresidente de medicina para análisis e integridad de datos, y profesor de medicina en la Facultad de Medicina de la Universidad Johns Hopkins.
Para demostrar la capacidad del modelo para predecir la resistencia al COVID-19, los investigadores primero adquirieron datos de un registro clínico llamado Johns Hopkins COVID-19 Precision Medicine Analytics Platform Registry (JH-CROWN). El registro contiene información de los pacientes atendidos en el Sistema de Salud Johns Hopkins que se sospecha o se ha confirmado que tuvieron una infección por SARS-CoV-2.
Los científicos solo incluyeron personas que recibieron una prueba de COVID-19 entre el 10 de junio de 2020 y el 15 de diciembre de 2020, y que informaron “exposición potencial al virus” como motivo de la prueba. La fecha de finalización elegida fue la que coincidió con el inicio de vacunación contra el COVID-19 a gran escala en los Estados Unidos. Esta inflexión les permitió a los especialistas evitar sobre sus hallazgos los efectos de vacunas que previenen la infección en lugar de la resistencia natural.
Los 8536 participantes del estudio que informaron la exposición como motivo para hacerse la prueba de COVID se dividieron en dos grupos: aquellos que no compartían una residencia (llamada “hogar” en este estudio) con ningún paciente de COVID-19 o su residencia tenía 10 o más pacientes; y aquellos que compartieron una residencia con 10 o menos personas, siendo al menos uno un paciente de COVID-19.
El primer grupo, con 8.476 de los participantes, se nombró “Conjunto de capacitación y prueba”, mientras que el segundo, llamado “Conjunto de índice de hogares (HHI)”, tenía 60 miembros y se usó como prueba. Según los investigadores, determinar el número de 10 o menos personas en el hogar excluyó a quienes viven en áreas de vivienda de unidades múltiples de mayor densidad donde la exposición a una persona en particular positiva para SARS-CoV-2 sería menos intensa.
Hacer las cuentas
Para identificar patrones y agrupar a los participantes de modo que se destaquen aquellos naturalmente resistentes al SARS-CoV-2, ambos conjuntos de estudio se analizaron utilizando el algoritmo de agrupamiento basado en modelos de selección de patrones de máxima frecuencia y confianza total (MASPC, por sus siglas en inglés).
MASPC está diseñado específicamente para el análisis de datos de registros de salud electrónicos que combina información demográfica del paciente (edad, sexo y raza), la Clasificación Estadística Internacional de Enfermedades y Problemas de Salud Relacionados (ICD) códigos de diagnóstico médico relevantes para cada caso, órdenes de medicamentos para pacientes ambulatorios y el número de comorbilidades (otras enfermedades) presentes. Todas ellas, herramientas de uso habitual en los centros médicos de Estados Unidos y capaces de compartir información de modo abierto.
“Presumimos que MASPC nos permitiría agrupar a pacientes con patrones similares en sus datos para definirlos como resistentes y no resistentes al SARS-CoV-2, y con la esperanza de que el algoritmo aprendiera con cada análisis cómo mejorar la precisión y confiabilidad de asignaciones futuras. Este estudio inicial con datos de JH-CROWN se realizó para dar vida a esa hipótesis, un ensayo de prueba de concepto de nuestro modelo estadístico para mostrar que la resistencia a COVID-19 podría ser predecible según el perfil clínico y demográfico de un paciente”, explicó Ray.
”En el Conjunto de entrenamiento y prueba, identificamos 56 patrones de códigos ICD divididos en dos grupos: asociados con resistencia o no. Los análisis estadísticos de qué tan bien diferenciaron estos patrones entre la resistencia y la no resistencia arrojaron cinco que hicieron el mejor trabajo para nuestra población de estudio pequeña y localizada para definir quién estuvo más probablemente expuesto al SARS-CoV -2″ contó Yang.
”Al buscar estos patrones, las personas con mayor probabilidad de haber estado expuestas al SARS-CoV-2 en lugares cerrados, y luego analizar estadísticamente los resultados, el mejor rendimiento de nuestro modelo fue 0,6. Dado que una puntuación de 0,5 muestra solo una asociación aleatoria entre la predicción y la realidad, y 1 es una asociación del 100%, esto muestra que el modelo es prometedor como herramienta para identificar a las personas con resistencia a la COVID-19 que pueden estudiarse más a fondo”, dijo Ray.
Junto con Yang y Ray, los miembros del equipo de estudio de Johns Hopkins Medicine y la Universidad Johns Hopkins son los estudiantes de posgrado y pregrado Yijia Chen, Jacob Desman, Kevin Gorman, Chloé Paris, Ilia Rattsev, Tony Wei y Rebecca Yoo; y los coautores principales de la facultad Joseph Greenstein y Casey Overby Taylor.
Seguir leyendo