Parece una combinación obvia: aprendizaje automático y lucha contra COVID-19. Y, sin embargo, a pesar del intenso interés y la creciente disponibilidad de grandes conjuntos de datos, las historias de éxito de tales combinaciones son pocas y distantes entre sí. Hamsa Bastani, Kimon Drakopoulos y Vishal Gupta, investigadores del departamento de Operaciones, Información y Decisiones, de la Universidad de Pensilvania en Filadelfia, publicaron una investigación en Nature donde describen un sistema que diseñaron e implementaron en los puntos de entrada a Grecia.
El algoritmo, que se basa en un método llamado aprendizaje por refuerzo, aumentó notablemente la eficiencia de las pruebas para el coronavirus SARS-CoV-2, y contribuyó a la capacidad de Grecia para mantener sus fronteras abiertas de forma segura. El trabajo también proporciona una advertencia clara sobre las deficiencias de las herramientas de política comparativamente contundentes que la mayoría de los demás países siguen utilizando. Las pruebas son un problema que el aprendizaje automático está bien preparado para resolver. “Imagínese un agente de control de fronteras en una isla griega -indica Bastani-. Un vuelo acaba de aterrizar y la tarea del agente es identificar y detener a cualquier persona que tenga COVID-19. El agente puede querer probar a todos los pasajeros que llegan, pero la capacidad de prueba en la isla es muy limitada y, de manera más general, nunca es posible probar al 100% de cualquier población el 100% del tiempo.
La alternativa, cerrar la frontera por completo, en una economía altamente dependiente del turismo, tiene sus propios peligros. Estos incluirían no solo un enorme costo financiero asociado con la pérdida de empleos e ingresos, sino también los efectos negativos de tales pérdidas en la salud pública. Entonces, el agente fronterizo se enfrenta a una decisión difícil: ¿a quién se le debe hacer la prueba?”
El valor de una prueba depende de su resultado final. En este escenario, una prueba negativa genera solo costos: el costo de la prueba y un retraso para el viajero. Por el contrario, una prueba positiva genera un beneficio tremendo: prevención de todos los casos de COVID-19 que habría causado un viajero infectado. Entonces, al decidir a quién realizar la prueba, la estrategia óptima del agente fronterizo es clara: predecir qué viajeros tienen la mayor probabilidad de dar positivo y realizar la prueba.
“Esta estrategia maximiza el valor de las pruebas, porque detecta a la mayoría de los viajeros con COVID-19 utilizando la menor cantidad de pruebas”, sostiene Bastani. Si el agente fronterizo pudiera predecir qué pasajeros entrantes tienen más probabilidades de dar positivo, las pruebas podrían asignarse de manera eficiente. Convenientemente, los datos sobre los pasajeros entrantes, su país y región de origen, edad y sexo, están disponibles digitalmente, en el formulario de localización de pasajeros que todos los viajeros completan 24 horas antes de su llegada a Grecia. Parece bastante sencillo utilizar datos de pruebas anteriores de pasajeros entrantes para predecir qué tipos de pasajeros podrían tener más probabilidades de dar positivo en el futuro. Pero, como han demostrado décadas de investigación en estadística e informática, esta estrategia corre el riesgo de quedar atrapada en la pandemia de ayer: “Dada la dinámica en rápida evolución de la propagación de COVID-19, un algoritmo debe adaptar rápidamente sus predicciones para mantenerse un paso por delante y seguir probando a los pasajeros adecuados”, indica Bastani.
Aquí es donde los especialistas destacan el valor del aprendizaje automático. Así como el modo en que se puede entrenar un algoritmo para jugar el juego Go aprendiendo qué movimientos conducen a ganar el juego, Bastani y sus colegas entrenaron un algoritmo para asignar pruebas escasas, aprendiendo qué pasajeros tienen probabilidades de dar positivo. Fundamentalmente, el algoritmo equilibra dos objetivos.
El primer objetivo, y el más natural, es probar los tipos de pasajeros que probablemente den positivo en la prueba, aprovechando los patrones aprendidos de los datos anteriores sobre el resultado de las pruebas para el SARS-CoV-2 en estos diferentes grupos. El segundo, quizás menos intuitivo, pero igualmente importante, es explorar patrones no reflejados en datos anteriores, probando tipos de pasajeros sobre los cuales el algoritmo sabe poco.
Luego, en un puerto de entrada determinado en un cierto día, el algoritmo entrega recomendaciones específicas a los agentes fronterizos sobre qué pasajeros probar, respetando el presupuesto y las limitaciones de recursos impuestas por las cadenas de suministro, la dotación de personal, la capacidad del laboratorio y la logística de entrega de muestras biológicas. Estas limitaciones son reales y vinculantes: los autores señalan que, en el pico de la temporada de turismo de verano, solo había capacidad para evaluar al 18,4% de los viajeros entrantes, incluso después de que el Comité Nacional Griego de Expertos COVID-19 aprobó sabiamente las pruebas grupales para conducir beneficios de eficiencia en el laboratorio.
Los autores se basan en las estrategias de aprendizaje reforzado que han impulsado los avances en el comercio y el marketing online. Pero el uso de un algoritmo de este tipo en el mundo real plantea sus propios desafíos técnicos. Por ejemplo, el algoritmo debe aprender de manera discontinua, a partir de grandes lotes de resultados de pruebas, en lugar de uno por uno a partir de datos individuales. Y la retroalimentación de los resultados de los lotes se retrasa, lo que obliga al algoritmo a operar desinformado mientras espera los resultados.
Resolver estos desafíos requirió un ajuste sustancial de los algoritmos que generalmente están diseñados para configuraciones en línea más fáciles y más ricas en datos. Los desafíos más espinosos, sin embargo, son legales y políticos. Para cumplir con el Reglamento General de Protección de Datos (GDPR) de la Unión Europea, los autores limitaron deliberadamente los datos disponibles para el algoritmo y, por lo tanto, su precisión, en estrecha consulta con abogados, epidemiólogos y legisladores. El límite potencial impuesto al rendimiento del algoritmo por el GDPR destaca cómo las leyes bien intencionadas para proteger la privacidad pueden tener consecuencias tanto positivas como negativas.
“En una pandemia que no respeta la privacidad de las personas -advierte Bastani-, tales regulaciones pueden, en última instancia, obstaculizar la capacidad de un gobierno para proteger la salud de sus ciudadanos. Los autores también adaptaron el algoritmo teniendo en cuenta a una audiencia política, eligiendo sus métodos de optimización para mostrar claramente el valor de ambos objetivos del algoritmo. “Los resultados fueron impresionantes”, destaca Bastani.
El sistema automatizado duplicó la eficiencia de las pruebas, la cantidad de casos detectados por prueba, lo que permitió a los agentes fronterizos realizar pruebas y poner en cuarentena a los pasajeros correctos, muchos de los cuales estaban asintomáticos, mientras dejaban a otros pasar a su destino final.
El éxito del algoritmo presentado por Bastani y sus colegas destaca la insuficiencia de las políticas fronterizas de casi todos los demás países. Las decisiones que subyacen a estas políticas, por ejemplo, si negar a todos los viajeros la entrada al país o forzar la prueba o la cuarentena de todos los viajeros de un país determinado, tienen dos defectos clave. Primero, estas decisiones se toman sobre países enteros, en lugar de individuos, sin tener en cuenta las grandes diferencias entre las personas dentro de los países. En segundo lugar, normalmente se elaboran sobre la base de datos epidemiológicos a nivel de país que, como muestra el presente documento, tienen deficiencias notables.
Si los agentes fronterizos hubieran negado la entrada a todos los pasajeros de países que tenían métricas preocupantes, habrían impedido que esas personas con COVID-19 ingresaran a Grecia, pero a costa de aplastar un pilar clave de la economía. Sin embargo, si simplemente hubieran probado personas proporcionales a las métricas de COVID-19 informadas de un país en lugar de predicciones algorítmicas, su eficiencia de prueba habría sido mucho menor. Esto se debe a que las métricas de COVID-19 informadas pueden ser muy diferentes de la prevalencia real de la enfermedad entre los viajeros que llegan. Los viajeros no se extraen al azar de las poblaciones de sus países, y los datos recopilados pasivamente sobre casos de COVID-19 o muertes asociadas con la enfermedad reflejan grandes sesgos de notificación y barreras sistémicas de acceso.
De hecho, al probar de manera eficiente a los pasajeros entrantes, el algoritmo de los autores pudo anticipar picos en las tasas de infección del SARS-CoV-2 entre las poblaciones de viajeros casi 9 días antes que si hubieran utilizado solo datos epidemiológicos a nivel de país. “Esto indica el enorme valor de la recopilación de datos inteligente y deliberada, y los peligros de depender de datos contundentes y defectuosos a nivel de país para tomar decisiones importantes”, concluye Bastani.
SEGUIR LEYENDO