En el 74% de los datos digitales para investigación científica no se citan cifras demográficas

La ausencia de segmentación o el modo en que se incluye a los sujetos pueden impactar en los resultados. Así, el sesgo en los estudios complica las conclusiones

Guardar
La mayoría de las instituciones de salud tienen datos de imágenes clínicas a una escala que va desde decenas de miles a decenas de millones de exploraciones
La mayoría de las instituciones de salud tienen datos de imágenes clínicas a una escala que va desde decenas de miles a decenas de millones de exploraciones

La disponibilidad de grandes conjuntos de datos del mundo real ha sido esencial para acelerar la investigación de datos de salud, incluido el uso de datos recopilados de forma rutinaria para impulsar nuevos descubrimientos e innovaciones. Muchas de estas innovaciones utilizan métodos estadísticos y computacionales avanzados, como el aprendizaje automático (ML). Incluyen el desarrollo de algoritmos para la detección de cáncer de mama a partir de mamografías, cáncer de piel a partir de fotografías, neumonía por radiografías de tórax y retinopatía diabética a partir de imágenes del fondo de ojo de la retina, entre muchos otros.

ML también ha encontrado muchas aplicaciones dentro de la oftalmología, que incluyen segmentación de imágenes, diagnóstico automatizado, predicción de enfermedades y pronóstico. La oftalmología es particularmente adecuada para ML debido al papel crucial de las imágenes, donde las fotografías del fondo de ojo, la tomografía de coherencia óptica (OCT), las fotografías del segmento anterior y la topografía corneal se pueden aplicar a afecciones como la retinopatía diabética, la degeneración macular relacionada con la edad, el glaucoma, papiledema y cataratas.

La investigación de datos de salud de alta calidad y el desarrollo de modelos de AA requieren datos significativos a una escala suficiente. Sobre este punto, y las dificultades en el uso de datos de manera repetida (siempre el mismo grupo) es que un grupo de la Unidad Académica del Instituto de Inflamación y Envejecimiento de la Facultad de Ciencias Médicas y Dentales de la Universidad de Birmingham realizó un reciente análisis con el fin de poner atención a la mirada reductivista en muchas de las investigaciones, a pesar de la gran cantidad de datos disponibles.

(Shutterstock.com)
(Shutterstock.com)

Indudablemente, los datos existen. La mayoría de las instituciones de salud tiene datos de imágenes clínicas a una escala que va desde decenas de miles a decenas de millones de exploraciones. Sin embargo, estos datos a menudo son inaccesibles para los investigadores, incluso cuando existe la intención de ponerlos a disposición para la investigación, debido a las barreras de acceso y usabilidad. Estas pueden incluir: barreras de gobernanza (dificultades para comprender y trabajar a través de los marcos de gobernanza que regulan el uso de datos); barreras de costos (puede haber costos generales considerables para los conjuntos de datos y muchos conjuntos de datos requieren pago para acceder); y barreras de tiempo (las solicitudes y la conservación de conjuntos de datos pueden sufrir un retraso considerable antes de que estén disponibles).

Las barreras de usabilidad incluyen: el formato de datos (los datos pueden no estar en una forma computacionalmente manejable); barreras de calidad de los datos (los datos pueden ser de calidad insuficiente o incierta); y las barreras de etiquetado de imágenes (la mayoría de los proyectos de imágenes dependen del etiquetado preciso de esas imágenes, que pueden no realizarse como parte de la atención de rutina y son difíciles de hacer retrospectivamente. Para sortear estas barreras, muchos grupos de investigación recurren al uso de conjuntos de datos de imágenes disponibles públicamente. Esta ruta alternativa a menudo conduce a que utilicen los mismos conjuntos de datos dentro de un área clínica.

Así se han utilizado varias veces conjuntos de datos de imágenes públicas bien conocidas, incluidos MESSIDOR, DRIVE, EyePACS y E-ophtha. Las barreras de calidad de los datos (los datos pueden ser de calidad insuficiente o incierta); y las barreras de etiquetado de imágenes (la mayoría de los proyectos de imágenes dependen del etiquetado preciso de esas imágenes, que pueden no realizarse como parte de la atención de rutina y son difíciles de hacer retrospectivamente).

Más datos mejor guardados

Estos datos de contagios son muy similares a los de la jornada anterior, cuando el país suramericano notificó 12.141 casos de coronavirus.EFE/ Juan Ignacio Roncoroni/Archivo
Estos datos de contagios son muy similares a los de la jornada anterior, cuando el país suramericano notificó 12.141 casos de coronavirus.EFE/ Juan Ignacio Roncoroni/Archivo

Actualmente, no existe un directorio centralizado de conjuntos de datos oftalmológicos y, por lo tanto, hay poco conocimiento sobre la cantidad de datos de imágenes oftalmológicas que están disponibles públicamente. Tampoco está claro cuál es su accesibilidad y qué tan completo es el informe de los metadatos asociados que describen las características de la imagen, las poblaciones y las enfermedades. Esta revisión tiene como objetivo identificar todos los conjuntos de datos de imágenes oftalmológicas disponibles públicamente, para crear un directorio central de lo que está disponible para el acceso actualmente. Informam la fuente de cada conjunto de datos, su accesibilidad y un resumen de las poblaciones, enfermedades y tipos de imágenes representados.

“Es muy probable -indica el líder del informe, Saad M. Khan-, que las enfermedades que se consideran mayoría o se estudian con más habitualidad sean representativas de las que se obtienen imágenes con mayor frecuencia en la práctica clínica y la investigación de rutina. En particular, en oftalmología, por ejemplo, existen programas de detección de la retinopatía diabética en varios países, lo que lleva a la acumulación de grandes datos de imágenes a nivel nacional de la población diabética”.

En todos los conjuntos de datos, la fotografía del fondo de ojo fue el tipo de imagen más común, probablemente debido a su amplia disponibilidad y uso común en una amplia gama de enfermedades oftalmológicas.

Varias variables que son clínicamente esenciales no se informaron en todos los conjuntos de datos. Los datos demográficos que incluyen edad, sexo y origen étnico no se informaron en la mayoría de los conjuntos de datos (74%), incluso a nivel agregado. Además, los criterios de inclusión y exclusión solo se definieron para el 15% de los conjuntos de datos. “Esta información faltante es motivo de preocupación, ya que no está claro si existe una representación adecuada de los grupos de población dentro de los datos, y la capacidad de los investigadores para evaluar la aplicabilidad de los resultados de la investigación a partir de estos datos estará severamente restringida”, afirma el especialista..

Para los conjuntos de datos con etiquetas de imagen (como etiquetas de diagnóstico o de características), los procesos de etiquetado también se encuentran mal definidos, según indica el documento. “Se hacen muchas suposiciones durante el etiquetado de las verdades básicas y, por lo tanto, la garantía con respecto a la precisión de la etiqueta es primordial, ya que tienen implicaciones para cualquier modelo de ML entrenado con el uso de estas etiquetas. Por lo tanto, los detalles sobre la experiencia de las etiquetadoras, el proceso de consenso utilizado para múltiples etiquetadoras y cómo se resolvieron las discrepancias son todos relevantes”, se afirma en el documento.

En los pocos conjuntos de datos que informaron esta información, los etiquetadores iban desde estudiantes de medicina, pero en la mayoría de los casos se desconocían las habilidades de los etiquetadores. Aunque el etiquetado detallado de los conjuntos de datos públicos puede ser ambicioso, una lista de verificación de elementos de metadatos de informes mínimos podría mejorar drásticamente la utilidad de los datos y también podría permitir la fusión de múltiples conjuntos de datos.

SEGUÍ LEYENDO

Guardar

Últimas Noticias

Día Mundial del Pene: cuidados para la higiene adecuada y consejos para prevenir el cáncer y otras enfermedades

La fecha busca celebrar la fertilidad y generar conciencia acerca de la práctica del sexo seguro. La salud y el cuidado del órgano reproductor masculino son fundamentales para mantener una vida sexual plena y saludable
Día Mundial del Pene: cuidados para la higiene adecuada y consejos para prevenir el cáncer y otras enfermedades

Turbulencias durante el vuelo: cinco consejos para subirse al avión sin miedo

Un piloto comercial explica por qué son habituales estos movimientos, además brindó recomendaciones sobre qué asiento elegir para sufrir menos durante el viaje. Una guía práctica y sencilla sobre algunos de los puntos más consultados por los pasajeros
Turbulencias durante el vuelo: cinco consejos para subirse al avión sin miedo

Cuáles son los tres desayunos ideales para personas con diabetes e hipertensión

Las clásicas tostadas con mermelada pueden reemplazarse por opciones más saludables, con más proteínas, fibras y minerales. Cómo ayudan a controlar estas enfermedades
Cuáles son los tres desayunos ideales para personas con diabetes e hipertensión

Cuáles son los 6 alimentos que inflaman y aumentan el riesgo de enfermedades crónicas

Varios de ellos también agotan nuestra energía. Cuáles son aquellos alimentos que se presentan como altamente inflamatorios y por qué los expertos recomiendan no consumirlos para llevar adelante una vida saludable
Cuáles son los 6 alimentos que inflaman y aumentan el riesgo de enfermedades crónicas

Cómo aliviar la ansiedad y reducir el estrés con cinco ejercicios físicos

Actividades de alta o baja intensidad, o la simple relajación permiten tonificar los músculos mientras la tensión en el cuerpo y la mente disminuyen. Qué actividades recomiendan los expertos
Cómo aliviar la ansiedad y reducir el estrés con cinco ejercicios físicos
MÁS NOTICIAS