Una estrategia lectura híbrida asistida por IA mejora la interpretación de mamografías

Archivo - Imagen de recurso de una mamografía.
Archivo - Imagen de recurso de una mamografía. - ISTOCK - Archivo
Publicado: miércoles, 27 agosto 2025 7:29

MADRID 27 Ago. (EUROPA PRESS) -

Una estrategia híbrida de lectura de mamografías de cribado mediante inteligencia artificial (IA), desarrollada por investigadores holandeses y aplicada retrospectivamente a más de 40.000 exámenes, redujo la carga de trabajo de los radiólogos en un 38 por ciento, sin alterar las tasas de repetición de pruebas ni de detección de cáncer.

El estudio, que hace hincapié en la fiabilidad de la IA, se ha publicado en 'Radiology', una revista de la Sociedad Radiológica de Norteamérica (RSNA). "Aunque el rendimiento general de los modelos de IA de última generación es muy alto, la IA a veces comete errores", afirma Sarah D. Verboom, doctoranda del Departamento de Imagen Médica del Centro Médico Universitario Radboud de los Países Bajos.

"Identificar los exámenes en los que la interpretación de la IA no es fiable es fundamental para permitir y optimizar el uso de modelos de IA en los programas de detección del cáncer de mama", ha añadido Verboom.

La estrategia de lectura híbrida consiste en utilizar una combinación de lectores radiólogos y una interpretación independiente de la IA de los casos en los que el modelo de IA funciona tan bien o mejor que el radiólogo.

"Podemos alcanzar este nivel de rendimiento si el modelo de IA proporciona no solo una evaluación de la probabilidad de malignidad (PoM) de un caso, sino también una calificación de la certeza de esa evaluación", afirma Verboom.

"Desgraciadamente, la PoM por sí sola no siempre es un buen predictor de certeza, ya que las redes neuronales profundas tienden a ser demasiado confiadas en sus predicciones", ha agregado la investigadora.

Para desarrollar y evaluar una estrategia de lectura híbrida, los investigadores utilizaron un conjunto de datos de 41.469 mamografías de cribado realizadas a 15.522 mujeres (edad media de 59 años) con 332 cánceres detectados mediante cribado y 34 cánceres de intervalo. Las pruebas se realizaron entre 2003 y 2018 en Utrecht (Países Bajos), como parte del Programa Nacional de Cribado del Cáncer de Mama de los Países Bajos.

El conjunto de datos se dividió a nivel de pacientes en dos grupos iguales con tasas idénticas de detección de cáncer, rellamadas y cánceres de intervalo. El primer grupo se utilizó para determinar los umbrales óptimos para la estrategia de lectura híbrida, mientras que el segundo grupo se utilizó para evaluar las estrategias de lectura.

De las métricas de incertidumbre evaluadas por los investigadores, la entropía de la puntuación media del PoM de la región más sospechosa produjo una tasa de detección de cáncer de 6,6 por cada 1.000 casos y una tasa de recuperación de 23,7 por cada 1.000 casos, similares a las tasas de la doble lectura estándar realizada por radiólogos.

La estrategia de lectura híbrida final consistió en que la IA evaluara cada mamografía de cribado para producir dos resultados: el PoM y una estimación de la incertidumbre de esa predicción. Cuando la IA determinaba con certeza que el PoM estaba por debajo del umbral establecido, el caso se consideraba normal. Cuando la IA detectaba un PoM por encima del umbral establecido, se citaba a las mujeres para realizar más pruebas, pero solo cuando esa predicción se consideraba fiable. De lo contrario, el examen era leído dos veces por radiólogos.

REDUJO LA CARGA DE TRABAJO DE LOS RADIÓLOGOS

Aunque la mayoría de las decisiones de la IA eran inciertas y se remitían a un lector humano, el 38 por ciento se clasificaron como seguras y pudieron ser leídas únicamente por la IA. El uso de la estrategia de los investigadores redujo la carga de trabajo de lectura de los radiólogos al 61,9 por ciento sin alterar las tasas de rellamada (23,6 frente a 23,9) ni de detección de cáncer (6,6 frente a 6,7), ambas comparables a las de la doble lectura estándar.

Cuando el modelo de IA era seguro, el área bajo la curva (AUC) era mayor (0,96 frente a 0,87). Su sensibilidad casi igualaba a la de la doble lectura de los radiólogos (85,4% frente a 88,9%). Las mujeres más jóvenes con mamas densas eran más propensas a tener una puntuación de IA incierta.

"El componente clave de nuestro estudio no es necesariamente que esta sea la mejor manera de dividir la carga de trabajo, sino que es útil incorporar la cuantificación de la incertidumbre en los modelos de IA", afirma Verboom, que espera que los productos comerciales integren esto en sus modelos.

Verboom señala que, si los resultados del estudio se aplicaran a la práctica clínica, la decisión de volver a citar al 19 por ciento de las mujeres la tomaría la IA sin la intervención de un radiólogo. "Varios estudios han demostrado que las mujeres que participan en programas de detección del cáncer de mama tienen una actitud positiva hacia el uso de la IA", afirma. "Sin embargo, la mayoría de las mujeres prefieren que su mamografía sea interpretada por al menos un radiólogo", agrega.

"El uso de la IA con cuantificación de la incertidumbre puede ser una posible solución para la escasez de personal y podría ayudar a generar confianza en la implementación de la IA", finaliza Verboom.

Contador