MADRID, 18 Sep. (EUROPA PRESS) -
Una herramienta de aprendizaje profundo de inteligencia artificial (IA) que estima el riesgo de malignidad de los nódulos pulmonares logró altas tasas de detección de cáncer, a la vez que redujo significativamente los falsos positivos, según expertos del Centro Médico Universitario Radboud de Nimega, Países Bajos.
Los resultados del estudio, que utilizó datos de amplios ensayos de cribado de cáncer de pulmón realizados en múltiples centros, se publican en 'Radiology', revista de la Sociedad Radiológica de Norteamérica (RSNA).
El cáncer de pulmón sigue siendo un problema de salud global importante, causando la mayor cantidad de muertes por cáncer en todo el mundo. Se ha demostrado que el cribado de personas de alto riesgo mediante tomografía computarizada de tórax de baja dosis reduce la mortalidad por cáncer de pulmón. Sin embargo, los ensayos de cribado temprano han reportado altas tasas de falsos positivos, lo que conlleva procedimientos de seguimiento innecesarios, mayor ansiedad en los pacientes y mayores costos de atención médica.
Los nódulos pulmonares (pequeños crecimientos redondos u ovalados en los pulmones) son comunes, y determinar cuáles son malignos es un desafío en la detección del cáncer de pulmón.
"El aprendizaje profundo ofrece soluciones prometedoras, pero una validación sólida es esencial", apunta la doctora Noa Antonissen, investigadora principal y candidata a doctorado en el Centro Médico Universitario Radboud de Nimega. "La IA tiene en cuenta factores que tal vez ni siquiera veamos en la tomografía computarizada para evaluar con mayor precisión la probabilidad de malignidad de un nódulo".
ALTERNATIVA PROMETEDORA AL PERMITIR PREDICCIONES
La mayoría de los protocolos actuales de detección del cáncer de pulmón se basan en el tamaño, el tipo y el crecimiento de los nódulos para estimar el riesgo de malignidad. El modelo Pancanadiense de Detección Temprana del Cáncer de Pulmón (PanCan), que estima el riesgo de malignidad de los nódulos mediante la combinación de características del paciente y del nódulo, ilustra cómo las herramientas basadas en la probabilidad pueden refinar la evaluación del riesgo.
Estos umbrales de riesgo basados en la probabilidad se utilizan cada vez más para orientar los protocolos de tratamiento. El aprendizaje profundo ofrece una alternativa prometedora al permitir predicciones basadas en datos, pero se necesita más evidencia antes de que pueda adoptarse en la práctica clínica.
En el estudio retrospectivo, los investigadores entrenaron su algoritmo de aprendizaje profundo desarrollado internamente para estimar el riesgo de malignidad de los nódulos pulmonares utilizando datos del Ensayo Nacional de Detección Pulmonar que incluyó 16.077 nódulos (1.249 malignos).
Se realizaron pruebas externas utilizando tomografías computarizadas basales del Ensayo Danés de Detección de Cáncer de Pulmón, el Ensayo Multicéntrico Italiano de Detección de Pulmón y el Ensayo Neerlandés-Belga NELSON. La cohorte combinada incluyó a 4.146 participantes (mediana de edad: 58 años, 78% varones, mediana de antecedentes de tabaquismo: 38 paquetes-año) con 7.614 nódulos benignos y 180 malignos.
Los investigadores evaluaron el desempeño del algoritmo para la cohorte agrupada y dos subconjuntos: nódulos indeterminados (5-15 mm) y nódulos malignos cuyo tamaño coincidía con el de los nódulos benignos.
"Seleccionamos nódulos de 5 a 15 mm debido a sus dificultades diagnósticas y la frecuente necesidad de seguimiento a corto plazo", reseña el doctor Antonissen. "Una clasificación precisa del riesgo de estos nódulos podría reducir los procedimientos innecesarios".
A modo de comparación, se evaluó el rendimiento del algoritmo frente al modelo PanCan a nivel de nódulo y de participante, utilizando el área bajo la curva característica operativa del receptor (AUC), entre otros parámetros. El AUC resume la capacidad de un modelo para generar puntuaciones relativas que permitan discriminar entre instancias positivas y negativas en todos los umbrales de clasificación.
En la cohorte agrupada, el modelo de aprendizaje profundo alcanzó AUC de 0,98, 0,96 y 0,94 para los cánceres diagnosticados dentro de un año, dos años y durante la detección, respectivamente, en comparación con PanCan con 0,98, 0,94 y 0,93. En el caso de los nódulos indeterminados (129 malignos, 2.086 benignos), el modelo de aprendizaje profundo superó significativamente a PanCan en todos los intervalos de tiempo, con AUC de 0,95, 0,94 y 0,90 frente a 0,91, 0,88 y 0,86. En el caso de los cánceres con tamaño similar a los nódulos benignos (180 malignos, 360 benignos), el AUC del modelo de aprendizaje profundo fue de 0,79, frente a 0,60 para PanCan.
Con una sensibilidad del 100% para los cánceres diagnosticados dentro de un año, el modelo de aprendizaje profundo clasificó el 68,1% de los casos benignos como de bajo riesgo en comparación con el 47,4% utilizando el modelo PanCan, lo que representa una reducción relativa del 39,4% en falsos positivos.
"Los algoritmos de aprendizaje profundo pueden ayudar a los radiólogos a decidir si es necesario realizar imágenes de seguimiento, pero se requiere una validación prospectiva para determinar la aplicabilidad clínica de estas herramientas y guiar su implementación en la práctica", finaliza el doctor Antonissen. "Reducir los falsos positivos facilitará la detección del cáncer de pulmón".