MADRID, 22 Ago. (EUROPA PRESS) -
Un estudio ha demostrado que una herramienta comercial de inteligencia artificial (IA), utilizada de forma no especializada, fue eficaz para excluir patologías y presentó tasas de errores críticos en radiografías de tórax iguales o inferiores a las de los radiólogos.
Los recientes avances en IA han suscitado un creciente interés por el diagnóstico asistido por ordenador, en parte motivado por la creciente carga de trabajo a la que se enfrentan los departamentos de radiología, la escasez mundial de radiólogos y el potencial de agotamiento en este campo. Las consultas de radiología tienen un gran volumen de radiografías de tórax no significativas (sin hallazgos clínicos significativos), y la IA podría mejorar el flujo de trabajo proporcionando un informe automático.
En este estudio, publicado en 'Radiology', revista de la Sociedad Radiológica de Norteamérica (RSNA, por sus siglas en inglés), investigadores daneses se propusieron calcular la proporción de radiografías de tórax anodinas en las que la IA podría excluir correctamente una patología sin aumentar los errores de diagnóstico. El estudio incluyó informes radiológicos y datos de 1.961 pacientes (edad media, 72 años; 993 mujeres), con una radiografía de tórax por paciente, obtenidos en cuatro hospitales daneses.
"Nuestro grupo y otros han demostrado anteriormente que las herramientas de IA son capaces de excluir patologías en radiografías de tórax con un alto grado de fiabilidad y, por tanto, proporcionar un informe normal autónomo sin la intervención de un humano", afirma el autor principal, Louis Lind Plesner, del Departamento de Radiología del Hospital Herlev y Gentofte de Copenhague (Dinamarca).
"Estos algoritmos de IA pasan por alto muy pocas radiografías de tórax anormales. Sin embargo, antes de nuestro estudio actual, no sabíamos cuál era el umbral adecuado para estos modelos", ha agregado.
El equipo de investigación quería saber si la calidad de los errores cometidos por la IA y los radiólogos era diferente y si los errores de la IA, de media, son objetivamente peores que los errores humanos.
La herramienta de IA se adaptó para generar una probabilidad de 'notableidad' de la radiografía de tórax, que se utilizó para calcular la especificidad (una medida de la capacidad de una prueba médica para identificar correctamente a las personas que no tienen una enfermedad) con diferentes sensibilidades de IA.
Dos radiólogos torácicos, que no conocían los resultados de la IA, etiquetaron las radiografías torácicas como 'notables' o 'no notables' basándose en hallazgos no notables predefinidos. Las radiografías de tórax en las que la IA o el informe radiológico omitieron algún hallazgo fueron calificadas por un radiólogo de tórax, que no conocía si el error había sido cometido por la IA o por el radiólogo, como críticas, clínicamente significativas o clínicamente insignificantes.
TASAS DE ERRORES CRÍTICOS INFERIORES
El estándar de referencia etiquetó 1.231 de 1.961 radiografías de tórax (62,8%) como notables y 730 de 1.961 (37,2%) como no notables. La herramienta de IA excluyó correctamente la patología entre el 24,5 y el 52,7 por ciento de las radiografías de tórax no destacables con una sensibilidad superior o igual al 98 por ciento, con tasas de errores críticos inferiores a las encontradas en los informes radiológicos asociados a las imágenes.
Plesner señala que los errores cometidos por la IA fueron, de media, clínicamente más graves para el paciente que los cometidos por los radiólogos. "Esto se debe probablemente a que los radiólogos interpretan los hallazgos basándose en el escenario clínico, cosa que la IA no hace", ha afirmado.
"Por lo tanto, cuando se pretende que la IA proporcione un informe normal automatizado, tiene que ser más sensible que el radiólogo para evitar que disminuya el estándar de atención durante la implementación. Este hallazgo también es interesante en general en esta era de capacidades de IA que abarcan múltiples entornos de alto riesgo no solo limitados a la atención sanitaria", ha agregado.
Según Plesner, la IA podría informar de forma autónoma sobre más de la mitad de las radiografías de tórax normales. "En nuestra población de estudio basada en hospitales, esto significaba que más del 20 por ciento de todas las radiografías de tórax podrían haber sido potencialmente informadas de forma autónoma utilizando esta metodología, manteniendo al mismo tiempo una tasa de errores clínicamente relevantes más baja que el estándar actual", ha señalado.
Por último, Plesner ha indicado que es necesaria una aplicación prospectiva del modelo utilizando uno de los umbrales sugeridos en el estudio antes de poder recomendar una implantación generalizada.