MADRID 1 Oct. (EUROPA PRESS) -

Los médicos y enfermeras son mejores que la inteligencia artificial (IA) en la clasificación de pacientes en los departamentos de emergencia, según una investigación de la Universidad de Vilnius, Lituania, presentada en el Congreso Europeo de Medicina de Emergencia, celebrado en Viena, Austria.

Sin embargo, la doctora Renata Jukneviciene, investigadora postdoctoral de la Universidad de Vilnius, que presentó el estudio, aporta que la IA podría ser útil cuando se utiliza junto con el personal clínico. No obstante, no debería utilizarse como una herramienta de clasificación independiente.

"Realizamos este estudio para abordar el creciente problema de la saturación en los servicios de urgencias y la creciente carga de trabajo del personal de enfermería", declara el doctor Jukneviciene. "Dado el rápido desarrollo de herramientas de IA como ChatGPT, nuestro objetivo era explorar si la IA podría facilitar la toma de decisiones de triaje, mejorar la eficiencia y reducir la carga del personal en Urgencias".

Los investigadores distribuyeron un cuestionario impreso y digital a seis médicos de urgencias y 51 enfermeras del servicio de urgencias del Hospital Universitario Santaros Klinikos de Vilna. Les pidieron que clasificaran casos clínicos seleccionados aleatoriamente de 110 informes citados en la base de datos PubMed en internet. El personal clínico debía clasificar a los pacientes según la urgencia, colocándolos en una de cinco categorías, de mayor a menor urgencia, utilizando el Sistema de Triaje de Manchester. Los mismos casos se analizaron con ChatGPT (versión 3.5). Un total de 44 enfermeras (86,3%) y seis médicos (100%) completaron el cuestionario.

"En general, la IA tuvo un rendimiento inferior al de las enfermeras y los médicos en la mayoría de las métricas que medimos", aporta Jukneviciene. "Por ejemplo, la precisión general de la IA fue del 50,4%, en comparación con el 65,5% de las enfermeras y el 70,6% de los médicos. La sensibilidad (la precisión con la que identificó los casos verdaderamente urgentes) de la IA también fue menor, con un 58,3%, en comparación con la de las enfermeras, que obtuvieron un 73,8% y los médicos, que obtuvieron un 83%".

Los médicos obtuvieron las puntuaciones más altas en todas las áreas y categorías de urgencia que analizaron los investigadores. Sin embargo, la IA superó al personal de enfermería en la primera categoría de triaje, que corresponde a los casos más urgentes; mostró mayor precisión y especificidad, lo que significa que identificó los casos verdaderamente mortales. En cuanto a precisión, la IA obtuvo un 27,3% en comparación con el 9,3% del personal de enfermería, y en cuanto a especificidad, la IA obtuvo un 27,8% frente al 8,3%.

"Estos resultados sugieren que, si bien la IA generalmente tiende a sobreclasificar, puede ser algo más cautelosa al señalar casos críticos, lo que puede ser tanto una fortaleza como una desventaja", argumenta Jukneviciene.

Los médicos también obtuvieron mejores resultados que la IA al considerar casos que requirieron o implicaron cirugía, así como en casos que requirieron tratamiento con medicamentos u otras terapias no invasivas. En los casos quirúrgicos, los médicos obtuvieron una puntuación de fiabilidad del 68,4%, las enfermeras del 63% y la IA del 39,5%. En los casos terapéuticos, los médicos obtuvieron una puntuación del 65,9%, las enfermeras del 44,5% y la IA obtuvo un mejor resultado, con una puntuación del 51,9% en fiabilidad.

Si bien anticipamos que la IA podría no superar a los profesionales clínicos y de enfermería con experiencia, nos sorprendió que en algunas áreas tuviera un rendimiento bastante bueno. De hecho, en la categoría de triaje más urgente, demostró mayor precisión que la del personal de enfermería. Esto indica que la IA no debería reemplazar el juicio clínico, sino que podría servir como herramienta de apoyo a la toma de decisiones en contextos clínicos específicos y en servicios de urgencias saturados.

La IA puede ayudar a priorizar los casos más urgentes de forma más consistente y a apoyar al personal nuevo o con menos experiencia. Sin embargo, un triaje excesivo podría generar ineficiencias, por lo que una integración cuidadosa y la supervisión humana son cruciales. Los hospitales deben abordar la implementación de la IA con cautela y centrarse en capacitar al personal para que interprete críticamente las sugerencias de la IA, concluye el doctor Jukneviciene.

Los investigadores planean estudios de seguimiento con versiones más recientes de IA y modelos de IA optimizados para fines médicos. Quieren probarlos en grupos más amplios de participantes, incluir la interpretación de ECG y explorar cómo la IA puede integrarse en la formación de enfermeras, especialmente para el triaje y los incidentes con gran número de víctimas.

Las limitaciones del estudio incluyen su reducido número de participantes, que se realizó en un solo centro y que el análisis de IA se realizó fuera de un entorno hospitalario en tiempo real, por lo que no fue posible evaluar su uso en el flujo de trabajo diario. Tampoco fue posible interactuar con los pacientes, evaluar las constantes vitales ni obtener datos de seguimiento. Además, ChatGPT 3.5 no fue entrenado específicamente para uso médico.

Los puntos fuertes del estudio fueron que utilizó casos clínicos reales para la comparación por parte de un grupo multidisciplinario de médicos y enfermeras, así como IA; su accesibilidad y flexibilidad se incrementaron al distribuir el cuestionario digitalmente y en papel; fue clínicamente relevante para los desafíos actuales de la atención médica, como el hacinamiento y la escasez de personal en el departamento de emergencias; y el estudio identificó que la IA sobreclasifica a muchos pacientes, asignándoles una mayor urgencia, lo que es un conocimiento crucial para la implementación segura de la IA en los departamentos de emergencias.