MADRID 3 Jul. (EUROPA PRESS) -

La Asociación Española de Urología (AEU) ha presentado 'Uro-Oncogu(IA)s', un 'chatbot', creado mediante IA generativa, que ofrece una respuesta "inmediata, precisa, y confiable" a cualquier pregunta uro-oncológica, explica el jefe de sección de la Unidad de Próstata del Servicio de Urología del Hospital Universitario Miguel Servet de Zaragoza, Ángel Borque Fernando.

El proyecto ha contado con la participación de más de 70 profesionales, entre ellos médicos e informáticos, que han trabajado durante 12 meses para crear esta herramienta "hecha por expertos para no expertos", afirma Borque.

Esta nueva herramienta contiene tres modelos de lenguaje (LLM, por sus siglas en ingles) que son los que procesan la información y generan la respuesta. El objetivo es ofrecer un 'software' conversacional automatizado con el que "interactuar como si fuese con humanos" que respondiera "certeramente" a preguntas sobre cáncer urológico, expone el experto.

En este sentido, los modelos leen "fantásticamente bien el texto" pero "no leen tan bien los diagramas de flujo y las tablas", señala Borque. Así, los expertos "han tenido que convertir esos contenidos en lectura" para mejorar la función del 'chatbot'.

Asimismo, otra de las características de 'Uro-Oncologu(IA)s' es su limitada fuente de búsqueda. La asociación ha considerado limitar el libre acceso a Internet, que puede escoger una referencia "que no tenga toda la ciencia absoluta", y evitar así las posibles "alucinaciones" del 'chatbot', explica Borque.

Para ello, los expertos han diseñado los modelos para que tomen la información proporcionada unícamente por las Guías Europeas, definiendo esta información al modelo como "la verdad absoluta".

Sin embargo la Asociación Europea de Urología establece específicamente que "no se pueden utilizar las guías europeas para IA generativa sin un consentimiento expreso". Así, el primer paso de la AEU fue pedir un permiso, que fue concebido, y después se trabajó durante dos fases en perfeccionar los resultados de búsqueda de la herramienta.

Por otro lado, Borque ha confesado que la Asociación Europea de Urología ha presentado una herramienta similar que competirá con 'Uro-Oncologu(IA)s'. Sin embargo, el experto señala que su chatbot tiene "mejor interfaz, es más amigable", y tiene una acreditación con 15.000 pares de preguntas/respuesta que le otorga "una credibilidad que no tiene ninguna otra herramienta del mercado".

Además, Borque ha señalado que la herramienta está disponible para todas las sociedades que han participado en el proyecto y que la intención es hacerla de acceso libre a todas las sociedades científicas, así como crear una App. En este sentido, ha justificado que el motivo de no hacerla accesible a todo el público reside en la intención de "no saturarla"; y que el paciente "no tenga una idea concreta" de su diagnóstico cuando acuda a un experto, para que no discrepe con él.

ELABORACIÓN DE 'URO-ONCOLOGÍA'

La primera fase consistió en la elaboración de 25 preguntas por parte de cada uno de los 7 grupos de trabajo de cada patología (próstata, vejiga, riñón, testículo y pene). Después, le pidieron a los modelos que leyeran "literalmente" las preguntas y que las respondieran de acuerdo a ese contenido que les habían definido como la "verdad absoluta".

Con esto, cada una de las 25 preguntas tenía 6 respuestas, porque cada modelo daba dos respuestas. Una respuesta "directa" y una segunda, en la que el modelo, lo primero que hacía era "entender perfectamente" la pregunta, reescribir la pregunta, contextualizarla y, a partir de ahí, tener una respuesta "muchísimo más formalizada", explica Borque. Por último, cada colaborador puntuó la respuesta obtenida en una calificación de uno a cinco, para comprobar que fueran óptimas.

Además, se pidió a los colaboradores que sólo evaluaran las respuestas si eran de su área de experiencia. Estas 6 respuestas de cada una de las 25 preguntas, multiplicadas por los 7 grupos de trabajo dio un total de 10.200 pares de pregunta-respuesta evaluadas por 74 colaboradores.

Después se elaboró una segunda fase en la que se evaluaron 5.100 pares de preguntas respuestas en una escala del uno al nueve, con dos rondas de respuestas para buscar un consenso.