La IA logra identificar variantes emergentes de COVID-19

Archivo - Variante ómicron.
Archivo - Variante ómicron. - NAEBLYS/ISTOCK - Archivo
Publicado: martes, 12 marzo 2024 7:17

MADRID, 12 Mar. (EUROPA PRESS) -

Científicos de las universidades de Manchester y Oxford (Reino Unido) han desarrollado un marco de inteligencia artificial que puede identificar y rastrear variantes nuevas y preocupantes de COVID-19 y podría ayudar con otras infecciones en el futuro. El estudio, publicado en la revista 'PNAS', podría respaldar los métodos tradicionales de seguimiento de la evolución viral, como el análisis filogenético, que actualmente requieren una curación manual exhaustiva.

En concreto, este marco de IA se basa en un nuevo algoritmo de agrupamiento explicable llamado CLASSIX, desarrollado por matemáticos de la Universidad de Manchester. Esto permite la identificación rápida de grupos de genomas virales que podrían presentar un riesgo en el futuro a partir de enormes volúmenes de datos.

Roberto Cahuantzi, investigador de la Universidad de Manchester y primer autor correspondiente del artículo, aclara: "Desde la aparición de COVID-19, hemos visto múltiples oleadas de nuevas variantes, mayor transmisibilidad, evasión de respuestas inmunes y mayor gravedad. de enfermedad. Los científicos ahora están intensificando sus esfuerzos para identificar estas nuevas variantes preocupantes, como alfa, delta y omicron, en las primeras etapas de su aparición".

"Si podemos encontrar una manera de hacer esto de manera rápida y eficiente, nos permitirá ser más proactivos en nuestra respuesta, como el desarrollo de vacunas personalizadas, e incluso nos permitirá eliminar las variantes antes de que se establezcan", añade.

Asimismo, los investigadores señalan en el trabajo que la cantidad sin precedentes de datos genéticos generados durante la pandemia exige mejoras en los métodos para analizarlos en profundidad. Por otra parte, como muchos otros virus de ARN, el COVID-19 tiene una alta tasa de mutación y un corto tiempo entre generaciones, lo que significa que evoluciona extremadamente rápido. Esto significa que identificar nuevas cepas que probablemente sean problemáticas en el futuro requiere un esfuerzo considerable.

Así, gracias a este nuevo marco de IA los investigadores procesaron 5,7 millones de secuencias de alta cobertura en sólo uno o dos días en una computadora portátil moderna estándar. Esto no sería posible con los métodos existentes, lo que pondría la identificación de cepas patógenas preocupantes en manos de más investigadores debido a la reducción de las necesidades de recursos.

El método propuesto funciona descomponiendo las secuencias genéticas del virus COVID-19 en "palabras" más pequeñas (llamadas 3-mers) representadas como números al contarlas. Luego, agrupa secuencias similares en función de sus patrones de palabras utilizando técnicas de aprendizaje automático.

Stefan Güttel, profesor de Matemáticas Aplicadas en la Universidad de Manchester, añade: "El algoritmo de agrupamiento CLASSIX que desarrollamos es mucho menos exigente desde el punto de vista computacional que los métodos tradicionales y es completamente explicable, lo que significa que proporciona explicaciones textuales y visuales de los grupos calculados".

Si bien la filogenética sigue siendo el 'estándar de oro' para comprender la ascendencia viral, estos métodos de aprendizaje automático pueden acomodar varios órdenes de magnitud más secuencias que los métodos filogenéticos actuales y a un bajo costo computacional.