MADRID, 11 Jun. (EUROPA PRESS
Biofísicos de la Universidad Northwestern (Estados Unidos) - han desarrollado una nueva herramienta computacional de IA para identificar las combinaciones de genes subyacentes a enfermedades complejas como la diabetes, el cáncer y el asma.
A diferencia de los trastornos monogénicos, estas afecciones se ven influenciadas por una red de múltiples genes que trabajan en conjunto. Sin embargo, la enorme cantidad de posibles combinaciones genéticas es enorme, lo que dificulta enormemente a los investigadores identificar las que causan la enfermedad.
Mediante un modelo generativo de inteligencia artificial (IA), el nuevo método amplifica datos limitados de expresión génica, lo que permite a los investigadores resolver patrones de actividad genética que causan rasgos complejos.
Esta información podría conducir a tratamientos nuevos y más eficaces para enfermedades que involucren dianas moleculares asociadas con múltiples genes. El estudio se publica en 'PNAS' (Proceedings of the National Academy of Sciences).
"Muchas enfermedades están determinadas por una combinación de genes, no solo por uno", comenta Adilson Motter, de Northwestern, autor principal del estudio. "Se puede comparar una enfermedad como el cáncer con un accidente aéreo. En la mayoría de los casos, se necesitan múltiples fallos para que un avión se estrelle, y diferentes combinaciones de fallos pueden tener consecuencias similares. Esto dificulta la identificación de las causas. Nuestro modelo simplifica el proceso al identificar los factores clave y su influencia colectiva".
Durante décadas, los investigadores han luchado por desentrañar las bases genéticas de rasgos y enfermedades humanas complejas. Incluso rasgos no patológicos, como la altura, la inteligencia y el color del cabello, dependen de conjuntos de genes. Los métodos existentes, como los estudios de asociación del genoma completo, buscan encontrar genes individuales vinculados a un rasgo. Sin embargo, carecen de la potencia estadística necesaria para detectar los efectos colectivos de grupos de genes.
"El Proyecto Genoma Humano nos mostró que solo tenemos seis veces más genes que una bacteria unicelular", agrega Motter. "Pero los humanos somos mucho más sofisticados que las bacterias, y la cantidad de genes por sí sola no lo explica. Esto resalta la prevalencia de las relaciones multigénicas, y que deben ser las interacciones entre genes las que dan origen a la vida compleja".
"Identificar genes individuales sigue siendo valioso. Pero solo una pequeña fracción de los rasgos observables, o fenotipos, puede explicarse mediante cambios en genes individuales. En cambio, sabemos que los fenotipos son el resultado de la interacción de muchos genes. Por lo tanto, es lógico que múltiples genes contribuyan típicamente a la variación de un rasgo", reflexionan los investigadores.
Para ayudar a superar la brecha de conocimiento de larga data entre la composición genética (genotipo) y los rasgos observables (fenotipo), el equipo de investigación desarrolló un enfoque sofisticado que combina el aprendizaje automático con la optimización.
El modelo, denominado Autocodificador Variacional Condicional de Transcriptoma Amplio (TWAVE), utiliza IA generativa para identificar patrones a partir de datos limitados de expresión génica en humanos. De esta manera, puede emular estados de enfermedad y salud, de modo que los cambios en la expresión génica se puedan correlacionar con los cambios en el fenotipo. En lugar de examinar los efectos de genes individuales de forma aislada, el modelo identifica grupos de genes que, en conjunto, causan la aparición de un rasgo complejo. El método utiliza un marco de optimización para identificar los cambios genéticos específicos con mayor probabilidad de cambiar el estado de una célula de saludable a enfermo o viceversa.
Centrarse en la expresión génica ofrece múltiples beneficios. En primer lugar, evita los problemas de privacidad del paciente. Los datos genéticos (la secuencia real de ADN de una persona) son inherentemente únicos, lo que proporciona un mapa muy personal de salud, predisposiciones genéticas y relaciones familiares. Los datos de expresión, por otro lado, son más bien una instantánea dinámica de la actividad celular. En segundo lugar, los datos de expresión génica consideran implícitamente factores ambientales, que pueden activar o desactivar genes para realizar diversas funciones.
"Los factores ambientales podrían no afectar el ADN, pero definitivamente afectan la expresión génica", argumenta Motter. "Por lo tanto, nuestro modelo tiene la ventaja de considerar indirectamente los factores ambientales".
Para demostrar la eficacia de TWAVE, el equipo lo probó en diversas enfermedades complejas. El método identificó con éxito los genes causantes de dichas enfermedades, algunos de los cuales no se detectaban con los métodos existentes. TWAVE también reveló que diferentes conjuntos de genes pueden causar la misma enfermedad compleja en diferentes personas. Este hallazgo sugiere que los tratamientos personalizados podrían adaptarse a los factores genéticos específicos de la enfermedad de cada paciente.
"Una enfermedad puede manifestarse de forma similar en dos personas diferentes", finaliza Motter. "Pero, en principio, podría haber un conjunto distinto de genes involucrados en cada persona debido a diferencias genéticas, ambientales y de estilo de vida. Esta información podría orientar el tratamiento personalizado".