Desarrollan el 'ChatGPT de la genética': la IA que revela cómo cooperan los genes para acelerar nuevos tratamientos

Archivo - Mamografía de cáncer de mama
Archivo - Mamografía de cáncer de mama - MPHILLIPS007/ ISTOCK - Archivo
Infosalus
Publicado: miércoles, 27 mayo 2026 7:08

   MADRID, 27 May. (EUROPA PRESS) -

   Científicos de la Escuela de Medicina Icahn en Mount Sinai (Estados Unidos) han creado un nuevo modelo de inteligencia artificial (IA) que ayuda a revelar cómo funcionan los genes juntos dentro de las células humanas, ofreciendo una nueva y poderosa forma de comprender la biología y las enfermedades.

   El estudio, publicado en la edición en línea de 'Patterns', una revista de 'Cell Press', presenta un modelo de base de conjuntos de genes (GSFM) diseñado para aprender patrones en cómo se agrupan y funcionan los genes en miles de contextos biológicos. El trabajo se inspira en los avances de los grandes modelos de lenguaje (LLM), como ChatGPT, que aprenden cómo las palabras adquieren significado según su contexto. De manera similar, un GSFM aprende cómo los genes se comportan de manera diferente según su "contexto" celular.

   “Los genes rara vez actúan solos. En cambio, participan en múltiples procesos biológicos, formando diferentes agrupaciones moleculares según dónde y cuándo estén activos en la célula. Un solo gen puede desempeñar diferentes funciones en distintos contextos, al igual que una palabra puede tener diferentes significados en distintas oraciones”, detalla el autor principal correspondiente, Avi Ma'ayan, doctor en Ciencias Farmacológicas, profesor y director del Centro de Bioinformática de Mount Sinai en la Escuela de Medicina Icahn de Mount Sinai.

“Así como los modelos de lenguaje modernos aprenden el significado de las palabras a partir del contexto, nos preguntamos si la IA podría aprender el 'significado' de los genes de la misma manera. Nuestro GSFM fue diseñado precisamente para eso”.

   El modelo ofrece una nueva forma de comprender la organización estructural y funcional de los genes y sus productos dentro de las células humanas. Esta mejor comprensión podría, a la larga, contribuir al desarrollo de mejores diagnósticos, biomarcadores y terapias. Al mapear cómo se relacionan los genes entre sí en diversas situaciones biológicas, el GSFM crea un marco de referencia que puede ayudar a los científicos a interpretar conjuntos de datos multiómicos complejos con mayor eficacia, según afirman los investigadores.

   “La organización de los genes dentro de las células sigue siendo una de las principales incógnitas de la biología. El GSFM ayuda a abordar este problema aprendiendo de millones de agrupaciones de genes derivadas de investigaciones publicadas y conjuntos de datos de expresión génica”, finaliza Ma'ayan.

   En concreto, el modelo puede ayudar a identificar la función de genes poco comprendidos sin necesidad de experimentos de laboratorio inmediatos. También a resaltar los genes implicados en los procesos patológicos.

   Asimismo, se espera que sugiera posibles nuevas dianas farmacológicas y biomarcadores. Igualmente, podría proporcionar un sistema de conocimiento reutilizable para muchos tipos de tareas de análisis de datos de investigación biomédica, por ejemplo, un análisis mejorado del enriquecimiento de conjuntos de genes. En esencia, según los investigadores, GSFM ofrece un nuevo "mapa" de cómo los genes trabajan juntos en diferentes contextos.

   Para construir el modelo, los investigadores recopilaron millones de conjuntos de genes a partir de estudios científicos publicados y conjuntos de datos de expresión génica. En total, el sistema aprendió de cientos de miles de investigaciones independientes.

ASÍ APRENDIÓ LA IA DE MILLONES DE DATOS CIENTÍFICOS

   El modelo de IA se entrenó de forma similar a resolver un rompecabezas: se le proporcionó parte de un conjunto de genes y se le pidió que predijera las piezas que faltaban. Con el tiempo, aprendió patrones subyacentes que describen cómo se agrupan e interactúan los genes.

   Posteriormente, se comparó el modelo de IA con otros enfoques y demostró un rendimiento sólido, incluyendo la capacidad de identificar relaciones gen-gen y gen-función antes de que se confirmaran experimentalmente. Para evaluar esto, el modelo se entrenó utilizando conjuntos de genes de publicaciones hasta una fecha límite definida, y luego se probó si podía predecir descubrimientos reportados en estudios publicados después de esa fecha límite.

   “A diferencia de los modelos de IA biológica anteriores, que se basan principalmente en datos de expresión genética, nuestro GSFM se entrena exclusivamente con conjuntos de genes, un tipo de información biológica diferente y poco utilizado”, afirma el doctor Ma'ayan. “Este enfoque permite que el modelo integre datos diversos de numerosas enfermedades, métodos experimentales y condiciones de investigación, creando una representación unificada de las relaciones genéticas en todo el ámbito biológico”.

   Los modelos GSFM podrían mejorar las herramientas bioinformáticas existentes y la interpretación de los datos recopilados con tecnologías ómicas. Una aplicación inmediata se encuentra en el análisis de enriquecimiento de conjuntos de genes, un método ampliamente utilizado en la investigación en biología molecular. Al mejorar la interpretación que hacen los científicos de las agrupaciones de genes, el modelo podría ayudar a descubrir nuevos conocimientos biológicos a partir de conjuntos de datos tanto existentes como futuros.

   El equipo de investigación planea expandir el sistema combinando GSFM con otros modelos fundamentales de IA. Uno de los objetivos es integrarlo con modelos basados en el lenguaje para generar explicaciones en lenguaje natural de las funciones genéticas. Otra línea de investigación futura consiste en combinar GSFM con modelos de IA centrados en fármacos, con el objetivo a largo plazo de predecir cómo interactúan los fármacos con las células y apoyar el diseño de nuevas terapias.

Contador

Últimas noticias sobre estos temas

Contenido patrocinado