Así funciona 'OmicsTweezer', una nueva herramienta de IA que revoluciona el análisis de tejidos cancerosos

Archivo - Laboratorio químico
Archivo - Laboratorio químico - HRAUN/ ISTOCK - Archivo
Publicado: martes, 22 julio 2025 7:29

   MADRID, 22 Jul. (EUROPA PRESS) -

    Investigadores del Instituto Oncológico Knight de la Universidad de Salud y Ciencias de Oregón (Estados Unidos) han desarrollado una nueva y poderosa herramienta que facilita el estudio de la mezcla de tipos de células en el tejido humano, lo cual es crucial para comprender enfermedades como el cáncer. Los científicos publican su trabajo en 'Cell Genomics'.

   La herramienta, denominada 'OmicsTweezer', utiliza técnicas avanzadas de aprendizaje automático para analizar datos biológicos a una escala lo suficientemente grande como para estimar la composición de los tipos celulares en una muestra de tejido obtenida de una biopsia. Este proceso permite a los científicos mapear la composición celular de los tumores y los tejidos circundantes, un área conocida como microambiente tumoral.

   "El microambiente tumoral, compuesto por diversos tipos de células que dan forma al desarrollo del tumor y los resultados del paciente, ha sido una prioridad de investigación de larga data en el Knight Cancer Institute", aporta el autor principal Zheng Xia, profesor asociado de ingeniería biomédica en la Facultad de Medicina de OHSU y miembro del OHSU Knight Cancer Institute. "Nuestro objetivo es inferir la composición de los tipos de células utilizando datos masivos de muestras clínicas de gran tamaño".

   Normalmente, los científicos utilizan datos de todo el tejido (llamados "datos masivos") e intentan compararlos con datos de células individuales para estimar la composición de los tipos celulares. Sin embargo, estos dos tipos de datos a menudo no coinciden porque se recopilan de maneras diferentes. Esta discrepancia, llamada "efecto de lote", puede dificultar la obtención de resultados precisos.

   'OmicsTweezer' compara patrones conocidos de datos unicelulares (donde los investigadores pueden estudiar una célula a la vez) con datos mixtos más complejos de muestras masivas. Esto se logra alineando ambos tipos de datos en un espacio digital compartido, lo que facilita la comparación de patrones y reduce los errores causados por diferencias en la forma en que se recopilaron los datos, lo que resulta en resultados más fiables.

   Si bien las tecnologías unicelulares pueden proporcionar vistas detalladas de células individuales, su aplicación a grandes cantidades de células en muestras de tejido de pacientes sigue siendo costosa y técnicamente difícil. Por ello, los científicos suelen recurrir a datos masivos más accesibles, que promedian las señales de muchas células.

   "Sigue siendo muy costoso perfilar una muestra clínica grande utilizando tecnología unicelular", comenta Xia. "Pero existe una gran cantidad de datos masivos, y al integrarlos, podemos obtener una visión mucho más clara".

   Las herramientas tradicionales utilizan un modelo lineal más simple para estimar los tipos de células según la expresión génica. Sin embargo, 'OmicsTweezer' adopta un enfoque más sofisticado, utilizando el aprendizaje profundo (una rama del aprendizaje automático que encuentra patrones no lineales en datos complejos) y un método llamado transporte óptimo para alinear diferentes tipos de datos. "Utilizamos un transporte óptimo para alinear dos distribuciones diferentes (datos unicelulares y masivos) en el mismo espacio", explica Xia. "De esta manera, podemos reducir el efecto de lote, que durante mucho tiempo ha sido un desafío al trabajar con datos de diferentes fuentes".

   Los investigadores probaron 'OmicsTweezer' tanto en conjuntos de datos simulados como en muestras de tejido real de pacientes con cáncer de próstata y de colon. Identificó con éxito subtipos celulares sutiles y estimó cambios en la población celular entre grupos de pacientes, lo que podría ayudar a los científicos a identificar posibles dianas terapéuticas.

   "Con esta herramienta, ahora podemos estimar las fracciones de las poblaciones definidas por datos unicelulares en datos masivos de grupos de pacientes", apunta Xia. "Esto podría ayudarnos a comprender qué poblaciones celulares están cambiando durante la progresión de la enfermedad y orientar las decisiones de tratamiento".

Contador