Publicado 11/05/2021 07:17CET

Nuevas herramientas permiten un rápido análisis de las secuencias de coronavirus

Archivo - Coronavirus
Archivo - Coronavirus - UPM - Archivo

   MADRID, 11 May. (EUROPA PRESS) -

   La secuenciación de los genomas del SARS-CoV-2 presenta nuevas oportunidades para rastrear la dinámica de transmisión local y global, pero analizar tantos datos genómicos es un desafío. La gran cantidad de secuencias del genoma del coronavirus y su rápida acumulación dificulta la colocación de nuevas secuencias en un "árbol genealógico" que muestre cómo están todas relacionadas.

   Pero los investigadores del Instituto de Genómica de la Universidad de California (UC Santa Cruz) han desarrollado un nuevo método que lo consigue con una velocidad sin precedentes, con una poderosa herramienta, denominada 'Colocación Ultrarrápida de Muestras en Árboles Existentes' (UShER), como publican en la revista 'Nature Genetics'.

   La pandemia de COVID-19 ha impulsado la vigilancia genómica de los virus a una escala sin precedentes, ya que los científicos de todo el mundo utilizan la secuenciación del genoma para rastrear la propagación de nuevas variantes del virus SARS-CoV-2. La rápida acumulación de secuencias de genomas virales presenta nuevas oportunidades para rastrear la dinámica de transmisión global y local, pero el análisis de tantos datos genómicos es un reto.

   "Ahora hay más de un millón de secuencias del genoma del SARS-CoV-2. Nadie había previsto ese número cuando empezamos a secuenciar este virus", explica Russ Corbett-Detig, profesor adjunto de ingeniería biomolecular en la UC Santa Cruz.

   El gran número de secuencias del genoma de los coronavirus y su rápida acumulación hace difícil situar las nuevas secuencias en un "árbol genealógico" que muestre cómo están relacionadas. Pero el grupo de Corbett-Detig en el Instituto de Genómica de la UC Santa Cruz ha desarrollado un nuevo método que lo hace con una velocidad sin precedentes.

   UShER identifica las relaciones entre los genomas virales recién secuenciados de un usuario y todos los genomas conocidos del virus del SARS-CoV-2 añadiéndolos a un árbol filogenético existente, un diagrama de ramificaciones como un árbol genealógico que muestra cómo ha evolucionado el virus en diferentes linajes a medida que acumula mutaciones.

   "Somos capaces de mantener un árbol filogenético completo de más de 1,2 millones de secuencias de coronavirus y actualizarlo con nuevas secuencias en tiempo real. Ninguna otra herramienta puede manejar árboles de este tamaño con una eficacia comparable --afirma el primer autor, Yatish Turakhia, becario postdoctoral del Instituto de Genómica--. Esto nos ayuda a hacer un seguimiento de todas las variantes en circulación, incluidas las nuevas variantes que están surgiendo".

   Este tipo de análisis de secuencias puede utilizarse para descubrir nuevas cepas del virus a medida que surgen y seguir su evolución y dinámica de transmisión. También puede utilizarse para identificar vínculos entre casos individuales de infección por coronavirus y rastrear cadenas de transmisión, un enfoque conocido como rastreo genómico de contactos.

   "El reto consiste en obtener resultados lo suficientemente pronto como para hacer predicciones significativas que los organismos de salud pública puedan utilizar para tratar de controlar un brote --afirma Corbett-Detig, autor correspondiente del artículo--. Nuestro método es órdenes de magnitud más rápidos que cualquier otro que exista, colocando nuevas muestras en décimas de segundo".

   El UShER y las herramientas de visualización de datos relacionadas están disponibles para la comunidad investigadora a través del Navegador del Genoma del SARS-CoV-2 de la UCSC, que también proporciona acceso a una amplia gama de datos y resultados de la investigación científica en curso sobre el virus, incluyendo nuevas variantes que son especialmente preocupantes.

   "Nuestro navegador es el recurso de información más completo sobre las mutaciones que aparecen en el virus y lo que significan para nuestra batalla contra él --resalta el coautor David Haussler, profesor de ingeniería biomolecular y director del Instituto de Genómica--. Gracias al equipo de Russ, incluye el árbol filogenético más completo del mundo de los diferentes linajes del virus, y ese árbol sigue creciendo cada semana, tan rápido como aparecen nuevos datos".

   Como todos los virus, el SARS-CoV-2 adquiere mutaciones a medida que se replica y se propaga. La mayoría de estas variaciones aleatorias en la secuencia del genoma no tienen ningún efecto sobre el comportamiento del virus, pero los investigadores pueden utilizarlas para identificar diferentes variantes o cepas del virus, ver cómo están relacionadas y determinar si dos muestras forman parte de la misma cadena de transmisión.

   Los científicos han identificado varias mutaciones importantes que parecen hacer que el virus sea más infeccioso. Las variantes del SARS-CoV-2 con estas mutaciones se están propagando más rápidamente que otras variantes.

   La coautora Angie Hinrichs, ingeniera del Navegador del Genoma de la UCSC, utilizó el UShER para determinar que una de estas variantes, conocida como B.1.1.7, entró en Estados Unidos a través de varias introducciones independientes. Ahora es la cepa dominante en Estados Unidos.

   Turakhia avanza que ha empezado a utilizar el UShER para estudiar una nueva variante que ha surgido en la India y que parece estar extendiéndose rápidamente en ese país. Conocido como B.1.617, este linaje del virus tiene dos mutaciones que pueden preocupar a los científicos. "Todavía no sabemos hasta qué punto es preocupante, pero es importante seguirle la pista", admite.

   La genómica viral puede revelar cadenas de transmisión que no se encuentran a través del rastreo de contactos convencional, dijo Corbett-Detig. Este enfoque puede ayudar a identificar eventos de superdifusión, en los que una persona transmitió el virus a muchas otras, y también puede mostrar que dos casos del mismo lugar son en realidad infecciones no relacionadas, no parte de la misma cadena de transmisión, porque las secuencias virales difieren demasiado.

   "Se trata de un enfoque que probablemente será valioso en el futuro, por lo que estamos construyendo las herramientas para que la gente pueda hacer esto en tiempo real --señala--. Si se quiere saber quién ha transmitido el virus a quién, o de qué lugar del mundo puede proceder una nueva muestra, hay que tomar las muestras de la comunidad y proyectarlas en el árbol filogenético conocido de todas las demás secuencias del genoma del SARS-CoV-2, y los métodos filogenéticos convencionales no pueden hacerlo en un tiempo razonable".

   Esto se debe a que los métodos convencionales tienen que volver a calcular todo el árbol cada vez que se añaden nuevas secuencias, lo que lleva demasiado tiempo cuando hay cientos de miles de secuencias. El UShER coloca las muestras en una filogenia global existente casi al instante, y proporciona un subárbol local de las muestras añadidas y sus vecinos más cercanos para que sus relaciones puedan visualizarse y examinarse en detalle.

   Los investigadores demostraron que el UShER encuentra la colocación correcta en el 97% de los casos. En el otro 3%, las colocaciones incorrectas están muy cerca del sitio verdadero y siguen siendo útiles para el rastreo de contactos.

   El UShER también puede utilizarse para el control de calidad a fin de identificar y eliminar rápidamente las secuencias de baja calidad que puedan contener errores de secuenciación. Los resultados del UShER pueden visualizarse y explorarse en la plataforma Nextstrain para la visualización interactiva de árboles filogenéticos y mapas de la propagación del virus.