BARCELONA 18 Jul. (EUROPA PRESS) -
Investigadores del Instituto de Biotecnología y de Biomedicina (IBB) de la Universitat Autònoma de Barcelona han desarrollado herramientas bioinformáticas "más fiables" para comprender mejor las proteínas implicadas en un proceso biológico por el que forman condensados y el papel que estos tienen en condiciones funcionales, de envejecimiento y de enfermedad.
Los recursos generados, disponibles en una plataforma abierta y en línea, permitirán mejorar los modelos predictivos actuales, que presentan "carencias importantes", según ha informado este viernes la UAB en un comunicado.
Muchas proteínas tienen la capacidad de reorganizarse espontáneamente dentro de las células para formar condensados moleculares --estructuras intracelulares sin membrana compuestas por una o múltiples proteínas--, mediante un proceso conocido como separación por fases líquido-líquido (LLPS, por sus siglas en inglés).
Este proceso biológico es clave ya que permite a las proteínas organizarse, interactuar y funcionar de manera eficiente y regulada en el entorno celular, y cuando este mecanismo falla pueden aparecer enfermedades neurodegenerativas, cánceres o trastornos del desarrollo.
Los investigadores de la UAB han creado la serie de datos "más exhaustivo y fiable" de proteínas que participan en la LLPS, y su propuesta ofrece un protocolo que permite superar las limitaciones de los algoritmos que se han desarrollado hasta ahora para obtener modelos predictivos.
El estudio, publicado en la revista 'Genome Biology', ha clasificado con precisión los dos grandes tipos de proteínas implicadas en el LLPS: las que pueden formar los condensados por si mismas (drivers) y las que solo forman parte de ellos (clientes).
Además, han desarrollado el primer conjunto estándar de proteínas que no participan en este proceso, que comprende tanto proteínas con estructuras definidas como proteínas desordenadas.
Para validar su trabajo, los científicos han investigado rasgos fisicoquímicos específicos implicados en la LLPS en diferentes subconjuntos de secuencias proteicas y han identificado diferencias significativas entre ellas, y han evaluado la predicción de LLPS en 16 herramientas bioinformáticas existentes, lo que supone la comparación más exhaustiva realizada hasta el momento.
Los investigadores han clasificado 2.876 proteínas diferentes y los conjuntos de datos y las herramientas asociadas del estudio están disponibles en llpsdatasets.ppmclab.com.