MADRID 10 Ago. (EUROPA PRESS) -
Investigadores del Reino Unido esperan que la nueva base de datos disponible públicamente que han creado se reduzca y no crezca con el tiempo, porque es un compendio de las miles de proteínas poco estudiadas codificadas por genes en el genoma humano, cuya existencia se conoce pero cuyas funciones en su mayoría no.
La base de datos, denominada 'unknome' (desconocidos) y publicada en la revista de acceso abierto 'PLOS Biology', es obra de Matthew Freeman de la Escuela de Patología Dunn de la Universidad de Oxford, y Sean Munro, del Laboratorio de Biología Molecular MRC en Cambridge (Reino Unido), y colegas.
Sus propias investigaciones de un subconjunto de proteínas en la base de datos revelan que la mayoría contribuye a funciones celulares importantes, incluido el desarrollo y la resistencia al estrés.
La secuenciación del genoma humano ha dejado claro que codifica miles de probables secuencias de proteínas cuya identidad y funciones aún se desconocen. Esto se debe a múltiples razones, entre ellas la tendencia a centrar los escasos fondos de investigación en objetivos ya conocidos y la falta de herramientas, como los anticuerpos, para interrogar a las células sobre la función de estas proteínas.
Pero los riesgos de ignorar estas proteínas son considerables, argumentan los autores, ya que es probable que algunas, quizá muchas, desempeñen papeles importantes en procesos celulares críticos, y pueden aportar tanto conocimientos como dianas para la intervención terapéutica.
Para agilizar la exploración de estas proteínas, los autores crearon la base de datos 'unknome' (www.unknome.org), que asigna a cada proteína una puntuación de "conocimiento" que refleja la información de la literatura científica sobre su función, conservación entre especies, compartimentación subcelular y otros elementos.
Según este sistema, hay muchos miles de proteínas cuyo grado de conocimiento es casi nulo. Se incluyen proteínas de organismos modelo, junto con las del genoma humano. La base de datos está abierta a todo el mundo y es personalizable, lo que permite al usuario dar su propio peso a los diferentes elementos, generando así su propio conjunto de puntuaciones de conocimiento para priorizar su propia investigación.
Para probar la utilidad de la base de datos, los autores eligieron 260 genes humanos para los que había genes comparables en moscas, y que tenían una puntuación de conocimiento de 1 o menos en ambas especies, lo que indicaba que no se sabía casi nada sobre ellos.
Para muchos de ellos, la inactivación completa del gen era incompatible con la vida en la mosca; la inactivación parcial o la inactivación específica de un tejido permitieron descubrir que una gran parte contribuía a funciones esenciales que influían en la fertilidad, el desarrollo, el crecimiento de los tejidos, el control de la calidad de las proteínas o la resistencia al estrés.
Los resultados sugieren que, a pesar de décadas de estudio detallado, hay miles de genes de la mosca que aún no se conocen ni siquiera al nivel más básico, y lo mismo ocurre claramente con el genoma humano.
"Estos genes no caracterizados no han merecido su olvido --afirma Munro--. Nuestra base de datos proporciona una plataforma potente, versátil y eficaz para identificar y seleccionar genes importantes de función desconocida para su análisis, acelerando así el cierre de la brecha en el conocimiento biológico que representa el 'unknome'".
"La función de miles de proteínas humanas sigue sin estar clara y, sin embargo, la investigación tiende a centrarse en las que ya se conocen bien --explica--. Para ayudar a resolver este problema, creamos una base de datos 'Unknome' que clasifica las proteínas en función de lo poco que se sabe de ellas y, a continuación, realizamos cribas funcionales en una selección de estas proteínas misteriosas para demostrar cómo la ignorancia puede impulsar el descubrimiento biológico".