Pobres proteínas huérfanas, ¿dónde paran vuestros genes?
El popular y controvertido boletín de noticias de Madrimasd nos indicaba recientemente los que, a juicio del prestigioso Instituto Smithsoniano serían mayores acontecimientos científicos de la última década. El primero de ellos era el siguiente:
1- La secuenciación del genoma humano: La secuenciación del genoma se ha convertido en algo bastante común, con nuevas especies que los científicos añaden poco a poco a la lista (el genoma del maíz ha sido hecho público hace un par de semanas). Pero, sin duda, el más importante fue la del genoma humano, completada en 2003, que dio a los investigadores una importante herramienta para conocer la biología humana y las enfermedades.
Empero, un artículo reciente tiene algo importante que puntualizar al respecto……Se trata del titulado “The DING family of proteins: ubiquitous in eukaryotes, but where are the genes?” por Anne Berna, Ken Scott , Eric Chabrière , François Bernier, publicado en la revista BioEssays Volume 31, Issue 5, Pages 570-580. 2009 y que a continuación se comenta.
El artículo describe las denominadas como PstS y DING que pertenecen a una superfamilia de proteínas secretadas que unen fosfato con alta afinidad. En Pseudomonas, las PstS son transportadoras de fosfato. En eucariotas, a pesar de haberse purificado más de treinta proteínas DING, no se ha encontrado ningún gen completo que codifique para ellas en las bases de datos. Ante este sorprendente resultado, los autores indican y discuten dos posibles alternativas:
Primera, que las proteinas DING eucariotas se originen a partir de bacterias comensales o simbióticas no identificadas. Segunda, que estén codificadas en genes eucarióticos que puedan presentar aspectos peculiares impidiendo o haciendo difícil su clonación, tales como por ejemplo encontrarse en determinadas zonas cromosómicas de particular complejidad (heterocromatina). A este respecto se lee:
not a single metazoan chromosome has been sequenced entirely
ningún cromosoma de animales o plantas se ha secuenciado completo
Although it is believed that most of the euchromatin in the model eukaryotic genomes has now been determined, not a single metazoan chromosome has been sequenced entirely,[57] and recent reports provide evidence that there are still many unknown genes, as for example in the model plant Arabidopsis thaliana.[58][59] Numerous gaps also still remain in the human genome, which are now known to contain genes.[60]
Que traduzco:
Aunque se cree que la mayoría de la eucromatina en los genomas de eucariotas-modelo ha sido secuenciada, ni un solo cromosoma de metazoos ha sido secuenciado por completo, [57] y los recientes informes proporcionan evidencia de que todavía hay muchos genes desconocidos, como por ejemplo en el planta modelo Arabidopsis thaliana. [58] [59] también numerosas lagunas permanecen aún en el genoma humano, que ahora se sabe que contienen genes.
No es la primera vez que un artículo da cuenta de este tipo de fenómenos. El propio artículo cita dos ejemplos en sus referencias 58 y 59. El primero es un caso curioso que merece reseña a parte : En su trabajo titulado“Orphan transcripts in Arabidopsis thaliana: identification of several hundred previously unrecognized genes” , Diego Mauricio Riaño-Pachón , Ingo Dreyer y Bernd Mueller-Roeber analizan y comparan con secuencias genómicas de Arabidopsis 178.292 ESTs (Expressed Sequence Tags), encontrándose nuevos transcritos codificados en loci para los que previamente no se había descrito actividad transcripcional. Esto es interesante pero hay cosas que todavía lo son más:
En el curso de su trabajo, éstos autores encuentran 1638 secuencias correspondientes a ESTs que no pueden localizar en las bases de datos y, a las que, en consecuencia……¡¡¡¡excluyen de su análisis !!!! (The remaining 1638 sequences that could not be localized accurately were excluded from further analysis). Es decir, no sólo no se ha secuenciado ningún genoma eucariótico completo sino que se sabe muy bien que existen secuencias que eluden a los programas de secuenciación de genomas y cuando aparecen, son ignoradas o evitadas. ¿Tendrá esto alguna importancia?
Referencias
(Corresponden al artículo de Berna et al.):
57 Smith, C. D., Shu, S., Mungall, C. J. and Karpen, G. H., The release 5.1 annotation of Drosophila melanogaster heterochromatin. Science 2007. 316: 1586-1591.
59 de Diego, J. G., Rodriguez, F. D., Rodriguez Lorenzo, J. L., Grappin, P. and Cervantes, E., cDNA-AFLP analysis of seed germination in Arabidopsis thaliana identifies transposons and new genomic sequences. J Plant Physiol 2006. 163: 452-462.
60 Bovee, D., Zhou, Y., Haugen, E., Wu, Z., Hayden, H. S., et al. Closing gaps in the human genome with fosmid resources generated from multiple individuals. Nat Genet 2008. 40: 96-101.