Más de 100 Gigabases en las bases de datos públicas de DNA y RNA

Ya hace casi un año (22 de Agosto de 2005) que se alcanzó la astronómica cifra de 100 Gigabases en las bases de datos de DNA y RNA disponibles públicamente para tod@ aquel con espacio para descargarlas (actualmente ¡99 GB de ficheros comprimidos!). Esta compilación de genomas, secuencias y fragmentos de secuencia es debida principalmente al esfuerzo de todos los investigadores de proyectos de secuenciación y a tres entidades coordinadoras: NCBI (National Center for Biotechnology Information, Estados Unidos), EMBL (European Molecular Biology Laboratory, Europa) y DDBJ (DNA Data Bank of Japan, Japón).

Cada una de estas entidades ha publicado, al principio por separado, y más tarde de forma coordinada, sus propias compilaciones de secuencias. Esta coordinación dio como fruto la creación del INSDC (International Sequence Database Collaboration) y el establecimiento de protocolos conjuntos de difusión y «curado» de la información.

Leyendo la noticia original de aquel momento, podemos leer que las secuencias de DNA y RNA que conformaban aquel grueso de 100 Gigabases provenían de alrededor de 165000 organismos. Lo más curioso de todo esto es que el número de organismos para los que conocemos por completo su genoma es muy pequeño (menos de 100). Si tuviéramos la información completa de todos los genomas de todos esos organismos, ¡tendríamos que multiplicar la cifra total de pares de bases por 100 o 200!

A pesar de que estas cifras mareen casi a cualquiera, hay que recordar que buena parte de las técnicas bioinformáticas actuales de minería de datos se basan de forma directa o indirecta en la similitud entre secuencias, y la información asociada a esas secuencias.Aunque la información sobre los distintos organismos está codificada en sus genomas, seguimos sin poder extraer de forma directa dicha información.

Usando la analogía del libro de la vida, por mucha información que tengamos aún no sabemos leer (y a veces, incluso abrir) el libro, y ¡necesitamos una Piedra de Roseta!

Compartir:

Deja un comentario