{"id":35393,"date":"2006-07-24T14:04:00","date_gmt":"2006-07-24T14:04:00","guid":{"rendered":"http:\/\/weblogs.madrimasd.org\/\/bioinformatica\/archive\/2006\/07\/24\/35393.aspx"},"modified":"2006-07-24T14:04:00","modified_gmt":"2006-07-24T14:04:00","slug":"mas-de-100-gigabases-en-las-bases-de-datos-publicas-de-dna-y-rna","status":"publish","type":"post","link":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/2006\/07\/24\/35393","title":{"rendered":"M\u00e1s de 100 Gigabases en las bases de datos p\u00fablicas de DNA y RNA"},"content":{"rendered":"<p>Ya hace casi un a\u00f1o (22 de Agosto de 2005) que se alcanz\u00f3 la astron\u00f3mica cifra de 100 Gigabases en las bases de datos de DNA y RNA disponibles p\u00fablicamente para tod@ aquel con espacio para descargarlas (actualmente \u00a199 GB de ficheros comprimidos!). Esta compilaci\u00f3n de genomas, secuencias y fragmentos de secuencia es debida principalmente al esfuerzo de todos los investigadores de proyectos de secuenciaci\u00f3n y a tres entidades coordinadoras: <a href=\"http:\/\/www.ncbi.nlm.nih.gov\/\">NCBI<\/a> (<i>National Center for Biotechnology Information<\/i>, Estados Unidos), <a href=\"http:\/\/www.embl.org\/\">EMBL<\/a> (<i>European Molecular Biology Laboratory<\/i>, Europa) y <a href=\"http:\/\/www.ddbj.nig.ac.jp\/\">DDBJ<\/a> (<i>DNA Data Bank of Japan<\/i>, Jap\u00f3n).<\/p>\n<p><!--more-->Cada una de estas entidades ha publicado, al principio por separado, y m\u00e1s tarde de forma coordinada, sus propias compilaciones de secuencias. Esta coordinaci\u00f3n dio como fruto la creaci\u00f3n del <a href=\"http:\/\/www.insdc.org\/\">INSDC<\/a> (<i>International Sequence Database Collaboration<\/i>) y el establecimiento de protocolos conjuntos de difusi\u00f3n y \u00abcurado\u00bb de la informaci\u00f3n.<\/p>\n<p>Leyendo <a href=\"http:\/\/www.nlm.nih.gov\/news\/press_releases\/dna_rna_100_gig.html\">la noticia original<\/a> de aquel momento, podemos leer que las secuencias de DNA y RNA que conformaban aquel grueso de 100 Gigabases proven\u00edan de alrededor de 165000 organismos. Lo m\u00e1s curioso de todo esto es que el n\u00famero de organismos para los que conocemos por completo su genoma es muy peque\u00f1o (menos de 100). Si tuvi\u00e9ramos la informaci\u00f3n completa de todos los genomas de todos esos organismos, \u00a1tendr\u00edamos que multiplicar la cifra total de pares de bases por 100 o 200!<\/p>\n<p>A pesar de que estas cifras mareen casi a cualquiera, hay que recordar que buena parte de las t\u00e9cnicas bioinform\u00e1ticas actuales de miner\u00eda de datos se basan de forma directa o indirecta en la similitud entre secuencias, y la informaci\u00f3n asociada a esas secuencias.Aunque la informaci\u00f3n sobre los distintos organismos est\u00e1 codificada en sus genomas, seguimos sin poder extraer de forma directa dicha informaci\u00f3n.<\/p>\n<p>Usando la analog\u00eda del libro de la vida, por mucha informaci\u00f3n que tengamos a\u00fan no sabemos leer (y a veces, incluso abrir) el libro, y \u00a1necesitamos una Piedra de Roseta!<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Ya hace casi un a\u00f1o (22 de Agosto de 2005) que se alcanz\u00f3 la astron\u00f3mica cifra de 100 Gigabases en las bases de datos de DNA y RNA disponibles p\u00fablicamente para tod@ aquel con espacio para descargarlas (actualmente \u00a199 GB de ficheros comprimidos!). Esta compilaci\u00f3n de genomas, secuencias y fragmentos de secuencia es debida principalmente al esfuerzo de todos los investigadores de proyectos de secuenciaci\u00f3n y a tres entidades coordinadoras: NCBI (National Center for Biotechnology Information, Estados Unidos), EMBL (European Molecular Biology Laboratory, Europa) y DDBJ (DNA Data Bank of Japan, Jap\u00f3n).<\/p>\n","protected":false},"author":25,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"ngg_post_thumbnail":0},"categories":[187,31],"tags":[],"blocksy_meta":{"styles_descriptor":{"styles":{"desktop":"","tablet":"","mobile":""},"google_fonts":[],"version":4}},"aioseo_notices":[],"_links":{"self":[{"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/posts\/35393"}],"collection":[{"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/users\/25"}],"replies":[{"embeddable":true,"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/comments?post=35393"}],"version-history":[{"count":0,"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/posts\/35393\/revisions"}],"wp:attachment":[{"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/media?parent=35393"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/categories?post=35393"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/tags?post=35393"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}