{"id":131226,"date":"2011-03-25T19:44:16","date_gmt":"2011-03-25T18:44:16","guid":{"rendered":"http:\/\/www.madrimasd.org\/blogs\/bioinformatica\/?p=131226"},"modified":"2011-03-26T00:59:20","modified_gmt":"2011-03-25T23:59:20","slug":"bases-de-datos-biologicas-y-bioinformaticas","status":"publish","type":"post","link":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/2011\/03\/25\/131226","title":{"rendered":"Bases de datos biol\u00f3gicas y bioinform\u00e1ticas"},"content":{"rendered":"<p>Casi todos los desarrollos que se hacen a d\u00eda de hoy en bioinform\u00e1tica de una u otra manera hacen uso de datos almacenados en bases de datos \u00abbiol\u00f3gicas\u00bb o \u00abbioinform\u00e1ticas\u00bb. Para aquellos de vosotros que tiene formaci\u00f3n en ciencias de la computaci\u00f3n, cuando escuch\u00e1is <a href=\"http:\/\/es.wikipedia.org\/wiki\/Base_de_datos\" target=\"_blank\">base de datos<\/a> empez\u00e1is a pensar en <a href=\"http:\/\/es.wikipedia.org\/wiki\/SQL\" target=\"_blank\">SQL<\/a>, el <a href=\"http:\/\/es.wikipedia.org\/wiki\/Modelo_relacional\" target=\"_blank\">modelo relacional<\/a>, etc&#8230; Para la gente que las tiene que usar diariamente, les vendr\u00e1 a la mente los <a href=\"http:\/\/es.wikipedia.org\/wiki\/Gestor_de_bases_de_datos\" target=\"_blank\">gestores de bases de datos<\/a> y los distintos productos que hay disponibles, tanto de pago como de c\u00f3digo abierto, que permiten interrogar de diversas maneras (usando el lenguaje de consultas SQL) la informaci\u00f3n almacenada en una instancia del gestor. En bioinform\u00e1tica, el concepto de \u00abbase de datos biol\u00f3gica\u00bb no alude tanto a la tecnolog\u00eda usada como al contenido almacenado.<\/p>\n<p>Una base de datos biol\u00f3gica es un almac\u00e9n de datos para informaci\u00f3n derivada de los datos obtenidos experimentos biol\u00f3gicos, ni m\u00e1s ni menos. Y una base de datos bioinform\u00e1tica es un almac\u00e9n de datos para informaci\u00f3n derivada de datos biol\u00f3gicos y de programas bioinform\u00e1ticos. Si bajamos al nivel m\u00e1s t\u00e9cnico, las bases de datos biol\u00f3gicas y bioinform\u00e1ticas est\u00e1n disponibles generalmente como un conjunto de ficheros planos, cuyo tama\u00f1o suele ser enorme. Para que os hag\u00e1is una idea, os incluyo un gr\u00e1fico p\u00fablico de crecimiento de la base de datos GenBank desde 1982 hasta 2008:<\/p>\n<div style=\"text-align:center\"><a href=\"http:\/\/www.ncbi.nlm.nih.gov\/genbank\/genbankstats.html\"><img decoding=\"async\" class=\"aligncenter\" title=\"GenBank Growth\" src=\"http:\/\/www.ncbi.nlm.nih.gov\/genbank\/genbankgrowth.jpg\" alt=\"GenBank Growth Chart\" width=\"75%\" \/><\/a><\/div>\n<p>Y lo m\u00e1s importante de todo: casi todas estas bases de datos son de libre disposici\u00f3n (cualquiera puede descargarlas). Ello es posible porque la informaci\u00f3n almacenada en la mayor parte de estas bases de datos es de dominio p\u00fablico y casi siempre est\u00e1tica, al venir de investigaci\u00f3n cient\u00edfica ya terminada financiada con fondos p\u00fablicos. Estos ficheros est\u00e1n casi siempre en formato textual, y la raz\u00f3n viene de los or\u00edgenes de la bioinform\u00e1tica: poder entender, ver y manipular sus contenidos sin depender de herramientas especializadas. Los contenidos de estos ficheros, al ser textuales, son muy comprimibles, y por eso suelen estar comprimidos con <a href=\"http:\/\/es.wikipedia.org\/wiki\/Gzip\" target=\"_blank\">gzip<\/a>, <a href=\"http:\/\/es.wikipedia.org\/wiki\/Bzip2\" target=\"_blank\">bzip2<\/a>, <a href=\"http:\/\/en.wikipedia.org\/wiki\/Xz\" target=\"_blank\">xz<\/a>, etc&#8230;<\/p>\n<p><span style=\"text-decoration: underline;\">Pr\u00f3xima entrada<\/span>: <a href=\"\/blogs\/bioinformatica\/2011\/03\/26\/131233\" target=\"_blank\">qu\u00e9 es necesario para ser un <em>scientific database curator<\/em><\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Casi todos los desarrollos que se hacen a d\u00eda de hoy en bioinform\u00e1tica de una u otra manera hacen uso de datos almacenados en bases de datos \u00abbiol\u00f3gicas\u00bb o \u00abbioinform\u00e1ticas\u00bb. Para aquellos de vosotros que tiene formaci\u00f3n en ciencias de la computaci\u00f3n, cuando escuch\u00e1is base de datos empez\u00e1is a pensar en SQL, el modelo relacional, etc&#8230; Para la gente que las tiene que usar diariamente, les vendr\u00e1 a la mente los gestores de bases de datos y los distintos productos que hay disponibles, tanto de pago como de c\u00f3digo abierto, que permiten interrogar de diversas maneras (usando el lenguaje de\u2026<\/p>\n","protected":false},"author":25,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"ngg_post_thumbnail":0},"categories":[1],"tags":[],"blocksy_meta":{"styles_descriptor":{"styles":{"desktop":"","tablet":"","mobile":""},"google_fonts":[],"version":4}},"aioseo_notices":[],"_links":{"self":[{"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/posts\/131226"}],"collection":[{"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/users\/25"}],"replies":[{"embeddable":true,"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/comments?post=131226"}],"version-history":[{"count":6,"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/posts\/131226\/revisions"}],"predecessor-version":[{"id":131236,"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/posts\/131226\/revisions\/131236"}],"wp:attachment":[{"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/media?parent=131226"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/categories?post=131226"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/tags?post=131226"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}