{"id":69765,"date":"2007-07-11T22:34:00","date_gmt":"2007-07-11T22:34:00","guid":{"rendered":"http:\/\/weblogs.madrimasd.org\/\/bioinformatica\/archive\/2007\/07\/12\/69765.aspx"},"modified":"2007-07-11T22:34:00","modified_gmt":"2007-07-11T22:34:00","slug":"cuando-una-base-de-datos-deja-de-serlo","status":"publish","type":"post","link":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/2007\/07\/11\/69765","title":{"rendered":"Cuando una base de datos deja de serlo"},"content":{"rendered":"<p>Por mi \u00abespecialidad\u00bb estoy acostumbrado a trabajar con muchas fuentes de informaci\u00f3n simult\u00e1neas: bases de datos biol\u00f3gicas, resultados de programas, servicios web, etc&#8230; \u00daltimamente he tenido que trabajar bastante con bases de datos que proporcionan informaci\u00f3n sobre interacciones entre prote\u00ednas, como<a href=\"http:\/\/www.ebi.ac.uk\/intact\/\"> IntAct<\/a>, <a href=\"http:\/\/dip.doe-mbi.ucla.edu\/\">DIP<\/a>, <a href=\"http:\/\/mips.gsf.de\/proj\/ppi\/\">MIPS\/Mammalian<\/a>, <a href=\"http:\/\/mips.gsf.de\/genre\/proj\/yeast\/\">MIPS\/Yeast<\/a>, <a href=\"http:\/\/www.hprd.org\/\">HPRD<\/a>, <a href=\"http:\/\/www.thebiogrid.org\/\">BioGRID<\/a>, <a href=\"http:\/\/cbm.bio.uniroma2.it\/mint\/\">MINT<\/a>, &#8230; y <a href=\"http:\/\/bind.ca\/\">BIND<\/a>.<br \/><!--more-->Todas estas bases de datos comparten ciertas similitudes, como por ejemplo que usan el formato <a href=\"http:\/\/psidev.sourceforge.net\/mi\/xml\/doc\/user\/\">PSI-MI<\/a> (<a href=\"http:\/\/www.hupo.org\/\">HUPO<\/a> <i>Proteomics Standards Initiative &#8211; Molecular Interactions<\/i>) para publicar la descripci\u00f3n de las interacciones que contienen, adem\u00e1s de sus formatos propios. Casi todas tambi\u00e9n comparten cierta dificultad a la hora de automatizar la descarga de las mismas: para descargar <a href=\"http:\/\/www.hprd.org\/\">HPRD<\/a> tienes que rellenar un formulario en cada ocasi\u00f3n, para el caso de <a href=\"http:\/\/www.thebiogrid.org\/\">BioGRID<\/a> tienes que seguir una serie de p\u00e1ginas usando <i>cookies<\/i>, para otras tienes que tener un usuario registrado, etc&#8230;<\/p>\n<p>Independientemente de todo esto, la que siempre me ha dado m\u00e1s quebraderos de cabeza a la hora de trabajar ha sido <a href=\"http:\/\/bind.ca\/\">BIND<\/a>, por el volumen de datos que contiene y la complejidad de su representaci\u00f3n nativa. Esta base de datos de interacciones tiene mucha solera, porque junto con <a href=\"http:\/\/dip.doe-mbi.ucla.edu\/\">DIP<\/a> fue una de las primeras bases de datos de interacciones. Inicialmente naci\u00f3 en el seno del <a href=\"http:\/\/www.biochemistry.utoronto.ca\/\">departamento de bioqu\u00edmica<\/a> de la <a href=\"http:\/\/www.utoronto.ca\/\">Universidad de Toronto<\/a>. Tras ciertos avatares, est\u00e1 gestionada actualmente por una compa\u00f1\u00eda llamada <a href=\"http:\/\/www.unleashedinformatics.com\/\"><i>Unleashed Informatics<\/i><\/a>, adquirida recientemente por <a href=\"http:\/\/www.scientific.thomson.com\/\">Thomson Scientific<\/a> de la <a href=\"http:\/\/www.thomson.com\/\">corporaci\u00f3n Thomson<\/a>.<\/p>\n<p>Adem\u00e1s de trabajar con estas bases de datos, tambi\u00e9n me encargo de mantenerlas actualizadas para uso cient\u00edfico en el <a href=\"http:\/\/www.cnio.es\/\">CNIO<\/a>. Por eso, desde hace unas semanas me he encontrado con que \u00a1ya no es posible descargar por FTP o HTTP los ficheros de la base de datos BIND! Para acceder a los contenidos de BIND para usos de investigaci\u00f3n cient\u00edfica hay que registrarse en su sitio web (lo cu\u00e1l no es ning\u00fan problema), inclu\u00edda su documentaci\u00f3n. Estuve investigando un poco los pasados d\u00edas, y ha desaparecido por completo toda referencia a su antiguo sitio FTP.<\/p>\n<p>La \u00fanica forma actual de obtener informaci\u00f3n de BIND de forma program\u00e1tica es usando sus servicios web SOAP. Esto tampoco es un problema, salvo cuando necesitas realizar consultas no contempladas en la API de SOAP, o quieres aplicar t\u00e9cnicas de miner\u00eda de datos que implican acceder a todas las interacciones de la base de datos. \u00a1Y \u00e9ste es justo mi caso!<\/p>\n<p>Por tanto, BIND sigue siendo una magn\u00edfica fuente de datos de interacciones entre prote\u00ednas. Pero a mi parecer, el no proporcionar m\u00e1s sus datos de interacciones en forma de fichero, para poder trabajar sobre ellos de forma local, va en contra del esp\u00edritu cient\u00edfico de colaboraci\u00f3n y entorpece (si no impide) hacer miner\u00eda de datos sobre su informaci\u00f3n de interacciones. Que cada uno saque sus propias conclusiones&#8230;<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Por mi \u00abespecialidad\u00bb estoy acostumbrado a trabajar con muchas fuentes de informaci\u00f3n simult\u00e1neas: bases de datos biol\u00f3gicas, resultados de programas, servicios web, etc&#8230; \u00daltimamente he tenido que trabajar bastante con bases de datos que proporcionan informaci\u00f3n sobre interacciones entre prote\u00ednas, como IntAct, DIP, MIPS\/Mammalian, MIPS\/Yeast, HPRD, BioGRID, MINT, &#8230; y BIND.<\/p>\n","protected":false},"author":25,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"ngg_post_thumbnail":0},"categories":[31],"tags":[],"blocksy_meta":{"styles_descriptor":{"styles":{"desktop":"","tablet":"","mobile":""},"google_fonts":[],"version":4}},"aioseo_notices":[],"_links":{"self":[{"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/posts\/69765"}],"collection":[{"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/users\/25"}],"replies":[{"embeddable":true,"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/comments?post=69765"}],"version-history":[{"count":0,"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/posts\/69765\/revisions"}],"wp:attachment":[{"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/media?parent=69765"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/categories?post=69765"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/tags?post=69765"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}