{"id":131311,"date":"2011-12-08T16:48:45","date_gmt":"2011-12-08T15:48:45","guid":{"rendered":"http:\/\/www.madrimasd.org\/blogs\/bioinformatica\/?p=131311"},"modified":"2011-12-08T16:48:45","modified_gmt":"2011-12-08T15:48:45","slug":"la-bioinformatica-en-la-nube-cloudbiolinux","status":"publish","type":"post","link":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/2011\/12\/08\/131311","title":{"rendered":"La Bioinform\u00e1tica en la nube: CloudBioLinux"},"content":{"rendered":"<p>En varias ocasiones he publicado entradas en este blog relacionadas con distintas distribuciones de Linux especializadas en bioinform\u00e1tica. En ese sentido, estas distribuciones toman como base una versi\u00f3n estable de una distribuci\u00f3n Linux (<a title=\"Ubuntu\" href=\"http:\/\/www.ubuntu.com\/\" target=\"_blank\">Ubuntu<\/a>, <a title=\"Debian\" href=\"http:\/\/www.debian.org\/\" target=\"_blank\">Debian<\/a>, <a title=\"Gentoo\" href=\"http:\/\/www.gentoo.org\/\" target=\"_blank\">Gentoo<\/a>, <a title=\"Fedora\" href=\"http:\/\/fedoraproject.org\/\" target=\"_blank\">Fedora<\/a>, etc&#8230;), y sus desarrolladores a\u00f1aden lo que les falta a esas distribuciones est\u00e1ndar: programas, paquetes o repositorios de programas de <a title=\"Bioinform\u00e1tica\" href=\"http:\/\/es.wikipedia.org\/wiki\/Bioinform%C3%A1tica\" target=\"_blank\">bioinform\u00e1tica<\/a>, <a title=\"Qu\u00edmica Computacional\" href=\"http:\/\/es.wikipedia.org\/wiki\/Qu%C3%ADmica_computacional\" target=\"_blank\">qu\u00edmica computacional<\/a>, <a title=\"Text Mining\" href=\"http:\/\/es.wikipedia.org\/wiki\/Miner%C3%ADa_de_textos\" target=\"_blank\"><em>text-mining<\/em><\/a>, etc&#8230;<\/p>\n<p>Pero tambi\u00e9n es cierto que cada vez m\u00e1s empezamos a mover nuestros desarrollos a entornos de <a title=\"Cloud Computing\" href=\"http:\/\/es.wikipedia.org\/wiki\/Computaci%C3%B3n_en_la_nube\" target=\"_blank\">computaci\u00f3n en la nube<\/a> cuando requerimos m\u00e1s potencia de c\u00e1lculo. Ello es debido a que es en muchos casos m\u00e1s barato que administrar un recurso local de supercomputaci\u00f3n y trae menos problemas log\u00edsticos: no necesitas espacio f\u00edsico local, tienes alta disponibilidad, evitas instalaciones especiales de electricidad o aire acondicionado, etc&#8230; Y todo eso a pesar de sus inconvenientes, como que en las soluciones comerciales actuales de computaci\u00f3n en la nube te cobren por el tr\u00e1fico de red de entrada y\/o de salida a las m\u00e1quinas virtuales que corren en la nube, adem\u00e1s de por el tiempo de computaci\u00f3n.<\/p>\n<p><a href=\"http:\/\/www.cloudbiolinux.org\/\"><img decoding=\"async\" class=\"aligncenter\" title=\"CloudBioLinux\" src=\"http:\/\/cloudbiolinux.org\/images\/logo.png\" alt=\"\" width=\"400\" height=\"276\" \/><\/a><\/p>\n<p>Por ello no me ha extra\u00f1ado encontrarme en una reuni\u00f3n que la gente est\u00e9 usando <a title=\"CloudBioLinux\" href=\"http:\/\/www.cloudbiolinux.org\/\" target=\"_blank\">CloudBioLinux<\/a> como base para sus desarrollos en la nube. \u00bfQu\u00e9 es CloudBioLinux? Es una imagen de Ubuntu, lista parar ser usada en los sistemas de m\u00e1quina virtual (p.ej. <a title=\"VirtualBox\" href=\"https:\/\/www.virtualbox.org\/\" target=\"_blank\">VirtualBox<\/a>) o de computaci\u00f3n en la nube (p.ej. <a title=\"Amazon EC2\" href=\"http:\/\/es.wikipedia.org\/wiki\/Amazon_EC2\" target=\"_blank\">Amazon EC2<\/a>). Al estar esta imagen preparada y mantenida en parte por el <a href=\"http:\/\/www.jcvi.org\/cms\/research\/projects\/jcvi-cloud-biolinux\/overview\/\" target=\"_blank\">Craig Venter Institute<\/a>, esta imagen viene con mucho del software de an\u00e1lisis de datos de <a href=\"http:\/\/en.wikipedia.org\/wiki\/Next-generation_sequencing#High-throughput_sequencing\" target=\"_blank\">ultrasecuenciaci\u00f3n<\/a> instalado (<a href=\"https:\/\/github.com\/chapmanb\/cloudbiolinux\/blob\/master\/config\/custom.yaml\" target=\"_blank\">listado parcial disponible aqu\u00ed<\/a>). Adem\u00e1s, estas im\u00e1genes pueden sincronizarse, mediante el <em>script<\/em> <a href=\"https:\/\/github.com\/chapmanb\/cloudbiolinux\/blob\/master\/data_fabfile.py\" target=\"_blank\">data_fabfile.py<\/a>, con una imagen global que contiene los \u00edndices y los genomas de referencia usados por los programas de ultrasecuenciaci\u00f3n que vienen. El <em>script<\/em> se descarga los \u00edndices y genomas seleccionados de manera peri\u00f3dica de una imagen mantenida en Amazon S3, facilitando a\u00fan m\u00e1s la tarea de mantenimiento.<\/p>\n<p>La idea es muy buena, y todo esto est\u00e1 muy bien pensado, a expensas de cambiar tiempo de computaci\u00f3n por tiempo de transferencia de red y copia de datos. Ya es cuesti\u00f3n de cada uno ponderar los pros y los contras de este tipo de soluciones a la hora de ir a usarlas.<\/p>\n<p><span style=\"text-decoration: underline;\">Enlaces<\/span><\/p>\n<ul>\n<li><a href=\"http:\/\/cloudbiolinux.org\/\" target=\"_blank\">CloudBioLinux<\/a><\/li>\n<\/ul>\n","protected":false},"excerpt":{"rendered":"<p>En varias ocasiones he publicado entradas en este blog relacionadas con distintas distribuciones de Linux especializadas en bioinform\u00e1tica. En ese sentido, estas distribuciones toman como base una versi\u00f3n estable de una distribuci\u00f3n Linux (Ubuntu, Debian, Gentoo, Fedora, etc&#8230;), y sus desarrolladores a\u00f1aden lo que les falta a esas distribuciones est\u00e1ndar: programas, paquetes o repositorios de programas de bioinform\u00e1tica, qu\u00edmica computacional, text-mining, etc&#8230; Pero tambi\u00e9n es cierto que cada vez m\u00e1s empezamos a mover nuestros desarrollos a entornos de computaci\u00f3n en la nube cuando requerimos m\u00e1s potencia de c\u00e1lculo. Ello es debido a que es en muchos casos m\u00e1s barato que\u2026<\/p>\n","protected":false},"author":25,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"ngg_post_thumbnail":0},"categories":[1],"tags":[],"blocksy_meta":{"styles_descriptor":{"styles":{"desktop":"","tablet":"","mobile":""},"google_fonts":[],"version":4}},"aioseo_notices":[],"_links":{"self":[{"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/posts\/131311"}],"collection":[{"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/users\/25"}],"replies":[{"embeddable":true,"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/comments?post=131311"}],"version-history":[{"count":3,"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/posts\/131311\/revisions"}],"predecessor-version":[{"id":131314,"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/posts\/131311\/revisions\/131314"}],"wp:attachment":[{"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/media?parent=131311"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/categories?post=131311"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/tags?post=131311"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}