{"id":131079,"date":"2010-10-13T16:00:02","date_gmt":"2010-10-13T15:00:02","guid":{"rendered":"http:\/\/www.madrimasd.org\/blogs\/bioinformatica\/?p=131079"},"modified":"2010-10-13T16:00:02","modified_gmt":"2010-10-13T15:00:02","slug":"paris-japonica-y-el-volumen-de-los-datos","status":"publish","type":"post","link":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/2010\/10\/13\/131079","title":{"rendered":"Paris japonica y el volumen de los datos"},"content":{"rendered":"<p>Hoy me he encontrado con una noticia curiosa sobre <a href=\"http:\/\/www.kew.org\/news\/kew-scientists-discover-largest-genome.htm\" target=\"_blank\"><em>Paris japonica<\/em><\/a>, una rara flor japonesa, cuyo proyecto de secuenciaci\u00f3n ha terminado hace poco. La noticia resalta el tama\u00f1o del genoma de esta flor, que es uno de los hechos publicados en el art\u00edculo <a href=\"http:\/\/onlinelibrary.wiley.com\/doi\/10.1111\/j.1095-8339.2010.01072.x\/abstract\" target=\"_blank\"><em>The largest eukaryotic genome of them all?<\/em><\/a>, publicado en <a href=\"http:\/\/onlinelibrary.wiley.com\/journal\/10.1111\/%28ISSN%291095-8339\" target=\"_blank\"><em>Botanical Journal of the Linnean Society<\/em><\/a>. Como no he tenido la oportunidad de leerme el art\u00edculo completo (acceso s\u00f3lo para subscriptores), y la noticia s\u00f3lo hace referencia al peso del ADN (y no a su tama\u00f1o en pares de bases), indagando en <a href=\"http:\/\/en.wikipedia.org\/wiki\/Paris_japonica\" target=\"_blank\">la entrada de Paris japonica de Wikipedia<\/a> he encontrado que ese genoma tiene la friolera de \u00a1150 mil millones de pares de bases!<\/p>\n<div style=\"text-align:center\"><a href=\"http:\/\/en.wikipedia.org\/wiki\/Paris_japonica\"><img decoding=\"async\" class=\"alignnone\" title=\"Paris japonica\" src=\"http:\/\/upload.wikimedia.org\/wikipedia\/commons\/6\/6d\/Paris_japonica_Kinugasasou_in_Hakusan_2003_7_27.jpg\" alt=\"\" width=\"95%\" \/><\/a><\/div>\n<p>\u00bfQu\u00e9 significa esto a nivel del uso de herramientas bioinform\u00e1ticas? Que algunas herramientas no podr\u00edan usarse, y que el tiempo de ejecuci\u00f3n con otras se alargar\u00eda bastante. Por ejemplo, imaginaos que ten\u00e9is acceso a las lecturas de los secuenciadores usados para la secuenciaci\u00f3n del genoma de esta planta. Si quisierais ensamblar las lecturas para obtener el genoma, e intentarais usar una t\u00e9cnica de ensamblaje <em>de novo<\/em>, sin tomar como referencia ning\u00fan otro genoma, no podr\u00edais usar las t\u00e9cnicas convencionales por los requisitos de memoria de los ensambladores <em>de novo<\/em>. Y en el mejor de los casos, una vez ensamblado el genoma una predicci\u00f3n de genes tardar\u00eda al menos 50 veces m\u00e1s que en un genoma del tama\u00f1o del genoma humano. Los visores tipo Ensembl o UCSC Genome Browser no deber\u00edan verse afectados, pero s\u00ed alguna de las funcionalidades que tienen (por ejemplo, <a href=\"http:\/\/en.wikipedia.org\/wiki\/BLAT_%28bioinformatics%29\" target=\"_blank\">el servicio BLAT de UCSC<\/a> no estar\u00eda disponible).<\/p>\n<p>En estos casos en los que el volumen de datos sobrepasa lo anteriormente manejado es cuando nos tenemos que plantear estrategias alternativas. Y para las t\u00e9cnicas bioinform\u00e1ticas convencionales no s\u00f3lo de uso de algoritmos paralelizados que permitan sacar partido a varios procesadores u ordenadores simult\u00e1neamente, o que gestionen de forma eficiente la memoria necesaria, sino de gesti\u00f3n del almacenamiento en disco (el genoma de <em>Paris japonica<\/em> ocupar\u00eda unos 150GB en formato FASTA una vez ensamblado).<\/p>\n<p>Tras tanto razonamiento mi pregunta es, \u00bfcu\u00e1ntos cromosomas tiene esta planta? Y de todas esas pares de bases, \u00bfcu\u00e1ntas corresponden a genes codificantes?<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Hoy me he encontrado con una noticia curiosa sobre Paris japonica, una rara flor japonesa, cuyo proyecto de secuenciaci\u00f3n ha terminado hace poco. La noticia resalta el tama\u00f1o del genoma de esta flor, que es uno de los hechos publicados en el art\u00edculo The largest eukaryotic genome of them all?, publicado en Botanical Journal of the Linnean Society. Como no he tenido la oportunidad de leerme el art\u00edculo completo (acceso s\u00f3lo para subscriptores), y la noticia s\u00f3lo hace referencia al peso del ADN (y no a su tama\u00f1o en pares de bases), indagando en la entrada de Paris japonica de\u2026<\/p>\n","protected":false},"author":25,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"ngg_post_thumbnail":0},"categories":[1],"tags":[],"blocksy_meta":{"styles_descriptor":{"styles":{"desktop":"","tablet":"","mobile":""},"google_fonts":[],"version":4}},"aioseo_notices":[],"_links":{"self":[{"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/posts\/131079"}],"collection":[{"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/users\/25"}],"replies":[{"embeddable":true,"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/comments?post=131079"}],"version-history":[{"count":4,"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/posts\/131079\/revisions"}],"predecessor-version":[{"id":131083,"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/posts\/131079\/revisions\/131083"}],"wp:attachment":[{"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/media?parent=131079"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/categories?post=131079"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/tags?post=131079"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}