{"id":74453,"date":"2007-09-22T17:02:00","date_gmt":"2007-09-22T17:02:00","guid":{"rendered":"http:\/\/weblogs.madrimasd.org\/\/bioinformatica\/archive\/2007\/09\/22\/74453.aspx"},"modified":"2007-09-22T17:02:00","modified_gmt":"2007-09-22T17:02:00","slug":"clustalw-el-abuelo-de-los-alineamientos-multiples-llega-a-2-0","status":"publish","type":"post","link":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/2007\/09\/22\/74453","title":{"rendered":"ClustalW, el &#8216;abuelo&#8217; de los alineamientos m\u00faltiples, llega a 2.0"},"content":{"rendered":"<p>Cuando uno empieza en bioinform\u00e1tica a trabajar en temas de an\u00e1lisis de secuencias, lo primero que aprende es a usar herramientas como <a href=\"http:\/\/0-www.ncbi.nlm.nih.gov.library.vu.edu.au\/BLAST\/\">NCBI Blast<\/a> para el <a href=\"http:\/\/es.wikipedia.org\/wiki\/Alineamiento_de_secuencias\">alineamiento de secuencias<\/a> y <a href=\"http:\/\/www.ebi.ac.uk\/clustalw\/\">Clustal W<\/a> para el <a href=\"http:\/\/en.wikipedia.org\/wiki\/Multiple_sequence_alignment\">alineamiento m\u00faltiple<\/a> de un conjunto de ellas. \u00c9ste \u00faltimo programa ha sido durante mucho tiempo el est\u00e1ndar <i>de facto<\/i> a la hora de realizar <a href=\"http:\/\/en.wikipedia.org\/wiki\/Multiple_sequence_alignment\">alineamientos m\u00faltiples<\/a> y calcular <a href=\"http:\/\/es.wikipedia.org\/wiki\/%C3%81rbol_filogen%C3%A9tico\">\u00e1rboles filogen\u00e9ticos<\/a>, a pesar de fallos puntuales existentes en algunas versiones del programa. Justo ahora, casi 20 a\u00f1os despu\u00e9s de su primera encarnaci\u00f3n, ha salido a la luz <a href=\"http:\/\/bioinformatics.oxfordjournals.org\/cgi\/content\/abstract\/btm404v1?maxtoshow=&amp;HITS=10&amp;hits=10&amp;RESULTFORMAT=&amp;fulltext=clustalw&amp;searchid=1&amp;FIRSTINDEX=0&amp;resourcetype=HWCIT\">Clustal W 2.0<\/a>. Ha sido un largo viaje, as\u00ed que hagamos un poco de \u00abarqueo-bioinform\u00e1tica\u00bb&#8230;<br \/> <!--more-->La historia de ClustalW comienza en 1988 en la revista <a href=\"http:\/\/www.sciencedirect.com\/science\/journal\/03781119\">Gene<\/a>, con la publicaci\u00f3n del art\u00edculo <i>\u00ab<a href=\"http:\/\/www.sciencedirect.com\/science?_ob=ArticleURL&amp;_udi=B6T39-47PH5BM-S4&amp;_user=10&amp;_coverDate=12%2F15%2F1988&amp;_rdoc=1&amp;_fmt=&amp;_orig=search&amp;_sort=d&amp;view=c&amp;_acct=C000050221&amp;_version=1&amp;_urlVersion=0&amp;_userid=10&amp;md5=2e278f34a25b0ff245f54ff0efaec031\">CLUSTAL: a package for performing multiple sequence alignment on a microcomputer<\/a>\u00ab<\/i>. CLUSTAL permiti\u00f3 agilizar la tarea de realizar alineamientos m\u00faltiples usando un ordenador, siendo uno de los primeros programas disponibles para ello. El siguiente de la saga fue ClustalV, que mejoraba la velocidad de ejecuci\u00f3n y la precisi\u00f3n del programa, y fue usado durante varios a\u00f1os. Aqu\u00ed os incluyo un par de referencias a la entonces revista CABIOS, y que es hoy en d\u00eda conocida como <a href=\"http:\/\/bioinformatics.oxfordjournals.org\/\">Bioinformatics<\/a>:<\/p>\n<ul>\n<li>Higgins, D.G. and Sharp, P.M. (1989). <a href=\"http:\/\/bioinformatics.oxfordjournals.org\/cgi\/content\/abstract\/5\/2\/151\"><i>Fast and sensitive multiple sequence alignments on a microcomputer<\/i><\/a>. CABIOS, vol. 5, 151-153.<\/li>\n<li>Higgins,D.G. Bleasby,A.J. and Fuchs,R. (1991) <a href=\"http:\/\/bioinformatics.oxfordjournals.org\/cgi\/content\/abstract\/8\/2\/189\"><i>CLUSTAL V: improved software for multiple sequence alignment<\/i><\/a>. CABIOS, vol .8, 189-191.<\/li>\n<\/ul>\n<p>El \u00faltimo miembro de la saga ha sido ClustalW, que desde 1994 est\u00e1 siendo usando por la comunidad bioinform\u00e1tica. Este paquete de programas fue (y es) distribuido como un conjunto de ficheros de c\u00f3digo en C, dentro de un archivo comprimido, que compila con un simple <a href=\"http:\/\/es.wikipedia.org\/wiki\/Make\"><i>Makefile<\/i><\/a>. Dentro de este paquete apareci\u00f3 Clustal X, el hermano \u00abgr\u00e1fico\u00bb de Clustal W, el cu\u00e1l es mucho m\u00e1s dif\u00edcil de compilar, debido a su dependencia en las librer\u00edas gr\u00e1ficas <i>NCBI Vibrant<\/i> (Virtual Interface for Biological Research and Technology):<\/p>\n<ul>\n<li>Thompson, J.D., Higgins, D.S., Gibson, T.J. (1994): <a href=\"http:\/\/nar.oxfordjournals.org\/cgi\/content\/abstract\/22\/22\/4673\"><i>CLUSTAL W: improving the sensitivity of progressive multiple sequence alignment through sequence weighting, position-specific gap penalties and weight matrix choice<\/i><\/a>. Nucleic Acids Res. 1994, Vol. 22, No. 22 4673-4680.<\/li>\n<li>Thompson J.D., Gibson T.J., Plewniak F., Jeanmougin F., Higgins DG. <a href=\"http:\/\/nar.oxfordjournals.org\/cgi\/content\/full\/25\/24\/4876\"><i>The CLUSTAL_X windows interface: flexible strategies for multiple sequence alignment aided by quality analysis tools<\/i><\/a>. Nucleic Acids Res. 1997 Dec 15;25(24):4876-82.<\/li>\n<\/ul>\n<p>Desde entonces, este paquete de programas ha ido sufriendo peque\u00f1as mejoras, actualizaciones y arreglos de fallos. Tambi\u00e9n desde entonces le han surgido otros competidores, como por ejemplo <a href=\"http:\/\/tcoffee.vital-it.ch\/cgi-bin\/Tcoffee\/tcoffee_cgi\/index.cgi\">T-Coffee<\/a> o <a href=\"http:\/\/www.drive5.com\/muscle\/\">MUSCLE<\/a>, que son m\u00e1s precisos o m\u00e1s r\u00e1pidos para determinados conjuntos y vol\u00famenes de secuencias:<\/p>\n<ul>\n<li>Notredame C., Higgins D.G., Heringa J. <a href=\"http:\/\/www.sciencedirect.com\/science?_ob=ArticleURL&amp;_udi=B6WK7-45F5150-7S&amp;_user=10&amp;_coverDate=09%2F08%2F2000&amp;_rdoc=1&amp;_fmt=&amp;_orig=search&amp;_sort=d&amp;view=c&amp;_acct=C000050221&amp;_version=1&amp;_urlVersion=0&amp;_userid=10&amp;md5=c3bcba335afd3fec2220c99e433a1083\"><i>T-Coffee: A novel method for fast and accurate multiple sequence alignment<\/i><\/a>. J Mol Biol. 2000 Sep 8;302(1):205-17.<\/li>\n<li>Edgar RC. <a href=\"http:\/\/nar.oxfordjournals.org\/cgi\/content\/full\/32\/5\/1792\">MUSCLE: multiple sequence alignment with high accuracy and high throughput<\/a>. Nucleic Acids Res. 2004 Mar 19;32(5):1792-7.<\/li>\n<\/ul>\n<p> \u00bfQu\u00e9 trae Clustal W 2.0 que lo permita competir con los nuevos programas? Est\u00e1 claro que tiene de entrada muchos puntos ganados por ser un est\u00e1ndar <i>de facto<\/i>. El c\u00f3digo interno de los programas del paquete CLUSTAL ha sufrido una reestructuraci\u00f3n completa, pasando a estar escritos en C++. Adem\u00e1s, Clustal X 2.0 usa las <a href=\"http:\/\/trolltech.com\/products\/qt\">librer\u00edas gr\u00e1ficas qt<\/a> (las mismas que usa <a href=\"http:\/\/www.kde.org\/\">el escritorio KDE<\/a>) en lugar de las anteriores, lo cu\u00e1l facilita much\u00edsimo su compilaci\u00f3n y traslado a otras plataformas. Tambi\u00e9n hay nuevos algoritmos y grandes mejoras a la hora de calcular los \u00e1rboles filogen\u00e9ticos de alineamientos m\u00faltiples enormes (se puede elegir entre <a href=\"http:\/\/en.wikipedia.org\/wiki\/Neighbour_joining\">NJ<\/a> y <a href=\"http:\/\/en.wikipedia.org\/wiki\/UPGMA\">UPGMA<\/a>), y en la realizaci\u00f3n de estos alineamientos. Encontrareis m\u00e1s detalles en <a href=\"http:\/\/bioinformatics.oxfordjournals.org\/cgi\/content\/abstract\/btm404v1?maxtoshow=&amp;HITS=10&amp;hits=10&amp;RESULTFORMAT=1&amp;title=clustalw&amp;andorexacttitle=and&amp;andorexacttitleabs=and&amp;andorexactfulltext=and&amp;searchid=1&amp;FIRSTINDEX=0&amp;sortspec=reverse-date&amp;resourcetype=HWCIT\">el art\u00edculo de ClustalW 2.0<\/a>, disponible s\u00f3lo de momento en Bioinformatics en <i>Advance Access<\/i>.<\/p>\n<p>Aunque el paquete de programas est\u00e1 disponible para las principales plataformas (y funciona bien, doy fe de ello), intent\u00e9 compilarlo siguiendo la tradici\u00f3n. Personalmente me descargu\u00e9 hace poco <a href=\"ftp:\/\/ftp.ebi.ac.uk\/pub\/software\/clustalw2\">el c\u00f3digo fuente de Clustal W 2.0<\/a>, e intent\u00e9 compilarlo usando el script <i>installer<\/i> que incluye para ello el paquete. Al final tuve que usar el fichero <i>Makefile<\/i> inclu\u00eddo (como siempre se hizo) para conseguir el ejecutable, porque simplemente installer se negaba a realizar la tarea.<\/p>\n<p>\u00a1Que disfruteis de la nueva versi\u00f3n de Clustal W!<\/p>\n<p><u>Referencias<\/u>:<\/p>\n<ul>\n<li>Larkin M.A., Blackshields G., Brown N.P., Chenna R., McGettigan P.A., McWilliam H., Valentin F., Wallace I.M., Wilm A., Lopez R., Thompson J.D., Gibson T.J., and Higgins D.G. <a href=\"http:\/\/bioinformatics.oxfordjournals.org\/cgi\/content\/abstract\/btm404v1?maxtoshow=&amp;HITS=10&amp;hits=10&amp;RESULTFORMAT=1&amp;title=clustalw&amp;andorexacttitle=and&amp;andorexacttitleabs=and&amp;andorexactfulltext=and&amp;searchid=1&amp;FIRSTINDEX=0&amp;sortspec=reverse-date&amp;resourcetype=HWCIT\"><i>ClustalW and ClustalX version 2.0<\/i><\/a> Bioinformatics, Advance Access published on September 10, 2007<\/li>\n<\/ul>\n","protected":false},"excerpt":{"rendered":"<p>Cuando uno empieza en bioinform\u00e1tica a trabajar en temas de an\u00e1lisis de secuencias, lo primero que aprende es a usar herramientas como NCBI Blast para el alineamiento de secuencias y Clustal W para el alineamiento m\u00faltiple de un conjunto de ellas. \u00c9ste \u00faltimo programa ha sido durante mucho tiempo el est\u00e1ndar de facto a la hora de realizar alineamientos m\u00faltiples y calcular \u00e1rboles filogen\u00e9ticos, a pesar de fallos puntuales existentes en algunas versiones del programa. Justo ahora, casi 20 a\u00f1os despu\u00e9s de su primera encarnaci\u00f3n, ha salido a la luz Clustal W 2.0. Ha sido un largo viaje, as\u00ed que\u2026<\/p>\n","protected":false},"author":25,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"ngg_post_thumbnail":0},"categories":[186,31,189],"tags":[],"blocksy_meta":{"styles_descriptor":{"styles":{"desktop":"","tablet":"","mobile":""},"google_fonts":[],"version":4}},"aioseo_notices":[],"_links":{"self":[{"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/posts\/74453"}],"collection":[{"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/users\/25"}],"replies":[{"embeddable":true,"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/comments?post=74453"}],"version-history":[{"count":0,"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/posts\/74453\/revisions"}],"wp:attachment":[{"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/media?parent=74453"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/categories?post=74453"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/tags?post=74453"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}