HMMer 3.0 y la migración de Pfam

Una de las noticias que me confirmaron en persona en el pasado ISMB-ECCB 2009 fue que a finales de Agosto o principios de Septiembre la base de datos Pfam va a cambiar de formato para adaptarse a HMMer 3.0, la última versión principal de este software de búsqueda de motivos. Por lo que entendí tras charlar con uno de sus curadores, el cambio de formato en Pfam no es compatible hacia atrás, en el sentido de que las herramientas de formateo de bases de datos de HMMer 2.x no funcionan con el nuevo formato.
¿Eso implica que tendremos que actualizar inmediatamente nuestros programas e implementaciones para que traten con HMMer 3.x? No necesariamente. Siguiendo la traza de este cambio me he encontrado en una entrada del 19 de Marzo del blog de Xfam que este cambio  de formato lleva planeándose desde hace tiempo, y por ello se han creado herramientas que permitirán generar bases de datos compatibles con HMMer 2.x. Este último punto es imprescindible para implementaciones que no se actualizarán tan rápidamente, como por ejemplo la de Timelogic DeCypher.

El cambio no es sólo a nivel de formato, sino también a nivel de curación de la base de datos Pfam. El nuevo algoritmo usado por HMMer 3.0, que para ganar sensibilidad deja de ser un algoritmo «exacto» y se asemeja a los heurísticos usados en Blast 2, ha encontrado una serie de solapamientos antes desconocidos en motivos de Pfam encontrados en alrededor de 80000 secuencias de bases de datos de secuencias como UniProt. Los curadores de Pfam se las han tenido que ver con la resolución de estos solapamientos para poder afirmar cuál de los motivos es el genuino, y cuáles son subdominios, falsos positivos, etc…

¡Poneos las pilas para Septiembre!

Compartir:

Deja un comentario